Text
                    Б. В. ГНЕДЕНКО
КУРС
ТЕОРИИ
ВЕРОЯТНОСТЕЙ

Б. В. ГНЕДЕНКО КУРС ТЕОРИИ ВЕРОЯТНОСТЕЙ Допущено Министерством высшего образования СССР в качестве учебника для университетов ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ТЕХНИКО-ТЕОРЕТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА I 960 ЛЕНИНГРАД
П-5-2
ОГЛАВЛЕНИЕ Предисловие .................................................. 6 Введение......................................................... 7 Глава 1. Понятие вероятности................................. 13 § 1. Достоверное, невозможное и случайное события........... 13 § 2 Различные подходы к определению вероятности............ 16 § 3. Поле событий .......................................... 19 § 4. Классическое определение вероятности................... 23 § 5. Примеры.............................................. 26 § 6. Геометрические вероятности............................. 31 § 7. Статистическое определение вероятности................. 37 § 8. Аксиоматическое построение теории вероятностей ..... 41 § 9. Условная вероятность и простейшие основные формулы ... 46 § 10. Примеры................................................ 53 Глава 2. Последовательность независимых испытаний................ 60 §11. Вероятности Рп(тъ 61 § 12. Локальная предельная теорема........................... 64 § 13. Интегральная предельная теорема........................ 73 § 14. Применение интегральной теоремы Муавра-Лапласа........ 85 § 15. Теорема Пуассона....................................... 89 § 16. Иллюстрация схемы независимых испытаний................ 94 Глава 3. Цепи Маркова............................................ 98 § 17. Определение цепи Маркова............................... 98 § 18. Матрица перехода . . .................................. 99 § 19. Теорема о предельных вероятностях..................... 101 Глава 4. Случайные величины и функции распределения .... 104 § 20. Основные свойства функций распределения................ 104 § 21. Непрерывные и дискретные распределения................. 109 § 22. Многомерные функции распределения...................... 113 § 23. Функции от случайных величин........................... 120 § 24. Интеграл Стилтьеса.................................... 131 Глава 5. Числовые характеристики случайных величин............136 § 25. Математическое ожидание........................... 136 § 26. Дисперсия........................................... 141 § 27. Теоремы о математическом ожидании и дисперсии....... 146 § 28. Моменты........................................' • • • 152
ОГЛАВЛЕНИЕ Глава 6. Закон больших чисел................................ • 158 § 29. Массовые явления и закон больших чисел . -............158 § 30. Закон больших чисел в форме Чебышева................ 161 § 31. Необходимое и достаточное условие для закона больших чисел ......................................................167 § 32. Усиленный закон больших чисел........................171 Г л а в а 7. Характеристические функции........................178 § 33. Определение и простейшие свойства характеристических функций................................................... 178 § 34. Формула обращения и теорема единственности...........183 § 35. Теоремы Хелли ................................... . 188 § 36. Предельные теоремы для характеристических функций .... 192 § 37. Положительно определённые функции....................196 § 38. Характеристические функции многомерных случайных величин 201 Глава 8. Классическая предельная теорема ....................206 § 39. Постановка задачи.................................. 206 § 40. Теорема Ляпунова.....................................• 209 § 41. Локальная предельная теорема........... 214 Глава 9. Теория безгранично-делимых законов распределения . 221 § 42 Безгранично-делимые законы и их основные свойства .... 222 § 43. Каноническое представление безгранично-делимых законов . . 224 § 44. Предельная теорема для безгранично-делимых законов .... 229-. § 45. Постановка задачи о предельных теоремах для сумм......232 § 46. Предельные теоремы для сумм.................Г.........233 § 47. Условия сходимости к законам нормальному и Пуассона . . . 237 Глава 10. Теория стохастических процессов , ....................240 § 48. Вводные замечания.................................... 240 § 49. Условные функции распределения и формула Байеса.......242 § 50. Обобщённое уравнение Маркова .........................245 §51. Непрерывный случайный процесс. Уравнения Колмогорова . . 247 § 52. Чисто разрывный случайный процесс. Уравнения Колмо- горова-Феллера .............................................255 § 53. Однородные случайные процессы с независимыми прираще- ниями .................................................... 261 § 54. Понятие стационарного случайного процесса. Теорема Хин- чина о корреляционной функции............................. 268 Глава 11. Элементы статистики.....................................273 § 55. Основные задачи математической статистики . ............273 § 56. Вариационный ряд и эмпирическая функция распределения . 276. § 57. Теорема Гливенко ..................................... 278 § 58. Теорема Колмогорова ............................... . . 283 § 59. Критерий согласия Колмогорова...........................291 § 60. Классический метод определения параметров распределения . 292 § 61. Исчерпывающие статистики............................... 301 § 62. Доверительные границы и доверительные вероя1ности . . . . 303 § 63. Проверка статистических гипотез.........................310 § 64. Метод последовательного анализа.........................317 Дополнение 1. Об аксиоматике теории вероятностей..................328 Дополнение 2. О преобразованиях Лапласа...........................335
ОГЛАВЛЕНИЕ 5 Дополнение 3. Краткий очерк истории теории вероятностей...............340 Литература......................*.................... • • • . 368 .т2 Таблица значений функции (х) = е 2............................... у 2п х я* 1 Г — — Таблица значений функции Ф (х) = j 6 2 dz............................. о дк 0— а Таблица значений функции (а) = —• . . . • - . . ....................... Таблица qWi g— Q> значений функции 2j —— m—о Таблица значений функции Р(х) = fc — 2 2 2 Г я? * zk~* е 2 dz Таблица значений функции г(-Г) Д5 5(х) = ——— У (л — 1) к Г П 2' dz 372 373 375 377 378 382 к 1 со Таблица значений функции К(х) = 2 (—. .... 384 Й=— со | __ о Таблица значений функции а = In-----L .... ....................385 Gt Предметный указатель ............................................ 386
ПРЕДИСЛОВИЕ Настоящий курс разбивается на две части — элементарную (главы 1—6) и специальную (главы 7—11). Последние пять глав могут служить базой для спецкурсов — теории суммирования случайных величин, теории стохастических процессов, элементов математической статистики. Теория вероятностей рассматривается в книге исключительно как математическая дисциплина, поэтому получение конкретных есте- ственно-научных или технических результатов в ней не является самоцелью. Все примеры в тексте книги имеют целью только разъ- яснение общих положений теории и указание на связь этих положений с задачами естествознания. Конечно, одновременно эти примеры дают указания на возможные области приложения общетеоретических резуль- татов, а также развивают умение применять эти результаты в конкретных задачах. Хорошо, если изучающий теорию вероятностей имеет перед глазами какие-нибудь явления материального мира для того, чтобы общая математическая схема заполнялась определённым смыслом. Такое направление изучения даёт возможность читателю выработать свое- образную теоретико-вероятностную интуицию, которая позволяет предвидеть в общих чертах выводы раньше, чем применён аналити- ческий аппарат. Заметим далее, что без систематического решения задач изучать теорию вероятностей нельзя, в особенности на первых порах. Первые четыре параграфа первой главы* являются незначительной переработкой неопубликованных рукописей А. Н. Колмогорова. Я счастлив поблагодарить здесь моих дорогих учителей А. Н. Кол- могорова и А. Я. Хинчина, много помогавших мне своими советами и беседами, касавшимися узловых вопросов теории вероятностей. Б, Гнеденко.
ВВЕДЕНИЕ Цель настоящей книги состоит в изложении основ теории вероят- ностей— математической науки, изучающей закономерности случайных явлений. Возникновение теории вероятностей относится к середине XVII века и связано с именами Гюйгенса, Паскаля, Ферма и Якова Бернулли. В переписке Паскаля и Ферма, вызванной задачами, поставленными азартными игроками и не укладывающимися в рамки математики того времени, выкристаллизовались постепенно такие важные понятия, как вероятность и математическое ожидание. При этом, конечно, нужно отдавать себе ясный отчёт, что выдающиеся учёные, занимаясь задачами азартных игроков, предвидели и фундаментальную натур- философскую роль науки, изучающей случайные явления. Они были убеждены в том, что на базе массовых случайных событий могут возникать чёткие закономерности. И только состояние естествознания привело к тому, что азартные игры ещё долго продолжали оставаться тем единственным конкретным материалом, на базе которого со- здавались понятия и методы теории вероятностей. Это обстоятельство накладывало отпечаток и на формально-математический аппарат, по- средством которого решались возникавшие в теории вероятностей задачи: он сводился исключительно к элементарно арифметическим и комбинаторным методам. Последующее развитие теории вероятно- стей, а также широкое привлечение её результатов и методов иссле- дования в естествознание и в первую очередь в физику показали, что классические понятия и классические методы не потеряли своего интереса и в настоящее время. Серьёзные требования со стороны естествознания (теория ошибок наблюдений, задачи теории стрельбы, проблемы статистики, в первую очередь статистики народонаселения) привели к необходимости дальнейшего развития теории вероятностей и привлечения более раз- витого аналитического аппарата. Особенно значительную роль в раз- витии аналитических методов теории вероятностей сыграли Муавр, Лаплас, Гаусс, Пуассон. С формально-аналитической стороны к этому же направлению примыкает работа творца неевклидовой геометрий" Н. И. Лобачевского, посвящённая теории ошибок при измерениях на сфере и выполненная с целью установления геометрической системы, господствующей во вселенной.
8 ВВЕДЕНИЕ С половины XIX столетия и приблизительно до двадцатых годов нашего века развитие теории вероятностей связано исключительно с именами русских учёных — П. Л. Чебышева, А. А. Маркова, А. М. Ляпунова.- Этот успех русской науки был подготовлен деятель- ностью В. Я. Буняковского, широко культивировавшего в России исследования по применению теории вероятностей к статистике, в особенности к страховому делу и демографии. Им был написан первый в России курс теории вероятностей, оказавший большое влия- ние на развитие в России интереса к этой области науки. Основное непреходящее значение работ Чебышева, Маркова и Ляпунова в области теории вероятностей состоит в том, что ими было введено и широко использовано понятие случайной величины. С результатами Чебышева относительно закона больших чисел, с «цепями Маркова» и с пре- дельной теоремой Ляпунова мы познакомимся в соответствующих разделах настоящей книги. Современное нам развитие теории вероятностей характеризуется всеобщим подъёмом интереса к ней, а также расширением круга её практических приложений. В этой напряжённой научной работе совет- ская школа теории вероятностей продолжает занимать выдающееся положение, а если говорить об общих проблемах, то в их развитии она занимает первое место. Среди представителей советских учёных прежде всего должны быть названы имена С. Н. Бернштейна, А. Н. Кол- могорова и А. Я. Хин чина. В процессе изложения мы будем выну- ждены самим существом дела вводить читателя в курс преобразовав- ших лицо теории вероятностей идей и результатов советских учёных. Так, уже в первой главе мы будем говорить о фундаментальных работах С. Н. Бернштейна и А. Н. Колмогорова по основаниям теории вероятностей. В двадцатых годах нашего столетия А. Я. Хин- чин, А. Н. Колмогоров, Е. Е. Слуцкий и П. Леви установили тес- ную связь между теорией вероятностей и метрической теорией функ- ций. Эта связь оказалась весьма плодотворной. На этом пути удалось найти окончательное решение классических задач, поставленных ещё Чебышевым, а также значительно расширить содержание теории ве- роятностей. Полностью к советскому периоду относится создание А. Н. Колмогоровым и А. Я. Хинчиным в тридцатых годах теории стохастических (вероятностных, случайных) процессов, которая теперь стала основным направлением исследований в теории вероятностей. Указанная теория служит прекрасным образцом того органического синтеза математического 'и естественно-научного мышления, когда математик, овладев физическим существом узловой проблемы есте- ствознания, находит для неё адэкватный математический язык. Нам важно заметить, что решение классических за тач теории вероятностей оказалось тесно связанным с теорией стохастических процессов. Элементы этой важной новой главы теории вероятностей будут из- ложены нами в главе десятой. Упомянем, наконец, о новом разделе математической статистики, созданном преимущественно работами
ВВЕДЕНИЕ 9 А. Н. Колмогорова и Н. В. Смирнова, получившем название «непара- метрические задачи статистики». Некоторое представление о содер- жании этого раздела науки дают §§ 57—59. Вообще нужно сказать, что бурное развитие теории вероятностей за последние сто лет неразрывно связано с традициями и достижениями русской, а теперь советской науки. И не только новые основные теоремы были доказаны нашими соотечественниками, но ими были проложены новые пути развития теории вероятностей. О влиянии работ советских учёных на современное развитие теории вероятностей можно судить хотя бы по тому, что теперь не появляется и не может появиться хотя бы в какой-нибудь мере ценная книга или статья по теории вероятностей, которая не основывалась бы на работах советских авторов и не имела бы на них ссылок. За последние десятилетия неизмеримо выросла роль, которую играет теория вероятностей в современном естествознании. После того как молекулярные представления о строении вещества получили всеобщее признание, стало неизбежным широкое использование теории вероятностей и в физике и в химии. Заметим, что с точки зрения молекулярной физики каждое вещество состоит из огромного числа малых частиц, находящихся в непрерывном движении и в процессе этого движения воздействующих друг на друга. При этом о при- роде этих частиц, о существующем между ними взаимодействии, характере их движения и пр. известно мало. В основных чертах эти сведения исчерпываются тем, что частиц, из которых состоит вещество, очень много и что в однородном теле они близки по своим свойствам. Естественно, что при таких условиях обычные для физи- ческих теорий методы математических исследований становились бес- сильными. Так, например, аппарат дифференциальных уравнений пе мог привести в указанной обстановке к серьёзным результатам. Действительно, ни строение, ни законы взаимодействия между ча- стицами вещества в достаточной мере не изучены, и при таких условиях применение аппарата дифференциальных уравнений должно носить эле- менты грубого произвола. Но даже если бы этой трудности не суще- ствовало, уже одно количество этих частиц представляет собой такую трудность в изучении их движения, которую преодолеть с помощью обычных уравнений механики нет возможности. К тому же и методологически такой подход неудовлетворителен. Действительно, задача, которая здесь возникает, состоит не в изуче* нии индивидуальных движений частиц, а в изучении тех закономер- ностей, которые возникают в совокупностях большого числа движу- щихся и взаимодействующих частиц. Закономерности же, возникающие вследствие массовости участвующих в их возникновении ингредиентов, имеют своё собственное своеобразие и не сводятся к простому сум- мированию индивидуальных движений. Более того, эти закономерно- сти в известных пределах оказываются не зависящими от индивидуальных особенностей участвующих в их порождении частиц. Конечно, для
10 ВВЕДЕНИЕ изучения этих новых закономерностей должны быть найдены и соответствующие новые математические методы исследования. Какие же требования должны быть в первую очередь предъявлены к этим методам? Понятно, что в первую очередь они должны учитывать то, что изучаемое явление носит массовый характер; таким образом, для этих методов наличие большого числа взаимодействующих частиц должно представлять не дополнительную трудность, а облегчать изучение возникающих закономерностей. Далее недостаточность зна- ний о природе и строении частиц, а также о характере их взаимо- действия также не должно ограничивать эффективности их приме- нения. Этим требованиям лучше всего удовлетворяют методы теории вероятностей. Чтобы сказанное не было понято ошибочно, мы ещё раз под- черкнём следующее обстоятельство. Говоря, что аппарат теории вероятностей лучше приспособлен для изучения молекулярных явлений, мы ни в какой мере не хотим сказать, что философские предпосылки использования теории вероятностей в естествознании лежат в «недостаточности знаний». Основной принцип состоит в том, что при изучении «массовых» явлений возникают своеобразные новые закономерности. При изучении явлений, обусловленных действием большого числа молекул, учёт всех свойств каждой молекулы не нужен. Действительно, при изучении явлений природы необходимо отвлекаться от учёта несущественных подробностей. Рассмо- трение же всех деталей, всех существующих связей, в том числе и несущественных для данного явления, приводит лишь к тому, что само явление затемняется и овладение им отодвигается ввиду такой искусственно усложнённой обстановки. Классики марксизма неодно- кратно подчёркивали это обстоятельство. Естествоиспытатель не может упускать из виду следующее основное положение марксистско- ленинской философии: «Чтобы познавать отдельные стороны (или частности общей картины мировых явлений), мы вынуждены вырывать их из их естественной или исторической связи и исследовать каж- дую в отдельности по её особым причинам и следствиям» (Ф. Энгельс, Анти-Дюринг, стр. 20, изд. 1948 г., слова в скоб- ках принадлежат В. И. Ленину, см. «Материализм и эмпириокрити- цизм», стр. 134, изд. 1946 г.). Насколько удачно произведена схематизация явления, насколько удачно выбран математический аппарат для его изучения, мы можем судить по согласию теории с опытом, с практикой. Развитие есте- ствознания, в частности физики, показывает, что аппарат теории вероятностей оказался весьма хорошо приспособленным к изучению многочисленных явлений природы. Указанная связь теории вероятностей с потребностями современной физики лучше всего поясняет те причины, в силу которых в последние десятилетия теория вероятностей превратилась в одну из наиболее быстро развивающихся областей математики. Новые теоретические
ВВЕДЕНИЕ 11 результаты открывают новые возможности для естественно-научного использования методов теории вероятностей. Всестороннее изучение явлений природы толкает теорию вероятностей на разыскание новых закономерностей, порождаемых случаем. Теория вероятностей не отмежёвывается от запросов других наук, а идёт в ногу с общим развитием естествознания. Понятно, что сказанное не означает, что теория вероятностей является лишь вспомогательным средством для решения тех или иных практических задач. Наоборот, следует подчеркнуть, что за последние три десятилетия теория вероятностей превратилась в стройную математическую дисциплину с собственными проблемами и методами доказательств. В то же время выяснилось, что наиболее существенные проблемы теории вероятностей служат делу решения различных задач естествознания. Мы определили в самом начале теорию вероятностей как науку, изучающую случайные явления. Отложив выяснение смысла понятия «случайное явление (событие)» до первой главы, мы сейчас огра- ничимся несколькими замечаниями. Если в обыденных представлениях, в житейской практике считается, что случайные события предста- вляют собой нечто крайне редкое, идущее вразрез установившемуся порядку вещей, закономерному развитию событий, то в теории вероятностей мы откажемся от этих представлений. Случайные собы- тия, как они понимаются в теории вероятностей, обладают рядом характерных особенностей; в частности, все они происходят в мас- совых явлениях. Под массовыми явлениями мы понимаем такие, которые имеют место в совокупностях большого числа равноправных или почти равноправных объектов и определяются именно этим массовым характером явления и лишь в незначительной мере зависят от природы составляющих объектов. Заметим, что весь ход развития теории вероятностей показывает, в какой жестокой борьбе материалистических концепций с идеали- стическими выкристаллизовывались её понятия и идеи. Стихийно материалистическим взглядам Я. Бернулли, Лапласа, Лобачевского, Чебышева, Маркова и многих других выдающихся учёных прошлого противопоставлялись открыто идеалистические концепции ряда дру- гих математиков и статистиков (К. Пирсон, П. А. Некрасов, Р. Мизес и др.). Эта борьба продолжается и теперь. На примере мизесовского определения вероятности мы увидим, что взглядам советских учёных, развитым в плане марксистско-ленинской фило- софии, противопоставляются идеалистические построения, порой ста- рательно замаскированные словами «опыт», «практика», «естество- знание». Теория вероятностей, подобно другим разделам математики, раз- вилась из потребностей практики; в абстрактной форме она отра- жает закономерности, присущие случайным событиям массового характера. Эти закономерности играют исключительно важную роль в физике и других областях естествознания, военном деле,
12 ВВЕДЕНИЕ разнообразнейших технических дисциплинах, экономике и т, д. В по- следнее время в связи с широким развитием предприятий, производящих массовую продукцию, результаты теории вероятностей используются не только для браковки уже изготовленной продукции, но, что важ- нее, для организации самого процесса производства (статистический контроль в производстве). Это лишний раз подтверждает правиль- ность положений философии диалектического материализма об этапах научного исследования: «От живого созерцания к абстрактному мышлению и от него к практике — таков диалектический путь по- знания истины, познания объективной реальности», (В. И, Ленин, Философские тетради, стр. 146, изд. 1948 г.). Связь теории вероят- ностей с практическими потребностями, как уже было отмечено, была основной причиной бурного развития её в последние три деся- тилетия. Многие её разделы были развиты как раз в связи с ответами на запросы практиков. Здесь кстати вспомнить замечательные слова основателя нашей отечественной школы теории вероятностей П. Л. Че- бышева: «Сближение теории с практикой даёт самые благотворные результаты, и не одна только практика от этого выигрывает; сами науки развиваются под влиянием её: она открывает им новые предметы для исследования или новые стороны в предметах давно известных... Если теория много выигрывает от новых приложений старой методы или от новых развитий её, то она ещё более приобретает открытием новых метод, и в этом случае наука находит себе верного руко- водителя в практике».
ГЛАВА 1 ПОНЯТИЕ ВЕРОЯТНОСТИ § 1. Достоверное, невозможное и случайное события На основе наблюдений и опыта наука приходит к формули- • ровке закономерностей, которым подчиняется течение изучаемых ею явлений. Простейшая и наиболее распространённая схема устанавли- ваемых закономерностей такова: 1. При каждом осуществлении комплекса условий •© происхо- дит событие А. Так, например, если вода при атмосферном давлении в 760 мм нагревается выше 100° по Цельсию (комплексу условий S), то она превращается в пар (событие Л). Или другой пример: при любых химических реакциях каких угодно веществ, без обмена с окру- жающей средой (комплекс условий S) общее количество вещества (материи) остаётся неизменным (событие Л). Последнее утверждение носит название закона сохранения материи. Читатель легко может самостоятельно указать примеры других подобных закономерностей, заимствованных из физики, химии, биологии и других наук. Событие, которое неизбежно происходит при каждой реализации комплекса условий ®, называется достоверным. Если событие А заведомо не может произойти при осуществлении комплекса условий <5, то оно называется невозможным. Событие Л, которое при реали- зации комплекса условий <5 может произойти, а может и не про- изойти, называется случайным. Из этих определений ясно, что, говоря о достоверности, невоз- можности, «случайности какого-либо события, мы всегда будем иметь в виду его достоверность, невозможность или случайность по отно- шению к какому-либо определённому комплексу условий ©. В предложении 1 утверждается достоверность события А при осуществлении комплекса условий ®. Утверждение о невозмож- ности какого-либо события при реализации данного комплекса условий не доставляет чего-либо существенно нового, так как они легко сводятся к утверждениям типа 1: невозможность события Л равносильна достоверности противоположного события Л, заклю- чающегося в том, что событие Л не происходит.
14 понятие ВЕРОЯТНОСТИ [гл. 1 Простое утверждение о случайности события имеет лишь очень ограниченный познавательный интерес: оно сводится лишь к указа* нию на то, что комплекс условий S не отражает всей совокупности причин, необходимых и достаточных для появления события 4. Такое указание нельзя считать совершенно бессодержательным, так как оно может послужить стимулом к дальнейшему изучению условий появления события А, но само по себе оно ещё не даёт нам положи- тельного знания. Но имеется широкий круг явлений, когда при многократном осуществлении комплекса условий ©, доля той части случаев, когда событие А происходит, лишь изредка уклоняется сколько-нибудь значительно от некоторой средней цифры, которая, таким образом, может служить характерным показателем массовой операции (много- кратного повторения комплекса ®) по отношению к событию А» Для указанных явлений возможно не только простое констати- рование случайности события А, но и количественная оценка воз- можности его появления. Эта оценка выражается предложениями вида: 2. Вероятность того, что при осуществлении комплекса условий Ъ произойдёт событие А, равна р. Закономерности этого второго рода называются вероятностными или стохастическими закономерностями. Вероятностные закономер- ности играют большую роль в самых различных областях науки. Например, не существует способов предсказания, распадётся ли данный атом радия за данный промежуток времени или нет, но можно на основании опытных данных определить вероятность этого распада: атом радия распадается за промежуток времени в t лет с вероятностью р ~ 1___£-0,000486^ Комплекс условий S в этом примере состоит в том, что рассматри- вается атом радия, в течение данного числа лет не подвергаемый каким-либо необычайным внешним воздействиям, подобным бомбарди- ровке быстрыми частицами, в остальном условия его существования не существенны: неважно, в какую среду, какой температуры он погружён и т. п.; событие А состоит в том, что атом этот в течение заданного периода в t лет распадётся. Кажущаяся нам теперь совершенно естественной идея, ^то вероят- ность случайного события А при известных условиях допускает количественную оценку при помощи некоторого числа р = Р(Д), получила систематическое развитие впервые в XVII веке в работах Ферма (1601—1665), Паскаля (1623 — 1662), Гюйгенса и особенно Я. Бернулли (1654—1705). Их исследованиями и было положено начало теории вероятностей. В качестве математической дисциплины с тех пор теория вероятностей непрерывно развивается, обогащаясь
g 1] ДОСТОВЕРНОЕ, НЕВОЗМОЖНОЕ И СЛУЧАЙНОЕ СОВЫТИЯ 16 всё новыми важными результатами. Её применимость к изучению реальных явлений самой различной природы тоже находит всё новые блестящие подтверждения. Несомненно, что понятие математической вероятности заслуживает углублённого философского изучения. И основная специфическая философская проблема, выдвигаемая самим существованием теории вероятностей и успешным её применением к реальным явлениям, состоит в следующем: при каких условиях имеет объек- тивный смысл количественная оценка вероятности случайного события А при помощи определённого числа Р(Л), называемого математической вероят- ностью события Л, и какой объективный смысл этой оценки. Ясное понимание взаимоотношения между философскими категориями случайного и необходимого является неизбежным пред- варительным условием успешного анализа понятия математической вероятности, но этот анализ не может быть полным без ответа на поставленный нами вопрос о том, при каких условиях случайность допускает количественную оценку в виде числа — вероятности. Каждый исследователь, имеющий дело с применениями теории вероятностей к физике, биологии, артиллерийской стрельбе, эконо- мической статистике или любой другой конкретной науке, в своей работе исходит по существу дела из убеждения, что вероятност- ные суждения выражают собой некоторые объек- тивные свойства изучаемых явлений. Утверждать, что при некотором комплексе условий <5 появление события А имеет вероятность р, это значит утверждать наличие между комплексом условий © и событием А некоторой вполне определённой, хотя и своеобразной, но от этого не менее объективной, существующей независимо от познающего субъекта, связи. Философская задача и заключается в выяснении природы этой связи. Только трудность этой задачи сделала возможным то парадоксальное обстоятельство, что даже среди учёных, не стоящих на идеалистических позициях в общих вопросах философии, можно встретить стремление вместо положительного решения проблемы снять её, объявив вероятностные суждения имеющими отношение только к состоянию познающего субъекта (измеряющими степень его уверенности в наступлении события Лит. п.). Весь разнообразный опыт применения теории вероятностей в самых различных областях учит, что самая задача количественной оценки вероятности какого-либо события имеет разумный объективный смысл только при некоторых совершенно определённых условиях. Данное выше определение случайности события А при комплексе условий © чисто отрицательно: событие случайно, если оно не необ- ходимо и не невозможно. Из случайности события в этом чисто отри- цательном смысле ещё совсем не вытекает, что имеет смысл говорить о его вероятности как о некотором определённом, хотя бы и
16 ПОНЯТИЕ ВЕРОЯТНОСТИ [ГЛ. 1 неизвестном нам числе. Иначе говоря, не только утверждение — «собы- тие А при комплексе условий S имеет определённую вероятность Р (4)», — но и простое утверждение, что эта вероятность с у щ е- с т в у е т, является содержательным утверждением, нуждающимся в каждом отдельном случае в обосновании или в случае, когда оно принято в качестве гипотезы, — в последующей проверке. Например, физик, встретившись с новым радиоактивным элемен- том, будет заранее предполагать, что для атома этого элемента, пре- доставленного самому себе (т. е. не подвергаемого внешним воздей- ствиям чрезвычайно большой интенсивности), существует, некоторая вероятность распада за промежуток времени /, зависимость которой от времени имеет вид р = 1 — и поставит перед собой задачу определения коэффициента а, харак- теризующего скорость распада нового радиоактивного элемента. Может быть поставлен вопрос о зависимости вероятности распада от внеш- них условий, например, от интенсивности космического излучения: при этом исследователь будет исходить из допущения, что каждой достаточно определённой совокупности внешних условий соответ- ствует некоторое определённое значение коэффициента а. Точно так же обстоит дело и во всех других случаях успешного и оправдавшего себя на опыте применения теории вероятностей. По- этому задачу философского выяснения реального содержания понятия «математической вероятности» можно сделать заранее безнадёжной, если требовать определения, применимого к любому событию А при любом комплексе условий S. § 2. Различные подходы к определению вероятности Число различных определений математической вероятности, пред- ложенное теми или иными авторами, очень велико. Мы не станем сейчас разбираться во Bdfcx логических тонкостях этих многочисленных определений. Всякое научное определение такого рода основных поня- тий, как понятие вероятности, является лишь утончённой логической обработкой некоторого запаса очень простых наблюдений и оправ- давших себя долгим успешным применением практических приёмов. Интерес к логически безупречному «обоснованию» теории вероятно- стей возник исторически позднее, чем умение определять вероятности различных событий, производить вычисления с этими вероятностями, а также использовать результаты произведённых вычислений в прак- тической деятельности и в научных исследованиях. Поэтому в основе большинства попыток научного определения общего понятия вероят- ности легко рассмотреть те или иные стороны конкретного познава- тельного процесса, приводящего в каждом отдельном случае к фак- тическому определению вероятности того или иного события, будь
§ 2] РАЗЛИЧНЫЕ ПОДХОДЫ К ОПРЕДЕЛЕНИЮ ВЕРОЯТНОСТИ 17 то вероятность выпадения хотя бы одной шестёрки при четырёх бро- саниях игральной кости, или вероятность радиоактивного распада, или вероятность попадания в цель. Некоторые определения берут в качестве исходного пункта несущественные, побочные стороны реаль- ных процессов,— такие определения совсем бесплодны. Другие выдви- гают какую-либо одну сторону дела или какие-либо способы факти- ческого нахождения вероятности, применимые не во всех случаях, — такие определения, несмотря на их односторонность, должны быть рассмотрены более внимательно. С очерченной сейчас точки зрения большинство определений мате- матической вероятности может быть разделено на три группы: 1. Определения математической вероятности как количественной меры «степени уверенности» познающего субъекта. 2. Определения, сводящие понятие вероятности к понятию «равно- возможности» как к более примитивному понятию (так называемое «классическое» определение вероятности). 3. Определения, отправляющиеся от «частоты» появления события в большом количестве испытаний («статистическое» определе- ние). Определениям второй и третьей групп посвящены §§ 4 и 7. Конец настоящего параграфа мы посвящаем критике определений первой группы. Если математическая вероятность есть количественная мера степени уверенности познающего субъекта, то теория вероятности оказывается чем-то вроде раздела психологии. В конечном итоге после- довательное проведение такой чисто субъективистской концепции веро- ятности неизбежно приводит к субъективному идеализму. В самом деле, если допустить, что оценка вероятности имеет отношение только к состоянию познающего субъекта, то и все выводы из вероятностных суждений (суждений вида 2) лишаются объективного, не зависящего от познающего субъекта, содержания. Между тем, на вероятностных су- ждениях типа 2 наука основывает много положительных выводов, кото- рые по своей значимости ничем не отличаются от выводов, полученных без обращения к вероятностям. Например, физика все «макроскопи- ческие» свойства газов выводит из предположений о характере вероят- ностей того или иного поведения отдельных молекул. Если этим выво- дам приписывать объективное, независимое от познающего субъекта значение, то и в исходных вероятностных гипотезах о течении «макро- скопических» молекулярных процессов необходимо видеть что-то большее, чем констатацию наших психологических состояний, возни- кающих при размышлении о движении молекул. Для тех, кто стоит на точке зрения независимой от нас реальности и принципиальной познаваемости внешнего мира, а также считается с тем фактом, что вероятностные суждения успешно используются в Целях познания внешнего мира, несостоятельность чисто субъек- тивного определения математической вероятности должна быть абсо- лютно ясной. На сказанном можно было бы и закончить обсуждение 2 Зак. 1826. Б. В. Гнеденко
18 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 определений первой группы, если бы они не находили себе опоры в первоначальном обиходном смысле слова вероятность. Дело в том, что в обычной речи выражения «вероятно», «очень вероятно», «мало вероятно» и т. п. действительно выражают просто отношение гово- рящего к вопросу об истинности или ложности какого-либо единич- ного суждения. Поэтому необходимо подчеркнуть одно обстоятельство, на которое мы не обращали до сих пор специального внимания. Когда в § 1 мы сразу сосредоточили своё внимание на вероятностных законо- мерностях вида 2, противополагая их строгим причинным закономер- ностям вида 1, то мы поступали в полном соответствии со всей прак- тикой успешного научного применения понятия математической вероят- ности, но с самого начала несколько отклонились от обычного «до- научного» смысла слова «вероятность»: если во всех реальных научных применениях теории вероятностей «вероятность» есть вероятность появления некоторого события Д, при условии осуществления неко- торого принципиально воспроизводимого неограни- ченное количество раз комплекса условий <5 (только в такой обстановке высказывание р = Р(Д) выражает некоторую закономерность, имеющую объективный смысл), то в обычной речи принято говорить о большей или меньшей вероят- ности какого-либо вполне определённого суждения. Напри- мер, относительно суждений: а) каждое чётное натуральное число, большее двух, можно пред- ставить в виде суммы двух простых чисел (4 = 2 4-2, 6 = 3 4“ 3, 8 = 54-3 и т. д.); б) 7 мая 1956 года в Москве выпадет снег, — можно сказать сле- дующее: относительно суждения а) сейчас известно далеко не всё, но многие считают его весьма вероятным; точный ответ относительно суждения б) нужно думать удастся получить только 7 мая 1956 года. Однако, так как снег в Москве в мае выпадает крайне редко, в на- стоящее время суждение б) следует считать мало вероятным. Подобным высказываниям относительно вероятности единичных фактов или вообще каких-либо определённых суждений (хотя бы и общего характера) действительно можно приписать только субъек- тивный смысл: они отражают лишь отношение говорящего к данному ; вопросу. В самом деле, говоря о большей или меньшей вероятности определённого суждения, мы обычно совсем не имеем в виду подвер- гать сомнению применимость к нему принципа исключённого третьего, i Например, никто не сомневается, что на самом деле каждое из пред- ложений а), б) истинно или ложно. Если подобные сомнения и выска- зывались так называемыми интуиционистами по поводу суждения а), то во всяком случае в обычном сознании возможность говорить о большей или меньшей вероятности этого предложения никак не связана с сомнениями в применимости к нему принципа исключённого
ПОЛЕ СОБЫТИЙ 19 § 3] третьего. Если когда-либо предложение а) будет доказано или опро- вергнуто, то все предварительные оценки его вероятности, высказы- ваемые в настоящее время, потеряют смысл. Точно так же, когда на- ступит 7 мая 1956 года, легко будет обнаружить — истинно суждение б) или нет: если снег в этот день выпадет, то потеряет смысл мнение о том, что это событие мало вероятно. Полное исследование всего разнообразия психических состояний сомнения, промежуточных между категорическим признанием и категорическим отрицанием единичного суждения, как бы оно ни было интересным для психологии, лишь завело бы нас далеко в сторону от основной для нас задачи выяснения смысла имеющих объективную научную ценность вероятностных закономерностей. § 3. Поле событий В предыдущем параграфе мы видели, что определение математи- ческой вероятности как количественной меры «степени уверенности» познающего субъекта не улавливает содержания понятия вероятности. Мы возвращаемся, следовательно, к вопросу, откуда берутся объектив- ные вероятностные закономерности. Простые и непосредственные ответы на этот вопрос претендуют дать классическое и статистическое опреде- ления вероятности. Мы увидим далее, что оба эти определения отражают существенные стороны действительного содержания понятия вероят- ности, хотя каждое из них в отдельности и недостаточно. Полное понимание природы вероятности требует их синтеза. В ближайших параграфах мы займёмся исключительно классическим определением вероятности, которое исходит из представления о равновозмож- но ст и как объективном свойстве различных возможных вариантов течения изучаемых явлений, основанном на их реальной симметрии. Только с таким представлением равновозможности мы и будем в даль- нейшем иметь дело. Определение же вероятности через «равновоз- можность», понимаемую в чисто субъективном смысле одинакового «правдоподобия» для познающего субъекта, является разновидностью определений вероятности через «степень уверенности» познающего субъекта, которые мы уже исключили из рассмотрения. Прежде чем перейти к классическому определению понятия вероят- ности, мы сделаем несколько предварительных замечаний. Будем считать фиксированным комплекс условий ® и станем рассма- тривать некоторую систему S событий Л, В, С, ... *), каждое из которых должно при каждом осуществлении^комплекса ® произойти или не произойти**). М?жду событиями системы S могут *) События в дальнейшем обозначаются латинскими прописными бук- вами А, В, C,DtE,.,. **) Вместо «произойти» говорят также «появиться», «иметь место» или «наступить». 2*
20 ПОНЯТИЕ ВЕРОЯТНОСТИ Ггл. Т существовать известные соотношения, с которыми мы постояннно будем иметь дело и которые поэтому прежде всего изучим. 1) Если при каждом осуществлении комплекса условий ©, при котором происходит событие Л, происходит и событие В, то мы будем говорить, что А влечёт за собой*) В, и обозначать это обстоя- тельство символом ЛсВ или символом Bid Л. 2) Если А влечёт за собой В и в то же время В влечёт за собой Л, т. е. если при каждой реализации комплекса условий <5 события А и В оба наступают или оба не наступают, то мы будем говорить, что события А и В равносильны и будем обозначать это обстоятель- ство символом Л = В. 3) Событие, состоящее в наступлении обоих событий А и В, будем называть произведением событий Л и В и обозначать ЛВ. 4) Событие, состоящее в наступлении хотя бы одного из собы- тий А и В, будем называть суммой событий Л и В и обозначать Л -j~ В. 5) Событие, состоящее в том, что событие Л происходит, а собы- тие В не происходит, будем называть разностью событий Л и В и обозначать Л — В. Черт. 1. Пусть, например, комплекс условий S состоит в том, что внутри квадрата, изображённого на черт. 1, выбирается наудачу точка, не ♦) Вместо «Л влечёт за собой В» говорят также «Л является частным случаем В».
§ ПОЛЕ СОБЫТИЙ 21 расположенная ни на одной из двух изображённых на этом чертеже окружностей. Обозначим через А событие «выбранная точка лежит внутри левой окружности» и через В событие «выбранная точка лежит внутри правой окружности». Тогда события A, A, В, В, А-^В, АВ состоят в попадании выбранной точки внутрь областей, заштрихо- ванных на соответствующих фигурах черт. 1. Рассмотрим другой пример. Допустим, что комплекс условий <5 состоит в том, что на стол бросается (один раз) игральная кость. Обозначим через А выпадение на верхней грани кости*) шести очков, через В — выпадение трёх очков, через С—выпадение какого-либо чётного числа очков, через D — выпадение какого-либо числа очков, кратного трём. Тогда события А, В, С и D связаны следующими соотношениями: АсС, AcD, BcD, A-^B^D, CD = A. Определение суммы и произведения двух событий обобщается на любое число событий: A + B+...+W обозначает событие, заключающееся в наступлении хотя бы одного из событий А, В, .Л/, а AB...N обозначает событие, заключающееся в наступлении всех событий А, В, ..., N. 6) Событие называется достоверным, если оно с необходимостью должно произойти (при каждой реализации комплекса условий S). Например, при бросании двух игральных костей достоверно, что сумма очков будет не меньше двух. • Событие называется невозможным, если оно заведомо не может произойти (ни при одной реализации комплекса условий <5). Напри- мер, при бросании двух игральных костей невозможно появление суммы очков, равной тринадцати. Очевидно, что все достоверные события равносильны между собой. Поэтому законно обозначать все достоверные события одной буквой. Мы будем употреблять для этого букву U. Все невозможные собы- тия тоже равносильны между собой. Мы будем обозначать любое невозможное событие буквой V. 7) Два события А и А называются противоположными, если для кил одновременно выполняются два соотношения: A-\-A~U, AA=V. Игральная кость представляет собой деревянный или костяной куб, каждой грани которого нанесены соответственно 1, 2, 3, 4, 5. и 6 очков.
22 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 Например, если при бросании одной игральной кости С обозначает выпадение чётного числа очков, то U— С=С есть событие, состоящее в выпадении нечётного числа очков. 8) Два события А и В называются несовместимыми, если их совместное появление невозможно, т. е. если AB=V. Если д = В14-в24- ... -|-вй и события Bi попарно несовместимы, т. ев BiBj = V при i ф J, то говорят, что событие А подразделяется на частные случаи Вх, В2, Вп. Например, при бросании игральной кости событие С, состоящее в выпадении чётного числа очков, подразделяется на частные случаи Е2, £\, £6, состоящие соответственно в выпадении 2, 4 и 6 очков. События В19 В%, ..., Вп образуют полную группу событий, если хотя бы одно из них непременно должно произойти (при каждом осуществлении комплекса <5), т. е. если В1 + В9+...+В„ = £7. Особенно существенны для нас в дальнейшем будут полные группы попарно несовместимых событий. Такова, например, при однократном бросании игральной кости система событий £и £2, £3, £5, £6, состоящая, соответственно, в появлении 1, 2, 3, 4, 5 и 6 очков. 9) В каждой задаче теории вероятностей приходится иметь дело с каким-либо определённым комплексом условий S и с какой-либо определённой системой 5 событий, наступающих или не наступающих после каждой реализации комплекса условий <5. Относительно этой системы целесообразно сделать следующие допущения: а) если системе S принадлежат события А и В, то ей при- надлежат также события АВ, А — В\ б) система S содержит достоверное и невозможное события. Система событий, удовлетворяющая этим допущениям, называется j полем событий. Заметим ещё в заключение, что во всех рассмотрениях теории вероятностей равносильные между собой события могут заменять друг друга. Поэтому мы условимся в дальнейшем любые два равносильных события считать просто тождественными друг другу.
§ 4] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 23 § 4. Классическое определение вероятности Классическое определение вероятности сводит понятие вероятности к понятию равновероятности (равновозможности) событий, которое считается основным и не подлежит формальному определению.. Для примера: при бросании кубика, который имеет точную форму куба и изготовлен из вполне однородного материала, равновероятными событиями будут выпадения какого-нибудь определённого числа очков (1, 2, 3, 4, 5, 6), обозначенного на гранях этого куба, поскольку в силу наличия симметрии ни одна из граней не имеет объективного преимущества перед другими. Классическое определение вероятности может быть сформулировано так: Если событие А подразделяется на/n частных слу- чаев, входящих в полную группу из п попарно несо- вместимых и равновозможных событий, то вероят- ность Р(Д) события А равна РИ) = ^. Например, при однократном бросании игральной кости полная группа попарно несовместимых и равновероятных событий состоит из событий Еу ^2» ^3» ^4» ^*6» которые состоят соответственно в выпадении 1, 2, 3, 4, 5, 6 очкоь Событие С — Е2 -f~ Eq, состоящее в выпадении чётного числа очков, подразделяется на три частных случая, входящих в состав полной группы несовместимых и равновероятных событий. Поэтому вероятность события С равна Р(о=4=1 : Очевидно также, что в силу принятого определения Р(£<) = |, 1<Z<6, и Ъ Д. В теории вероятностей широко используется следующая терми- нология, к которой мы часто впоследствии будем обращаться. Пред- ставим себе, что для выяснения вопроса, произойдёт или не произойдёт событие А (например, выпадение числа очков, кратного трём), необ- ходимо произвести некоторое испытание (т. е. осуществить ком- плекс условий <5), которое дало бы ответ на поставленный вопрос (в нашем примере требуется бросить игральную кость). Полная группа
24 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. I попарно несовместимых, и равновероятных событий, которые могут произойти при таком испытании, называется полной группой воз- можных результатов испытания. Те из возможных результатов испытания, на которые подразделяется событие Л, называются резуль- татами испытания, благоприятствующими А, Пользуясь этой термино- логией, можно сказать, что вероятность Р (Д) события А равняется отношению числа возможных результатов испытания^ благоприят- ствующих событию Л, к числу всех возможных результатов испытания. Понятно, что такое определение предполагает, что отдельные воз- можные результаты испытания равновероятны. Рассмотрим теперь бросание двух костей. Если кости правильны, то выпадение каждой из 36 возможных комбинаций числа очков на первой и второй кости можно считать равновероятными. Так, скажем, вероятность выпадения в сумме 12 очков равна Выпадение в сумме 11 очков возможно двумя способами: на первой кости 5, а на другой 6, на первой кости 6, а на второй 5. Поэтому вероят- ность выпадения в сумме одиннадцати очков равна 2/36 = 1/18. Читатель легко проверит, что вероятности выпадения той или иной суммы очков даются следующей таблицей: Таблица 1 Число очков 2 3 4 5 6 7 8 9 10 11 12 Вероятность 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Рассмотрим какую-либо группу G, состоящую из п попарно не- совместимых равновозможных событий (назовём их элементарными событиями): ^1, ^2» • • • > и рассмотрим систему S, состоящую из невозможного события V, всех событий Ек группы G и всех событий А, которые могут быть подразделены на частные случаи, входящие в состав группы G. Например, если группа О состоит из трёх событий Е2 и Е& то в систему S входят события *) Vt Ev Е^ Е3, Ех~\-Е^ Е2-\-Е& А + ^3. U — + ^2 + ^з- Легко установить, что система S есть поле событий. В самом деле, очевидно, что сумма, разность и произведение событий из S ♦) Этими восемью событиями система S исчерпывается, если не различать между собой (как это мы и условились делать, начиная с конца § 2) равно- сильные друг другу события. Легко показать, что в общем случае группы G из п событий система S состоит из 2п событий.
§ 4] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 25 входят в S; невозможное событие V входит в S по определению, а достоверное событие U входит в S, так как оно представляется в виде 17=Е1 + Е2+...+Е„. В соответствии с приведённым определением каждому событию принадлежащему к построенному сейчас полю событий S, приписы- вается вполне определённая вероятность Р(Л) = ?, где т есть число тех событий Е4 исходной группы О, которые являются частными случаями события А. Таким образом, вероят- ность Р(Л) можно рассматривать как функцию от события 4» определённую на поле событий S. Функция эта обладает следующими свойствами: 1. Для каждого события А поля S Р(Л)>0. 2. Для достоверного события U Р(У) = 1. 3. Если событие А подразделяется на частные случаи В и С и все три события А, В и С принадлежат полю S, то Р(А) = Р(В) + Р(С). Это свойство называется теоремой сложения вероят- ностей. Свойство 1 очевидно, так как дробь ~ не может быть отрица- тельной. Свойство 2 не менее очевидно, так как достоверному событию U благоприятствуют все п возможных результатов испытания, и поэтому Р(£/) = 7 = 1. Докажем свойство 3. Пусть событию В благоприятствуют а событию С—т" событий Ei группы О. Так как события В и С по допущению несовместимы, то события Еъ благоприятствующие одному из них, отличны от событий Е^ благоприятствующих другому* Всего, таким образом, имеется т! -j- т" событий Еь благоприят- ствующих появлению одного из событий В или С, т. е. благоприят- ствующих событию В-\-С = А. Следовательно, Р(Л) = ^^== J+v = P(B)+P(c)> 'vro и требовалось доказать.
26 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 Мы ограничимся здесь указанием ещё нескольких свойств вероят- ности. 4. Вероятность события А, противоположного событию А, равна Р(А) = 1 —Р(А). Действительно, так как А + А = £Д -То, согласно уже доказанному свойству 2, Р(А + Л) = 1, а так как события А и А несовместимы, то по свойству 3 Р(А+А) = Р(А)-|-Р(й). Два последних равенства доказывают наше предложение. 5. Вероятность невозможного события равна нулю. В самом деле, события U и V несовместимы, поэтому P(£d + P(V) = P(U). откуда следует, что P(V) = O. 6. Если событие А влечёт за собой событие В, то Р(А)<Р(В). Действительно, событие В может быть представлено как сумма двух событий А и АВ. Отсюда в силу свойств 3 и 1 получаем: Р(5) = Р(Л + АВ) = Р(Л) + Р(ДВ)>Р(Л)е 7. Вероятность любого события заключена между нулем и единицей. . Из того, что для любого события А имеют место соотношения V = A = AZ7czZ7, следует в силу предыдущего свойства, что имеют место неравенства O = P(V)<P(A)<P(l/)=l. § 5. Примеры Мы рассмотрим теперь несколько примеров вычисления вероят- ностей событий, пользуясь классическим определением вероятности. Приводимые нами примеры носят исключительно иллюстративный характер и не претендуют на то, чтобы сообщить читателю все основ- ные методы расчёта вероятностей.
27 ПРИМЕРЫ § 5J Пример 1. Из колоды карт (36 карт) наудачу вынимаются три карты. Найти вероятность того, что среди них окажется точно один туз. Решение. Полная группа равновероятных и несовместимых событий в нашей задаче состоит из всевозможных комбинаций по три карты, их число равно Cf6. Число благоприятствующих событий можно подсчитать следующим способом. Один туз мы можем выбрать Cj различными способами, а две другие карты (не тузы) можно выбрать С|3 различными способами. Так как для каждого определённого туза две остальные карты могут быть выбраны С& способами, то всего благо- приятствующих случаев будет Cj • С|2. Искомая вероятность, такйм образом, равна 4 32 * 31 44 1 • 1-2 _ 31-16 ___ 496 CL 36-35-34 “35-3-17“ 1785 и.-й"О, 86 -П2Г3- т. е. немного больше 0,25. Пример 2. Из колоды карт (36 карт) наудачу вынимаются три карты. Найти вероятность того, что среди них окажется хотя бы один туз. Решение. Обозначим интересующее нас событие буквой А: оно может быть представлено в виде суммы трёх следующих несовмести- мых событий: — появление одного туза, Д2— появления двух тузов, А3— появления трёх тузов. Рассуждениями, аналогичными тем, которые мы привели при реше- нии предыдущей задачи, легко установить, что число случаев, благо- приятствующих событию At равно С1 • С|2, » А(2 » Cl * С32, » Аз » С| • С32. В Так как число всевозможных случаев равно Сзв, то Cj-CL 16-31 р (А ) = -£-± 0,2778, v 17 CL 3-35-17 <>0 з • 16 р (А2) = = 0,0269, <4 3-35-17 С? - С»2 1 р (А3) = -Ц-2 = х : 0,0006. V 37 CL 3-35-17 ао В силу теоремы сложения Р (А) = Р (А,) + Р (Аз) + Р (А3) = ~ 0,3053.
28 ПОНЯТИЕ ВЕРОЯТНОСТИ (гл. 1 Этот пример можно решить и иным методом. Событие А, противо- положное А, состоит в том, что среди вынутых карт не окажется ни одного туза. Очевидно, что три нетуза можно вынуть из колоды карт С32 различными способами и, следовательно, - С* 32.31*30 р /Д) = ___________ V 7 С|8 36*35.34 31-8 3*17-7 ~ 0,6947. Искомая вероятность равна р (Д) = 1 — р (А) ~ 0,3053. Примечание. В обоих примерах выражение «наудачу» означало, что всевозможные комбинации по три карты равновероятны. Пример 3. Колоду карт, состоящую из 36 карт, наудачу раз- деляют на две равные части. Чему равна вероятность, что в обеих частях окажется по равному числу красных и чёрных карт. Выражение «наудачу» означает, что всевозможные разделения колоды на две равные части равновероятны. Решение. Нам нужно найти вероятность того, что среди наудачу вынутых из колоды 18 карт 9 будут красными и 9 — чёрными. Общее число различных способов, которыми можно выбрать 18 карт из 36, равно Сзв* Благоприятствующими способами окажутся все те, при которых из 18 красных карт будут извлечены какие-то 9 и из 18 чёрных карт будут извлечены какие-то 9. 9 красных карт можно извлечь Cfs различными способами и 9 чёрных также Cf8 различными способами. Так как при извлечении 9 определённых красных карт 9 чёрных можно извлечь Ct$ различными способами, то общее число благоприятствующих способов равно С±з * Ci8. Искомая вероятность равна, следовательно, __ ^18’^18 __ (18!)4 р~~ <4в “36 w Чтобы составить себе представление о величине этой вероятности и при этом не производить утомительных вычислений, мы восполь- зуемся формулой Стирлинга, согласно которой имеет место следую- щее асимптотическое равенство: п!~ ппе~п. Таким образом, имеем: 18!~1818e-18]/2it • 18" 9!~ 99 е-9 /2ir~9, 36!~3686 . е-з« J/2- •'36,
ПРИМЕРЫ 29 § 5] и значит, _________(У2гс~П1Г. 1818-е~18)4 Р~ 99.е-9)4 После несложных преобразований находим, что 2 4 р---------74=~4~0,26. F /18 те 15 Пример 4. Имеются п частиц, каждая из которых может нахо- диться с одной и той же вероятностью в каждой из N(N > п) ячеек. Найти вероятность того, что: 1) в определённых п ячейках окажется по одной частице, 2) в каких-то п ячейках окажется по одной частице. Решение. Эта задача играет важную роль в современной статистической физике, и в зависимости от того, как образуется полная группа равновероятных событий, приходят к той или иной физической статистике: Больцмана, Бозе-Эйнштейна, Ферми-Дирака. В статистике Больцмана равновероятными считаются любые мысли- мые распределения, отличающиеся не только числом, но и индиви- дуальностью частиц: в каждой ячейке может помещаться любое число частиц от 0 до п. Общее число возможных распределений мы подсчитаем следую- щим способом: каждая частица может находиться в каждой из Л/ ячеек, следовательно, п частиц можно распределить по ячейкам № различными способами. В первом вопросе число благоприятствующих случаев будет, оче- видно, п\ и, значит, вероятность того, что в определённые п ячеек попадёт по одной частице, равна „ _ п\ Pl — Nn- Во втором вопросе число благоприятствующих случаев будет в раз больше и, значит, вероятность того, что в какие-то п ячеек попадёт по одной частице, равна _ C^-nt дп A— Nn = Nn(N—n)\' В * * * * * * * В статистике Бозе-Эйнштейна считаются тождественными случаи, когда частицы меняются местами между ячейками (важно только, сколько частиц попало в ячейку, но не индивидуальность попавших частиц), и полная группа равновероятных событий состоит из все- возможных распределений п частиц по N ячейкам, причём за одно распределение принимается целый класс больцмановских распределе- ний, отличающихся не числами содержащихся в определённых ячейках частиц, а только самими частицами. Для наглядного представления
30 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 о различии статистик Больцмана и Бозе-Эйнштейна рассмотрим частный пример: W = 4, п = 2. Всевозможные распределения в этом примере можно записать в виде следующей таблицы, в которой а и b — наименования частиц. В статистике Больцмана все 16 возмож- ностей представляют собой различные равновероятные события, в статистике же Бозе-Эйнштейна случаи 5 и 11, 6 и 12, 7 и 13, 8 и 15, 10 и 16 попарно отождествляются и мы имеем группу из 10 равновероятных событий. Таблица 2 Случаи 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15. 16 Ячейки ab а а а b b b ab Ъ а а а b b ab b b а а а b ab b b Ъ а а а Вычислим теперь общее число равновероятных случаев в стати- стике Бозе-Эйнштейна. С этой целью заметим, что всевозможные размещения частиц по ячейкам мы можем получить следующим путём: расположим ячейки на прямой вплотную друг к другу, расположим далее рядом одну возле другой на той же прямой наши частицы. Рассмотрим теперь всевозможные перестановки частиц и перегородок между ячейками. Таким образом, как легко сообразить, будут учтены всевозможные заполнения ячеек, отличающихся как порядком распо- ложения частиц в ячейках, так и порядком расположения перего- родок. Число этих перестановок равно — 1)!. Среди этих пере- становок имеются и тождественные: каждое распределение по ячей- кам считается (N—1)! раз, так как мы различали, какие перегородки были между ячейками, а кроме того, каждое распределение по ячей- кам мы снова считали по п\ раз, так как мы учитывали не только число частиц в ячейке, но и то, какие это частицы и в каком порядке они расположены. Таким образом, каждое распределение по ячейкам мы считали и! (/V—1)! раз, отсюда число различных в смысле Бозе-Эйнштейна распределений частиц по ячейкам равно (л + ЛГ— 1)! n\(N — 1)! * Таким образом, число равновероятных событий в полной группе собы- тий нами найдено. Теперь мы легко можем ответить на вопросы
§ g] ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ 31 нашей задачи. В статистике Бозе-Эйнштейна вероятности pj и р3 равны _ _ 1________л!(ЛГ-1)! P1~~(n+N—1)! — (л +?/— 1)!’ л! (N— 1)! _ CN _ 1)! Рз + 1)J— (ДГ __ пу (дг_|_ л_ 1)! nl(N— 1)! Рассмотрим, наконец, статистику Ферми-Дирака. Согласно этой статистике в ячейке может находиться либо одна частица либо не находится ни одной: индивидуальность частиц уничтожается. Общее число различных распределений частиц по ячейкам в ста- тистике Ферми-Дирака подсчитать легко: первая частица может быть расположена N различными способами, вторая — только N—1, третья—(N — 2) и, наконец, п-я— (N—я+О различными спосо- бами. Таким образом, п частиц по N ячейкам могут быть располо- жены различными равновероятными способами. Легко сообразить, что в статистике Ферми-Дирака искомые вероятности равны р8=1. Рассмотренный пример -показывает, насколько важно точно опре- делять, какие события считаются в задаче равновероятными. § 6. Геометрические вероятности Ещё в самом начале развития теории вероятностей была замечена недостаточность «классического» определения вероятности, основан- ного на рассмотрении конечной группы равновероятных событий. Уже тогда частные примеры привели к некоторому видоизменению этого определения и построению понятия вероятности также для случаев, когда мыслимо бесконечное множество исходов. При этом попрежнему основную роль играло понятие «равновероятности» неко- торых событий. Общая задача, которая ставилась и привела к распростране- нию понятия вероятности, может быть сформулирована следующим способом. Пусть имеется, например, на плоскости некоторая область Q и в ней содержится другая область g с квадрируемой границей.
32 ПОНЯТИЕ ВЕРОЯТНОСТИ Ггл. 1 В область G наудачу бросается точка и спрашивается, чему равна вероятность того, что точка попадёт в область g. При этом выра- жению «точка бросается наудачу в область G» придаётся следующий смысл: брошенная точка может попасть в любую точку области G, вероятность попасть в какую-либо часть области G пропорциональна мере этой части (длине, площади и т. д.) и не зависит от её рас- положения и формы. Таким образом, по определению, вероятность попадания в об- ласть g при бросании наудачу точки в область G равна mesg mes G ’ Рассмотрим несколько примеров. Пример1. Задача о встрече. Два лица А и В услови- лись встретиться в определённом месте между 12 часами и часом. Пришедший первым ждёт другого в течение 20 минут, после чего уходит. Чему равна вероятность встречи лиц А и В, если приход каждого из них в течение указанного часа может произойти наудачу и моменты прихода независимы *). Решение. Обозначим моменты прихода лица А через х и лица В через у. Для того чтобы встреча произошла, необходимо и достаточно, чтобы |х — ^|<20. Станем изображать х и у как декар- товы координаты на плоскости; в ка- честве единицы масштаба выберем минуту. Всевозможные исходы изобра- сторонами 60; благоприятствующие встрече — расположатся в заштрихованной области. Искомая вероятность равна **) отношению площади заштрихован- ной фигуры к площади всего квадрата: _602--402 _ 5 Р~ 602 — 9 • Некоторые инженеры-исследователи применяли задачу о встрече к решению следующей проблемы организации производства. Рабочий *) То-есть момент прихода одного лица не влияет на момент прихода другого. Понятие независимости событий будет подробно рассмотрено в § 9. ♦*) В § 9 мы увидим, что в силу независимости моментов прихода лиц Д и В вероятность того, что лицо А придёт в промежуток от х до x-}-h, а лицо В — в промежуток от у до у + s> равна -gg- • , т. е. пропорцио- нальна площади прямоугольника со сторонами h и s. У Черт. 2. зятся точками квадрата
ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ 33 § 61 обслуживает несколько однотипных станков, каждый из которых в случайные моменты времени может потребовать внимания рабочего. Может случиться, что в то время, когда рабочий занят у одного станка, потребовалось его вмешательство у других станков. Требуется найти вероятность этого события, т. е., иными словами, среднюю длительность ожидания станком рабочего (иначе говоря, простой станка). Заметим, однако, что схема задачи о встрече мало пригодна для решения этого производственного допроса, так как никакого условленного времени, в течение которого станки обязательно тре- буют к себе внимания рабочего, не существует, а длительности операции рабочего у станка не постоянны. Помимо этой основной причины, нужно указать на сложность вычислений в задаче о встрече для случая большого числа лиц (станков). А эту задачу нередко нужно решать для большого числа станков (в текстильном произ- водстве, например, некоторые ткачихи обслуживают до 280 ткацких станков). Пример 2. Парадокс Бертрана. Теория геометрических вероятностей неоднократно подвергалась критике за t произвольность определения вероятности событий. При этом многие авторы прихо- дили к убеждению, что для бесконечного числа исходов нельзя дать объективного, не зависящего от способа расчёта, определения вероят- ности. В качестве особенно яркого выразителя этого скептицизма можно привести французского математика прошлого века Жозефа Бертрана. В своём курсе теории вероятностей он привёл ряд задач на геометрические вероятности, в которых результат зависел от метода решения. В качестве примера приведём одну из задач, рас- смотренных Бертраном. Наудачу берётся хорда в круге. Чему равна вероятность, что её длина превосходит длину стороны вписанного равностороннего тре- угольника? Решение 1. По соображениям симметрии можно заранее задать направление хорды. Проведём диаметр, перпендикулярный к этому направлению. Очевидно, что только хорды, пересекающие диаметр в промежутке от четверти до трёх четвертей его длины, будут превосходить стороны правильного треугольника. Таким обра- зом, искомая вероятность равна -i-. Решение 2. По соображениям симметрии можно заранее за- крепить один из концов хорды на окружности. Касательная к окруж- ности в этой точке и две стороны правильного треугольника с вер- шиной в этой точке образуют три угла по 60°. Условию задачи благоприятствуют только хорды, попадающие в средний угол. Таким образом, при этом способе вычисления искомая вероятность оказывается равной одной третьей. Решение 3. Чтобы определить положение хорды, достаточно задать её середину. Чтобы хорда удовлетворяла условию задачи, •3 Зак. 1826. Б. В. Гнеденко.
34 ПОНЯТИЕ ВЕРОЯТНОСТИ [ГЛ. 1 необходимо, чтобы её середина находилась внутри круга, концент- рического данному, но половинного радиуса. Площадь этого круга равна одной четверти площади данного; таким образом, искомая вероятность равна . Мы должны теперь выяснить, в чём причина неоднозначности решения нашей задачи. Лежит ли причина в принципиальной невоз- можности определить вероятность для случаев бесконечного числа возможных исходов или же причина лежит в том, что мы приняли в процессе решения какие-либо недопустимые предпосылки. Дело, как легко усмотреть, заключается в том, что за решение одной и той же задачи, пользуясь тем, что в условии задачи не определено понятие проведения хорды наудачу, выдаются решения трёх различных задач. В самом деле, в первом решении вдоль одного из диаметров заставляют катиться круглый цилиндрический стержень. Множество всех возможных мест остановки этого стержня есть мно- жество точек отрезка АВ длины, равной диаметру. Равновероятными считаются события, состоящие в том, что остановка произойдёт в интервале длины h, где бы внутри диаметра ни был расположен этот отрезок. Во втором решении стержень, закреплённый на шарнире, распо- ложенном в одной из точек окружности, заставляют совершать коле- бания размером не более 180°. При этом предполагается, что оста- новка стержня внутри дуги окружности длины h зависит только от длины дуги, но не от её положения. Таким образом, равновероятными событиями считаются остановки стержня в любых дугах окружности одинаковой длины. Несогласованность определений вероятности в пер- вом и во втором решениях становится совершенно очевидной после такого простого расчёта. Вероятность того, что стержень остановится в промежутке от А до х, согласно первому решению равна Вероятность того, что проекция точки пересечения стержня с окруж- ностью во втором решении попадёт в тот же интервал, как показы- вают элементарно геометрические подсчёты, равна Черт. 3. , 1 2х — D 1----arc cos—~— к и D при тл z при Наконец, в третьем решении мы бросаем наудачу точку внутрь круга и спрашиваем себя о вероятности попадания внутрь некоторого меньшего концентрического круга.
§ 61 ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ 35 Различие постановок задач во всех трёх случаях совершенно очевидно. Пример 3. Задача Бюффона. Плоскость разграфлена парал- лельными прямыми, отстоящими друг от друга на расстоянии 2а. На плоскость наудачу * **)) бросается игла длины 21 (I < а). Найти вероятность того» что игла пересечёт какую-нибудь прямую. Решение. Обозначим через х расстояние от центра до ближай- шей параллели и через <р — угол, составленный иглой с этой парал- лелью. Величины х и <р полностью определяют поло- жение иглы. Всевозможные *1 положения иглы определяют- ся точками прямоугольника । /у* со сторонами а и тс. Из а <7 черт. 4 видно, что для пе- ресечения иглы с параллелью необходимо и достаточно, -1-----------------:---—— ---------- чтобы . Черт. 4 х / sin ср. Искомая вероятность в силу сделанных предположений равна отно- шению площади заштрихованной на черт. 5 области к площади прямоугольника те о Заметим, что задача Бюффона является исходным пунктом для решения некоторых проблем теории стрельбы, учитывающих размеры снаряда. Черт. 5. Пример 4. На горизонтальную плоскость, разграфлённую парал- лельными прямыми, отстоящими друг от друга на расстоянии 2а, наудачу *♦) брошен выпуклый контур, диаметр которого меньше 2а. *) Под словом «наудачу» здесь подразумевается следующее: во-первых, центр иглы наудачу падает на отрезок длины 2а, перпендикулярный к про- ведённым прямым, во-вторых, вероятность того, что угол <р, составленный иглой и проведёнными прямыми, будет заключаться между и ©i + Аср про- порциональна Дер и, в-третьих, величины х и ср независимы (см. § 9). **) В этом примере «наудачу» значит, что мы берём какой-либо отрезок, жёстко связанный с контуром, и бросаем его «наудачу» в смысле предыду- щего примера. Нетрудно показать, что иаким образом определённое понятие не зависит от выбора указанного отрезка. 3*
36 . ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. I Найти вероятность того, что контур пересечёт одну из параллельных прямых. Решение. Положим сначала, что выпуклый контур является многоугольником с п сторонами. Пусть его стороны пронумерованы от номера 1 до номера п. Если многоугольник пересекается с какой- либо параллельной прямой, то это пересечение должно произойти по каким-либо двум сторонам. Обозначим через вероятность того, что пересечение произойдёт по Ай и у-й сторонам. Очевидно, что событие Д, состоящее в том, что брошенный многоугольник пересечёт одну из параллельных прямых, может быть представлено в виде следующей суммы попарно несовместимых событий: Л = (Л124-^8*4- ••• А1п) + (^23 + ^24 + ••• + ^2п) + ••• ••• + (^п-2> п-1 Ч““ ^п-2> п) ^п-Ь п> где через I — 1, 2, ...; j = 1, 2, ...) обозначено событие, состоящее в пересечении с параллельной прямой Ай и у-й сторон. По теореме сложения вероятностей Р = Р(Л) = (Р(Л12) + Р(Л13)+ ... +Р(Л1П)1 + +IPGW + ••• +Р (л2п)]+ +Р(Л-ьп) = в=(Рм+/’1в4" • • . + Pin) 4-(/’se+/’24 + •. • +Р2я)+ • • • Пользуясь равенством Pij=Pj{, мы можем записать вероятность р иным способом: Р = у [(Р12 + /’1#4_ . • . 4"Р1п) + (/72t + Pw + • • • Ч“Р2п) + • • . ••• И" (Pni +Ряг+ • • • + Рп, п-1)]* п Но сумма 2 Pih r^e положено pit = 0, представляет собой не что иное, как вероятность пересечения Ай стороны многоугольника с одной из параллельных прямых. Если длину Ай стороны обозначить через 24, то из задачи Бюффона находим, что п и, следовательно, п г==1 ps=z 2ъа * Если обозначить через 2s периметр многоугольника, то мы найдём, что s р = па *
§ у] СТАТИСТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 37 Мы видим, таким образом, что вероятность р не зависит ни от числа сторон, ни от величины сторон многоугольника. Отсюда мы заключаем, что найденная формула верна и для любого выпуклого контура, так как мы всегда можем рассматривать этот последний как предел выпуклых многоугольников с безгранично возрастающим числом сторон. § 7. Статистическое определение вероятности Классическое определение вероятности при переходе от простей- ших примеров к рассмотрению сложных задач, в особенности же задач естественно-научного или технического характера, наталкивается на непреодолимые трудности принципиального порядка. Прежде всего, в большинстве случаев возникает вопрос о возможности нахождения разумного способа выделения «равновозможных случаев». Так, на- пример, из соображений симметрии, на которых основаны наши суждения о равновероятности событий, вывести вероятность распада атома радиоактивного вещества за определённый промежуток времени, или же определить вероятность того, что родившийся ребёнок ока- жется мальчиком, представляется невозможным. Этой трудности не существует для статистического определения вероятности, к которому мы и переходим. Длительные наблюдения над появлением или непоявлением собы- тия А при большом числе повторных испытаний, происходящих при неизменном комплексе условий <5, показывают, что число появлений события А подчиняется устойчивым закономерностям. А именно, если мы через обозначим число появлений события А при п неза- U. висимых испытаниях, то оказывается, что отношение ~ при доста- точно больших п для большинства таких серий наблюдений сохраняет почти постоянную величину, причём большие отклонения наблюдаются тем реже, чем многочисленнее произведённые испытания. Более того, оказывается, что для тех случаев, к которым применимо классическое определение вероятности, это колебание частоты происходит около вероятности события р. Мы увидим впоследствии, что этот эмпири- ческий факт имеет глубокие основания в теореме Бернулли. То, что при большом числе испытаний частота события остаётся почти постоян- ной, 'даёт нам возможность расширить круг явлений, для которых мы будем говорить об их вероятности. При таком определении мы сохраняем за вероятностью её объектив- ный, не зависящий от познающего субъекта смысл. То, что заключе- ние о наличии у того или иного события вероятности мы можем вынести лишь после некоторых предварительных наблюдений, нисколько не обесценивает наши выводы, так как познание закономерностей никогда не берётся из ничего, ему всегда предшествуют эксперимент, наблюдение. Сами эти закономерности, конечно, существовали и до
38 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 вмешательства экспериментирующего и мыслящего лица, но были лишь неизвестны науке. Представим себе, что относительно события А принципиально возможно проведение неограниченной последовательности независимых друг от друга испытаний в неизменных условиях <5. Если в резуль- тате достаточно многочисленных наблюдений замечено, что частота события А ведёт себя достаточно правильно и почти всегда колеблется около некоторой, вообще говоря, неизвестной, постоянной, то мы скажем, что это событие имеет вероятность. За численное значение этой вероятности может быть приближённо при большом числе п независимых испытаний, производящихся в не- изменных условиях (5, принята частота события Д. Понятно, что при этом мы не определяем вероятность, а лишь постулируем её существование и указываем способ её приближённого определения. При этом, подчеркнём это вторично, последовательность испытаний нами используется не для определения вероятности, так как любое объективное свойство изучаемого явления, в том числе и вероятность события А, должно определяться исключительно из стру- ктуры самого явления, безотносительно к тому, производится или не производится эксперимент, присутствует или отсутствует эксперимен- тирующий интеллект. Тем не менее эксперименту нами отводится существенная роль: во-первых, именно эксперимент позволяет под- метить существующие в природе теоретике-вероятностные законо- мерности, во-вторых, он позволяет приближённо находить неизвестные вероятности изучаемых нами событий и, наконец, он даёт возмож- ность производить проверку правильности тех теоретических пред- посылок, которые мы делаем в наших исследованиях. Последнее обстоятельство требует пояснения. Представим себе, что некоторые соображения дают нам основание считать, что вероятность некоторого события А равна р. Пусть, далее, при проведении нескольких серий независимых испытаний оказалось, что частоты в подавляющем числе серий значительно отклоняются от величины р. Это обстоятельство даёт нам основание высказать сомнение относительно правильности наших априорных суждений и предпринять более детальное исследо- вание тех предпосылок, из которых мы исходили в своих априорных выводах. Так, например, в отношении некоторой игральной кости мы делаем предположения о её геометрической правильности и одно- родности материала, из которого она изготовлена. Из этих предва- рительных предпосылок мы вправе сделать вывод, что при бросании кости вероятность выпадения некоторой грани, например, грани с номером 5, должна быть равна -I. Если неоднократные серии до- статочно многочисленных испытаний (бросаний) в нашем примере систематически показывают, что частота появления этой грани значи- тельно отличается от то мы усомнимся не в существовании опре-
СТАТИСТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 39 §7] делённой вероятности выпадения этой грани, а в наших предпосылках 0 правильности кости или в правильности организации процесса наших испытаний (бросаний). В качестве иллюстрации почти постоянства частот при больших числах испытаний рассмотрим распределение новорождённых по полу по месяцам. Данные заимствованы из книги Г. Крамера «Математи- ческие методы статистики» и представляют собой официальные данные шведской статистики за 1935 г. Таблица 3 Месяц 1 2 3 4 5 6 7 8 9 10 11 12 За год Всех 7280 6957 7883 7884 7892 7609 7585 7393 7203 6903 6552 7132 88 273 Мальчиков . . 3743 3550 4017 4173 4117 3944 3964 3797 3712 3512 3392 3761 45 682 Девочек . . . 3537 3407 3866 3711 3775 3Q55 3621 3596 3491 3391 3160 3371 42591 Частота рож- дения дево- чек 0,486 0,489 0,490 0,471 0,478 0,482 0,462 0,484 0,485 0,491 0,482 0,473 0,4825 На черт. 6 показано уклонение частоты рождений девочек по месяцам от частоты рождений девочек за год. Заметим, что в случае 'статистического определения снова имеют место такие свойства ве- роятности: 1) вероятность досто- „ » *____________» верного события равна " 5 * “ "* 7* единице; * 2) вероятность невоз- можного события равна нулю; 3) если случайное со- ^4—,—(—,—,—।—।—।—।—।—>—>—г-* бытие С является суммой * 1 Z з ч s в 7 8 9 W 11 1Z конечного числа несо- церт g вместимых событий Alt ’ I ^2» • • •» Ап имеющих вероятность, то его вероятность существует и равна сумме вероятностей слагаемых Р(С) = Р(А1) + Р(Д2)+ ... +Р(АЯ). В заключение мы должны остановиться на весьма распространён- ной, в особенности среди естествоиспытателей, концепции вероятности, Данной Р. Мизесом. Согласно Мизесу раз частота по мере увеличения опытов всё меньше и меньше уклоняется от вероятности р, то в пределе должно быть р = lim ~. П
40 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 Это равенство Мизес предлагает считать определением понятия вероят- ности. По его мнению, любое априорное определение обречено на неудачу и лишь данное им эмпирическое определение способно обес- печить интересы естествознания, математики и философии, причём раз классическое определение имеет лишь весьма ограниченное при- менение, а статистическое определение применимо ко всем имеющим научный интерес случаям, то классическое определение через равно- возможность, основанную на симметрии, Мизес предлагает вовсе отбросить. Более того, Мизес считает вообще ненужным выяснение структуры явлений, для которых вероятность является объективной числовой характеристикой, для него достаточно наличия эмпирической устойчивости частоты. Мы не будем останавливаться на деталях теЪрии Мизеса, в част- ности, на тех ограничениях и условиях, которые он дополнительно накладывает на последовательность испытаний. За подробностями его теории мы отошлём читателя к книге Мизеса «Вероятность и стати- стика», а за более развёрнутой критикой — к статье А. Я. Хинчина*). Здесь же мы ограничимся лишь немногими замечаниями, которые должны показать* читателю неприемлемость концепции Мизеса. Выдвинутые Мизесом положения нашли горячих поклонников, особенно среди представителей естественных наук, в значительной степени благодаря убедительной критике узости и ограниченности классических понятий и призыву к опыту для определения вероят- ности. Но мы знаем по той уничтожающей критике, которую дал В. И. Ленин различным направлениям идеализма в своей бессмертной книге «Материализм и эмпириокритицизм», что не каждый учёный, говорящий о том, что он основывает свою теорию на опыте, дей- ствительно строит материалистическую теорию. Так случилось и с Мизесом. В конечном счёте его принципиальные установки вполне согласуются с философией Маха, да и сам Мизес не скрывает этого и открыто об этом заявляет. В концепции Мизеса вероятность теряет свой характер объектив- ной числовой характеристики некоторых реальных явлений. Дей- ствительно, до производства бесконечного числа испытаний нельзя даже говорить про вероятность того или иного события, а поскольку этого нельзя осуществить, то и вообще мы лишены возможности в каких-либо условиях использовать теорию вероятностей. Следует заметить при этом, что, требуя от частот сходимости к вероятности, Мизес выставляет такое требование; какого не предъявляют ни в одной области естествознания. Ведь, в самом деле, никто из нас не откажется от понятия температуры только потому, что мы не можем произвести бесконечного числа измерений и не можем про- верить, будут ли результаты этих измерений стремиться к пределу, *) «Учение Мизеса о вероятностях и принципы физической статистики», Успехи физических наук, т. IX, вып. 2, 1929 Г.
§ 3 АКСИОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ТЕОРИИ 41 если бы мы их всё же стали производить. Или не станем же мы гово- рить, что какой-либо предмет не имеет размеров только потому, что последовательность наших измерений не стремится к пределу. Более того, следуя за Мизесом, мы вообще не можем говорить о температуре тела или о существовании размеров предмета до тех пор, пока не появится мыслящий субъект, не начнёт производить измерения и не убедится в том, что их результаты стремятся к пре- делу. § 8. Аксиоматическое построение теории вероятностей До недавнего времени теория вероятностей представляла собой ещё не сложившуюся математическую науку, в которой основные понятия были недостаточно чётко определены. Эта нечёткость при- водила нередко к парадоксальным выводам (вспомним, парадоксы Бертрана). Естественно, что приложения теории вероятностей к изу- чению явлений природы были слабо обоснованы и встречали порой резкую и обоснованную критику. Нужно сказать, что эти обстоя- тельства мало смущали естествоиспытателей и их наивный теоретико- вероятностный подход в различных областях науки приводил к круп- ным успехам. Развитие естествознания в начале текущего столе- тия предъявило к теории вероятностей повышенные требования. Возникла необходимость в систематическом изучении основных поня- тий теории вероятностей и выяснении тех условий, при которых воз- можно использование её результатов. Вот почему особенно важное значение приобрело формально-логическое обоснование теории вероят- ностей, её аксиоматическое построение. При этом в основу теории вероятностей как математической науки должны быть положены неко- торые предпосылки, являющиеся обобщением многовекового челове- ческого опыта. Дальнейшее же её развитие должно строиться посред- ством дедукции из этих основных положений без обращения к на- глядным представлениям, к выводам, «согласно здравому смыслу». Иными словами, Теория вероятностей должна строиться из аксиом так же, как любая сформировавшаяся математическая наука — гео- метрия, теоретическая механика, абстрактная теория групп и т. д. Впервые такая точка зрения была высказана и развита в 1917 г. советским математиком С. Н. Бернштейном. При этом С. Н. Берн- штейн исходил из качественного сравнения случайных событий по их большей или меньшей вероятности. Имеется иной подход, предложенный А. Н. Колмогоровым. Этот подход тесно связывает теорию вероятностей с современной метри- ческой теорией функций, а также теорией множеств. Настоящая книга следует пути, предложенному Колмогоровым. Мы увидим, что аксиоматическое построение основ теории веро- ятностей отправляется от основных свойств вероятности, подмечен- ных на примерах классического и статистического определений.
42 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 Аксиоматическое определение вероятности, таким образом, как част- ные случаи включает в себя и классическое и статистическое опре- деления и преодолевает недостаточность каждого из них. На этой базе удалось построить логически совершенное здание современной теории вероятностей и в то же время удовлетворить повышенные требования к ней современного естествознания. Более подробное изложение аксиоматики Колмогорова мы отло- жим до дополнения 1. Сейчас мы станем исходить как из данного из некоторого множества S случайных событий. В дополнении 1 бу- дет дано построение множества S случайных событий, исходя из первичного понятия — множества элементарных событий. Для того чтобы элементарные операции не выводили нас за пределы множества уже определённых случайных событий, мы потре- буем выполнения следующих условий: 1. Если множеству S принадлежат события А и В, то ему при- надлежат также события А-{-В, АВ и А — В. 2. Система 5 содержит достоверное U и невозможное V события *). Легко понять, что первое требование влечёт за собой принадлеж- ность множеству S сумм, произведений и разностей конечного числа событий, принадлежащих S. Как и в § 3, мы назовём эту систему событий полем событий. Во многих важнейших задачах нам потребуется от поля событий требовать большего, а именно 3. Если счётное множество событий Alt А2, . .., Ап,... принад- лежит полю 5, то их сумма ... -р + • • • и произве- дение AtA2. ..Ап... также принадлежат S. Такие поля событий называются борелевскими. Как и прежде, мы скажем, что события А и В несовместимы, если их произведение равно V. Если события А и А несовместимы и в сумме дают достоверное событие, то они называются противо- положными. Теперь мы можем перейти к формулировке аксиом, определяющих вероятность. Аксиома 1. Каждому случайному событию А из поля собы- тий S поставлено в соответствие неотрицательное число Р(Л), называемое его вероятностью. Аксиома 2. P(f7) = l. Аксиома 3 (аксиома сложения). Если события Alf А2,... ..., Ап попарно несовместимы, то Р (Лх + Л9 + ... + Л„) = Р (Лх) + Р (Л3) + ... + Р (4„). *) Ранее данные определения суммы и произведения событий опирались на наглядные соображения. Но сейчас мы будем их придерживаться. Построе- ние аксиоматики с полной строгостью будет дано в дополнении 1.
АКСИОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ТЕОРИИ 43 § 8) Для классического определения вероятности свойства, выражен- ные аксиомами 2 и 3, не нужно было постулировать, так как эти свойства вероятности были нами доказаны. Из сформулированных аксиом мы выведем несколько важных элементарных следствий *). Прежде всего, из очевидного равенства и= v~yu и аксиомы 3 мы заключаем, что Р(^ = Р(Ю + Р(У). Таким образом, 1. Вероятность невозможного события равна нулю. 2. Для любого события А Р(Л) = 1— Р(Д). 3. Каково бы ни было случайное событие А, 0<РИ)<1. 4. Если событие А влечёт за собой событие В, то Р(А)<Р(В). 5. Пусть А и В — два произвольных события. Поскольку в суммах A-f-5 = A-|-(B — АВ) и В = АВ-\-(В— АВ) слагаемые являются несовместимыми событиями, то в соответствии с аксиомой 3 Р(А + В) = Р(А)4-Р(В —АВ); Р (В) = Р (АВ) +Р(В —АВ). Отсюда вытекает теорема сложения для произвольных событий А и В Р (А + В) = Р (A) -J- Р (В) — Р (АВ). В силу неотрицательности Р (АВ) отсюда заключаем, что Р(Л + В) < Р(Д) + р (В). По индукции теперь выводим, что если А19 Л2, . ,.,ДП— про- извольные события, то имеет место неравенство Р{А14-А3+...+Ая}<Р(А1)'+Р(А8)+... + Р(А„). Система аксиом Колмогорова непротиворечива, так как сущест- вуют реальные объекты, которые всем этим аксиомам удовлетворяют. Например, если за U принять произвольное конечное множество с ко- нечным числом элементов U= {ар а2, ап}9 за 5—совокупность всех подмножеств {а<1#О^8^п,Ъ^з^п, *) Как мы увидим в дополнении 1, учение о вероятности этими аксио- мами сведено к теории меры, определённой на борелевских телах множеств. <-ама вероятность есть неотрицательная аддитивная функция множества.
44 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. I то, положив Р(Л1)=Р1, Р(я2)=Р2, ••• Р(а«) = Аи где pv ... ..., Рп — произвольные неотрицательные числа, удовлетворяющие равенству Pi+p2+ • • • = 1, а Р (а*;, а/а, ..., = ph . .. . , мы удовлетворим всем аксиомам Колмогорова. Система аксиом Колмогорова неполна*, даже для одного и того же множества U вероятности в множестве S’ мы можем выбирать различными способами. Так, в рассмотренном нами примере с игральной костью мы можем положить или Р(£1) = Р(£2) = ...=Р(Ев) = | (1) ИЛИ Р(£1) = Р(Е8)«Р(£8) = |, Р(Е4) = Р(Е6) = Р(£в)=1 (2) и т. д. Неполнота системы аксиом теории вероятностей не является свидетельством их неудачного выбора или недостаточной работы мысли при их создании, а вызвана существом дела: в различных задачах могут встретиться явления, при изучении которых требуется рассматривать одинаковые множества случайных событий, но с раз- личными вероятностями. Например, могут встретиться игральные кости, из которых одна правильная (точный куб с одинаковой плот- ностью в каждой точке), другая неправильная. В первом случае система вероятностей будет задана системой равенств (1), а во вто- ром, скажем, системой (2). Дальнейшее развитие теории нуждается в дополнительном пред- положении, которое носит название расшаренной аксиомы сложения. Необходимость введения новой аксиомы объясняется тем, что в тео- рии вероятностей постоянно приходится рассматривать события, под- разделяющиеся на бесконечное число частных случаев. Расширенная аксиома сложения. Если событие А равносильно наступлению хотя бы одного из попарно несовмести- мых событий Лп Л2, ..., Лп, ..., то р(Д)=Р(д1)+Р(л2)+...+Р(лп)+.-.. Заметим, что расширенная аксиома сложения может быть заме- нена равносильной ей аксиомой непрерывности. Аксиома непрерывности. Если последовательность собы- тий В19 В2, ..., Вп, ... такова, что каждое последующее влечёт за собой предыдущее и произведение всех событий Вп есть невоз- можное событие, то Р(В„)~*0 при П-+ОО. Докажем эквивалентность только что сформулированных пред- ложений.
АКСИОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ТЕОРИИ 45 § 81 1. Из расширенной аксиомы сложения следует аксиома непрерыв- ности. Действительно, пусть события В2, .Вп, ... таковы, что Вг о В2 зэ ... zd Вп о ... и при любом п^\ (3) к> п V 7 Очевидно, что в„=2вЛ+1+П^. к=п к>п Так как события, стоящие в этой сумме, попарно несовместимы, то согласно расширенной аксиоме сложения Р(5„) = 2 Р(ВА+1) + Р(П вк). к=п к^п Но в силу условия (3) Р(Цв*) = о, п поэтому оо * Р(в„)= 2р(5Л+Л к=п т. е. Р(В„) есть остаток сходящегося ряда 2р(вЛ+1) = р(вД к=1 Поэтому Р(Вп)~>0 при я->оо. 2. Из аксиомы непрерывности следует расширенная аксиома сло- жения. Пусть события Л2, ..., Ап, ... попарно несовместимы и Д = Л1-|-Д94- ... -|-Лп-{- ••• Положим 2 Ак. Ясно, что В„+1сВп. Если событие Вп наступило, то наступило какое- нибудь из событий Л<(/>«) и, значит, в силу попарной несовме- стимости событий Ак, события Л<+1, Л<+2, ... уже не наступили. Таким образом, события Д+1, В<+9 ... невозможны, и, следовательно, 00 невозможно событие ]J По аксиоме непрерывности Р (Вп) -> О к=п при п -> оо. Так как л = Л,-|-Л9-|--Л„-]-Вп+х,
4Й ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 то по обычной аксиоме сложения р (Л) = р (ДО + р (Да) + . .. + Р (Ап) 4- Р (Вп+ 0 = = lim 2 Р(Л)=» 2 РИО- П->оо к^=1 § 9. Условная вероятность и простейшие основные формулы Мы уже говорили, что в основе определения вероятности события лежит некоторая совокупность условий S. Если никаких ограничений, кроме условий ©, при вычислении вероятности R (А) не налагается, то такие вероятности называются безусловными. Однако в ряде случаев приходится находить вероятности событий при дополнительном условии, что произошло некоторое событие В. Такие вероятности мы будем называть условными и обозначать сим- волом Р(А/В); это означает вероятность события А при условии, что событие В произошло. Строго говоря, безусловные вероятности также являются условными, так как исходным моментом построенной теории было предположение о существовании некоторого неизменного ком- плекса условий <5. Пример 1. Брошены две игральные кости. Чему равна вероят- ность того, что сумма выпавших на них очков равна 8 (событие А), если известно, что эта сумма есть чётное число (событие В)? Таблица 4 (Ы) (2.D (3,1) (4,1) (5,1) (6,1) (1.2) (2.2) (3,2) (4,2) (5,2) (6,2) (1.3) (2.3) (3,3) (4,3) (5,3) (6,3) (1,4) (2,4) (3,4) (4,4) (5,4) (6.4) (1.5) (2.5) (3,5) (4,5) (5,5) (6,5) (1.6) (2.6) (3,6) (4,6) (5,6) (6,6) Все возможные случаи, которые могут представиться при бросании двух костей, мы запишем в таблице 4, каждая клетка которой содер- жит запись возможного события: на первом месте в скобках указы- вается число очков, выпавших на первой кости, на втором месте — число очков, выпавших на второй кости. Общее число возможных случаев—36, благоприятствующих собы- тию А —5. Таким образом, безусловная вероятность Р(Л)^.
§ 9] ПРОСТЕЙШИЕ ОСНОВНЫЕ ФОРМУЛЫ 47 Если событие В произошло, то осуществилась одна из 18 (а не 36) возможностей и, следовательно, условная вероятность равна Р(Л/В)=^. Пример 2. Из колоды карт последовательно вынуты две карты. Найти а) безусловную вероятность того, что вторая карта окажется тузом (неизвестно, какая карта была вынута вначале) и б) условную вероятность, что вторая карта будет тузом, если первоначально был вынут туз. Обозначим через А событие, состоящее'в появлении туза на вто- ром месте, а через В — событие, состоящее в появлении туза на первом месте. Ясно, что имеет место равенство A — AB-f-AB. В силу несовместимости событий АВ и АВ имеем: Р(А)=Р(АВ) + Р(АВ). При вынимании двух карт из колоды в 36 карт могут произойти 36 • 35 (учитывая порядок!) случаев. Из них благоприятствующих собы- тию АВ—4 • 3 случаев, а событию АВ—32 • 4 случая. Таким образом, р(Л)=х±±+3224=1 36*35 ’36*35 9’ Если первая карта есть туз, то в колоде осталось 35 карт и среди них только три туза. Следовательно, Р(л/В)=А. Общее решение задачи нахождения условной вероятности для клас- сического определения вероятности не представляет труда. В самом деле, пусть из п единственно возможных, несовместимых и равно- вероятных событий Ар А2, ..., Ап событию А благоприятствует т событий, » В » k » » АВ » г » (понятно, что г Если событие В произошло, то это означает, что наступило одно из событий А^, благоприятствующих В. При этом условии событию А благоприятствуют г и только г собы- тий Ajt благоприятствующих АВ. Таким образом, Р(л/В)=у=1=¥да’. _ (I) п
4Я ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. I Точно так же можно вывести, что Р(В/А) = ^. (Г) Понятно, что если А(В) есть невозможное событие, то равен- ство (1) (соответственно (1')) теряет смысл. Каждое из равенств (1), (1') эквивалентно так называемой тео- реме умножения, согласно которой Р (АВ) = Р (Л) Р(В/Л) = Р (В) Р (Л/В), (2) то-есть: вероятность произведения двух событий равна произве- дению вероятности одного из этих событий на условную вероят- ность другого при условии, что первое произошло. Теорема умножения применима и в том случае, когда одно из событий Л или В есть невозможное событие, так как в этом случае вместе с Р (Л) = 0 имеют место равенства Р (Л/В) = 0 и Р (АВ) — 0. Говорят, что событие Л независимо от события В, если имеет место равенство Р(Л/В) = Р(Л), (3) т. е. если наступление события В не изменяет вероятности события Л. Если событие Л независимо от В, то в силу (2) имеет место равенство Р(Л)Р(В/Л) = Р(В)Р(Л). Отсюда находим, что Р(В/А) = Р(В), (4) т. е. что событие В также независимо от Л. Таким образом, свой- ство независимости событий взаимно. Понятие независимости событий играет значительную роль в тео- рии вероятностей и в её приложениях. В частности, большая часть результатов, изложенных в настоящей книге, получена в предполо- жении независимости тех или иных рассматриваемых событий. В практических вопросах для определения независимости данных событий редко обращаются к проверке выполнения для них равенств (3) и (4). Обычно для этого пользуются интуитивными соображениями, основанными на опыте. Так, например, ясно, что выпадение герба на одной .монете не изменяет вероятности появления герба (решки) на другой монете, если только эти монеты во время бросания не связаны между собой (например, жёстко не скреплены). Точно так же рождение мальчика у одной матери не изменяет вероятности появления мальчика (девочки) у другой матери. Это события независимые. Для независимых событий теорема умножения принимает особенно простой вид, а именно, если события А и В независимы, то Р (ЛВ) ®= Р (Л) • Р(В),
§91 ПРОСТЕЙШИЕ ОСНОВНЫЕ ФОРМУЛЫ 49 Мы обобщим теперь понятие независимости двух событий на сово- купность нескольких событий. События В2, . • •, Bs называются независимыми в совокуп- ности, если для любого события Вр из их числа и произвольных Bit, Bi„ ..Bir {in фр) из их же числа события Вр и Bh, Biz, В{, взаимно независимы. В силу предыдущего это определение эквивалентно следующему: при любых 1 « /"(I О О) Р^, В<, ... B<r] = P{^|PR.:.P{B/r}. Заметим, что для независимости в совокупности нескольких собы- тий недостаточно их попарной независимости. В этом можно убедиться на следующем простом примере. Представим себе, что грани тетраэдра окрашены: 1-я в — красный цвет (Л), 2-я — в зелёный (В), третья — в синий (С) и 4-я — во все эти три цвета (АВС). Легко видеть, что вероятность грани, на которую упадёт тетраэдр, при бросании, в своей окраске иметь красный цвет равна у: граней четыре и две из них имеют в окраске красный цвет. Таким образом, Р(Л)=1.' Точно так же можно подсчитать, что Р (В) = Р (С) = Р {А/В) = Р {В/С) = Р {С/А) = = Р (В/А) = Р (С/В) = Р (А/С) =1 события Л, В, С, таким образом, попарно независимы. Однако если нам известно, что осуществились события В и С, то заведомо осуществилось и событие Л, т. е. Р(Л/В<?) = 1. Таким образом, события Л, В, С в совокупности зависимы. Формула (Iх), которая в случае классического определения была нами выведена из определения условной вероятности, в случае аксио- матического определения вероятности будет взята нами в качестве определения. Таким образом, в общем случае при Р (Л) > 0 по определению рда)=^а. (В случае Р (Л) = 0 условная вероятность Р (В/А) остаётся неопре- делённой.) Это позволяет нам перенести автоматически на общее по- нятие вероятности все определения и результаты настоящего параграфа. 4 Зак. 1826. Б. В. Гнеденко.
50 ПОНЯТИЕ ВЕРОЯТНОСТИ [ГЛ. 1 Предположим теперь, что событие В может осуществиться с одним и только с одним из п несовместимых событий Alf Л2, ...» Ап. Иными словами, положим, что в = 2 BAi, (5) г = 1 где события BAi и с Разными индексами i и j несовместимы. По теореме сложения вероятностей имеем: п P(5)~2PW i==l Использовав теорему умножения, находим, что п р(в)= s р(^)Р(ад). 1=1 Это равенство носит название формулы полной вероятности и играет основную роль во всей дальнейшей теории. В качестве иллюстрации рассмотрим два примера. Пример 1. Имеется пять урн: 2 урны состава А{ — по два белых шара и одному чёрному, 1 урна состава А2 — по 10 чёрных шаров, 2 урны состава А3 — по 3 белых шара и одному чёрному. Наудачу выбирается урна и из неё наудачу вынимается шар. Чему равна вероятность, что вынутый шар белый (событие В)? Так как вынутый шар может быть только из урны 1-го, 2-го или 3-го состава, то в==л1в+л2в+л3в. По формуле полной вероятности находим, что Р (В) = Р (Л,) р (8/4) + р (Л9) р (В/Л9) + р (Л3) р (В/Л8). Но ясно, что PHO^f, Р(4)=|, P(4)=f, Р(В/Л1У=|, Р (В/Л9) = О, Р(В/Л8) = |. Таким образом, р/тЛ .1 । 1 а . 1.1-11 3*5 ° '5 4 ~~ 30 ‘ Пример 2. Известно, что вероятность поступления k вызо- вов на телефонную станцию за промежуток времени t равна (6 = 0, 1, 2, ...).
ПРОСТЕЙШИЕ ОСНОВНЫЕ ФОРМУЛЫ 5] § 91 Считая, что появления какого-либо числа вызовов за два сосед- них промежутка времени являются событиями независимыми, найти вероятность поступления 5 вызовов за промежуток времени длитель- ности 24 Решение. Обозначим через Д* событие, состоящее в поступле- нии k вызовов за время т. Очевидно, что мы имеем следующее равен- АЪ = АЖ + ^ИГ1 + • • • + А8Л которое означает, что событие Aft можно рассматривать как сумму $4-1 несовместимых событий, состоящих в том, что за первый про- межуток временй\длительности t наступает I вызовов, а за следующий промежуток той же продолжительности—s — Z (Z = 0, 1, 2, . .5). По теореме сложения вероятностей Р(А^) = 2 Р(Л?АГ'). г==() По теореме умножения вероятностей для независимых событий р (лМГг) = Р (А$) р (А?"') = Pt (0 • Pt (S — о- Таким образом, если положить то (6) г=0 Впоследствии мы увидим, что при некоторых весьма общих усло- виях (Л — 0, 1, 2, ...) ^)==(-^-«*, (7) где а — некоторая константа. Из формулы (6) мы находим, что о fs) = у {atye-^ у 1 , 24 /!(s — /)! ( —/)!• •i—0 г = 0 Но У—J________= 1 у_______±_ = 1 (1 4-1). = Is i = 0 « = 0 Поэтому = (s = 0, 1, 2,...). 4*
52 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл.1 Таким образом, если для промежутка времени длительности t имеет место формула (7), то для промежутков времени, в два раза больших, и, как легко убедиться, для любых кратных t промежутков времени характер формулы для вероятности сохраняется. Мы в состоянии теперь вывести важные формулы Бейеса или, как иногда говорят, вероятности гипотез. Пусть попрежнему имеет место равенство (5). Требуется найти вероятность события Aif если известно, что В произошло. Согласно теореме умножения имеем: Р (Af5) = Р (В) Р (At/B) = Р (А<) Р (BMJ. Отсюда иепольвуя формулу полной вероятности, находим, что 2 Р (Лу) Р (В/Лд) 3^ Полученные нами формулы носят название формул Бейеса, Общая схема применения этих формул к решению практических задач такова. Пусть событие В может протекать в различных условиях, относи- тельно характера которых может быть сделано п гипотез: Av Л2, Ап. По тем или иным причинам нам известны вероятности Р(Л^) этих гипотез до испытания. Известно также, что гипотеза Ai сообщает событию В вероятность Р (В/Л^). Произведён опыт, в котором событие В наступило. Это должно вызвать переоценку вероятностей гипотез А^ формулы Бейеса количественно решают этот вопрос. В артиллерийской практике производится так называемая при- стрелка, имеющая своей целью уточнить наши знания относительно условий стрельбы (например, правильность прицела). В теории при- стрелки широко используется формула Бейеса. Мы ограничимся при- ведением чисто схематического примера исключительно ради иллю- страции характера задач, решаемых этой формулой. Пример 1. Имеются пять урн следующего состава: 2 урны (состава Л^ по 2 белых и 3 чёрных шара, 2 урны (состава Л2) п0 1 белому и 4 чёрных шара, 1 урна (состав Л3) — 4 белых и 1 чёрный шар. Из одной наудачу выбранной урны взят шар. Он оказался белым (событие В). Чему равна после опыта вероятность (апостериорная веррятность) того, что шар вынут из урны третьего состава? Согласно предположению PG4,)=|, Р(Л2)=4» Р(А)=Ц; рда1)=|, р(в/л2)=1, Р(ад = |.
ПРИМЕРЫ 53 § 101 Согласно формуле Бейеса имеем: р/д /ох __________________Р(Я3)Р(В/Л3)_________. Р (№) - р (Л) р (В/Л1) + р 02) р (В/Лз) + р (Лз) р (В/Лз) - 1 4 __ 5 6 * * * 5 _ 4 _ 2 — 10 5 ’• 5 * 5 ' 5 * 5 5 * 5 Точно так же находим: 9 1 Р(Л1/В) = |, Р(Л2/В) = 1 § 10. Примеры Мы приведём несколько более сложных примеров на использо- вание изложенной теории. Пример 1 *). Два игрока А и В продолжают некоторую игру до полного разорения одного из них. Капитал первого равняется а руб., капитал второго — b руб. Вероятность выигрыша каждой партии для игрока А равна р, а для игрока В равна q; p-\-q = l (ничьи отсутствуют). В каждой партии выигрыш одного игрока (и, значит, проигрыш другого) равняется 1 рублю. Найти вероятность разорения каждого из игроков (результаты отдельных партий предполагаются независимыми). Решение. Обозначим через рп вероятность разорения игрока Л, когда он имеет п руб. Очевидно, что искомая вероятность есть ра и что Ра+Ь = °. Ро=1- (О Если игрок А имел п руб. перед некоторой партией, то его разоре- ние может осуществиться двумя различными способами: или он очеред- ную партию выиграет, а всю игру проиграет, или он проиграет и партию и игру. По формуле полной вероятности поэтому Рп=Р -Рп^ + Ч-Рп-1- Относительно рп мы получили уравнение в конечных разностях; легко видеть, что его можно записать в следующем виде: q(pn—pn-i)=p(Pn+\—Рп)- (2) *) Мы сохраняем для этой задачи «о разорении игрока» её классическую формулировку, но возможны и иные формулировки, например: материальная частица находится на прямой в точке О и каждую секунду подвергается слу- энному толчку, в результате которого передвигается на 1 см вправо с вероят- остью р или на 1 см влево с вероятностью 7 = 1 — р. Чему равна вероят- 6 АТ\1?Г0’ что материальная частица окажется правее точки с координатой w>0), прежде чем она попадёт в положение, расположенное левее точки С Координатой а (в<0, а и Ь — целые числа)?
54 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 Рассмотрим сначала решение этого уравнения при p^q=^* При этом допущении Рп+1~Рп—Рп~ Рп-1= ••• =Рх— Ро = с> где с — постоянная. Отсюда находим, что Рп = Р(ЛпС- Поскольку р0— 1 И pa + b — Q> ТО , п Рп—1 « + Таким образом, вероятность разорения игрока А равняется , а _ b Ра а-\-Ь а-\-Ь* Подобным же путём найдём, что в случае р = -^ вероятность разорения игрока В равна _ а Уь~~а~±Ъ' В общем случае при р-ф-q из (2) находим, что Чп П {Рк~Рк-х)=Рп П (Рк+1—рк)- После сокращений и учёта соотношений (1) находим, что -1). Рассмотрим разность рп+ь — рп\ очевидно, что —1 Ct-f'b —1 Pa+V—Рп~ S — Рй) = У (%) к^п к*=п q \a+b Поскольку Ра+ь = 0, то q\a + b Pn = (l—Pl) а так как р0^=1, то 1 — 3. р д\аЧ-Ь 1-3. р 1 — 3. р
§ 10] ПРИМЕРЫ 55 Исключив из двух последних равенств величину ру находим, что Рп ( q — 1 Отсюда вероятность разорения игрока А qa+b — qapb Ра qa+b_____ра+Ъ Hi) i—(L\a+b' Подобным же путём находим, что вероятность разорения игрока В при рфц равна .а 1—( — а = J__Л2Ла+** Из этих формул мы можем сделать следующие выводы: если капитал одного из игроков, например В, несравненно больше капитала игрока А, так что практически b можно считать бесконечно большим по сравнению с а, а игроки одинаково искусны, то разорение В практически невозможно. Вывод будет совсем иной, если А играет лучше, чем В9 и, значит, р > q. Считая b ~ оо, находим, что / а V И Отсюда мы делаем тот вывод, что умелый игрок даже с малым капиталом может иметь меньше шансов на разорение, чем игрок с большим капиталом, но менее умелый. К задаче о разорении игрока сводится решение некоторых задач физики и техники. Пример 2. Найти вероятность того, что станок, работающий в момент /0, не остановится до момента + если известно, что 1) эта вероятность зависит только от величины промежутка времени ^о + О» 2) вероятность того, что станок остановится за проме- жуток времени Д/ пропорциональна Д/ с точностью до бесконечно малых высших порядков *) относительно Д/. *) В дальнейшем для записи того факта, что некоторая величина а бес- конечно мала сравнительно с величиной 0, мы будем пользоваться записью а = о (0). Если же отношение ограничено по абсолютной величине, то мы бУДем писать а = О (р).
56 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. I . События, заключающиеся в остановке станка в непересекающиеся промежутки времени, независимы между собою. Решение. Обозначим искомую вероятность через р (0: Вероят- ность того, что станок остановится за промежуток времени М равна 1 — р (Д0 = а Д£-|- о (Д0, где а — некоторая постоянная. Определим вероятность того, что станок, работавший в момент /0, не остановится до момента £0-|- + Д/. Для осуществления этого собы- тия необходимо, чтобы станок не остановился за периоды времени длины t и Д/; в силу теоремы умножения, таким образом, p(t-{-M) —p(f) • р(Д0 = Р(0(1 ——о(Д0). Отсюда РЛ +¥) =(о - о (1 ) (3) Перейдём теперь к пределу, положив Д/—>0; из того, что существует предел правой части равенства (3), вытекает, что существует также предел левой части. В результате находим, что Решение этого уравнения есть функция р (0 == где С—постоянная. Эта постоянная находится из того очевидного условия, что р(0)=1. Таким образом, /?(/) = Первое условие задачи налагает на режим работы станка большие ограничения, однако существуют производства, где оно выполняется с большой степенью точности. В качестве примера можно привести работу автоматического ткацкого станка. Заметим, что к рассмотрен- ной задаче сводится много других вопросов, например, вопрос о рас- пределении вероятностей длины свободного пути молекулы в кинети- ческой теории газов. Пример 3. При составлении таблиц смертности часто исходят из таких допущений: 1) вероятность того, что некоторое лицо умрёт в течение времени от t до равна р (t, f-}- Д0 = а (0 Д^4- о (Д0; где a(t) — неотрицательная, непрерывная функция. 2) считается, что смерть данного лица (или его выживание) за рассматриваемый промежуток (0, £2) времени не зависит от того, что было до момента tp 3) вероятность смерти в момент рождения равна нулю. Исходя из высказанных предположений, найти вероятность смерти лица А до того, как оно достигнет возраста t.
ПРИМЕРЫ 57 § 101 Решение. Обозначим через к(/) вероятность того, что лицо А доживёт до возраста t, и вычислим Очевидно, что из допущений, принятых в задаче, вытекает равенство тг Ы) = к (0 к (t + Д/; /), где обозначает вероятность дожить до возраста ^~]-Д^ если лицо А уже дожило до возраста t. В соответствии с первым и вторым допущениями к Д£ 0 = 1 — р t+ ДО = 1 — а (0 Д/— о (Д0; поэтому к (Z+ ДО = К (0 [1 — а (0 Д/ — о (ДОЬ Отсюда находим, что к(0 удовлетворяет следующему дифферен- циальному уравнению: = «(/). Решением этого уравнения при учёте третьего условия задачи будет функция t — J* a (a) dz К (0 = в 0 Вероятность умереть прежде, чем будет достигнут возраст /, таким образом, равна t — I* а (я) dz 1—п(0=1— е 6 При составлении таблиц смертности для взрослого населения не- редко пользуются формулой Макегама, согласно которой а (/) = a -f- постоянные а, р, у— положительны *). При выводе этой формулы исходили из допущения, что взрослый человек может умереть от причин, не зависящих от возраста, и причин, зависящих от возраста, причём вероятность смерти растёт с увеличением возраста в геометри- ческой прогрессии. При таком дополнительном предположении Пример 4. В современной ядерной физике для измерения интен- сивности источника частиц используются счётчики Гейгера-Мюллера. *) Их значение определяется условиями, в которых находится группа лиц, подлежащих изучению, и прежде всего социальными условиями.
58 ПОНЯТИЕ ВЕРОЯТНОСТИ [гл. 1 Частица, попавшая в счётчик, вызывает в нём разряд, длящийся время т, в протяжение которого счётчик не регистрирует частицы, попадающие в счётчик. Найти вероятность того, что счётчик сосчитает все частицы, попавшие в него за время /, если выполняются следующие условия: 1) вероятность того, что за промежуток времени t в счётчик попадут k частиц, не зависит от того, сколько частиц попало в счётчик до начала этого промежутка; 2) вероятность того, что за промежуток времени от до в счётчик попадёт k частиц, задаётся фор- мулой *) Ри^, где а — положительная постоянная; 3) т — постоянная величина. Решение. Обозначим через Л(/) — событие, состоящее в том, что все попавшие за время t в счётчик частицы были сосчитаны; через Bk(t) — событие, состоящее в том, что за время t в счётчик попало k частиц. В силу первого условия задачи при Р{Л(^+до! = РМ(0!Р{в0(ДО} + + Р{Л (/—т)} р {ад} р { в, (ДО! -|-о (ДО, а при Р {Д (/+ АО) = Р {А (/)} Р {Во (А/)} + Р {Во(/)} Р {В, (ДО! Н-о (АО. Обозначим для краткости записи тг(О —Р{Л (/)}; тогда на осно- вании второго и третьего условий задачи при 7Г (f-f ДО = К (0 е~аи 4- e~aMaMe~at 4- о (ДО и при я (t -I- ДО = к (0 e~a&t 4- К (t — т) е~а“аМ е~™ +-о (ДО- Путём перехода к пределу при Д/~>0 находим, что при имеет место равенство ^. = -ак(04-^"Л (4) а при — равенство • = - а (к (0—« (t—т) е~ат]. (5) ♦) Позднее мы выясним, почему в этом примере и в примере 2 преды- дущего параграфа мы считали, что (at)Ae~at Рк-
ПРИМЕРЫ 59 § 101 Из уравнений (4) находим, что при 0^/^т (с 4-а/). Из условия тс (0) = 1 определяем постоянную с. Окончательно при «(О = e~at (1 4-aZ). (6) При т^/^2т вероятность определяется из уравнения -^Уг- = — а (0 — т) е~ах] = = — а [к(/)—в~а<*-т)(1 4-д (t—т)) е~вт] = = _ а [тс (/) _ (1 + а х))]. Решение этого уравнения даёт нам: z —atf . . a2(t — т)2 \ * (0 = « (q 4-at-|-----Ц., -Z..J. Постоянное может быть найдено из того, что согласно (6) тс (т) = е~™ (1 ат). Таким образом, q =s 1 и для т t 2т К (/) = е-°ф 4- at4- Методом полной индукции можно доказать, что для (я—1)т^/^пт имеет место равенство п
ГЛАВА 2 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ В настоящей главе мы изучим основные закономерности, относя- щиеся к одной из важнейших схем теории вероятностей — схеме по- следовательности независимых испытаний. В это понятие мы вклады- ваем следующий смысл. Рассматривается последовательность полных групп событий ...» Аи\ s = 1, 2, .. ., //. Вероятность появления события (/=1, 2,...,&) в группе с индексом s не зависит ни от этого индекса, ни от того, какие события появились или появятся в дру- гих группах *). Часто бывает полезно придерживаться иной терминологии и гово- рить, что производится // независимых испытаний, каждое из которых имеет k несовместимых исходов AiS), ..., причём вероят- ность исхода не зависит от номера испытания s и равна pi (/ = = 1, 2, ..., в силу несовместимости и единственной возможности исходов А^\ очевидно, имеем Эта схема впервые была рассмотрена Я. Бернулли в важнейшем частном случае & = 2; по этой причине указанный случай носит название схемы Бернулли. В схеме Бернулли обычно полагают р2=1—p — q. Подробное исследование таких последовательностей испытаний за- служивает исключительного внимания как в силу непосредственного их значения в теории вероятностей и в приложениях, так и в силу выявившейся в процессе развития теории вероятностей возможности обобщения тех закономерностей, которые впервые были открыты при изучении схемы последовательности независимых испытаний, в част- ности схемы Бернулли. Многие факты, подмеченные на этой частной схеме, впоследствии служили путеводной нитью при изучении более сложных схем. Сделанное замечание относится как к прошлому, так ♦) Схеме последовательности независимых испытаний можно придавать и более широкий смысл — считать, что число исходов и вероятности этих исходов зависят от номера испытания. Мы эти более общие построения оставим в стороне.
§ И] вероятности Рп(ти т^9..^тк) 61 и к современному развитию теории вероятностей. Мы убедимся впо- следствии в этом на примерах закона больших чисел и теоремы Муавра-Лапласа. §11. Вероятности Рп(т19 m%9 .. .,тк) Простейшая задача, относящаяся к схеме независимых испытаний, состоит в определении вероятности Рп(т19 т29...9т1с) того, что при п испытаниях события Л18) наступят тх раз, Л^— т2 раз, ..., события А(к—тк раз. При этом, конечно, должно быть выполнено равенство ПЦ + + • • • + Мы ограничимся подробным рассмотрением этой задачи для случая схемы Бернулли, предоставив читателю вывод формул и их исследо- вание в общем случае. Для схемы Бернулли мы обозначим собы- тие через Л(а), событие Л^ — через число появлений собы- тий Л<8)— через р. и вероятность Рп (т19 — через Pn(nt)9 где Сначала мы найдём вероятность того, что события Л^ наступают при определённых т испытаниях (например, при $4, s2, ...9sm) и при остальных п-^-т не наступают. По теореме умножения для независи- мых событий эта вероятность равна pmqn т. По теореме сложения вероятностей искомая вероятность Рп(т) равна сумме только что вычисленных вероятностей для всех различных способов т появлений события и п — т непоявлений среди п испыта- ний. Число таких рт___ п\ п т\ (п — т)! способов, как известно из теории сочетаний, равно ; следовательно, искомая вероятность равна п г... \ т „п — т Рп О) = Спр -q (1) Так как все возможные несовместимые между собой исходы п испытаний состоят в появлении события Л(8) 0 раз, 1 раз, 2 раза, ..., # раз, то ясно, что п 2 Рп(т) = ь Это соотношение может быть выведено также без учёта теоретико- вероятностных соображений из равенства п 2 /э„(/п) = (р + 7)п==1п=1- Легко заметить, что вероятность Рп (т) равна коэффициенту при хт в разложении бинома (q-\-px)n по степеням х; в силу этого свой-
. Г 62 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [ГЛ. 2 ства совокупность вероятностей Рп(т) называют биномиальным зако- ном распределения вероятностей. Немного изменив наши рассуждения, читатель без труда убедится в том, что < тк) = Wi!m2| j1Р22-**Ркк. О ) 4 а также в том, что эта вероятность является коэффициентом при J в разложении по степеням х полинома (pix1 -}-р2^2 + 1 + • • • Ркхк)П- Имея в виду постановку общих задач, относящихся к схеме не- зависимых испытаний, мы рассмотрим числовые примеры. В этих при- > мерах мы не станем немедленно доводить до конца вычисление < искомых вероятностей, а оставим это до того момента, когда у нас будут подготовлены удобные методы для этого вычисления. Пример 1. Имеются два сосуда А и В, каждый объёмом в 1 дм*. | В каждом из них содержится по 2,7 • 1032 молекул газа. Эти сосуды | приведены в соприкосновение так, что между ними происходит свобод- 1 ный обмен молекулами. Чему равна вероятность того, что через сутки | в одном из сосудов молекул окажется по меньшей мере на одну десятимиллиардную часть больше, чем в другом? Для каждой молекулы вероятность находиться в том или ином сосуде через сутки одна и та же и равна половине. Таким образом, как бы производится 5,4 • 1022 испытаний, для каждого из которых вероятность попасть в сосуд А равна Цг. Пусть р— число молекул, попавших в сосуд Л, и, значит, 5,4* 1022 — р есть число молекул, попавших в сосуд В. Нам нужно определить вероятность того, что | и _ (5>4 • 1022 - И) | > = 5,4 • 10« иначе говоря, мы должны найти вероятность Р = Р{ ||Л—2,7 - 1022|>2,7 • Ю12}. Согласно теореме сложения где сумма распространена на те значения /п, для которых \т — 2,7 • 1022| > 2,7 • 1012. Пример 2. Вероятность изделию некоторого производства ока- заться бракованным равна 0,005. Чему равна вероятность того, что из 10 000 наудачу взятых изделий бракованных изделий окажется \ а) ровно 40, б) не более 70. В нашем примере п = 10 000, р = 0,005, поэтому по формуле (1) находим, что а) Рю ооо (40) = Cj0°ооо (0,995)"eo (О,ОО5)40.
111 вероятности Рп (гир т2,.,.,тл) 63 Вероятность Р { у. 70} того, что число бракованных изделий ока- жется не более семидесяти, равна сумме вероятностей числу брако- ванных изделий оказаться равным 0, 1, 2,...,70. Таким образом, 70 70 б) Р { Р-С 70 } = 2 Рп (т) = S Pw000(O,995)10000~’n(O,OO5)m. m==0 т = о Рассмотренные ‘Примеры показывают, что непосредственное вычи- сление вероятностей по формуле (1) (а также по формуле (1')) часто представляет большие технические трудности, поэтому возни- кает задача отыскания простых приближённых формул для вероятно- стей Ри(/п), а также для сумм вида t 2 Рп{т} m~s при больших значениях п. Эти задачи будут решены в §§ 12 и 13. Теперь же мы обратимся к установлению элементарных фактов, касающихся поведения вероятностей Рп (т) при постоянных п. Начнём с изучения Рп (т) как функции т. Для 0 т < и, как легко под- считать, Рп (т 4-1) _ п — т р ' рп(т) ~ т +1 ”7’ отсюда следует, что Рп(т+ 1)>Р„ (т), если (п — /и) р > (т Ж 1) q, т. е. если пр — q > т; Ря(тЖ1) = ^«(»»). если т~пр — q и, наконец, Рп(»гЖ О <рп('")> если /п > пр — q. Мы видим, что вероятность Рп (т) с увеличением т сначала воз- растает, затем достигает максимума и при дальнейшем росте т убы- вает. При этом если пр — q является целым числом, то максимальное значение вероятность Рп (т) принимает для двух значений /п, именно для mQ = пр — q и т^ = пр — 7 + 1 =пр-\-р. Если же пр — q не является целым числом, то максимального значения вероятность Рп (т) достигает при т = /и0, равном наименьшему целому числу, боль- шему w0. Число ;п0 называют вероятнейшим значением для у,. Мы видели, что если пр — q есть целое число, то у. имеет два вероятней- ших значения — mQ и m^ — mQ-\-\. Отметим, что если пр — # < 0, то ^п(0)>Рп(1)>... >Рп(п\ а если пр — # = о, то >M(0) = Pn(l)>Pw(2)> ...>Рп(п).
64 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [ГЛ. 2 В дальнейшем мы увидим, что при больших значениях п только для mt близких к вероятнейшему значению ji, вероятности Рп (т) сколько-нибудь заметно отличаются от нуля. Этот факт впоследствии будет доказан нами, а сейчас проиллюстрируем сказанное численным примером. Пример. Пусть п == 50, р = . о Вероятнейших значений два: т^ = пр— q = 16 и 1 = 17. Значения вероятностей Рп(т) с точностью до четвёртого десятич- ного знака представлены в таблице 5. Таблица 5 т р„(«) т рп(т) т Лг("г) <5 0,0000 13 0,0679 23 0,0202 5 0,0001 14 0,0879 24 0,0113 6 0,0004 15 0,1077 25 0,0059 7 0,0012 16 0,1178 26 0,0028 8 0,0033 17 0,1178 27 0,0012 9 0,0077 18 0,1080 28 0,0005 10 0,0157 19 0,0910 29 0,0002 11 0,0287 20 0,0704 30 0,0001 12 0,0470 21 22 0,0503 0,0332 >30 0,0000 § 12. Локальная предельная теорема При рассмотрении числовых примеров предыдущего параграфа мы пришли к выводу, что при больших значениях пу , тк вычисление вероятностей по формуле (Iх) § 11 представляет значительные трудности. Возникает необходимость в асимптотических формулах, позволяющих с достаточной степенью точности определять эти вероятности. Впервые формула такого рода была найдена Муавром (de Moivre) в 1730 г. для частного случая схемы Бернулли при р — q == ~, а затем обобщена Лапласом (Laplace) на случай произвольного р, отличного от 0 и 1. Эта формула получила название локальной теоремы Лапласа; мы в целях восстановления исторической справедливости будем называть её локальной теоремой Муавра-Лапласа. Изложение мы начнём с доказательства аналогичной теоремы для общего случая схемы независимых испытаний, а затем выделим из неё как частный слу- чай теорему Муавра-Лапласа,
ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 65 § 121 Прежде чем формулировать теорему, мы введём несколько обо- значений: положим ql==\— Pt (i - 1, 2, .. .,k), Величина x$ зависит не только от i (т. е. от pj, но также от п и от ть однако мы в целях сокращения письма не вводим новых индексов. Локальная теорема. Если вероятности pv р&*'*,Рк появления соответственно событий А^\ в s-ом испы- тании не зависят от номера испытания и отличны от 0 и от 1 (О < р7- < 1, / = 1, 2, ..., А), то вероятность Рп (шп /д2, ..., тк) того, что при п независимых испытаниях события A^{i— 1,2,..., k) появятся раз (mY-\-tn2-\- • • • т^ — п), удовлетворяет соот- ношению *) п к _____ ~г «а. —д--—---------------->1 (п->оо) (2) (2л) 2 VpiP^-.-Pk равномерно для всех mi (/= 1, 2, .. ., k), для которых Xi нахо- дятся в произвольных конечных интервалах ai xi Доказательство. Приводимое нами доказательство опирается на известную из курса Анализа формулу Стирлинга 2тг$ • s8e~se4% в которой остаточный показатель 08 удовлетворяет неравенству (ад Заметим, что формула (1) может быть записана иначе ”4 = “Pi + V~nPMi, (1') откуда следует, что если xi остаются ограниченными, то соответ- ствующие им числа mt возрастают до бесконечности вместе с п. —-------------- ”*) Это предельное соотношение записано в однородных координатах; и ___________________________________ величины xi связаны соотношением 2 xi VPiVi — ®, которое легко выво- <==1 ДИТСя из соотношений 2 тг = и и 2 Pi “ !• Если МЫ ХОТИМ, чтобы Xi были независимыми переменными, то нужно в формуле (2) исключить один из аргументов, например хк. 5 Зак. 1826. Б. В. Гнеденко.
ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 . 66 Применение формулы Стирлинга даёт нам: Рп (тр та,..., тк) = р^> ...Рр = к У‘2г.пппе-П тгтг %.— 2 о =———---------------П Р^е = -------- = ЕЕГ‘ i * * * * б * В’’ (2к) 2 1=1 * где О = 0w— 0W2 — ... — 6m^. В силу оценки (3) имеем: l6|<iUi+i+ Если di ^x,i ^,bit то соответствующие хгм значения удовлетво- ряют неравенствам > npi + а{ V пр.^ «= nPi (1 -|- и, значит, для всех указанных значений имеет место оценка к i ~ 1 1 -4- I/ — ' ПРъ Отсюда мы видим, что каковы бы ни были интервалы (ai9 вели- чина 0 равномерно относительно xt в этих интервалах стремится к нулю при п -> оо, а следовательно, множитель е9 при тех же усло- виях равномерно стремится к единице. Рассмотрим теперь величину к ie=:l = — ^(.nPi + XiVn^qf)^ 4-%i i = 1 г В условиях теоремы величины j/* ~ (1 I k) при доста- точно больших п могут быть сделаны сколь угодно малыми, поэтому мы можем воспользоваться разложением в степенной ряд
§ 121 ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 67 функций 1g ( 1 _|_ х. у • Ограничившись двумя первыми членами, мы находим, что Оценка остаточного члена равномерна в любом конечном интервале изменения Таким образом, к ___ 2 1g Ап = - («А + xt [А У -1 + О (4г)] = г = 1 = 2^ + °(v=)- 2=1 4=1 ' п Так как согласно формуле (1) к к п п ЕА /wi = О; — nPi) =^т{~п^р1==п~п = 0, 4=1 2 = 1 2 = 1 г’-=1 ТО к и, значит, равномерно относительно х?: в лах (if Xj^bj при п-> оо имеет место любых конечных интерва- соотношение Далее мы имеем: лцт2.. .т1( nkPiP2-. .рк /П т\ (7) В условиях теоремы второй множитель правой части этого равен- ства при п -> оо стремится к единице и притом равномерно в каж- дом конечном интервале изменения хД/=1, 2, Легко видеть, что соотношения (5),- (6) и (7) доказывают нашу Горему. 5*
68 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 ЛокальнаятеоремаМуавр а-Л а п л а с а. Если вероятность наступления некоторого события в п независимых испытаниях постоянна и равна р (0 < р < 1), вероятность Рп(т) того, что в этих испытаниях событие А наступит ровно т раз, удовле- творяет при п—> оо соотношению Vw рп (,ПУ- Х 1 V (8) равномерно для всех т, для которых х находится в каком-либо конечном интервале. Доказательство. Теорема Муавра-Лапласа, как мы уже говорили во введении к настоящему параграфу, является частным случаем только что доказанной нами теоремы. Здесь k «== 2, qx—q, q^l—q, р^р, р%—1—p = q> т[ — т, т — пр — т, х~ , 2 1 Vnpq -^2 п — т — ng Vnpq т — пр Vnpq Подставив эти обозначения в соотношение (2), находим, что 1 1 о 1 --- 1 —-ptf q& VnpqPn(m)'.y^e 2 Очевидно, что это соотношение эквивалентно (8). Мы можем теперь довести до конца вычисления в примерах предыдущего параграфа. Пример 1. В примере 2 предыдущего параграфа нам нужно было определить Рп(т) при п =10 000, zn = 40, р = 0,005. По только что доказанной теореме имеем: Ря(т)~ _1 т—пр \2 —----е 2 v . V^npq Для нашего примера Vnpq = /IOООО • 0,005 • 0,995 = /49,75 ~ 7,05, Следовательно, т — пр Vnpq ------1,42. Функция 1 -----т=-е 7,05 V2* 1,42’ 1
§ 12J ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 69 табулирована; краткая таблица значений этой функции приведена в конце книги. По этой таблице находим, что ₽„(«)-^ = 0,00206. Точные подсчёты без использования теоремы Муавра-Лапласа дают нам: Pn(w)~ 0,00197. Для иллюстрации характера приближений, даваемых теоремой Муавра-Лапласа, а также для геометрического пояснения проделан- ных при её доказательстве аналитических преобразований, мы рас- смотрим численный пример. Пусть вероятность р равна 0,2. В таблицах 6—9 собраны зна- чения /п, х = , вероятностей Рп (яг), величин УпрдРп(т), У npq Таблица 6 /2 = 4 т 0 1 2 3 4 Рп(т) 0,4096 0,4096 0,1536 0,0256 0,0016 X —1,00 0,25 1,50 2,75 4,00 YnpqPn(m) 0,3277 0,3277 0,1229 0,0205 0,0013 0,2420 0,3867 0,1-295 0,0091 0,0001 1 — а также функции ф(х)==-^==е 2 с точностью до четвёртого деся- 0,30 0,20' Л *• * т>~25 азо * • к • S n-1ОО *• о! ю То 30 .......*..'П~Ч00 Тз ~75 35 05^ Черт. 7а. тичного знака соответственно для числа испытаний az = 4,25, 100, 400. На черт. 7а ординаты изображают значения вероятностей Pn(jn)
70 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ |гл. 2 Таблица 7 п — 25 т X Рп(т) |6у^Р„(т) т X Р„(т) V npq Рп(т) ?(•*) 0 —2,5 0,0037 0,0075 0,0175 8 1,5 0,0623 1 0,1247 1 0,1295 1 -2,0 0,0236 0,0472 0,0540 9 2,0 0,0294 0,0589 0,0540 2 —1,5 0,0708 0,1417 0,1295 10 2,5 0,0118 0,0236 0,0175 3 —1,0 0,1358 0,2715 0,2420 11 3,0 0,0040 0,0080 0,0044 4 —0,5 0,1867 0,3734 0,3521 12 3,5 0,0012 0,0023 0,0009 5, 0,0 0,1960 0,3920 0,3989 13 4,0 0,0003 0,0006 0,0001 6 0,5 0,1633 0,3267 0,3521 14 4,5 0,0000 0,0000 0,0000 7 1,0 0,1108 0,2217 0,2420 >14 >4,5 0,0000 0,0000 0,0000 Т аблица 8 л» 100 т X рп(.т) <? (*) т X Рп(т) VnpqPn(m) Т(л) 8 —3,00 ОДООб 0,0023 0,0044 21 0,25 1 0,0946 1 0,3783 0,3867 9 —2,75 0,0015 0,0059 0,0091 22 0,50 0,0849 0,3396 0,3521 10 —2,50 0,0034 0,0134 0,0175 23 0,75 0,0720 0,2879 0,3011 11 —2,25 0,0069 0,0275 0,0317 24 1,00 0,0577 0,2309 0,2420 12 —2,00 0,0127 0,0510 0,0540 25 1,25 0,0439 0,1755 0,1826 13 —1,75 0,0216 0,0863 0,0862 26 1,50 0,0316 0,1266 0,1295 14 -1,50 0,0335 0,1341' 0,1295 27 1,75 0,0217 0,0867 0,0862 15 — 1,25 0,0481 0,1923 0,1826 28 2,00 0,0141 0,0565 0,0540 16 —1,00 0,0638 0,2553 0,2420 29 2,25 0,0088 0,0351 0,0317 17 -0,75 0,0788 0,3154 0,3011 30 2,50 0,0052 0,0208 0,0175 18 —0,50 0,0909 0,3636 0,3521 31 2,75 0,0029 0,0117 0,0091 19 20 -0,25 -0,00 0,0981 0,0993 0,3923 0,3972 0,3867 0,3989 32 3,00 0,0016 0,0063 0,0044 при различных целочисленных значениях абсциссы т. Из чертежа видно, что с увеличением п величины Рп(т) равномерно убывают. Для того чтобы на чертеже точки [т, Рп (т)] уже для рассматривае- мых значений п не слились с осью абсцисс, мы выберем резко раз- личные масштабы по осям координат. Рассмотрение вместо абсцисс т и ординат Рп (т) абсцисс т — пр , ч ъ , \ хп = —=== и ординат у (т) = V npq Рп\т) означает 1) перенос V npq начала координат в точку (пр, 0), находящуюся вблизи от максималь- ной ординаты Рп (tn), 2) увеличение единицы масштаба по оси абс- цисс. в Ynpq раз (иными словами, сжатие чертежа по оси абсцисс в ]/npq раз), 3) уменьшение единицы масштаба по оси ординат
§ 12] ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 71 Т а б л и ца 9 Z? = 400 т . X Рп(.т) VnpqPn(m) ?(*) т X Рп(т) VnpqPn(m) ? (*) 56 —3,000 0,0004 0,0034 0,0044 81 0,125 0,0492 0,3956 0,3957 57 —2,875 0,0006 0,0051 0,0064 82 0,250 0,0478 0,3828 0,3867 58 -2,750 0,0009 0,0076 0,0091 83 0,375 0,0458 0,3666 0,3719 59 —2,625 0,0014 0,0104 0,0127 84 0,500 0,0432 0,3459 0,3521 60 —2,500 0,0019 0,0156 0,0175 85 0,625 0,0402 0,3215 0,3282 61 -2,375 0,0027 0,0218 0,0238 86 0,750 0,0368 0,2944 0,3011 62 |—2,250 0,0037 0,0298 0,0317 87 0,875 0,0332 0,2656 0,2721 63 - 2,125 0,0050 0,0399 0,0417 88 1,000 0,0295 0,2362 0,2420 •64 -2,000 0,0066 0,0525 0,0540 89 1,125 0,0259 0,2070 0,2119 65 -1,875 0,0089 0,0679 0,0684 90 1,250 0,0223 0,1788 0,1826 66 -1,750 0,0108 0,0862 0,0862 91 1,375 0,0190 0,1523 0,1550 67- — 1,625 0,0134 0,1075 0,1065 92 1,500 0,0160 0,1279 0,1295 68 — 1,500 0,0164 0,1316 0,1295 93 1,625 0,0132 0,1059 0,1065 69 -1,375 0,0198 0,1583 0,1550 94 1,750 0,0108 0,0865 0,0862 70 , —1,250 0,0234 0,1871 0,1827 95 1,875 0,0087 0,0696 0,0684 71 ; —1,125 0,0271 0,2175 0,2119 96 2,000 0,0069 0,0553 0,0540 72 ' —1,000 0,0310 0,2483 0,2420 97 2,125 0,0054 0,0433 0,0417 73 -0,875 0,0349 0,2789 0,2721 98 2,250 0,0042 0,0335 0,0317 74 —0,750 0,0385 0,3081 0,3011 99 2,375 0,0032 0,0255 0,0238 75 —0,625 0,0419 0,3317 0,3282 100 2,500 0,0024 0,0192 0,0175 76 —0,500 0,0447 0,3580 0,3521 101 2,625 0,0018 0,0142 0,0127 77 —0,375 0,0471 0,3766 0,3719 102 2,750 0,0013 0,0105 0,0091 78 —0,250 0,0487 0,3919 0,3867 103 2,875 0,0009 0,0075 0,0064 79 —0,125 0,0497 0,3973 0,3957 104 3,000 0,0008 0,0054 0,0044 80 1 1 —0,000 0,0498 0,3985 0,3989 в VпРЧ Раз (иными словами, растяжение чертежа по оси ординат в Уnpq раз). На черт. 76, в, г изображены кривая = и преобра- зованные только что описанным способом точки [ап, Рп(т)]> т. е. точки [xnt yn(ni)\> Мы видим, что уже при п = 25 точки [хп, уп(т)] сливаются на графике с соответствующими точками кривой у — <р(х). Это совпадение становится ещё лучше при больших чем 25 значе- ниях и. Чтобы получить наглядное представление о том, в какой мере можно пользоваться асимптотической формулой Муавра-Лапласа при конечных п*), т. е. заменять биномиальный закон при вычислении вероятностей Рп(т) функцией у = <р(х), приведём пример. Для *) Очень точные оценки остаточного члена даны в работе С. Н. Берн- штейна «Возврат к вопросу о точности предельной формулы Лапласа». Изв. АН СССР, т. 7, 1943 г.
72 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 простоты рассмотрим случай р = q = -^- и возьмём лишь те п, для которых возможно значение х,т=1; такими могут быть, напри- Черт. 76, в, г. мер, /2 = 25, 100, 400, 1156. Именно для них хпт—1 при /п=15, 55, 210, 595. Положим для краткости Рп(т)=*Ря и 1 _ Хпт ~V^qe ^Qn при ^ = «7=^- И хм = 1. Согласно локальной теореме Муавра-Лапласа отношение Qn должно стремиться к единице, когда п -> оо. Вычисление при назван- ных выше значениях п даёт Таблица 10 п Рп Qn Рп* Qn Pnl Qn 25 0,09742 0,09679 0,00063 1,0065 . 100.. 0,04847 0,04839. 0,00008 1,0030 - 400 0,024207 0,024194 0,000013 1,0004 . 1156 Ьч- 0,014236 0,014234 0,000002 1,0001
§ 13] ИНТЕГРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 73 § 13. Интегральная предельная теорема Только что выведенную локальную предельную теорему мы ис- пользуем для вывода другого предельного соотношения теории вероят- ностей — интегральной предельной теоремы. Изложение начнём с про- стейшего частного случая этой теоремы — интегральной теоремы Муа- вра-Лапласа. Интегральная теорема Му авр а-Л апласа. Если р есть число наступлений события в п независимых испытаниях, в ка- ждом из которых вероятность этого события равна р, причём О < р < 1, то равномерно относительно а и b (— оо а b -|- со) при п-+ оо имеет место соотношение dz. Доказательство. Введём для краткости письма обозначение Pn(atb) = p[ <b I ( Vnpq ) Эта вероятность, очевидно, равна сумме 2 Рп (w)» распространён- ной на те значения т, для которых а хт < Ь, где попрежнему т — пр обозначено хт = т Vnpq Определим теперь функцию у = П„ (х) следующим образом: О О , пр ДЛЯ X < Хо =----7==- И Vnpq । 1 1Ц- nq ДЛЯ X > Х„ -I-F=- = , Vnpq Vnpq Vnpq Рп (т) для хт < х < хт+ j (т = 0, 1,..., /г). Очевидно, что вероятность Ptl(m) равна площади, ограниченной кривой у = Пя (х), осью ОХ и ординатами в точках х ==s хт и Xz==xm+u т* е* Рп (.т) = VПРЧ Рп (т) (хт м — хт) = J Пп (х) dx. Отсюда следует, что искомая вероятность Рп (а, Ь) равна площади, заключённой между кривой у = Щ (х), осью ОХ и ординатами в Точках хт и х—, где т и т определяются посредством не- равенств * . 1 1 А / А I 1 а < хт, < а +- —r= » Ь b Н--7=^' Vnpq т Vnpq
74 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 Таким образом, Ри(а, 6)= I* Un(x)dx = Ъ хт = J п„ (х) dx 4- J П„ (х) dx — J П„ (х) dx. • а b а Так как максимальное значение вероятности Рп(т) приходится на значение /п0 = [(«—]— 1)р], то максимальное значение Пл(х) при- ходится на интервал 0 < т^—пр <х < mQ+l—np < 2 . V npq Уnpq Vnpq ’ В этом интервале действует локальная теорема Муавра-Лапласа, и мы можем поэтому заключить, что при всех достаточно больших значе- ниях п 1 -- maxEL (х) < 2—max*? 2 ' V2n Отсюда мы прежде всего выводим, что а и что, следовательно, lim р№ = 0. п->оо т ; Таким образом, Рп(а, Ь) только на величину бесконечно малую от- ъ личается от Пп(х)^х. а Мы предположим сначала, что а и b—конечные числа. При этом предположении согласно локальной теореме при а хт < b 1 6 2 + a,i где при п-»оо равномерно относительно хан. Очевидно, что и при промежуточных значениях аргумента Им (х) e yW е~ ~ 11+(х)]’
§ 13] ИНТЕГРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 75 причём lim max ап(х)=0. Действительно, при любом tn в интер- п-»оо вале хш<х<хш+1 имеем: .V1 fl+«»(•*:)], •Ч» (Л) — (хт) — чГсГ~ V 2п где <*п(х) = е 2 [ая(А-т)_|_1]_ 1. Так как х2— х^ шах (| а |, р|) 2 1 х I ’ I х хт | t--- то ясно, что lim max а (х) = 0. п -> оо а<а?<& Собрав вместе найденные оценки, получаем, что Рп(а, b) = -^= е 2 dx + Rn, а где ^п==~^ fe~r “пWdx+p«- а Так как | Яга к max I ап (х) | • -±= [ е~ Т dx -f- р„, & V 2л J то из сказанного ясно, что lim Rn = 0. П -> оо В сделанном нами по ходу доказательства частном предположении тео- рема доказана. Нам остаётся освободиться от этого ограничения. С этой целью прежде всего заметим, что f е 2 dz—l. Поэтому для любого е > 0 можно выбрать столь большое А, что Д j~2 ~ fe~2'dz>l — 4-, J 4 — А А «8 ОО Zi -i= f е 2 dz — f е 2 dz<—. /2тс J /ЙГ J 8 —оо А
76 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 Выберем далее, в соответствии с доказанным, столь большое п, что при — b <Z А будет: & —— а Тогда очевидно, что Pn(-A, А)>1 —у, Р( — оо, —А)4-Р(д, 4_оо)= 1 ~Р( —A, 4)<y- Теперь докажем, что при любых а и b (— оо 00) | будет: f Рп а Ь 1 Г I —== е 2 dz < е, V2rc J чем, очевидно, и закончится доказательство теоремы Лапласа. Для этого надо разобрать отдельно различные случаи расположе- ния на прямой точек а и b относительно интервала (— А, А). Раз- берём, например, случай — А, Ь^А (остальные предоставим читателю). В этом случае Рп(а, /») = />„ (а, — А) + Рп(-А, А)±Рп(А, Ь).
§ 131 ИНТЕГРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 77 Мы перейдём теперь к выводу интегральной предельной теоремы в общем случае схемы последовательности независимых испытаний. Пусть попрежнему (/ = 1, 2, ..., k) означает число появлений со- бытий (5 = 1, 2, ...» п) в п последовательных испытаниях. В за- висимости от случая числа могут принимать лишь значения О, 1, 2, п, причём так как в каждом испытании возмож- ны k исходов и эти исходы несовместимы, то должно иметь место равенство Н-1 4“ Ня + • • • + Рк — п- (1) Станем теперь на величины p.7f смотреть как на прямоугольные координаты точки в ^-мерном евклидовом про- странстве. При этом результаты п испытаний изобразятся точкой с цело- численными координатами, не меньшими нуля и не большими п; будем в дальнейшем называть такие точки целочисленными. Равен- ство (1) показывает, что результаты испытаний изобразятся не про- извольными целочисленными точками в гиперкубе 0 п (z —1, 2, а лишь теми из них, которые находятся в гипер- плоскости (1). На черт. 8 изображено положение возможных резуль- татов испытаний в гиперплоскости (1) для случая л = 3, & = 3. Произведём преобразования координат по формулам у н — npt ------------- V пр iqi (z=l, 2, ..., k; Уравнение гиперплоскости (1) в новых координатах перепишется в следующем виде: к _____ 2 = (2) Точки гиперплоскости (2), в которые перешли целочисленные точки гиперплоскости (1), условимся также называть «целочислен- ными». Обозначим через Pn(G) вероятность того, что в результате п испытаний числа ^(/=1, 2, k) появлений каждого из воз- можных исходов окажутся такими, что точка с координатами попадёт внутрь области О.
78 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 Тогда имеет место следующая Теорема. Если в схеме последовательности независимых испытаний в каждом из испытаний возможны k исходов, причём вероятность каждого из исходов не зависит от номера испыта- ния и отлична от 0 и от 1, то какова бы ни была область Q гиперплоскости (2), для которой (k—Химерный объём её границы равен нулю, равномерно относительно О при п-> оо имеет место соотношение Рп { G } -> 1//'-— Г е~Т dv, ' (2я)*-» 2 Ptfi a где dv означает элемент объёма области Q и интеграл распро- страняется на область Q. Доказательство. Так как доказательство и по идее и по осуществлению является почти полной копией рассуждений, проведён- ных при доказательстве интегральной теоремы Муавра-Лапласа, то мы можем ограничиться лишь кратким изложением, предоставив читателю проведение его во всех деталях. Изложение мы начнём с того, что произведём два элементарных подсчёта. Прежде всего найдём число Sk (п) возможных исходов в результате п испытаний, в каждом из которых могут произойти k несовместимых событий. Числа Sk (п) удовлетворяют следующему соотношению: п 2 .!>*_, (г). (3) г = О Действительно, это равенство означает, что событие Ак может по- явиться любое число п — г раз (О^п — в каждом из этих случаев для остальных k — 1 событий могут представиться Sk^1(r) исходов. Так как при различных г эти исходы различны, то отсюда и вытекает равенство (3). Для случая схемы Бернулли (А = 2) S2(/z) = n-bl, поэтому для k = 3 имеем: г=о Это равенство наводит на мысль о том, что формула для Sk(n) имеет вид +А=1>. = сги„(4)
§ 131 ИНТЕГРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 79 Предположим, что эго равенство, доказано для всех покажем, что тогда оно верно и при £ = tV—[— 1, т. е. что имеет место равенство п п Sn+1(»)= 2 $&(/) = 2 Cr + N—1 = Cn + N. r=Q Г=0 Последнее утверждение вытекает из следующей легко проверяемой цепочки равенств: Cn+N _ (n + N)\ _ (л + 1)(п + 2) ... (n + N) _ “ п\ № ~ N\ _ п(«4-1)... (л + ДГ— 1) . (п + 1).. .(л + 1) “ У! (7V—1)! = С-яЧ-N-i “Г C(n—1)+N = I ^И“1 I 2) == Сп^дг—i “Г Сп—14-У—1 ф С(П_2)4. =...=» п “ 2 ^4-N—1> У=0 ч. и тр. д. Нам понадобится знание величины (k — 1)-мерного объёма той части гиперплоскости (2), которая определяется неравенствами (/=1, 2, ..., k). В этой области гиперплоскости (2) содержатся все её «целочислен- ные» точки, изображающие результаты испытаний. Этот объём, как легко проверит читатель, хотя бы путём интегрирования, равен __ к Pitfi / = 1 к г = 1 Отнесём теперь точкам (xh х2, ... , хк) гиперплоскости (2), где хг =2, .^)» а тг — числа, непересекаю- Щиеся параллелепипедальные области, содержащие эти точки, диаметра, не большего максимального расстояния между двумя целочисленными ближайшими точками [на черт. 8 одна из таких областей, около точки 1, 1) заштрихована]. Все эти области будут иметь один и тот же объём dv, а в сумме будут давать объём У, несколько больший, чем v, но нетрудно ви- деть, что при п —> оо отношение объёмов v и v' стремится к единице.
80 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [ГЛ. 2 Поэтому dv — [1 о (1)]. Легко видеть, что при п-+оо объём dv &к \п) стремится к нулю, как Определим теперь в каждой точке гиперплоскости (2) функцию тс (хр х2, х/£) следующим образом: в каждой «целочисленной» точке (х1} х2, хк) и окружающей её области положим л(Хр х2, .... х„) = Pn(mv т2, ...,тк) = 1 П.(«+о к » = 1 n Z V77pn('«i’ РгЧг •••> »h) [1 4 о (!)]. Вне указанных областей положим к(хр х2, .... хп)=о. Станем откладывать значения функции тс (хр х2, х;.) на перпен- дикулярах к гиперплоскости в точках (хр х2, x7f), считая от гиперплоскости в направлении той части пространства, в которой 2 VГеометрически построенная функция изобразится сту- пенчатой гиперповерхностью: ^-мерный объём, ограничиваемый гипер- поверхностью и гиперплоскостью, равен 2^(Хр х2, ..., xk)dv = ^Pn{mv ...» тк)=1. Вероятность P(G) попадания результатов испытаний в область G, очевидно, равна Р(°)= 2 Рп(ти т2) тк), где суммирование распространяется на все «целочисленные» точки, находящиеся в области О. Записав P(G) в виде P(G) = 2 •••> xk)dv> замечаем, что искомая вероятность почти равна объёму цилиндра, ограниченного с одной стороны гиперплоскостью (2), с другой — гиперповерхностью т:(хь х2, .хк), и с образующими, проходя- щими через границу области О перпендикулярно к гиперплоскости (2). Разница между ними равна величине | ате— рп|, где -сумма объёмов, находящихся над принадлежащими G частями областей, окружающих целочисленные точки, не принадлежащие G, а — сумма объёмов, находящихся над не принадлежащими G частями областей, которые окружают целочисленные точки, входящие в область G.
ИНТЕГРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 81 § 13] Предположим теперь, что область О расположена в ограниченной части гиперплоскости (2) и её граница является квадрируемой 2)-мерной поверхностью. Согласно локальной предельной теореме при этих условиях тс (х1? х2, ..., xj —----------------(1 “F Tn) — dv у ... рк _л/ я^-яг- Як ТТЛ П х _ 1/ (2«)*-1 y.Piqi Щ1 + тг (1+(5) где Ъ = т(х1> х2> •••>•*&) равномерно для всех точек области G стремится к нулю при « -> оо. Таким образом, а - — (2л)»-1 Як к—1 (6) В силу выбора областей, окружающих целочисленные точки, вели- чина |ап — рп| не может превысить объёма, находящегося над теми из этих областей, которые имеют общие точки с границей области G. Этот объём не превышает произведения (k — 2)-мерного объёма гра- ницы области G (обозначим его буквой и) на удвоенный диаметр области, окружающей «целочисленную» точку плоскости (2) и на максималь- ное значение функции тс (xt, х2, .. ., хк). В силу (5) максимальное значение тс(хр ха, хй) для всех достаточно больших значений п не превышает 2тс(0, О, Я1Яг --Як Наибольший диаметр областей, окружающих целочисленные точки, не превышает наибольшего расстояния между соседними целочисленными точками и, следовательно, не больше, чем , ГР4Ж +Р1Я< У~2 ' ntPiqiPjqfi "" Vnmin^a * Таким образом, ________ЯгЯг --Як________________ 1_ (2it)fe-i m»n (PiQi) и, следовательно, при п -> оо (7) 6 Зак. 1826. Б. В. Гнеденко.
82 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ (гл. 2 Согласно определению многомерного интеграла при п ->оо (8) г glg8. g,. Разность к Р(О)-£ <? dv = a, п — (2л)»-1 9к к =— (9) при п -> оо стремится к нулю, так как при п -> со имеет место соот- ношение (7), а также к I п (х+4)ь | <2*тах и» ।-> ° И к ПМ—0. Соотношения (6), (8), (9) доказывают теорему для случая ограничен- ных областей с квадрируемой границей. Для неограниченных обла- стей мы проведём следующее рассуждение. Пусть а > 0—произволь- ное число. Опишем около начала координат в гиперплоскости (2) (к—1)-мерную сферу S столь большого радиуса 7?, что *) --- 1 V л J (2л)»-14 (10) 1 — В силу только что доказанной теоремы для достаточно больших п Р„(3)>1-у. (ЮО Пусть теперь G — неограниченная область с квадрируемой в ка- ждой конечной части гиперплоскости (2) границей. Разобьём область G ♦) Это можно сделать потому, что написанный интеграл, взятый по всему пространству, равен 1.
§ ’3] ИНТЕГРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 83 на две—внутреннюю (GJ и внешнюю (О2) к сфере S; ясно, что Р (G) = Р (GJ + Р (О2). В силу (9) и (10) для любого в>0 мы можем выбрать столь боль- шое AJ, что при всех достаточно больших п |р(О )_ [ 1 / -note.—Ч** doI < 2 • (П) Кроме того, при достаточно больших п, как было только что доказано, |P(O»>-Jl/raX’iyL (12) । И (2я) zjWi Так как е>0 произвольно, то неравенства (11) и (12) полностью доказывают нашу теорему. Замечание. Только что доказанной теореме мы придали форму, в которой все переменные х19 х2, . . хп играют одинаковую роль. В интегральной теореме Муавра-Лапласа мы, однако, предпочли проводить рассуждения, нарушив однородность переменных хг и х2, только с переменным х = х^ Геометрически это означало, что мы рассматриваем не сами результаты испитаний (целочисленные точки на прямой х1-|-х2 = 0), а их проекции на ось ОХ. Подобным же образом мы можем, нарушив однородность и в общем случае, рас- смотреть интегрирование не по области О, а по её проекции G' на какую-либо координатную гиперплоскость, скажем, на плоскость хк = 0. Элемент объёма dv' в гиперплоскости хк = 0 связан с элемен- том объёма dv гиперплоскости (2) соотношением dv' = dtFCoscp, где — угол между указанными гиперплоскостями. Легко подсчитать, что cos <р = —. / ^Pi4i В координатной гиперплоскости элемент объёма dfo'=rfx1dx2 ... dxk_v поэтому имеет место равенство е г dv == • • • Як-1 j (2n)k-\pk (J к е 1 rfxj ... dxft_P 6*
84 /ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ (ГЛ. 2 В подинтегральной функции мы должны произвести замену xk на его выражение через хп х2, ...» хй-1: ft—i Vp^xt. * ^к^к i=:l В результате этой замены мы имеем: /=1 <с=1 К l<i<J<ft—1 Интегральная предельная теорема может быть, таким образом, сформу< лирована иначе, а именно: В условиях интегральной предельной теоремы при /г—>оо ₽(О)^1/,14> Понятно, что интегральная теорема Муавра-Лапласа является частным случаем только что доказанной теоремы: она легко может быть полу- чена из формулы (14). Для этого достаточно заметить, что в схеме Бернулли k в 2, P=Pt, q=p^=l—p. При k — З формула (14) принимает следующий вид: G' где Рз = 1— Pl— р2, Q(X„ .4)_.91(l+g)«>4-9,(l +g)^ + 2 =T?(*;+*!+2 Простой подсчёт показывает, что Ре = 1 — Pi — Ра = ^2~ PiPa, поэтому Q (Xi, х2) = 1 р^ (х* + х* + 2 j/~£1^ . qi<i*
§ 14j ПРИМЕНЕНИЕ ИНТЕГРАЛЬНОЙ ТЕОРЕМЫ 85 § 14. Применение интегральной теоремы Муавра-Лапласа В качестве первого приложения интегральной теоремы Муавра- Лапласа мы оценим вероятность неравенства где е > О — постоянное. Имеем Р —яр Упм и, значит, в силу интегральной теоремы Муавра-Лапласа lira Р Л П->ОО ( I < е I = - L_ f е 2 dz = 1 Итак, каково бы ни было постоянное е > 0, вероятность неравен- ства |у — р | < в стремится к единице. Обнаруженный нами факт был впервые найден Я. Бернулли; он носит название закона больших чисел или теоремы Бернулли. Тео- рема Бернулли и её многочисленные обобщения являются одними из важнейших теорем теории вероятностей. Через них именно теория соприкасается с практикой, именно в них заложен фундамент успехов применения теории вероятностей к различным проблемам естество- знания и техники. Об этом будет подробнее сказано в главе, посвя- щённой закону больших чисел; там же мы дадим доказательство теоремы Бернулли более простым методом, отличным, как от только что изложенного, так и от употреблённого Я. Бернулли. Мы рассмотрим теперь типичные задачи, приводящие к теореме Муавра-Лапласа. Производится п независимых испытаний, при каждом из которых вероятность наступления события А равна р: I. Спрашивается, чему равна вероятность того, что частота насту- пления события А отклонится от вероятности р не более чем на а? Эта вероятность равна
86 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [ГЛ. 2 П. Какое наименьшее число испытаний нужно произвести для того, чтобы с вероятностью, не меньшей р, частота отклонялась от вероят- ности не больше чем на а. Нам нужно определить п из неравенства р{||- Вероятность, фигурирующую в левой части неравенства, мы заменяем приближённо по теореме Муавра-Лапласа интегралом. Для определе- ния п, в результате получается неравенство 1/ п а К — . г о вероятности £ и числе испытаний п требуется возможных изменений | — р |. Иными словами, Ш. При определить зная рил, данной границу нужно найти а, для которого интегральной теоремы Лапласа даёт нам для определе- Применение ния а уравнение •Г У 2л ' о Численное решение всех рассмотренных нами задач требует умения вычислять значения интеграла о (1) при любых значениях х и решать обратную задачу — по величине интеграла Ф(х) вычислять соответствующее значение аргумента х. Для этих расчётов требуются специальные таблицы, так как инте- грал (1) при 0<х<оо в конечном виде через элементарные функ- ции не выражается. Такие таблицы составлены и имеются в конце настоящей книги. Черт. 9 даёт наглядное представление о функции Ф (х). При помощи таблицы значений функции Ф(х) можно вычислять по фор- муле J(a, #) = Ф(£) — Ф(а) также значение интеграла , г
ПРИМЕНЕНИЕ ИНТЕГРАЛЬНОЙ ТЕОРЕМЫ 87 §14] Таблица функции Ф(х) составлена только для положительных х; для отрицательных х функция Ф (х) определяется из равенства ф(—х) =— Ф(х). Мы теперь в состоянии довести до конца решение примера 1 § 11. Пример 1. В при* мере 1 § 11 нам нужно было найти вероятность р = 2Р{|» = '»Ь где сумма распространена на те значения /п, для которых \т—2,7-1022|> 2,7*1012, при условии, что общее число испытаний и==5,4*1022 ир = ~. £ Так как 1р —яр| Упрч 2,7-Ю» } ~ р /'И-I |/"5,4• 1022• 1-1 I V~npq >2,33-10 В силу теоремы Лапласа Так как ТО 2 f . | е 2 r V2? J ' 2,33-10 7 —— 1 7 1 —— \ е 2 dx< — I хе 2 dx = — e 2 J 2 J Z з з < 1---- - 2,7-100 < 10-100 Г . К)5 О том, как мала эта вероятность, можно судить по следующему срав- нению. Предположим, что шар радиуса 6000 км наполнен белым песком, в который попала одна чёрная песчинка. Размер песчинки равен 1 мм*. Наудачу из всей этой массы песчинох берётся одна; чему равна вероятность того, что она будет чёрного цвета? Легко подсчитать, что объём шара радиуса 6000 км немногим меньше Ю30 мм* и, следовательно, вероятность извлечь чёрную песчинку немногим больше 10~30.
88 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ испытаний [гл. 2 Пример 2. В примере 2 § 11 нам нужно было найти вероят- ность того, что число бракованных изделий окажется не больше семи- десяти, если вероятность для каждого изделия быть бракованным равна р = 0,005 и число изделий равно 10 000. По только что дока- занной теореме эта вероятность равн£ Р {р<70} = Р 50 < (л — пр < 20 ) /49J5 Vnpq V49J5 J 2.84 i) 1 г —£ — 7,09 2,84 1-- е 2 dz = Vnpq j ^-7% = Ф (2,84) — Ф (— 7,09) = Ф (2,84) + Ф (7,09) = 0,9975. Значения функции Ф(х) при х = 7,09 в таблицах нет, мы заменили его половиной, совершив при этом ошибку, меньшую 10“10. Естественно, что в примерах настоящего и предыдущего парагра- фов, равно как и в любых других задачах, относящихся к определе- нию вероятностей Рп(т) при каких-либо конечных значениях тип по асимптотическим формулам Муавра-Лапласа требуется оценка совер- шаемой при такой замене ошибки. В течение очень долгого времени теоремы Муавра-Лапласа применялись к решению подобного рода задач без сколько-нибудь удовлетворительной оценки остаточного члена. Создалась чисто эмпирическая уверенность, что при п порядка нескольких сотен или ещё большем, а также при р, не слишком близких к 0 или 1, употребление теорем Муавра-Лапласа приводит к удовлетворительным результатам. В настоящее время существуют достаточно хорошие оценки погрешностей, совершаемых при пользо- вании асимптотической формулой Муавра-Лапласа *). Мы остановимся ещё на обобщении теоремы Бернулли на случай общей схемы последовательности независимых испытаний. Пусть в каждом испытании возможны k исходов, вероятность каждого из них соответственно равна рп р2, ..., рк и ..., — числа появлений каждого исхода в последовательности п независимых испы- таний. Определим вероятность одновременного осуществления нера- венств I Pl I I Р-2 I I I |-_P1|<S1, |__p2|<sa, . .., |__pi.|<sb (2) т. е. неравенств ♦) См., например, цитированную Да стр. 71 работу С. Н. Бернштейна.
ТЕОРЕМА ПУАССОНА 89 § 151 Последнее из этих неравенств, собственно, является следствием пре- дыдущих, так как согласно (2) § 13 первые k—1 из неравенств (2) дают оценку А—1 ____ й-1 _____ Согласно (16) § 13 вероятность первых k—1 неравенств (2) [а сле- довательно, также неравенства (3)] имеет своим пределом при п -> оо интеграл /f f |/ (2«)*-'Рк J '"J dxx dx9 • . dx % _ । — 1 • §15. Теорема Пуассона Мы видели при доказательстве локальной теоремы Муавра-Лап- ласа, что асимптотическое представление вероятности Рп(т) посред- 1 -- ством функции —2 действует тем хуже, чем больше вероят- у ность р отличается от половины, т. е. чем меньшие значения р или q приходится рассматривать, и это представление отказывается служить при р = 0, 7 = 1, а также при р==1, 7 = 0. Однако значительный круг задач связан с необходимостью вычисления вероятностей Рп(т} именно при малых значениях р *). Для того чтобы в этом случае теорема Муавра-Лапласа дала результат с незначительной ошибкой, необходимо, чтобы число п испытаний было очень велико. Возникает, таким образом, задача разыскания асимптотической формулы, спе- циально приспособленной для случая малых р. Такая формула была найдена Пуассоном. Рассмотрим последовательность серий ^21 > ^22» ^31, ^82> ^33 ^w2> ^п8’ • • •> в которой события одной серии взаимно независимы между собой и имеют каждое вероятность рп, зависящую только от номера серии. Через обозначается число фактически появившихся событий /г-й серии. *) Или также при малых значениях q* но очевидно; что задачи разыска- ния асимптотических формул для Pw(m) при малых значениях р или q сво- дятся одна к другой.
90 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. J Теорема Пуассона. Если рп-+® при /г->оо, то ат __________________________ = ““->0, (1) где ап — пРп- Доказательство. Очевидно, что Рп («О = Р {fS = «} = « (1 -рп)п-т = = ”! (^(l — ^П~т = ml (п — т)\ \п ) \ п ) = --------j^yS----------- <2> , Пусть т фиксировано. Выберем произвольно е > 0. Тогда можно выбрать Д=Д(е) столь большим, чтобы при а^А было ат 4» 1 т\ 2 ‘ Рассмотрим сначала те номера л, для которых ап Д. Для этих л, по неравенству 1 — х <г-®, 0 х 1: a™ е п при «>2/в а™ п ^-~а„ — е » ml 8 2' £ . £ к + =8. Поэтому для указанных п I ат \Рп^-^п Рассмотрим теперь те номера п, для которых ап^,А. Так как 1 I (1 — — ] — е~ап } = 0 при ап А и при постоянном т lim —————————— — 1 J т ’ то в силу формулы (2) при л>-я0(б) Рп (т)----г е ап ” ' 7 т\ а, 8, ч. и тр. д.
§15l ТЕОРЕМА ПУАССОНА 91 Заметим, что теорема Пуассона имеет место и в том случае, когда вероятность события А в каждом испытании равна нулю. В этом случае аЛ = 0. Обозначим Полученное распределение вероятностей носит название закона Пуассона. Легко подсчитать, что величины Р (т) удовлетворяют равенству 2 р (т) — 1. Изучим поведение Р (т) как функции т. С этой целью рассмотрим отношение Р(т) ___д Р(т — \) т ’ Мы видим, что если т>а, то P(/n)<P(w—1), если же т<а, то Р(/п)>Р(/п— 1), если, наконец, т = а, то Р(т)=Р(т—1). Отсюда мы выводим, что величина Р(пь) возрастает при увеличе- нии т от 0 до = [а], и при дальнейшем увеличении т убывает. Если а — целое число, то Р(т) имеет два максимальных значения: при mQ~a и при mQ = a—1. Приведём примеры. Пример 1. Вероятность попадания в цель при каждом выстреле равна 0,001. Найти вероятность попадания в цель двумя и более пулями, если число выстрелов равно 5000*). Считая каждый выстрел за испытание и попадание в цель — за событие, мы можем для вычисления вероятности Р(рп^>2) восполь- зоваться теоремой Пуассона. В рассматриваемом примере ап = пр = 0,001 • 5000 = 5, Искомая вероятность равна Р > 2} = 2 Рп («) -1 -Рп Ф)-Рп (О- т = 2 По теореме Пуассона Рл(1)~5е-\ Поэтому ' Р {Рп > 2} ~Д — 6*~б ~ 0,9596. *) В Великой Отечественной войне реальное осуществление условий нашей задачи имело место при обстреливании самолёта из пехотного оружия. Пулей самолёт может быть подбит лишь при попадании в немногие уязви- мые места — мотор, лётчик, бензобаки и пр. Вероятность попадания в эти Уязвимые места отдельным выстрелом весьма мала, но, как правило, по само- лёту вело огонь целое подразделение, и общее количество выстрелов, выпу- щенных по самолёту, было значительным. В результате вероятность попа- дания хотя бы одной или двумя пулями имела заметную величину. Это Обстоятельство было подмечено и чисто практически,
92 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ испытаний (гл. 2 Максимальное значение вероятность Рп(т) принимает при ш = 4 и ;п = 5. Эти вероятности равны с точностью до четвёртого десятич- ного знака Р(4) = Р (5)~ 0,1751. Вычисления по точной формуле дают с точностью до четвёртого знака Рб000 (0) = 0,0071, Рб000 (1) = 0,0354 и, следовательно, Р{?п> 2} =0,9575. Ошибка от использования асимптотической формулы меньше 0,25°/0 вычисляемой величины. Пример 2. На прядильной фабрике работница обслуживает по несколько сотен веретён, каждое из которых прядёт свой моток пряжи При вращении веретена пряжа из-за неравномерности натя- жения, неровноты и других причин в моменты времени, зависящие от случая, рвётся. Для производства важно знать, как часто могут происходить обрывы при тех или иных условиях работы (сорт пряжи, скорость веретён и т. д.). Считая, что работница обслуживает 800 веретён и вероятность j обрыва пряжи на каждом из веретён в течение некоторого проме- | жутка времени т равна 0,005, найти наиболее вероятное число обры- * вов и вероятность того, что в течение промежутка времени т про- ' изойдёт не более 10 обрывов. Так как ап = пр — 0,005 • 800 == 4, то наиболее вероятных чисел обрывов за промежуток времени т будет два: 3 и 4. Их вероятности Р8Оо (3) = Рвоо (4) = doo • 0,005“ • 0,995™. По формуле Пуассона имеем: Psoo (3) - РвооИ) - | = у • = 0.1954. Точное значение Р800 (3) = Рвоо (4) = 0,1945. Вероятность того, ; что число обрывов за промежуток времени т будет не более 10. равна 10 со Р fan 10} = 5 Р800 = 1 2 Р800 faO* т=«0 В силу теоремы Пуассона P8oo(w)~^e"* 0 = 0. 1. 2. ...),
§ 151 ТЕОРЕМА ПУАССОНА 93 поэтому Р|и.<10) = 1-2*е-*. м=11 Но V ^в.4>^ + ±!_|_^Ъ-4-^в-*-0 00276 2л т\ 12М 131/ 11139 е «=11 С другой стороны, =т®г«-‘=0.°°28'1. Таким образом, 0,99716 < Р {ип < Ю} < 0,99724. Подобно тому, как и при использовании теоремы Муавра- Лапласа, возникает вопрос об оценке совершаемой ошибки при замене точной формулы для вычисления Pn(m) на асимптотическую формулу Пуассона. Из равенства где оо мы легко можем найти эту оценку для случая т = 0. В самом деле, так как при любом положительном х 0<1— то каковы бы ни были ап и п: О
94 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [гл. 2 Так как , аП I аП , ап ЗП ап ап в 2п? ’*зл8 А \в6л2 * л — ап 2 л (л —a^J* \ п) то Из того, что Rn неотрицательно, мы заключаем, что при замене Рп (0) на е“"а» мы несколько увеличиваем вероятность Рп (0). § 16. Иллюстрация схемы независимых испытаний В качестве иллюстрации использования предыдущих результатов * для целей естествознания мы рассмотрим весьма схематически про-1 блему случайных блужданий частицы на прямой линии. Эта задача! может рассматриваться как прообраз реальных физических задач; теории диффузии, броуновского движения и пр. Представим себе, что в определённые моменты времени частица, находящаяся в начальный момент в положении х — 0, испытывает случайные толчки, в результате которых она получает смещение! вправо или влево на единицу масштаба. Таким образом, в каждый J 1 i из этих моментов частица с вероятностью смещается на единицу^ вправо или с такой же вероятностью — на единицу влево. В резуль-| тате п толчков частица переместится на расстояние у.. Ясно, что 1 в этой задаче мы имеем дело со схемой Бернулли в чистом виде. Отсюда следует, что при каждых п и tn мы можем вычислить веро- ятность того, что = а именно Р{н = л»} = О При больших значениях п, как это если — п tn С л, если | т | > п. следует из локальной теоремы На полученную формулу мы сможем смотреть следующим образом. Пусть в начальный момент имелось большое число частиц, имеющих координату х — 0. Все эти частицы независимо друг от друга начи- нают перемещаться по прямой под влиянием случайных толчков.
§ 161 ИЛЛЮСТРАЦИЯ СХЕМЫ НЕЗАВИСИМЫХ ИСПЫТАНИЙ 95 Тогда после п толчков доля частиц, переместившихся на расстоя- ние /п, даётся формулой (1). Понятно, что мы рассматриваем идеализированные условия движения частиц и реальные молекулы движутся при гораздо более сложных условиях, однако полученный результат даёт правильную качественную картину явления. В физике приходится рассматривать более сложные примеры слу- чайных блужданий. Мы ограничимся столь же схематическим рас- смотрением влияния 1) отражающей стенки, 2) поглощающей частицы стенки. Представим себе, что на расстоянии s единиц вправо от точки х = 0 имеется отражающая стенка; так что частица, попавшая в какой-либо момент времени на эту стенку, при следующем толчке с вероятностью единица выбивается в том же направлении, откуда она пришла. Для наглядности станем изображать положение частицы на пло- скости (х, /). Путь частицы изобразится при этом в виде ломаной линии. При каждом толчке частица передвигается на единицу «вверх» и на единицу вправо или влево (каждый раз, когда х < $, с веро- ятностью половина). Если же х==$, то при очередном толчке частица сдвигается на единицу влево. Для подсчёта вероятности Р (pt=/n) поступим следующим обра- зом: мысленно откинем стенку и раз- решим частице двигаться свободно, как если бы не было стенки. На чертеже показаны такие идеализиро- ванные пути, приводящие в точки А и Л', симметрично расположенные относительно стенки. Ясно, что для того, чтобы реальная частица, дви- гаясь с отражениями, достигла точки А, необходимо и достаточно, чтобы частица, двигающаяся в идеали- зированной обстановке (без отражающей стенки), достигла либо точки Л, либо точки Л'. Но вероятность попасть в точку А в идеали- зированной обстановке, очевидно, равна Точно так же вероятность попасть в точку А' равна (абсцисса точки Л' равна 2$ — т) {|х = 2s — т} = --------- - ------— (i-Y.
96 ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИЙ [ГЛ. 2 Искомая вероятность, следовательно, равна Рп (т; s) = Р {р. = т} + Р {[л = 2s — tn}. Если воспользоваться локальной предельной теоремой Муавра-Ла- пласа, то находим, что ( (28—туч Р„(от, s)---^==1* 2л +« ая Это известная формула из теории броуновского движения. Она приобретает более симметричный вид, если начало координат поме- стить в точке х = s и, следовательно, перейти к новой координате z по формуле z — x—s. В результате этой замены получим, что 1 f (fe~~g)2) = = = * +e . у ( j Мы перейдём теперь к рассмотрению третьей схематической задачи, когда на пути частицы поставлена в точке х = $ поглощающая пере- городка. Частица, попавшая на перегородку, в дальнейшем движении участия уже не принимает. Очевидно, что в этом примере вероятность попасть в точку х = т(т<з) после п толчков будет меньше, чем Рп(т) (т. е. меньше вероятности попадания в эту точку без поглощающей стенки); обозначим искомую вероятность симво-1 лом Рп (т\ s). Для подсчёта вероятности Рп (т; s) снова мысленно уберём погло- щающую стенку и предоставим тем самым частице свободно дви- гаться по прямой. Частица, попавшая в некоторый момент времени в положе- ние х =ь 5, оказывается в последующие моменты времени справа и слева от А' прямой х = s с одной и той же вероят- \ z ностью. Точно так же после попадания / на прямую x — s частица с одной и \ / той же вероятностью может попасть х / как в точку A(rn. п), так и в точку s z A'(2s— т.п). Но в точку А' частица может попасть, только попав предвари- тельно в положение х = s, поэтому для всякого пути, ведущего в точку Д', имеется путь, симметричный относи- Черт. 11. тельно прямой х = s и ведущий в точку А; точно так же для всякого запре- щённого в действительном движении пути, приводящем в точку А9 существует симметричный относительно прямой х = $ путь, приводя- щий в точку А1. При этом заметим, что мы рассматриваем симметрию путей, только начиная с момента попадания на прямую x—s. Прове-
g 16] ИЛЛЮСТРАЦИЯ СХЕМЫ НЕЗАВИСИМЫХ ИСПЫТАНИЙ 97 дённые рассуждения показывают нам, что из путей, приводящих в точку А в идеализированном движении, мы должны отбросить при подсчёте числа благоприятствующих случаев в реальном движении ровно столько, сколько путей ведёт в точку А'. Отсюда, очевидно, следует, что Рп (т, s) = Р {р = /п) —Р {р = 25 — т}> В силу локальной теоремы Муавра-Лапласа имеем: — i (28— in }. 7 Зак. 1826. Б. В* Гнеденко
ГЛАВА 3 ЦЕПИ МАРКОВА § 17. Определение цепи Маркова Непосредственным обобщением схемы независимых испытаний является схема так называемых цепей Маркова, впервые систе- матически изученная известным русским математиком A. An М а р- ковым. Мы ограничимся изложением элементов его теории. Представим себе, что производится последовательность испытаний, в каждом из которых может осуществиться одно и только одно из k несовместимых событий А^\ A^.^./A^ (верхний индекс, каки в предыдущей главе, обозначает номер испытания). Мы скажем, что последовательность испытаний образует цепь Маркова, точнее, простую цепь Маркова, если вероятность вв-\~\-м испытании ($ — 1, 2, 3,...) осуществиться событию а!*+1\/ = 1, 2, ...,&) зависит только от того, какое событие произошло при s-м испытании и не изменяется от добавочных сведений о том, какие события происходили в более ранних испытаниях или произойдут в более поздних. Часто при изложении теории цепей Маркова придерживаются иной терминологии и говорят о некоторой физической системе S, которая в каждый момент времени может находиться в одном из состояний Ар А2, ..., Ак и меняет своё состояние только в моменты tv Z2, ..tn, ... Для цепей Маркова вероятность перейти в какое- либо состояние Ai (Z — 1, 2, ...,&) в момент т (Zg<r < /8+1) зависит только от того, в каком состоянии система находилась в момент и не изменяется от того, что становятся известными её состояния в более ранние моменты. Для иллюстрации рассмотрим два схематических примера. Пример 1. Представим себе, что частица, находящаяся на пря- мой, движется по этой прямой под влиянием случайных толчков, происходящих в моменты tu . Частица может находиться в точках с целочисленными координатами а, а~1, a-f-2, ..., fr; в точках а и b находятся отражающие стенки. Каждый толчок пере- мещает частицу вправо с вероятностью р и влево с вероятностью q = 1 — р, если только частица не находится у стенки. Если же
МАТРИЦА ПЕРЕХОДА 99 § 181 частица находится у стенки, то любой толчок переводит её на еди- ницу внутрь промежутка между стенками. Мы видим, что приведён- ный пример блуждания частицы представляет собой типичную цепь Маркова. Точно так же можно бы было рассмотреть случай, когда частица прилипает к одной из стенок или к обеим из них. Пример 2. В модели Бора атома водорода электрон может находиться на одной из допустимых орбит. Обозначим через собы- тие, состоящее в том, что электрон находится на Z-й орбите. Пред- положим далее, что изменение состояния атома может наступать только в моменты • • • (в действительности эти моменты представляют собой случайные величины). Вероятность перехода с Z-й орбиты на у-ю в момент t8 зависит только от I и j (разность ] — i зависит от количества энергии, на которую изменился заряд атома в момент t8) и не зависит от того, на каких орбитах нахо- дился электрон в прошлом. Последний пример представляет собой цепь Маркова с беско- нечным (правда, только в принципе) числом состояний; этот пример был бы несравненно ближе к реальной обстановке, если бы моменты перехода нашей системы в - новое состояние могли бы меняться непрерывно. § 18. Матрица перехода Мы ограничимся далее изложением простейших фактов для одно- родных цепей Маркова, в которых условная вероятность появления события в ($-|-1)-м испытании при условии, что в 5-м испы- тании осуществилось событие Л<8), не зависит от номера испытания. Мы назовём эту вероятность вероятностью перехода и обозначим букве® в этом обозначении первый индекс всегда будет обозна- чать результат предшествующего испытания, а второй индекс указы- вает, в какое состояние перейдёт система ^в последующий момент времени. Полная вероятностная картина возможных изменений, осуществляю- щихся при переходе от одного испытания к непосредственно следую- щему, задаётся матрицей /PiiPia ••• Р1А Л _ Р21Р22 • • • P^k I \PkiPk2 • • • Pkkf составленной из вероятностей перехода, которую мы будем называть матрицей перехода. Отметим, каким условиям должны удовлетворять элементы этой матрицы. Прежде всего они, как вероятности, должны быть 7*
100 ЦЕПИ МАРКОВА [гл. 3 неотрицательными числами, т. е. при всех I и / Далее из того, что при переходе из состояния Л/8) в s-м испытании система обязательно переходит в одно и только в одно из состоя- ний в испытании вытекает равенство к 2^=1 (i=l, 2, t). Таким образом, сумма элементов каждой строки матрицы перехода равна единице. Наша первая задача в теории целей Маркова состоит в опреде- лении вероятности перехода из состояния в s-м испытании в со- стояние Ajd+w) через п испытаний. Обозначим эту вероятность знач- ком Рассмотрим какое-нибудь промежуточное испытание с номером В этом испытании осуществится какое-то одно из возможных событий Ay,4’w>(l Вероятность такого перехода, согласно с только что введенными обозначениями, равна Вероятность же перехода из состояния A,+w)b состояние А)8+п) равна л— т). По формуле полной вероятности к Рц (») = (/») • Prj (п — «)• (1) Обозначим через матрицу перехода через п испытаний /^h(«)^12(«) ••• ЛИ«) == I* ... Ркк(п) Согласно (1) между матрицами с различными индексами суще- ствует соотношение ’'« = «»»• "п-т (0<т<п). В частности, при л = 2 находим, что 2 ТГз = Ttj • Kj = TUjJ при л = 3 8. Ttg = Ttj • 1ta.= TCj • ТГ1 = Ki, и вообще при любом п п к 1 •
§ 19] ТЕОРЕМА О ПРЕДЕЛЬНЫХ ВЕРОЯТНОСТЯХ 101 Отметим частный случай формулы (1): при т = 1 г»1 В качестве упражнения предлагается читателю написать матрицу перехода для первого примера предыдущего параграфа. § 19. Теорема о предельных вероятностях Теорема. Если при некотором $>0 все элементы матрицы перехода положительны, то существуют такие постоянные числа Pj(J=\, 2, .k), что независимо от индекса i имеют место равенства lim Ру (л) ==/>,. п-»оо Доказательство. Идея доказательства этой теоремы весьма проста: сначала устанавливается, что наибольшая из вероятностей Рц(п) с ростом п не может возрастать, а наименьшая не может убывать; далее показывается, что максимум разности Рц(п)— Рц(п) (/, 7=1, 2, ..., k) стремится к нулю, когда п->оо. Этим доказа- тельство теоремы, очевидно, завершается. Действительно, в силу известной теоремы о пределе монотонной ограниченной последова- тельности мы заключаем из первых двух указанных свойств вероятно- стей Ptj(n), что существуют lim min P{i(n)=pj П->оо И lim max P(An) =>pj. А так как в силу третьего из указанных свойств lim max \Рц(п)—Рг (п)| = 0, то Pj^Pj = Pr Мы перейдём теперь к осуществлению намеченного плана. Заметим прежде всего, что при п > 1 имеет место неравенство » и 2р«Ру(в—1)> min Рц(п — 1) 2р« = 1—1 1<г<* г—1 = min Ру(и—1). 1<г<* Это неравенство имеет место при каждом i, в частности при том, при котором ₽«(»)= min (л).
102 ЦЕПИ МАРКОВА [гл. з Таким образом, min min — U* 1<*<Л 1«<A Подобным же путём легко обнаружить, что max Р^Лп)^ max Рц(п—1). 1<<<Л Мы можем считать, что п > $, и поэтому имеем право записать по формуле (1), что к Pii («) я ,2 Pir ($) • Prj (fl — S). Рассмотрим разность к к Pij («) — Рц («) = ,2 Pir (s) Pr] (.П — s) — 22 Plr (s) • Prj (n — s)=* к = 2 [p<r(^)-plr(s)]prj(«—s). r=l Обозначим положительные разности P{r(s)—Pir($) символом 0$, а неположительные разности через —0я • Так как к к Г—1 reel ТО к 2 [^r (s)-^r (®)]-2₽S?-S₽^-o (2) г—1 (г) W Из этого равенства заключаем, что (г) (Г) Так как по предположению при всех i и г(/, г==1, 2, 3, Л) Р*. ($) > 0, то к 2Р« < 2p«w-i. (г) . г== 1 Таким образом, 0<Л«<1. Пусть h = max hiP Так как число возможных исходов конечно, то наряду с величи- нами Нц величина h удовлетворяет неравенствам 04*<l.
§ IQ] ТЕОРЕМА О ПРЕДЕЛЬНЫХ ВЕРОЯТНОСТЯХ 103 pj3 (1) находим, что при любых i и Z(f, Z = 1, 2, ..k) I Рц Ю-Рц(«) I -12 $’Ру ("—«) -2 («-s) I < <*•> W <1 шах РгЛп— $)2$?— min pri(n— (r) l<r<ft (г) <Л| max PrAn— s)— min PrAn — s)|<C l<r<k l<r<* Cft max IР1л(n—s) — Pu{n — $)| и, следовательно, также max |P«(«) — Ру(я)|<Л max \PfJ(n—s) — Pu{n — s)|. 1«. K* Ki.Klt Применив это неравенство раз, найдём, что к™ <*1 Pii {n)~Pij (п) 1 < АЧ »IРу (п _ Н *) ” — pv(«-[три- так как всегда |Ру(«) — Ру (/»)!<!, ТО ЯСНО, ЧТО [21 max |Рц(/г) — Ptj(л) |<А1 *J. 1<4, 1<к При я->оо также ^J->oo, поэтому в силу (3) отсюда следует, что lim max | Рц (я) — Ру (я) | = 0. n->ool<<, Z<Zc Из доказанного заключаем также; что • к 2pj=i- Действительно, к к ^Pj~ lim 2 Ру («) = lim 1 = 1. Je»l n->OOj=l П->0О Таким образом, на величины pj можно смотреть как на вероят- ности появления исхода Aj1* при л-м испытании, когда п велико. Физический смысл доказанной теоремы ясен: вероятность системе находиться в состоянии А$ прак ически не зависит от того, в каком состоянии она находилась в далёком прошлом. Только что обнаруженная теорема была впервые доказана творцом теории цепных зависимостей А. А. Марковым; она явилась первым строго доказанным результатом среди так называемых эргодических теорем, играющих важную роль в современной физике.
ГЛАВА 4 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ § 20. Основные свойства функций распределения Одним из основных понятий теории вероятностей является понятие случайной величины. Прежде чем переходить к формальному его определению, мы остановимся на рассмотрении примеров. Число космических частиц, попадающих на определённый участок земной поверхности в течение промежутка времени определённой длины, ‘ подвержено значительным колебаниям в зависимости от мно- гих случайных обстоятельств. Число вызовов, поступивших от абонентов на телефонную стан- цию в течение определённого промежутка времени, также является случайной величиной и принимает те или иные значения в зависимости от случайных обстоятельств. Размер уклонения точки падения снаряда от центра цели опреде- ляется большим количеством разнообразных причин, носящих случай- ный характер. В результате в теории стрельбы вынуждены считаться с явлением рассеивания снарядов около центра цели как со случайным явлением и рассматривать указанные уклонения как случайные вели- чины. Скорость молекулы газа не остаётся неизменной, а меняется в зависимости от столкновений с другими молекулами. Этих столкно- вений очень много даже в течение короткого промежутка времени. Зная скорость молекулы в данный момент, нельзя с полной опреде- лённостью указать её значение, скажем, через 0,01 или 0,001 секунды. Изменение скорости молекулы носит случайный характер. Приведённые примеры показывают с достаточной определённостью, что со случайными величинами приходится иметь дело в самых разнообразных областях науки и техники. Возникает естественная и притом весьма важная задача создания методов изучения случайных величин. Несмотря на всю разнородность конкретного содержания приведён- ных нами примеров, все они с точки зрения математики представляют одну и ту же картину. А именно, в каждом примере мы имеем дело 9 величиной, так или иначе характеризующей исследуемое явление.
§ 201 ОСНОВНЫЕ СВОЙСТВА ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ 105 Каждая из этих величин под влиянием случайных обстоятельств спо- собна принимать различные значения. Заранее предсказать, какое значение примет эта величина, нельзя, так как оно меняется случай- ным образом от испытания к испытанию. Таким образом, для того чтобы знать случайную величину, прежде всего необходимо знать те значения, которые она может принимать. Однако одного перечня значений случайной величины ещё недоста- точно, чтобы по ним можно было делать какие-лйбо существенные выводы. Действительно, если в третьем примере рассмотреть газ при разных температурах, то возможные значения скоростей молекул оста- нутся теми же самыми, тогда как состояния газа будут различны. Таким образом, для задания случайной величины необходимо знать не только, какие значения может она принимать, но и как часто, т. е. с какой вероятностью она принимает эти значения. Разнообразие случайных величин весьма велико. Число принимае- мых ими значений может быть конечным, счётным или несчётным; значения могут быть расположены дискретно или заполнять интервалы сплошь или же не заполнять интервалы, но располагаться всюду плотно. Для того чтобы задавать вероятности значений случайных величин, столь различных по своей природе, и притом задавать их одним и тем же способом, в теории вероятностей вводят понятие функции распределения случайной величины. Пусть 5 — случайная величина и х — произвольное действительное число. Вероятность того, что $ примет значение, меньшее чем х, называется функцией распределения вероятностей случайной вели- чины В: F(x) = P {£<*}. Условимся в дальнейшем, как правило, случайные величины обо* значать греческими буквами, а принимаемые ими значения — строчными латинскими. Резюмируем сказанное: случайной величиной называется перемен- ная величина, значения которой зависят от случая и для которой определена функция распределения вероятностей*). Рассмотрим примеры функций распределения. Пример 1. Обозначим через р. число появлений события А в последовательности п независимых испытаний, в каждом из которых вероятность его появления постоянна и равна р. В зависимости от случая может принимать все целочисленные значения от 0 до л включительно. Согласно результатам главы 2 рп (щ) = Р {pi = т} = C™pmqn~™. *) В дополнении 1 будет дано более формализованно^ определение слу- чайной величинь!,
106 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [гл. 4 Функция распределения величины р определяется следующим спосо- бом: 0 для F(x) = k<x для 0 < х п, 1 ДЛЯ X > п. Функция распределения представляет собой ступенчатую линию со скачками в точках л:=®0, 1, 2, ..., п; скачок в точке х = £ равен Pw(fe). Рассмотренный пример показывает, что так называемая схема Бернулли может быть включена в общую теорию случайных величин. Пример 2. Пусть случайная величина 5 принимает значения О, 1, 2, ... с вероятностями = = (й=0, 1, 2,...). где X > 0 — постоянная. Функция распределения величины Е пред- ставляет собой как бы лестницу с бесконечным числом ступенек, со скачками во всех неотрицательных целочисленных точках. Величина скачка в точке х — п равна при х 0 имеем F (х) = 0. Про случайную величину, рассмотренную в настоящем примере, говорят, что она распределена по закону Пуассона. Пример 3. Мы скажем, что случайная величина нормально распределена^ если её функция распределения имеет вид х С*—д)2 Ф(х) = С j* е * dz, —оо где С>0, а>0, а—постоянные. Впоследствии мы установим связь между постоянными а и С и выясним теоретико-вероятностный смысл параметров а и а. Нормально распределённые случайные величины играют особо важную роль в теории вероятностей и её приложениях, в дальнейшем у нас будет много поводов убедиться в этом. Заметим, что если в двух первых рассмотренных нами примерах случайные величины могли принимать только конечное или счётное множество значений (дискретные величины), то случайные величины, распределённые по нормальному закону, могут принимать значения из любого интервала. Действительно, как мы увидим ниже, вероят- ность нормально распределённой случайной величине принять значе- ние, заключающееся в интервале х1 Е < х2, равна _ (а—д)* Ф (ха) — Ф (xj == С J е~ dz и, следовательно, при любых и х2 (х* ф ха) положительна.
§ 20 J ОСНОВНЫЕ СВОЙСТВА ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ 107 При помощи функции распределения случайной величины 6 можно определить вероятность неравенства хг $ < х2 при любых хг и х2. В самом деле, если через А обозначить событие, состоящее в том, что £ примет значение, меньшее чем х2, через В — событие, состоя- щее в том, что £<х1, и, наконец, через С—событие хх<3 < то, очевидно, имеет место следующее равенство: 4 = В-|-С. Так как события В и С несовместимы, то Р(Л)«Р(В)+Р(С). Но Р(Л) = Р(х2), P(B)«FW, Р(С) = Р{х1<е<х2}, поэтому Р {хх < 5 < х2} = F (xj — F (хх). (1) Так как, по определению, вероятность есть неотрицательное число, то из равенства (1) следует, что при любых Xj и х2(х2>хх) имеет место неравенство F F C^i)» т. е. что функция распределения любой случайной величины есть неубывающая функция. Очевидно, далее, что функция распределения F (х) при любом х удовлетворяет неравенству 0<Р(х)<1. (2) Мы скажем, что функция распределения F(x) имеет при х==х0 скачок, если F(x0 + 0) — F (х0—0) = Со > 0. Функция распределения может иметь не более чем счётное множество скачков. В самом деле, скачков размера, большего -j, функ- ция распределения может иметь не более одного; скачков размера от одной четвёртой до половины 0- < Со не более трёх. Вообще скачков размером от до может быть не более чем 2* — 1. Совершенно ясно, что мы можем пронумеровать все скачки, распо- ложив их по величине, начиная с больших значений и повторяя рав- ные значения столько раз, сколько скачков этой величины имеет функция F(x). Установим ещё несколько общих свойств функций распределения. Определим F( — оо) и F(-]-oo) равенствами F( — оо) = lim F(—п), F(-|-oo) = lim F (-1- л)
108 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 и докажем, что F( — оо) = 0, /7(+оо)=1. Действительно, так как неравенство £ < оо достоверно, то Р{е< + оо} = 1. Обозначим через Qk событие, состоящее в том, что k — 1 5 < k. Так как событие £ < —|— эквивалентно сумме событий то на основании расширенной аксиомы сложения Р{5< + оо}= 3 р {(?*}. А =—оо Следовательно, при л->оо S P{Qft}= 2 \F(k) — F(k—V)] = F(n) — F( — я)->1. feel-n k=l — n Отсюда, принимая во внимание неравенства (2), заключаем, что при оо F(— я)->0, Г( + л)->1. Функция распределения непрерывна слева. Выберем какую-нибудь возрастающую последовательность х0 < < xt <х2 < ... < хп < ..., сходящуюся К X. Обозначим через А„ событие {x„^Si<x}. Тогда ясно, что AfCAj, при Z>/, и произведение всех событий А„ есть невозможное событие. По аксиоме непрерывности должно быть lim Р (Дя) = lim {F (х) — F (хя)} = F (х) — lim F(х„) = Я-> ОО »->оо п~>оо = F(x)— F(x— 0) = 0 ч. и тр. д. Точно так же можно доказать, что . P{5<x}=F(x + 0). Мы видим, таким образом, что каждая функция распределения является неубывающей, непрерывной слева и удовлетворяющей условиям F{ — оо) = 0 и F( + оо) = 1 функцией. Верно и обратное: каждая функция, удовлетворяющая перечисленным условиям, мо- жет рассматриваться как функция распределения некоторой слу- чайной величины. Заметим, что в то время как каждая случайная величина одно- значно определяет свою функцию распределения, существует сколько угодно различных случайных величин, имеющих одну и ту же функцию распределения. Так, если 6 принимает два значения —1 и каждое с вероятностью X- и tj — — £, то ясно, что всегда $ отлична
§ 211 НЕПРЕРЫВНЫЕ И ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЙ 109 от т|. Тем не менее обе эти случайные величины имеют одну и ту же функцию распределения 0 при хС— 1. F(x) = 1 2 при 1 < X 1, 1 при х> 1. § 21. Непрерывные и дискретные распределения Иногда поведение случайной величины характеризуют не заданием её функции распределения, а каким-либо иным способом. Всякая такая характеристика носит название закона распределения случайной вели- чины, если только по определённым правилам можно получить из неё функцию распределения. Так, законом распределения будет функция интервала Р {х1э х2), представляющая собой вероятность неравенства Действительно, зная Р {хи х2}, мы можем найги функ- цию распределения по формуле Г(х) = Р{ — оо, х}. Мы уже знаем, что и по Р(х) можно найти для любых xt и х2 функ- цию Р{хь xJtPfXp x2} = F(x2)— Часто в качестве закона распределения полезно брать функцию множества Р {£}, определённую для всех борелевских множеств и представляющую собой вероятность того, что случайная величина 5 примет значение, принадлежащее множеству Е. Вероятность Р(Е\ в силу расширенной аксиомы сложения, есть вполне аддитивная функ- ция множества, т. е. для любого множества Е, представляющего собой сумму конечного или счётного числа непересекающихся множеств Ел: Р(Е) = ЕР{ЕЙ}. Из всевозможных случайных величин мы выделим прежде всего те, которые могут принимать только конечное или счётное множество значений. Такие величины мы будем называть дискретными. Для пол- ной вероятностной характеристики дискретной случайной величины принимающей с положительными вероятностями значения хи х2, х8, ...» достаточно знать вероятности р* = Р {$ = х&} *). Очевидно, что по совокупности вероятностей рк можно определить функцию распределения F (х) посредством равенства в котором суммирование распространяется на все те индексы, для которых хк < х. ♦) Эти и только эти значения хп мы назовём возможными значениями дискретной случайной величины 5.
110 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ 4 Функция распределения любой дискретной величины разрывна, возрастает скачками при тех значениях х, которые являются воз- можными значениями Е. Величина скачков функции F (х) в точке х, как мы выяснили ранее, равна разности А(х~[~0) — F(x). Если два возможных значения величины $ разделены интервалом, в котором других возможных значений Е нет, то в этом интервале функция распределения F(x) постоянна. Если возможных значений Е конечное число, например л, то функция распределения F(x) пред- ставляет собой ступенчатую кривую c/z^l интервалом постоянства. Если же возможных значений Е имеется счётное множество, то это последнее может быть и всюду плотным, так что интервалов посто- янства у функции распределения дискретной случайной величины может и не быть. Пусть для примера возможными значениями Е будут все рациональные числа и только они. Пусть эти числа занумерованы каким-нибудь способом: г2, ... и вероятности Р {Е «rj = рк определены посредством равенства = В нашем примере все ра- циональные точки являются точками разрыва функции распределения. В качестве другого важного класса случайных величин мы выде- лим те из них, для которых существует неотрицательная функция р (х), удовлетворяющая при любых х равенству F(x)== J p(z)dz. —“ОО Случайные величины, обладающие этим свойством, называются непре* рывными*, функция р (х) называется плотностью распределения вероятностей. Отметим, что плотность распределения вероятностей обладает сле- дующими свойствами: 2. При любых хг и ха удовлетворяет равенству я?2 Р {*! <I; < х8} = J p(x)dx. XL В частности, если р (х) непрерывна в точке х, то с точностью до бесконечно малых высших порядков Р {х Е < х + ~ Р (х) 3. J p(x)dx = 1. Величины, распределённые по нормальному или равномерному закону*), дают нам примеры непрерывных случайных величин^ *) Так называется закон с функцией распределения, линейно изменяю* щейся от 0 до 1 в некотором интервале (а, Ь) и равной нулю левее точки а И единице правее Ь.
21J НЕПРЕРЫВНЫЕ И ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ 111 Пример. Рассмотрим ближе нормальный закон распределения- Для него плотность распределения вероятностей равна (а?—о)а р(х) = С-« . Постоянное С определяется, исходя из свойства 3. Действительно* (я>—о)* Cje dx = l. Заменой переменных = z это равенство приводится к виду Г _£ Сар Интеграл, стоящий в правой части этого равенства, известен под име- нем интеграла Пуассона, причём _ g2 J е 2 dz == Таким образом, находим, что С=—~ а и, значит, для нормального распределения 1 (ж—д)а а у 2я Функция р (х) достигает максимума при х = а, имеет точки пере- гиба при х = ось абсцисс служит для неё асимптотой при х->±:оо. Для иллюстрации влияния параметра о на форму графика плотности нормального распределения мы приводим на черт. 12 гра- фики р(х) при а = 0 и 1) а8 = -^-, 2) а9 = 1, 3) а9 = 4. Мы видим, что чем меньше значение а, тем кривая р (х) имеет большее значение •
112 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ (гл. 4 максимума и падает круче. Это означает, в частности, что веро- ятность попасть в интервал (— а, а) больше для той случайной вели- чины, распределённой по нормальному закону (с параметром а = 0), для которой величина а меньше. Мы, следовательно, можем считать с характеристикой разбросанности значений величины 5. При а ф 0 кри- вые плотностей имеют ту же форму, но сдвинуты вправо (а > 0) или влево (а < 0) в зависимости от знака параметра а. Помимо дискретных и непрерывных случайных величин суще- ствуют, разумеется, и другие случайные величины. Кроме величин, которые ведут себя в одних интервалах как непрерывные, а в других как дискретные, имеются величины, не являющиеся ни в одном интер- вале ни дискретными, ни непрерывными. К таким случайным величи- нам относятся, например, все те, функции распределения которых непрерывны, но при этом возрастают только на множестве лебегов- ской меры нуль. В качестве примера такой случайной величины при- ведём величину, имеющую функцией распределения известную кривую Кантора. Напомним построение этой кривой. Величина $ принимает только значения между нулём и единицей. Следовательно, её функция распределения удовлетворяет равенствам F(x)==0 при — ! при х>1. Внутри интервала (0, 1) Е принимает значения только в первой и последней его третях, в каждой с вероятностью у. Таким образом, г?/ \ 1 1 2 = ПРИ •з<х<’з' В интервалах (0, -у) и 1J $ снова может принимать значения только в первой и последней трети каждого из них, в каждой с вероят- ностью Этим определяются значения F(x) ещё в двух интер- валах: ПРИ д-ОС-д, Е-/ \ з 7*8 ^(*)==У при -g<*<g-- Далее в каждом из оставшихся интервалов повторяется то же по- строение и этот процесс продолжается до бесконечности. В резуль- тате функция F(x) оказывается определённой на счётном множестве интервалов, являющихся интервалами смежности некоторого нигде не плотного совершенного множества меры нуль. На этом множестве дооп- ределяем функцию F (х) по непрерывности. Величина Ес таким образом определённой функцией распределения не дискретна, так как её функция распределения непрерывна, но в то же время Е не непрерывна, так
§22] МНОГОМЕРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 113 как её функция распределения не является интегралом от своей произ- водной. Все введённые нами определения переносятся легко на случай условных вероятностей. Так, например, функцию F(x/B) = Р{Е < х/В} мы будем называть условной функцией распределения случайной величины Е при условии В. Очевидно, что F(x)B) обладает всеми свой- ствами обычной функции распределения. § 22. Многомерные функции распределения Систему из п величин Е1Э Е2> ..., Еп мы назовём случайным векто- ром или п-мерной случайной величиной, если определена вероятность совместного осуществления неравенств ^2 < *^2» • * •» < Хп при всевозможных вещественных хп х2, хп. Функция F (х1> х2, • • •, хп) = Р <Xi, Е2 <С х%, . xt^ называется д-мерной функцией распределения случайного вектора (^1 > ?2» • • •» В дальнейшем мы прибегнем к геометрической иллюстрации и ста- нем рассматривать величины Еи Е2> ..., Ел как координаты точек д-мер- ного евклидова пространства. Очевидно, что положение точки (Ер • • •» зависит от случая и что функция F(xn ..хп) при такой интерпретации даёт вероятность попадания точки (Ер ..Еп) в «-мер- ный параллелепипед Ei < хп Е2< х2, Кп<хп с рёбрами, парал- лельными осям координат. С помощью функции распределения легко вычислить вероятность того, что точка (Ер Е2> ..., Еп) окажется внутри параллелепипеда G=l> 2, . где и bi—произвольные постоянные. Нетрудно подсчитать, что Р {#1 ^262 < ^2> • • • > ап < &п\ = «= F {Ьь £2, ..., Ьп) — 2 Pi + • • • + + ( —а2, ..., ап\ (1) где через рц„.к обозначено значение функции Р(съ с2> ..., сп) при Cj — aj, C{ = ai...ck = ak и при остальных с8, равных Ь8. Мы предоставляем доказательство этой формулы читателю. Заметим, в частности, что F(xx, ..., 4"°°> •••х хп) Даёт нам вероятность того, что будет выполнена следующая система неравенств: ?! < Х19 Е2<С«^2» •••» •••> 6Л <c xn* 3 Зак. 1826. В. В. Гнеденко;
114 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 Так как. по расширенной аксиоме сложения вероятностей Р (51 <С Хь ...» 5*-t < ЯА_р 5*4-1 хк±\> • • •> < хп} ~ “ 2 Р {^1 Яр • . . , 5*_ 1 <С Хк-У> 5 5* < $ 4~ 1, 5*+1 < 8=—оо <я^+1, ..5П < хп} = F(хр •.., х*_р оо, Яд.44, ..хл), то Г(Хр х^р оо, хА+1, ...» xw) является функцией распреде- ления (п — 1)-мерной случайной величины (5П ...» 5*—1? 5*4-1, ..5Д Продолжив этот процесс далее, мы можем определить 6-мерные функ-* ции распределения любой группы из k величин 5/,, 5^, ..., 5г- по формуле Ffc(я^, я^, ..., x7ft) = Р {5/j <С я^р ..., 5^ < xijc] = F (^, с2> • • • > спК где с8 — х8, если s = ir (1 г 6) и cs = -|-oo в иных случаях. В частности, функция распределения случайной величины 57. равна ^к (я) = F (q, ^2» • • • > сп)> где все (/ ф 6) равны 4" °°> а с1{ = х. Подобно тому как поведение одномерной случайной величины можно характеризовать не только посредством функции распределе- ния, но и другими способами, многомерные случайные величины могут быть определены, скажем, посредством неотрицательной вполне адди- тивной функции множества Ф {В}, определённой для любых борелев- ских множеств //-мерного пространства. Эту функцию мы определим как вероятность попадания точки (Н1э 5W) на множество £. Этот способ вероятностной характеристики п-мерной случайной величины следует признать наиболее естественным и с точки зрения теорети- ческой наиболее удачным. Рассмотрим примеры. Пример 1. Случайный вектор (5Р 5П) называется равно- мерно распределённым в параллелепипеде < bi (1 если вероятность попадания точки (5Р 5а, ...» 5П) в любую внутрен- нюю область указанного параллелепипеда пропорциональна её объёму и вероятность попадания внутрь параллелепипеда является достовер- ным событием. Функция распределения искомой величины имеет вид О, если xi^ai хотя бы при одном Z, (Яр ..•, хп) п ТТ с{ — а{ 7^ ai9 где ^==Х|, если и Ci = если Xi >
§ 221 МНОГОМЕРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 11 5 Пример 2. Двумерная случайная величина (5Р $2) распределена нормально, если для неё функция распределения равна f (х, у) == С J J ^—9 (®. у) dx dy, —оо —оо где Q(x, у) — положительно определённая квадратичная форма. Известно, что положительно определённая квадратичная форма от х и у может быть записана в виде о(х и\ — (x~g)2_г— | {у — &)8 Ч И- У)— 2Аг r I 2В2" ’ где А и В — положительные числа, а г, а и b — вещественные числа, причём г подчиняется условию — 1 < г < —1. Легко видеть, что при г*ф 1 каждая из случайных величин и подчинена одномерному нормальному закону. Действительно, (-^i) = Р {^i < xj == F (хп + оо) = С |* J в<® y^dxdy = — 00 р (я?—a)2 t< р 1 (У — Ъ г(х—а) р ==С е ** 1 ’ е 2 I в А J dy. —00 Так как е 2 I в А 1 dy = В то ___ ?' to—ау F^xJ^BCj/fr j е 2А’ dx. (2) —оо Постоянное С может быть выражено через А, В и г. Эту зависи- мость можно найти из условия F, ( -f- оо) = 1. Имеем: 1 = ВС/2^ [ Их = .^У2п Г = J /1—г2 J /I —г2 Отсюда 2пАВ • Если Г^ф1, то мы положим А = о, V 1 —г8, В = а2 )/1 - А 8*
116 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 В этих новых обозначениях двумерный нормальный закон принимает такой вид: Г(Хл, х2) = г* 1 Г Д)а 2г (#—а) (У—Ь) (У— ОТ с=-------е аа—r®)L «л + - \ dxdy. 2710100 1 -r2 * — ОО —ОО Теоретико-вероятностный смысл входящих в эту формулу параметров будет выяснен в следующей главе. При г2 = 1 равенство. (2) теряет смысл. В этом случае и связаны линейной зависимостью. Подобно тому как это было сделано в одномерном случае, для многомерных функций распределения можно установить ряц свойств. Мы приведём их формулировки, предоставив читателю их доказа- тельства. Функция распределения 1) есть неубывающая функция по каждому аргументу, 2) непрерывна слева по каждому аргументу, 3) удовлетворяет соотношениям Р(-)-оо, -|-оо, ..., 4-°°) = 1, lim F(xn .., xw) = 0 оо при произвольных значениях остальных аргументов. В одномерном случае мы видели, что перечисленные свойства необходимы и достаточны, чтобы функция F(x) была функцией рас- пределения некоторой случайной величины, В многомерном случае, оказывается, этих свойств уже недостаточно. Для Того чтобы функ- ция F (хр ..., хп) была функцией распределения, помимо перечис- ленных трёх свойств, нужно добавить ещё следующее: 4) при любых а* и ^(/=1, 2, ..., п) выражение (1) не отри- цательно. Что это требование может быть не выполнено, несмотря на на- личие у функции F(xt, ..., хп) свойств 1 — 3, показывает сле- дующий пример. Пусть ( 0, если или или F(x, у/) = { , 4 l 1 в остальной части плоскости. Эта функция удовлетворяет требованиям 1—3, но для неё /=•(1,1)-г(1,|)-f(|, + = (3) и, следовательно, четвёртое требование не выполнено. Функция F (х, j/) не может быть функцией распределения, w как разность (3) согласно соотношению (1) равна вероятности попа- дания точки ($р У в прямоугольник
§221 МНОГОМЕРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 117 Если существует такая функция p(xt, х2> хя), что при любых хи х2, хп имеет место равенство ®2 F(xlt х2, .xn)= f f f p(zbz2, zn)dzn...dz2 dzb — 00 —co —oo то эта функция называется плотностью распределения вероятно- стей случайного вектора (В,, В2, .Q. Легко видеть, что плот- ность распределения обладает следующими свойствами: 1. р(хи х2, ...» х„)>0. 2. Вероятность попадания точки ($ь $2, $п) в какую-нибудь область G равна J... Jp (Х1, . .., хп) dxn.. .dxt. G В частности, если функция p^xv х2, .хп) непрерывна в точке (хр ..хп), то вероятность попадания точки $2, ..$п) в парал- лелепипед хк < хк -j- dxk (k = 1, 2, ..., п) с точностью до бесконечно малых высших порядков равна р (Хр х2, ..хп) dxx dx2... dxn. Пример 3. В качестве примера л-мерной случайной величины, имеющей плотность, приведём величину, равномерно распределённую в я-мерной области G. Если через V обозначим я-мерный объём области G, то плотность распределения будет равна О, если (хр х2, xj'c’G, если (хр х2, хп)С° Р -^2’ • • •» *^п) — Пример 4. Плотность двумерного нормального закона даётся формулой 1 Г (a? —Q)8 2г (Я?—О) (у—Ь) (у —b)aj nfx v) ............... — 2(1—г8) [ «л аз J, Л 2^02 Vl—гЗ Заметим, что плотность нормального распределения сохраняет постоянное значение на эллипсах (х—л)2 2г — — — а1 а1а2 (4) где X — постоянное; на этом основании эллипсы (4) носят название эллипсов равных вероятностей. Найдём вероятность попадания точки ($р £2) внутрь эллипса (4). По определению плотности /р(х> y}dxdy, (5)
118 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [гл. 4 где через G(X) обозначена область, ограниченная эллипсом (4). Для вычисления этого интеграла введём полярные координаты х — a = pcos6, у —ь = р sin 0. Интеграл (5) при этом принимает вид 2я k/d У1—-Г® —f f е a*PrfPrf0» 2itata2y 1— Г2 J J где для краткости обозначено 9 cos 0 sin 0 . sin2 0* zr -j- 2 ala2 a2 J Интегрирование по p даёт: № 1-e f d0 2Kaia2 У*1 ~ '*2 J s2 * 0 Интегрирование no 0 можно выполнить по правилам интегрирования тригонометрических функций, но в этом нет необходимости, так как оно автоматически производится с помощью вероятностных сообра- жений. Действительно, 2х П/ I X 1 1 f Р(4-оо)== 1 = ------==== — • Эпод 'У 1 — г2 J s9 Отсюда 2л J = —га О и, стало быть, v Р(Х)=1— е за-'2). Нормальное распределение играет исключительно большую роль в различных прикладных вопросах. Распределение многих практи- чески важных случайных величин оказывается подчинённым нормаль- ному закону распределения. Так, например, огромная практика артилле- рийских стрельб, произведённая в различных условиях, показала, что рассеивание снарядов на плоскости при стрельбе из одного орудия на определённом прицеле подчиняется нормальному закону. В главе 8 мы увидим, что эта «универсальность» нормального закона объясняется тем, что всякая случайная величина, являющаяся суммой очень боль- шого числа независимых случайных величин, каждая из которых
§221 МНОГОМЕРНЫЕ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 119 оказывает лишь незначительное влияние на сумму, распределена почти по нормальному закону. Важнейшее понятие теории вероятностей—независимость собы- тий— сохраняет своё значение и для случайных величин. В соответ- ствии с определением независимости событий мы скажем, что случайные величины независимы, если для любой группы Ц, Ц, этих величин имеет место равенство Р {5** <х^ 5*а < 5*ft <С х&к\ = = Р {5*t <С Xi^} Р {5*2 < XiJ . . .Р {5*fc X<J при произвольных х*1$ х*2» •••> Xik и Л1°б°м В част- ности, для произвольных xL, х2, хп выполняется равенство Р {5t< Ху 52<^х2, • •5W <С хп] = = P{£1 <*1) Р{*2<*2}.. .P{Sn<xJ или в терминах функций распределения F (хр х2, ..., хп) — (^1) • F2 (х2). • • Fn \хп), где Fft(xft) означает функцию распределения величины $7с. Легко видеть, что верно и обратное предложение: если функ- ция распределения F(xv х2„ ...» хп) системы случайных вели- чин $2, ..., имеет вид F(Xy х2, •. •, х^) = F\ C^i) F2 (х2) •.. Fn (x.n), где функции Fk(xk) удовлетворяют соотношениям F*( + oo) = l (А = 1, 2, ..., zz), то величины 52, ..независимы и функции /^(xj, F2(x2),... .. ., Fn (хп) являются их функциями распределения. Проверку этого предложения мы предоставляем читателю. Пример 5. Рассмотрим /z-мерную случайную величину, компо- ненты которой 5Р $2, являются взаимно независимыми случай- ными величинами, распределёнными по нормальным законам Fft(Xfc)==V7^_J/ dz' В рассматриваемом примере функция распределения равна F(xn х2, .... xn)==(2ic) аП°Г1Гв 2’А dz‘ Ля.1 J —ОО Если независимые случайные величины 5^ ..., 5П имеют плот- ности распределения рг (х), (х), ..., рп{х^, то //-мерная вели-
120 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 чина (5Ь ?2, ..., %п) имеет плотность распределения, равную Р(х1> х2, .... х„)=р1(х1)-р2(х2).../?„(хп). Пример 6. Если величины $2, ..независимы и имеют плотности распределения * 2’Л (1 <£<«), то д-мерная плотность распределения величины (6Х, $2, . £п) равна __£ F(*>. ......x*>=s^' 4 (») При п = 2 эта формула принимает вид (жх—gJ3 (а?2—а2)а p(Xi, х2) — ^—в 2а? 2®2 . г \ ы 2лаха2 Сравнение этой функции с плотностью двумерного нормального за- кона (пример 4) показывает, что для независимых случайных величин и $2 параметр г равен 0. При я = 3 формула (6) может быть истолкована как плотность распределения вероятностей компонент S2, ;3 скорости молекулы по осям координат (распределение Максвелла), если только предпо- ложить, что O1==SO2 = O3 = ^» 1 а » пт где т — масса молекулы, а Л — константа. § 23. Функции от случайных величин Сведения, полученные нами о функциях распределения, позволяют нам приступить к решению следующей задачи: по функции распре- деления F (хр х2, ..., хп) совокупности случайных величин $2, ..., определить функцию распределения Ф (ур у2, ..., уА.) величин 7}!=/^!, S2, ..., 5„), т)2=/2($1, .... 7)* = Общее решение этой задачи весьма просто, но требует расши- рения понятия интеграла. Чтобы не отвлекаться в сторону чисто аналитических вопросов, мы ограничимся рассмотрением важнейших часгных случаев: дискретных и непрерывных случайных величин. В следующем параграфе будут изложены определение и основные свойства интеграла Стилтьеса; там мы дадим общую1 запись важнейших результатов настоящего параграфа.
§23] ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН 121 Рассмотрим сначала случай, когда «-мерный вектор (^, ..., £п) имеет плотность распределения вероятностей р(хъ ха, ...» хп). Из предыдущего видно, что искомая функция распределения определяется равенством •••» л)= / Xg, ...,xn)dxldx2...dxn, D причём область интегрирования D определяется неравенствами Л (*1, X» хп) <у{ (1= 1,2,..., k). В случае дискретных случайных величин решение, очевидно, даётся с помощью «-мерной суммы, также распространённой на область D. Мы применим теперь только что сделанное нами общее замечание относительно решения поставленной нами общей задачи к нескольким важным частным случаям. Функция распределения суммы. Пусть требуется найти функцию распределения суммы = + если p(xt, х2, хп)—плотность распределения вероятностей век- тора ($р ?2, • • •» £п)- Искомая функция равна вероятности попадания точки (8Р Q в полупространство ^4"^+ ••• +^n<* и> следовательно, Ф (х) — J J р (хп х2, ..., х„) dxt dx2.. .dxn. S Рассмотрим подробнее случай л = 2. Предыдущая формула при- нимает в этом случае такой вид: X—х2 Ф(х) = J J р(хр х2) dxt dx2 = J J p(xn x^rfXjrfXa. (1) Если величины и независимы, то p(xu x2) =pJ(x1)p2(x2) и равенство (1) может быть записано в таком виде: X—Хч X Ф(х) = У«/х1 J р} (xJ)p2(x2)rfx2== j* rfXi j’p1(x1)p2(2’—Xj)<fe« — JO * —00 X = J dz{ j"pt (Xi)p2(z — xjdx^. (2) — 00 В общем случае формула (1) даёт: ф(х)= J dxj j* p(z, х, — z)dz. (3) -оо
122 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [гл. 4 Последние равенства доказывают, что если многомерное распределение слагаемых имеет плотность распределения вероятностей, то их сумма также имеет плотность распределения. Эта плотность в случае неза- висимых слагаемых может быть записана в виде р (х) = J Pi (х — г) р2 (г) dz. (4) Рассмотрим примеры. Пример 1. Пусть и ?2 независимы и равномерно распреде- лены в интервале (а, Ь). Найти плотность распределения сум..«ы ^ = 51 + $2- Плотности распределения вероятностей и равны Р1(х)=р2(х) = ' О , если 1 v----, если Ь — а ’ х ^а или х > а <х ^Ь. По формуле (4) находим, что & Ръ (X) = J Pl —z)dz = j- а ь 1 f Ь — а . а Из того, что при х < 2а х — z < 2а — z < а, а при х > 2Ь х — г заключаем, что при х < 2а и х > 2Ь рГ)(х) = 0. Пусть теперь 2а < х нуля только при тех венствам ; 2Ь. Подинтегральная значениях г, которые функция отлична удовлетворяют нера- ОТ a <х— z < b или, что то же самое, неравенствамч х — # < г < х — а. Так как х > 2а, то х — а>а. Очевидно, что х — а при х^а-\~Ь. Следовательно, если 2а < х <^a-J- b, то ж—а Рч(х)= J (6 _ ар Я х—2а
§ 23] ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН 123 Точно так же при а-\~Ь <х ^2Ь ь , ч__ f dz _______ 2b — х Р^х)— J (&—а)2 — (&_e,2• х—Ь Собрав вместе полученные результаты, находим, что 0 при ' 2а И X >2/>, Рп (•*) = 1 1 Й КЗ при 2а < X 2Ь — х (Ь — а)* при a-f- Z>< [ х < ,2&. Функция р^(х) носит название закона распределения Симпсона. Вычисления в рассмотренном примере значительно упрощаются, если воспользоваться геометрическими соображениями. Изобразим, как обычно, и $2 как прямоугольные координаты на плоскости. Тогда вероятность неравенства -J- ?2 < х ПРИ 2а < х а b равна вероятности попадания в дважды заштрихованный прямоугольный треугольник (черт. 13). Эта вероятность, как легко под- считать, равна (х —2а)2 2(а — ЬУ' При а 4- b < х 2Ь вероят- ность неравенства -f- $2<х равна вероятности попадания во всю заштрихованную фигуру. ’Эта вероятность равна (26 —х)2 2(Ь-—а)2' Дифференцирование по х Черт. 13. приводит нас к формуле (5). В связи с рассмотренным примером интересно заметить следующее. Общие вопросы геометрии привели Н. И. Лобачевского к не- обходимости решения следующей задачи: имеется группа из п взаимно независимых случайных Величин $2, ..., найти распределение вероятностей их среднего арифметического. Эта задача была им решена только для случая, когда все ошибки равномерно распределены в интервале (—1, 1). При этом ока- залось, что вероятность ошибке среднего api фметического заклю- чаться в пределах от —х до х равна *П\Х) Ч (г!)Цп—г)1
124 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 где суммирование распространяется на все целые г от г = 0 до [п — nxl 2 J’ Пример 2. Двумерная случайная величина (ВА, $2) распределена по нормальному закону р (X, у) = ------J------ X 2яа1а2 у 1 — г2 Хехр ________1 /(* —л)2____(Х — а)(у — Ь) . (у —£)2\) 2 (1 Г2) у Gj (jjGg /J Найти функцию распределения суммы Согласно формуле (3) X f exp! •• I ______1 /(g —а)8__g (г — я) (х — z — Z>) 2(1—r2)\ о8________ata2 a2 / J Обозначим для краткости х — а — b через v и z— а через тогда 2л®,а2 /1 — г* X X J ехр| — 1 / ц2____2г ы ~~ц) 2 (1 — гЗ) \ <$ в1«г ff2 / J Так как и2 u(v--u) (v — u)* _ + 2 I 2 2 2 *1 gag2 a2 а Г gl+2rgtG2+g2 ffla2 V Gj + Z*G2 g2 + + + ™2)2 > °2 \ <4 + 2r<Jl°2 + °2' U °lg2 ______^1 + ^2 V | *,2(1 — ^2) a3 1/^^ + 2гаАа3 + a2 j c! + + аз то, введя обозначение V0! + 2rat a2 -j- gg GjGg V Gj 4- r<32 a2 al 2fGjGg 4“ a|
§ 231 ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН 125 мы приведём выражение для рТ{ (х) к виду ___________________________________&________ 2^ + 2ro1q2 + o|) Г71 4 ’ 2тс 4- 2га1аа + а2 Так как то ___________________________________________(я?—а—Ь)2 р (х) = ...1-е 2(3l+2r,t В частности, если случайные величины и ?2 независимы, то г = 0 и формула для ръ(х) принимает вид (ж—-о —д)2 /2л(а| + о^) Нами получен, таким образом, следующий результат: сумма нормально распределённых случайных величин распределена по нормальному закону. Интересно заметить, что когда слагаемые независимы, имеет место и обратное предложение (теорема Г. Крамера): если сумма двух независимых случайных величин распределена по нормальному за- кону, то каждое слагаемое также распределено по нормальному закону. Мы не останавливаемся на доказательстве этого предложения, так как оно требует более сложного математического аппарата. Пример 3. Распределение х® Пусть Ц, ..., — не- зависимые случайные величины, распределённые по одному и тому же нормальному закону с параметрами а и а. Функция распределения величины п £&-«)• /С=1 носит название -^-распределения. Это распределение играет важную роль в различных вопросах статистики. Мы вычислим сейчас функцию распределения величины Она окажется независимой от а и о. Очевидно, что для отрицательных значений аргумента функция распределения Ф (у) величины С равна 0; для положительных значе*
126 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 ний у фгнкцмя Ф^у) равна вероятности попадания точки (?р внутрь шара 2 (х* —а)2=/./г.а’. к=1 Таким образом, П о - 2 Ф Су) = [ • • • J (у^)”е <=1 2 dxidx^• -dXn' Перейдём для вычисления этого интеграла к сферическим координатам, т. е. сделаем замену = р cos cos 02.. .cos 6M_lt x2 = pcos61 cos02. • - sin 0n_t, xw = psin 0r В результате этой замены 4.25 2L 2 2 yVn р2 фCv)= J • •. f J (-y=yiP”-10(<h.. A-i)d?rfVi.• TC ___к 0 ~ 2 2 =* Cn J e 2pn'^1dp9 0 где постоянная « т 2 2 C”=(7W J- ГС rc "2 2* зависит только от n. Эту постоянную легко вычислить, пользуясь равенством Отсюда находим, что уУп _ £ е 2 dp«
§ 23] . ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН 127 Плотность распределения случайной величины С при у 0 равна , Черт. 14. Отсюда, в частности, при я-= 1 мы получим, естественно, плотность распределения, равную удвоенной плотности исходного нормального закона 0>о). При п == 3 мы получаем известный закон Максвелла ( 1 3 /6 9 —If <Р (У) = -27=^ У е • у « Пример 4. Функция распределения частного. Пусть плотность распределения вероятностей величины ($, т]) равна р (х, у). Требуется найти функцию распределения частного С— Согласно определению /ч(*)=р )!<*}• Если $ и т| изображают координаты точки на пло- скости, то Р^(х) равна ве- роятности того, что точка (£, *q) попадёт в область, координаты точек которой удовлетворяют неравенству < х. На черт. 14 эта область заштрихована. Согласно общей формуле искомая вероятность равна оо га? О оо Л(х) = / ! Р(У’ z)dydz± j fp(y,z)dydz. (7) О —оо — оо яй? Отсюда вытекает, что если $ и т| независимы, a (х) и р2 (х) — их плотности распределения, то оо О w = J (хг) р* w dz + J* о — F1 (Х2У> р* аг- V') О —оо л . -
128 - СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 Продифференцировав (7), находим, что со О />c(x) = J* zp(zx, z)dz— Jzp(zx,z)dz. (8) О —оо В частности, если $ и т] независимы, то- оо О Pl (*) = f zPi (zx) Pi (z)dz— f zpi (zx) Pn (x) dz. (8') , 0 —oo Пример 5. Случайная величина (5, r|) распределена по нормаль- ному закону р (х, у) =-----*— ехр /-------1—§- Г^- — 2г-^~ ^-11. 4 2^/1-г2 Ч 2(1—ra)L4 Va ’a-ll Найти функцию распределения частного £ = ~ По формуле (8) (_____& ра^8 —2/~aiV + Ji { 2(1—г2) L Г f I Z9 «|х9 —2га « х + ^1 = ‘™I--------------Й2-----j Произведём под интегралом замену, положив z2 о|ха —2г0102х + 4 И-2(1-га) а2а* Выражение для рс(х) при этом принимает такой вид: „ (х} = агазУТ^___________fe-^du = —. С « (°2 — 2г®1 °2Х + *1) J U Z3 ~ 2rs 132 v + °?) если, в частности, величины $ и т| независимы, то д(х)т-в^У9 -а-. к(®1 + 9&х > Плотность распределения величины С называется законом Коши.
§231 ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН 129 Пример 6. Распределение Стьюдента. Найти функ- цию распределения частного С = Е/т], где 5 и т] — независимые величины, причём $ распределено по нормальному закону -- паз3 *(*)-/£* а т] = —(см. пример 3), У п Согласно формуле (8') находим, что Плотность распределения вероятностей носит название закона Стьюдента (Стьюдент — псевдоним англий- ского статистика Госсета, впервые нашедшего этот закон эмпириче- ским путём). При п = 1 закон Стьюдента превращается в закон Коши. Пример 7. Поворот осей координат. По функции рас- пределения двумерной случайной величины ($, ц) найти функцию рас- пределения величин V = 8 cos а-|~ ц sin а, т/=2=—5 sin а—|—-q cosa. (9) Обозначим через Г(х, у) и Ф(х, у) функции распределения величин G, **0 и ($', •q,)> Если мы станем изображать ($, ц) и (S', ц') как 9 Зак. 1826. Б. В. Гнеденко.
130 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 прямоугольные координаты точки на плоскости, то легко видеть, что система осей ¥Оч\' получается из системы IjOiq путём поворота послед- ней на угол а. Мы ограничимся случаем 0 < а < у, предоставив читателю вывод аналогичных формул для остальных значений а. Так как при 0<а<-^ sina>0 и cosa>0, то мы легко на- ходим: Ф (х> У) =«P{lcosa-|-'i| sin a <х; — 5 sin а т] cos a < у } = «=Р{ В < xcosa—jrsina; т] < л sin a -J-у cos a } = = F{xcosa—у sin a; xsin acos a }. Отсюда дифференцированием получаем соотношение между плот- ностями „ (г _ дФ (х, у) = дР(х', у') к Iх» У)------дхду - дх,ду, “ = р(х cos а —у sin a; х sin a -|-у cos a). (Ю) Пример 8. Двумерная случайная величина (£, •/)) распределена по нормальному закону Найти плотность распределения случайных величин V «= 5 cos a -f- щ sin a, vf == — х 5 sin a -|- 7] cos a. Согласно равенству (10) те (л/, у') = р (х' cos a —у' sin a, xf sin a -\-y' cos a) = —--------U= exP I-----------------ГAx'2 — 2 Bx'y' 4- Cy'2ll, 2паха,/1 —1 2(1—r3) L Jl где обозначено л cos2 a ~ cos a Sin a . sin2 a X = —---------2r--------------------- °’ Vs °2 sin2 a — cos2 a COS a sin a D cos a sin a °1’2 sin3 a । n cos a sin a । cos3 a 1“+ : ' =‘ Из полученной формулы мы заключаем, что поворот осей переводит нормальное распределение в нормальное.
§ 24] ИНТЕГРАЛ СТИЛТЬЕСА 131 Заметим, что если угол а выбран так, что «а—М. то В = 0 и Ах'* ВуГй те (х', у') =---...... е . 2кз1а2 у 1 — г2 Это равенство означает, что любая нормально распределённая дву- мерная случайная величина путём поворота осей координат может быть приведена к системе двух нормально распределённых неза- висимых случайных величин. Этот результат может быть пере- несён на л-мерные случайные величины. Можно доказать более сильное предложение, исчерпывающе характеризующее нормальное распределение вероятностей. Пусть на плоскости имеется невырожденное (т. е. не сосредоточенное на одной прямой) распределение вероятностей. Для того чтобы это рас- пределение было нормальным, необходимо и достаточно, чтобы двумя различными способами можно было на плоскости выбрать оси ко- ординат SjOjg и такие, что координаты и $2, так же как и 7)2, рассматриваемые как случайные величины с заданным распре- делением вероятностей, были.бы независимы. § 24. Интеграл Стилтьеса Дальнейшее изложение существенно использует понятие интеграла Стилтьеса. Для облегчения изучения последующих параграфов мы приводим здесь определение и основные свойства интеграла Стилтьеса, не останавливаясь при этом на доказательствах. Предположим, что в интервале (а, Ь) определены функция /(х) и неубывающая функция F(x) с ограниченной вариацией. При этом мы для определённости будем предполагать,, что функция F(x) не- прерывна слева. Если а и b конечны, то разделим интервал (а, Ь) точками а == х0 < xt < х2 < ... < хп = b на конечное число частич- ных интервалов (х<, х<+х) и образуем сумму 4=1 где х4 — произвольное число, выбранное в сегменте х$). Ста- нем теперь увеличивать число точек подразделения, одновременно приближая длину максимального из частичных интервалов к нулю. Если при этом написанная выше сумма стремится к определённому пределу J= lim S (/(xj [F (x<)—Fto-J], (1) n->ooi=*l 9*
132 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 то этот предел называется интегралом Стилтьеса от функции / (х) с интегрирующей функцией /7(х) и обозначается символом ь J = J/(x)dF(x). (2) а Несобственный интеграл Стилтьеса, когда промежуток интегриро- вания бесконечен, определяется обычным путём: рассматривается интеграл по произвольному конечному интервалу (а, Ь); величины а и b произвольным образом заставляют стремиться к —оо и если при этом существует предел ь lim [/(x)rfF(x), —со J Ь->со а то этот предел называется интегралом Стилтьеса от функции /(х) по функции F(x) в промежутке (—оо, оо) и обозначается J*/(x)rfF(x). Можно доказать, что если функция f (х) непрерывна и ограничена, то предел суммы (1) существует, как в случае конечных, так и в случае бесконечных пределов интегрирования. В некоторых случаях интеграл Стилтьеса существует и для не- ограниченных функций f(x). Для теории вероятностей рассмотрение таких интегралов представляет значительный интерес (математическое ожидание, дисперсия, моменты и пр.). Заметим, что всюду в дальнейшем мы считаем, что интеграл от функции f(x) существует тогда и только тогда, когда суще- ствует интеграл от |/(х) | стой же интегрирующей функ- цией F (х). Для целей теории вероятностей важно распространить определе- ние интеграла Стилтьеса на тот случай, когда функция /(х) может иметь конечное или счётное множество точек разрыва. Можно дока- зать (см. В. И. Гливенко, Интеграл Стилтьеса, стр. 116), что всякая ограниченная функция, имеющая конечное или счётное множество точек разрыва, в частности, всякая функция ограниченной вариации, интегрируема при любой интегрирующей функции ограниченной вариа- ции. При этом требуется несколько видоизменить само определение интеграла Стилтьеса, именно, при образовании предела (1) надо рас- сматривать только такие последовательности подразделений интервала интегрирования на части, что каждая точка разрыва /(х) входит в число точек деления всех подразделений, за исключением, быть может, конечного числа их. Заметим, что при установлении пределов интегрирования важно указывать, включается в промежуток интегрирования или нет тот или
§ 24] ИНТЕГРАЛ СТИЛТЬЕСА 133 иной его конец. Действительно, из определения интеграла Стилтьеса мы получаем следующее равенство (символ а — 0 означает, что а включено в промежуток интегрирования, а символ а 4“ 0 —что а исключено из него): > п ~ • J /(x)rfF(x) = lim S/(xi)fF(x<)-F(x<_1)] = Zo n->0° «=i n - »«n S/&)l/7(x<)--/7(*<-t)]+ Пт /(x^F^)- n->oo i=2 ft -/W]= f /(x)dF(x)+/(a)[F(a + O)-F(a)]. Таким образом, если f (a) ^tO и функция F (x) имеет скачок при х — а, то ь ъ J /(x)dF(x)- f /(x)dF(x)=/(a)[F(a + 0)-F(a-0)]. a—0 a4-° Это обстоятельство указывает на то, что интеграл Стилтьеса, рас- пространённый на промежуток, сводящийся к одной точке, может давать отличный от нуля результат. Мы условимся в дальнейшем, если не будет сделано особой оговорки, правый конец промежутка исключать, а левый включать в интервал интегрирования. Это усло- вие позволяет написать следующее равенство: ь J </F(x) = F(£) —F(a). а В самом деле, по определению, ь п $dF(x)~ lim 2 [F(X<)-F(X<_1)]= lim [F (x„) - F (x0)] = J П->0О<ев1 П->ОО = F(6) —F(a) (напомним, что F(x), по определению, непрерывна слева и для неё, следовательно, F (р) = lim F(b — s)). «->0 В частности, если F(x) есть функция распределения случайной величины 6, то ь JrfF(x) = F(*) — F(a) = P{a<;<^, а b JdF(x) = F(d) = P{5<&}. —СО
134 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ [ГЛ. 4 Если F (х) имеет производную и является интегралом от нее, то из того, что по формуле конечных приращений F (х<) — F (xt _ J = р (х{) (х{ — Xi _,). где х<-в] <х^ < xi9 следует равенство & п J*/(х) dF (X) = lim 2 f(Xi) [F(Xi) - F(x^)] = J n~>ooi«=l G П ~ b «= lira 2 f (Xi) P (x<) (x{ — Xi _,) = f / (x) p (x) dx. a Мы видим, что в -этом случае интеграл Стилтьеса сводится к обыкно- венному интегралу. Если F (х) имеет скачок в точке х = с, то, выбрав подразделе- ния так, что при некоторых значениях индекса хл<с<хй+1, имеем: ь к f f (х) dF (X) = lim 2 /(*<) [F(x<) —F (x^)] + J n-»oo i = l a n +/(^)[F(xfc+1)-F(xft)]+lim 2 /(x<)[F(x<)-F(x<_1)] = n-> CO isssZc4* 3 0 b ^ff(x)dF(x)+ //(x)dF(x)+/(c)[F(c+0)-F(c-0)J. a c-M В частности, если изменение функции F(x) происходит только в точ- ках q, с2,..., сП9..., то & ОО f/(x)rfF(x)= 2 /(cn)[F(c„H-0) —F(cn —0)] J n=l G и интеграл Стилтьеса сводится к ряду. Перечислим основные свойства интеграла Стилтьеса, которые нам потребуются в дальнейшем. Доказательства этих свойств легко могут быть проведены читателем, исходя из определения интеграла Стилтьеса и пользуясь рассуждениями, используемыми в теории обычного инте- грала. 1. При а < Cj < с2<... <сп<Ь ь п с< + 1 f/(x)dF(x)= 2 f f{x)dF(x) [а~с* b^cn^]. J г«о J a
ИНТЕГРАЛ СТИЛТЬЕСА 135 § 24] 2. Постоянный множитель выносится за знак интеграла ъ ъ J с/ (х) dF (х) = с j /(х) dF (х). а а 3. Интеграл от суммы функций равен сумме их интегралов Ъ п п Ь f (x)rfF(x) = 5 f/<(x)rfF(x). а а 4. Если /(х) > 0 и 4 > а, то ъ f/(x)rfF(x)>0. а 5. Если F^x) и F2(x)—монотонные функции с ограниченным изменением, a и — произвольные постоянные, то ъ ь ъ j*/(x)rf[c1F1(x) + c2Fa(x)] = cI J/(x)dF1(x) + c3 J/(x)dFa (x). a a a to 6. Если F(x)» j* g(a) dO (и), где с—постоянное, g(u)—не- в прерывная функция и О (и) — неубывающая функция с ограниченным изменением, то ь ь f f (х) dF (х) == J / (х) g (х) dQ (х). а а Использовав понятие интеграла Стилтьеса, мы можем написать общие формулы для функции распределения суммы F (х) = J F, (х—г) dF2 (г) - J F2 (х- г) dFt (г) двух независимых слагаемых, а также частного оо О F(x) = J F, (xz) dFa (z) + J [1 — (хг)] dF2 (z) 0 — oo независимых случайных величин и в предположении, что Р{еа = 0}=0.
ГЛАВА 5 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН В предыдущей главе мы видели, что наиболее полная характе- ристика случайной величины даётся её функцией распределения. Действительно, функция распределения одновременно указывает на то, какие значения может принимать случайная величина и с какими вероятностями. Однако в ряде случаев о случайной величине тре- буется знать гораздо меньше, требуется получить о ней лишь неко- торое суммарное представление. Для теории вероятностей и её приложений большую роль играют некоторые постоянные числа, получаемые по определённым правилам из функций распределения случайных величин. Среди этих постоянных, служащих для получения общей количественной характеристики случайных величин, особенно важны математическое ожидание, дисперсия и моменты различных порядков. § 25. Математическое ожидание Начнём изложение с рассмотрения следующего схематического примера: предположим, что при стрельбе из некоторого орудия для поражения некоторой цели требуется один снаряд с вероятностью рь два снаряда — с вероятностью р2, три снаряда — с вероятностью р8 и т. д. Кроме того, известно, что п снарядов заведомо достаточно для поражения этой цели. Таким образом, известно, что Pi + Pa+ ••• +Рп=1> Спрашивается, сколько в среднем потребуется снарядов для пораже- ния указанной цели. Для ответа на поставленный вопрос будем рассуждать так. Предположим, что производится очень большое число стрельб в указан- ных выше условиях. Тогда на основании теоремы Бернулли мы можем утверждать, что относительное число стрельб, в которых для поражения цели потребовался только один снаряд, приблизительно равно рх. Точно так же два снаряда потребовалось приблизительно
§ 25) МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ 137 в ЮОр2°/о стрельб и т. д. Таким образом, «в среднем» напораже- ние одной цели потребуется приблизительно l-pi + 2-pa4- ... снарядов. Аналогичные задачи по подсчёту среднего значения случайной величины возникают в самых разнообразных задачах. Вот почему в теории вероятностей вводят в рассмотрение особое постоянное, носящее название математического ожидания. Мы сначала дадим определение для дискретных случайных величин, отправляясь от только что рассмотренного примера. Пусть «^2» • • •» • обозначают возможные значения дискретной случайной величины 5, а Ру Р* •••> Рп> - -- •—соответствующие им вероятности, оо Если ряд 2 хпРп сходится абсолютно, то его сумма назы- л=1 вается математическим ожиданием случайной величины $ и обозна- чается М£. Для непрерывных случайных величин естественным будет следую- щее определение: если случайная величина 5 непрерывна и р(х)— её плотность распределения, то математическим ожиданием величины 8 называется интеграл MS = j* хр (x)dx (1) в тех случаях, когда существует интеграл J | х | р (х) dx. Для произвольной случайной величины Е с функцией распределе- ния F (х) математическим ожиданием называется интеграл ME = JxdF(x). (2) Пользуясь определением интеграла Стилтьеса, мы можем дать простое геометрическое истолкование понятию математического ожи- дания: математическое ожидание равно разности площадей, заключённых между осью ординат, прямой у = 1 и кривой у = F (х) в интервале (О, 4” сю) и между осью абсцисс, кривой у = F (х) и осью ординат в промежутке (—со, 0). На черт. 15 соответствующие площади заштрихованы и указано, с каким знаком следует взять в сумме
138 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ. 5 каждую из площадей. Заметим кстати, что геометрическая иллюстра- ция позволяет математическое ожидание записать в таком виде: ме = - J>(x)dx + J(l — F(x))dx. (3) —оо О Сделанное замечание позволяет во многих случаях находить матема- тическое ожидание почти без вычислений. Так, для случайной вели- чины, распределённой по за- кону, указанному в конце § 21, математическое ожидание равно половине. Заметим, что среди рассмо- тренных нами ранее случайных величин, случайная величина, распределённая по закону Коши (пример 5 § 23), не имеет математического ожидания. Перейдём к рассмотрению примеров. Черт. 15. Пример1. Найти мате- матическое ожидание случай- ной ве^ ичины распределённой по нормальному закону (ж —а)8\ 2в» /• По формуле (2) находим, что Заменой z-^ —~ мы приводим вычисляемый интеграл к виду то МЬа. Мы получили важный результат, вскрывающий вероятностный смысл одного из параметров, определяющих нормальный закон: ла- раметр а в нормальном законе распределения равен математи- ческому ожиданию.
§ 25 J МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ 139 Пример2. Найти математическое ожидание случайной величины 5, равномерно распределённой в интервале (а, Ь). Имеем: И- J о — а 2 (у — а) л а Мы видим, что математическое ожидание совпадает с серединой ин- тервала возможных значений случайной величины. Пример 3. Найти математическое ожидание случайной вели- чины В, распределённой по закону Пуассона Р{В-Л}«=^ (*-0,1,2,..,). Имеем: СО ОО со tut V А v а <»*«*• . V Л*-1 мв—z^k- ы kl —ш- 2d(k—i)i= Л-=0 Л—1 -“-St-1 Если F(x]B) есть условная функция распределения для случай- ной величины 5, то интеграл М(В/В) = f xdF(x)B) (4) мы назовём условным математическим ожиданием случайной вели- чины 5 относительно события В. Пусть Bv В9, ..., Вп — полная группа несовместимых событий и F(xfB^ F(x)B^t ..F (х)В^— соответствующие этим событиям условные функции распределения величины Обозначим через Р (х) безусловную функцию распределения величины 5; по формуле полной вероятности находим, что В(х)= 2 Р (Вк) F (х/Вк). к—1 Это равенство совместно с (4) позволяет нам получить следующую формулу: мв« Др^мсе/вд которая, очевидно, может быть записана и иначе: МВ = М{М(В/В*)}. (5) Только что найденная формула во многих случаях значительно упрощает вычисление математических ожиданий.
140 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ величин [гл. 5 Пример 4. Рабочий обслуживает п однотипных станков, распо- ложенных прямолинейно на расстоянии а друг от друга (черт. 16). Считая, что рабочий обслуживает станки, подходя к ним в порядке к п очерёдности, найти средний о—-о——о—..о—о™ о»—о переход (математическое ожи- _ дание величины перехода) х____________________________между станками. ч Пронумеруем станки слева направо от 1-го до л-го и обо- значим через событие, состоящее в том, что рабочий находится у станка с номером k. Так как все станки по условию задачи однотипны, то вероятность того, что следующим станком, потребующим вни- мания рабочего, будет станок с номером /, равна — (1^/^л). ^е' личина перехода Л в этом случае равна Х(Л)_ ((A — i)a при ft>/, 4 | (/ — k) а при k < L По определению к п 1-1 г==&4-1 a (k(k— 1) . (и--£) (л--£ 4-1) п I 2 2 = £12 fe2 - 2 (п +-1)k+п (п +1М • Вероятность рабочему находиться у ft-го станка равна -i-, поэтому по формуле (5) находим, что п МХ== £-ЙН2*2-2(л+1)* + «(«+1)1. Известно, что и (и + 1) (2л +1) Й = 1 поэтому а{п\~Х) = т(1 +4 on о \ 1 п где 1='(п— 1)а означает расстояние между крайними станками.
§ 261 ДИСПЕРСИЯ 141 Математическим ожиданием я-мерной случайной вели- чины (Slf S2, ..., $Л) называется совокупность п интегралов ак ~ f J ••• J* (^1» •••> •••> хп) 33 J* х = где Ffc(x)—функция распределения величины Пример 5. Плотность распределения двумерной случайной ве- личины (?о 52) задана формулой (двумерное нормальное распределение) р (хп х2) == -^—^= ехр | — 2(1_г2) “ __2r(xi—д)(ха —Ь) . (xt —»)8Ц . ®1°2 ' $ JJ’ найти её математическое ожидание. По определению «I = J J* XiP (х„ х2) rfXi rfx2 = J XjPj (Xj) dxt и a2 = J* J* ^зР (*!» •’’з) dxZ « J* x2p2 (x2) dx2. В примере 2 § 22 мы видели, что '’w=^Fr"xp{- поэтому согласно, результатам примера 1 настоящего параграфа на- ходим, что 8^-» 61, и2 « Ь, Нам удалось выяснить вероятностный смысл параметров а и b также и для двумерного нормального распределения. § 26. Дисперсия Дисперсией случайной величины В называется математическое ожидание квадрата уклонения 5 от MS. Мы условимся дисперсию обозначать символом D5. Таким образом, по определению De = M(S —1№)3 = JxdFJx), . (1) о *) Мы не даём формального определения л-мерного интеграла Стилтьеса, во-первых, потому что фактически будем рассматривать только дискретные и непрерывные случайные величины и, во-вторых, потому что, по существу, для теории вероятностей нужна не общая теория интегралов Стилтьеса, а теория абстрактного интеграла Лебега (см. об этом подробнее — гл. I — моно- графии Гнеденко и Колмогорова «Предельные распределения для сумм, независимых случайных величин» 1949 г.).
142 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ величин (гл. 5 . где через (х) обозначена функция распределения случайной вели- чины ц = (Е— ME)2. Найдём связь между функцией F4(x) и функ- цией распределения F$(x) величины Е. Имеем: Р^(х) = 0 при х<0, а при х > О ад = РЬ<х} = Р{(Е-МЕ)*<х} = = Р{—]/х<Е—МЕ< ]/х} = Р{МЕ — /х<Е<МЕ+]/^} = = Fe (ME + /х)—Ft (ME — Ух 0). Формула (1) переписывается так: DE = J xd[Fe(МЕ-Ь/х) -Fe(ME — рх + 0)] = о = /xdF5(ME+/x) —J° xd/VME—/х4-0). О о В первом интеграле произведём замену z = MS -j- V~x, а во втором — замену £==М;—Ух, в результате J X dFK (ME + Vx) = J (х — ME)8 dFi (x), 0 Ms ©о ме J XdPK (ME — Vx+0)— — j*(x—ME)8rfFe(x). 0 —co Таким образом, DE = /(x —ME)8^(x). (2) Так как (x —ME)8 = x8—2xME-j-(ME)9 и ME =J zdF^z), то формула (2) может быть записана иначе DE«Jx8rfFs(x) —(/х^(х))’ = МЕ8—(ME)8. (3) Так как дисперсия является неотрицательной величиной, то из последнего соотношения мы выводим, что J х8^(х)>(/х^(х))’. Это неравенство представляет собой частный случай известного неравенства Буняковского-Коши.
§ 26] ДИСПВРСИЯ 143 Подобно математическому ожиданию дисперсия существует не для всех случайных величин. Так, рассмотренный нами ранее (пример 4 § 23) закон Коши не имеет конечной дисперсии. Рассмотрим примеры вычисления дисперсии. Пример 1. Найти дисперсию случайной величины 5, равномерно распределённой в интервале* (а, Ь). В нашем примере ь pdFc(x) = J 7 J b — a Ъ(Ь — а) 3 а В предыдущем параграфе было найдено ме = ^. Таким образом, • rv— а* + аЬ + & (а + Ъ\* (Ъ — а)* U'~ 3 \ 2 ) “ 12 ’ Мы видим, что дисперсия зависит только от длины интервала (а, Ь) и является возрастающей функцией длины. Чем больше интервал зна- чений, принимаемых случайной величиной, т. е. чем больше рассеяны её значения, тем больше дисперсия. Дисперсия, таким образом, играет роль меры рассеяния (разбросанности) значений случай- ной величины около математического ожидания. Пример 2. Найти дисперсию случайной величины распре- делённой по нормальному закону р (х) === —ехр {----- ' а I 2’’ I Мы знаем, что М? = а, поэтому D£= I (х— a)2p(x)dx = —==- I (х — а)®е 2®а dx. J J Произведём под интегралом замену переменных, положив при этом <2 /• __2? D£ = -4= I 2 dz. Интегрированием по частям находим, что °? _£ £ ____________________________________________ J г2 е 2 de — | — ze 4 J е 2 de == У2?t. —оо Таким образом, окончательно DS = a8
144 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН (ГЛ. 5 Мы выяснили, таким образом, вероятностный смысл второго па- раметра, определяющего нормальный закон. Мы видим, что нор- мальный закон распределения полностью определён математи- ческим ожиданием и дисперсией. Это обстоятельство широко используется в теоретических изысканиях. Заметим, что и в случае нормально распределённой случайной величины дисперсия позволяет судить о рассеянии её значений. Хотя при любых положительных значениях дисперсии нормально распре- делённые случайные величины могут принимать все вещественные значения, всё же рассеяние значений случайной величины будет тем меньше, чем меньше дисперсия; при этом вероятности значений, близких к математическому ожиданию, будут больше. Это обстоя- тельство было отмечено нами в предыдущей главе при первоначаль- ном знакомстве с нормальным законом. Пример 3. Найти дисперсию случайной величины X, рассмотрен- ной в примере 4 § 25. Сохранив обозначения примера 4, находим, что л п S (/-й)2а8) = “ £ ; А(2£—1)Н«—^)(«—Ж)(2«—2Н-1)1а «.£[6^-6 (в+ 1)* + (2л + 1) (л+ l)j и, следовательно, я = ^-[«(»+l)(2«+l)-3(n+l)an + + п (п + 1) (2л +1)]. 4 Отсюда следует, что D (А) = М (Х*)-(МХ)8 = (л9-1) - Д*(Лд^-1)а = а’(л2 — 1)(л2 + 2) Р (. । 2 , 1 , 2 \ ~ 18л2 ~ 18 V 'Т’л— 1 "Т" л (л — 1) ТП!(Я_ 1)/ Дисперсией л-мерной случайной величины (5(, $2, называется совокупность л9 постоянных, определяемых формулой J" J* ’ ' • J* Xg, . xn) (!<*<«, !</<»). (4)
§ 26] ДИСПЕРСИЯ, 145 Так как при любых вещественных fy(l </<») п п п J* • • • J М*/)| dF (•*!> *2» • • • > хп) У] zEj bjktyk^ 0> j= 1Ы то, как известно из теории квадратичных форм, величины bjk удо- влетворяют неравенствам ^11 ^12 • • • ^21 ^22 • • • ^2fc Ьк1 &к2 • • • &кк >0 при & ===== 1, 2, .. п. Очевидно, что &кк ~ D?fc. Величины bjk при k ф] называются смешанными центральными моментами 2-го порядка величин^- и Кк, очевидно, что Следующая функция от моментов второго порядка г______ носит название коэффициента корреляции между величинами и Еу. Коэффициент корреляции является мерой силы связи (линейной связи) между величинами Е< и Еу. Величина коэффициента корреляции, как это следует из неравенства Буняковского, заключена в пределах (-1,+1). Значения ztl достигаются только в случае, когда $ и т| связаны линейной зависимостью. В дальнейшем мы увидим, что для независимых величин коэф- фициент корреляции равен нулю. Пример 4. Найти дисперсию двумерной случайной величины Gp U> распределённой по невырожденному нормальному закону Р (*. У) — 2Л,19,ут'_г« X 1 f(x — а)’ 2(1-г*) [ 2r (х — а) (у — Ь) , (у-6)Л ’1’а ~Г J’ 4 Согласно формуле (4) и результатам примера 2 настоящего па- раграфа и примера 1 § 25, находим, что DEa = a*« 10 Вак. 1826. В. В. Гнеденко.
146 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН [гл. 5 Далее = aai = J J* (х — а)(у — Ь)р (х, у) dx dy => (у-Ы 1_______________ Г 2а* ~2я.х,аут^Г X J*(х-а) (^-^)ехр{-2jnz75)(^r-r^T}rfx- Заменой г---------------* у 1 - г2 \ Oi а2 / а2 выражение для £1а приводится к виду йм = />й1 = J- J |* (01аа /1 — r2te -}- rap^2) е 2 2 dzdt = = J dt J e~* dz + X X J to 2 dt J ze 2 dz=* rojOj. Отсюда находим, что г . / = м(е1-ме1)(еа-м£г) <Jia2 V D^D^2 Мы видим, что двумерный нормальный закон, так же как и одномерный, полностью определяется заданием математического ожидания и дисперсии, т. е. определяется заданием пяти величин м?р ме2, Dip di2 и г. § 27. Теоремы о математическом ожидании и дисперсии Теорема 1. Математическое ожидание постоянной равно этой постоянной. Доказательство. Постоянную С мы можем рассматривать как дискретную случайную величину, которая может принимать только одно значение С с вероятностью единица; поэтому МС=С.1 = С Теорема 2. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий-. М(1 + Ч)“М1+М^
§ 27] ТЕОРЕМЫ О МАТЕМАТИЧЕСКОМ ОЖИДАНИИ И ДИСПЕРСИИ 147 Доказательство. Рассмотрим сначала случай дискретных случайных величин Е и т). Пусть av ...» ап, ...—возможные значения величины Е и pv р2, ..., рп, ...—их вероятности; Ьи Z>2, ...» Ьк, ... — возможные значения величины г) и qp q2iqk, ... — вероятности этих значений. Возможные значения величины $ имеют вид + п== 1> 2, ...). Обозначим через рпк вероятность того, что $ примет значение ani а ц — значение Ьк. По определению мате- матического ожидания MG4“71)S== 2 (ап+ Ьк)Рпк~ 5 2 (ап + &к) Рпк — п, 7с= I п==г1 & = 1 со оо оо оо = 2 ап (2 P»k)+ 2 ^4 (2 Рпк)* п=1 £«=1 Л = ! П=1 Так как по теореме о полной вероятности оо оо 2 Рпк*^ Рп и 2 Рпк~ tfkf &=1 п=1 ТО оо со оо • 2 2 Рпк = 2 апРп = Ms П~1 /=1 И 2 bk (2 рПк) = 2 (Wk = м-п. fc==l п=1 Л==1 Доказательство теоремы для случая дискретвых слагаемых завер- шено. Точно так же в случае, когда существует двумерная плотность распределения р(хуу) случайной величины (5, tj), по формуле (3) § 23 находим: МС== М ($ + ^) = РxdFt (х) = J р(?)Х — z)dz^dx^ ~=Hxp(z ,х — z}dzdx — j* j* (z -j-У) P (z, У) dz dy =» = J J zp(z,y)dzdy-{- J J yp (z,y) dz dy ==* = / m (z) dz + jyp^ (y) dy = MS 4- Miq. В общем случае теорема 2 будет, доказана нами в дополнении 1. Следствие 1. Математическое ожидание суммы конечного числа случайных величин равно сумме их математических ожи- даний. М Gi 4- 5» + • • •+и - MSj 4- MS, 4-... 4- мей. ю*
148 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ. 5 Действительно, в силу только что доказанной теоремы М(51 + е9+... + и = м$1я-М(5а+58+... + и = = M^ + IMa+M Gb+ ... +U“... -мн M£a+... 4- М;„. Следствие 2. Математическое ожидание суммы ^ = ^4-^4“ ••• 4-^ где р — случайная величина, принимающая лишь целочисленные значения, случайные величины Ер ?2, ... не зависят от р, мате- матическое ожидание р конечно и ряд 2 м|МР{н>*} сходится, существует а равно м^2му»{р>д Доказательство. Действительно, условное математическое ожидание, при условии, что у. = k, равно м{с^=^} = ме1+ме9+>.. + мел. Безусловное математическое ожидание оо оо к мси~2мм*=*}-Р{р==*}= 2р{н=*} 2 ме,= А=Х j=l ₽ 2м^ 2р W = 2 му» {н >j\. ;=1 A==J ;==1 Если слагаемые $2, £3, ... одинаково распределены, т. е. если Р {^1 < *} == Р {^2 < Х} = • • • e F (*)< Т0 Действительно, m<l= 2 р{р = а} 2меу«=м11 2*р{н = ^! = М;1-м!л. г /г—1 /=1 к=\ Пример 1. Число космических частиц, попадающих на данную площадку, есть случайная величина р, подчинённая закону Пуассона с параметром а, каждая из частиц несёт энергию зависящую от случая. Найти среднюю энергию S, получаемую площадкой в единицу времени. Согласно следствию 2 имеем: м8==м£-мр = яме.
§ 27J ТЕОРЕМЫ О МАТЕМАТИЧЕСКОМ ОЖИДАНИИ И ДИСПЕРСИИ 149 Пример 2. По некоторой цели стрельба введётся до л-го попа- дания. Считая, что выстрелы производятся независимо друг от друга и вероятность попадания при каждом выстреле равна р, найти мате- матическое ожидание расхода снарядов. Обозначим через 1к число снарядов, потраченных от (4—1)-го до &-го попадания. Очевидно, что расход снарядов на п попаданий равен + ^2 4” • • • “Нп и, следовательно, МЕ=м£+ме9+... + МЕЛ. Но М$1==М^-...-М5п и 1-0 следовательно, М? = £. Теорема 3. Математическое ожидание произведения неза- висимых случайных величин $ и т] равно произведению их мате- матических ожиданий. Доказательство. Если величины S и ц дискретны; а*, ..., ак, ... —возможные значения £ и pt, р2, ..., рк, ... — вероят- ности этих значений; Ьъ Ьъ ..., bw ... —возможные значения т] и ^2> • •., Qn> • • • — вероятности этих значений, то вероятность того, что Е примет значение ай, а т] — значение bw равна pkqn. По опре- делению математического ожидания 00 оо Mfy = s «кЬпРкЧп =22 akbnpkqn = к, п оо оо = (S ЯкРк) ( S = М;Мт1. Лишь немногим сложнее доказательство для случая непрерывных величин, провести его мы предоставляем читателю. Доказательство теоремы в общем случае мы отложим до допол- нения 1. Следствие 1. Постоянный множитель можно выносить за знак математического ожидания МСЕ = <?МЕ. Это утверждение очевидно, так как, каково бы ни было Е, постоян- ное С и величину Е можно рассматривать как независимые величины.
150 / ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ величин [гл. 5 Теорема 4. Дисперсия постоянного равна нулю. Доказательство. Согласно теореме 1, DC = М (С— МС)2 = М (С— С)2 = МО = 0. Теорема 5. Если с — постоянное, то DcS = c2DS. Доказательство. В силу следствия из теоремы 3 Del = М kS — McS]2 = М kS — с MS]2 = = Мс2 [5 — MS]2 = с2М [S — MS]2 = c2DS. Теорема 6. Дисперсия суммы независимых случайных вели- чин ; и т] равна сумме их дисперсий D(S4-7i) = DS + Diq. Доказательство. Действительно, d (t+ч) ~ м it+ч—м (t+ч)]® - м кь- мо+(ч—м-q)!9= = Dt -|- D4 + 2М (5 — МВ) (ч—Мч). Величины t и т] независимы, поэтому независимы также величины t—М; и т] — Мт]; отсюда M(t — М5)(Ч — M7]) = M(t — МО М(т] — Мт]) = 0. Следствие 1. Если tn t2, . • •, t„ — случайные величины, каждая из которых независима от суммы предыдущих, то D(0H-t2+...4-U = Dt1 + Dt2+... + Dt„. Следствие 2. Дисперсия суммы конечного числа попарно не- зависимых случайных величин 5lt S2, ...» Sw равна сумме их дис- персий. Доказательство. Действительно, D (0 + 0 + • • • + W = М£2 М^)2 == - м S St(tfc - ми (О- МО) = ДД М & - MW (О - МО) « = S Dt*+ s M(O-MW(0-M0). Й=1 Из независимости любой пары величин tft и 0 (6 Ф J) вытекает, что при k ф j M(O-MW(0-M0) = o. Этим, очевидно, доказательство завершено.
§ 27] ТЕОРЕМЫ О МАТЕМАТИЧЕСКОМ ОЖИДАНИИ И ДИСПЕРСИИ 181 Пример 1. Нормированным уклонением случайной величины называется отношение Доказать, что Действительно, t и ME, рассматриваемые как случайные величины, независимы, поэтому в силу теорем 5 и 6 D ( « PL+PbMil _ 2! _ L К /DE / DE De Пример 2. Если 5 и tj— независимые случайные величины, то D(t—7j) = De + Dvi. Действительно, в силу теорем 6 и 7 D (— tj) = (— I)9 D?) == Щ и DG —v)) = DB + Dvj. Пример 3. Теоремы 2 и 6 позволяют весьма просто вычислять математическое ожидание и дисперсию числа у наступлений события А при п независимых испытаниях. Пусть рк есть вероятность появления события А при £-м испы- тании. Обозначим через у* число появлений события А при fe-м испыта- нии. Очевидно, что уЛ есть случайная величина, принимающая зна- чения 0 и 1 с вероятностями qk*=l—pk и pk соответственно. Величина у., таким образом, может быть представлена в виде суммы Р = н + и-2++ Так как М|*к =» 0 • 1 • Рк — Рк и / М[4~(Mpfc)2= о . qk-\-1 • рк—р1 = рк(1 — рк) = pkqk, то доказанные теоремы позволяют заключить, что Мцвр14-ра4-...+Л, и Dp. =М+ • • • + РпЧп' Для случая схемы Бернулли рк^р и, следовательно, и Dp = /zp<7. Заметим, что отсюда Л г л п
152 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ величин [гл. 5 § 28. Моменты Моментом k-го порядка случайной величины $ называется мате- матическое ожидание величины (В— а)л: Ма) = М(Е— a)*. (1) Если а = 0, то момент называется начальным. Легко видеть, что начальный момент первого порядка есть математическое ожидание величины 5. Если а — ME, то момент называется центральным. Легко видеть, что центральный момент первого порядка равен нулю, а центральный момент второго порядка есть не что иное, как дисперсия. Начальные моменты мы станем обозначать буквой vb а централь- ные— буквой указывая в обоих случаях нижним индексом порядок момента. Между центральными и начальными моментами существует простая связь. Действительно, =м g—моп - S <- ме* - 2ci(- ъ (2) k^Q Так как Vi а® ME, то П—2 S (3) Л=0 Выпишем эту связь между моментами для первых четырёх значений л: Hi — H2eV2 — (3') H3 = V8—3Vl + 2vl’ Hi — 4 ~ 4v8Vj 4- 6v2v? — 3vt Этй первые моменты играют особо важную роль в статистике. Величина Wfe=M|E — а\* (4) носит название абсолютного момента А-го порядка. Согласно определению математического ожидания М (Е—а)11 должно вычисляться по формуле •'k(a) = f xdG(x), (Г) где О (х) обозначает функцию распределения величины (Е— а)Л. Однако при действительных расчётах предпочитают пользоваться другой формулой: *л (в) — / (* — а)* dF (*)> (б)
МОМЕНТЫ 153 § 28] где F (х) — функция распределения величины В. Для того чтобы фор- мулы (1') и (5) не противоречили друг другу, необходимо, чтобы имели место равенства J* х dG (х) — j* (х — a)» dF (х). Докажем, что это действительно так. Если б—нечётное число, то (5 — a)ft — неубывающая функция В и поэтому G(x) —Р{(; —a)R<x} = P{$ —а< Vx) == == Р (I < а + fa} = F (a -f- |/х). При нечётном таким образом, М($ — f xdF(a + fa). Нетрудно подсчитать, что заменой г = а 4~ fa мы приводим этот интеграл к виду (5). Если же k — чётное, то (? — a)fc есть неотрицательная величина и, следовательно, G(x) = O при х-^0. При х>0 О(х) = Р {(5 —а)» < х} = Р {а—fa <5 < а4- fa} » = F (а 4-Vх) — F(a—|/х4"0)« Таким образом, при чётном k М(Е— «)*=» JxdF(а-f-V*) — JxdF(a — j/x-|-O). о о Заменами z = a-^j/x в первом интеграле и z*= а — ]/х — во втором мы приводим М(Е— а)к к ВИДУ (5). Мы доказали частный случай следующей теоремы, которая будет доказана в дополнении 1. Теорема 1. Если F(x)— функция распределения величины Е, /(х)—непрерывная функция, то W®~$f(x)dF(x). Так как мы условились считать, что случайная величина Е имеет математическое ожидание только в том случае, когда изображающий его интеграл абсолютно сходится, то ясно, что момент &-го порядка у величины Е существует тогда и только тогда, когда сходится интеграл Jlx|MFt(x).
154 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ величин [гл. 5 Из этого замечания следует, что если случайная величина 5 имеет момент 6-го порядка, то она имеет также моменты всех положитель- ных порядков, меньших чем k. В самом деле, так как при |х |*>|х |г, если |х|> 1, то J|xrdFt(x)- J |хГ^(х)+ / |жГ4П(ж)< 1»|>1 < J |х|^Л(х)+ J |х|МЛ(х). |«|<1 |®|>1 Первый интеграл в правой части неравенства конечен в силу конечности пределов интегрирования и ограниченности подинтеграль- ной функции, второй интеграл сходится в силу предположения. Пример. Найти центральные и центральные абсолютные моменты случайной величины, распределённой по нормальному закону Р«=.-Й“Р{-^}- Имеем: Р* = .-у® /(х - “>* «Р { - 'т } ^ = Д J Л"Т dx- При k нечётном, в силу нечётности подинтегральной функции, При k чётном Рк = О. Подстановкой х2 = 2г мы приводим этот интеграл к виду /"5- *=1 f *z2 Н = «*— у -о*2 3 J z 2 О При k нечётном абсолютный момент равен тк = т/-! e*Jdx = | °*2 V г (1+2) =. О
МОМЕНТЫ 155 >0 (А = 1, 2, .... л). § 281 Моменты функций распределения не могут быть произвольными величинами. Действительно, каковы бы ни были постоянные t0, tit.... tn, квадратичная форма Jn = f (S h (X-a)*)*dr (x) = 2 2 vk+y (a) Ki> 0 неотрицательна; поэтому первые vy(a) должны удовлетворять следую- щим неравенствам: v0(a) vt(a) ... vi(«) *a(a) ••• vs(a) ^+i(a) ••• vaft(n) Аналогичным неравенствам подчинены и абсолютные моменты. Относительно абсолютных моментов мы докажем ещё следующую теорему. Теорема 2. Если случайная величина $ имеет абсолютный момент порядка ky то при любых t и т (0 < / < т < k) где обозначено Щ ==» М | $ — а [*, а — любое вещественное число. Доказательство. Докажем сначала теорему для того случая, когда t9 т и k — рациональные числа. Пусть для определённости причём по предположению теоремы p<s < и. Пусть теперь г — какое-нибудь целое положительное число, меньшее чем и. Рассмотрим неотрицательную квадратичную форму г г-1 г+1-12 /nr_iK24- т^уи2 = j [и 1X12« +*'1*1 2q J dF(x). a a e J Условие её неотрицательности состоит, как известно, в том, что з т г 4^, nir—1 • 1. ~ ~1~ Это неравенство, очевидно, может быть записано и в таком виде: 2r Т Т т—1 * я ~я~ ~я~
156 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН [ГЛ. 5 Если придать г последовательно значения от 1 до г, то мы полу- чим последовательность неравенств 7 1 2«2 2.3 <^1^3, 7 7 7 2г Г Г /Ду -5^ 1 ~ ~ Заметив, что всегда «о=1» перемножив выписанные неравенства и произведя сокращения, мы приходим к неравенству « <? Таким образом, 1 JL «л -Л 4-1 /Мг4-1 • 7 7 или же 1 ~/4-i ^г4-1 * 7 7 Это неравенство доказывает, очевидно, теорему в случае /, т и k рациональных. Так как функция mt непрерывна относительно аргумента t в об- ласти 0 t ky то предельным переходом мы убеждаемся в пра- вильности теоремы при любых Z, т и k. Заметим, что в только что доказанной теореме содержится сле- дующее важное свойство моментов: 11 1 1 of < ••• of В примерах предыдущих параграфов два первых момента случай- ной величины полностью определяли её функцию распределения, если только заранее известен вид этой функции (так это имело место для распределений нормального, Пуассона, равномерного и др.). В математической статистике играют значительную роль законы рас- пределения, зависящие от большего чем два числа параметров. Если заранее известно, что случайная величина подчинена закону вполне определённого вида, но неизвестны лишь значения параметров, то эти неизвестные параметры в важнейших случаях определяются через первые моменты. Если же нам неизвестно, к какому виду принадле-
МОМЕНТЫ 157 § 28] жит функция распределения, то» вообще говоря, не только знание одних первых, но и знание всех целочисленных моментов не даёт возможности определить неизвестную функцию распределения. Ока- зывается, можно построить примеры различных функций распределе-' ния с одинаковыми моментами всех целочисленных порядков. В связи с этим возникает вопрос (проблема моментов): дана после- довательность постоянных чисел с0 = 1, Ср • • • > 1) при каких условиях существует такая функция распределения Г (х), для которой при всех п имеют место равенства сй= JxMF(x); 2) когда эта функция единственна? В настоящее время эта задача получила полное решение, мы не останавливаемся на нём, так как оно стоит в стороне от назначения нашей книги. Среди прочих числовых характеристик наиболее существенную роль играют так называемые семиинварианты; их определение мы отложим до главы 7, сейчас же отметим только следующее. При сложении независимых случайных величин момент суммы, вообще говоря, не равен сумме моментов слагаемых. Для момента суммы независимых слагаемых $ и т] имеет место равенство к==0 Семиинварианты различных порядков обладают тем свойством, что при сложении независимых слагаемых семиинвариант суммы равен сумме семиинвариантов слагаемых того же порядка. Оказы- вается, что семиинвариант любого порядка k есть рациональная функция моментов порядков, меньших или равных А.
ГЛАВА6 ЗАКОН БОЛЬШИХ ЧИСЕЛ § 29. Массовые явления и закон больших чисел Огромный опыт, накопленный человечеством, учит нас, что явле- ния, имеющие вероятность, весьма близкую к единице, почти обя- зательно происходят. Точно так же события, вероятность наступле- ния которых очень мала (иными словами, очень близка к нулю), наступают очень редко. Это обстоятельство играет основную роль для всех практических выводов из теории вероятностей, так как указанный опытный факт даёт право в практической деятель- ности считать мало вероятные события практически невоз- можными, а события, происходящие* с вероятностями, весьма близкими к единице, практически достоверными. При этом на вполне естественный вопрос, какова должна быть вероятность, чтобы мы могли событие считать практически невозможным (практи- чески достоверным), однозначного ответа дать нельзя. И это понятно, так как в практической деятельности необходимо учитывать важность тех событий, с которыми приходится иметь дело. Так, например, если бы оказалось, что при измерении расстояния между двумя се- лениями оказалось, что оно равно 5340 м и ошибка этого измерения с вероятностью 0,02 равна или меньше 20 л/, то мы можем пре- небречь возможностью такой ошибки и считать, что расстояние действительно равно- 5340 м. Таким образом, в нашем примере мы считаем событие с вероятностью 0,02 практически несущественным и в своей практической деятельности его не учитываем. В то же время в других случаях пренебрегать вероятностями 0,02 и даже ещё меньшими нельзя. Так, если при строительстве большой гидро- электростанции, требующей огромных материальных затрат и чело- веческого труда, выяснилось, что вероятность катастрофического паводка в рассматриваемых условиях равна 0,02, то эта вероятность будет сочтена большой и при проектировании станции она должна быть учтена, а не отброшена, как это было сделано в предыдущем примере. Таким образом, только требования практики могут нЯм подсказать критерии, согласно которым мы будем считать те или иные события практически невозможными или практически достовер- ными.
§ 29] МАССОВЫЕ ЯВЛЕНИЯ И ЗАКОН КОЛЬШИК ЧИСЕЛ 159 В то же время необходимо заметить, что любое событие, имею- щее положительную вероятность, как <бы мала ни была эта вероят- ность, может произойти, и если число испытаний, в каждом из кото- рых оно может произойти с одной и той же вероятностью, очень велико, то вероятность хотя бы однократного его появления может стать сколь угодно близкой к единице. Это обстоятельство постоянно следует иметь в виду. Однако если вероятность некоторого события очень мала, то чрезвычайно трудно ожидать его появления в каком- либо заранее определённом испытании. Так, если некто утверждает, что при первой же раздаче карт между четырьмя парт- нёрами каждый получит карты только одной масти, то естественно заподозрить, что при раздаче руководствовались каким-то опреде- лённым . соображением, например, расположили карты в опреде- лённом, известном сдающему, порядке. Эта наша уверенность осно- вывается на том, что вероятность такой раскладки при хорошей тасовке равна (9!)*4!/361 < 1,1 vl0~18, т. е. чрезвычайно мала. Тем не менее однажды факт такой раскладки карт был зарегистрирован. Этот пример достаточно хорошо иллюстрирует различие между по- нятиями практической невозможности и невозможности, так сказать, категорической. Из сказанного понятно, что в практической деятельности, да и в общетеоретических задачах, большое значение имеют события с вероятностями, близкими к единице или нулю. Отсюда становится ясным, что одной из основных задач теории вероятностей должно быть установление закономерностей, происходящих с вероятностями, близкими к единице; при этом особую роль должны играть законо- мерности, возникающие в результате наложения большого числа независимых или слабо зависимых случайных факторов. Закон боль- ших чисел является одним из таких предложений теории вероят- ностей и при том важнейшим. Под законом больших чисел теперь было бы естественно понимать всю совокупность предложений, утверждающих с вероятностью, сколь угодно близкой к единице, что наступит некоторое событие, зави- сящее от неограниченно увеличивающегося числа случайных событий, каждое из которых оказывает на него лишь незначительное влияние. Это общее представление о теоремах типа закона больших чисел можно сформулировать и несколько определённее: пусть дана после- довательность случайных величин ... (И Рассмотрим случайные величины являющиеся некоторыми за- данными симметрическими функциями от первых п величин последо- вательности (1):
160 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. 6 Если существует такая последовательность постоянных ai9 аа, . ..., что при любом е>0 Пт Р||Св-в.|<.)-1, (2) П->ОО то последовательность (1) подчиняется закону больших чисел с за- данными функциями /я. Обычно, однако, в понятие закона больших чисел вкладывается гораздо более определённое содержание. А именно, ограничиваются тем случаем, когда /п есть среднее арифметическое вели- чин Если в соотношении (2) все величины ап равны одной и той же величине а, то говорят, что случайные величины Сп сходятся по вероятности к а. В этих терминах соотношение (2) означает, что — ап сходится по вероятности к нулю. Наблюдая единичные явления, мы наблюдаем их вместе со всеми их индивидуальными особенностями, затемняющими проявление тех закономерностей, которые имеют место при наблюдении большого числа аналогичных явлений. То, что факторы, не связанные с суще- ством всего процесса в целом, а проявляющиеся только в единичных его осуществлениях, при рассмотрении среднего из большого числа наблюдений взаимно погашаются, было замечено ещё давно. Позднее этот эмпирический результат отмечался всё чаще и чаще и притом, как правило, без попытки найти его теоретическое объяс- нение. Впрочем, такое объяснение многим авторам и не требовалось, так как наличие закономерностей как в явлениях природы, так и в общественных явлениях для них было не чем иным, как проявле- нием правил божественного порядка. Некоторые авторы до сих пор обедняют содержание закона боль- ших чисел и даже искажают его методологическое значение, сводя его попросту к наблюдающейся на опыте закономерности. На самом же деле непреходящая научная ценность исследований Чебышева, Маркова и других исследователей в области закона больших чисел состоит не в том, что они подметили эмпирическую устойчивость средних, а в том, что они нашли те общие условия, выполнение которых обязательно влечёт за собой статистическую устойчивость средних. В связи с этим нельзя не напомнить следующее основное поло- жение материалистической диалектики: «Мышление, восходя от кон- кретного к абстрактному, не отходит, если оно правильно, от истины, а подходит к ней. Абстракция материи, закона природы, абстракция стоимости и т. д., одним словом все научные (правильные, серьёз- ные, невздорные) абстракции отражают природу глубже, полнее, вернее. От живого созерцания к абстрактному мышлению и от него к практике — таков диалектический путь познания истины, познания
§ 30] ЗАКОН БОЛЬШИХ ЧИСЕЛ В ФОРМЕ ЧЕБЫШЕВА 161 объективной реальности». (В. И. Ленин, Философские тетради, стр. 146, ОГИЗ, 1947 г.) । История закона больших чисел не составляет исключения в этом | общем пути познания истины. в Для иллюстрации действия закона больших чисел приведём сле- I дующий схематический пример. По современным физическим воззре- ниям любой газ состоит из огромного количества отдельных ча- стиц, находящихся в непрестанном хаотическом движении. Про каждую отдельную молекулу нельзя предсказать, с какой скоростью она будет двигаться и в каком месте она будет находиться в каждый I данный момент времени. Однако мы можем рассчитать при опреде- лённых условиях, в которых находится газ, долю тех молекул, кото- рые будут двигаться с заданной скоростью, или долю тех из них, которые будут находиться в заданном объёме. Но, собственно, именно это и нужно знать физику, так как основные характеристики газа—давление, температура, вязкость и пр.— определяются не замысловатым поведением одной молекулы, а их совокупным дей- ствием. Так, давление газа' равно суммарному воздействию молекул, 1 ударившихся о пластинку площади единица за единицу времени. 1 Число ударов и скорости ударившихся молекул меняются в зависи- I мости от случая, однако в силу закона больших чисел (в форме g Чебышева) давление должно быть почти постоянным. Это «уравни- I вающее» влияние закона больших чисел в физических явлениях ’ обнаруживается с исключительной точностью. Достаточно вспомнить, I что, скажем, в обычных условиях даже очень точные измерения I с трудом позволяют отметить уклонения от закона Паскаля о давле- * нии жидкости. Противникам молекулярного строения материи это чрез- мерно хорошее совпадение результатов теории с опытом даже служило своеобразным аргументом: если бы материя имела молекулярное строе- ние, то наблюдались бы и уклонения от закона Паскаля. Эти укло- I нения, так называемые флюктуации давления, действительно удалось . наблюдать, когда научились изолировать сравнительно небольшие количества молекул, в результате чего влияние отдельных молекул ещё не полностью нивелировалось и оставалось ещё достаточно силь- ным. § 30. Закон больших чисел в форме Чебышева Мы перейдём теперь к формулировке и доказательству теорем Чебышева, Маркова и др.; употребляемый при этом метод принадле- жит Чебышеву. Неравенство Чебышева. Для любой случайной величины 5, ’ имеющей конечную дисперсию, при каждом е>0 имеет место нера- 1 венство Р{I?-. (1) П Зак. 1826. Б. В. Гнеденко.
162 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. б Доказательство. Если F (х) обозначает функцию распреде- ления случайной величины 5, то ясно, что Р{|$ — М5|>3}= / dF(x). Так как в области интегрирования 1-у—М g| t то J f (х —ме)а^(х). мс|>8 |ш—ме|>« Мы только усилим это неравенство, распространив интегрирование на все значения х 1ж— Неравенство Чебышева доказано. Теорема Чебышева. Если £lt $2, ..5П, ... —последова- тельность попарно независимых случайных величин, имеющих конечные дисперсии, ограниченные одной и той же постоянной DSjCC, D$a<C, ...» D?n<C, ...» то, каково бы на было постоянное е > О, п п Л=»1 Zc=l Доказательство. Мы знаем, что в условиях теоремы п п Л==1 А-=1 и, следовательно, к=Л Согласно неравенству Чебышева
§30] ЗАКОН БОЛЬШИХ ЧИСЕЛ В ФОРМЕ ЧЕБЫШЕВА 163 Переходя к пределу при п-> со, получаем, что lim р{ П->00 1 ’ п п А так как вероятность не может быть больше единицы, то отсюда и следует утверждение теоремы. Мы отметим некоторые важные частные случаи теоремы Чебы- шева. 1. Теорема Бернулли. Пусть р. — число наступлений со- бытия А в п независимых испытаниях и р есть вероятность наступления события А в каждом из испытаний. Тогда, каково бы ни было е > О, Jim p/l£_J<s| = i. (3) П->ОО П I / 7 Доказательство. Действительно, введя случайные величины равные числу наступлений события А при А-м испытании, имеем: = +^2+ •• • + Нп- А так как то теорема Бернулли является простейшим частным случаем теоремы Чебышева. Так как на практике часто неизвестные вероятности приходится приближенно определять из опыта, то для проверки согласия теоремы Бернулли с опытом было проведено большое число опытов. При этом рассматривались события, вероятности которых можно считать по тем или иным соображениям известными, относительно которых легко проводить испытания и обеспечить независимость испытаний, а также постоянство вероятностей в каждом из испытаний. Все под- робные опыты дали прекрасное совпадение с теорией. Мы приведём результаты нескольких таких легко воспроизводимых экспериментов. Колода карт, состоящая из 36 карт, сто раз была разделена наудачу на две равные части. В таблице 11 приведены результаты этого эксперимента. В первом столбце указан номер испытания, во втором — число появившихся в одной из полуколод красных карт, в третьем — число случаев деления красных и чёрных карт пополам среди уже произведённых испытаний и, наконец, в четвёртом столбце даны значения частот. В примере 3 (§ 5) было вычислено, что вероятность в полуколоде получить поровну чёрные и красные карты равна (W ^“361(91/ 0,26. 11*
164 ЗАКОН БОЛЬШИХ ЧИСЕЛ [гл. 6 Таблица И №№ испыта- ний Число красных карт Число благопр. случаев Частота №№ испы- таний Число красных карт Число благопр. случаев Частота 1 8 0 0,00 51 9 13 0,25 2 9 1 0,50 52 8 13 0,25 3 11 1 0,33 53 7 13 0,25 4 9 2 0,50 54 9 14 0,26 5 11 2 0,40 55 7 14 0,26 6 8 2 0,33 56 9 15 0,27 7 11 2 0,29 57 9 16 0,28 8 9 3 0,37 58 11 16 0,28 9 8 3 0,33 59 8 16 0,27 10 7 3 0,30 60 8 16 0,27 11 12 3 0,27 61 8 16 0,26 12 10 3 0,25 62 10 16 0,26 13 9 4 0,31 63 12 16 0,25 14 13 4 0,29 64 9 17 0,27 15 12 4 0,27 65 11 17 0,26 16 ’ 8 4 0,25 66 12 17 0,26, 17 11 4 0,23 67 11 17 0,26 18 10 4 0,22 68 8 17 0,25 19 8 4 0,21 69 10 17 0,25 20 11 4 0,20 70 8 17 0,25 21 12 4 0,19 71 7 17 0,24 22 10 4 0,18 72 9 18 0,25 23 10 4 0,17 73 10 18 0,25 24 9 5 0,21 74 8 18 0,24 25 9 6 0,24 75 11 18 0,24 26 14 6 0,23 76 & 18 0,24 27 9 7 0,26 77 9 19 0,25 28 10 7 0,25 78 9 20 0,26 29 10 7 0,24 79 5 20 0,26 30 7 7 0,23 80 8 20 0,25 31 10 7 0,22 81 7 20 0,25 32 7 7 0,22 82 10 20 0,24 33 8 7 0,21 83 9 21 0,25 34 10 7 0,21 84 6 21 0,24 35 9 8 0,23 85 10 21 0,25 36 9 9 0,25 86 10 21 0,24 37 10 9 0,24 87 9 22 0,25 38 10 9 0,24 88 7 22 0,25 39 8 9 0,23 89 7 22 0,25 40 7 9 0,22 90 10 22 0,24 41 9 10 0,24 91 8 22 0,24 42 10 10 0,24 92 8 22 0,24 43 10 10 0,23 93 10 22 0,24 44 9 . 11 0,25 94 8 22 0,23 45 8 11 0,24 95 11, 22 0,23 46 7 11 0,24 96 9 23 0,24 47 12 11 0,23 97 9 24 0,25 48 9 12 0,25 98 10 24 0,25 49 6 12 0,25 99 7 24 0,24 50 7 12 0,24 100 7 24 0,24
§ 30] ЗАКОН БОЛЬШИХ ЧИСЕЛ В ФОРМЕ ЧЕБЫШЕВА 165 Приводимый на черт. 17 график наглядно представляет изменение и* _ частоты — в зависимости от числа испытаний. Вначале, когда число п опытов невелико, ломаная линия порой значительно уклоняется от прямой у = р ~0,26. Затем с увеличением числа опытов ломаная в общем всё ближе и ближе подходит к этой прямой. В рассмотренном случае получилось довольно значительное окон- чательное (при п = 100) уклонение частоты от вероятности (прибли- зительно равное 0,02). По теореме Лапласа вероятность получить такое уклонение или ещё большее равна р{|^“р|>0,()2}== = Р ( I I > 0,02 1/ZI _ 2Ф (о,О2 =- II vnpq I г pq j \ V pqj = 1 -2Ф (0,02 у/~= 1 -2Ф (0,455) ~ 0,65. Таким образом, если повторить указанный эксперимент большое число раз, то приблизительно в двух третях случаев получится укло- нение, не меньшее, чем полученное в нашем опыте. Французский естествоиспытатель XVIII века Бюффон бросил монету 4040 раз, герб выпал при этом 2048 раз. Частота появления герба в опыте Бюффона приближённо равна 0,507. Английский статистик К. Пирсон бросил монету 12 000 раз и при этом наблюдал 6019 выпадений герба, Частота выпадения герба в этом опыте Пирсона равна 0,5016,
166 8АК0Н БОЛЬШИХ ЧИСЕЛ [ГЛ. 6 В другой раз он бросил монету 24 000 раз, и герб при этом выпал 12 012 раз; частота выпадения герба при этом оказалась рав- ной 0,5005. Во всех приведённых опытах частоты лишь немного уклонялись от вероятности — 0,5. 2. Теорема Пуассона. Если в последовательности независи- мых испытаний вероятность появления события А в k-м испы- тании равна рк, то lim р||£ Р1+Р2+ •••+Рп п->оо И П П где, как обычно, через р обозначено число появлений события А в первых п испытаниях. Введя в рассмотрение случайные величины рь равные числу появлений события А в £-м испытании, и заметив, что М^== рк, 'Dvic = pltqit<.^, мы убеждаемся, что теорема Пуассона является частным случаем теоремы Чебышева. 3. Если последовательность попарно независимых случайных величин £х, $2, ..., ... такова^ что М5х = М52=... = М^= .’..=а и D^<C, D$2<a..., ..., то, каково бы ни было постоянное е>0, п lim HliS5*-«|<®I=i; Этот частный случай теоремы Чебышева даёт основание правилу среднего арифметического, постоянно употребляющемуся в теории измерений. Предположим, что производится измерение некоторой физической величины а. Повторив измерения п раз в одинаковых условиях, наблюдатель получит не вполне совпадающие результаты х{, х2, ..., хп. В качестве приближённого значения а принято брать среднее арифметическое из результатов наблюдений д ^.Х1 + х2+---+*п . п Если измерения лишены систематической ошибки, т. е. если Мхх = М*2 = ... = Мхп = а, и если сами наблюдённые значения не обладают неопределённостью, то согласно закону больших чисел при достаточно больших значе- ниях п с вероятностью, сколь угодно близкой к единице, мы ука-
§ 31] ЗАКОН БОЛЬШИХ ЧИСЕЛ 167 занным путём можем получить значение, сколь угодно близкое к искомой величине а. Сказанное мы должны пояснить следующим: если измерительный прибор устроен так, что он не может давать точности отсчёта большей, чем некоторая величина В, например, из- за того, что ширина деления шкалы, по которой производится отсчёт, равна 8, то, понятно, нельзя и рассчитывать получить точность изме- рения, большую, чем ±8. Каждое измерение в этом случае даёт результат с неопределённостью 8; но ясно, что при этом и среднее арифметическое будет обладать той же неопределённостью, как и каждое измерение. Это замечание учит нас, что если приборы дают нам результаты измерений с некоторой неопределённостью 8, то стремиться посредством закона больших чисел получить значение а с большей степенью точности является заблуждением, а сами произ- ведённые при этом вычисления превращаются в арифметическую забаву. Мы ограничимся формулировкой теоремы А. А. Маркова; её доказательство является очевидным следствием неравенства Чебышева. Теорема Маркова. Если последовательность случайных величин •.. > • • • макова, что при п-+оо Л«=1 то, каково бы ни было положительное постоянное s, п п llm 11 " "1 1 ’ Если случайные величины ..., \ч, ... попарно независимы, то условие Маркова принимает вид: при п -> оо Отсюда видно, что теорема Чебышева является частным случаем теоремы Маркова. § 31» Необходимое и достаточное условие для закона больших чисел Мы уже указывали, что закон больших чисел является одним из основных предложений теории вероятностей. Отсюда становится понятным, почему так много усилий было положено на то, чтобы установить наиболее широкие условия, которым должны удовлетворять величины 52,чтобы для них имел место закон боль- ших чисел.
168 ЗАКОН БОЛЬШИХ ЧИСЕЛ [гл. 6 История вопроса такова. В конце XVII — начале XVIII века Яков Бернхлли нашёл предложение, получившее его имя. Теорема Бернулли была впервые опубликована в 1713 г., после смерти автора, в трактате «Ars Conjectandi» (Искусство строить догадки). Затем в начале XIX века Пуассон доказал аналогичную теорему в более широких условиях. До середины XIX века не было достигнуто каких-либо новых успехов. В 1866 г. великий русский математик П. Л. Чебышев нашёл метод, изложенный нами в предыдущем параграфе. Позднее А. А. Марков заметил, что рассуждения Чебышева позволяют получить более общий результат (см. § 30). Дальнейшие усилия долго не приносили принципиальных успехов, и лишь в 1926 г. А. Н. Колмогоров получил условия, необходимые и достаточные для того, чтобы последовательность взаимно незави- симых случайных величин $2, ..., $п, ... подчинялась закону больших чисел. В 1923 г. А. Я. Хинчин показал, что если случайные величины не только независимы, но и одинаково распределены, то существование математического ожидания является достаточ- ным условием для применимости закона больших чисел. В последние годы много работ было посвящено определению условий, которые следует наложить на зависимые величины, чтобы для них выполнялся закон больших чисел. Теорема Маркова принадлежит к предложениям этого рода. Используя метод Чебышева, легко получить условие, аналогичное условию Маркова, но уже не только достаточное, но и необходимое для применимости закона больших чисел к последовательности произвольных случайных величин. Теорема. Для того чтобы для последовательности ^1» ^2* • • • {как угодно зависимых) случайных величин при любом положи- тельном в выполнялось соотношение п п й==1 необходимо и достаточно* чтобы при п-+оо (S (?л-М?й))3 м ---\ - :----------->о. (2) «2 + (2 Gfc-iW 1 Доказательство. Предположим сначала, что (2) выполнено, И покажем, что в этом случае выполнено также (1). Обозначив
169 §31] ЗАКОН БОЛЬШИХ ЧИСЕЛ через Фп(х) функцию распределения величины п %=45>-ми. fc=l Легко проверить следующую цепочку соотношений: Чг" J ГТГ2^Ф»(Х)< |Я?|>6 ’ Это неравенство доказывает достаточность условия теоремы. Покажем теперь, что условие (2) необходимо. Легко видеть, что Р{Ы>*} = / <*$«(*)> f | х |’> е I X 1 > е 1®|<« > f 4/Ф (Х) —83= М — В2. (3) J l+x2a®nW 1 + y)2 Таким образом, °<Mrr4<s8+p{|ii~l>8}- 1 “г Нп Выбирая сначала е сколь угодцо малым, а затем п достаточно боль- шим, мы можем сделать правую часть последнего неравенства сколь угодно малой. Отметим, что все теоремы, доказанные в предыдущем параграфе, легко вытекают из только что доказанного общего предложения. Действительно, так как при любом п и любых имеет место нера- венство *) Последнее равенство мы пишем на основании формулы М/(5)= J/(x)rfF6(x) (см. теорему 1 § 28).
170 ЗАКОН БОЛЬШИХ ЧИСЕЛ (гл. в то в случае существования дисперсий отсюда вытекает неравенство Таким образом, если условие Маркова выполнено, то выполнено также условие(2)и, следовательно, последовательность^, 5а,... ... подчиняется закону больших чисел. Всё же мы должны заметить, что в более сложных случаях, когда у величин не предполагается конечных дисперсий, доказанная теорема для фактической проверки применимости закона больших чисел весьма мало пригодна, так как условие (2) относится не к отдельным слагаемым, а к их суммам. Однако рассчитывать на то, что, не сделав никаких предложений о величинах и о существую- щей между ними связи, удастся найти необходимые и достаточные условия, к тому же удобные для приложений, повидимому, нельзя. Если предположить, что величины $2, . взаимно незави- симы, то можно показать, что условие (2) эквивалентно следую- щему: при п —> оо п 2 м г3 п2 + & где обозначено ми Практическое использование только что доказанных теорем встре- чает одно принципиальное затруднение: можем ли мы считать, что изучаемое нами явление или производственный процесс протекают под воздействием независимых причин? Не противоречит ли само понятие независимости нашим основным представлениям о взаимо- связи всех явлений внешнего мира? Мы не должны забывать при этом фундаментального положения материалистической диалектики, абсо- лютно чётко сформулированного товарищем Сталиным: «В противо- положность метафизике диалектика рассматривает природу не как случайное скопление предметов, явлений, оторванных друг от друга, изолированных друг от друга и не зависимых друг от друга, — а как связное, единое целое, где предметы, явления органически свя- заны друг с другом, зависят друг от друга и обусловливают друг друга». («Вопросы ленинизма», стр. 536, 11 изд.) Находясь на позициях философии диалектического материализма, мы не можем уклониться от выяснения реальных связей, имеющихся в изучаемом нами явлении. При математическом изучении тех или иных явлений природы, технических процессов или тех или иных общественных явлений мы прежде всего должны выводить наши основные предпосылки, опираясь на глубокое изучение существа самого явления, качественных его особенностей. Мы должны учи-
§ 32] УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 171 тывать изменение внешних условий, в которых протекает изучаемое нами явление и изменять математический аппарат и предпосылки, лежащие в основе его применения, как только обнаружится, что условия осуществления явления изменились. Признавая взаимосвязь всех процессов природы, материалисти- ческая диалектика в то же время указывает на то, что эти связи могут быть существенными и несущественными для того или иного явления. Рассмотрение всех существующих связей, в том числе и несущественных, приводит лишь к тому, что само явление затемняется и овладение им отодвигается ввиду такой ослож- нённой обстановки. Несущественные для данного явления связи должны нами не учитываться, и всё наше внимание должно быть сосредоточено на основном. Мы всегда должны иметь в виду, что «для того чтобы познавать отдельные стороны (или частности общей картины мировых явлений), мы вынуждены вырывать их из их естественной или исторической связи и исследовать каждую в отдель- ности по её свойствам, по её особым причинам и следствиям» (Ф. Энгельс, Анти-Дюринг, стр. 20, изд. 1948 г.; слова в скоб- ках принадлежат В. И. Ленину: «Материализм и эмпириокритицизм», стр. 134, изд. 1946). Отбрасывая несущественные связи между причинами, под влиянием которых развивается изучаемое явление, мы приходим к возможности в качестве рабочего аппарата пользоваться независимыми случайными величинами. Насколько удачно мы произвели схематизацию явления, насколько удачно выбран нами математический аппарат для его изу- чения, мы можем судить по согласию созданной нами теории с прак- тикой. Если наши теоретические результаты существенно расходятся с опытом, то мы должны пересмотреть предпосылки, в частности, если идёт речь о применимости закона больших чисел, то быть может придётся отказаться от предположения о полной независимости действующих причин и перейти к предположению об их зависимости, быть может и слабой. Мы уже говорили, что накопленный опыт использования теорем о законе больших чисел показывает, что условие независимости удовлетворительно во многих важных задачах естествознания и техники. § 32. Усиленный закон больших чисел Нередко из теоремы Бернулли делают совершенно необоснован- ный вывод, что частота события А при безграничном увеличении числа испытаний стремится к вероятности события А. На самом же деле теорема Бернулли устанавливает только тот факт, что для достаточно большого числа испытаний п вероятность одного един- ственного неравенства:
172 ЗАКОН БОЛЬШИХ ЧИСЕЛ [гл. 6 может быть сделана больше чем 1 — 7] при произвольном т] > 0. В 1909 г. французский математик Э. Борель обнаружил более глубо- кое предложение, согласно которому при любых е > 0 и т) > 0 можно указать такое л0, что, каково бы ни было вероятность одновременного выполнения неравенств для всех я, удовлетворяющих неравенствам nQ^.n^nQ-[-s больше чем 1—т). Эту теорему мы выведем из теоремы А. Н. Колмогорова об усиленном законе больших чисел. Неравенство А. Н. Колмогорова. Если взаимно незави- симые случайные величины ...,5Я имеют конечные диспер- сии, то вероятность совместного осуществления неравенств к I2& —Mh)|<« (А = 1, 2,...,л) 8=1 не меньше, чем п 1— Л=1 Доказательство. Введём обозначения к ^к=Ч—м?*, ^==2^- Пусть, далее, Ек обозначает событие, состоящее в том, что |Sj|<e для / —1 и |SJ>e; Ео означает событие, состоящее в том, что | Sj | < е для j п. Так как событие, состоящее в том, что хотя бы при одном будет выполнено неравенство |Sfc|>e (6=1, 2, ..., л) п (иными словами, что max |5fc|>8) равносильно событию 2 то 1 •< к < п Zc=l в силу несовместимости событий Ек Р{ max |Sfc|>e) = SP(Bfe). Согласно равенству ((5) § 26) = S Р(Д0 • М (Sl/Et) > s Р (£*) • м (S*n/Ek),
§ 321 УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 173 Очевидно, далее, что м($^=м{$14-2 2^+2 ^4-2 2 w/^)> j>k J > к j >h>k >M{Sl + 2 2^ + 2 2 w^}- j>k ' j>h>k Так как осуществление события Ек налагает ограничение только на значения первых k из величин 5<t а последующие остаются при этом условии независимыми друг от друга и от Sk, то М (S^/Еь) = М (Sk/Ek) • М (ц/Ек) = О И м<№1ь/Ек) = 0 (Аф], h>k, Кроме того, согласно (1) имеет место неравенство M(4/Efc)>s2 (А>1). Мы можем написать поэтому, что DSn>^P{Ek}. к=1 Отсюда Ур[Ей} = Р{ max |Sft|>e}<iDSn. Неравенство А. Н. Колмогорова доказано. Мы скажем, что последовательность случайных величин ^2» ?8» • • • подчиняется усиленному закону больших чисел, если, каковы бы ни были е > 0 и т] > 0, можно указать такое /г0, что для любого 5 и всех п, удовлетворяющих неравенствам п0 п nQ + s, вероятность неравенства п п max пв<я<л0 + ®1 » больше, чем 1 — Теорема А. Н. Колмогорова. Если последовательность взаимно независимых случайных величия Е2» • • • удовлетворяет условию П = 1 то она подчиняется усиленному закону больших чисел.
174 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. 6 Доказательство. Положим * п = М5П, vn — ~Sn. Рассмотрим вероятность PW = P {max | vn l^e, 2m O<2mM}. Так как Pm < P {max | vn | > e, 1 < n < 2M+1}> то согласно неравенству A. H. Колмогорова (2ше)3 J<2m + ' Так как, далее, Р {max | vn | > e для n > v} < 2 Pm, где p определяется из неравенств 2р<><2?+1, то ясно, что оо Р{шах|г/„|>е для 2 w=p После перемены порядка суммирования в правой части последнего неравенства получим: ОО 00 где сумма 2; распространена 2»*+i > у. При /<^2р+1 коэффициент на те значения /п>-р, для которых при D$y равен S1 3 4иг = 4р-1 т > р а при 2Wf,+1 >/^ 2Wj;> 2р+1 этот коэффициент . 3-16 16 равен
§321 УСИЛЕННЫЙ ЗАКОН БОЛЬШИХ ЧИСЕЛ 175 Таким образом: оо 2?+1 оо _с 2 0^2>+з-1в 2 да=р /<2W,+I J=1 у=2Р + ! + 1 р оо <^+’•‘2 5^ + з.16 2 J=P + 1 J=2₽+1 + l р a?+1 00 h <^SDE'+3-4 s >3'16 s js=*l J«p4“l J=s2P+1-f-l В силу сходимости ряда 1°. Две последние суммы в написанном выше неравенстве могут быть сделаны сколь угодно малыми при р достаточно большом. 2°. Существует такая постоянная С, что D5n < Сп2, откуда еле* дует, что JLVrv <-3-ср8 4Р+1 4p-i • j=»i т. е. и первая сумма может быть сделана сколь угодно малой при достаточно большом р. Из всего сказанного следует, что при и0 достаточно большом Р {max|^|^s для n>v} может быть сделана сколь угодно малой, ч. и тр. д. Следствие. Если дисперсии случайных величин ограничены одной и той же постоянной С, то последовательность взаимно независимых случайных величин £2, £3, ... подчиняется усилен- ному закону больших чисел. Один окончательный результат, относящийся к усиленному закону больших чисел, был получен также А. Н. Колмогоровым для случая одинаково распределённых независимых слагаемых. Теорема. Существование математического ожидания является необходимым и достаточным условием для применимости усилен- ного закона больших чисел к последовательности одинаково рас- пределённых и взаимно независимых случайных величин. Эту теорему мы можем вывести из уже доказанной нами теоремы А. Н. Колмогорова. Действительно, из существования математического ожидания сле- дует конечность интеграла j* | х | dF (х), где F(x)— функция распре- деления случайных величин ?п.
176 8AK0H БОЛЬШИХ чисел (гл. 6 Поэтому 2р{|Ч>«} = 2 S Р{*<1Ч<*4-1} = п^1 п~1 к>п = 2feP{Л< |В|<А+1}<2 п = 1 fc=O < J|x|rfF(x)<oo. (1) \x\dF(x) < Введём в рассмотрение случайные величины . ( В» при |<п|<л» “ 1 0 при 1| > п. Тогда получим: +» п D5n<MC= Г x2rfF(x)<S(fc-]-l)2P{fc<jS[<fe + l} -п и оо оо , ..а Ю==1 n = l fc«=0 OO OO <£P{*<PI<*+r}(*4-1)22 k—0 n^k Так как V 1 zlxlz 1 2^ ifi № “1” k k • »> fc то в силу (1) находим, что V D;* s «2 <°°> n=»l т. e. удовлетворяют усиленному закону больших чисел. Далее Рпри каком-либо n^N]^ P{^z£^} = n = Sp{|M>«}<J (2) n>N при 2V>^(s). Выберем v0 столь большим, чтобы при v^-v0 (е, т)) XVq 2 fe-w fc=i V] •» 3 (3)
§321 УСИЛЕННЫЙ ЗАНОЙ БОЛЬШИХ ЧИСЕЛ 177 и Наконец, так как & удовлетворяет усиленному закону больших чисел, то Р | max | vn | > при у>у2(8, -q), (5) где v„ = — ft = 1 Из (2),-(3), (4) и (5) выводим Р { шах [ | ;>-я; при v^>tnax(v0, vb 7V0), т. e. и $я удовлетворяют усиленному закону больших чисел. Принципиальная роль усиленного закона больших чисел в теории вероятностей и в её приложениях весьма велика. Действительно, пред- положим на минуту, что, скажем, в случае одинаково распределённых слагаемых, имеющих конечное математическое ожидание, усиленный закон не имеет места. Тогда с вероятностью, сколь угодно близкой к единице, можно утверждать, что будут повторяться моменты, когда средняя арифметическая результатов наблюдений будет далека от математического ожидания. И это бы случилось даже в тех случаях, когда наблюдения производятся без систематической ошибки и с пол- ной определённостью (величина 3, о которой была речь в § 30, равна 0). Можно ли было бы в таких условиях считать, что среднее арифметическое из результатов наблюдений сближается с измеряемой величиной, могли ли бы мы в этих условиях считать, что среднее арифметическое можно считать за приближённое значение измеряемой величины? Сомнительно. 12 Зак. 1826. В. В. Гнеденко
ГЛАВА 7 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ Мы видели в предыдущих главах, что в теории вероятностей широко используются методы и аналитический аппарат различных отделов математического анализа. Простое решение весьма многих задач теории вероятностей, особенно тех из них, которые связаны с суммированием независимых случайных величин, удаётся получить с помощью характеристических функций, теория которых развита в анализе и известна под именем преобразованийФурье. Настоящая глава посвящена изложению- основных свойств характери- стических функций. § 33. Определение и простейшие свойства характеристических функций Характеристической функцией случайной величины Е называется математическое ожидание случайной величины е№ ♦). Если F (х) есть функция распределения величины Е, то характеристическая функция равна по теореме 1 § 28 /(/) = (1) Мы условимся обозначать в дальнейшем характеристическую функцию и соответствующую ей функцию распределения одними и теми же буквами, но только соответственно малой и большой. Из того, что | eita> | = 1 при всех вещественных /, следует суще- ствование интеграла (1) для всех функций распределения; следова- тельно, характеристическая функция может быть определена для каждой случайной величины. Теорема 1. Характеристическая функция равномерно непре- рывна на всей прямой и удовлетворяет следующим соотношениям*. /(0) = 1, |/(01<1 (—оо</<оо). (2) *) t—действительный параметр. Математическое ожидание для комплекс- ных случайных величин Е + Щ определяем как ME -|- Легко проверить, что теоремы 1, 2 и 3 § 27 справедливы и в этом случае.
§ 33] ОПРЕДЕЛЕНИЕ И ПРОСТЕЙШИЕ СВОЙСТВА 179 Доказательство. Соотношения (2) немедленно вытекают из- определения характеристической функции. Действительно, по (1) /(0)=р.<^(х) = 1 И |/0|=| j\«*>dF(x)|< j’|^«’lrfF(x) = j*rfF(x) = l. Нам остаётся доказать равномерную непрерывность функции / (/). С этой целью рассмотрим разность / (/ h) —f (0 = j* — 1) dF (х) и оценим её по модулю. Имеем: |/(<+ А) _/01 < 11 1 \dF(х). Пусть е>0 произвольно; выберем столь большое А, чтобы [ dF(x)<|, и подберём столь малое Л, чтобы для | х | < А |^Л— 1|<^. Тогда А 1/(^4-h)~/(0|< —l|dF(x)H-2 f <ZF(x)<e. —А \х\>А Это неравенство доказывает теорему. Теорема 2. Если т| = аЕ4"^» г$е а и &— постоянные, то где f^(t) и fi(t) означают характеристические функции величин И и Е. Доказательство. Действительно, Д (0 = Ме“т‘ = Ме“ <0?+Ь) = eitb Меа<Л = eitbfk (at). Теорема 3. Характеристическая функция суммы двух неза- висимых случайных величин равна произведению их характери- стических функций. 12*
180 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ (гл. 7 Доказательство. Пусть Е и — независимые случайные вели- чины и C = E-f-iq. Тогда очевидно, что вместе с Е и т; независимы также случайные величины е** и еи\ Отсюда вытекает, что Ме<л = Me"(е+,) = Ме"С • = М«"6Ме"4. Это доказывает теорему. Следствие. Если = + ... Ц-Еп, причём каждое слагаемое независимо от суммы предыдущих, то характеристическая функция величины Е равна произведению харак- теристических функций слагаемых. Применение характеристических функций в значительной степени опирается на свойство, сформулированное в теореме 3. Сложение независимых случайных величин, как мы видели в § 23, приводит к весьма сложной операции — композиции функций распределения слагаемых. Для характеристических функций эта сложная операция заменяется весьма простой — простым’умножением характеристических функций. Теорема 4. Если случайная величина Е имеет абсолютный момент п-го порядка, то характеристическая функция величины Е дифференцируема п раз и при k^n (3) Доказательство; Действительно, 6-кратное (6^п) фор- мальное дифференцирование характеристической функции приводит к равенству /(*) (/) « Я / dF(x) (4) Но IJ xM*»<fF(x)|< J |x|*dF(x) и, следовательно, в силу предположения теоремы ограничен. Отсюда следуют существование интеграла (4) и законность дифференцирования. Положив в (4) /=0, находим, что /(»)(0) = /* fx*dF(x). Математическое ожидание и дисперсия весьма просто выражаются при помощи производных от логарифма характеристической функции. В самом деле, положим W) = ig/(0. Тогда /(0
ОПРЕДЕЛЕНИЕ И ПРОСТЕЙШИЕ СВОЙСТВА 181 § зз1 й /2(0 Приняв во внимание, что / (0) = 1 и равенство (3), находим, что ф'(0)=/(0)-=1М1 ф" (0) = /" (0) — [/' (О)]9 = Ж — bW = — Di. Отсюда |№=}ф'(0) И (5) DB = - ф"(0). Производная ft-го порядка логарифма характеристической функции в точке 0, умноженная на ik, называется семиинвариантом Ь-го порядка случайной величины. Как это непосредственно следует из теоремы 3, при сложении независимых случайных величин их семиинварианты складываются. Мы только что видели, что первыми двумя семиинвариантами являются математическое ожидание и дисперсия, т. е. момент первого порядка и некоторая рациональная функция моментов первого и вто- рого порядков. Путём вычислений легко убедиться, что семиинвариант любого порядка k есть (целая) рациональная функция первых k момен- тов. Для примера приведём явные выражения семиинвариантов треть- его и четвёртого порядков: (0)=—{мб8—змб1 2 • ме+2 [м*]3}, /4<Г (0) = Мб4—4Мб8Мб —3 1М^2 + 12Мб*[Мб]2 — 6 [Мб]4. Рассмотрим теперь несколько примеров характеристических функций. Пример 1. Случайная величина б распределена по нормальному закону с математическим ожиданием а и дисперсией а2. Характе- ристическая функция величины б равна ?(0 1 f —=- I в * dx. а У 2к J Подстановкой ?(0 приводится к виду я — а Z —----------- а ? (О = е . . аа£* 4 л & tat _ 1 г —— ’ ~7= е — <pp—tfq
182 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [ГЛ. 7 Известно, что при любом вещественном а оо—*^3 J е * dz — У^к, —со—<а следовательно, фСО-^-т Пользуясь теоремой 4, мы можем без труда вычислить централь- ные моменты для нормального распределения и тем самым другим путём получить результат примера, рассмотренного в § 28. Пример 2. Найти характеристическую функцию случайной вели- чины распределённой по закону Пуассона. Согласно предположению величина 5 принимает только целочис- ленные значения, причём Р{е=&}==Цг- (k=o, 1,2,...), где X > 0 — постоянная. Характеристическая функция величины $ равна /(/) = Р {5 = Л} = 2 Я в-Х “ А:=0 fc=0 = е-х у = (.«-»). k\ Л «а О Согласно (5) отсюда находим, что М?==1у(0) = Х; (0) = Х. Эти равенства были нами ранее (§ 25, пример 3) получены непо- средственно. Пример 3. Случайная величина 5 равномерно распределена в интервале (—а, а). Характеристическая функция равна dx __ sin at 2а at * Пример 4. Найти характеристическую функцию величины уь, равной числу появлений события А в п независимых испытаниях, в каждом из которых вероятность появления события А равна р. Величина рь может быть представлена как сумма /(/) = f
§ 34] ФОРМУЛА обращения и теорема единственности 183 п независимых величин, каждая из которых принимает лишь два значения 0 и 1, соответственно с вероятностями q — 1—р и р. Величина р* принимает значение 1, если событие А происходит в £-м испытании, и значение 0, если событие А в k-м испытании не про- исходит. Характеристическая функция величины равна А (0 = = eitoq -f- ettlp = q ре". Согласно теореме 3 характеристическая функция величины у. равна п Найдём ещё характеристическую функцию величины т; = -р' 7—* у яр? По теореме 2 она равна .. \/“пр ± i * V = e ’ V *(q+pe Vn^)n = = (qe~{t ^”5 -|- ре* У*Ф)п. Пример 5. Характеристические функции удовлетворяют равенству /(_/)=/(/). . Действительно, f (— t) = j* dF (х) =s J <?«* dF (х) = J7J). § 34. Формула обращения и теорема единственности Мы видели, что по функции распределения случайной величины $ всегда можно найти её характеристическую функцию; для нас важно, что имеет место также обратное предложение: по характеристи- ческой функции функция распределения определяется однозначно. Теорема 1. Пусть f(f) и F (х)— характеристическая функ- ция и функция распределения случайной величины 6. Если xt и — точки непрерывности функции F(x)t то F(xa)-F(x1)=^-cnm р-----------Р-----f(t)dt. (1) Доказательство. Из определения характеристической функ- ции следует, что интеграл = J ---------Tt-----f^dt
184 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [ГЛ. 7 равен Л = f eit(g~^]dF(z)dt, J J W — с В последнем интеграле можно изменить порядок интегрирования, так как по z интеграл абсолютно сходится, а по t пределы интегри* рования конечны. Таким образом, At (z—x,)_ it (2—ж2) -J —---------A---------dFtz) it 1 f Г f — __eit(z— I e— it (z— ш,2) n = 27 J IJ --------------------------Tt----------31------------dt\ dF & =* 0 оо c 1 J J pin/(x—Xj) —со 0 s^^-^dtdF(z). Из анализа известно, что при с —> оо тр если а > О, 1 А — -5-, если а < О, & (2) и эта сходимость равномерна относительно а в каждой области а > 8 > 0 (соответственно а < — 8), и при | а | 8, при всех с с (3) Положим для определенности, что х2 > х19 и представим инте- грал Je в виде следующей суммы: я?!—8 + $ а?2—8 гв24-5 со •/cejr + J’ + j+ j4- f ^(С, z; xlt x2)dF(z), —00 — 8 a?2—8 £Ва4-8 где для краткости обозначено с ф (с, z; xit х2) = 1J о и 8>0 подобрано так, что Xj-|-8<x2—8,
§ 34] ФОРМУЛА ОБРАЩЕНИЯ И ТЕОРЕМА ЕДИНСТВЕННОСТИ 185 В области — оо<г<х1 — 8 имеют место неравенства z — xt < 8иг — х2 <—8. Поэтому мы на основании (2) заключаем, что при с —> оо 8 J ф (с, z\ х19 х2) dF (г) -> 0. —оо Аналогично при ха-|-8 <г < + оо и при с->оо ОО J4» (с, Z-, Ху ха) dF (х) -> 0. #2-М Далее, так как в области хг + 8 < z < х2 — 8 имеют место не- равенства z — Xi >8 и z — х2 < 8, то согласно (2) при с-*оо —6 #5—8 У Ш Z-, XyX^dFiz)-* xt 8 #14- 8 У dF(^) = F(x2-8)-F(x14-8). Наконец, в силу (3) мы можем воспользоваться оценками | у ф(с, г\ Ху xJdF(z) |<2 j* dF(z)—2 [F^-j-S)—F(xj—8)] а?, — 8 азх—В и ' | У Ф (с, г; xt, ха) rfF(^) | < 2 У dF(z) =2 [F(ха+ 8)-F (ха-8)]. #2—8 а?2—8 Таким образом, находим, что при любом 8 > О Йт Je = F(xa —8) — F (х, 4- 8) + (8, х„ xa) C -> OO И lim Jc = F (xa — 8) — F (xt + 8) + /?a (8, xp xa), c-> oo где I Ri (8. Ху x2) I < 2 {F (х^ + 8)—F(x, — 8) -|- F (xa + 8) — F (xa—8)} (/=1,2). Пусть теперь 8 —> 0. При этом из того, что х, и ха являются точками непрерывности функции F(x), следуют равенства lira F(x14-8)= lim F(Xj — 8) = F(x1) 8 ->0 8-> 0 И lim F(xa4- 8) = lim F (xa — 8) = F (xa), 8—> 0 8-^0
186 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [гл. 7 А так как J, не зависит от 8, то V 7 lim Je-=F(x3) — с->оо Равенство (1) носит название формулы обращения. Мы используем эту формулу для вывода следующего важного предло- жения (теорема единственности). Теорема 2. Функция распределения однозначно определяется своей характеристической функцией. Доказательство. Действительно из теоремы 1 непосред- ственно следует, что в каждой точке непрерывности функции F (х) применима формула = lim lim Г fit) dtt ОО С->оо J “ — с где предел по у берётся по множеству точек у^ являющихся точками непрерывности функции F(x). В качестве приложения последней теоремы мы докажем следую- щие предложения. Пример 1. Если независимые случайные величины и $2 рас- пределены нормально, то их сумма 6 = 6i4-'52 также распределена нормально. Действительно, если М$1 == DSj М$2==^2> =s ®2> то характеристические функции величин и ?2 равны . . 1 2.2 л . 12.2 По теореме 3 § 33 характеристическая функция /(/) суммы равна 12 2 9 Это—характеристическая функция нормального закона с математиче- ским ожиданием а — ах-\-а2 и дисперсией <з2 = На основании теоремы единственности заключаем, что функция распределения величины В нормальна. Пример 2. Независимые случайные величины и Е2 распре- делены по закону Пуассона, причём р(е.=*)=—тг~- Докажем, что случайная величина В = $2 распределена по закону Пуассона с параметром ХсяЛ|-|-Х3.
§ 34J ФОРМУЛА ОБРАЩЕНИЯ И ТЕОРЕМА ЕДИНСТВЕННОСТИ 187 Действительно, в примере 2 предыдущего параграфа мы нашли, что характеристические функции случайных величин Ех и $2 равны д (0 = И-1), /а(/) e (ott-1). В силу теоремы 3 предыдущего параграфа характеристическая функ- ция суммы £ = равна /(0=Л(0-/а(0 = ^‘+м(в#-1). т. е. является характеристической функцией некоторого закона Пуас- сона. Согласно теореме единственности единственное распределение, имеющее /(/) своей характеристической функцией, есть закон Пуас- сона, для которого Д. А. Райков доказал обратное более глубокое предложение: если сумма двух независимых случайных величин распределена по закону Пуассона, то каждое слагаемое также распределено по закону Пуассона. Пример 3. Характеристическая функция вещественна тогда и только тогда, когда соответствующая ей функция распределения симметрична, т. е. когда при любых х функция распределения удо- влетворяет равенству F(x) = l—F(—*4-0). Если функция распределения симметрична, то её характеристи- ческая функция вещественна. Это доказывается несложным подсчётом: /(<) = J*e<tedF(x) = = J е-"» dF(— х + 0) 4- J dF (х) — F (+0) — F(- 0) = о о = [(«-«•-|-e««)rfF(x) — F(-J-O) —Р(-0) = 6 = 2 J cos tx dF (x) — F(-|-0) — F (—0) = J cos tx dF (x)» ° (Напомним здесь, что мы условились включать нижний предел в интервал интегрирования и не включать верхний.) Для доказательства обратного предложения рассмотрим случай- ную величину т) = — Е. Функция распределения величины равна
188 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [гл. 7 Характеристические функции величин 5 и ц связаны соотношением g(f) = Ме^ - Ме-<« == ₽ =7(t). Так как по условию /(0 вещественна, то /(0 = /(0 и, значит, g(0=/(0. Из теоремы единственности мы теперь заключаем, что функции рас- пределения величин 5 и т) совпадают, т. е. что F(x) = l — F(-x + 0), ч. тр. д. § 35. Теоремы Хелли В дальнейшем нам потребуются две теоремы чисто аналитиче- ского характера — первая и вторая теоремы Хелли. Условимся говорить, что последовательность неубывающих функций Р*(х),..., Fn{x), ... сходится в основном к неубывающей функции F (х), если при п оо она сходится к этой последней в каждой её точке непре- рывности. Впоследствии мы всегда будем считать, что функции Fn(x) удо- влетворяют добавочному условию Fre(—оо) = 0, и не станем далее оговаривать этого. Отметим сразу же, что для сходимости в основном достаточно, чтобы последовательность функций сходилась к функции F(x) на каком-нибудь всюду плотном множестве D. Действительно, пусть х— любая точка и хг и х"— какие-нибудь две точки множества Z), такие, что х'^х^х". При этом также Следовательно, lim Fn (х') < lim Fn (х) < Hm Fn (x) < lim Fn (x"). n -> co n”=Too n -> oo П -> 00 А так как по предположению lim Fn (x') = F (x') и lim Fn (x") = F (x")9 n->OO n->OO TO И F(x')< Hm Fn(x)< lim Fn(x)<F(x"). П-»0О П->ОО Но средние члены в этих неравенствах не зависят от х' и х", по- этому F (х—0)< lim Fn(x)< firn Fn (л)< F (x 0),
£ 351 ТЕОРЕМЫ ХЕЛЛИ 189 Если функция F (х) в точке х непрерывна, то F(x — 0) = F(x)=F(x + 0). Следовательно, в точках непрерывности функции F (х) lim Fw(x) = F(x). П -> оо Первая теорема Хелли. Всякая последовательность огра- ниченных в совокупности неубывающих функций F^x), F^x)........Fn(x), ... (1) содержит по крайней мере одну подпоследовательность Ръ (*^)> Fns (х), । (-£)> • • •» сходящуюся в основном к некоторой неубывающей функции F(x). Доказательство. Пусть D — какое-нибудь счётное всюду плотное множество точек хь х2, ..., xw, ... Возьмём значения функций последовательности (1) в точке Xi Л ^2 (*i), • • •, Рп (*i), • • • Так как множество этих значений, по предположению, ограничено! то оно содержит по меньшей мере одну последовательность Рц (х1)> ^?12(Л'1)> •••» Рin(xi)> •••» (2) сходящуюся к некоторому предельному значению, которое мы обо- значим через G(x/). Рассмотрим теперь множество чисел Рц (Хз), Р12 (хз)» • • •» ^1п(*2)> • • • Так как и это множество ограничено, то существует в нём последо- вательность, сходящаяся к некоторому предельному значению О(х2). Таким образом, из последовательности (2) мы можем выделить под- последовательность ^21 (*)> Р22 (х)> • • •> Р2п (Х)> • • •» (3) для которой одновременно lim F2W (xi) = О (xi) и lim F2n (x2) ==• n-> OO n->oo *=gg4). Продолжим такое выделение подпоследовательностей Pkl(x)> Ркъ^х)’ •••> Ркп (*^)> •••» (4) Для которых одновременно имели бы место равенства lim Fkn (xr) = П-> оо = G(Xr) при всех r^,k. Составим теперь диагональную последо- вательность РU (*)» ^22(x)> ♦ • Рпп (*)» • • ♦ (5)
190 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [ГЛ. 7. Вся она в конечном счёте выделена из последовательности (1), по- этому для неё lim Fnn (х^ — G (xi). Далее, так как вся диагональная Я->ОО последовательность, за исключением лишь первого члена, выделена из последовательности (2), то lim FWft(x2) = О(х2). Вообще вся диа- п->оо тональная последовательность, за исключением первых её k — 1 чле- нов, выделена из последовательности (4); поэтому для неё также lim Fnn (Хк) = G (xft) при каждом k. Полученный результат можно п -> оо сформулировать так: последовательность (1) содержит по крайней мере одну подпоследовательность, которая во всех точках х& мно- жества D сходится к некоторой функции G(x), определённой на множестве D. При этом, так как функции Fnn (х) не убывают и равномерно ограничены, то, очевидно, и функция G (х) будет неубы- вающей и ограниченной. Теперь ясно, что функцию G(x), определённую на множестве D, можно продолжить так, что она будет определена на всей прямой — оо<х<со, оставаясь неубывающей и ограниченной. Последовательность (5) сходится к этой функции на всюду плотном множестве Z); следовательно, она сходится к ней в основ- ном, что и требовалось доказать. Заметим, что функция, полученная продолжением функции G, может оказаться не непрерывной слева. Но мы можем изменить её значения в точках разрыва так, чтобы восстановить это свойство. Подпоследовательность Fnn будет схо- диться в основном и к таким образом «поправленной» функции. Вторая теорема Хелли. Пусть/(х)— непрерывная функ- ция и пусть последовательность неубывающих, ограниченных в совокупности функций Ш Fa(x), ...,F„(x)................ сходится в основном к функции F(x) на некотором конечном интервале а^х где а и b — точки непрерывности функ- ции Г(х); тогда ъ ь я“тоо Р(Х) dFn (Х) = Р(Д° dF (Х)‘ а а Доказательство. Из непрерывности функции /(х) вытекает, что как бы мало ни было положительное постоянное е, найдётся подразделение интервала а х С b точками х0 = а, хп ..., xN « b на частичные интервалы х^^х ^х-^ такое, что в каждом интер- вале (хь xfe+1) будет выполняться неравенство |/(х)—/(xfe) | < е. Пользуясь этим обстоятельством, мы можем ввести вспомогательную функцию А(х), принимающую только конечное число значений, определив её посредством равенств при
§ 35] ТЕОРЕМЫ ХЕЛЛИ 191 Очевидно, что для всех х в интервале а^х^Ь выполняется нера- венство 1/(х)—/.(*)!< *• При этом мы можем заранее выбрать точки деления ху х2, ..., так, чтобы они были точками непрерывности функции F(x). В силу сходимости функций F1(x), F2(x), /^(х), ... к функции F(x), при достаточно больших п во всех точках деления будут выпол- няться неравенства (6) где М — максимум модуля f(x) в интервале а^,х^,Ь. Без объяснений ясно, что ь ь ь ь | Г/(х)йР(х)- f/(x)dFn(x)|<| p(x)dF(x)-J/.(x)dF(x)|+ а а а а ъ ъ ь + | J* А (х) dF (х) - J* /, (х) dFn (х) | +1 / /.(X) dFn (x) - a a a b — § f (x) dFn(x)\. a Нетрудно подсчитать, что первое слагаемое правой части не превос- ходит s[F(6)— F(a)], а третье не превосходит s[Fn(£)—FM(a)]. Что же касается второго слагаемого, то оно равно IN — 1 N-1 | I S f (xfc) (xk+1)—F (*&)] — 5 f to) I*7» (**+i)—(*s)]| ==» A’=0 Ы0 N—1 N—1 “ I 2 /(xfc)[F(xft+1)-F„(xk+1)J- 2 f(xk)[F(xk)-Fn(xk)}\ &==0 fc—O и, следовательно, при достаточно больших п не превосходит 2е, как это вытекает из неравенства (6). В силу рграниченности функ- ций Fn(x) в совокупности, сумма . [F (b) - F(а)] + е [F„ (b) - F„ (а)] + 2з может быть сделана сколь угодно малой вместе с е. Обобщённая вторая теорема Хелли. Если функция /(х) непрерывна и ограничена на всей прямой — оо < х < оо, последовательность ограниченных в совокупности неубывающих функций РЛх), F9(x), ..F„ (х), ...
192 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ Ггл. 7 сходится в основном к функции F (х) и lim Fn (—00) —F(— 00), lim 00) — F (-[- 00), И->оо n->OO то lim n->oo ff(x)dFn(x) ~Jf(x)dF(x). Доказательство. Пусть A < 0 и В > 0; положим А А Л = | JЛ*) dF(х) - J7(x) dFn(x)\, — оо —со 2 Очевидно, что В Величины Jt и J8 можно сделать сколь угодно малыми, если выбрать А к В достаточно большими по абсолютной величине и притом такими, чтобы точки А и В были точками непрерывности функции F (х), а п выбрать достаточно большим. В самом деле, пусть М — верхняя грань |/(х)| при —оо < х < оо; тогда F1<2W[F(A) + F„(A)]> м [F(+ оо) - F(B)] + М [F п (+ а>) — Fn (В)]. Но lim F (А) = О, lim F(B) = F (+ co). --OO B->QO А так как, по предположению, lim Fn (A) = F (A), lim Fn (B) = F (B), W->oo n-»oo то наше утверждение об Jt и J3 доказано. Величина J2 при доста- точно большом п может быть сделана сколь угодно малой в силу теоремы Хелли для Конечного интервала. Теорема доказана. § 36. Предельные теоремы для характеристических функций Важнейшими с точки зрения приложений характеристических функ- ций к выводу асимптотических формул теории вероятностей являются две.предельные теоремы — прямая и обратная. Эти теоремы устанавли- вают, что соответствие, существующее между функциями распреде-
§ 361 ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЙ 193 ления и характеристическими функциями, не только взаимно одно- значно, но и непрерывно. Прямая предельная теорема. Если последовательность функций распределения сходится в основном к функции распределения F(x), то последа- вательность характеристических функций 4(0. /а(0...-, /пер- еходится к характеристической функции f(f). Эта сходимость равномерна в каждом конечном интервале I. Доказательство. Так как fn W - j* ^dFn (х), f (t) =x j* e^dF (x) и функция eitx непрерывна и ограничена на всей прямой —оо</<оо, то согласно обобщённой второй теореме Хелли при п -> оо Утверждение, что эта сходимость равномерна в каждом конец* ном интервале /, проверяется буквально теми же рассуждениями, какие мы провели при доказательстве второй теоремы Хелли. Обратная предельная теорема. Если последователь-. ность характеристических функций (1) сходится к непрерывной функции f(t)> то последовательность функций распределения (**), Ш • • • (2) сходится в основном к некоторой функции распределения Р(х) (в силу прямой предельной теоремы f (f) = J eiix dF (х)}. Доказательство. На основании первой теоремы Хелли заклю- чаем, что последовательность (2) непременно ^содержит подпоследо- вательность Лц(*), С*)> • • •> ^WfcG*)» • • •• (3) Сходящуюся в основном к некоторой неубывающей функции F (х). При этом понятно, что функцию F(x) мы можем считать непрерыв- ной слева: lim F (xf) = F (х). X* -> ш—0 Вообще говоря, функция F (х) может и не быть функцией распреде* ления, так как для этого должны удовлетворяться ещё условия 13 Зак. 1826. Б. В. Гнеденк».
194 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [ГЛ. 7 F (— оо) — 0 и F (4“ оо) = 1. Действительно, для последователь- ности функций Fп (х) = О при х<— п, у при — П < X я, 1 при X > Пу предельная функция F(x)=s=-^- и, следовательно, F(—оо) и F(-|~ °°) также равны . Однако в условиях нашей теоремы, как будет сей- час показано, обязательно будет F(— оо) = 0 и F (-]- оо)= 1. В самом деле, если бы это было не так, то, приняв во внимание, что для предельной функции F (х) должно быть F(—оо).^0 и F(-|-oo)^l, мы имели бы: 8=-F(H-oo)- F(— оо) <1. Возьмём теперь какое-нибудь положительное число е, меньшее 1—8. Так как по условию теоремы последовательность характеристических функций (1) сходится к функции /(Z), то/(0) = 1. А так как, сверх того, функция /(/) непрерывна, то можно выбрать достаточно малое положительное число т такое, что будет иметь место неравенство ' r| 7>’Н- <4) —X 4 Но в то же время можно выбрать -¥> — и настолько большое К, чтобы при k > К было 8к = РПк (X) - РПк(- X) < 8 + А. Так как /п}\^ есть характеристическая функция, то —-т — г Интеграл, стоящий в правой части этого равенства, можно оценить следующим способом. С одной стороны, так как = 1, то | J eiia> 2т. — т С другой стороны, т J eitx di =» — sin тх,
I 35] ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЙ 195 и так как | sin tx | С 1, то при | х ] > X Отсюда, применив первую оценку при (хКЛТи вторую при |х[>ЛГ, получаем: |//..<')"'I<| f (f «I+ —т —т + 1 I (/e^di)dFnk(x)\<2^k+^ |4»| >X -T и, следовательно, i|K(H<8+7- Это неравенство сохраняется и в пределе sLP('4<8+r’ что, очевидно, противоречит неравенству (4). Таким образом, функция F(x), к которой сходится в основном последовательность Рй (х), есть функция распределения; согласно прямой предельной теореме её характеристическая функция равна Чтобы закончить доказательство теоремы, нам остаётся доказать, что и вся последовательность (2) сходится в основном к функции F(x). Предположим, что это не так. Тогда найдётся подпоследовательность функций ....•••. (5) сходящаяся в основном к некоторой функции F* (х), отличной от F (х) по крайней мере в одной из точек непрерывности. По уже доказан- ному F*(x) должна быть функцией распределения с характеристиче- ской функцией /(/). По теореме единственности должно быть F* (х) = F (х). Это противоречит сделанному предположению. Заметим, что условия теоремы выполнены в каждом из двух сле- дующих случаев: 1) Последовательность характеристических функций fn (t) сходится к некоторой функции /(/) равномерно в каждом конечном интервале t. 13*
196 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [гл. 7 2) Последовательность характеристических функций fn (t} сходится к характеристической функции /(/). Пример. В качестве примера использования предельных теорем рассмотрим доказательство интегральной теоремы Муавра-Лапласа. В примере 4 § 33 мы нашли характеристическую функцию слу- чайной величины in = г-= • = Г п* + ре г *р) . Воспользовавшись разложением в ряд Маклорена, находим, что -it К— , it V — qe ' ? «₽ = 1 -!- (1 + #„), где о _ 9 У 1 / tt \k~2P^k + <l(-P),‘ n~ • Так как при n -> оо Rn-o, то В силу обратной предельной теоремы отсюда вытекает, что при любом х Р ?-—пр Vnpq * е 8 /fe, когда п —> со. Из непрерывности предельной функции легко вывести, что эта сходимость будет равномерна по х. § 37. Положительно определённые функции Цель настоящего параграфа дать исчерпывающее описание класса характеристических функций. Приводимая нами ниже основная теорема была одновременно найдена А. Я. Хинчиным и С. Бохнером и опубли- кована впервые С. Бохнером. Для формулировки и доказательства этой теоремы нам нужно ввести новое понятие. Мы скажем, что непрерывная функция /(/) вещественного аргумента t положительно определена в интервале — co < t < оо, если, каковы бы ни были вещественные числа • ••» *п> комплексные числа $1( $2, и целое число п п п 2 2/(^—(1)
§ 371 ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЁННЫЕ ФУНКЦИИ 197 Перечислим несколько простейших свойств положительно опреде- лённых функций. 1. /(0)>0. В самом деле, положим п=1, ^ = 0, 5Х = 1; тогда из условия положительной определённости функции /(/) находим, что 2 2/(^-0)М>/(°)>°- 2. При любых вещественных t Для доказательства положим в (1) л = 2, /1===0, /2==/, ?2 произвольны. Имеем по предположению 0< 2 2/(4-'Ж=/(°-°НЛ+/(°-+ Л=1>=1 +/(/-о)^1+/(/-О^2 = ^2>(2) поэтому величина /(-оеЛ+лоЦ, должна быть вещественной. Таким образом, если положить /(—1) — = a1-|-ipi, / (0 = а2-}* Фа> = Т + ^1^2 ==1— l8> то должно быть а18 4-М—аэ8+М = °- Так как и ?2, а следовательно, 7 и 8 произвольны, то должно быть “1 — «2= °- ₽1+₽2 = °- Отсюда следует наше утверждение. 3. При любых вещественных t 1/(0 !</(»). Положим в неравенстве (2) =/(/), ?2 =— |/(/)|; тогда согласно предыдущему 2/(0)|/(0|8—1/(01’1/(0|—1/(0121/(01>°‘ Отсюда при \f(t) | ф 0 получаем: /(0)> |/(01 • Если же |/(01 = 0, то опять-таки в силу свойства 1 /(°)> 1/(01- Из доказанного следует, между прочим, что если положительно опре- делённая функция такова, что /(0) = 0, то /'(0-0-
198 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [ГЛ. 7 Теорема Бохнер а-Х и н ч и на. Для того чтобы непрерывная функция f (/), удовлетворяющая условию/(0) = 1, была характе- ф ристической, необходимо и достаточно9 чтобы она была положи- тельно определённой. Доказательство. В одном направлении теорема тривиальна. Действительно, если /(^) = где F(x)—некоторая функция распределения, то при любом целом п, произвольных вещественных /2, ... , tn и комплексных числах Е2, имеем: пп _ п п ( - ) 2 2 Г(4-^)= 2 2 f eta!^-^dF(x) = = f 2 2^(^a^F(x)= • , n = f| S <ЧМн>». J fc = l Доказательство достаточности условий теоремы требует более сложных рассуждений. Рассмотрим последовательность чисел зависящую от цело- численного параметра п. В силу положительной определённости функ- ции /(х) мы имеем при любом № N — 1У-1 W= j 2 2 О. fe=o J = o Легко подсчитать, что в этой сумме имеется N—|г| слагаемых, для которых разность k—J равна г. Далее очевидно, что число г может изменяться от —1 До N—1. Таким образом, имеет место, равенство к «W)- 2 ЧтгИЧ""- г=«—N Умножим обе части полученного равенства на eisx и проинтегрируем по х в пределах от —к до те: Г eis<»8$ (х) dx == 2 ~"ЧгУ (?) Г e-f^eiexdx. Л г=-л ” J,
§ 37] ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЁННЫЕ ФУНКЦИИ 199 Известно, что « ( 0 для e-i(r-s)!»dx=B{ J 12тс для r = s. — к Поэтому ж « (1 = 2^ Р я’ W et8a,dx = f eiSX dFW (х)> — It —я где , f — ж есть неубывающая функция с полным изменением, равным ж Пр(’)=i J dx=/(0) = ь —те т. е. является функцией распределения. На основании первой теоремы Хелли мы можем найти последова- тельность оо при k-+ оо, для которой функции (х) (п фикси- ровано!) сходятся к предельной; обозначим её через F(w)(x). Функ- ция F^ (х) снова является функцией распределения, так как при любых N и произвольном е > О F<$ (— тс — е) = 0, (тс -J- е) = 1 и, значит, при произвольном s>0 также F<w) (_ _ S) = О, FW (тс + е) = 1. Согласно второй теореме Хелли Ж Тс lim f eiax dFW (х) = f e^dF^ (х). ft->oo J ь J — к —я Таким образом *), ж /(J) = fei*”dF^(x) —к при всех целочисленных $($ — 0, ±1, zL2, ...). *) Заметим,что попутно нами доказана следующая теорема Герг- ло т ц а. Если последовательность чисел сп(п—0, ±1, ...) обладает тем свойством, что при любом выборе комплексных чисел и произ- вольном N N N 2 S cii-j то последовательность сп может быть записана в форме ж сп = J d<s (х), —ж ъде а (х) — неубывающая функция с ограниченной вариацией.
200 ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ [ГЛ. 7 Рассмотрим теперь последовательность характеристических функ- ций определенных посредством равенства /„(/)= fe^dFn(x), —кп где F„(x)='F^(j). Легко проверить, что при всех целочисленных k л(4)=/®. (ад Но каково бы ни было t, мы можем подобрать такую последователь- ность k = k(n> t) *), что Из непрерывности функций f(t) следует, что / (0lim/(-)= lim/„(£). (4) п->оо Х"/ п->со X"/ Если мы докажем, что при всех вещественных t х ДО^Шп/ДО, \ (5) П->оо то доказательство теоремы будет завершено, так как /(/)—непре- рывная функция и поэтому, в силу обратной предельной теоремы для характеристических функций, будет характеристической функцией. С этой целью заметим, что из (3) и (4) следует равенство W={[/. (0 _/.(!)]+Z.(A)} _ =/(0 + lim к (0-/п(|)1. (6) n->co L \п /J Обозначим: 6 = г— п Согласно выбору величин k имеем О -С ® ~ • По определению функ- ции fn{t) — кп < / И9® — 1RF„(X). п *) Всюду дальше под k мы понимаем числа k[n, f).
§38] МНОГОМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 201 Воспользовавшись неравенством Буняковского, находим, что - пП J 2 (1 — cos Ox) (х) = /2 (1 - Rfn (0)), (8) — ЯП где символ Rfn (0) означает вещественную часть fn (0). Так как cos z cos аг при 0 а < 1 и — ir < к, то 1 — J* (1—cos Ox) dFn (x) = J (1—cos 0 • nz) dFn (zri)^. — ЯП —я я •< J* (1—cos г) dFn(zti). — Я А так как Fra(^) = F(’»)(z), то 1 —Я/»(0) < / (1 — cos г) rfF<») (г) = 1 — R f e“dp^ (г). — я —я (9) Отсюда в силу (3) находим, что 1-#„(•)< 1—R/(|)- Собрав вместе неравенства (7), (8) и (9), находим, что Из непрерывности функции /(/) отсюда следует, что Соотношение (5), как это видно теперь из (6), доказано. § 38. Характеристические функции многомерных случайных величин В настоящем параграфе мы излагаем без доказательств основные сведения о характеристических функциях многомерных случайных величин. Характеристической функцией л-мерной случайной величины Ц, ...? 5^) называется математическое ожидание . величину
202 ХАРАКТЕРИСТИЧЕСКИЕ функции [гл. 7 e«(Mi+<A+---+#ny, где tu /2, tn—вещественные переменные: f(tv t* .... tn} =» М ехр (г 2 ^ft). (1) fc = l Если F(xp x2, xn) есть функция распределения величины (£n S2, ..., tjw), то, как мы знаем из предыдущего*), ] г г п > ^2» • • • э ^n) = J • • • f (ехР I S • • • > #n) • (2) J J J fe=1 1 Подобно тому как и в одномерном случае, характеристическая I функция л-мерной случайной величины равномерно непрерывна во | всём пространстве (— сю << -j- оо, 1 ^/Хй) и удовлетворяет еле- | дующим соотношениям: ; /(О, 0, 0) = 1, • • •> ^n) I •С 1 (— 00 < < + °о, Л= 1, 2, ...), / ( ^2’ • • •» А») tty • • •> ^n)- По характеристической функции /(/1? /2, tn) случайной вели- чины (?!, ?2, . .4, $м) легко найти характеристическую функцию любой fe-мерной (&<л) величины (5д, 5у3, ..., компонентами которой являются величины 58(1 л)- Для этого в формуле (2) нужно положить равными нулю все аргументы t8 при s=f=Jr(\ k). Так, например, характеристическая функция величины равна A(4)=/(Vo..... о). Из определения вытекает, что если компоненты величины (£р ?2» • • •> 5W) являются независимыми случайными величинами, то её характеристическая функция равна произведению характеристи- ческих функций компонент /(^1> ^2’ •••> ^г) =/(^Р • f (^2) ••• /(О* Так же как и в одномерном случае, многомерные характеристи- ческие функции позволяют легко находить моменты различных по- рядков. ♦) Ср. теорему 1 § 28 и замечание о многомерных интегралах Стилтьеса в § 27.
§381 МНОГОМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 203 Так, например, мСС • • - С"=J / • • • / *Х* • • • х"пdF <*i' **•••>х»)= П = (/)! J О______________nf(tb Z,, ...» t„) dikt dtk% . .. dt*n • • • ==s £^=0 Для вычисления характеристических функций полезно знать сле- дующую теорему, доказательство которой без труда проведёт чита- тель. Теорема 1. Если характеристическая функция величины (5р ?2» .£») равна f(/ь /2, >. *, /п), то характеристическая фуНКЦиЯ величины (^^4-^1, °2^2 “Ь fl2> •••> г^3 ai и 0/ (1 п) — вещественные постоянные, равна п ехр(/ 2 «Л) •/• • •> ®Л)- П=1 Пример 1. Вычислим характеристическую функцию двумерной случайной величины, распределённой по нормальному закону: Р У) = 2Я(1-Г^) ехр {~ 2(Г^ [%а~2гХу По формуле (2) Ж = 2л(1—~^7 SS е<(М+< у)р (х, у) dx dy. Заменой переменных мы можем привести /(Уи /2) к виду /(*р Q = e ' -57J J е “ dudv = = -i-(*i+2rtA+#a) , Пример 2. Применяя теорему 1, мы найдём характеристическую функцию величины (т^, т]2), распределённой по нормальному закону: Vexnl 1 |(х~а)2 2г(х — — Д. О'- X ехР 4-- — ^7 2 2 2 И Г I 2(1 —И) L Qj Gg (4) Если мы положим а, т)2 = о2$2 4” т0 величина $2) будет распределена по закону (3). Согласно теореме 1 характери- стическая функция величины (т^, т]2) равна <f> = ехР [iat\ + iat2 — J (°1й + а*4) 1.
204 ХАРАКТЕРИСТИЧЕСКИЕ функции [гл. 7 Из определения характеристической функции вытекает следующая Теорема 2. Если f(tx, f%, ..., tn) есть характеристическая функция величины ($п $2, ...» ?w), то характеристическая функ- ция суммы . 4- равна /(О«Г(А А ..., О- Примечание. Заметим, что /(О =/(#!» 'Q есть характеристическая функция суммы /2?2 + • • • + ^п- Пример 3. Применим теорему 2 к определению функции рас- пределения суммы ^ + ^2, если (rjj, т]2) распределена по закону (4). Согласно теореме 2 характеристическая функция суммы тц 4е т|2 равна / (/) = ехр р/ (а Ь) — (а? 4^ 2roi<53 4" °г) j • Мы знаем (пример 1 § 33), что это—характеристическая функция нормального закона с математическим ожиданием, равным а 4-0, и дисперсией, равной я* 4~ 4" °2« Этот результат был нами получен ранее непосредственно (§ 23, пример 2). Важно заметить, что в многомерном случае сохраняется следующая теорема. Теорема 3. Функция распределения F(xx, х2, ..., хп) одно- значно определяется своей характеристической функцией. Доказательство этого предложения основывается на формуле обращения. Теорема 4. Если f(tx, tn)—характеристическая функ- ция, a F(xb х2, ..., хп)—функция распределения случайной величины (Вь ?2, ..., та Р {&кА? = 1, 2, • »., п\ =5 т т т iff f _n_ iiak ^k “J J '“ J П2 dt'dt*'"dtn' — T—T — T fc=sl где ak a bk— любые вещественные числа, удовлетворяющие един- ственному требованию9, вероятность попадания на поверхность параллелепипеда ак^ \к < bk (k — 1, 2, ..., п) равна нулю. Точно так же, как и в одномерном случае, имеют место прямая и обратная предельные теоремы для характеристических функций. Мы не будем на этом останавливаться. Пример 3. Говорят, что «-мерная случайная величина ($п ?2, ..., Вм) имеет невырожденное (собственное) п-мерное нормальное распреде- ление, если её плотность распределения имеет вид р C^i, xp • • •» — F^e ,
205 МНОГОМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ § 381 где Q (^1> -^2’ • • • > ^л) == —положительно определённая квадратичная форма, С, ai и Ьц—дей- ствительные постоянные. Несложные подсчёты показывают*), что С = ()/2гс)—" УЪ, где * ^11 ^12 ’ • • &1п 0 _ ^21 ^22 * • • ^2я &п! *•• &пп Обозначим через Dtj минор D, соответствующий элементу bijt тогда = = — (j “1, 2, ..и), fj VDuD^ Определитель D и главные миноры его положительны. Обычными подсчётами легко проверить, что характеристическая функция величины (5Р $а, .... $п) равна f(tuh......к“1^1 Таким образом, п-мерное нормальное распределение вполне опреде* ляется заданием математического ожидания и дисперсии. Из выражения для характеристической функции л-мерной нор- мально распределённой случайной величины мы видим, что распреде- ление величины ^2» • • •» при любых 1 < 4 < 4 < ... <40 будет ^-мерным нормальным распределением. *) Обычный приём при подобного рода подсчётах заключается в том, что заменой переменных приводят форму Q к сумме квадратов и все вычи- сления производят в новых переменных.
ГЛАВА 8 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА § 39. Постановка задачи Интегральная предельная теорема Муавра-Лапласа, доказанная нами в главе 2, послужила источником большого цикла исследований, имеющих фундаментальное значение как для самой теории вероят- ностей, так и для её многочисленных приложений в естествознании, технических и экономических науках. Для того чтобы составить себе представление о направлении этих исследований, мы придадим тео- реме Муавра-Лапласа несколько иную форму. А именно, если, как это мы неоднократно делали, через ji* обозначить число появлений события А в k-м испытании, то число появлений события А в п по- п следовательных испытаниях равно 2 Ил* Далее, в примере 3 § 27 fc==i п п мы подсчитали, что = и пРЯ* Поэтому теорема Муавра-Лапласа может быть записана в таком виде: при п->оо & g2 (1) /2л J 4 ' а п и словами сформулирована так: вероятность того, что сумма уклоне- ний независимых случайных величин, принимающих два значения О и 1 с вероятностями, соответственно равными q и р == 1—q (0<р<1), от их математических ожиданий, делённая на квадрат- ный корень из суммы дисперсий слагаемых, будет заключаться в пре- делах от а до Ь, при увеличении числа слагаемых до бесконечности, ь равномерно относительно а и b стремится к интегралу —е 2 а Естественно возникает вопрос: насколько тесно связано соотно- шение (1) со специальным выбором слагаемых |л/£, не будет ли оно
§ 39] ПОСТАНОВКА ЗАДАЧИ 207 иметь место и при более слабых ограничениях, наложенных на функ- ции распределения слагаемых? Постановка этой задачи, а также её решение являются в основном делом Чебышева и его учеников А. А. Маркова и А. М. Ляпунова. Их исследования показали, что на слагаемые следует наложить лишь самые общие .ограничения, смысл которых состоит в том, что отдельные слагаемые должны оказывать незначительное влияние на сумму. В следующем параграфе мы дадим точную формулировку этого условия. Причины, в силу которых эти результаты приобрели огромное значение в приложе- ниях, лежат в самом существе массовых явлений, изучение законо- мерностей которых, как мы говорили ранее, и составляет предмет теории вероятностей. Одной из важнейших схем, по которой идёт использование резуль- татов теории вероятностей в естествознании и технике, состоит в сле- дующем. Считают, что процесс протекает под влиянием большого числа независимо действующих случайных факторов, каждый из кото- рых лишь ничтожно мало изменяет течение явления или процесса. Исследователь, интересующийся изучением процесса в целом, а не действием отдельных факторов, наблюдает лишь суммарное действие этих факторов. Приведём два типичных примера. Пример 1. Пусть производится некоторое измерение. На резуль- тат неизбежно действует большое количество факторов, порождаю- щих ошибки в измерении. Сюда относятся ошибки, вызванные состоянием измерительного прибора, которое может нечувствительно изменяться под влиянием различных атмосферных или механических причин. Сюда относятся личные ошибки наблюдателя, вызванные особенностями его зрения или слуха и также могущие незначительно изменяться в зависимости от психического или физического состоя- ния наблюдателя, и т. д. Каждый из этих факторов породил бы -ничтожную ошибку. Но на измерении сказываются сразу все эти ошибки, наблюдается «суммарная ошибка». Иначе говоря, факти- чески наблюдаемая ошибка измерения будет случайной величиной, являющейся суммой огромного числа ничтожных по величине и не- зависимых между собой случайных величин. И хотя эти последние неизвестны, так же как неизвестны их функции распределения, их влияние на результаты измерений заметно и поэтому должно быть подвергнуто изучению. Пример 2. В процессе массового производства, существующего во многих отраслях промышленности, изготовляются большие партии одинаковых предметов. Обратим внимание на какую-нибудь числовую характеристику интересующего нас продукта. Поскольку это изделие находится в соответствии с техническими нормами, существует неко- торая нормальная величина избранной нами характеристики. В дей- ствительности же всегда наблюдается некоторое отклонение от этой нормальной величины. При правильно поставленном процессе про- изводства такие отклонения могут вызываться лишь случайными
208 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА [ГЛ. 8 причинами, каждая из которых производит лишь незаметный эффект. Суммарное же их действие производит заметное уклонение от нормы. Подобных примеров можно привести сколько угодно. Таким образом, возникает задача изучения закономерностей, свой- ственных суммам большого числа независимых случайных величин, каждая из которых оказывает лишь малое влияние на сумму. Этому последнему требованию мы придадим позднее более точный смысл. Вместо того чтобы изучать суммы очень большого, но конечного числа слагаемых, мы будем рассматривать последовательность сумм со всё большим и большим числом слагаемых и считать, что реше- ния интересующих нас задач даются предельными функциями распре- деления для последовательности функций распределения сумм. Такого рода переход от конечной постановки задачи к предельной является обычным как для современной математики, так и для многих отделов естествознания. Итак, мы пришли к рассмотрению следующей задачи: дана после- довательность взаимно независимых случайных величин • • •» • • • » о которых мы предположим, что они имеют конечные математические ожидания и дисперсии. В дальнейшем мы станем придерживаться следующих обозначений: А—1 /с==1 Спрашивается, какие условия нужно наложить на величины чтобы функции распределения сумм п (2) п сходились к нормальному закону распределения? В следующем пара- графе мы увидим, что для этого достаточно выполнения условия Ландсберга'. при любом т>0 я 11т 4-У J (x-«ft)2dF*(x) = 0, **"*“ *» 1 а>—ак | >iBn где F*(x) обозначает функцию распределения величины Выясним смысл этого условия. Обозначим через Ак событие, состоящее в том, что — ак\>хВп (Л = 1, 2, .... п) И оценим вероятность Р{ max |5k — ak\>tBn\. 1 < А < я
§401 ТЕОРЕМА ЛЯПУНОВА 209 Р{ max |5ft —as|> сВ„} =Р{А14-И2+ ... -|-Ая| 1 < к < п п PMi+Лз-ь ... +ЛХ2РИД к~>1 то, заметив, что Р {Ад} e J* dFk (х) (тВд)8 J* 00 I ®—afc I > тВ„ I х—ак I > tBn находим неравенство Р{ max |£д—ай|>тВ„}< 1<%<п п -irS f (x-ak)*dFk(x). В силу условия Линдеберга, каково бы ни было постоянное т > 0, последняя сумма при я—>оо стремится к нулю. Таким образом, условие Линдеберга представляет собой своеобразное требование равномерной малости слагаемых —ак) в сумме (2). Отметим ещё раз, что смысл условий, достаточных для сходимости функции распределения сумм (2) к нормальному закону, был вполне выяснен уже исследованиями А. А. Маркова и А. М. Ляпунова. § 40. Теорема Ляпунова ' Мы начнём с доказательства достаточности условия Линдеберга. Теорема. Если последовательность взаимно независимых слу- чайных величин (j2, ..., 5П, ... при любом постоянном т>0 удовлетворяет условию Линдеберга lim П-> со (x-«A)Wk(x) = 0, то при /г -> оэ равномерно относительно х -QQ (I) (2; Доказательство. Для краткости введём обозначения = ^a(x)«P{U< х}. Dn 14 Зак. 1826. Б. В. Гнедедко.
210 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА [ГЛ. 8 I Очевидно, что I MU-0, = I I и, следовательно, п | Sdu=i. (2х) I &=1 I Легко убедиться, что условие Линдеберга в этих обозначениях | принимает следующий вид: ? lim 2 f = (Г) ”->оой-=1|а,|>т Характеристическая функция суммы п п равра *“* 1 * * * * * „ *“* %(О=Плио. &=1 Нам нужно доказать, что lim <ри (/) = ₽". п ->оо С этой целью мы установим прежде всего, что множители /п&(0 при /г—>оо равномерно относительно стремятся к 1» Действительно, принимая во внимание равенство М5П& = 0, находим, /»» (0—1 = / —1 - их) dFn1c (х). Так как при любом вещественном а ♦) (3) *) Это неравенство и целую серию ему подобных можно вывести хотя бы следующим путём. Из того, что I efi* — 11 = | J dx К а (а > 0) вытекает неравенство о а —za| = | j*(eto — О Из последнего неравенства далее следует, что а |e<«—l_/a4_^|=,|J 1 —Zx)dx|< О а а < f f ^dx = ^, (S') И т. д. о7 о
211 ТЕОРЕМА ЛЯПУНОВА $ 401 то Пусть е — произвольное положительное число; тогда очевидно, что f х3</Гпк(х) = J x3dFnJe(x)-f- |£B|<e + f *edF„k(*)O9 + f x3dFni(x). |Ж|>8 |Л?|>е Последнее слагаемое может быть, согласно (Г), при достаточно больших п сделано меньше, чем г2. Таким образом, для всех доста- точно больших п равномерно относительно k (1 k п) и t в любом конечном интервале 111 Т \fniAty—и<«*п Отсюда мы заключаем, что равномерно относительно k (1 k п) lim/„*(/)=! (4) п~>оо и что для всех достаточно больших п при t, лежащих в произвольном конечном интервале |£| Т, выполняется неравенство 1Д*(0-1|<|. (5) Мы можем, следовательно, в интервале |/|^Т написать разложение (1g обозначает главное значение логарифма) 1g ?«(0=21гЛй (0 = 21g 11+(Лй (0 -1)] = ^=1 Л—1 -2(Ай(0~1)+*п. (в) Л-1 где п оо *•-2 2^(/uo-i)*. в—8 В силу (5) п оо • = l в=я2 П П 1 Unkv'J *1 Л—1 Л—1 14*
212 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА (ГЛ. 8 Так как 21/»* (0 - 11 = £ IJ (<“•-! - dFnk (х)| < Л«1 *2 2 J ^пк (*) = “2 9 ТО |/?я|<4 max н. 1<7г<п Из (4) вытекает, что равномерно относительно / в произвольном конечном интервале |/|^ Т9 при яоо (7) Но 2(ЛИб-1) = —^+-рп, (8) »—1 где Рп = у + 2 J ^ita> “1 “zZx) dF»k<*>• Л—l Пусть s > 0 произвольно; тогда в силу (2') + 2 J (-^ + ^-l-/7x)^(x). |®|>* Неравенства *(3) и (3') позволяют получить следующую оценку: / \х\*арпк(х) + ^ J xadF;t4(x)< Jtol IяI<с л==1 |*|>* <V,eS J *в^»*(*)+*2 J* *а^(*)= Л=1 |®|<s I х |>s =Ци-е+/9(1—^e)2 J ^dFnk(X). | Я?|>8 Согласно условию (Iх) второе слагаемое при любОлМ s>0 может быть сделано меньше любого т] > 0, лишь бы п было достаточно
§ ТЕОРЕМА ЛЯПУНОВА 213 большим. А так как е > 0 произвольно, то мы можем его выбрать настолько малым, чтобы, каковы бы ни были <) > 0 и Т, для всех заключённых в интервале |/| Т, выполнялось неравенство |ря|<2-П (я>л0(е, т], Г)). Это неравенство показывает, что равномерно в каждом конечном интервале значений t lim рп = 0. (9) Я-»оо Собрав вместе соотношения (6), (7), (8) и (9), мы получаем окон* чательно, что равномерно в каждом конечном интервале t Ит |g?.:(/) = — 4* П->оо 4 Теорема доказана. Следствие. Если независимые случайные величины Е2, ... . •., • • • одинаково распределены и имеют конечную отличную от нуля дисперсию, то при я—>оо равномерно по х п * & frssl —со Доказательство. Нам достаточно проверить, что при сде- ланных предположениях выполнено условие Линдеберга. С этой целью заметим, что в нашем случае гае b обозначает дисперсию отдельного слагаемого. Положив М^= а, мы можем написать следующие очевидные равенства; п Sb? J (х—d^dFkix)^ *—1 »|®—а|>та п BaWn J (х—a)8 dP\ (•*)s J <х — «)’ dFi м. 1 а | > %Вп | г—а | > тВп В силу предположения о конечности дисперсии и её положительности заключаем, что интеграл, стоящий в правой части последнего равен- ства, стремится к нулю, когда л-~>оо. Теорема Ляпунова. Если для последовательности взаимно независимых случайных величин ..., $п, ... можно подобрать такое положительное число 8 > 0, . wo при п->оо п - (10> - » fc—1 * ' -
214 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА [гл. 8 то при п-+ оо равномерно по х п Р /2л: Р * Доказательство. Нам снова достаточно проверить, что усло- вие Ляпунова (условие (10)) влечёт за собой выполнение условия Линдеберга. Но это ясно из следующей цепочки неравенств: п р x-ak\i+idFk^)< ^$\*-ак \2+idFk(x) Zc = l § 41. Локальная предельная теорема Мы приведём теперь достаточные условия для применения другой классической предельной теоремы — локальной теоремы. При этом мы ограничимся рассмотрением только случая взаимно независимых слагаемых, имеющих одно и то же распределение вероятностей. Условимся говорить, что дискретная случайная величина Е имеет решетчатое распределение, если существуют такие числа а и h > 0, что все возможные значения Е могут быть представлены в виде а + kh, где параметр k может принимать любые целые значения (— оо < k < оо). К решетчатым относятся, например, распределения- Пуассона, Бернулли и др. Выразим теперь условие решетчатости распределения случайной величины Е в терминах характеристических функций. С этой целью докажем следующую лемму. Лемма. Для того чтобы случайная величина Е имела решет- чатое распределение, необходимо и достаточно, чтобы при не- котором модуль её характеристической функции был равен единице. Доказательство. Действительно, если t распределена решет- чато и р]с есть вероятность равенства Е = а Ц- то характеристи- ческая функция величины Е равна V „ iat V „ J^kh & рке 1==ле 2л Prf • /Css — эо • А»»—оо
§411 ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 215 Отсюда находим, что а со а &==—оо Мы видим, таким образом, что для каждого решетчатого распреде- Предположим теперь, что при некотором tx ф О 1/(01 “1. и докажем, что при этом С имеет решетчатое распределение. Послед- нее равенство означает, что при некотором О /W-Л Таким образом, / eitlXdF{x)^ea и, следовательно, (*)==!. Отсюда вытекает, что J cos (fax — Q)dF (х) = 1. Для того чтобы это равенства было возможно, необходимо, чтобы функция F (х) могла расти только при тех значениях х, при которых I cos(/xx— 9) = 1. Это означает, что возможные значения 5 должны быть вида ч. тр. д. Число h мы будем называть шагом распределения. Шаг распределения h максимален, если ни при каких b (— оо < < b < оо) и hx > h нельзя представить все возможные значения 5 в виде b~\-khv Для иллюстрации различия между понятиями шага распределения и максимального шага распределения рассмотрим такой пример. Пусть 5 может принимать в качестве своих значений все нечётные числа. Очевидно, что все значения $ могут быть записаны в виде a -J- ЛА, где а = 0, А=1. Шаг А, однако, не будет максимальным, так как все возможные значения 5 можем записать также в виде 64_ЛА1, где 6=1, ^ = 2.
216 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА [ГЛ. 8 Условия максимальности шага распределения можно выразить и в других терминах. Во-первых. Шаг распределения будет максимальным тогда и только тогда, когда общий наибольший делитель попарных разностей возможных значений величины 5, поделённых на А, равен единице. Во-вторых. Шаг распределения А максимален тогда и только тогда, когда модуль характеристической функции в промежутке О < 111 < меньше единицы и при равен единице. Последнее утверждение немедленно вытекает из только что дока- 2я занной леммы. В самом деле, если при 1/(01 “1, то согласно доказанному величина — должна бцть шагом распреде- ления, а так как 2я А<Т’ то шаг h не может быть максимальным. Отсюда мы можем сделать такой вывод: если h—максимальный шаг распределения, то для каждого в > 0 найдётся такое число cQ > О, 2я u что при всех t в интервале е | /1 ----е имеет место неравенство 1/(01 (1) Пусть теперь случайные величины Е2, ..., Еп, ... взаимно независимы, решетчато распределены и имеют одну и ту же функ- цию распределения F (х). Рассмотрим сумму -J- -f- • . . -’j- Очевидно,; что она также является решетчатой случайной величиной и возможные её значения могут быть записаны в виде па -f - АЛ. Обозначим через Рп (А) вероятность равенства Cw = па -f- АА; в частности, (А) = Р {Е, = а АА } = рк. Обозначим далее anA-kh— Ап гпк = —^в---------------------------- • Dn где Ans= IVICn, = DCtj s=j Мы можем теперь доказать следующее предложение, очевидным образом обобщающее локальную предельную теорему Муавра-Лапласа. ” 'Тебрёма. Пусть независимые решётчатые случайные вели- чины -••• -- : — : ’ -•'<••• - ' " - •' ^2» ~ - - --
$ 4|] ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 217 имеют одну и ту же функцию распределения F(x) и их мате* матические ожидания и дисперсии конечны. Тогда для того чтобы равномерно относительно k (— оо < k < оо) при п-+ оо имело место соотношение В 1 £ 2-°' необходимо и достаточно^ чтобы шаг распределения h был макси* мальным. Доказательство. Необходимость условия теоремы почти оче- видна. Действительно, если шаг h не максимален, то возможные п значения суммы Cn = 2 будут содержать систематические пропуски: разность между ближайшими возможными значениями суммы не может быть меньше dh> где d есть общий наибольший делитель разностей возможных значений С*, делённых на h. Если h—не максимальный шаг, то d>l при всех значениях п. Доказательство достаточности условия теоремы требует несколько более сложных рассуждений. Характеристическая функция величины $л(&=1, 2, 3, ...) равна /(/) = S рьв****™^,™ 2 рк^, Jctst—со к«- оо а характеристическая функция суммы С» есть fce-OO Умножив последнее равенство на и проинтегрировав л « его в пределах от —7? до 7Г ’ нах°Дим* чт0 ж и *Lpn(k)= J dt. * Заметив, что М==В„гя^4-Дп — ап (вместо гпк мы будем дальше писать г), можем написать % h . ^Pn{k}~ J ; к h
218 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА ГЛ. $ где обозначено Положив, наконец, х = /Вя, находим окончательно:. ь ^-Pn{k)^ J ₽-<**/•* _Z£a h Легко подсчитать, что 1 ~т 1 е 2 в — У2те 2к Представим разность Я.-2« в виде суммы четырёх интегралов Р» =Л + 4+4+4» J4= f e-^f*n(-^-\dx, •7 \ &П ' 4<|а>|<»В п где А > 0 — достаточно большое, а е > 0 — достаточно малое по- стоянные числа, более точные значения которых будут выбраны нами позднее. В силу следствия из теоремы, доказанной в предыдущем пара- графе, в любом конечном интервале значений t равномерно относи- тельно t выполняется соотношение t2 ~ (я-*00). Но отсюда следует, что каково бы ни было постоянное 4, Jj —> 0 (я —> оо).
219 § 4IJ ЛОКАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА Интеграл оценивается посредством неравенства f ~ 2 Г 2 ps|< J е dx^=—e 3 . \х\>А А Выбрав достаточно большое Ау мы можем сделать J2 сколь угодно малым. Согласно неравенству (1) имеем: / НОГ"* <e-««o2B„g-e Отсюда ясно, что при п -> со Л-4 0. Для оценки интеграла мы заметим, что существование диспер- сии влечёт за собой существование второй производной у функ- ции /*’(/). Мы можем, следовательно, в окрестности точки / = 0 воспользоваться согласно (3) § 33 разложением /* (0 = 1 — tW). и при 111 з, если в достаточно малб, получим: Тогда при |х|<вВп пМ Поэтому вВя 00 £. 1Л|<2/« * dt <2$е~~dt. А А А Выбором достаточно • большого А мы можем добиться, чтобы инте- грал J4 был сколь угодно мал. Теорема доказана. Имеется ещё другой случай, когда естественно ставить вопрос о локальном поведении функций распределения сумм. Это — случай непрерывных распределений. Здесь ставится вопрос о том, когда плотности распределения нормированных сумм сходятся к плотности нормального распредели-
220 КЛАССИЧЕСКАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА (ГЛ. 8 I ния, если соответствующие функции распределения сходятся к нор- I мальной. I Оказывается, что для случая одинаково распределённых независи- f мых слагаемых с конечной дисперсией достаточным, является условие | интегрируемости плотности слагаемых в какой-либо степени S > 1. f Если отказаться от этого условия, то легко указать примеры | случайных величин, имеющих плотности распределения вероятностей J и принимающих значения только в ограниченном интервале, но для $ которых локальная теорема не имеет места (см. монографию Гне- j денко и Колмогорова). ;
ГЛАВА 9 ТЕОРИЯ БЕЗГРАНИЧНО-ДЕЛИМЫХ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ Долгое время центральной задачей теории вероятностей считали отыскание наиболее общих условий, при, выполнении которых функ- ции распределения сумм независимых случайных величин сходятся к нормальному закону. Весьма общие условия, достаточные для этой сходимости, были найдены, как мы говорили об этом в главе 8, А. М. Ляпуновым. Попытки расширить условия Ляпунова увенчались успехом лищь в самые последние годы, когда были найдены условия, явля- ющиеся не только достаточными, но и при весьма естественных огра- ничениях, необходимыми. Параллельно с завершением классической проблематики возникло и развилось новое направление в теории предельных теорем для сумм независимых случайных величин, тесно связанное с возникновением и развитием теории стохастических (случайных) процессов. В первую очередь возник вопрос о том, какие законы, помимо нормального закона, могут быть предельными для сумм независимых случайных величин. Оказалось, что класс предельных законов далеко не исчерпы- вается нормальным законом. Затем возник вопрос об определении условий, которые следует наложить на слагаемые, чтобы функции распределения сумм сходились к тому или иному предельному закону. В настоящей главе мы ставим своей целью изложение некоторых исследований последних лет, посвящённых предельным теоремам для сумм независимых случайных величин. При этом мы ограничиваемся случаем, когда слагаемые имеют конечные дисперсии. Рассмотрение задачи без этого ограничения требует более громоздких вычислений; Для ознакомления с её решением мы отсылаем читателя к упоминав- шейся монографии Гнеденко и Колмогорова. В качестве простого следствия излагаемых нами общих теорем мы получим упомянутое нами необходимое и достаточное условие сходимости функций распре- деления сумм к нормальному закону.
222 БЕЗГРАНИЧНО-ДЕЛИМЫЕ законы [гл. 9 § 42. Безгранично-делимые законы и их основные свойства Закон распределения Ф (х) называется безгранично-делимым^ если, каково бы ни было натуральное число п, случайная величина, распределенная по закону Ф (х), является суммой п независимых случайных величин $2, ..., 5М, с одним и тем же законом распре- деления Фп(х) (зависящим от числа слагаемых /г). Понятно, что это определение равносильно следующему: закон Ф (х) называется безгранично-делимым, если при любом п его характери- стическая функция является n-й степенью некоторой другой характе- ристической функции. Исследования последних лет показали, что безгранично-делимые законы играют значительную роль в различных вопросах теории вероятностей. В частности, оказалось, что класс предельных законов для сумм независимых случайных величин совпадает с классом без- гранично-делимых законов. Мы перейдём теперь к изложению необходимых нам для даль- нейшего свойств безгранично-делимых законов. Это изложение мы начнём с доказательства того, что законы нормальный и Пуассона безгранично-делимы. Действительно, характеристическая функция нормального закона, имеющего математическое ожидание а и дис- персию о8, равна /А iat"Г’’** При любом п корень я-й степени из <?(/) есть снова характеристи- ческая функция нормального закона, только с математическим ожи- данием А и дисперсией Мы несколько обобщим встречавшееся ранее понятие закона Пуассона и скажем, что случайная величина 5 распределена по закону Пуассона, если она может принимать только значения ak-\-bt где а и # —вещественные постоянные, a k = 0, 1, 2, ... и = + = (1) где X—положительное постоянное. Характеристическая функция для закона (1), как легко подсчитать, даётся формулой ?(/) Мы видим, что при любом п корень л-й степени из ср (/) есть снова характеристическая функция закона Пуассона, но с другими пара- метрами5 а, ~ и — Ь. г 9 п п Теорема 1. Характеристическая функция безгранично-дели- мого закона не обращается в нуль.
1 42] ОСНОВНЫЕ СВОЙСТВА 223 доказательство. Пусть Ф (х)— безгранично-делимый закон и ©(/)— его характеристическая функция. Тогда, по определению, прй любом п мы имеем равенство ' ?(0 = {?п(0П (2) где ?п(0 — некоторая характеристическая функция. В силу непре- рывности функции ср (/) существует область значений аргумента в которой ф(/)^:0; понятно, что в этой же области (О Ф °- ^ри Достаточно большом п мы можем величину | фл (/) | = не |/|ср (/) [ сделать сколь угодно близкой к единице равномерно по t (| /| 'С а)* Возьмём теперь две взаимно независимые случайные величины и т]2, распределённые по некоторому закону F(x), и рассмотрим их разность 71 = т]1 — т]2. Характеристическая функция величины т; равна /* (/) = Мг^-’ь) = | М^|2 = |/(0|а. Мы видим, таким образом, что квадрат модуля любой характеристи- ческой функции является характеристической функцией. Далее, так как вещественная характеристическая функция имеет вид / (^) == J* cos xl dF (х), то, следовательно, мы можем написать неравенство (1 — cos 2х/) dF (*) = 2 J sin9 х/ dF (х) =» =» 2 J (1 — cos х/) (1 4- cos xi) dF(x)^4 $ (1 — cos xt) dF (x) = = 4 (1-/(0). Из сказанного мы видим, что функция | cpw (019 удовлетворяет неравенству 1-|?п(20|2<4(1-[?м(012)- Из этого неравенства следует, что если п столь велико, что 1 — 1?п(0| < « ПРИ то в той же области 1 - 1?П(201 < 1 -1?» (20|а <4(1- |?п (01») < 8(1 -1?„ (01) < 89. Итак, в области |/|^2а 1 — l?n(0l<8s. Таким образом, при достаточно больших п в области [ /] 2а, fn (О, а вместе с тем и ® (0 в нуль не обращаются. Подобным же способом мы докажем, что <р (£)=/= 0 в области и 1 < 4а, и т. д. 1—/(20 = J
224 БЕЗГРАНИЧНО-ДЕЛИМЫВ ЗАКОНЫ [ГЛ. $ Это доказывает нашу теорему. Теорема 2. Функция распределения суммы независимых слу* чайных величин, имеющих безгранично-делимые функции распре деления, также безгранично-делима. Доказательство. Очевидно, что для доказательства теоремы достаточно ограничиться случаем двух слагаемых. Если <р(0 и ф(0 — характеристические функции слагаемых, то по условию теоремы при любом п имеем: где (0 и фп(/)—характеристические функции. Поэтому характе- ристическая функция суммы при любом п удовлетворяет равенству Теорема 3. Функция распределения^ предельная (а смысле сходимости в основном) для последовательности безгранично-дели- мых функций распределения, сама является безгранично-делимой. Доказательство. Пусть последовательность Ф (*) (х) без- гранично-делимых функций распределения сходится в основном к функции распределения Ф (х). Тогда lim ?(*) (0 = <?(/) (3) Л->оо равномерно в каждом конечном интервале 4 По условию теоремы при любом п функции (под понимается его главное значение) (4) являются характеристическими функциями. Из (3) заключаем, что при каждом п lim ?<,*)(/) = %; (/). fc->00 (5) Из непрерывности следует непрерывность ?„(/)• В силу пре- дельной теоремы для характеристических функций, ?„(/) есть харак- теристическая функция. Из (3), (4) и (5) находим, что при каждом Л имеет место равенство ?(0 = {?„(0)в. ч. тр. д. § 43. Каноническое представление безгранично-делимых законов В дальнейшем мы ограничимся изучением безгранично-делимых законов с конечной дисперсией. Целью настоящего пара- графа является доказательство следующей теоремы, найденной в 1932 г. А. Н. Колмогоровым и дающей полную характеристику интересующего нас класса законов распределения.
КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ 225 §431 Теорема 4. Для того чтобы функция распределения Ф (х) конечной дисперсией была безгранично-делимой, необходимо и д статочно, чтобы логарифм её характеристической функции имел вид lg?(O = ‘V+J 1 — itx}-~dG{x), (1) г$е ч__вещественная постоянная, а О(х)—неубывающая функ- ция ограниченной вариации» Доказательство. Предположим сначала, что Ф(х)— безгра- нично-делимый закон и ср(/) — его характеристическая функция. Тогда при любом п где<?п(/)-—некоторая характеристическая функция. Так как <р(/):£0, то это равенство эквивалентно следующему*): 1g ? (О = «1g ?п (О = «1g 11 + (?»(О — DL Каково бы ни было Т при я-» сю равномерно в интервале р| < Т, <Рп (0 -> 1. поэтому в любом конечном интерзале значений / величина |фп(/) —11 может быть сделана меньше любого, наперёд заданного числа, лишь бы п было достаточно велико. Мы можем, следовательно, воспользо- ваться равенством lg [1 + (?п (0 — 1) “ (<?» (/) — 1) (1 + о (1)), которое даёт: 1g ? (О = Нт п (©„ (/) — 1) — lim п f (е«® — 1) d$n (х), (2) П->ОО П->СО где Фп(х)— функция распределения, имеющая <рп(/) своей характе- ристической функцией. Из определения математического ожидания и связи между функциями Фп (х) и Ф (х) следует, что п J х йФп (х) = J х с?Ф (х). Обозначим эту величину через 7; тогда равенство (2) мы можем переписать в следующем виде: 1g <р (/) = lim п f {eitx — 1 — Itx} d$n (x). n-»oo * Положим теперь On (x) = n j* d$n (и). —oo Очевидно, что функции Crn(x) не убывают с возрастанием аргумента и Оп (— оо) = 0. Кроме того, функции Оп (х) ограничены в сово- *) Логарифм здесь понимается в смысле главного значения. 15 Зак. 1826. Б. В. Гнеденко. •
226 БЕЗГРАНИЧНО-ДЕЛИМЫЕ ЗАКОНЫ {ГЛ. 9 Я купности. Последнее утверждение вытекает из свойств дисперсии и 1 связи между функциями Ф (х) и Фп (х). Действительно, 1 On(+°°)=«J «2<*Ф„(«) = I =п [ J «2^Ф„ («) — ( J « №п (и))8 ] + «(J ttd$n («))’ = = ®24-7К2. (3) . где а2—дисперсия закона Ф(х). В новых обозначениях (см. свойство 6 интеграла Стилтьеса в § 24) lg<p(O = ty+ llm f(ew® — 1— itx)~dGn(x). n->oo V Согласно первой теореме Хелли, из последовательности функций Qn (х) можно выбрать подпоследовательность, сходящуюся к некото- рой предельной функции G (х). Если Д <0 и В > 0 являются точками 1 непрерывности функций О(х), то в силу второй теоремы Хелли при | k —> оо । в в I f _ 1 _ их) 2_ аа„к (X) -> J —1 — их) ± do (х). (4) I A A I Мы знаем,- что | |е<^—1—Z/x|<|^ —1|+|/х|<|/х| + |/х| = 2|/|. |х|, поэтому А со | J + J(^-1 -Ux) ^dO„ft(x)|< -“•со В < — оо В 4 оо А со <2)/|( J+ J -f7rrf0nfc(A))<2PL( J +J №t(x))< —со В —оо JB max (dGn (х), 1 l<fc<ooj к где Г = min (| А |, В). Так как вариации функций (а) равномерно ограничены, то, каково бы ни было е > 0, мы можем, выбирая А и В достаточно большими, добиться выполнения неравенства | А оо | j + J(e«»-l-to;)^dO„lk(x)|<| (б) — оо В
КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЙ 227 для всех /, заключённых в каком-либо конечном интервале, и для всех Из (4) и (5) следует, что, каково бы ни было s > 0, для всех /, заключённых в произвольном конечном интервале, при достаточно больших п имеет место неравенство | J — 1 — itx) dOnk (х) — J — 1 — itx) dG (х) | < г, т. е., иными словами, lim J(eitx — 1 — itx)^dGnje (х) = J — 1 —itx)^dG (х). Мы доказали, таким образом, что логарифм характеристической функ- ции любого безгранично-делимого закона может быть записан в виде(1). Нам предстоит теперь доказать обратное предложение, что всякая функция, логарифм которой представим по формуле (1), является ха- рактеристической функцией некоторого безгранично-делимого закона. Для любого е(0<е<1) интеграл £ J (в«« —1—z7x)-^rfO(x) (6) е по определению интеграла Стилтьеса является пределом сумм п 2>‘Ч-1-йх8) ^-(0(х8+1)-0(х.)), 8=1 * где х, = г, хп+1 = -^, х8<х8<х84~1, и . тах(х8+1—х8)->0. Каждое слагаемое этой суммы является логарифмом характеристиче- ской функции некоторого закона Пуассона. Согласно теоремам 2 и 3 интеграл (6) является логарифмом характеристической функции некоторого безгранично-делимого закона. Переходя к пределу при мы убеждаемся, что то же самое Ихмеет место для интеграла J itx)^dQ{x). (7) ®>0 Подобным же образом доказываем, что интеграл J 1 —(8) а<0 15»
228 БЕЗГРАНИЧНО-ДЕЛИМЫЕ ЗАКОНЫ [гл. $ Я есть логарифм характеристической функции некоторого безгранично* Я делимого закона. Интеграл, стоящий в правой части формулы (l)t Ц равен сумме интегралов (7) и (8) и величины Ц ZT/_^s(0( + 0)_0(_0)). J Последнее слагаемое есть логарифм характеристической функции нор- I мального закона. Из теоремы 2 следует, что функция ср (/), предста- вимая формулой (1), является характеристической функцией некото- рого безгранично-делимого закона *). Нам остаётся теперь убедиться, что представление 1g ср (7) формулой (1) единственно, т. е. что функ- § ция G(x) и постоянное 7 однозначно определяются з а данием <р(/). ? Путём дифференцирования формулы (1) находим, что * ^lg?(0=------J eitxdG(x). (9) Из теории характеристических функций мы знаем, что функция О (х) в этой формуле однозначно определяется через 1g ср (/). В, про- | цессе доказательства теоремы мы видели, что постоянное 7 является | математическим ожиданием и, значит, так же однозначно определяется | посредством функции <р(/). | Отметим, наконец, вероятностный смысл полной вариации функ- 1 ции G (х). Мы знаем, что если случайная величина Е распределена | по закону Ф (х), то (см. (6) § 33) | из (9), следовательно, вытекает, что DS = pG(x) = G(-J-<x>). В качестве примеров мы приведём каноническое представление нормального закона и закона Пуассона. Для нормального закона с дисперсией а2 и математическим ожи- данием а для для х<0, х > 0. Ч — а и *) Мы только что доказали, что всякий безгранично-делимый закон яв- ляется либо композицией конечного числа законов Пуассона и нормального закона, либо пределом равномерно сходящейся последовательности таких законов. Таким образом, мы видим, что законы нормальный и Пуассона яв- ляются тедаи основными элементами, из которых составлен каждый безгра- нично-делимый закон.
ПРЕДЕЛЬНАЯ ТЕОРЕМА 229 § 44] Действительно, эта функция и постоянное 7 приводят к данному закону, так как J — 1 — Ux] dG (х) = = Hm eltU~J"[О( + 0) — О(-0)] ------------ U->0 “ z а в силу единственности канонического представления другие функ- ции G(x) не могут дать нормального закона. Подобным же способом легко убедиться, что закону Пуассона с характеристической функцией соответствует функция G(x) с единственным скачком в точке а: (О для х < а, а2Х для х > а и = § 44. Предельная теорема для безгранично-делимых законов Мы уже знаем, что если последовательность безгранично-делимых законов распределения сходится к предельному закону распределения, то этот предельный закон сам является безгранично-делимым. Теперь мы укажем условия, при выполнении которых данная последователь- ность безгранично-делимых функций распределения будет сходиться к предельной. Теорема 5. Для того чтобы последовательность {Фп(х)} без- гранично-делимых функций распределения сходилась при п-^оо к некоторой функции распределения Ф (х) и дисперсии их сходи- лись к дисперсии предельного закона, необходимо и достаточно, чтобы существовали такие постоянное 7 и функция G(x), для которых при п—> оо 1) Gn (х) сходится в основном к G(x) (—00 ^-j-oo), 2) Gw(oo)->G(oo), 3) ъ»-*ъ г°е 7П и Gn(x) определяются формулой (1) § 43 для закона Фм(х), а постоянное 7 и функция G (х) определяют по той же формуле предельный закон Ф (х). Доказательство. Достаточность условий теоремы является непосредственным следствием второй теоремы Хелли. Действительно, из условий теоремы и формулы (1) § 43 следует, что при- п->оо 1g (0 1g Т (0 равномерно в каждом конечном интервале t.
230 БЕЗГРАНИЧНО-ДЕЛИМЫЕ ЗАКОНЫ (гл. 9 В предыдущем параграфе мы видели, что интегралы J dGn (в) и / dO (и) равны дисперсиям законов Фй(х) и Ф (х); поэтому второе условие теоремы есть не что иное, как требование сходимости дисперсий. Пусть теперь нам известно, что при п —> оо Ф„(х)->Ф(х) (1) и дисперсии законов Фй(х) сходятся к дисперсии предельного за- кона Ф (х). Мы докажем, что эти требования влекут за собой вы- полнение условий теоремы. В отношении условия 2, как мы только что заметили, это не требует дополнительных рассуждений. Отсюда следует, что полные вариации функций Gn(u) ограничены в совокуп- ности. Мы можем, следовательно, воспользоваться первой теоремой Хелли и из последовательности функций Gn(u) выбрать подпоследо- вательность Gnk (и), сходящуюся при k —> оо к некоторой предель- ной функции Ооо(м). Наша цель состоит в том, чтобы Доказать ра- венство Goo («) = 0(a). Для этого установим сначала, что 4 = J leitU — 1 — itu\ d0*k («) ~> -> Ло= J {е«“ — 1 — itu] 1 («) (2) при k-+oo. Пусть Л<0 и В>0— точки непрерывности функций Gqo(w); тогда по второй теореме Хелли при £->оо в в I {е«“— 1 — ttu] -^dGnk («) -* J{eitu — 1— ituj-^dGaXu). (3) А А С другой стороны, из неравенства | eitx — 1 — z/x | 21 tx\ мы видим, что А оо А оо —оо В < ( / + Г<“>) < т?1 /-'<’«» (“)• — оо Q
ПРЕДЕЛЬНАЯ ТЕОРЕМА 231 §441 где p==min(—А, В). В силу ограниченности вариаций функций Gn(«) в совокупности для любого е > 0 можно подобрать столь большие по абсолютной величине Л и В, что (4) Точно так же при любом «> 0 для достаточно больших по абсо- лютной величине А и В имеет место неравенство А оо | J + J {eitu— 1 — Ни} -^dGx (a) | < в. (5) —оо В Из соотношений (3), (4) и (5) выводим, что, каково бы ни было е > 0, при достаточно больших значениях k | Jfc ““ Joo | < 3s. Соотношение (2), таким образом, доказано. Из (1) видим, что lim lg<fn (0 = lim (i^nt f {e^— 1 — itu\^dGn (a)) = n->oo n~>OO 4 V u, / = lg ? (0 = W+ f leitu—1 — dG(u), ИЛИ en+ J — (6) Из неравенства /2у/2 и ограниченности в совокупности полных вариаций функций 0Пк(ц) заключаем, что при /«->0 равномерно по п. Поэтому при /->0 (6) даёт: limT„=7, (7) А->оо ** а, с другой стороны, по (2) и (7) 1g ? (О = W + J ------ 1--iai\ ^2 (“)• В силу единственности представления безгранично-делимых законов формулой (1) § 43 мы заключаем, что Gco(tf) = 0(a). Итак, любая
232 БЕЗГРАНИЧНО-ДЕЛИМЫЕ законы [гл. 9 сходящаяся подпоследовательность функций СПк (и) сходится к функ- ции G(u) и одновременно постоянные уПк сходятся к 7. Теперь легко доказать, что вся последовательность Gn (и) также сходится к G (и) и, значит, одновременно lim Если бы это было не так, то _ п->оо нашлась бы точка непрерывности функций G(zz), назовём её с, и под- последовательность функций Gnfc(zz), которая в точке и = с при k -> 00 сходится к числу, отличному от G(c). По первой теореме Хелли мы можем из этой подпоследовательности выбрать сходящуюся подпо-. следовательность СМЙ, (и). Из предыдущего следует, что во всех точках непрерывности функ- ции G (zz) lim («) = Q («). Г->ОО г Это противоречит сделанному нами допущению. Таким образом, во всей точках непрерывности функции G(u) lim Gn (zz) = G(zz); n->oo как мы видели, отсюда немедленно следует, что ИтТя = Т. П->со Теорейа доказана. § 45. Постановка задачи о предельных теоремах для сумм Дана последовательность серий ^12» • • • > ^21> ^22’ • • •> ^2fe> • • • » (1) независимых в каждой серии случайных величин. Спрашивается, к каким предельным функциям распределения могут сходиться функции рас- пределения сумм + ^2 + • • • при п->оо и каковы условия этой сходимости? В дальнейшем мы ограничимся изучением элементарных систем, т. е. последовательностей серий (1), для которых выполнены сле- дующие условия: 1) величины имеют конечные дисперсии, 2) дисперсии сумм См ограничены не зависящей от п константой С, 3) pn= maxDSMfc->0 при л->со. 1
§461 ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СУММ 233 Последнее требование означает, что влияние отдельных слагаемых на сумму становится всё меньше и меньше с возрастанием л. рассмотренные нами ранее предельные теоремы для сумм, оче- видно, укладываются в эту общую схему. Так, в теоремах Муавра- Лапласа и Ляпунова мы имели следующую последовательность серий: ^п2> • • * ’ где п=1,2, В теоремах Бернулли, Чебышева и Маркова о законе больших чисел мы также имели дело, с последовательностью серий, в которых в ка- честве взяты величины § 46. Предельные теоремы для сумм Пусть имеется элементарная система; обозначим через функцию распределения случайной величины и через Fnk(x)— функцию распределения величины \пк = ^пк— очевидно, что ^пк (•£) = Fnk (х -j- М $№&)• Теорема 6. Для того чтобы функции распределения сумм + • • • + ^nkn (1) при п-+ оо сходились к предельной функции распределения, не- обходимо и достаточно, чтобы к предельному закону сходились безгранично-делимые законы, логарифмы характеристических функ- ций которых определяются формулой (О = SJ* М U+ J (^- 1)^я»(*)}*)• (2) *) Если ввести обозначения Gn(u)=2 и заметить, что J*х dFnk (х) = 0, то функции (/) могут быть записаны в виде Фп (0 = W + J {^“ -1 - itu} ±dGn («). Как мы знаем, это означает, что фп(0 является логарифмом характеристи- ческой функции некоторого безгранично-делимого закона. Отметим, что дисперсии и безгранично-делимых законов (2) совпадают. J* х2 dFnk (х)
234 безгранично-делимые законы [гл. g Предельные законы для обеих последовательностей совпадают. Доказательство. Характеристическая функция суммы (1) равна k„ кп /»(о=Д/пк(о=« ДЛй(о, (3) где —характеристическая функция случайной величины ЕпЬ a fnk (0 — характеристическая функция величины ЕлЛ. Мы знаем, что для сходимости функций распределения сумм (1) к предельной Ф (х) необходимо и достаточно, чтобы при п -> оо ЛЮ->?('), где <р (0 — непрерывная функция; о (/) при этом оказывается харак- теристической функцией закона Ф(х). Положим < anfc = fnk (О 1 • Для величин равномерно в каждом .конечном интервале t a„= max |anfc|->0. (4) 1 С к < кп Действительно, anfc = J* — J) dFnk (x) = J {etta> — 1 — zZx) dFnk (x), так как M — J* х dFnk (x) = 0. Мы знаем, что при всех вещественных a поэтому 1«пл1<£р^ (*)=?DU- (5) Из (5) и третьего условия элементарности системы следует (4). Из (4) мы прежде всего выводим, что при любом Т мы можем считать, что для достаточно больших п и |/| Т (6) В силу этого мы можем воспользоваться разложением логарифма в ряд 2 3 (0 = 1g (1 + «»*) - *п/—• ••=«»* + '-»*•
§ 4gj ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СУММ 235 Очевидно, что =। ig/„ со— 2 и+а»й)|=j 2 w—“»*) I п п=1 П“1 ci Ст n«2 fc=l Формулы (5) и (6) приводят к неравенству Rn< max |a„k|2la»ftK'¥ max la«fcl* В силу (4) мы заключаем, что равномерно в каждом конечном интервале t при га—> оо |lg/»(0-WI"*0. (8) Таким образом, мы установили, что в каждой элементарной системе функции распределения сумм Сл а безгранично-делимые функции распределения, определяемые формулой (2), неограни- ченно сближаются при л->оо, чем собственно теорема 6 и дока- зана. Доказанная теорема позволяет заменять исследование сумм (1) случайных величин с функциями распределения, вообще говоря, произвольными исследованием безгранично-делимых законов. Послед- нее, как мы увидим, во многих случаях оказывается весьма про- стым. Теорема 7. Всякий закон распределения, предельный для функ- ций распределения сумм элементарной системы, является безгра- нично-делимым с конечной дисперсией и, обратно, каждый безгра- нично-делимый закон с конечной дисперсией является предельным для функций распределения сумм некоторой элементарной системы. Доказательство. Из предыдущей теоремы мы знаем, что предельный закон для функций распределения сумм (1) является предельным для безгранично-делимых законов и, значит, по теореме 3 является безгранично-делимым; его дисперсия конечна, так как дисперсии сумм по второму условию элементарности системы огра- ничены в совокупности. Обратное предложение, что каждый без- гранично-делимый закон с конечной дисперсией является предель- ным для сумм, немедленно вытекает из определения безгранично- делимых законов. Теорема 8. Для того чтобы функции распределения сумм (1) при п—>оо сходились к какой-нибудь предельной функции распределения и их дисперсии сходились к дисперсии предельного
236 БЕЗГРАНИЧНО-ДЕЛИМЫЕ ЗАКОНЫ (гл. 9 закона, необходимо и достаточно, чтобы существовали такие функция G(u) и постоянное т, что при я->оо к н 1) f x*dFnk(x)~+G(u) -оо в точках непрерывности функций G (и) кп 2) 2 f *2dFnk (х) -> G (+ оо), к=1 J кп . Логарифм характеристической функции предельного закона определяется формулой (1) § 43 с только что определёнными функ- цией G(y) и постоянной Доказательство. Если ввести обозначения <?»(«) =2 fx*dFnk(x) Л—1 —оо И к. - In =:= S [хdFnk(x)i то мы придём к условиям теоремы 5. Теорема этим доказана. Несколько видоизменив формулировку последней теоремы, мы можем получить не только условия существования предельного за- кона, но также и условия сходимости к каждому данному предель- ному закону. Теорема 9. Для того чтобы функции распределения сумм (1) при /г-»оо сходились к данной функции распределения Ф(х) и дисперсии сумм сходились к дисперсии предельного закона, не- обходимо и достаточно, чтобы при п-+оо выполнялись следующие условиях к н 1) 2 $ x*dFnk(x)-+G(u) *==1-00 в точках непрерывности функции G(u), 2) 2 J x2rfFnft(x)^G(oo), kn 3) 2 f X dFnk (x) Y, k=lJ где ' функции G(u) и постоянное у определяются формулой (1) § 43 для функции Ф (х).
СХОДИМОСТЬ К НОРМАЛЬНОМУ ЗАКОНУ 237 §471 g 47, Условия сходимости к законам нормальному и Пуассона Мы применим результаты предыдущего параграфа к выводу усло- вий сходимости функций распределения сумм к законам нормальному и Пуассона. Теорема 10. Пусть дана элементарная система независимых случайных величин. Для того чтобы функции распределения сумм = + &П2 (!) при п-+<х> сходились к закону Ф(х) = необходимо и достаточно, чтобы при л -> со были выполнены условия 1) 1 J к п 2) 2 x*dFnM-*0, 1®1 >Т п л _ 3) 2 f x*dFnk(x)-+l, Йв1|ж|<х где т—любая положительная постоянная. Доказательство. Из теоремы 9 следует, что искомые условия состоят в выполнении при я—>оо соотношений Ьп 2 f С*) О* и 2 f (*)-»• О для и < О, 1 для и > О, 2 f x*dFnk(x)-+l. fcasl J Первое из них совпадает с первым условием теоремы, равносиль- ность двух остальных второму и третьему условиям теоремы оче- видна.
23R БЕЗГРАНИЧНО-ДЕЛИМЫЕ ЗАКОНЫ (гл. 9 Особенно простую форму эта теорема принимает, если элементарная система, рассматриваемая нами, нормирована заранее условиями fc=l J J xdFnJc(x) = O (1 <fe<fen; я = 1, 2, ...). (2) Теорема 11. Если элементарная система нормирована соот- ношениями (2), то для сходимости функций распределения сумм (1) к нормальному закону необходимо и достаточно> чтобы для всех т^>0 при п-+ оо 2 f X2dFnfcU)->0. (3) Доказательство теоремы очевидно. . Требование (3) носит название условия Линдеберга, так как им в 1923 г. была доказана его достаточность для сходимости функций распределения сумм к нормальному закону. В 1935 г. В. Феллером была доказана необходимость этого условия. В качестве другого примера использования общих теорем преды- дущего параграфа мы рассмотрим сходимость функций распределения элементарных систем к закону Пуассона Р(х) = О для х О, У ДЛЯ «I о < 7с < ® (4) *Если Е — случайная величина, распределённая по закону (4), то, как мы знаем, = = Мы ограничимся элементарными системами, для которых Л=1 7cw fc=l (5) Теорема 12. Пусть дана элементарная система, подчинённая условиям (5). Функции распределения сумм
сходимость к нормальному закону 239 тогда а только тогда сходятся к закону (4), когда при любом г>0 л 2 J (л-*ОО). 1|>* Доказательство этой теоремы мы предоставляем читателю. В § 15 нами была доказана теорема Пуассона. Легко убедиться, что при прп=Л она является частным случаем только что доказан- ного предложения. Действительно, пусть 5яЛ(1 ^k^n) есть слу- чайная величина, принимающая значения 0 или 1 в зависимости от того, появится или не появится при Л-м испытании n-й серии наблю- даемое нами событие А. При этом Р{^ = 1}“| и Р{^=о} = 1-А Очевидно, что сумма Рп — ^nl 4“ ^п2 “Ь • • • ^пп представляет собой число появлений события А в n-й серии испы- таний. Согласно теореме Пуассона функции распределения величин при п -> оо. сходятся к закону Пуассона (5). Этот результат сле- дует и из только что сформулированной теоремы, так как все её требования в данном случае выполнены. Общие теоремы о сближении функций распределения сумм (1) с некоторыми безгранично-делимыми функциями распределения, дока- занные в более широких, чем у нас, предположениях, позволяют также получить необходимое и достаточное условие для закона больших чисел (в случае независимых слагаемых). См. об этом уже упоминавшуюся монографию Б. В. Гнеденко и А. И. Колмогорова.
ГЛАВА 10 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ § 48. Вводные замечания Совершенствование физической статистики, а также ряда отраслей техники, поставило перед теорией вероятностей большое число новых, не укладывающихся в рамки классической теории, задач. В то время как физика и техника интересовало изучение процесса, т. е. явления, протекающего во времени, теория вероятностей не имела ни общих приёмов, ни разработанных частных схем для решения задач, возникающих при изучении таких явлений. Появилась настоятельная необходимость в разработке общей теории случайных процессов, т. е. теории, которая изучала бы случайные величины, зависящие от одного или нескольких непрерывно изменяющихся параметров. Перечислим несколько задач, иллюстрирующих необходимость построения теории случайных процессов. Представим себе, что мы задались целью проследить за движе- нием какой-либо молекулы газа или жидкости. Эта молекула в слу- чайные моменты времени сталкивается с другими молекулами и меняет при этом свои скорость и положение. Состояние молекулы, таким образом, подвержено случайным изменениям в каждый момент времени. Многие физические явления требуют для своего изучения умения вычислять вероятности того, что определённое число молекул успеет за тот или иной промежуток времени переместиться на то или.иное расстояние. Так, например, если приведены в соприкосно- вение два газа или две жидкости, то начинается взаимное проникно- вение молекул одной жидкости в другую: происходит диффузия. Как быстро протекает процесс диффузии, по каким законам, когда образующаяся смесь становится практически однородной? На все эти и многие другие вопросы даёт ответ статистическая теория диффузии, в основе которой лежит теория случайных процессов, или, как принято теперь говорить, теория стохастических процессов. Очевидно, что подобная же задача возникает в химии, когда изучают процесс химической реакции. Какая часть молекул уже вступила в реакцию, как реакция протекает во времени, когда прак- тически реакция уже закончилась?
§ ВВОДНЫЕ ЗАМЕЧАНИЯ 241 Весьма важный круг явлений протекает по принципу радиоактив- но распада. Это явление состоит в том, что атомы радиоактивного ешества распадаются, превращаясь в атомы другого элемента, распад каждого атома происходит мгновенно, подобно взрыву, выделением некоторого количества энергии. Многочисленные наблю- дения показывают, что распад различных атомов для наблюдателя происходит в случайно взятые моменты времени. При этом располо- жение этих моментов времени независимо друг от друга .в смысле тео- рии вероятностей. Для изучения процесса радиоактивного распада суще- ственно определить, какова вероятность того, что за определённый промежуток времени распадётся то или иное количество атомов? Формально, если задаваться только выяснением математической картины явлений, точно так же протекают и другие явления: число вызовов, поступающих на телефонную станцию за определённый промежуток времени (загрузка телефонной станции), обрывность нитей на ватере (ватер — прядильная машина) или изменение числа частиц, находящихся в броуновском движении, оказавшихся в какой- либо момент времени в заданной области пространства. Мы дадим в этой главе простое решение тех математических задач, к которым приводят указанные явления. Начало общей теории стохастических процессов было положено фундаментальными работами советских математиков А. Н. Колмогорова и А. Я. Хинчина в начале тридцатых годов. В статье А. Н. Колмо- горова «Об аналитических методах в теории вероятностей» было дано систематическое и строгое построение основ теории стохасти- ческих процессов без последействия или, как часто говорят, процессов марковского типа. В ряде работ Хинчина была создана теория так называемых стационарных процессов. Заметим, что прежде чем подвергнуть математическому изучению те или иные явления природы или технические процессы, нужно их схематизировать. Причина этой необходимости лежит в том, что математический анализ применим к исследованию процесса изменения некоторой системы только в том случае, если предположено, что каждое возможное состояние этой системы вполне определено посредством некоторого определённого математического аппарата. Понятно, что такая математически определимая система не есть сама Действительность, но лишь схема, пригодная для её описания. С такой картиной мы встречаемся, скажем, в механике, когда предполагаем, что реальные движения систем материальных точек полностью могут быть описаны для любого момента времени указанием этого момента времени и её состояния в любой предыдущий момент времени /0. Иными словами, схема, которая принимается в теоретической меха- нике для описания движения, состоит в следующем: принимается, Что для любого момента времени t состояние системы у полностью Определяется её состоянием х в любой предыдущий момент времени tQ, 16 Зак. 1826. Б. в. Гнеденко.
242 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 10 При этом под состоянием системы в механике понимается задание положения точек материальной системы и их скоростей. Вне классической механики, собственно, во всей современной физике, приходится иметь дело с более сложным положением, когда знание состояния системы в какой-либо момент времени /0 уже не определяет однозначно состояния системы в последующие моменты времени, а лишь определяет вероятность того, что система будет находиться в одном из состояний некоторого множества состояний системы. Если через х обозначить состояние системы в момент а через Е — некоторое множество состояний системы, то для только что описанных процессов определена вероятность ? Р{4). • системе, находящейся в момент /0 в состоянии х, в момент i перейти в одно из состояний множества Е. Если дополнительное знание состояний системы в моменты не изменяет этой вероятности, то естественно назвать выделенный- нами класс случайных процессов процессами без последей- ствия или за их аналогию с цепями Маркова — процессами марковского типа. Почти вся настоящая глава будет посвящена изучению процессов без последействия и только в последнем параграфе мы дадим пред- ставление о стационарных процессах. / § 49. Условные функции распределения и формула Байеса Для дальнейших выводов нам необходимо обобщить понятие условной вероятности, введенное в первой главе, на случай беско- нечного множества возможных: условий. В частности, нам нужно ввести понятие условной функции распределения относительно слу- чайной величины. Рассмотрим некоторое событие В и случайную величину $ с функ- цией распределения F(x). Обозначим через Аар событие, состоящее в том, что х— а<^5<х4“Р. В силу определений первой главы Р { ВАа? } = Р { Аа?} • Р { В/Аа?} = [F(x4- p)-F(x-a)] Р{ В/Лв?}, откуда Р { В/А„? 1— р{.ВА'?} ' F(x + ₽)-f(X-a) Предел lim Р{ВАа?} а, р ~>0 F(x + ^-F(x-ay
243 ФОРМУЛА БАЙЕСА §49] он существует *), называется условной вероятностью события В еС условии, что и обозначается символом Р{В/х}. Оче- идно, что при х фиксированном Р {В/х) будет конечно-аддитивной функцией события В, определённой на некотором поле событий, при некоторых условиях, которые практически всегда оказываются выполненными, Р { В/х} будет обладать всеми свойствами обычной вероятности, удовлетворяющей аксиомам 1—3 § 8. ЕСЛИ у] — случайная величина и В означает событие т| < у, то функция Ф(у/а:) = Р{т)<^/х}, которая, как легко видеть, будет функцией распределения, называется условной функцией распределе- ния величины т; при условии, что % — х. Очевидно, что если В(х, у) есть функция распределения пары случайных величин £ и т], то о F(x + ₽, co)-F(x-a,oo)’ F(x + M)~F(x-<»,.y) если только этот предел существует. Если функция Р{В/х} интегрируема относительно Г(х), то имеет место формула полной вероятности Р { В} = J Р { В/х } 4?В(х). Для доказательства этой формулы мы разделим промежуток измене- ния величины $ точками х{ (Z= 0, dz 1, zt 2, ...) на интервалы •*<^<*<+1- Обозначим через событие В силу расширенной аксиомы сложения имеем: Р{В}= 2 Р{ВЛ}= 2 P{B/A}[F(x<+1)-F(xf)]. <=:-^оо 4 =—оо Станем теперь подразделять интервалы (хо xi+1) на более мелкие таким образом, чтобы максимальная длина получившихся интервалов стремилась к нулю. В силу определения условной вероятности и интеграла Стилтьеса отсюда получаем: Р{В } = J р {B/x}dF(x). В частности, Ф(^) = Р{7]<Д,}== уФСу/х)^(х). (1) Если существует плотность распределения вероятностей величины т), то = f f{y/x)dF{x), (Г) где ф(д//х)—условная плотность распределения величины т]. *) Этот предел существует для почти всех значений х в смысле меры, определяемой функцией F(x). 16*
244 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [ГЛ. to Пример. В качестве примера использования формулы (1) рас-* смотрим следующую задачу теории стрельбы. При стрельбе по не- которой цели возможны ошибки двоякого рода: 1) в определении положения цели и 2) ошибки выстрела, происходящие от большого числа различных причин (колебания в величине заряда в снаряде, не- правильности обточки стакана снаряда, ошибки в наводке, незначи- тельные колебания атмосферных условий и т. д.). Ошибки второго рода носят название технического рассеивания. Производится п независимых выстрелов по одному определению положения цели. Требуется определить вероятность хотя бы одного попадания в цель. Ради простоты мы ограничимся рассмотрением одномерной цели размера 2а, а снаряд будем считать точкой. Обозначим через / (х) плотность вероятностей положения цели и через (х) плотность вероятностей для точек попадания Z-ro снаряда. Если центр цели находится в точке г, то вероятность попадания в цель при Z-м выстреле равна вероятности попадания в интервал (г — а, * + а)> т* е- равна*) У ^Mdx. г—а Условная вероятность промаха при Z-м выстреле при условии, что центр цели находится в точке г, равна 3-Н 1— J г—а Условная вероятность промаха при всех п выстрелах (при том же условии) равна Ш1-/ г—а Отсюда заключаем, что вероятность хотя бы одного попадания, при условии, что центр цели находится в точке г, равна У TiWrfx). г—а Безусловная вероятность хотя бы одного попадания в цель (по формуле (1)), таким образом, равна ^ = У/(*) [1—Д(1— У <?<(*)<**)] dz. g—a *) Мы полагаем при этом, что определение положения цели и техни- ческое рассеивание независимы. .
§ ОБОБЩЁННОЕ УРАВНЕНИЕ МАРКОВА 245 Вели условия стрельбы не изменяются от выстрела к выстрелу, то = G =1» 2, п) и, следовательно, «Ц-а Р=У /(•*) [1 —(1-~ / ?(*)rf*)"l dz. tf—а Пусть попрежнему А{ обозначает событие < х<+1. Согласно классической теореме Байеса р( д //?•_Р{Л(}Р{В1А(} Р { А(/В } =---. Если F(x) = Р {5 < х} и Р{$<х/В} имеют непрерывные произ- водные по х, то, пользуясь теоремой Лагранжа, голучаем: Р (х'АР{В1АЛ Р [А{/В\ — р^(х(/В) (х<+1—х<) =---- р{В} --(*<+!— где х{ < х{ < х<+1, xt < Xi < х<+1. В пределе, когда х^х, х<+1-»х, получаем: Д(х/В)= (2) J Р {В/х}р (x)dx Это равенство естественно назвать формулой Байеса. Пусть теперь событие В состоит в том, что некоторая случайная величина т) принимает значение между у — а и условная функция распределения Ф (у/х) величины tj имеет при каждом х не- прерывную плотность р (у/х). Тогда, как это следует из равенства (2)» 1 если щ-; Р {В/х} при аир, стремящихся к нулю,, равномерно отно* сительно х стремится к р^ (у/х), то имеет место равенство , . ч P(x)p^(ylx) Pi(x/y)=-7---------2------- J Рщ(у1х)р(х)с1х Эта формула будет нами широко использована в следующей главе. § 50. Обобщённое уравнение Маркова Мы перейдём теперь к изучению случайных процессов без после- действия, ограничиваясь при этом лишь прсстейшима задачами. В частности мы будем предполагать, что множество возможных со- стояний системы есть множество действительных чисел. Таким обра- зом, для нас случайным процессом будет совокупность случайных величин $(/), зависящих от одного действительного параметра /, Мы
246 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 10 будем называть параметр t временем и говорить о состоянии си- стемы в тот или иной момент времени. Полную вероятностную характеристику процесса без последействия мы получим, задав функцию F (t, х; т, у), равную вероятности того, что в момент т случайная величина $ (т) примет значение, меньшее у, если известно, что в момент имело место равенство 5(f) = х. Дополнительное знание состояний системы в более ранние чем / моменты времени для процессов без последействия не изменяет функцию F (/, х; т, у). Отметим теперь некоторые условия, которым должна удовлетворять функция F(/, х; г, у). Прежде всего для неё, как для функции распределения, должны быть при любых х, t и т выполнены равен- ства: 1) lim F (/, х; т, у) = 0, lim F (/, х; т, у) = 1; . £/->—оо 2/->4-со 2) функция F (А х; т, у) непрерывна слева относительно аргу- мента у. Предположим теперь, что функция F(/, х; т, у) непрерывна по /, т и ПО X. Рассмотрим моменты времени /, 5, т (^О<т). Так как из состояния х в момент t система переходит в момент s в одно из состояний интервала (г, z-\-dz) с вероятностью dzF (t, х; 5, z), а из состояния z в момент s переходит в состояние, меньшее у, в момент т с вероятностью F (s, z\ т, у), то согласно формуле (1) предыдущего параграфа находим, что F(/, х; т, у) = J F(s, z\ т, y)dzF(t, х; s, z). Полученное равенство естественно назвать обобщённым уравнением Маркова, так как оно представляет собой распространение равенства (1), §17 теории цепей Маркова на теорию случайных процессов и в этой теории играет столь же важную роль, как упомянутое тождество в теории цепей Маркова. Вероятность F (/, х; т, у) определена пока только для т > t. * Дополним это определение, приняв | I {0 для I 1 для у X. Если существует плотность* /(А х’> s Л
§ gl] УРАВНЕНИЯ КОЛМОГОРОВА 247 то Для не6 выполняются следующие очевидные равенства: v J f(t, х; т, z)dz — F(t, х; т, y)t — ОО J*/ (/, х; т, z) dz — 1. Для этого случая обобщённое уравнение Маркова должно быть записано в таком виде: f(t, х; t, у)== J/(f, г; т, y)f(t, х; f, z)dz. § 51. Непрерывный случайный процесс. Уравнения Колмогорова Мы скажем, что случайный процесс $(/) непрерывен, если за малые промежутки времени лишь с малой вероятностью $(/) может получить заметные по величине приращения. Более точно, случайный процесс 5 (0 непрерывен, если, каково бы ни было постоянное 8 (8 > 0), имеет место соотношение lim f dF(t—x; t, y)==0. (1) Af->0 J a?|>8 Наша ближайшая задача состоит в выводе дифференциальных урав- нений, которым при выполнении некоторых условий удовлетворяет функция F (t9 х; т, ^), управляющая непрерывным случайным про- • цессом без последействия. Эти уравнения впервые строго были дока- заны А. Н. Колмогоровым (хотя второе из них и встречалось до этого в работах физиков) и носят название уравнений Колмогорова. Мы предположим, что 1) частные производные dF (t, х; т, у) d2 F (/, х\ ъ у) дх дх2 существуют и непрерывны при любых значениях х й т > t; 2) каково бы ни было 8 > 0, существуют пределы *) 11m Г (у — x)dyF(t—М, х; t,у) — a(t, х) (2) а‘ J | у—а>\ < 5 И ' lim _L f (.у — xyidyFlt— А/, х; t, y)=b(t, х), (3) Д*->0 J |у—д?| < 8 и эта сходимость равномерна относительно х. ♦) При некоторых достаточно общих предположениях. А. Н. Колмогоров Доказал существование пределов a(tt х)’и b(t, х). Наглядный смысл функций й Р им выясним в конце параграфа,
248 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 1Q Левые части равенств (2) и (3) зависят от 8. Эта зависимость однако, в силу определения непрерывности процесса (т. е. в силу (i)j является лишь кажущейся. Первое уравнение Колмогорова. Если только чта сформулированные условия 1) и 2) выполнены, то функция F(/, *5 У) удовлетворяет уравнению dF(t,x;v,y) х dF(t9x,i,y) b(t, х) d2F(t,x;x,y) ---------------- a (t, х)--------------2-------. (4) Доказательство. Согласно обобщённому уравнению Маркова F(t—Lt, х;т, у) — J F(t, z\ i,y)dJF(t—Lt, x; t, z). Кроме того, в силу свойств функции распределения, F(/, х; т, у) = J F(t, х; т, y)deF(t— Lt, х; t, z). Из этих равенств заключаем, что F(t— Lt, х; т, у) — F(t, х; т, у) Lt = = ”й J т* у)—г У* Х’ УУ1агГ(*—£*)• По формуле Тейлора при сделанных нами предположениях имеет место равенство F(t,z-, т, у) = F (t, х; т, у) + {г—х) -f- + ±(г-х)* ^- + о((г-хП. Последующие аналитические преобразования не требуют пояснений! F(t — Lt, х; ъ, у) — F (/, х; т, у) _ Lt “ ==4г J {F(t, z; т, у) — F(Ax;t,y)]deF(t— | я— х | >8 + й- f IF<Z> g’ т’ x> у№ (*—д*> x’> ~ l«—®l <» eZ7 / r> ’• -У)— F (z’ yHd*Fx’> *) + I я—a? | >8 + — 'it J x; t, z) + |г—я?'|<3 +4—Г i^-x)a+«(^-^ix ♦ С/Х* ДГ • I I g—(c| ^8 —M x; Z, 2Г). (5)
§511 УРАВНЕНИЯ КОЛМОГОРОВА 249 Перейдём теперь к пределу, положив Первое слагаемое пра- вой части в силу (1) имеет своим пределом 0. Второе слагаемое, д F согласно (2), в пределе равно а (/, х) Наконец, третье слагае- 1 X д2/7 Мое может отличаться от b (t9 х) только на слагаемое, стре- мящееся к нулю при 8->0. Но так как левая часть последнего равенства от 8 не зависит и только что указанные предельные значе- ния от 8 не зависят, то предел правой части существует и равен Отсюда мы заключаем о существований предела: lim — т> У)—Е(*, х; ь У) _ dF(t, х; т, у) " д£->о М dt * Равенство (5) приводит нас к уравнению (4). Если предположить, что существует плотность распределения /(А х-, т, y) = ^F(t, х; г, у), то простое дифференцирование (4) показывает, что плотность /(/, х; т, у) удовлетворяет уравнению df(t,x-,x,y) , df(t, х; т, у) j dt -t-av, х) |- + -*-*(/, х) -f-^ = 0. (4') Мы перейдём теперь к выводу второго уравнения Колмогорова. При этом мы не станем стремиться к наибольшей возможной общности и сделаем допущения, не вызываемые существом дела. Помимо уже сделанных предположений, мы наложим на функцию F(/, х; т, у) ещё такие ограничения: 3) существует плотность распределения вероятностей /// ч dF(ttx^,y) , X', Т, Jl) = —^2—22.; 4) существуют непрерывные производные -^[b(y,y)f(t,x-,z,y)]. Второе уравнение Колмогор.ова *). Если выполнены условия то для непрерывного случайного процесса без по- следействия плотность у) удовлетворяет уравнению —A. loft y)f(f. ^,уШ>, ^.у>1. (6) *) Второе уравнение Колмогорова было получено раньше физиками Фок- кером и Планком в связи с развитием теории диффузии.
250 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 10 Доказательство. Пусть а и b (а<Ь)— некоторые числа и R(y)— неотрицательная непрерывная функция, имеющая непрерывные производные до второго порядка включительно. Кроме того, мы по- требуем, чтобы R(y)=O при у<а и У>Ь. Из условия непрерывности функции R (у) и её производных заключаем, R (а) = R (&) = R' (а) = R' (b) = R" (а) = R" (Д) 0. (7) Заметим прежде всего, что ъ ь а а _ 1|m г + Ат -> О J ДГ Согласно обобщённому уравнению Маркова / (/, х; т + Ат, у) = J / (/, х; х, z) f (т, z-, т -f- At, у) dz, поэтому ъ J а а д"”о [ / J Х; Т’ г> Х Лт’ R dz dy ~~ — $ f(t,x-,x,y)R(y)dy]=s =дн®0 [ J /(*>х; ь *) J / (х> г’>х 4- Дх> у) R (у) dy dz— — f f(t,x; t, y) R (y) dy] =z = A«i”o^' /[J + R(z)dz—R(y)j dy. Произведённые преобразования очевидны: первый раз мы поменяли порядок интегрирования, а второй раз изменили обозначения перемен- ных интегрирования (у на a z на у). По формуле Тейлора R (*) = R О') + -У) О') + - У? О')+о —Л
§ 51] УРАВНЕНИЯ КОЛМОГОРОВА 251 Так как в силу ограниченности функции R(z) и условия (1) J К*,У> * + Д*, г) Я (г) dz = o (Ат) |у—«1>» и J /(т,_у;т-|- Дт»г) dz = 1 4~о(Дт), ТО J / («>у>т + Дт>«) я (*) dz—Я О) в = Я'О) J (г— I У—ZI < в +4₽*O) f [(г-^)3+о(«-^)2]/(ь>у;г + Дт,г)^4-о(Дт). | У—z I < 8 Таким образом, ъ J SfV^yLRW<ly = а = lim f f(t,x;%y){R'(у) f (г — y)f(y, y,t-\-&r^z)dz + Дт 0 J * J I <8 . J 1(г-у)* + о(2-уЯХ A I У—z I < 8 X f(% У z)dz-\-° (Ax) | dy. Перейдём к пределу, положив Ат -> 0. В силу предположения о равно- мерной сходимости к пределам в (2) и (3), заключаем, что преды- дущее равенство может быть записано в виде ь = ff (i, хт, у) [а (т, у) R' (у) -J-1 <5 (т, у) R" (у) ] dy. Так как Rr (y) — R^r О') = 0 для У а и У то ь Ь = //(*. яJ) [а (угу) К' О') + 7 Ь (х>У) О')] dy. (8)
252 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ (гл. Воспользовавшись формулой интегрирования по частям и равен- ствами (7), находим, что ь ь J a(x,y)R' (у) dy=-j R(y)-^ te(y,y)f(t,x;x,y)]dyf a a b b J f(t,x;'t,y)b(y,y)R"(y)dy = J R(y) -^[b(t,y)f(i,x;t,y')] dy. a a В результате подстановки полученных выражений в (8) получаем: ь а b = J {—+ а + 4 Р (х>У)/(Ь X;Т, у))| R (у) dy. Это равенство может быть записано, очевидно, в таком виде: ъ J т'У) 4-Jl [д(Т> J)/(/, х;т,^Я — 0 (ьЯЛА х; т,д01) R (У) dy = 0. (9) Так как функция R(y) произвольна, то из последнего тождества вытекает (6). Действительно, предположим, что это не так. Тогда существует такая четвёрка чисел (/, х;т,у), при которой выражение, стоящее в (9) в фигурных скобках, отлично от нуля. В силу сде- ланных предположений это выражение представляет собой непрерыв- ную функцию; следовательно, найдётся интервал а <у < ^, где оно сохраняет знак. Если и то мы полагаем /?(д/) = О при у и у > и R (у) > 0 при а < у < р. При таком выборе R (у) интеграл, стоящий в левой части равенства (9) должен быть отличен от нуля. Мы пришли к противоречию. Таким образом, сделанное нами предположение ошибочно и, следовательно, из (9) вытекает (6). 4 Естественно, что основная задача, которую приходится решать, состоит не в проверке того, что данная функция f(t, х;т,у) удо- влетворяет уравнениям Колмогорова, а в разыскании неизвестной функции f(t,x,t9y) по этим уравнениям, в которых коэффициенты a(t, х) и предполагаются известными. При этом, конечно, ра*
§511 УРАВНЕНИЯ КОЛМОГОРОВА 253 ыскивается не какое-нибудь решение уравнений Колмогорова, а лишь те из них, которые удовлетворяют следующим требованиям: 1. /при всех /,х,х^у. 2. f f(tfx^,y)dy=l и при любом 8 > О 3. Hm f /(/,х;т, y)dy = 0. |у—л| >5 (10) Мы не будем останавливаться на выяснении тех условий, которые нужно наложить на функции a(t,x) и 6(/, х), чтобы существовало решение уравнений Колмогорова, удовлетворяющее перечисленным требованиям и было бы при этом единственным. Мы несколько усилим требование непрерывности с тем, чтобы выяснить физический смысл коэффициентов a (t, х) и b (/, х). Именно, предположим вместо (1), что при любом 8>0 имеет место соотно- шение lim f (у—x)*dF(t— £d,x;t,y) — 0. (1') Д£~>0 J I У—а |>8 Легко видеть, что из (1') следует (1). Требования 2 и 3 могут быть теперь записаны иначе, а именно, J (y — x)dyF(t — bd,x\t,y) = a(t,x) (2') И aSoTF f {y-x^dvF{t—^x-tiy)^b(t,x). (3') ДГ -> О ь** J Остальные требования, а также окончательн&е выводы от за- мены (1) на (1') не изменяются. Так как J (у — х) dy F (t — ДА х; А у) = м [5 (/) — е (/— Д/)] является математическим ожиданием изменения £(/) за время А/, а J (у — X)2 d„ F (Z—ДА х; а У) = М Р (0 - е (/- Д/)]3 есть математическое ожидание квадрата изменения $ (/) и, следова- тельно, пропорционально кинетической энергии (в предположении, что 5 (t) есть координата движущейся под влиянием случайных воз- действий точки), то из (2') и (3') ясно, что a (f, х) есть средняя скорость изменения $(/), а Ь (/, х) пропорционально средней ки- нетической энергии изучаемой нами системы. Мы заключим этот параграф рассмотрением частного случая Уравнений Колмогорова, когда функция /(/, х; т, у) зависит от т
254 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [ГЛ. и у— х, но не от самих х и у. Физически это означает, что процесс протекает однородно в пространстве: вероятность получить при- ращение Д=^у — х не зависит от того, в каком положении х нахо- дилась система в момент времени t. Очевидно, что в этом случае функции а (/, х) и b (tt х) не зависят от х, а являются функциями только одного аргумента Z: а (/) = a (t. х); b (f) = b (/, х). Уравнения Колмогорова в рассматриваемом нами случае переписы- ваются в таком виде: dt — a(t) %-- 4 ’ дх -Lb(*W_ 2 w дх^ ’ dt -а (у)* у ' ду । 1 к / \ d2f Ь 2 Ь дуг ' (11) ^г Рассмотрим сначала частный случай, когда а (/) = 0и£(/)=1Л Уравнения (11) при этом превращаются в уравнение теплопроводности df _ 1 d*f dt ~ 2 dy* | и ему сопряжённое (12) // 1 д2/ di в 2 дх* ‘ Из общей теории уравнения теплопроводности известно, что един- | ственное решение этих уравнений, удовлетворяющее условиям (10), даётся функцией (у—а?)а / U X', у) = г " * 2 • Заменой переменных t х' — х — J a(z) dzt а t f = J b (z) dz, a у' —у— j* b (г) dz, a x' J* b (г) dz a уравнения (11) сводятся к уравнениям (12). Это даёт возможность искомое решение уравнений (11) записать в виде 1 (у —ж—А)а х; т, у) = —е а У 2п где обозначено т dz, o2=.J b (г) dz. t t А — j а (г)
§521 ЧИСТО РАЗРЫВНЫЙ ПРОЦЕСС 255 § 52. Чисто разрывный процесс. Уравнения Колмогорова-Феллера В современном естествознании большую роль играют процессы, б которых изменение системы происходит не непрерывно, а скачками. Примеры такого рода задач приведены во вводном к настоящей главе параграфе. Мы будем говорить, что случайный процесс $ (/) чисто разрывен, если в течение любого промежутка времени (t, /-рД/) величина $ (/) остаётся неизменной и равной х с вероятностью 1—р (/, лс) А/—о (AZ) и лишь с вероятностью р (t9 х) М + о (Д/) может претерпеть изме- нение (при этом мы считаем, что вероятность более чем одного из- менения i (/) за промежуток времени Д/ есть о (Д/)). Естественно, что поскольку мы ограничиваемся рассмотрением процессов без после- действия, функция распределения дальнейших после скачка измене- ний 5 (/) уже не зависит от того, какое значение имело 5 (/) в моменты, предшествующие скачку. Обозначим через Р(/, х, у) условную функцию распределения $(/) при условии, что в момент t произошёл скачок и непосредственно до скачка $(/) было равно х (т. е. Щ—0)=х). Функция распределения /=*(/, х; т, у) легко может быть выражена через функции р (/, х) и Р (/, х, у), а именно /=(/, х; т, у) = [1 — р(А х)(т —/)JE(x, j)-f- + (т — x)P(t х _у)-|~о(т — f). (1) По смыслу определения функций р (t, х) и Р (t, х, у) они не- отрицательны, причём для P(t, х,у), как для функции распределения, выполнены равенства Р(/, х, — оо)==0, Р(/, х, +°о) = 1. Кроме того, мы предположим, что р (t, х) ограничена, обе функ- ции р (t, х) и Р(/, х, у) непрерывны относительно /их (достаточно, на самом деле, предположить, что они измеримы по Борелю отно- сительно х). В отношении функции F(/, х; т, у) мы не станем делать никаких предположений и лишь сохраним её определение при / = т: lim F(/, х; т, у)= lim F(Z, х; т, у) = ( 0 при у х, = £(х, у)— { 1 . (1 при у > X. Одна из задач настоящего параграфа состоит в доказательстве следующей теоремы. Теорема. Функция распределения F(t> х; т, у) чисто разрыв- кого процесса без последействия удовлетворяет двум следующим
256 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ (гл. 10 интегро-дифференциальным уравнениям*. *) [F(/, х; х, у) - — J Г(7, z-, т, y)dj>(t, х, г)], (2) У | P(t, z)dzF(t, *; Ъ У> + —оо + j* р(у, z)P(x, z, y^df^t, х; т, г). (3) Уравнение (2) было получено А. Н. Колмогоровым в 1931 г.; в сделанных нами предположениях оба уравнения (2) и (3) были получены В. Феллером в 1937 г. Это обстоятельство приводит нас к естественному наименованию уравнений (2) и (3) уравнениями Колмогоров а-Ф е л л е р а. Доказательство. В силу обобщённого уравнения Маркова F(ty х\ т, у) = J*'» S х'> ^ + ДА *)• Подставив сюда значение F(/, х; г) по формуле (1), нахо* дим, что F(t, х\х,у) = J Z', -с, y)dz[l—p(t, х)Д(0 4“ 4-о (ДО ] Е (х, z) 4- J F (t -f- Ы, г; х, у) dz [р (/, х) Д/+ о (Д/)] Р (/, х, z). Так как J т. y)dzE(x, z) = F(t-\- Ы, х; т, у), то F(t, х; -с, _у) = [1—р (t, х) Д/] F(t-\-M, х; х, _у)4~ 4-Д/р(О х) J F(?4~M г> х» У)йяР({, х, ОН-о (ДО* Отсюда х)^(/4-д/, х; х, j)4- 4-р(/, х) У F(z4-M «';y)dgP(t, х, 0 4_°(1)- Переход к пределу приводит нас к (2).
$ 52] чисто разрывный процесс 257 Уравнение Маркова и (1), а также определение функции £(х, г) позволяют написать следующую цепочку равенств: F (t, т У) — J (т> т + Д'с, У) (Л х, *) = == J {[1 — Р(у, г) Д-с]В(г, *)Р(м> ,у)4-о(Дт)} X X х'> S г) — У У = j dtF (t, х; т, z) — Ьл J р(т, zyd^Fit, x; т, г)-|- — ОО . —СО + рСс» <г)Р(5, Ъ гО + ^Дт). дР Обычным путём отсюда следует существование производной -ч— и их равенство (3). Мы решим ещё одну важную для приложений задачу: с какой вероятностью в течение промежутка времени от t до т (т > f) система может изменить своё состояние то или иное число п раз (п = 0, 1, 2, ...)? Обозначим через pn(t, х, т) вероятность того, что, отправляясь от состояния х в момент /, система п раз изменит своё состояние до момента т. Решение задачи начнём со случая п = 0. С этой целью запишем следующее равенство: Ро (*> х> х) = Ро (*> х> х + Дх) +Ро (*» х> т) 11 — Ро Сч х + Дт)Ъ (4) которое означает, что отсутствие изменений состояния системы в промежуток времени (/, т) может произойти двумя несовместимыми путями: 1) система не изменила состояния за больший промежуток времени (/, тЦ-Дт), 2) система не меняла состояния до момента т, но в промежуток времени (т, х -}- Дт) состояние её изменилось. Так как по определению чисто разрывного процесса р0(т, х, т-|-Дт) = 1—р(х, х) Дт-|-о(Дт), то уравнение (4) может быть записано иначе: + х_ ху+0т Отсюда, положив Дт -> 0, находим, что существует производная J&At, х, -t) ——- и что дъ V ') --/>„«. X, X). 17 Зак. 1826. Б. В. Гнеденко.
258 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ (ГЛ- 10 Проинтегрировав это уравнение, находим: т — Г£С) du p0(t, х, т) = Се * Так как Ро(у, X, т)«=1, то С— 1 и т — Р р («, х) du р0(^ х, ъ) = е * . Теперь мы увидим, что, зная р0(/, х, т), а также функцию Р(Д х, у), определённую раньше, мы можем подсчитать' любую вероятность рп(/, х, т). В самом деле, n-кратное изменение состоя- ния происходит следующим образом: 1) до момента $(/<$<т) система не меняет состояния (вероятность этого события равна х, $)), 2) в промежуток (5, система меняет состояние (вероятность этого равна pt (s, х, s 4- Д$) = р (sy х) As-J- о (As)), * 3) вероятность того, что новое состояние, в котором окажется ' система, будет заключаться между у и у -(- Ду, равна Р (s, х, у -|- Ду)— — Р ($, х, у) =з LyP (s, х, у\ 4) наконец, за время (s + т) система изменит своё состояние п—1 раз (вероятность этого собы- тия равна Ри-1($ + Д^> У у т))- ' Вероятность того, что произойдут все четыре перечисленных ' события, в силу теоремы умножения, равна Ро V, х, $) [р ($, х) 4- о (1)] As • \Р (S, X, у) • р„_! (s + As, у, т). Так как $ и у могут быть произвольными (^<s<x и —оо <jz < оо), то, в силу формулы полной вероятности, Рп X, т) = J J р0 (А X, S) р (s, х) рп_! (S, у, т) dyP (s, х, у) ds=> t т «j* рь(1, х, s)p(s, х) ]*/>„_! (s, у, x)dvP(s,x,y)ds. (6) ’ t Отсюда, в частности, Pi (t, x, t) = j* p0(t, x, s) p (Si x)J p0(s, y, x)dyP(s, x, y)ds. (7) t ; Процесс определения pn(tf, x, т) очевиден; по формуле (5) на- j ходим pQ(t, x9 т), по формуле (7) вычисляем pi(t1 x, т) и затем g последовательно р2(/, х, т), (^ х, т) и, наконец, pn(t> xt т). |
§52] ЧИСТО РАЗРЫВНЫЙ ПРОЦЕСС 259 Пример 1. Пусть интересующая нас величина Е(7) есть число изменений состояния за время от 0 до т. В предположении р (t, х) = а, где а>0—постоянное, найти pn(t9 х, т). Возможными состояниями системы будут в нашем случае все неотрицательные целые числа (х = 0, I, 2, ...) и только они. Так как при каждом изменении состояния величина £(/) увеличивается ровно на 1, то ( 0 при у < х, P(t, х, j)= , ’ (1 при у > X. По формуле (5) имеем: Ро О, ху т) = е~а <х—*>. Согласно (7) Piit, х, х)= p0(t, х, s)p($,. х)p0(s, x-j-l, xjds^ t t = a J e—(S—flag—(T—S)a ds — a (x — q t По формуле (7) t Ху т)= f p0(/, Xy s)p(s, x)Pl(s, x-f-1, t = e-a(*-fl. 21 Предположим теперь, что По формуле (7) РпУ, х, -t)= j*pQ(t, х, S)p(s, x)p„_!(s, xH-1, x)ds=* t J (n—1)! n\ Этим доказано, что при любом целом Pn(t, х,х)^а^--^-е-^. Решением нашей задачи является, таким образом, закон Пуассона. В частности, Р„(0, о, г) = ^Г-«. 17*
260 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. ю Легко сообразить, что функция г у) = при у < 0. е-а(х-1) ПрИ у > Q п<у является решением интегро-дифференциальных уравнений (2) и (3). Пример 2. В момент / = 0 имеется N радиоактивных атомов. Вероятность распада атома в промежуток времени (/, равна aN(f) 0 (ДО, где а > 0 — постоянное, a N (/) — число атомов, не распавшихся до момента Найти вероятность того, что за время от t до т произойдёт п распадов *). Мы имеем типичный чисто разрывный случайный процесс. Величина £(/), понятно, может принимать только значения 0, 1, 2, N(t). По условию задачи ( 0 при и x^N, Р I а ПрИ о < х а {0 при у х, 1 при у > X. Оценим прежде всего вероятность того, что за время от 0 до t произойдёт п распадов. По формуле (5) — f p(t, 0) dt po(O, °> T) = £? 6 = e~aN\ Точно так же р0(/, = Далее, по формуле (7) Pi(0. О, т)== Jpo(O, 0, s)p(s, O)po(s, 1, t)ds = о := J e~a^aaNe~ a(N~1>(x~S>ds = 0 «= №-aWx J ds = Ne~ aNx [em — 1]. (8) 0 *) Мы предполагаем п и этом, что продукты распада атома сами уже не распадаются и во всяком случае не воздействуют на ещё нераспавшиеся атомы.
ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ 261 По формуле (7) легко последовательно найти р2(0,0, т), /?3(0,0,т) и т. Д. и доказать, что Р„ (0, 0, т) = aNz [eaz — 1 ]п. (9) Это мы предоставляем читателю. Очевидно, что при —k имеет место равенство pn(t, k, •c) = C^_fte_e(ir~'')(T~‘)[ea(x-#) — l]n. (9') Теперь мы можем перейти к определению интересующей нас вероятности, которую мы обозначим через pn(t, т). По формуле полной вероятности, используя затем (9) и (9Л), находим, что N—п Pn(t, *) = О, f)-pn(t, k, t) = N-n = 2 c£e-aNt[eat — — lj” = fc=o N—n = e-»^re^-O_i]» 2 С%С£_кеак^[еа*-1]к, . k—0 Так как c^cS-k^cScN-n и N—n 2 4_„ {еа^\еах— 1)]* = [1 — Л=0 то окончательно pn{t, T) = C$ [e~at-e~az]n[e~az-[-ea^~^ — e~at]N~n. Легко понять, что функция О при у С x, F (t> x; т, y) = 2 Pn(t, x, t) при y<N—x, n<y 1 при у > W— X является решением интегро-дифференциальных уравнений (2) и (3). § 53. Однородные случайные процессы с независимыми приращениями Мы рассмотрим теперь важный класс случайных процессов, пол- ная характеристика которых будет дана в терминах характеристиче- ских функций. Под однородным случайным процессом с независимыми прира- щениями понимается совокупность случайных величин £(/)> зависящих
262 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 10 от одного действительного параметра I и удовлетворяющих двум следующим условиям: 1) функция распределения величины $(/-]-/0)— не зависит от /0 (однородность процесса по времени); 2) для любых неперекрывающихся промежутков (а, Ь) параметра t приращения величины £(/), т. е. разности £(£) — £ (я) взаимно неза- висимы (независимость приращений). Прежде чем переходить к получению конкретных результатов, мы рассмотрим несколько примеров. В этих примерах условия, о которых только что шла речь, могут быть приняты в качестве рабочей гипо- тезы. Естественно, что их допустимость оправдывается только согла- сием выводов с опытом. Пример 1. Диффузия газов. Рассмотрим молекулу неко- торого газа, движущуюся среди других молекул того же газа при усло- виях постоянных температуры и плотности. Введём в пространство де- картовы координаты и станем следить, как изменяется с течением вре-. мени одна из координат избранной молекулы, скажем, координата х. Вследствие случайных столкновений данной молекулы с другими молекулами эта координата будет изменяться во времени, получая случайные приращения. Требование постоянства условий, в которых находится газ, очевидно, означает собой однородность изучаемого процесса во времени. Ввиду большого числа движущихся молекул и слабой зависимости их движения процесс оказывается с независи- мыми приращениями. Пример 2. Скорости молекул. Рассмотрим снова моле- кулу некоторого газа, движущуюся в объёме, наполненном молекулами того или иного газа постоянной плотности и температуры. Отнесём снова всё пространство к декартовым осям координат и будем следить, как изменяется со временем компонента скорости по одной из осей координат. В своём движении молекула будет подвергаться случайным столкновениям с другими молекулами. Вследствие этих столкновений компонента скорости будет получать случайные приращения. Мы снова имеем однородный случайный процесс с независимыми прира- щениями. Пример 3. Радиоактивный распад. Известно, что радио- активность вещества состоит в том, что его атомы превращаются в атомы другого вещества, выделяя при этом значительное количество энергии. Наблюдения над сравнительно большими массами радиоактивного вещества показывают, что распад различных атбмов происходит неза- висимо друг от друга, так что числа распадов атомов в непере- Крывающиеся промежутки времени независимы между собой. Кроме того, вероятности того, что за промежуток времени определённой длины произойдёт некоторое число распадов, зависят от длины этого промежутка и практически не зависят от того, где во времени он расположен.-В действительности, конечно, по мере уменьшения массы вещества егр радиоактивность постепенно убывает, Однако для срав-
j до] ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ 263 нительно небольших промежутков времени (и не слишком больших количеств вещества) это изменение настолько незначительно, что им вполне можно пренебрегать. Легко привести большое число других примеров, где интересующее Нас явление природы или технический процесс может рассматри- ваться как однородный процесс с независимыми приращениями. Ука- жем дополнительно на такие примеры: космическое излучение (число космических частиц, попавших за определённый промежуток времени на определённую площадку), обрывность пряжи на ватере, загрузка телефонистки (число вызовов абонентов, поступающих за определён- ный промежуток времени) и пр. Перейдём теперь к выяснению характеристического свойства одно- родных случайных процессов с независимыми приращениями. Обозначим функцию распределения приращения величины S (f) за промежуток времени т через F (х, т). Тогда, если промежутки вре- мени Tj и та не пересекаются, то F (х; 4-‘ т9) = J F (х — у; tj) dv F (у, т2). (1) Если /(«, г) — характеристическая функция, т. е. если f(gt t) = J da F (x; т), то равенство (1) в терминах характеристических функций принимает следующий вид: /(«; ’i + ’2)=/(^ xi) •/(«, t9). (!') Вообще, если интервалы времени та, тп не пересекаются, то п п л -- - /(*; 2 fc==l п В частности, если = та== ... == и 2 = т» то /(д, = Таким образом, функция распределения любого однородного слу- чайного процесса с независимыми приращениями безгранично-делима. Нужно отметить, что к рассмотрению безгранично-делимых зако- нов распределения в теории вероятностей пришли благодаря изучению однородных процессов с независимыми приращениями. Мы видели, что теория безгранично-делимых законов распределения оказала решающее влияние на развитие классических задач теории вероятно- стей по суммированию случайных величин. Если раньше, как мы указывали, интересы исследователей были сосредоточены на опреде-
264 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. ЭД лении наиболее широких условий, при которых имеют место закон больших чисел и сходимость нормированных сумм к нормальному закону, то после того как А. Н. Колмогоровым был полностью охарактеризован класс законов, управляющих однородными случай- ными процессами без последействия, естественно возникли те общие задачи, которые были рассмотрены в предыдущей главе. Оказалось при этом, что основные законы распределения, которые раньше полу, чались как асимптотические, в теории случайных процессов играют роль точных решений соответствующих функциональных уравнений. Более того, эта новая точка зрения позволила выяснить причины, в силу которых в классической теории вероятностей рассматривались только две предельные функции распределения — нормальный закон и закон Пуассона. Поскольку при произвольном т > 0 для однородных процессов с не- зависимыми приращениями /(*, г) = (/(*, 1)Г, то они полностью определяются заданием характеристической функции величины 5(1)— 5(0) В § 43 мы видели, что для безгранично- делимых законов с конечной дисперсией 1g? (*. 1) = — 1 — izu} dG (и), (2) где 7 — действительное постоянное, a G(u)— неубывающая функция! с ограниченным изменением. Мы ограничимся рассмотрением этого J частного случая однородных процессов. Введём в формуле (2) такие обозначения: и М (и) =: J (х) для и < О, —оо оо N(u) = “2 dG (х) для и > О, и а2 = О(-|-0) — G ( —0); тогда она примет следующий вид: о = + J —1—tzu}dM(u}-\- —оо оо f {eizu — 1—izu}dN(u). (2') о Выясним теперь теоретико-вероятностный смысл функций М (й) и ДГ(я).
§ 53J ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ 265 В § 43 при выводе формулы канонического представления без- гранично-делимых законов мы ввели функцию и Gn(u) = n j* х9йФ„(х). —оо Положим и Мп J 72 dGn <х') — «ФП («) ДЛЯ « < 0 — 00 И оо Nn («) = J 72 dOn (•*) = я [1 — Ф„ («)] для и > 0. и Из того, что при я —> оо в точках непрерывности функции О (и) Gn(«)->0(«) мы по второй теореме Хелли делаем вывод, что в точках непрерыв- ности функции М (и) Af„(«) — «Ф» (и)-+М(и). С точки зрения случайных процессов, Ф„ (х) (х < 0) есть вероят- ность того, что величина Е(т) за промежуток (~ 1 изменения параметра т получит отрицательное приращение по абсолютной вели- чине, большее, чем х. Таким образом, Мп(х) есть сумма по всем k от 0 до п —1 вероятностей того, что величина Е (/) получит отри- цательное приращение скачками по абсолютной величине, большими, чем х, за промежутки изменения параметра т. По- скольку М (и) и Л/(и) являются пределами при /2->оо соответственно функций Мп(и) и Nn(u), то они получили название функций скачков. Если 2И(я) = 0 (для и < 0) и N(a) = 0 (для и>0), т. е. функ- ции скачков отсутствуют, то из формулы (2') видно, что в этом случае стохастический процесс управляется нормальным законом. Мы видим, что случайный процесс, управляемый н рмальным законом, является непрерывным в смысле теории вероятностей. Мы докажем теперь более сильное утверждение. Теорема. Для того чтобы однородный случайный процесс, с независимыми приращениями и конечной дисперсией*) управлялся нормальным законом**), необходимо и достаточно, чтобы при произвольном s > 0 вероятность того, что максимальное значение *) Теорема верна и без допущения конечности дисперсии. **) В частности, нормальным законом с дисперсией 0, т. е. законом вида F (х) = 0 при х < at F (х) = 1 при х > а.
266 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [ГЛ. абсолютной величины приращений S(t) за промежутки 1 ' (k = 1, 2, . .., п) превзойдёт е, стремилась к нулю вместе с — *). Доказательство. Мы только что видели, что однородный случайный процесс с независимыми приращениями управляется нор* мальным законом тогда и только тогда, когда при х > О Л4(— х) ssO. (3) Так как Л4(ц) = HmAfw(«) и М(и)= ИтДГл(а), П~>ОО П->ОО то условие (3) равносильно следующему: lim лФ„ ( — а) = lim л [1 — Фп («)] « 0. (4) П->СО П->00 (k__1 £ \ —-— > л) через тогда РПк = ®п ( — х) +1 — Ф„ (*+0) = Р {| enft| > х}. Очевидно, что соотношения (4) эквивалентны такому: п lim = П->ОО Zc=«l Из неравенств n ” Л - S 1-2лй<П(1-а»)<* ft=sl Zc«=l мы видим, что соотношения (4) равносильны утверждению, что lim ПС1—P»fc) = 1> n->oo fc«=l которое означает, что вероятность осуществления неравенств | Еп&| < а при всех k(\^k^.n) при я—>оо стремится к единице. Иначе говоря, мы доказали, что соотношения (3) имеют место тогда и только тогда, когда при п -* оо Pl ®ах |?nft|>s}->0, 1<Лг<П ч. и тр. д. К общей теории, развитой в настоящем параграфе, мы добавим пример. Пример. В пространстве разбросаны точки с соблюдением сле- дующих требований: 1) вероятность k точкам оказаться в области О ♦) Таким образом, процессы, управляемые нормальным законом, и только они, являются «равномерно непрерывными» в смысле теории вероятностей.
§ 53] ПРОЦЕССЫ С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ 267 зависит только от объёма v этой области, но не зависит ни от её формы, ни от положения её в пространстве. Эту вероятность мы обозначим символом 2) Числа точек, попавших в непере- крывающиеся области, являются независимыми случайными величи- нами. 3) рг (Atf) == аД^ + о (Д^), где а > 0 — постоянное. 4) рк (Д^) == 5= о(Д<0(£ > 1)- Найти вероятности Рй('О). Первое условие, очевидно, означает пространственную однород- ность изучаемого процесса, а второе—независимость приращений в неперекрывающихся областях. Для определения функций pk(v) составим уравнения Ро (© + Дф) = р0 (v) • р0 (Дг>) и Рп (” + Д”) = Рп (”) Ро (М + Рп-1 (®)Pl.(М ’К п + Sfn-fcOdMM- (<г’) &==2 Первое из этих уравнений означает, что если в объём Д-п 4е попало О частиц, то в каждый из объёмов v и Lv также попало по 0 частиц. Второе равенство означает, что если в объём До попало п частиц, то или в объём о попали все частицы, а в объём До — ни одной, либо в объём о попало п—1 частиц, а в объём До — одна, либо, наконец в объём о не попало ни одной частицы, а в объём Ьк— все п частиц. Используя сделанные нами предположения, читатель легко убе- дится в том, что соотношения (5) в пределе превращаются в сле- дующие дифференциально-разностные уравнения: и при я>0 = — арп (©) + арп _ j (к). Последовательное решение этих уравнений приводит к равенству*) Рп(«) = Л-Я| г“°°- Требования, которые мы наложили на распределение точек, выпол- няются с достаточной степенью точности в различных естественно- научных и технических проблемах. Мы приведём только один пример такого рода. Если в какой-либо жидкости взвешены мельчайшие частицы какого-либо вещества, то под влиянием ударов окружающих молекул эти частицы находятся в непрерывном хаотическом движении (броуновское движение). В результате в каждый момент времени мы *) Легко понять, что настоящий пример и пример 1 предыдущего па- раграфа различны только по словесной формулировке.
268 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 10 имеем случайное распределение частиц в пространстве, о чём только что была! речь. Согласно теории настоящего примера следует считатц что распределение частиц, попадающих в некоторую определённую область, будет подчинено закону Пуассона. В таблице 12 сравниваются результаты опытов с частицами золота взвешенными в воде, заимствованные нами из статьи Смолуховского* и результаты вычислений по закону Пуассона. * Таблица 12 Число частиц п Число наблю- давшихся случаев т Частота т 518 п\ Вычисленное число случаев 0 112 0,216 0,213 ПО 1 168 0,325 0,328 173 2 130 0,251 0,253 131 3 69 0,133 0,130 67 4 32 0,062 0,050 26 5 5 0,010 0,016 8 . 6 1 0,002 0,004 2 7 1 0,002 0,001 1 Постоянное X = av, которым определяется закон Пуассона, вы- брано равным среднему арифметическому из наблюдавшегося числа частиц, т. е. X = 0* П2+1.168+ 2» 130 + 3.69 + 4.32 +5-5 +6» 1 + 7«1 г 54. § 54. Понятие стационарного случайного процесса. Теорема Хинчина о корреляционной функции Процессы марковского типа или, иначе, процессы без последействия, изученные нами в предыдущих параграфах, ни в какой мере не исчер- пывают всех запросов естествознания к теории вероятностей. В самом деле, во многих случаях прошлые состояния системы оказывают весьма .. сильное влияние на вероятности её будущих состояний, и пренебрегать этим воздействием прошлого нельзя даже при приближённой трактовке вопроса. Принципиально положение может быть исправлено изменением \ понятия состояния системы путём введения новых параметров. Так, на- ; пример, если бы изменение положения частицы в явлениях диффузии или броуновского движения мы стали рассматривать как процесс без последействия, то это означало бы, что мы при этом не принимаем в расчёт инерцию частицы, которая, само собой разумеется, в этих явлениях играет существенную роль. Введение в понятие состояния помимо координат частицы её скорости в приведённом примере испра- вило бы положение. Однако существуют случаи, когда такое исправление
§ 54] СТАЦИОНАРНЫЙ СЛУЧАЙНЫЙ ПРОЦЕСС 269 никакого облегчения при решении поставленных задач не даёт. В пер- .,ю очередь здесь следует указать на статистическую механику, в ко- торой указание на положение точки в той или иной ячейке фазового пространства даёт только вероятностное суждение о будущем её состоянии. При этом ознакомление с предыдущими положениями точки существенно меняет наши суждения относительно её будущего. В связи с этим А. Я. Хинчин выделил важный класс случайных процессов с последействием, так называемые стационарные процессы, однородно ведущие себя во времени. Стохастический процесс 5 (/) называется стационарным, если распределения вероятностей для двух конечных групп переменных 5(Л)> КАЛ + + совпадают и, значит, не зависят от и. Числа п и и, а также моменты времени t могут быть при этом выбраны совершенно произвольно. К стационарным процессам приводит, например, изучение ряда акустических явлений, в том числе встречающихся в радиотехнике (случайные шумы), а также разыскание скрытых периодичностей, интересующее астрономов; геофизиков и метеорологов. Часто в установившемся технологическом процессе легко подметить явления, протекающие по схеме стационарных процессов. Для при- мера рассмотрим процесс прядения. Значительная неоднородность свойств прядильных материалов (длина волокон, их крепость, вели- чина поперечного сечения и пр.),' колебания в скорости и равномер- ности подачи продукта на машинах в различные этапы процесса прядения и многие другие причины приводят к тому, что свойства пряжи меняются от одного сечения к другому. При этом оказывается, что знание того или иного свойства пряжи в какой-либо одной части мотка не даёт нам полного знания её свойств в другой его части. Но поскольку процесс прядения можно считать установившимся, постольку вероятностные характеристики качества пряжи представляют собой стационарный процесс. Понятно, что любая числовая характеристика стационарного про- цесса £(/) не зависит от момента t и, например, если \(i) имеет конечную дисперсию, то, очевидно, имеют место следующие равен- ства: мцн-«)=мцо=мцо)=а, DS(/+ и) = D 5(0 = D 5(0) = а9, М{5(Н-«)5(0} = М{5(«)5(0)}. Это обстоятельство позволяет без ограничения общности дальнейших результатов считать а = О и а == 1 (для этого, очевидно, достаточно вместо 5(f) рассматривать отношение Мы ограничимся здесь только изучением важнейшей числовой Характеристики 5(f)—её корреляционной функции, т. е. коэффи-
270 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. JQ циента корреляции между величинами Е(/) и £(£-]-я) »(и) = М [£ (/ -Ь я) -М S (/ + «)] Н (П - М; (01 k } УОЩ-ОЩ+а) В силу сделанного предположения о том, что я==0 и а=»1 выражение для /?(я) принимает более простой вид Я(а) = м{Е(я)Е(о)}. Мы назовём стационарный процесс непрерывным, если Шп7?(я) = 1. М—>0 В случае непрерывного стационарного процесса /?(я) есть непре. , рывная функция от я. Действительно, | R (я 4- Дя) - R (В)| = | М {Е (я 4- Да) Е (0)} — М {5 (а) $ (0)}| ==> «|М{Е(0)[Е(а4-Да)-Е(а)]}|. Но в силу неравенства Коши-Буняковского | м {Е (0)[Е (я + Дя) - Е (я)]}| < у М Еа(0) • м [ Е (а 4- Дя) — Е (а)]8. . А так как М Е® (0) = 1 и М [Е (я 4- Да) — Е (я)]8 = 2 [ 1 — R (Да)[, . то окончательно | R (и 4- Д я) — R (я) |< /2(1—/?(Дя)).‘ Это неравенство доказывает наше утверждение. J В теореме, которая сейчас будет доказана, стационарность про- цесса £(/) можно понимать в следующем более широком смысле: процесс £(/) стационарен в широком смысле, если математическое ожидание и дисперсия £(/) не зависят от t, а коэффициент коррелят, ции между 6(4) и является функцией только |/2— /J. Теорема Хинчина. Для того чтобы функция R(и) пред* ставляла корреляционную функцию некоторого непрерывного ста* ционарного процесса, необходимо а достаточно, чтобы ед можно было представить в виде R(u)~ J cos их dF(х), (О где F(x) — некоторая функция распределения. Доказательство. Условие теоремы необходимо. В самом деле, если R (я) есть корреляционная функция непрерывного стацио- нарного процесса, то она непрерывна и ограничена. Докажем, кроме того, что она положительно-определённа. Действительно, каковы бы
СТАЦИОНАРНЫЙ СЛУЧАЙНЫЙ ПРОЦЕСС 271 §541 йй были действительные числа ui9 и# «л, комплексные числа и целое число л, имеет место следующее соотношение; п п п о<М| 2^(«*)|9 = М {ДД(«,)5(а,)}- =2 J-1 4—1 В силу теоремы Бохнера-Хинчина (§ 38) отсюда следует, что /?(«) может быть представлена в виде /?(«)«= J e‘«»dF(x), где Р(х)—неубывающая функция с ограниченным изменением. В силу вещественности функции R (и) отсюда получаем: Я (я) »=з J cos uxdF(x). Наконец, приняв во внимание условие непрерывности процесса: Ж+0) = 1, находим, что F(-j-oo)—F(—оо) = 1, т. е. что F(x) есть некоторая функция распределения. Условие достаточно. Нам дано, что R(u) есть функция вида (1). Требуется доказать, что существует стационарный процесс 6 (Л> имею- щий своей корреляционной функцией функцию R (и), С этой целью для каждого целого п и каждой группы действительных чисел t%> -.tn рассматриваем «-мерный вектор 5(/х), 5(/2), ...» $ (/п), распреде- лённый нормально и обладающий свойствами ме(/1) = мц/8)= ... = мш=о, D5(^)==D$(/2)=...=D4^) = 1, при любых Z и j коэффициент корреляции между £(/<) и В(^) равен — т. е. мц^)^) = я(/<-9. Вид функции Я (я) обеспечивает положительную определенность квадра- тичной формы, стоящей в показателе «-мерного нормального закона. Определённый таким образом но рмальный случайный процесс стационарен и в узком и в широком смысле слова. Доказанная теорема играет основную роль в теории стационарных процессов и в её физических приложениях. За подробностями отсы- лаем к специальной литературе, для начала к литературе, приведён- в конце книги.
1 272 ТЕОРИЯ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ [гл. 1Q Параллельно с развитием теории стационарных процессов разви- валась теория стационарных последовательностей. Последовательность случайных величин •••» 5-2, 5-1, 5q, 5р 5g, • •• называется стационарной в широком смысле, если для всех членов последовательности математические ожидания и дисперсии являются постоянными числами, не зависящими от места в последовательности ... = М5-2 = MLi = М50 = M5i = М5а = ... = а, ... = D5-2 = D5-i = D50 = D5t = D52= ... =®2, а коэффициент корреляции между 5^ и L является функцией только В качестве упражнения мы предлагаем читателю 1) вывести, используя результаты § 38, общий вид корреляцион- ной функции для стационарной последовательности; 2) доказать теорему — если для стационарной последовательности lim R (s) = О, 8->ОО где R(s) — коэффициент корреляции между и то для неё * имеет место закон больших чисел, т. е. при п->оо п й=1 каково бы ни было постоянное в > 0.
ГЛАВА 11 ЭЛЕМЕНТЫ СТАТИСТИКИ § 55< Основные задачи математической статистики Во введении к курсу мы определили теорию вероятностей как математическую науку о закономерностях массовых явлений. Вполне законно поэтому теорию вероятностей рассматривать как часть дру- гой более широкой науки — статистики. Термин статистика происходит от латинского слова «статус» (status) — состояние. Первоначально, в XVIII веке, когда статистика начала оформляться в научную дисциплину, термин статистика связы- вался с системой описания фактов, характеризующих состояние госу- дарства. При этом даже не предполагалось, что ведению статистики подлежат только явления массового порядка. В настоящее время статистика включает в себя и большее и в то же время более опре- делённое содержание. А именно, можно сказать, что статистика со- стоит из следующих трёх разделов: 1) сбор статистических сведений, т. е. сведений, харак- теризующих отдельные единицы каких-либо массовых совокупностей; 2) статистическое исследование полученных дан- ных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения; 3) разработка приёмов статистического наблюде- ния и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики. Сбор статистических сведений, касающихся главным образом на- селения, производился уже давно: имеются сведения, что в 2238 г. До нашей эры в Китае при императоре Яо была произведена перепись населения; производились переписи населения и в древнем Египте, Древнем Иране, Римской империи; известны переписи населения в Рос- сии в 1245, 1259, 1273, 1287 гг. и более поздние. Нужно, правда, отметить, что эти переписи были чрезвычайно примитивны и в Китае, например, в течение 200 лет население учитывалось путём копировки списков предыдущих переписей. Однако даже такие неполные и несо- ВеРшенные переписи давали возможность намечать важные государ- ственные мероприятия. Практическое значение статистики в наше время 18 Зак. 182Q. Б. В. Гнеденко.
274 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. велико. Это отчётливо было выражено товарищем Сталиным в слова» сказанных им в мае 1924 г. на XIII съезде РКП (б): «.. .никакая стро^ тельная работа, никакая государственная работа, никакая планов^ работа немыслимы без правильного учета. А учёт немыслим без ста. тистики. Учёт без статистики ни на шаг не двинется вперёд». (Сочиве, ния, т. VI, стр. 214.) Большим мастером использования статистических методов бьщ В. И. Ленин. Желая иметь дело не с отдельными фактами, не с отдельными событиями, а со всей совокупностью фактов, желав путём анализа массовых явлений вскрыть качественное их своеобразие, В. И. Ленин систематически обращался к статистике. В качестве образца конкретного статистического исследования можно привести работу В. И. Ленина «Развитие капитализма в России». Имеются несколько страниц, к сожалению незаконченной, работы В. И. Ленина «Статистикам социология» («Ленинский сборник», т. XXX, стр. 302), в которой, повидимому, предполагалось развить общие принципы статистического анализа социальных явлений. В. И. Ленин высоко ценил статистику как орудие познания реального мира. Его слова, что социально-экономи. ческая статистика — одно из самых могущественных орудий социаль- ного познания, в неменьшей мере относятся и к естествознанию, и к технике, и к другим отраслям знания. В настоящей главе мы рассмотрим только некоторые основные задачи математической статистики. 1. Определение неизвестной функции * распределения Задача ставится так: в результате п независимых испытаний над случайной величиной $ получены следующие её значения: •^1» -^2) • • •» %п* Требуется определить, хотя бы и приближённо, неизвестную функ* цию распределения F(x) величины 5. 2. Определение неизвестных параметров распределения к Часто общетеоретические соображения позволяют сделать доста* точно определённые заключения о типе функции распределения инте- ресующей нас случайной величины. Так, например, теорема Ляпунова даёт возможность считать, что в определённых случаях функция рас- пределения должна быть нормальной. При этом определение неизвест- ной функции распределения сводится к определению по результатам; наблюдений только неизвестных значений параметров а и а. Общая задача ставится так: случайная величина 5 имеет функций распределения определённого вида, зависящую от k параметров, зН*
§ 55] ОСНОВНЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 275 чения которых неизвестны. На основании последовательных наблюде- ний величины 5 нужно найти значения этих параметров. Очевидно, что определение неизвестной вероятности р события А является частным случаем только что сформулированной задачи, так как мы можем рассматривать случайную величину принимающую значение 1, если событие А появляется, и значение 0, если событие А не появляется. Функция распределения 6 зависит от единственного параметра р. решение только что поставленной задачи будет нами дано лишь для нормального распределения 1 (я—аУ f(x/a, а) =--±-в * . а у2п В этом случае вторая задача, очевидно, может быть разбита на 3 частных вопроса: 1) величина а предполагается известной, требуется оценить неиз- вестное значение а\ 2) величина а предполагается известной, требуется оценить неиз- вестное значение а; 3) оба параметра а и о неизвестны, требуется оценить их значения. Более точно эти вопросы могут быть поставлены следующим обра- зом: в результате п независимых испытаний величина $ приняла еле* дующие значения: Требуется указать такие функции а=а (х19 ..., хп) и а в а (х1э ..., хп) (в первой задаче а может быть также функцией а, а во второй задаче а может быть функцией а), которые было бы рационально принять за приближённые значения оцениваемых величин а и а. Помимо этого нужно также оценить среднюю точность этих приближённых формул. Иногда предпочтительнее искать не приближённые значения неиз- вестных параметров а и а в виде функций а и g, а такие функции а» а" (а' и а") от результатов испытаний и известных величин, чтобы с Достаточной практической надёжностью можно было утверждать, что а' < а < а" и» соответственно, с' < с < 0*. Функции а', а" (o', o'7) называются доверительными границами для а (°). Впоследствии мы изложим два подхода к решению этих задач. 18*
276 ЭЛЕМЕНТЫ СТАТИСТИКИ (гл. Ц 3. Проверка статистических гипотез Задача, которую мы здесь рассмотрим, ставится так: на основание некоторых соображений можно считать, что функция распределения случайной величины $ есть F(x); спрашивается, совместимы ли наблю. дённые значения с гипотезой, что В действительно имеет распределе- ние F(x)? В частности, если вид функции распределения не вызывает сомне- ний и в проверке нуждаются только значения некоторых параметров, характеризующих это распределение, то в задаче спрашивается: не. опровергают ли результаты наблюдений ту гипотезу, что параметры распределения имеют предположенные значения? Это —задача про- верки простой гипотезы. Если проверяемая гипотеза состоит в том, что параметры принимают не точно определённые значения, а какие-то из некоторых определённых множеств (например, в случая биномиального распределения, гипотеза р < р0), то гипотеза назы* вается сложной. Заметим, что перечисленными тремя задачами далеко не исчерпьь ваются основные проблемы математической статистики. Совершенно новые задачи перед математической статистикой ставит промышленная и научная практика. Достаточно, например, сказать, что браковка про- дукции массовых производств, а также контроль качества выпускаемой продукции требуют не только определения неизвестных параметров или функций распределения, но также и рационального управления самим ходом производственного процесса. Помимо этого, разработка рацио- нальных методов использования наблюдённого материала, а также само планирование испытаний являются одной из основных задач мате- матической статистики. § 56. Вариационный ряд и эмпирическая функция распределения Исходным пунктом статистического исследования какой-либо слу- чайной величины $ является совокупность из п наблюдений, в резуль- тате которых величина $ принимает значения ^2> * ♦ •» %п* (0^ Впоследствии мы постоянно будем предполагать испытания взаимно^ независимыми и произведёнными в неизменных условиях. Естественно,! в некоторых задачах эти предположения чрезмерно ограничительны. J Нередко возникают задачи, в которых приходится рассматривать испыИ тания в переменных условиях (например, стрельба по движущейся цели) или же связные последовательности испытаний (например, испы*\ тание пряжи по образцам определённой длины, взятым с одной ка- тушки или одного мотка). И если для задач в переменных условиях испытаний имеются некоторые общие результаты, то статистика связ- ных испытаний^ можно сказать, совершенно не разработана и ев
ВАРИАЦИОННЫЙ РЯД 277 §561 разработка является одной из насущных задач математической стати- стики. Последовательность результатов испытаний мы расположим в воз- растающем порядке. Обозначив через х*к k-Q по величине наблюдён- ное значение, мы можем последовательность (1) записать в следующем виде: X.. Хм. Эта последовательность, т. е. последовательность наблюдённых зна- чений исследуемой случайной величины, расположенных в возра- стающем порядке, носит название вариационного ряда. Эмпирической функцией распределения Fn (х) мы назовём функ- цию, определённую следующими равенствами: О при х С Xi, прихл <*Ол+1, 1 при X > хп. Ясно, что эмпирическая функция распределения монотонна, не- прерывна слева и имеет точки разрыва только при значениях аргу- мента, равных членам вариационного ряда. Величины скачков в точках разрыва являются целыми кратными от--. Для дальнейшего подчерк- нём то обстоятельство, что при каждом значении х ордината Рп(х) является случайной величиной, возможные значения которой будут О’ “п ’ * • • ’ ~ = 1 • Вероятность равенства Fn (х) =» ~, как легко видеть, равна В простейшем частном случае, когда случайная величина $ может принимать лишь конечное число значений ап ..., а9 членами вариационного ряда обязательно будут только числа этой последова- тельности. Согласно закону больших чисел, если mit т9 0*4 + -]-" • • • + = п) будут обозначать соответственно числа испытаний, при которых Н = 5 = а2,..., £ = ая, то при достаточно большом значении п частоты будут представлять приближённые значения неизвестных нам вероятностей р1 = Р{$ = а1}, р2 — Р = а2}, . •. ps=P{5 = agJ. Более того, в нашем случае имеет место и уси- ленный закон больших чисел. В последующем параграфе мы докажем общую теорему о сближении эмпирической функции распределение V теоретической при увеличении числа ирпытанц^,
278 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. П Заметим, что обычно используемые в статистике сводные числовые характеристики вариационного ряда — среднее арифметическое резуль- татов наблюдений 7__*1 + Х2 + » • * + п 9 среднее квадратическое уклонение S~V 12 fc=l и др. — являются некоторыми функционалами, зависящими от эмпи- рической функции распределения. Так, например, х== jxdFn(x), s*~f(x-x)*dFn(x). § 67. Теорема Гливенко Прежде чем переходить к формулировке и доказательству теоре- мы, составляющей содержание настоящего параграфа, мы установим несколько вспомогательных предложений. Рассмотрим некоторую последовательность случайных величин ^2 >• • •> • • • Событие, заключающееся в том, что эта последовательность сходится к некоторой случайной величине 5, имеет в силу принятых нами аксиом, как мы увидим при доказательстве леммы 1, опреде- лённую вероятность. Если эта вероятность равна единице, то мы скажем, что после- довательность {Ем| сходится к Е почти наверное*). В другой форме утверждение о сходимости почти наверное можно выразить так: последовательность случайных величин > • • • > • • • сходится почти наверное к случайной величине Е, если с вероят- ностью единица для каждого целого положительного числа г най- дётся такое число п, что при всех k > 0 будут иметь место нера- венства |U+»-М<7- Очевидно, что равенство ______________ (1) ♦) Это понятие в точности соответствует понятию сходимости ПОЧТИ ₽СЮДу в теории функций, J
§ 57J ТЕОРЕМА ГЛИВЕНКО 279 мы можем записать и в иной форме: Р{$п745}=0. (Г) Это выражение означает, что вероятность того, что найдётся такое число г, что при всех п и хотя бы при одном значении k имеет место неравенство --5|>у, равна нулю. Лемма 1. Если при любом целом положительном г 00 Sp{|^-4>7}<+oo, (2) W»=l то имеет место (1) или, что то же самое, (!'). Доказательство. Обозначим через Егп событие, состоящее в том, что выполняется неравенство Положим, далее, Егп+к. Л===1 Из того, что 2 ₽{££+*}= , 2 р(рг-е|>7}, fca=l I Ч мы в силу (2) выводим равенство ШпР{.й}=0. (3) П—>ОО Пусть теперь Из того, что событие Sr влечёт за собой любое из событий Sn> в силу (3) получаем: рт=о. (4) Положим, наконец, s=s1+s2+s8+... Как нетрудно установить, это событие означает, что найдётся такое г, что для каждого п (я = 1, 2, 3,... ) хотя бы при одном k [ k =» k (я)) будут выполняться неравенства 14-*—Ч>7-
280 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. п Так как Р(5)<2р(П Г=1 то в силу (4) Р{5} = 0, ч. и тр. д. Лемма 2 (теорема Б о р е л я). Пусть р. — число наступлений события А при п независимых испытаниях, в каждом из которых событие А может появиться с вероятностью р. Тогда при /г оо Н^Ь1- Заметим, что теорема Бореля является простейшим частным слу- чаем теоремы А. Н. Колмогорова об усиленном законе больших чисел; здесь же дана только иная формулировка этого частного случая, отличная от общей формулировки теоремы § 32. Доказательство. События —р —> 0 и 0^— 0, оче- видно, эквивалентны. Введём, как это мы уже неоднократно делали, вспомогательные величины равные числу появлений события А при Z-м испытании. Находим, что п п п п S S (Нл—Р)(Нг~Р)‘ <=1 /=1 й=1 Z=1 Элементарный подсчёт показывает, что М (-у — = SI [п (р3 + q3) + 3pq («2 — й)] < J-a. Согласно лемме Чебышева p{(-W>4}<'M(-W<£- Отсюда мы заключаем о сходимости ряда р)М}- W® 1 Применение предыдущей леммы доказывает наше утверждение. Лемма 3. Если событие Е эквивалентно совместному осу- ществлению бесконечного числа событий Ev Е^ ... Е = ЕХЕ% • • • и каждое последующее событие Еп^г влечёт за собой предыду- щее Еп, то Р{Е}= lim Р{ЕП}.
ТЕОРЕМА ГЛИВЕНКО 281 § 571 Доказательство. Действительно, событие Ех можно двумя следующими способами представить в виде суммы несовместимых событий: == EjEg . + Еп —1Еп Еп и Et = ЕхЕ2-f"*^,2Е'з+ • •. + En_tEn-j-EnEn+1 -|- • • • + E. Отсюда P {EJ = P {ЕД} + P {ВД} + • • • + P + P Д} P {EJ = P {EtE8} + p {ЕД} + .. • + P {Еп-1Ёп} + p {^A+1} + t +... + p{E}. Сравнение последних двух равенств приводит нас к соотношению Р{Е} = Р{ЕЙ}- 2 Р{ад:}. Так как вычитаемое в правой части есть остаток сходящегося ряда, то Р{£}= НшР{Еп}. П ->ОО Лемма 4. Если каждое из событий конечной или бесконечной последовательности Ev Е2, ... , Еп, ... имеет вероятность, равную единице, то вероятность их совместного осуществления также равна единице. Доказательство. Рассмотрим, сначала два события Е{ и Е2, для которых Р{Е1} = Р{Е2) = 1. Так как Р {Е1 + Е3) = Р {EJ + Р {Еа} - Р {EtEa} и Р{Е14-Е2} = 1, то р{ад^1. Отсюда заключаем по индукции, что для любых п событий, для которых Р{Е1} = Р{Е2} = ...=Р{Ея) = 1, выполняется также равенство Р{Е^...Еп}^\. Пусть теперь имеется бесконечная последовательность событий Et, Е2....Еп, ... , для которых Р{Е1} = Р{Е2)«.,.=Р{Е„} = .., — |,
282 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. 11 Так как очевидно, что . ^1^2^3 • • • — (^1^2^з) • • • и каждый последующий множитель в правой части равенства влечёт за собой предыдущий, то согласно предыдущей лемме Р {£хед ... } - lim р {BtE9 ... Еп}. п-> ОО Это равенство доказывает лемму. Теорема В. И. Гливенко. Пусть F (х) — функция распре- деления случайной величины £ и Fn(x)— эмпирическая функция распределения результатов п независимых наблюдений над вели- чиной $. Тогда при п->оо Р{ sup |F„(x)-F(x)HO} = l. — оо <а?<оо Доказательство. Обозначим через xrt наименьшее х, удов- летворяющее неравенствам £(х-О) = £(х)<|<£(ЯО) (£=1,2, ... , г). Пусть А означает событие, состоящее в том, что 5 < хг, Ясно, что Так как частота появления события А равна Fn (хг, й), то по теореме Бореля (лемма 2) Р{^(*„*) -* F(xr. *)}=.!. (5) »->ОО Пусть теперь Ел есть событие, состоящее в том, что при п -> оо Fn (^r> ft) F (Xf, s) (A e 1> 2, ... , f) и = ... Ey Ясно, что событие Er равносильно тому, что при п -> оо max |F„ (xr, k) — F (xr, ft) | -> 0. !<»<«• Так как согласно (5) Р {£?} = Р {££} = ... = Р {#} = Ь то в силу леммы 4 Р {Е'} = 1. Пусть далее £=£W ... Согласно лемме 4 Р(£) = 1.
§ 581 ТЕОРЕМА КОЛМОГОРОВА 283 Обозначим, наконец, через 5 событие, состоящее в том, что при п -> оо sup |ля(х) — Л(х)|->0. —оо <аз< оо Для любого х, заключённого между и 4-1, выполняются неравенства Рп (Хг, к + 0) < Рп (х) < Fn (хг, й +1) и Р {Хг, к 4- 0) < F (х) < F (хг, к + О, причём О F (хг, л 1) — F (хг, к 4~ О) ~ • Отсюда мы заключаем, что Fntxr, к 4- 0) - Р (хг, к+1) < Fn (х) — F (х) < (*г, л 4“ 1) ? (*% л “Ь 0)> т. е. что I Рп {х) — F (х) |< max \Fn(xr,k) — F (хг, й) I + у 1<Л<г г и что, следовательно, sup |F„(X) — F(x)|< max | Fn(xr,k)—F(xr,k) |4-y. —oo<®<oo r Поскольку г произвольно, то из последнего неравенства вытекает, что Этим, очевидно, доказано, что Р{ sup |F„(x)— F(x)|->0) = l. —GO <®< CD § 58. Теорема Колмогорова Мы перейдём теперь к формулировке и доказательству другой основной теоремы математической статистики, найденной А. Н. Кол- могоровым в 1933 г. Подобно тому как в теоремах о законе больших чисел не даётся точных оценок вероятностей возможных уклонений средних арифме- тических случайных величин от их математических ожиданий, так и теорема Гливенко устанавливает важный факт сближения эмпири- ческих функций распределения с той, которой подчинена наблюдаемая случайная величина, но не устанавливает, с какими вероятностями могут возникать те или иные уклонения. Возникает задача опреде- ления функции распределения величины Dn= sup |fn(x) —F(x)|.
284 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. 11 Цель настоящего параграфа сострит в доказательстве следующего предложения. Теорема А. Н. Колмогорова. Если функция F(х) непре- рывна, то при п-+со о •и<2)->К(г) = 2 при г>0. 1С=х:—00 Доказательство.*) Пусть, как и прежде, величины х*, х* ... . ..,xw означают peзvльтaты п независимых испытаний над случайной величиной 5, расположенные в порядке возрастания их величины * ♦ * «^1 «^2 Хп* Обозначим через гк наименьший корень уравнения (вообще говоря, существует единственный корень zki но если в целом k сегменте F (х) == —, то любая точка этого сегмента может считаться корнем гк). Пусть далее с — некоторое целое положительное число (О < с < п). Определим сначала вероятность неравенства ~ с Это событие, очевидно, эквивалентно тому, что найдётся х, при котором будет выполнено либо неравенство Fn(x)-F(x)>|, (1) либо неравенство Гя(х)-Г(х)<-|. (И Если при некотором х выполняется неравенство (1), как не- трудно видеть, при некотором t должно выполняться равенство Но по определению где г — некоторое целое положительное число. Таким образом, если при некотором х имеет место неравенство (1), то для соответствующей величины t имеет место равенство P^^J-ZZL. v 7 п *) См. [11.10] в списке литературы в конце книги.
§ 581 ТЕОРЕМА КОЛМОГОРОВА 285 Точно так же, если имеет место (V), то для соответствующего t F(Z)==£±c. v 7 п Таким образом, каждое I обязательно должно быть одним из чисел гк> Так, в случае (1) k = r — с, а в случае (1') k = r-\-c. Иными сло- вами, в случае выполнения неравенства (1) левее точки попадает k -f- с наблюдённых значений величины 5, т. е> •^АЧ-с + o + l > % к* (2) Точно так же в случае выполнения неравенства (1') %к— с ^kf Л'А—с4*1 > ^к,* (2^) Событие, состоящее в выполнении неравенств (2), обозначим сим- волом Ак{с), а событие, состоящее в выполнении неравенств (2') — символом Ак(—с). Очевидно, что неравенство Dn~ выполняется тогда и только тогда, когда наступает по меньшей мере одно из событий GO» А%(с), Д2( ^)» ••• > О*)» События Ак(±с) и Лг(±с), вообще говоря, совместимы, поэтому для вычисления вероятности Р Dn > 1 нельзя непосредственно вос- пользоваться теоремой сложения вероятностей. Нам придётся итти обходным путём и построить новые последовательности событий уже несовместимых. Положим*) иг = А1(с)А1(—с) ... X-i(c)A-t(“с)4(c) И == (с) Xj ( с) . •• Аг~! (с) (— с) Аг (с) Аг ( с). ♦) Таким образом, событие Ur состоит в том, что одновременно выпол- няются неравенства |Fn(^)-F(^)|<4 (/=1,2,..., г-1) и равенство F (^г) ~ • Событие же Vr состоит в одновременном выполнении неравенств |ЗД)-/^)|<| (7=1,2......г-1) и равенства FnM-F(zr)-------
286 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. ц Так как п п &«=i и построенные события Ur и Vr несовместимы, то п Р{^>у} = 2>М}+Р{^}]. (3) fc=l Для вычисления вероятностей Р {Uk} и Р {Vk] воспользуемся сле- дующими очевидными равенствами: к р М*(С)} == s {Р {Ur} р {Ак(с)1Аг (С)}+Р {Уг} р {Ак(с)/Аг(—с)}} (4) Г=1 И к Р {Ак (-с)} = 2 {Р {£7J Р (Ак(- с)/Аг(с)} 4- + P{vr)P{4HM(-f)l}. Для вычисления 2д неизвестных Р{С7Г} и Р {^} (г-1, 2, ...» п) мы имеем, таким образом, 2п уравнений. Коэффициенты этих урав- нений легко могут быть вычислены. В самом деле, Р {Ак (с)} равно вероятности того, что при п независимых испытаниях k-\-c раз случайная величина примет значение, меньшее гкУ и п— (^4~с) раз — значение, большее гк. Но вероятность случайной величине при- k нять значение, меньшее zki равна — , поэтому Р(ЛМ|=с;+Ч4)‘+’(1-4Г*”. Точно так же РИИ-^СГ^П!-^’- Вероятность события Ак{с), когда известно, что событие Аг(с) осуществилось, есть не что иное, как вероятность попадания k— г наблюдённых значений в интервал (zr> гк) и (/г — k — с} значений— правее zk (по условию г-]-с значений оказались левее гг). Таким образом, Р {Ак (е)/Аг (с)} = С'Гг-о Г 0 ~ п^к^и k—г П — Г
§58] ТЕОРЕМА КОЛМОГОРОВА 287 Подобным же путём легко найти, что Р {А* (с)/Аг (- с)} = C*Z^c r+2e (1 fe — r ° n — r) P |Л(- cM(c)} = c-;z-(^/-r-2c (1 - ^pft+c, p w_ c)Mr(- C)} = c*z;+c(^p(i _£p. Введём обозначение лЛ+с Легко видеть, что р^»°—xw(~c> P|x>(-c)|=£»fc±^-»<c> Р |A„ (c)jAr « ) - Рп—г ( С) Р(л»м/лг(_С))_), Рп-r \Ч Р (А, (- «Ж («)) Рп-r\ Ч р И* (- c)/Ar(-c)} = Pn-r^f Введём, наконец, обозначения “r=P(^)/4=F)’ Vr=^Vr)lT^ Рп-rx Ч Рп—г\с) После несложных преобразований находим, что уравнения (4) принимают следующий вид: к Рк(с) = 2 {«гРй-г(°) +VrPk-r (2с)}. Г«1 к Рк С)= 2 {^гРк-г ( 2^) ^гРк-г (0)}* Г₽=ц (7)
288 ЭЛЕМЕНТЫ СТАТИСТИКИ (гл. 11 Важно заметить, что величины рк(с) определены для всех k и урав- нения (7) определяют иг и <ог при всех г > 0 (а не только при г^п). Мы не станем решать уравнения (7) непосредственно, а перейдём к преобразованиям Лапласа. Рассмотрим при Х>0 функции °° А' = 1 ® (к)=2 /с=1 ОО Улл=1 Уравнения (7), как легко проверить, в терминах преобразований Лапласа принимают следующий вид: р (К с) = и (X) р (X, 0) v (X) р (X, 2с), р(А, — с)==«(Х)р(Х, — 2с) + ®(Х)р(Х, 0). Перейдём • теперь к пределу, положив п — оо. Пусть с — z}f п, t > 0 произвольно и k таково, что при п -> оо При этом, воспользовавшись формулой Стирлинга, находим, что /— kk+G = V"e'‘+ °(1)I “ 1 / c\~G~k 1 -- в7=щ'Ю “u+ocoi. 1/ 2k -—!— r n k -J- c , так как —!-- t и n (1 + £)-'-* = (»+4) ig (i +|) =
§ 581 ТЕОРЕМА КОЛМОГОРОВА 289 В силу прямой предельной теоремы для преобразований Лапласа (см. Дополнение 2) отсюда заключаем, что при п оо Для наших целей нам нужны не сами величины Р {£7Й} и Р {VJ, п п а суммы SRI*/*} И 2 Р {Vjc}. Поэтому мы рассмотрим следующие Л=1 выражения: п к а’‘ ~ Рп (0) 2 Pk~r Ur и Ьк = />п(0) Рк~г Vr' Г=1 Г=1 ♦) Приведём метод вычисления интеграла £ dt * 1/_. Положив в этом интеграле и = 7Г—, находим, что 19 Зак. 1826. Б. В. Гнеденко.
290 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. ц Величины а* и Ь* снова определены для всех k (даже при &>п). Кстати заметим, что и j.-2p{v,}, Г»=1 Г=1 и, таким образом, Р{£>»>^} = й’» + ^- (10) Рассмотрим теперь функции (преобразования Лапласа) рп й=1 И Рп W fc=»l Приняв во внимание соотношение У2пп рп (0) -> 1 (п -> оо), а также соотношения (8), (8'), (9), находим, что <р (s) = lim lim — b(— ^=з П->осЛ W n+oo* w 1 +e — Формула (8) показывает, что функция <р($) является преобразо- ванием Лапласа функции 00 2JW /(0“2(-i)ft-1^ * ’v=- При некоторых ограничениях, выполненных в рассматриваемом нами случае, имеет место следующее предложение: пусть /(/)—неотри- цательная функция и <р<$) — её преобразование Лапласа о Пусть, далее, {«*} — последовательность неотрицательных чисел и и ($) =* 2 «4^-4 к = 1 Тогда, если при 8 -> 0 8« ($8) -> ф (s)
§ 59] КРИТЕРИЙ СОГЛАСИЯ КОЛМОГОРОВА 291 и £8->/, то при каждом />0 Соответствующая теорема со всеми требуемыми ограничениями будет доказана в Дополнении 2. Воспользуемся этим предложением. В нашем случае 6 = -L, поэтому должно быть lim ап — lim йп = /(1). П->ОО П->ОО Таким образом, Пт(ап4-й„) = 22(-1)й-1е-зд2га=1— S (-1)*г-2*Ч П->О0 fcsssl fc = ОО Приняв во внимание равенства (10), находим окончательно: lim Р {Y~nDn < z} = 2 (— I)**-2*2*3 = К (г). П->ОО fr=s—-ОО § 59. Критерий согласия Колмогорова Теорема, доказанная в предыдущем параграфе, может быть исполь- зована для решения следующей важной задачи статистики: имеются результаты п независимых наблюдений над случайной величиной Спрашивается, согласуются ли результаты наблюдений с гипотезой, что эта случайная величина имеет определённое распределение ве- роятностей F(x)? Предположим распределение F(x) непрерывным. В этом пред- положении теорема Колмогорова приводит к следующему естественному критерию согласия. Пусть в результате п наблюдений случайная вели- чина 5 получила значения Обозначим, как и раньше, эмпирическую функцию распределения через Fn (х). Пусть означает фактически найденное максималь- ное значение разности |Fw(x) — ^(х)| и Х0 = ]/г/гД»)* Если разность l-K(Xo) = P{/nDn>Xo} мала, то осуществилось маловероятное событие и расхождение между Fn(x) и F(x) нужно считать существенным, уже не объясни- мым случайностью наблюдённых значений. Если же разность 1 — К (Xq) велика, то расхождение между Fn(x) и F (х) следует считать не- существенным и нашу гипотезу можно признать согласованной с экспериментом. В качестве иллюстративного примера рассмотрим уклонение диа- метра детали одного прибора от заданных размеоов (67,8 мм). В силу 19$
292 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. И условий обработки (отбрасываются детали с диаметром, большим 67,8 мм) можно ^предполагать, что наблюдаемые уклонения размеров диаметра от заданного размера подчинены следующему закону рас- пределения: F(x) = 2 е 2 dz —оо при х О, при х > 0. В таблице 13 приведены результаты измерений девяти наудачу взятых деталей. Спрашивается, можно ли считать наблюдённое рас- хождение между F(x) и Fn(x) несущественным? Все необходимые расчёты проведены в таблице. Таблица 13 xft-67,8 Л>(^) ^п&к) F(Xj^ /=»(^ + 0)-Л(хй + 0) —1,8 0,00 0,07 0,0.7 0,04 —1,5 0,11 0,14 0,03 0,08 —1,2 0,22 0,23 0,01 0,10 —1,0 0,33 0,32 0,01 0,12 —0,7 0,44 0,48 0,04 0,07 —0,6 0,55 0,55 0,00 0,12 ~04 0,67 0,69 0,02 0,09 —0,3 0,78 0,77 0,01 0,12 -0,2 0,89 0,86 0.03 0,14 Из таблицы видно, что £^ = 0,14 и, следовательно, Хо = = 30^ = 0,42. По таблице функции К(Х) находим, что К (0,42) = = 0,0055. В соответствии с общим принципом, сформулированным в настоящем параграфе, мы должны признать расхождение между эмпирической и теоретической кривыми распределения несуществен- ным. К сказанному мы должны сделать такое замечание: число наблюдений п = 9 невелико, и мы не имели права без дополнитель- ных исследований пользоваться предельным распределением, а должны были найти точное распределение величины )/9Z)9. Таким образом, возникает задача определения точных распределений вероятностей величины VnDn для малых значений nt однако мы не будем на ней останавливаться. § 60. Классический метод определения параметров распределения Классический метод определения неизвестных параметров функ- ции распределения случайной величины $ состоит в том, что до наблюдения эти подлежащие оценке величины считаются случайными величинами, подчинёнными некоторому «априорному» (доопытному)
§ 60] КЛАССИЧЕСКИЙ МЕТОД 293 закону распределения вероятностей. Предполагая этот априорный закон распределения известным, можно вычислить, пользуясь тео- ремой Бейеса, «апостериорный» (послеопытный) закон распределения параметров при условии, что результаты наблюдений над 5 оказа- лись равными xv х2, хп. Как мы уже говорили раньше, всё последующее изложение будет относиться к определению неизвестных параметров а и о нормаль- ного закона распределения 1 °F р(х/а, о)=—7~е , о у которому подчинена наблюдаемая случайная величина 5. Плотность распределения вероятностей того, что в результате п независимых наблюдений над величиной 5 будут получены значения xv х2, ..., хп при условии, что неизвестные параметры имеют зна- чения а и о, равна 1 —— /(хп , хп/а> а) = —=— е а’8 где s2= S (*л —л)2- Если ввести обозначения п П fc = l то простой подсчёт показывает, что /(хь .... х„/а, . (1) Напомним, что в § 55 были поставлены следующие три задачи: 1) а известно, требуется определить а; 2) а известно, требуется определить о; 3) а и а неизвестны, требуется их определить. Если предположить, что а известно и <pt(a) означает априорную плотность распределения величины а, то. для условной плотности распределения вероятностей величины а при заданном а и найденных значениях х1э х2, ..., хп получим такое выражение: ? , х„; .) = . I f(x\, Х2,..хп/а, а) <?! (a) da
294 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. 11 После подстановки вместо функции / её значения по формуле (1) и последующих очевидных сокращений находим, что п (а—xf ?1 *2> • • м °) — n(a—xf [е 2а* (2) Во второй и третьей задачах соответствующие формулы будут: „ у у f(^u .......xn!at g)cp2(a) f(xb х* ...» хп/а, о) <р2(а) do и „ „1г *• V ч — /(-Уь хп1а,<г)^(а, о) J J f (А, -*2> • • • > хп/а> ’) ?8 («> °) da do где функции ср2 (а) и <р3 (а, а) обозначают априорные плотности рас- пределения вероятностей величины о и пары (а, а). После подстановки в эти формулы значения / по формуле (1) и последующих простых сокращений находим, что — И/, ( \ ?2(а/*1> •••> хп> й) = "^3-----_s! ------- (3) , Г <з~пе ^<f2(a)da () и —Д («?+(«—ш)9) ?8(а, о/Хр х2, ..х„) == —------------------J3------------------------ П—572 (И + (а—а?)2) о-пе 2 <р3 (а, а) da do и (4) Полученные формулы непригодны для практического использова- ния не только в силу их сложности, но главным образом потому, что входящие в них априорные вероятности, как правило, нам бы- вают неизвестны. Часто, не зная априорных плотностей, делают о них более или менее произвольные допущения и на их основе получают обозримые для практического применения формулы. Мы пойдём по иному пути: сделаем совершенно общие допущения о характере априорных распределений и из этих допущений выведем предельные закономерности (при л->оо) для апостериорных вероятностей. Теорема 1. Если априорная плотность распределения (а) имеет ограниченную первую производную и
§601 КЛАССИЧЕСКИЙ МЕТОД 295 то равномерно, относительно а ...» хи; = 2’ р + О( НаI)]. (5) где а = ^(а—х), (6) а хп\ о) обозначает апостериорную плотность распределения величины а. Доказательство. Действительно, из (6) находим, что По формуле конечных приращений (7) *(*+t=)_t‘w4 aa г , х где г = х4-9-^= и О < 6 < 1. ‘ V п По условию теоремы поэтому <, * 2[?1 (г)1 7^91 (а/х" *2’ • • ” Хп’о) == гйыз+м Легко сообразить, что (8) *) Заметим, что плотность распределения величины а равна Ф1 (*/*ь *2» • • •» хп1 °) «-^= <pi (а/хь x2t..хп; а). У а
296 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. И Несложные преобразования приводят нас к равенству Полученное равенство вместе с (8) доказывает теорему. Теорема 2. В условиях предыдущей теоремы М(а/хр ха, .... х„; a) = x-J-00^, М Ца — х)2/хь х2, ..., а] = ^1 -j- О . Доказательство. Действительно, из (7) находим, что М(а/В) = Г+^=Ж(а/В) У я и М [ (а — х)2/В] = -£ М (а*/В), где В означает некоторое событие. Следовательно, М(а/хр ха, х„; о) = 7Ц--^= Г а^а/хи .... х„; a)da V п J и М [(а —x)2/xt, ха, ..., хп; а] = f а2^ (а/хь ...» х„; а) da. Подстановка в эти равенства вместо функции 4^ её значения по (5) и последующие несложные подсчёты доказывают теорему. Доказанная теорема позволяет написать следующее приближённое равенство: а — х, <уЗ средняя квадратическая ошибка которого приближённо равна —. Теорема 1 позволяет получить вероятность того» что а заклю- чается в определённых границах при условии, что величины о, х1э х2, хп приняли определённые значения. Действительно, Р{|а — х| <^=lxlt хп; <Л==Р{|а|<г/Хр ...» х„; а) и, следовательно, в силу (5)
§601 КЛАССИЧЕСКИЙ МЕТОД 297 Пренебрегая величиной О ( ) (что можно сделать, вообще говоря, \ у п / только тогда, когда или а мало или п достаточно велико), мы можем считать, что । _ с ч 2 г_______________ Р 11 I < _/— % ^2» • • * • ==s ГсГ" I & 2 I у п 9 у 2п$ Теорема 3. Если априорная плотность распределения <р2(а) имеет ограниченную первую производную и ф2($):£0, [то равно- мерно относительно z %(г/хь х2, .... Х„;а) = —1=е-«,Г1+О('_2=.у1_|_|г|)1, где ф2— апостериорная плотность распределения величины ° — — —тт— у п S (9) US = ——r. /п Доказательство. Действительно, из (9) находим, что н а = $ и что S фа {z[xb ха, ..х„; а) = <р2 Г П Z 1 I ,/•—' I *^2» • • •, *^п> к п / I По формуле конечных приращений ?2 +7%)=?2 (Г)+7% (и)' где « = $-1-0-^=, а О<0< 1. V я Согласно условию теоремы 1?з(«)|<С,< Ч-оо,
298 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. И поэтому (10) Но следовательно, 1 «—s п_ _2Lj.JL 2а п а+ е а + 2 [1_|_0(1)]=3 2L п . з ___п е=]Л?(1__|уб a’r2 [1 -|-о(1)] = 2 [14-0(1)1. (12) Равенства (10), (11) и (12) доказывают теорему.
§ 60] КЛАССИЧЕСКИЙ МЕТОД 299 Из теоремы 3, очевидно, следует такой результат: Теорема 4. В условиях теоремы 3 имеют место следующие соотношения: х2, ...» хп; а) = 7ц-о^ и М[(а —s)2/Xi( х2, .... хп; а] = -g- -|- о • Эта теорема позволяет нам заключить, что при больших п имеет место приближённое равенство fl)2’ 72 средняя квадратическая ошибка которого приближённо равна Теорема 3 может быть использована также для определения вероятности того, что а будет находиться в заданных границах. Так, пренебрегая величинами порядка JLs-, мы можем утверждать, у п что при заданных xlt х2> ..хп и а с вероятностью я -JLf e~t!dt V" Jo находится в границах 7(1----^<а<7(1 +-7=). \ V п/ \ V п) В отношении третьей поставленной нг.ми задачи мы ограничимся только формулировкой результатов, так как их получение ничем не отличается от доказательства теоремы 3. Введём обозначения ______ $1 — , Г п где = Теорема 5. Если априорная плотность распределения cp3fa, о) имеет ограниченные первые производные по а и а и (х, sj ф 0, то равномерно относительно и % *^2» • • • > •К'п) === а2 = 77?',^’!(1+0Ш|1+1“>1+1₽-»). где ф8 означает апостериорную плотность распределения пары (ai> Pi)*
300 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. 11 Из теоремы 5 вытекает такой результат. Теорема 6. В условиях теоремы 5 М(а/хх, х3.....xn) = x-f-of-l М[(а —х2, ...» хп]= — fl-j-Of— п L \ у л М[а/Х1, х2, xj=7j р + О^)]' мi^-s^iXl, ха,.... aj=A[i Как и теоремы 1 и 3, теорема 5 может быть использована для определения вероятностей того, что а и а будут находиться в задан- ных границах при условии, что наблюдённые значения оказались рав- ными х2, ..., хп. Практическое значение теорем 1, 3, 5 неодинаково. По теореме 1 точность приближённых формул (5) и (5') увеличивается не только с увеличением я, но и с уменьшением о. Поэтому для определения а при известном а имеется основание пользоваться формулами (5) и (5') даже при малых п, если только мало а. В случае же теорем 3 и 5 остаточные члены полученных формул убывают только с возраста- нием п, и поэтому при малых значениях п они не дают ничего. Только что доказанные теоремы являются в некотором смысле обращениями следующих элементарных предложений. Если случайная величина $ нормально распределена, параметры а и о известны, х19 • • •, хп являются результатами независимых наблюдений В, то 1. Плотность распределения величины a = J^-(x —а) равна _ ___________________ 2. М (х/а, <з) = я и D(x/a, a) = —. 3. Плотность распределения величины асимптотически равна 1 ф2 (*/«. 2 • 4. М@а, = + D (7/а, = +
§611 ИСЧЕРПЫВАЮЩИЕ СТАТИСТИКИ 301 5 Величины аир независимы, и плотность распределения величины (а, Р) асимптотически равна 1 ф8(х, у/a, а)= . — — б2 6. М’(*|в» °) = e; D(x|a,o) = —; — — с2 1 М(ф, о)«о; D(s |а. а)~2п« Предложения 1 и 2 не требуют доказательства. Докажем 3. В § 22 мы нашли, что плотность распределения вели- чины s равна Легко проверить, что плотность распределения р есть Несложные преобразования приводят нас к равенству Для доказательства 4 заметим, что элементарные подсчёты при* водят нас к равенствам - /ТГ(£Т1) --i- - 2Г(| + 1) М$==1/4~Ms2 = 4, /- а» = о2. V П " Г(Й Отсюда и i)- Zn \ оП/ Независимость х и s будет нами доказана позднее. После того, как это будет сделано, остальные утверждения, содержащиеся в 5 и 6, становятся очевидными. § 61. Исчерпывающие статистики Английским статистиком Фишером было введено весьма важное понятие, которое мы поясним сначала на частном примере. Предполо- жим, что нами решается задача определения параметра а при извест- ном а по п наблюдениям над нормально распределённой случайной
302 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. 11 величиной. Если априорная плотность распределения параметра а существует и равна то полученная нами в предыдущем пара- графе формула (2) показывает, что условная плотность распределе- ния <Pi(a/Xj, х2, ..., хп; а) полностью определяется знанием <?i(a)9 а и средним арифметическим результатов наблюдений хь х2, ...» хп. Таким образом, каково бы ни было априорное распределение вероят- ностей параметра а, всё то новое (в случае известной дисперсии), что вносят в оценку а наблюдения, заключено в одной единственной величине х. Говорят поэтому, что х является исчерпывающей статистикой для параметра а. Точно так же при известных а и <р2(а) всё то новое, что вносят результаты наблюдений в определение параметра а, заключено в одной — - величине 7=1/ — я)2 [см. (3) § 60]. В задаче определе- * к=1 ния а при известном а, таким образом, исчерпывающей статистикой будет величина л Общее определение исчерпывающей статистики мы дадим, следуя А. Н. Колмогорову. Пусть наблюдаемая случайная величина имеет функцию распреде- ления, зависящую от k параметров 9р 92, ..., 9ft, значения которых нам неизвестны. Любую функцию^ (хр х2, ..., хп) от резуль- татов наб”людений йот параметров, значения которых известны, называют статистикой. Определение исчерпывающей статистики получает следующее есте- ственное обобщение: система функций •••> ^п) (/=1, 2, •••, в) называется исчерпывающей системой статистик для системы пара- метров 0р 92, ..., 9а, если условное ^-мерное распределение для этих параметров при известных хи х2, ..., хп полностью опреде- ляется априорным распределением параметров 9Х, 92, 9ft и значе- ниями статистик Хр у2, ..., Из формулы (4) § 60 мы заключаем, что для параметров а и а исчерпывающей системой статистик являются функции = х и у2 = Понятно, что для каждого параметра а и а в отдельности система статистик ул и у2 также является исчерпывающей. Без большого труда читатель может самостоятельно убедиться в том, что если случайная величина 5 подчинена закону Пуассона Р{« = *}==^ (£ = 0,1,2,...) с неизвестным параметром а, то исчерпывающей статистикой для а будет х — среднее арифметическое результатов наблюдений.
§62] ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ 303 Точно так же, если двумерная случайная величина (5, т|) распре- делена нормально, но параметры a, bt а2 и г неизвестны, то исчер- пывающей системой статистик для указанной системы параметров будут следующие пять функций: п Xi (Яр Я2, • • • > хп) ~ хк = Х9 Л® 1 п Х2(Л. У2. ••• Уп)^^^Ук = У, ft® 1 Ха (*1. *2. Хл(У1> У2. п Хе (*1........х„, yt.......уп) = 12 (хЛ — х) (ук — у). fc=l Здесь (хг ^), (х2, j>2), .(xw, уп) — результаты наблюдений. В качестве упражнения рекомендуем читателю самостоятельно опре- делить исчерпывающие системы статистик для параметра 1) а, 2) 3) 4) 5) г. § 62. Доверительные границы и доверительные вероятности Во вводном параграфе к настоящей главе мы указали, что задача определения неизвестных параметров иногда ставится следующим обра- зом: требуется определить такие две функции 6'(xt, х2, ...,хп) и О"(хр х2, xw) от результатов наблюдений, чтобы была практи- ческая уверенность в том, что неизвестный параметр 9 находится в пределах между 9' и 9". Функции 9' и О'7 называются довери- тельными границами для параметра 9. Для того чтобы доверительные границы для 9 были удовлетворительны, нужно, оче- видно, потребовать, чтобы условная вероятность Р {6' <0 <0'7х1, х2.....хп] параметру 9 находиться в промежутке от О' до 9" при заданных ху х2........ была достаточно близка к единице. Степень близости при этом определяется той практической задачей, с которой связано определение неизвестного параметра 9. Если известна априорная плот- ность распределения для параметра 9, то для определения довери- тельных границ в'(Яр х2» •••» хп) и 9"(Xi, х2, хп) естественно
804 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. 11 выбрать те 0' и 0", при которых для заданного о>, близкого к еди- нице, выполняется равенство е* Г/(Х1, Х2, ...» Xn/0)<p(0)d0 Лвр{Г<в<Г/х1, х2..........хя}=Л-----------------------. р(Х1, X»,..., —оо и при этом разность 0* — 0' будет минимальна. Задача определения доверительных границ в такой постановке сложна не только потому, что она приводит к сложным аналитиче- ским операциям, но в первую очередь потому, что априорная плот- ность <р(0) для параметра 0 нам обычно бывает неизвестна. Мы видели, что задача получает осмысленное и простое решение не зависящее от априорного распределения для параметров, если число наблюде- ний п настолько велико, что имеется возможность пользоваться пре- дельными теоремами. Можно, правда, итти по другому пути, а именно искать правила такого рода: каковы бы ни были результаты наблюдений хр х2, .. ., хп, требуется указать такие доверительные границы 0'(хр х2, хп) и 0"(хр х2, ...» xw), чтобы с заданной уверенностью (вероятностью) можно было считать, что в'Сч. *а> •••» *»•••> х,). Так как заранее неизвестно, каковы будут результаты наблюдений, то при решении вопроса о том, следует рекомендовать это правило или нет, нужно обращаться не к рассмотрению условных вероятно- стей Р{0'<0<0"/Хр х2, ..., х„К а к рассмотрению безусловной вероятности Р {0' < 0"} (1) того, что при применении правила не произойдёт ошибки. При заданном виде функций 0'(хр х2, ..хп) и О'^Хр х2, ..хп) вероятность (1) зависит, конечно, от функции распределения вели- чин хр х2, хп. Если это последнее распределение зависит от k параметров 0р 02, ..., 0Л и безусловная плотность распределения этих параметров даётся функцией ?(0p 0r), то Р{0'<0<0"} = = / ... /%. .... -AW,...»А- Особенно важным на практике является тот случай, когда условная вероятность русеет, о».... м (2)
§ 621 ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ 305 при любых значениях 01, 92, ..остаётся неизменной, равной неко- торому числу о. В этом случае также т. е. безусловная вероятность (1) не зависит от априорного безуслов- ного распределения параметров 62, ..., 9^. Сама гипотеза о существовании априорного распределения пара- метров не всегда осмысленна. В самом деле, как можно говорить о распределении параметра а в законе Пуассона для любой задачи, в которой характеризующая эту задачу случайная величина распре- делена по закону Пуассона? Однако, если условная вероятность (2) не зависит от значений параметров и равна одному и тому же зна- чению с», то естественно считать безусловную вероятность (1) суще- ствующей и равной со даже в тех случаях, когда существование априор- ного распределения параметров не предполагается. Условимся говорить, что предлагаемое правило имеет дове- рительную вероятность <о, если при всех возможных значе- ниях параметров условная вероятность (2) равна <о. Обратимся теперь к рассмотренным в § 60 задачам. В случае первой из рассмотренных там задач положим а' = х4-4=с>; = Vn 1 Vn Каковы бы ни были значения параметров а и а, мы имеем, очевидно: Отсюда мы заключаем, что доверительная вероятность правила равна В частности, имеем, следовательно, равенство 20 Зак. 1826. Б. В. Гнеденко.
306 ЭЛЕМЕНТЫ СТАТИСТИКИ (гл. II Во второй задаче мы считаем известным параметр а, тогда как параметр о подлежит оценке. Положим _ sУп _^Уп ° —tT> ~~1Г> где • е = «)2- , . . t=i Легко видеть, что Р{а’<о<а7а> °) = Р<«"< 77= Iа> ° В § 23 (распределение х2) мы нашли плотность распределения вели- чины s при условии, что а и а заданы. Именно -/•х— / 1/— \Л—1 У*П а) = е 2а® ?Г(")Л’Г2 / Отсюда мы находим, что — КП z ,--\П — 1 у*П ?(✓<,<«-/«, .)--£|Л . ‘‘‘dy- аГ(т)Av ' 4 Vn 1 f‘ -s- = -^=2-------J г”-1* * dz. 2 2 Мы видим, что условная вероятность неравенств а' а < а* при условии, что параметры а и о известны, не зависит от значений этих параметров. Следовательно, по предыдущему, доверительная вероятность правила \\f S {хк — а)2<’<-г I/ —«)а равна ш = п—^'-----J zn^e 2 о v ( а \ \2/
§62] ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ 307 Перейдём, наконец, к рассмотрению последней задачи, когда оба параметра а и а неизвестны. Положим di = x4“^i Ул$1 и а{ — х-\-С2Уп81, г — _ Vnst где __________ «1=]/~ 42^—^)а- При условии, что а и а заданы, мы имеем: р к <а < </«. °)=р к < < с2/«> °! I -«1 F П ) И _ Р^ОС^/а, = tja, aj. Нам нужно найти теперь условные плотности распределения а"~~ и -при условии, что а и а известны. Так как $1 у П а П для х — а________________fai_________________ «1 У п. Г * __ |/ л)12 _____а?____ ]/ Д(4-^')2 п где х'к = хк — а и х' *= ± х'к (величины х'к независимы и рас- пределены нормально с математическим ожиданием 0 и дисперсией о9). Введём теперь в «-мерном пространстве (х', х', ..., х') новую ортогональную систему координат (yt, _у2, ..., так, чтобы У1 = )Лгх'. При этом п __ п __ п п ns{=2 (4—х'у=2 хк2—их'9=2 у1—X в 2 Л Aai fc = l Л «2 и, следовательно, Так как п Jk “ 2 аИА'»’ <— 1 20*
308 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. 11 где величины aw удовлетворяют соотношениям “ | 1 при й, 0 при 1фк 'А величины х'{ нормально распределены, то величины ук также нор- мально распределены. Далее М_У& = 0(& = 1, 2, ..л). Наконец, из того, что Д , „Л ( о2 при г = £, МЛЛ = 0 при мы заключаем о независимости величин yk(k — 1, 2, ..л) и о том, что Ол = о2(£=1, 2, л). Так как далее зч _ j'i/V»—1 и в этой дроби числитель и знаменатель независимы, причём плот- ность распределения числителя равна ,.... а У 2л * а плотность распределения знаменателя (согласно § 23 распределе- ние х9) равна • /2 (л — 1) /_у/^ТТ\”~2 (п-1) оГ(^=1) \ ?/2 ) то согласно § 23 (распределение Стьюдента) плотность распределе- ния частного у11 \/ равна I Г к^2 Плотность распределения величины --==_.. , как в этом легко * Л«=2 убедиться, равна <F (*/«. °) = ~ 7 „ А-1 ч (1 + ИХ9) 2 , r«r(V;
§ 62] ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ 309 следовательно, f г -- р С1<^-Д<м =-----------АЦ- f I ’1/» J riTr(^L)J Эта вероятность не .зависит от значений, которые принимают пара- метры а и о. Мы можем поэтому сказать, что в третьей задаче доверительная вероятность правила с^Уп^а— x<tr251]/n равна ювв ран-»*?) arfx. V* Г\~2~) °' Нам остаётся найти доверительную вероятность правила, уста- навливающего границы для а. Использовав произведённые нами пре- образования, находим, что Отсюда, в силу результатов § 23 (распределение у2) чУлТ--TV / ,/--7\П-2 У»(п —1) j Чу? е " --5=Г7---- Снова эта вероятность не зависит от значений параметров а и а. Следовательно, правило Vnst \"nst h имеет доверительную вероятность, равную w ез _1----- Г zn^e 2 dt.
310 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. 11 Заметим в заключение, что из того, что при любых 0р 02, .. имеет место равенство P{9'<6<0"/6lf 02, б*} = (о и из него вытекает равенство Р{0'<6<6"}=ш, . ещё не следует, что ш = Р {О' (хх, х2, ..хп)< 0 < 9" (хн х2, ..хя)/хи х2.хп}. § 63. Проверка статистических гипотез В § 59 мы изложили одну из задач проверки статистических гипотез. Здесь мы рассмотрим другую задачу. Предположим, что нам известна функциональная форма распределения случайной вели- чины 5, но неизвестны значения параметров 9Р 02, ..., 6А, от кото- рых оно зависит. Имеются некоторые основания считать, что пара- метры имеют некоторые определённые значения Oj — 62 = 9з, • • • ..., 9ft = вл (простая гипотеза) или же принадлежат некоторому множеству (сложная гипотеза). Требуется выяснить, подтверждают или не подтверждают эту гипотезу результаты наблюдений над вели- чиной t Для того чтобы подчеркнуть практическую важность задачи, рассмотрим примеры. Пример 1. Имеется большая партия продукции некоторого производства. Каждая единица этого продукта относится к одной из двух категорий: годная, бракованная. Вся партия считается при- годной к сдаче, если относительное число р бракованных единиц продукта невелико, скажем, не больше, чем некоторое число /?0 (О < pQ < 1). Число р нам неизвестно; его нужно найти путём иссле- дования сравнительно небольшого (по отношению ко всему объёму партии) числа изделий. Рассмотрим случайную величину 5, равную О, если взятое наудачу изделие окажется пригодным, и равную 1, если взятое наудачу изделие окажется бракованным. Функция распреде- ления $ равна О при х^О, F(x) = 1 —р при 0<х<^ 1, 1 при х> 1. Параметр р, от которого зависит распределение, неизвестен. Наша задача состоит в том, чтобы проверить гипотезу р р0. Пример 2. Случайная величина $ распределена нормально (х-а? р(х) = —— е ™ У 2к
§631 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 311 параметры а и а неизвестны. Требуется проверить гипотезу, что |л — «о1 <а и где а0, о0 и а — некоторые известные числа. Эта и аналогичные задачи постоянно возникают в теории измерений, а также в есте- ственно научных и производственных задачах. Обозначим через п число наблюдений, на основании которых необходимо сделать заключение о подтверждении или опровержении сделанной гипотезы. Пусть Х2, . . •, Хп (1) результаты этих наблюдений. Процесс проверки, ведущий к под- тверждению или опровержению гипотезы, есть некоторое правило, согласно которому множество всех возможных результатов п наблю- дений разбивается на две непересекающиеся части Rnl и При этом принадлежность чисел (1) к множеству Rnl будем считать подтверждением проверяемой гипотезы, а принадлежность их к мно- жеству Рп2— отрицанием проверяемой гипотезы. .Если мы станем изображать числа (1) как . координаты д-мерного евклидова про- странства Rn, то, очевидно, каждый процесс проверки означает раз- биение пространства Rn на части Rni и /?п2. При этом, если точка (хр х2, хп) оказывается в части RnU то гипотеза при- нимается, а если (х1? х2, ..., хп) оказывается в части Rn2, то гипо- теза отбрасывается. Множество Rn2 носит название критической области. Выбор правила проверки, таким образом, эквивалентен выбору критической области. Для иллюстрации вернёмся к примеру 1. Множество Rn в этом случае состоит из всевозможных совокупностей п чисел, каждое из которых может принимать лишь значения 0 и 1. Критическая область Rn2 состоит из тех элементов /?п, для которых Л(х,+х3Ч-------+х„)>А). Мы перейдём теперь к следующей частной задаче проверки гипо- тез, для которой имеется исчерпывающее решение: имеются две простые гипотезы Нг и Н2. Гипотеза Нг состоит в том, что В/= 9/ (/== 1, 2, ..., А), гипотеза Н2— в том, что 94==9Д/ = 1, 2, ..., £). Эти гипотезы конкурируют друг с другом и на основании произве- дённых наблюдений требуется одной из них отдать предпочтение. Заметим, что при подтверждении или отрицании гипотезы Нх мы можем совершить ошибки двух видов. Ошибку первого рода мы совершаем тогда, когда отвергаем Нх в то время, когда в действи- тельности она верна. Иными словами, ошибки первого рода имеют место тогда, когда точка (хр х2, ..., х№) попадает в область Rn2 в то время, когда верна гипотеза Hv Ошибку второго рода мы со- вершаем, если принимаем Нх в то время, когда она неверна. Еслц
812 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. П критическая область выбрана, то вероятности ошибок первого и вто- рого рода можно рассчитать; обозначим их для данных п и /?w2 соответственно буквами «j и а2. Понятно, что чем меньше для данной критической области числа 04 и а2, тем удачнее выбрана критическая область. Однако при данном числе испытаний п невозможно ни при каком выборе критической области одновременно сделать как угодно малыми оба числа 04 и а2. В то же время изменением критической области мы можем добиться произвольной малости ошибок первого или второго рода в отдельности. Так, если положить /?w2=s/?n, то ясно, что в этом случае а2 = 0; если же положить Rnl = Rn, то 04 = 0. Отсюда вытекает следующий рациональный принцип выбора крити- ческой области: при заданных значениях и я нужно выбирать ту область /?п2, для которой а2 достигает минимума. При этом, конечно, чем меньшее значение 04 мы выбираем, тем большее значение полу- чается для минимума а2. Заранее нельзя сказать, какое 04 нужно выбрать, чтобы метод проверки гипотезы был самым выгодным, так как основную роль при этом играет практическая сторона дела. Пусть для примера отбрасывание или приём гипотезы Нх связаны с материальными затратами. Если приём гипотезы Ни в то время как она неверна, приводит к большим затратам (скажем, к необходимо- сти ручной подгонки некоторых деталей, поступающих для сборки на некоторое предприятие), тогда как отбрасывание гипотезы Hlt в то время как она верна, приводит к сравнительно небольшим потерям, то ясно, что необходимо выбрать возможно меньшее а2 и при этом можно помириться со сравнительно большими значениями 04. Предположим, что практические соображения приняты в расчёт и величина 04 выбрана; тогда имеет место следующее предложение, которое мы сформулируем лишь для того случая, когда величина 6 имеет конечную плотность распределения вероятностей, как при гипо- тезе так и при гипотезе //2. Теорема. Среди всевозможных критических областей, для которых вероятность ошибок первого рода равна ах, вероятность ошибок второго рода принимает наименьшее значение для крити- ческой области Rn2f состоящей из всех тех точек (хь х2, ..., хм), для которых п п ЩЫН') > c\\f (Xb/HJ *). (2) Число с определяется из условия ф(с) = Р{(Х1, х2, ...» хи) (3) Доказательство. Так как (в случае независимых испытаний) вероятность точке (xt, х2, ..., хп) находиться в какой-нибудь *) Таким образом, /?*3 является наивыгоднейшей критической областью,
§ 63] ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 313 области S равна P{S//71} = J ... J-ДdXi dx2 ... dxn при условии, что верна гипотеза и Р {5/Н2} == f • • • Г U f (Xfc/Hg) dx^ dx% •. . dxn J 8 J k=l при условии, что верна гипотеза Я2» то согласно предположению, Р$Д} = «1 и для любой другой рассматриваемой нами области /?п2 также Согласно аксиоме сложения вероятностей Р (Япа—Rt&Rna/Hi} = Р {R„3/Hi} — Р == >= «1—Р {Rn'iRnil^i} К Р {Яп2 — Rn^Rn^Hi] = ai — Р {RmRn^H^ т. е. Р {Яи2 — RniRnz/Hi} == Р {Rnz — RnzRnz/Hi}' Согласно определению и последнему равенству Р {Rn2—RnzRnz/H*} > cP {Rhi—RnzRnt/Hi} = ез с Р {/?пз ~ RnzRnz/Hi} • (4) Но для любой точки (хь х2, ..хп), не принадлежащей /?«3, Д/(х*/Яв)<сП/(^1) Л==1 Л = 1 и, следовательно, поскольку область Rn2 — RniRnz находится цели- ком вне Rn2i должно быть cP {/?ПЗ —адЛ2/Я1} > Р \Rn2~* RnzRnz/Hz]* Это неравенство вместе с (4) приводит нас к неравенству Р {/?лз—RnvRnzIHb} Р {Rn%-~ RnzRnzjH?}* Прибавив к обеим частям последнего неравенства Р {/?W2/?n3/ft}, находим, что рЮн2}>р{/?пз/я3},
314 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. 11 А так как _ Р {RJHJ = 1 И Rnl!= Rn ~~ /?П2> Rnl == R» ~~ R»2, ТО Р{/?»1/Я3} < Р{RniHJ. • Так как Р {/?п1/№} и Р {R^/H-i} представляют собо$ ошибки второго рода для критических областей и соответственно Rn2, то теорема доказана. Нам остаётся подтвердить, что выбор постоянной с действительно можно произвести по правилу (3). С этой целью заметим, что функ- ция <ь(С)=р{/?:2///1} с ростом с может только убывать (так как неравенству (2) будет удовлетворять всё более и более «тощее» множество точек (хр х2, ... •••> *»))• Кроме того, ясно, что ф(0) = 1 (так как для каждой ТОЧКИ (АГр х2, ..., хп) П/(^а)>о). к=1 Далее из (2) следует, что Заменив левую часть неравенства единицей и вспомнив определе- ние ф(с), находим неравенство 1 > Сф (с). Итак, 0<6(с)<1 Таким образом, ф(с)->0 при с->оо. Так как функция <]>(<?) не возрастает, то при любом а1(О<а1 < 1) найдётся такое с, что ф(с —О)>а,>ф(с/^-О). , Если в точке с функция ф (^) непрерывна, то выбор постоянной с согласно правилу (3) оправдан; если же в точке с функция ф (с) имеет разрыв, то положение несколько усложняется и требуется * незначительно изменить определение множества /?пз, исключив из него часть точек (хп х2» •••> хп)> Для которых п п П/(хл/Я2) = СП/(^/Н1), Л=1 к=1 и присоединив их к множеству Rnit так чтобы вероятность ошибок первого рода была равна аг
§ 63] ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 315 Рассмотрим пример. Пусть известно, что $ распределено нормально с известной дисперсией а2. Относительно математического ожидания а имеются две гипотезы, состоящие в том, что а = (гипотеза и а = а2 (гипотеза Н2). Требуется найти выгоднейшую критическую область. В нашем примере соотношение (2) может быть записано в сле- дующем виде: 1 п е с. Это неравенство, как легко подсчитать, эквивалентно следующему (в предположении, что а2 > аг): п (».+»=) А—1 или, что то же самое, неравенству « - T?! JE > (ъ-ajYn + 1Г ^~в1Ь Полученное неравенство определяет выгоднейшую критическую об- ласть Так как величина —У (*»—®i) а А==1 распределена нормально, с математическим ожиданием 0 и диспер- сией 1, если только гипотеза Нг имеет место, то по таблицам нор- мального распределения й заданному ах легко определить (и тем самым с). Пусть для определённости 04 = 0,05. Тогда ^ = 1,645 и, следовательно, наивыгоднейшая критическая область при ах = 0,05 определяется неравенством 2 (хк — а,) > 1,645^7». • it-i Интересно отметить, что критическая область в нашем примере не зависит от конкурирующего значения а2. Область /?ni определяется неравенством п 2 Хк<аа—а1~^~2 . А«1
816 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. 11 которое, очевидно, может быть записано в таком виде: I п г~ I _/•— ^2) < Z"“ (fl2 л1)ф ° Уп Величина, стоящая в левой части неравенства, в предположении, что имеет место гипотеза //2, распределена нормально с математи- ческим ожиданием 0 и дисперсией 1. Отсюда следует, что вероят- ность ошибки второго рода равна У"», —Д1) Если заданы величины 04 и а2, то возникает задача определения минимального числа п = п(^ а2) необходимых испытаний для того, чтобы ошибочные заключения могли быть сделаны с вероятнцстями, не большими, чем 04 и.а2. С ростом п величина a2w = a2(a1, п) не возрастает и, вообще говоря, стремится к нулю. Очевидно, что п (04, а2) есть наименьшее из тех л, для которых a2(«lt«)<Ca2. В только что рассмотренном примере число п по заданным значе- ниям и а2 найти очень просто. В самом деле, из того, что 1-Ф(А1) = а1 И ф (*! — (аа _ Я1)} =. аа мы получаем два уравнения: А1 = ф(1 — ai) И £1—~(а2—«1)=ф (а2)> где ф — функция, обратная для Ф(х). Отсюда „2 * п=(0^)2[ф(1 -в<ь W Приведём небольшой числовой пример. Пусть £4 = 135, £2=150, a — 25, a1 = 0,01, a2 = 0,03. Поскольку I ф (0,99) = 2,33, ф (0,03) = — 1,88, j то п = g [2,33 + 1,88]9 = J • 4.212 ~ 49.
§ 641 МЕТОД ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА 317 Таким образом, минимальное число наблюдений, которое необходимо провести для выбора между гипотезами Ях и в случае нор- мального распределения и только что указанных данных, должно быть 49. Только при таком числе испытаний мы можем быть уве- рены в том, что если верна гипотеза то мы отбросить её можем с вероятностью, не большей одной сотой, а если верна гипотеза Н& то её отбросить мы можем с вероятностью, не прево- сходящей 0,03. § 64. Метод последовательного анализа Статистическая практика, описанная в предыдущем параграфе, не может считаться достаточно совершенной. В самом деле, при та- ком методе проверки незначительное изменение результатов испы- v таний может существенно изменить выводы, если только эти резуль- таты оказались вблизи от границы областей Rnl и Далее, так как суждение о правильности или ложности гипотезы выно- сится только после того как произведены все заранее намеченные испытания, то может случиться, что на самом деле столь же обо- снованные выводы можно было сделать, ограничиваясь меньшим числом испытаний. Для практических целей уменьшение числа испы- таний имеет большое значение, так как это, во-первых, снижает стоимость проверки, а во-вторых, даёт возможность закончить её в более короткие сроки. В практической деятельности во многих случаях и фактически поступают так, что не производят всех за- ранее намеченных испытаний, а прекращают их тогда, когда инте- ресующий исследователей вопрос выяснен в достаточной мере. Так, если для уничтожения некоторой цели отпущено определённое число снарядов, то никто не поступает так, что предварительно расстре- ливает все эти снаряды и только после этого изучает резуль- таты стрельбы. На самом же деле стрельба ведётся до уничто- жения цели, а не до того момента, когда будут расстреляны все снаряды. Только что описанная простая идея прослужила А. Волду (A. Wald) отправным пунктом для создания теории проверки статистиче- ских гипотез методом последовательного анализа. Этот метод был разработан в дни последней мировой войны глав- ным образом для целей приёмки и браковки массовой военной продукции. Идея метода последовательного анализа состоит в следующем: пространство выборок разбивается не на две, а на три взаимно не- пересекающиеся части 7?я1, T?n2, Rn3 для каждого числа (n= 1, 2,.. .) испытаний. Процесс проверки гипотезы начинается с первого испы- тания. Если результат первого испытания попадает в область то считается, что гипотеза Н подтвердилась, если же хх оказы- вается в области /?Х2, то гипотеза Нх отбрасывается, наконец, если
318 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. И попадает в область /?13, то результат одного испытания не даёт возможности с достаточной надёжностью ни подтвердить,, ни отверг- нуть гипотезу Н. В этом последнем случае требуется произвести дополнительное испытание. После двух испытаний вновь изучается, в какую из областей /?а1, /?22, R^ попадает точка (х15 х2). Если она оказывается в одной из областей /?21 или /?22, то процесс про- верки гипотезы заканчивается соответственно её приёмом или её отрицанием. Если же оказывается, что точка (х1э х2) попадает в область /?23, то произведённые испытания недостаточны для обос- нованных выводов и возникает необходимость в дополнительном испытании. Вообще, если после каждого из п испытаний оказы- вается, что точки (хр х2, ... , х^) (/ — 1, 2, ... , п) попадают в об- ласти то произведённые испытания не дают оснований для выне- сения обоснованных заключений и требуется дополнительное наблю- дение. Испытания прекращаются, как только наблюдённая точка попадает в одну из областей Rni или /?я2. Как и в-предыдущем параграфе, мы ограничимся рассмотрением задачи сравнения двух статистических гипотез. Мы предположим, как и всюду раньше, что испытания взаимно независимы и что, следовательно, их результаты хп х2, ... , хп представляют собой взаимно независимые величины с одним и тем же распределением вероятностей. Допустим, что как в предположении, что имеет место гипотеза Hlf так и в предположении, что имеет место гипотеза /72, величины х^ имеют плотности распределения вероятностей. Знаком Д(х) мы будем обозначать плотность распре- деления величины $ (и, значит, любой величины хь &= 1, 2, ... , я) при условии, что имеет место гипотеза Я4(/=1, 2). Обозначим через Rni событие, состоящее в том, что точка (хп ... , хп) попадёт в область Rni (Z = 1, 2, 3) и через R{ — собы- тие, состоящее в том, что произойдёт одно из событий Rlh R2i, ..., т. е. = Ru + ₽2< + • • • Понятно, что события + и R3 противоположны. Пусть, далее, «1=р{» и обозначают вероятности всё время попадать в области Rn3 при всех значениях п при выполнении соответственно условий Нг и Я2. Так как для практических целей, впрочем, как и для теоретических, наиболее интересен тот случай, когда процесс сравнения гипотез с вероят- ностью единица приводит к определённому решению — предпочтению одной из гипотез или Н2 перед другой, — то мы ограничиваемся рассмотрением только случая CDj == со2 = о.
§641 МЕТОД ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА 319 Обозначим, через 04 и а2: как и прежде, ошибки первого и второго рода а2 = Р{ед}. Естественно, что одним из основных вопросов для последова- тельного анализа является выбор областей Rnv Rn2 и Rn3. Один из способов, связанный с доказанной в предыдущем параграфе теоре- мой, положен в основу результатов Волда. Этот способ состоит в следующем: выбираются два положительные числа А и В (Л<В). На каждом шаге проверки, т. е. после каждого испытания вычи- сляется отношение п п Если это отношение заключено в пределах от А до В, то считается, что произведённые испытания не дают возможности судить о пред- почтительности какой-либо из рассматриваемых конкурирующих гипотез. Если же это отношение превосходит В, то гипотеза Нх отбрасывается и принимается гипотеза Н2. Если, наконец, указанное отношение меньше, чем А, то процесс проверки заканчивается приёмом гипотезы Яр При этом, конечно, постоянные А и В выби- раются так, чтобы вероятности ошибок первого и второго рода не превосходили заданных величин 04 и а2. Рассмотрим теперь событие а, которому впоследствии мы при- дадим смысл одного из событий Rr или /?2. Пусть v — случайная величина, принимающая только целочисленные значения и равная п, ест на n-м шаге впервые точка (xt, ... , хп) попала в область Rni (соответственно в /?п2). Рассмотрим теперь случайную величину *1 ='?(*!> *••» *»)> представляющую собой некоторую функцию результатов наблюдений. Более точный выбор её мы произведём позднее. Заметим, что величины ^)= Пб(х<) (=1 (7 = 1, 2) также являются случайными. Для дальнейшего основную роль будет играть следующее тождество: М {4°Р (а/ъ} = М 7]/яаа} р {Й//41 (1)
320 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. П являющееся почти очевидным следствием определения условного математического ожидания. Действительно, по определению со м = р {*1Нд 2 f 4п) ip4n) dxt... dxn 9П и оо м {1Г10 } = р ^Яг> 2 / dxt... dx„, « = 1 ап где ял является пересечением множеств Rnl -[- Rn% и я. Сравнение этих двух равенств и приводит нас к тождеству (1). Положим теперь в равенстве (1) последовательно а = Rt и а = /?2. Так как р{rjhj = 1-31) р{ад)=в1 <29 И Р {RJHJ = а2, Р{ад) = 1 - «9, (23 то, положив в равенстве (1) = находим, ТС | ' ЧТО /те0) / X чфг1/?1)=^ (П и /-00 / \ 1 <3") Точно так же, положив в равенстве (1) iq= -Хг и использовав соотношения (2') и (2"), находим, что 1 а / тс(^ / \ f I \ at ~= м /ад): м Ш вд’)=,г=Ь? (4) л \ » / \ те2 I " Введём теперь в рассмотрение случайные величины При этом обозначении f 2 (^n) /1 (^n) Так как среднее арифметическое не меньше чем среднее геометри- ческое, то для любой положительной случайной величины ц (знак равенства имеет место только в случае т]= const.).
§641 метод последовательного Анализа &21 Положим и По определению ^ = м(-чпА) == f lg^/a(x) dx = ~ / lg^/a (х) d3t' Согласно сделанному замечанию, если ~ ф const., то J ,&Ш/а (х) dx < lg J Ш/а (х) dx “Ig 1=°- Таким образом, точно так же > 0. Рассмотрим теперь сумму = + ••• +С, 2 и воспользуемся следующим тождеством, получившим название тождества Волда *): м (С, + С9ч- ... +W) = М т) • м (Сх/Н<) (/-1,2). Из него вытекает, что 1 ( 40 / ' м (С1/нэ \ 47 , (/=1,2). (5) Это равенство весьма существенно, так как оно даёт возможность выяснить, как много в среднем нужно произвести испытаний, чтобы методом последовательного анализа произвести выбор между гипо- тезами и Равенство (5) мы используем теперь для вывода двух полезных неравенств. А именно, так как по предположению то <о1 = ша = О, Р!^1 + ^} = 1- ♦) Доказательство этого тождества находится в конце дополнения 1. 21 Зах. 1328. В. В. Гнеденк?.
322 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. ц Следовательно, м(1^М=р{«1Ж м^ф/ад)+ ( «<” / \ + P(₽V"4M 1g-75/ад). X К1 / / Но / / \ / 4V) / \ м ig-^/ад =-м(1?-^/ад). \ К1 / / \ я2 / / И согласно предыдущему ( 4° I \ /40 / \ м(1g^0 Hrfj)< 1gм(н^}. В силу соотношений (2) и (3) находим, что Точно так же получаем, что В соотношениях (6) и (7), вообще говоря, будет знак стро- гого неравенства; только в случае, когда отношение j\ (х) к /2(х) равно постоянному С, на Rt и постоянному С2 на /?2, в формулах (6) и (7) будут знаки строгого равенства. Естественное использо- вание полученных соотношений таково: посредством полученных соотношений получаем минимальные значения для среднего числа испытаний. Если эти числа оказываются большими, чем это требуется для самого выгодного классического метода сравнения гипотез, то, понятно, имеет смысл пользоваться классическим методом. Теперь от общих соображений о методе последовательного анализа мы перейдём к нескольким практическим замечаниям. Прежде всего фактическое определение областей Rnl и Rn2 по заданным вероятностям 04 и а2 представляет весьма сложную задачу. Более того, точное определение констант А и В в только что описанном методе Волда практически не выполнимо. Именно это обстоятельство заставляет пойти по пути разыскания приближённых формул. Соот- ношения (3) и (4) дают такую возможность. Мы говорили, что если отношение Л ~ = П i 2==1 fl (Xi)
§641 МЕТОД ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА 323 превосходит некоторое заранее указанное число В, то мы принимаем гипотезу Яа и, следовательно, отбрасываем гипотезу Hv Таким образом, для области /?9 постоянно я(») _(п) Отсюда мы заключаем, в силу второго из соотношений (4), что (8) «1 Точно так же, поскольку для области постоянно то А>Г^Т' (9) 1 — °1 Из полученных неравенств вытекает в частности, что Неравенства (8) и (9) будут использованы нами для построения приближённого приёма решения стоящей перед нами задачи. Этот метод состоит в том, что приближённо считаем Л = г^-, В = ^—^, (10) 1 — aj ’ v ' При этом меняются, конечно, области /?п1, /?п2, а вместе с ними и величины ах и а2, оценивающие точность метода. Если мы обозначим через аг и а2 вероятности ошибок первого и второго рода для вновь определённого разбиения пространства выборок, то в силу неравенств (8) и (9) находим, что / Умножим первое, из этих неравенств на (1—a2) (1—а2), а вто- рое на (1—at) (1—ai) и затем сложим полученные произведения. В результате находим, что «1 + «з < «! + «а- В качестве простого иллюстративного примера рассмотрим снова проверку гипотезы Hlt состоящей в том, что математическое ожида- ние величины 6, распределённой нормально с известной дисперсией а2, равно аг по сравнению с конкурирующей гипотезой Я2,. состоящей 21*
324 ЭЛЕМЕНТЫ СТАТИСТИКИ [гл. ц в том, что дисперсия равна о2, а математическое ожидание равно а2(аа>а1)» В этом примере ?„==« Гипотеза отбрасывается или принимается в зависимости от того, выполняется ли неравенство Яп> в или неравенство Яп < Эти неравенства, как легко видеть, могут быть записаны иначе: Н1 отбрасывается, если g*lgB—у (я* —д*) g21gв п Хк > а2—= * 2 fc«=i и принимается, если п Значения величин А и В находятся по формулам (10). Таким обра- зом, гипотеза Нх отбрасывается, если fc«=l , и принимается, если 2 >g Е=^ + < Рассмотрим числовой пример. Пусть, как и в предыдущем пара- графе, ^=135, а = 25 (гипотеза Ях); а2=150, а = 25 (гипо- теза/^); aj’ = 0,01, а2 = 0,03. Для того чтобы принять или отвер- гнуть гипотезу /7, нужно вычислять последовательные суммы а?14-х24- +...-4«хп наблюдённых значений величины S (л=1, 2, ...). ; Гипотеза Нг принимается, если при некотором п сумма -|- х2 4-... -f - хп оказывается меньшей, чем в„= 142,5я — ^ 1g 33 = 142,5л —165, " у : .........ч .
§641 МЕТОД ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА 325 и отвергается, если при некотором п эта сумма оказывается боль- шей, чем Ьп = 142,5л + 1g 97 142,5л Ц-190,6. В таблице 14, приводимой ниже, даны результаты и все необходи- мые для проверки гипотезы Нх величины. Так как при п = 20 сумма х 2 4“ • • • + хп оказалась меньшей а20, то принимается гипо- теза и, значит, отбрасывается гипотеза //2. Наблюдения дальше не производятся. Таблица 14 п хп а'п п S Xi fc=l ь'п 1 151 —18 151, 334 2 144 139 295 476 3 121 281 416 619 4 137 424 553 761 5 138 566 691 . 904 6 136 709 827 1046 7 155 851 982 1189 8 160 994 1142 1331 9 144 1136 1286 1474 10 145 1279 1431 1616 И 130 1421 1561 1759 12 120 1564 1681 1901 13 104 1706 1785 2044 14 140 1849 1925 2186 15 125 1991 2050 2329 16 106 2134 2156 2479 17 145 2276 2301 2614 18 123 2419 2424 2756 19 138 2561 2562 2899 20 108 2704 2670 3041 21 2846 —— 3184 22 — 2989 —.- 3326 23 — 3131 — 3469 24 3274 —— 3611 25 — 3416 —— 3754 Мы видели раньше, что проверка гипотезы по сравнению с конкурирующей гипотезой /У2 наилучшим классическим приёмом требует 49 наблюдений. Выигрыш в числе необходимых наблюдений, Достигнутый при использовании метода последовательного анализа, в данном примере приблизительно равен 60%. Можно доказать, что в задаче определения математического ожидания нормально распре- делённой случайной величины 5 при известной дисперсии имеет место следующий факт: математическое ожидание числа испытаний, которое
326 ЭЛЕМЕНТЫ СТАТИСТИКИ [ГЛ. П требуется методом последовательного анализа, приблизительно вдвое меньше, чем число испытаний, требуемое наиболее выгодным мето- дом, использующим заранее определённое число испытаний. Заметим, что при практическом использовании метода последова- тельного анализа нет нужды заранее рассчитывать числа ап и Ьпу а можно воспользоваться следующим графическим приёмом. Рас- смотрим в плоскости координат (л, х) две прямые: I 1g ft... И ^+0. —±_lgL±^. 2 1 —ai n и построим ломаную, проходящую через точки (п9 Как только эта ломаная окажется под первой прямой или над второй прямой, так испытания тотчас прекращаются и соответственно принимается гипотеза Ну или гипотеза Н2. В рассмотренном нами числовом при- мере уравнения указанных прямых таковы (черт. 18) у =142,5/г—165, j/ = 142,5#+190,6. В заключение приведём черт. 19, иллюстрирующий области RnV Rn& Rnt в нашем примере. При этом мы ограничимся рас- смотрением случаев #=1,# = 2и# = 3, так как в этих трех случаях возможно их наглядное графическое представление. К тому же эти три случая дают достаточно полную картину, чтобы по ней судить Об областях Rtf (/= 1, 2, 3) при п > 3,
§64] МЕТОД ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА 327 R» Л» 'шшту mwwmkj, %
ДОПОЛНЕНИЯ ДОПОЛНЕНИЕ 1 ОБ АКСИОМАТИКЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ Данное в § 8 изложение аксиоматического подхода к определе- нию вероятности должно быть нами дополнено. Это дополнение позволит нам подойти с иной, более совершенной, точки зрения к построению понятия случайной величины. На протяжении всей книги мы рассматривали понятие случайного события в качестве первичного. Однако в целом ряде уже рас- смотренных нами примеров возможен другой, пожалуй, даже более естественный подход. Так, в задачах на геометрическое определение вероятности рассматривается область О пространства (прямой, пло- скости и т. д.), в которую «наудачу» бросается точка. Случайными событиями при этом являются попадания в те или иные подобласти области G. Каждое случайное событие является при этом некоторым подмножеством множества G. Эта мысль положена в основу общей концепции случайного события в аксиоматике А. Н. Колмогорова. Колмогоров исходит из множества U элементарных собы- тий. Что представляют собой элементы этого множества для логи- ческого развития теории вероятностей безразлично. Далее рассматри- вается некоторая система F подмножеств множества Z7; элементы системы F называются случайными событиями. Относительно струк- туры системы F предполагаются выполненными три следующие требования: 1) F в качестве элемента содержит множество U. 2) Если А и В — подмножества множества U—входят в F в качестве элементов, то в качестве элементов F содержит также множества А-f-В, АВ, А и В. 3) Если подмножества А19 А2, ...» Ап, ... множества U являются элементами множества В, то их сумма At -j- А2 -f-... 4“ An . и произведение А^.. .Ап... также являются элементами F. Множество В, образованное таким образом, представляет собой борелевское тело множеств. При этом под А-j-В мы понимаем множество, составленное из элементов U, входящих или в А, или в В, или и в А и в В; под АВ понимаем множество, состоящее из элементов £7, входящих и
ОБ АКСИОМАТИКЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ 329 в Л и в В; и, наконец, под А (В)— множество элементов £Д не входящих в Л (в В). Поскольку в F в качестве элемента входит все множество £7, то согласно второму требованию F содержит также U, т. е. F в качестве элемента содержит пустое множество. Только что изложенный способ определения случайного события вполне согласуется с тем представлением, которое мы получили при рассмотрении конкретных примеров. Для большей ясности рассмо- трим подробнее два примера с этой точки зрения. Пример 1. Бросается игральная кость. Множество U эле- ментарных событий состоит из шести элементов: Е2, Е& Е^ Е^ Е6. Здесь Е^ означает выпадение I очков. Множество F случайных событий состоит из следующих 2е = 64 элементов: (7), (£0. (£2), (£8), (£4)> (В,), (£,). (A, fa), (5П в8), яв), (£j, £*2» ^з)> • • •» А)> (^1» ^8’ • • •» (^8» ^б)> (^1> ^2» ^*8» ^*4» ^б)’ • (^2> ^3> ^4? ^5’ ^б)» (^1> ^2» ^8> ^4> ^б» £«)• Здесь каждая скобка показывает, из каких элементов множества U составлено подмножество, входящее в качестве элемента в состав F; символом (V) мы обозначили пустое множество. Пример 2. Задача о встрече. Множество U состоит из точек квадрата: 0<;х<;60, О^у^бО. Множество F состоит из всех борелевских множеств, составлен- ных из точек этого квадрата. В частности, входит в состав F и является случайным событием множество, состоящее из точек замк- нутой области \х—у |С20. Нам естественно ввести следующие определения. Если два случайных события Л и В не имеют в своём составе одних и тех же элементов множества £7, то мы будем называть их несовместимыми. Случайное событие U будем называть достоверным событием, а случайное событие £7 (пустое множество) — невозможным собы- тием. События А и А называются противоположными. С точки зрения теории множеств, введение в множестве случай- ных событий вероятности есть введение в множестве £7 нормиро- ванной, счётно-аддитивной, неотрицательной меры, определённой для всех элементов множества F. При определении случайной величины мы будем исходить, в соот- ветствии с общим понятием случайного события, из множества эле- ментарных событий £7. Каждому элементарному событию е поставим в соответствие некоторое число Мы екажем, что 5 есть случайная величина, если функция /(<?) измерима относительно введённой в рассматриваемом множестве £7 вероятности. Иначе
330 ДОПОЛНЕНИЕ 1 говоря, мы требуем, чтобы для каждого измеримого по Борелю множества значений Е множество Ае тех е, для которых / (е) с принадлежало множеству F случайных событий и, следовательно, для него была бы определена вероятность Р{5с А) = Р{Де}. В частности., если множество А$ совпадает с полупрямой $ < х, то вероятность Р {Ае} есть функция переменного х P{5<x} = P{Ae}=F(x), которую мы назвали в основном тексте функцией распределения случайной величины Е. Пример 1. Рассмотрим последовательность п независимых испытаний, в каждом из которых вероятность появления события А постоянна и равна р. В этом примере элементарные события состоят из последовательностей появлений и непоявлений события А в п испытаниях. Так, одним из элементарных событий будет появление события А в каждом из испытаний. Всего, как нетрудно подсчи- тать, будет 2п элементарных событий. Определим функцию р. = /(г) от элементарного события е так: она равна числу появлений события А в элементарном событии е. Согласно результатам главы 2 p{j* = A} = Pn(A) = CWft. Измеримость функции р = /(е) в поле вероятностей непосредственно очевидна. Отсюда, согласно определению, заключаем, что р есть случайная величина. Пример 2. Произведены три наблюдения за положением моле- кулы, двигающейся по прямой линии. Множество элементарных событий состоит из точех трёхмерного эвклидова пространства /?3. Множество случайных событий F состоит из всевозможных боре- левских множеств пространства /?3. Для каждого случайного события А определим вероятность Р {Л} посредством равенства 1 fff -^((А-а)а+(®а-а)2+(®а-а)21 . . , р “ mW J J J е аХ1ах^хй. А Рассмотрим теперь функцию Е=/(е) элементарного события e = (xlt хй, ха), определённую посредством равенства ? •= у (xi + хя+хз)- Эта функция измерима относительно введённой нами вероятности,
ОБ АКСИОМАТИКЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ 331 поэтому $ является случайной величиной. Для неё функция распре- деления равна . з S (аЪ-О)’ Р(х) = Р {$<*} = ^-)3 JJj е к dxidx^dx^ ®i+ #2 + ^3 < Зя? » »(г-а)а =-----е dz. 01/2 Г 3 “ Если каждому элементарному событию е поставить в соответ- ствие точку «-мерного эвклидового пространства ^=/2(е)> •••» ^n~fn(e) и каждая из функций fk(e) (£ = 1, 2, ..., п) измерима относи- тельно введённой в множестве случайных событий F вероятности, то совокупность чисел (5Х, $а, ..., £я) называется «-мерной случайной величиной. С только что развитой точки зрения действия над случайными величинами сводятся к известным операциям над функциями. Так, если и являются случайными величинами, т. е. измеримыми относительно введённой вероятности функциями то любая борелевская функция от них также является случайной величиной. Для примера измерима относительно введённой вероятности и потому является случайной величиной. Понятие математического ожидания в этой концепции также естественно и сводится к абстрактному интегралу Лебега. За опре- делениями и выводом основных свойств абстрактного интеграла Лебега мы отсылаем читателя к книге А. Н. Колмогорова «Теория меры и интеграл Лебега». По определению, математическое ожидание случайной величины $=/($) есть интеграл IVK = J7(e)P{de}. и Условное математическое ожидание при условии В равно М{6|В} = J/(e)P{^e|5} V
332 ДОПОЛНЕНИЕ 1 Легко доказать, что это определение эквивалентно следующему: м{1|в}-]7(е)Р{лЬр^р в которое часто лучше приспособлено для практического использования. Заметим, что если событие В представимо в виде суммы конечного или счётного множества непересекающихся событий Вк 5 = 5, + ^+.... то //(6)p{de}=2 y/(*)*W- в * вж • Полезно заметить, что если раньше для доказательства теоремы о математическом ожидании суммы нам пришлось провести довольно длинные рассуждения, то теперь эта теорема является следствием формулы f J fP(de) + У gP{de). Для независимых случайных величин 5 и т) мы раньше доказали формулу (1) лишь в случае дискретных и в случае непрерывных случайных величин. В общем случае определим дискретные случайные величины и т]п формулами Л ь_1-1 'rln = v при *<»!<— Тогда лце„-'пи)=м„.лн,. Из известны* теорем о переходе к пределу под знаком интеграла Лебега легко выводим: ИтМ„=М, lim Л4и}п = 2Ит|, НтЛ4(еп.т1п) = Л1(е.»1). Таким образом, формула (1) доказана в общем случае. Полученные сведения мы применим к выводу формулы, которую мы назвали в § 64 формулой Волда. Эта формула будет получена нами из следующей теоремы, доказанной Д. Н- Колмогоровым и Ю. В. Прохоровым.
ОВ АКСИОМАТИКЕ ТЕОРИЙ ВЕРОЯТНОСТЕЙ 333 Пусть дана последовательность случайных величин • • •> • • • И ^ = ^1 + ^+ ... 4Л* означает сумму v первых величин, причём само число слагаемых v является случайной величиной. Обозначим через Sm событие, состоящее в том, что v = m, и по- ложим Рт “ Р СО ^n=P{v>«)= Sa»- т «=• п Теорема. Если при п>т случайная величина и событие Sm независимы, существуют математические ожидания аЛ « М$Л (я, значит, величины гЛ=М|£п| конечны), ряд со 2 спРп Л —1 сходится, то математическое ожидание величины С, существует и равно СО MCyв 2 п *" 1 где Tln = M^ = aL + ^+ ... 4“-#п- . Доказательство. В силу сделанных предположений С ОО . . ‘ • с» S Рп^п e S ?паП' ' Я-=1 «=1 Так как Sn не зависит от события {v < п}, то она не зависит также и от противоположного события {v^-л}, поэтому А. = М5„ = М {?»/*>«}• Приняв во внимание только что написанные равенства, а также при- веденные ранее свойства условных математических ожиданий, мы
334 ДОПОЛНЕНИЕ 1 можем написать следующую последовательность равенств: 2 рпап = 2 P{v>«}M{Uv>«}“ 2 J 5»Р(^) = П = 1 П=1 ейР Ide}. А так как величина |ЕП| и событие также независимы, то 2 2 | I £»Р(^)|< 2 2 /|?п1Р(^)= »=l«» = n {v —я»} 1 n=lm = nSM - 2 J IMPpfe}= 2 p{*>«]M{|UA>«}== ne,^>n> » = 1 OO OO == 2 P b > «I м | и = 2 Ла, <4-co. n == 1 n«=l Только что произведённая оценка позволяет написать равенство ОО 00 л оо т /• ОО р 2 2 Rp(*)= 2 2 Rp(^)=2 J^mP(de). n = lm=>nStM m = ln«=slS tn == 1 8Ш fit Ttv Так как fc,P(^) = 2 /стрш г m=is; то предыдущее равенство доказывает теорему. Следствие. Если в условиях предыдущей теоремы а — =3^183 02= то оо M4 = «Mv = a2 прп. П =S 1
ДОПОЛНЕНИЕ 2 О ПРЕОБРАЗОВАНИЯХ ЛАПЛАСА Пусть функция а (/) определена при положительных значениях t и имеет на положительной полуоси ограниченную вариацию. Интеграл ОО о называется преобразованием Лапласа функции а (/). Употребление преобразований Лапласа в теории вероятностей особенно полезно при рассмотрении неотрицательных случайных величин. Мы ограничимся здесь только доказательством тех двух предельных теорем, на ко- торые была ссылка в тексте книги в конце § 58. Формулировка и доказательство этих теорем принадлежит Н. В. Смирнову. Прямая предельная теорема. Пусть последовательность неотрицательных функций ик (8) аргумента 8 (0 < 8 < 80) удовле- творяет неравенствам u^^MeW (6=1, 2, 3, ...), где 7 > 0 и Ж > О не зависят от k и 8. Тогда^ если при 8 -> О и kb -> t для всех «*(8)->/(0> где f(t)—непрерывная функция, то каково бы ни было s>0 равномерно в каждой конечной области полуплоскости а— при 8->0 8 5 Г Г87(И Доказательство. Определим вспомогательные функции /8(t) равенствами О ик (8) при при /<о, (k— 1)8 </<68.
ззб ДОПОЛНЕНИЕ 2 Определим далее неубывающие функции (х) и g (х), определив их равенствами а g»(x) —о При х<0 и gt(x)*=> J/jO) dt при х>0; О а g(x) = 0 при и g(x) = при х>0. о Согласно условию теоремы при t > 0 для В —> О и стало быть в любой конечной области изменения аргумента х g(x) (8->0). А так как при а интегралы оо оо ffbtfdt и f f(t)e-^dt X X становятся равномерно малыми при достаточно большом X, то * lim gz (х) = g (х) при х<-|-оо. 8-> о Отсюда, в силу второй теоремы Хелли, при — оо < т < оо и 8->О оо со оо J e~ixxdgfi (х) -> J e~ixa> dg (х) = J е-® <’+<т)/ (х) dx. о о в А так как dgt (х)« J е"/? (х) dx == и оо ** “ S ик0)в-кг* f e~izxdx = &=1 (ft—1)« “ Sв» Л» 1 где $ = и при 8->0 е^ — 1 Йт то теорема доказана.
О ПРЕОБРАЗОВАНИЯХ ЛАПЛАСА 337 Обратная предельная теорема*). Пусть последова- тельность неотрицательных функций ик (8) удовлетворяет не- равенствам |^(8)-^-1(8)|<^8 (А=1, 2, ...), где L > 0 и у > 0 не зависят от k и 8 и и0 (8) = 0. Пусть, далее, дифференцируемая функция f(f) имеет абсолютно интегрируе- мую на (оо, -|- оо) производную, /(0) = 0 и интеграл при Rs>*[ f e~stf(f)dt о сходится. Тогда, если при 8 -> 0 со 00 8 2 (§)«-№_> f (1) ft=bl о то при 8 —> 0 и А8 -> t Доказательство. Определим функции /8 (/), положив -м=(° "Р" '<». \ик(Ь)е-^ при £8</<(A-j-l)8. Если о > 7 4~ ®> эти функции имеют ограниченное изменение. Действительно, полная вариация функции (t) в интервале (— оо, оо) равна при 8 достаточно малом 2 2 |«ft — «ft-i |e-ft8e + к = 1 к = 1 + S 1«й_1|е-(й-,)8в(е8’—1)<£8 2 + °° * /а (з-т) . + £3(^-1) 2 2 i_g-»(«-T) + It с= 1 Т = 1 . £afrfo--l) е-8 fr-7) 2£ Г- _а j —1 1 — (’’К) а — yl ’ 7 Рассмотрим далее функцию F(/) = 0 при '/<0, при />0. *) Доказываемая теорема носит локальный характер. Этим и вызвано большое число ограничений. 22 Зак. 1826. Б. В. Гнеденко.
338 ДОПОЛНЕНИЕ 2 В предположениях, которые были сделаны, F (t) имеет ограниченное изменение в интервале (— оо, оо) и t F(t) = f F' (f)dt. о Преобразования Фурье для построенных функций равны СО ™ e~ixt— 2 {ике~№ — = о * = * — [1—е~м] 2 (s = o-f-n), к = 1 <р (т) = J° e~ixt dF (/) = к р е~ы F (/) dt= h J est f(t) dt. 0 0 0 Приняв во внимание условие (1), а также равенство заключаем, что при 8->0 % СО -> ? (О- <2> Докажем, что при 8 -> О /«(О-*/(О- С этой целью заметим, что подсчёт, аналогичный проведённому, по- казывает, что вариации функций /6 (/) в интервале (Т, оо) равно- мерно относительно 8 малы, когда Т велико. Отсюда следует, что, выбрав из множества функций /5 (/) сходящуюся последовательность 8п->0, мы вместе с тем получаем сходящуюся последовательность преобра- зований Фурье о Приняв во внимание (2), мы заключаем, что <Р (т) = f e~ixt dF0 (/). О А так как преобразования Фурье для функций с ограниченным изме- нением однозначно определяют эти функции, то F0(t) = F(t).
О ПРЕОБРАЗОВАНИЯХ ЛАПЛАСА 339 Таким образом, всякая сходящаяся последовательность функций fzn(t) сходится к функции F (/). Отсюда следует, ’что и вообще при 8 -> О Но по определению А(О = «р] Таким образом, при 8 -> О — ГЛ и, следовательно, при 8~>0 (3) Пусть теперь kb -> t и для определённости £8 > t. Тогда к «»—«1>1+ 2 к— ы -га+. откуда к 1 78 |«s-«ml<£5 2 ^ = £8 -ei8-iLi—*’5< Ы “=[т1+‘ <2£8(й — Таким образом, если 8->0 и kb-+t, то "а— ~>°- В силу (3) находим, что ^ (§)-*/(О (kb->t). Теорема доказана. 22*
ДОПОЛНЕНИЕ 3 КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ Во введении к книге, а также в процессе изложения нами было сделано несколько кратких исторических замечаний. Теперь, не пре- тендуя на полноту изложения, мы дадим самый сжатый, но всё же более связный очерк развития теории вероятностей. Теория вероятностей, как и всякая подлинная научная дисциплина, изучает закономерности реального мира. Отсюда ясно, что основные понятия теории вероятностей, так же как и исходные ‘предпосылки при развитии тех или иных её частей, берутся не из головы учёного, а представляют собой результат сложного процесса абстракции явлений внешнего мира. Хотя при возникновении теории вероятностей область её приложений ограничивалась азартными играми, нужно думать, что крупнейшие учёные того времени — Гюйгенс, Паскаль, Ферма, Я. Бернулли видели в ней средство познания «случайных явлений». Именно в возникновении чётких закономерностей на базе большого числа индивидуальных, не связанных или почти не связан- ных между собой воздействий, предвиделась основная натурфило- софская роль теории вероятностей. Впоследствии развитие теории вероятностей направляли в пер- вую очередь проблемы естествознания, а не логические спекуля- ции представителей идеализма. Теория ошибок наблюдений и теория стрельбы, задачи астрономии и физики руководили Лапласом, Пуас- соном, Лобачевским и многими другими при построении теории ве- роятностей. Широко понятые задачи естествознания руководили П. Л. Чебы- шевым и А. А. Марковым при построении теории суммирования не- зависимых слагаемых и теории цепей Маркова. Подлинный расцвет теории вероятностей связан с возникновением и ростом советской школы теории вероятностей. И снова насущные проблемы естествознания руководили ведущими учёными в создании новых областей науки. Проблемы физики вызвали к жизни теорию случайных процессов, запросы естествознания поставили вопрос о необходимости приведения в порядок логических основ теории вероятностей. Нет сомнения в том, что успехам советской школы теории вероятностей во многом содействовало то глубокое проник-
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 341 новение в природу вещей, которое даёт марксистско-ленинское миро- воззрение. Представители советской школы теории вероятностей ни- когда не забывают замечательных слов товарища Сталина: «...тео- рия становится беспредметной, если она не связывается с револю- ционной практикой, точно так же, как и практика становится слепой, если она не освещает себе дорогу революционной теорией». (Соч. т. 6, стр. 88.) Именно в этом нужно видеть причину того, что большое число работ крунейших представителей советской тео- рии вероятностей посвящено конкретным проблемам естествозна- ния и техники. Вопросы теории телефонии и текстильного дела; статистической физики; математической статистики и контроля мас- совой промышленной продукции; железнодорожного транспорта и металлургии; гидромеханики и метеорологии и многие другие на- шли отражение в работах советских математиков. В то же время методологические вопросы, общие проблемы самой теории вероят- ностей занимали и занимают центральное место в работах совет- ской школы теории вероятностей. По путям, намеченным совет- скими учёными, идёт теперь развитие теории вероятностей во всём мире. Смешными нам кажутся попытки идеалистически настроенных бур- жуазных математиков «освободить» науку от «тирании внешнего мира», построить её на материале «чистого созерцания». Советская теория вероятностей развивается на базе марксистско- ленинской философии и успехи её ещё раз показывают, сколь боль- шая сила таится в принятой советскими математиками к руководству философской системе. Возникновение теории вероятностей относится к середине XVII века, однако первые шаги, подготовившие почву для этого, были сделаны намного раньше. Так ещё Кардано (1501—1576) в сочинении «Об азартной игре» («De ludo aleae») дал подсчёты того, сколькими спосо- бами из числа всех возможных можно получить в сумме то или иное число очков при метании двух или трёх игральных костей. Подобные же подсчёты, правда, не дающие числа равновозможных случаев, были сделаны Тарталья (1499—1557). Ещё раньше Лука Пачиоло (1445—1514) занимался знаменитой впоследствии задачей о разделе- нии ставки; об этой задаче мы скажем ниже. Научно менее обос- нованные попытки выяснения, как бы мы теперь сказали, вероятно- стей случайных событий, конечно, предпринимались и раньше в связи с азартными играми, а также в связи с определением длительности жизни, подсчётом населения, задачами страхования, незадолго до этого появившегося в Италии. Заметим кстати, что и само слово «азартный» произошло из своеобразной оценки степени надёжности появления того или иного числа очков. Арабское слово «азар» в переводе озна- чает «трудный»; этим словом обозначалась такая комбинация очков,
342 ДОПОЛНЕНИЕ 3 которая могла появиться единственным способом. Так, при бросании трёх игральных костей «трудными» были выпадения в сумме трёх и восемнадцати очков. Со временем от названия этого частного, осо- бенно неприятного для игроков случая, пошло наименование всех азартных игр. Интерес Паскаля и Ферма к задачам теории вероятностей также воз- ник отчасти в связи с азартными играми. Кавалер Де-Мере, страстный игрок, предложил однажды Паскалю (1623—1662) долго мучавшую его задачу, повидимому, имевшую для него и «прикладное» значение. Задача Мере заключается в следующем. Два игрока условились сыграть ряд партий. Выигравшим считается тот, кто первым выиграет 5 партий. Игра была прервана тогда, когда один из игроков выиграл я(а<5), а другой b (р < 5) партий. Спрашивается, как должна быть разделена ставка? Лука Пачиоло задолго до этого времени предлагал разделить ставку пропорционально числу уже выигранных партий. Кардано обос- нованно возражал, указывая, что при этом никак не принимается в расчёт то число партий, которое еще необходимо выиграть каждому из игроков. Однако и Кардано, правильно указав ошибку, не сумел найти верного решения. Правильные решения, исходящие из различных соображений, были даны Паскалем, Ферма (1601—1665) и Гюйгенсом (1629—1695). Паскаль, решив поставленную ему задачу, сообщил её Ферма в письме от 29 июля 1654 г. Тот предложил своё решение. Наконец, в 1657 г. в сочинении «О расчётах в азартной игре» («De ratiocinifs in ludo aleae») Гюйгенс предложил решение, в котором, как и в решении Паскаля, впервые участвует понятие математического ожидания. В основу всех решений положен принцип деления ставки пропорцио- нально вероятности выигрыша всей игры. Методы Паскаля и Ферма мы проиллюстрируем на рассмотренном ими частном случае: 5 = 3. Паскаль начинает со случая, когда из трёх нужных партий пер- вый игрок (игрок А) выиграл 2 партии, а игрок В (второй) — только одну. Если бы игроки сыграли ещё одну партию, то игрок Л либо выиграл бы всю игру, либо в крайнем случае сравнялся бы по числу выигранных партий с игроком В. В первом из этих случаев игрок А получает всю ставку, а во втором может требовать её половину. 3 1 В результате А должен получить ставки, а В — только — ставки. В работе «Об арифметическом треугольнике» («Traite du triangle arithmetique») Паскаль предлагает общее решение. Положим ради простоты записи m — s — a, n = s — b; тогда ставка между игроками А и В должна быть разделена в отношении —1 + 1 ...
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 343 Ферма в том же частном случае рассуждает так: для окончания игры требуется не больше чем s — я-j-s— b — 1 партий, то-есть в рассматриваемом примере не более чем две партии. При разыгры- вании этих двух партий могут представиться следующие четыре раз- личные равновозможные случая: 12 3 4 А В А В А А В В В трёх случаях, учитывая результаты ранее сыгранных партий, выигрывает игрок Див одном выигрывает игрок В. Отсюда Ферма заключает, что игрок А может претендовать на три четвёртых ставки. Гюйгенс исходил приблизительно из тех же оснований, как и Паскаль, а именно: если из u-\-v равновероятных случаев и случаев дают выигрыш a, a v случаев выигрыш (3, то ожидаемый выигрыш оценивается числом lla -|- flfl и -Ь v ' Легко видеть, что здесь в ещё более явной форме, чем у Паскаля, вводится в рассмотрение понятие математического ожидания. Впоследствии Паскаль несколько раз возвращался к задаче о раз- делении ставки, в том числе и между несколькими игроками. В указанной книге Гюйгенса были собраны все задачи, решённые к тому времени и, кроме того, предлагалось найти решение нескольких новых. Важный этап в развитии теории вероятностей связан с именем Якова Бернулли {1654—1705). Им было дано решение нескольких задач Гюйгенса. Далее он заметил, что число случаев, для которых при бросании п костей сумма очков равна т, равна коэффициенту при хт в разложении (х -f - х2 х3 -|- х4 х5 -|- х6)п по степеням х. Этим было положено начало рассмотрению произво- дящих функций. Якову Бернулли принадлежит исчерпывающая поста- новка, а также решение задачи о разорении игрока. Разностное урав- нение, рассмотренное нами в главе 1, было получено в общем случае именно Бернулли; частный случай p = q = был рассмотрен ещё Гюйгенсом. Однако не с этими частными результатами связано в первую оче- редь в истории науки имя Якова Бернулли. Основной вклад, сде- ланный им в науку, состоит в доказательстве теоремы, носящей теперь его имя и послужившей источником многих позднейших иссле- дований. Некоторые авторы утверждают, что, собственно, закон боль- ших чисел высказывался задолго до Бернулли и, например, у Кардано
344 ДОПОЛНЕНИЕ 3 имеются соображения о сближении при большом числе наблюдений эмпирических данных с некоторыми постоянными. Впрочем, и сам Бернулли в «Ars Conjectandi», говорит по поводу того, что способ определения вероятности по частоте «не нов и не необычен», сле- дующее: «всякому ясно и то, что для такого рассуждения о каком- либо явлении недостаточно взять одно или другое наблюдение, но требуется большой запас наблюдений. Поэтому-то даже самый огра- ниченный человек по какому-то природному инстинкту сам собой и без всякого предварительного обучения (что очень удивительно) знает, что чем больше принято во внимание таких наблюдений, тем меньше опасность не достичь цели». Но мы знаем, что от эмпириче- ски подмеченных фактов до формулировки закономерностей и до их доказательства из предположений о структуре наблюда- емых явлений лежит большой и сложный путь. Заслуга Бер- нулли состоит в том, что он первый сумел наблюдавшемуся факту сближения частоты с вероятностью дать теоретическое объяс- нение. Позднее, да и одновременно с Бернулли, различные авторы не- однократно отмечали, что факторы, не связанные с существом про- цесса в целом, а проявляющиеся только в единичных его осуществле- ниях, при рассмотрении среднего из большого- числа наблюдений взаимно погашаются. Это обстоятельство отмечалось как эмпирический факт и при этом, как правило, не делалось даже попыток найти его теоретическое объяснение. Впрочем, этого многим авторам в отличие от Бернулли и не требовалось, так как наличие закономерностей как в явлениях природы, так и в общественных явлениях для них было не чем иным, как проявлением правил божественного порядка. Так, член Лондонского королевского общества Джон Арбутнот писал, что наблюдаемое в обществе количественное «равенство мужчин и женщин не является результатом случая, но божественного провидения, рабо- тающего для хорошего конца». («Аргумент за божественное прови- дение, взятый из постоянной закономерности, наблюдаемой в рожде- нии обоих полов», Philosophical Transaction, 27, 1710—1712.) Другой член Лондонского королевского общества Вильям Дерхем (1657—1735) в книге «Физикотеология или доказательство существо- вания и свойств бога на основании его мироздания» (Лондон, 1713) писал, что мальчики и девочки рождаются не в случайных пропор- циях, а так, что имеется некоторый избыток мальчиков, которым «верховное существо уравновешивает большие опасности, каким под- вержены мужчины». Известный в истории демографии немецкий статистик XVIII века пастор Зюсьмильх в книге «Божественный порядок» утверждал, что «в малом всё кажется происходящим без всякого порядка. Надо сна- чала собрать множество единичных и мелких случаев за много лет и соединить воедино многие провинции, чтобы этим способом вывести на свет скрытые правила божественного порядка». 1
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 345 Впоследствии эти точки зрения были подвергнуты критике Ла- пласом; к этому мы вернёмся, когда будем говорить о его работах. Следующий успех после Бернулли принадлежит французскому математику Муавру (1667—1754), прожившему всю свою сознатель- ную жизнь в Англии. В 1718 г. появилось его сочинение «Учение о случае» («The Doctrine of Chances»), выдержавшее три издания (1718, 1738, 1756), в котором содержалось систематическое изложе- ние и дальнейшее развитие методов решения задач, возникающих в связи с азартными играми. В другом его сочинении («Miscellanea Analytica»), изданном в 1730 г., содержится доказательство извест- ных нам теорем Муавра-Лапласа для случая = а также фор- мулы Стирлинга. В вышедшей в 1740 г. книге «The Nature and Laws of Chance» Симпсона (1710—1761) среди прочих рассмотренных им задач была задача, важная для браковки и контроля продукции. Имеется данное число п вещей различного сорта: вещей первого, л2 второго, ... Наудачу берётся т вещей. Найти вероятность того, что при этом будет вынуто пц вещей первого сорта, т2 второго, ... Рядом задач, связанных с теорией азартных игр, теоретическими вопросами демографии и страхования занимался знаменитый член Пе- тербургской Академии наук Леонард Эйлер (1707—1783). Значительную известность получила задача Николая Бернулли (1687—1759), вошедшая в историю науки под именем «Петербург- ской игры». Его современники — Даниил Бернулли, Даламбер, Бюф- фон, Кондорсе и др., а затем математики XIX и Х^Х вв. много раз возвращались к парадоксу петербургской игры. Игра состоит в следующем. Пётр бросает монету до тех пор, пока не выпадет герб, после чего игра считается законченной. Павел вы- плачивает Петру один рубль, если герб выпадет при первом бросании; два рубля, если он выпадет только при втором; четыре рубля, если герб выпадет только при третьем бросании. Вообще, если герб появится впервые при я-м бросании, то Павел выплачивает Петру рублей. Спрашивается, какую сумму должен выплатить Пётр Павлу перед на- чалом игры за право участия в ней, чтобы игра была безобидна. Заметим, что игра называется безобидной, если математическое ожидание выигрыша равно стоимости участия в ней. Математическое ожидание выигрыша Петра равно со оо П = 1 Для безобидности игры необходимо, чтобы Пётр внёс Павлу беско- нечно большую сумму. С точки зрения здравого смысла этот резуль- тат является нелепостью: ни один здравомыслящий человек не стал бы участвовать в такой игре.
346 ДОПОЛНЕНИЕ 3 Для разрешения указанного парадокса было предложено большое число различных решений. Петербургский академик Даниил Бернулли (племянник Николая Бернулли) ввёл в рассмотрение так называемое «моральное ожидание». Мы не будем останавливаться на определении этого понятия, так как научного значения оно не приобрело и, кстати сказать, парадокса петербургской игры не разрешает. Большего вни- мания заслуживает соображение, высказанное Пуассоном. Идея пред- ложенного им решения состоит в следующем: не существует физи- ческих или юридических лиц, обладающих бесконечным капиталом, поэтому Павел, обещая выплатить произвольно большую сумму, если только герб долго не будет появляться, тем самым берёт на себя не- выполнимое обязательство. Если учесть это обстоятельство и несколько преобразовать условия петербургской игры, то результат получает уже осмысленное значение. Это преобразование сводится к следующему: Павел выплачивает сумму 2n_1 до тех пор, пока это число не пре- восходит его капитала, а, начиная с того п, для которого 2»-1 пре- восходит его капитал, выплачивает весь свой капитал. Пусть для примера капитал Павла равен 10000 рублей. Тогда 213 < 10 000 < 214. Таким образом, первое условие применяется при п < 15, а второе условие—- с n = 15. Следовательно, математическое ожидание выигрыша Петра равно 14 оо Si 2 i*™ 000 <8,25. • м = 1 п—15 Если бы капитал Павла равнялся 1000 000000, то ставка Петра, рав- ная математическому ожиданию его выигрыша, оставалась бы всё же меньше шестнадцати рублей. Даже в том случае, когда капитал Павла равен 1016 рублей, т. е. превосходит ценность всего «мирового иму- щества», математическое ожидание выигрыша Петра не превосходило бы 26 рублей. Даниил Бернулли (1700—1782) — один из первых русских ака- демиков— занимался теорией ошибок наблюдений, он желервый по- ставил вопрос о вычислении вероятностей гипотез при условии, что наблюдение уже принесло некоторые результаты. Эта задача полу- чила своё решение только в 1764 г. в работе Бейеса. Бейес (ум. 1763), помимо формул, выведенных нами в тексте книги, получил *) также ряд формул, разрешающих те или иные за- дачи частного характера. Для примера приведём решение следующего вопроса: событие А имеет вероятность р, значение которой неизвестно. Определить вероятность того, что р заключено в интервале от а до £, если в результате п независимых испытаний событие появилось т раз и п — т не появилось и если вдобавок распределение вероятностей *) «Ап Essay toward solving a Problem in the Doctrine of Chances», Phi- losoph. Trans., 1764, 1765.
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 347 величины р до испытаний равномерно в интервале (0, 1). Лёгкий под- счёт приводит нас к равенству ь j х™ (1 — х)п~™ dx а 1 Jxw(l — x)n~mdx о событие А, появ. т раз а^.р <Ъ Позднее эта же задача живо интересовала французского учёного Кондорсе (1743—1794) — одного из виднейших деятелей французской буржуазной революции 1789 г. В частности, его интересовала задача приложения теории вероятностей к анализу вынесения судебных при- говоров большинством голосов. Ряд интересных задач, обобщающих понятие вероятности, был рассмотрен французским естествоиспытателем Бюффоном (1707—1788). В трактате «Опыт моральной арифметики» («Essai d’Arithmetique moral»), напечатанном в 1777 г. (но написанном по утверждению его друзей ещё в 1760 г.), были введены в рассмотрение геометрические вероятности и решены многие задачи на их определение. В частности, задача о бросании иглы впервые была рассмотрена в этой работе Бюффона. Следует отметить, что Бюффон производил эксперименты с целью проверки закона больших чисел на примерах простейших схем (бросание монеты и т. п.}. Впоследствии такие испытания про- изводились неоднократно, в частности, как раз для рассмотренной нами в первой главе задачи Бюффона. Приведём некоторые из этих результатов, использованных, кстати сказать, для экспериментального определения числа тс. Экспериментатор Год Число бросаний иглы Эксперимен- тальное значе- ние тс Wolf 1850 5000 3,1596 Smith 1855 3204 3,1553 Fox 1894 1120 3,1419 Lazzarini 1901 3408 3,1415929 Так как для задачи Бюффона 2Z Р ъа ’ то приближённо 2Zn тс , ат ’ где п означает число бросаний иглы, а т — число наблюдённых при
348 ДОПОЛНЕНИЕ 3 этом пересечений. Заметим, что результаты Фокса и Лаццарини заслуживают малого доверия. Много ценных результатов Бюффон опубликовал по статистике населения Парижа и Франции в целом. Крупнейшие сдвиги в теории вероятностей связаны с именем заме- чательного французского математика и механика, бывшего, кстати сказать, иностранным сочленом нашей Академии наук, Пьера Лапласа (1749—1827). Первые работы Лапласа, относящиеся к теории вероят- ностей, были напечатаны в 1774 г.; с тех пор интерес к этой области не покидал его всю жизнь. В работе «Memoire sur la probabilit£ des causes par les Svenements» (M. A. S. P., Savantes etrangers, VI) он занимался классической задачей о разделении ставки, дал впервые отчётливую формулировку результатов Бейеса и занимался определе- нием среднего из большого числа наблюдений за одним и тем же явлением. Пожалуй, ещё существеннее то обстоятельство, что в этой работе впервые высказано много идей, которые занимали Лапласа на протяжении всей остальной части его жизни. В последующих мемуарах Лаплас много раз возвращается к задаче приближённого представления вероятностей событий, зависящих от большого числа причин. Повидимому, первый подход к решению этой задачи им опубликован в работе «M&noire sur les probabilitds» (M. A. S. P., 1778—1781). В это же время в его работе «Memoire sur les suites» (M. A. S. P., 1779—1782) он излагает теорию производящих функ- ций, впервые появившихся, как мы уже упоминали, у Я. Бернулли в связи с решением последним одной частной задачи. Статистика населения, задачи теории ошибок наблюдений, применение теории вероятностей к астрономическим вопросам — вот примерный круг задач, которые интересовали Лапласа. Мы не будем останавливаться на анализе каждой из этих работ, так как он сам подвёл итог своим исследованиям, а также исследованиям всего предшествующего периода, в классическом произведении «Аналитическая теория вероятностей» (Theorie analytique des probabilites, 1812, 1814, 1820, 1886). В качестве введения к этой книге Лаплас поместил свои лекции, прочитанные в Нормальной школе в 1795 г. и известные под названием «Опыт философии теории вероятностей» («Essai philosophique sur les pro- babilites»). В «Аналитической теории вероятностей» Лаплас впервые система- тически изложил основные теоремы теории вероятностей, дал чёткое определение вероятности, которое мы называем теперь классическим, дал доказательство теорем, получивших название теорем Муавра- Лапласа, построил теорию ошибок наблюдений и метод наименьших квадратов, использовал основные теоретические результаты для целей статистики народонаселения. При этом Лаплас не ограничивался полу- чением общематематических результатов, а рассматривал обширные статистические отчёты, часто полученные по его запросам. Всё это сопровождалось рассмотрением или в крайнем случае формуляров-
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 349 кой интересных по содержанию или неожиданных по форме примеров. Так, он указал, что число писем, не доставленных французской почтой по причине отсутствия на конверте адреса, оставалось в тече- ние ряда лет почти неизменным. У нас нет данных французской почтовой статистики, поэтому проиллюстрируем этот пример Лапласа данными русской дореволюционной статистики. Год Всего про- стой коррес- понденции в миллионах Совсем без адреса Без ука- зания места На миллион без адреса без указ, места 1906 983 26112 28749 27 29 1907 1076 26977 26523 25 25 1908 1214 33 515 26112 27 21 1909 1357 33 643 28445 25 21 1910 1507 40101 36513 27 24 Значительный интерес представляют общие философские установки Лапласа, ярко выраженные им в его «Опыте философии теории вероятностей». Думаю, что не будет ошибки, если эти взгляды на- звать механистическо-материалистическими. В некоторых местах он несомненно ведёт борьбу с теологическим и телеологическим объясне- ниями явлений природы. Так, говоря о попытках Лейбница путём математических спекуляций доказать существование бога, Лаплас замечает: «я упоминаю об этой черте для того только, чтобы пока- зать, до какой степени предрассудки детства могут вводить в за- блуждение самых великих людей». В другом месте он говорит, что «постоянство преобладания рождений мальчиков над рождениями девочек, как в Париже, так и в Лондоне, за всё время наблюдения показалось некоторым учёным вмешательством провидения...». Однако, замечает он дальше, это является «новым примером того, как часто злоупотребляют конечными*) причинами, которые всегда исчезают при более глубоком исследовании вопросов...». Собственное мировоззрение Лаплас отчётливо формулирует сле- дующими словами: «...мы должны рассматривать настоящее состоя- ние вселенной как следствие её предыдущего состояния и как при- чину последующего. Ум, которому были бы известны для какого-либо данного момента' все силы, одушевляющие природу, и относительное положение всех её составных частей, если бы вдобавок он оказался достаточно' *) To-есть телеологическое объяснение явлений.
350 ДОПОЛНЕНИЕ 3 обширным, чтобы подчинить эти данные анализу, обнял бы в одной формуле движения величайших тел вселенной наравне с движениями мельчайших атомов: не осталось бы ничего, что было бы для него недостоверно, и будущее, так же как и прошедшее, предстало бы перед его взором. Ум человеческий в совершенстве, которое он сумел придать астрономии, даёт нам представление о слабом наброске того разума» ... «Наступит день, когда благодаря длившемуся не- сколько столетий изучению, вещи, ныне скрытые, явятся со всей своей очевидностью; и потомки наши удивятся, что столь очевидные истины ускользнули от нас». Мы упомянем ещё два в высшей степени выдающихся имени, сыгравшие и в теории вероятностей первостепенную роль. Я имею в виду Гаусса (1777—1855) и Пуассона (1781—1840). И если Гаусс должен быть упомянут почти исключительно в связи с разработкой метода наименьших квадратов, кстати сказать, одновременно и неза- висимо разработанного Лежандром (1752—1833) и Лапласом, то имя Пуассона связано с обобщением закона больших чисел в форме Бернулли на случай независимых испытаний, вероятность появления в которых некоторого события зависит от номера испытаний, рас- пространением на этот случай теорем Лапласа-Муавра, а также полу- чением нового важного распределения — закона Пуассона. Пуассон получил свой закон впервые тем же самым путём, каким он был выведен нами в главе второй. Основные результаты Пуассона были объединены им в большом произведении «Recherches sur la probabilite des jugements, en mati£re crimitielle et en mati£re civille», 1837*). Использование этих результатов в теории стрельбы было проде- монстрировано им в работе «Memories sur la probabilite du tri a la cible». Мы остановимся ещё на одной известной проблеме Гаусса, которую он сообщил Лапласу в письме от 30 января 1812 г. Эта проблема в течение более чем ста лет не находила решениями только в 1928 г. советскому математику Р. О. Кузьмину (1891 — 1949) удалось найти полное её решение. Задача состоит в следующем: определить вероят- ность того, что при разложении в обыкновенную непрерывную дробь числа, наудачу взятого между 0 и 1, л-е полное частное имеет дроб- ную часть, заключённую между 0 и х (0 < х < 1). Кузьмин в 1928 г. получил для этой вероятности, которую мы обозначим через Рп(х), равенство W = '" fair- + 0 ) (а — постоянное). В 1948 г. ему удалось показать, что остаточный член этой формулы может быть записан в виде O(an)(0 < а < 1 — постоянная) и лучшей оценки не допускает. *) В этом трактате впервые был введён термин «закон больших чисел».
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 351 Мы не можем пройти мимо того факта, что Лаплас и Пуассон, оказав большое влияние на развитие теории вероятностей, явились в то же время косвенной причиной длительного её застоя, характер- ного для Западной Европы второй половины XIX и первых десяти- летий XX века. Оба знаменитых учёных широко пропагандировали применение* теории вероятностей к «нравственным наукам». Лаплас мотивировал необходимость таких применений тем, что поскольку «большая часть наших суждений основана на вероятности свидетель- ских показаний, очень важным является подчинить их исчислению». Одна из важнейших задач, стоящих перед «нравственными науками», состоит, по Лапласу, в определении вероятности «того, что решение суда, который может осудить только при данном большинстве, будет справедливо, т. е. будет соответствовать истинному решению по- ставленного вопроса». Решению подобных задач в конце XVIII и начале XIX века было посвящено большое число работ. Одним из основных принципов, положенных в основу их решения, было предположение о независи- мости выводов, делаемых различными судьями, и постоянстве вероят- ности, с которой они приходят к правильному решению вопроса. Если в решении вопроса принимает участие большое число судей, то судебный трибунал, решающий вопросы простым большинством голо- сов, был бы согласно теореме Бернулли практически непогрешимым при вынесении приговоров. Ошибка подобного утверждения заклю- чается прежде всего в игнорировании того положения, что всякий суд, будучи представителем определённого класса, не судит с закры- тыми глазами. Как замечает С. Н. Бернштейн (Теория вероятностей, стр. 192, изд. 4-е), «это утверждение, очевидно, неверно, потому что здесь не принимается во внимание, что все судьи судят на осно- вании тех же самых свидетельских показаний и вещественных доказа- тельств, так что в простом деле все они более или менее одинаково разбираются, а если запутанные обстоятельства вводят в заблуждение одних, то и для других судей ошибка становится более вероятной, иначе говоря, в случае судебного приговора отсутствует условие независимости между суждениями отдельных судей, и это коренным образом меняет положение вещей». Увлечение такого рода «приложениями», без достаточного учёта существа общественных явлений, без учёта определяющих их сторон тяжело сказалось на развитии теории вероятностей. Все эти в корне ошибочные приложения были квалифицированы впо- следствии как «математический скандал». В результате таких не- удач увлечение теорией вероятностей сменилось разочарованием и среди западноевропейских математиков широко распространилось мнение, что теория вероятностей является лишь своего рода математическим развлечением, не допускающим существенных на- учно обоснованных приложений и едва ли заслуживающим внимания серьёзных учёных. Даже успехи теории вероятностей в-её серьёзных
352 ДОПОЛНЕНИЕ 3 приложениях — кинетическая теория газов, теория ошибок, теория стрельбы и пр. — не смогли в Западной Европе сломить установив- шихся ошибочных оценок. Потребовались гений Чебышева и создание им русской школы теории вероятностей, а также бурное развитие физики, предъявив- шей повышенные требования к математике вообще и к теории вероят- ностей в частности, чтобы вернуть теорию вероятностей на путь большой науки, изучающей особыми приёмами большие группы явле- ний материального мира. Дальнейшее развитие теории вероятностей неразрывно связано с успехами нашей отечественной науки. На этом этапе развития теории вероятностей основные её резуль- таты' были получены именно в нашей стране. Развитие теории вероятностей в России. Довольно многочисленные результаты в области теории вероятностей и главным образом её применений к вопросам демографии и страхования при- надлежат Л. Эйлеру. Об этом мы упоминали ранее. Далее мы должны отметить, что среди богатейшего научного наследства создателя неевклидовой геометрии Н. И. Лобачев- ского (1792—1856) имеются ^ве работы, относящиеся к теории вероятностей. Специально не занимаясь теорией вероятностей, он заинтересовался ею в связи с вопросом о геометрии окружающего нас мира. В «Пангеометрии» Лобачевский писал, что для выяснения свойств реального пространства нужно обратиться к опыту: «...при- нятое в обыкновенной геометрии явно или скрытно предположе- ние, что сумма углов всякого прямолинейного треугольника по- стоянна, не есть следствие наших понятий о пространстве. Один только опыт может подтвердить истину этого предположения, на- пример, измерения на самом деле углов прямолинейного треуголь- ника ...». Так как при фактических наблюдениях для уменьшения влияния ошибок наблюдений производят несколько измерений и берут их среднее арифметическое, то Лобачевский поставил следующую задачу: зная функции распределения слагаемых ошибок п измерений, найти распределение вероятностей их среднего арифметического. Мы говорили в основном тексте книги, что Лобачевский решил эту задачу в пред- положении независимости наблюдений и равномерного распределения ошибок измерений в интервале —1, -|-1. Другой крупнейший математик и механик второй четверти XIX века М. В. Остроградский (1801—1861) также оставил после себя три работы по теории вероятностей. Судя по рукописям, хранящимся в библиотеке Академии наук УССР, Остроградский предполагал на- писать руководство по теории вероятностей, введение для которого . им было в значительной мере написано. В одной из своих работ Остроградский указывает на возможность использования его резуль-
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 353 тата для целей контроля качества поставляемой продукции и отме- чает, что этот результат «даёт возможность поставщикам сократить до приблизительно одной двадцатой чрезвычайно утомительную меха- ническую работу по проверке, например, очень большого числа меш- ков с мукой или кусков сахара». Значительное число результатов, главным образом в области демографии и страховой статистики, принадлежит крупному матема- тику XIX века В. Я. Буняковскому (1804—1889). Им же был создан первый русский, превосходный для своего времени учебник «Основа- ния математической теории вероятностей», изданный в 1846 г. Ака- демией наук. Буняковский находился под влиянием идей и результатов Лапласа и Пуассона, и поэтому одной из важнейших целей своей книги он считал упрощение выводов полученных ими результатов. Другую важную задачу он видел в выработке русской терминологии. Об этом он сам чётко говорит во введении: «так как у нас до сих пор не было никакого отдельного сочинения, ни даже перевода об Матема- тической теории вероятностей, то мне предстоял труд писать на русском языке о предмете, для которого мы не имели установленных употреблением оборотов и выражений». Нужно сказать, что в значи- тельной своей части введённые Буняковским термины укоренились в нашей литературе. Историческое значение книги Буняковского весьма велико, однако с нашей точки зрения целый ряд рассмотрен- ных в ней вопросов не представляет научного интереса и даже по- просту плохо поставлен, кроме того, ряд общефилософских утвержде- ний книги не выдерживает мало-мальски серьёзной критики. Согласно Буняковскому, теория вероятностей «подвергает рассмотрению и численной оценке явления, зависящие от причин, не только совер- шенно неизвестных нам, но которые даже по нашему неведению не подлежат никаким предположениям». Нет нужды останавливаться на ошибочности этого положения Буняковского. Мы знаем, что теория вероятностей не составляет исключения из системы наук и не позволяет делать из полного незнания каких-либо положительных выводов. Мы уже говорили в основном тексте нашего курса, что не незнание приводит к вероятностным закономерностям, а специфика массовых случайных явлений. Во введении к книге Буняковский присваивает теории вероятностей совсем несвойственную ей роль наднауки:.. .теория вероятностей «есть создание ума, наиболее возвышающее человека и как бы указывающее на предел ведений, за который ему не дано перейти». Заметим, что из 478 страниц книги Буняковский 60 отводит на «приложение анализа вероятностей к свидетельствам, преданиям, раз- личного рода выборам между кандидатами и мнениями и к судей- ским определениям по большинству голосов». Эти приложения, как мы уже знаем из предыдущего, являются не чем иным, как отголо- ском модных в то время приложений к «моральным и нравственным 23 Зак. 1826. Б. В. Гнеденко.
354 ДОПОЛНЕНИЕ 3 наукам», усиленно развивавшимся во Франции Кондорсе, Лапласом, Пуассоном и их последователями. Для того чтобы мы могли судить о характере задач этого рода, приведём один из рассмотренных Буня- ковским примеров. Из полной русской азбуки вынули наудачу шесть букв и по- ставили их в том порядке, как они вынуты, одну возле другой. Два очевидца утверждают, что вынутые буквы составили слово МОСКВА. Спрашивается, как велика вероятность, что показание свидетелей истинно? При этом предполагается, что полная русская азбука (того времени) содержит 36 букв и что склонность свидете- 9 лей к правде выражается дробью Мы не останавливаемся на решении этой задачи, заметим только, что основывается оно на использовании формул Бейеса и на пред- положении, что в русском языке имеется 50 000 слов, состоящих из шести букв. В результате вычислений Буняковский получил вероятность, меньшую одной трёхсотой. Критику такого рода приложений дал один из крупнейших рус- ских математиков прошлого А. А. Марков (1856—1922) в своём классическом произведении «Исчисление вероятностей». Он писал, что пример Буняковского «достаточно выясняет неизбежность многих пройзвольных предположений при решении вопросов, подобных разо- бранному нами, которые по существу дела имеют весьма неопределён- ный характер. Рассмотренный вопрос примет ещё более неопределённый харак- тер, если допустим, что свидетели могут ошибаться, и устраним независимость их показаний». Далее Марков критикует следующее утверждение Буняковского: «Некоторые философы, в видах предосудительных, пытались приме- нить формулы, относящиеся к ослаблению вероятности свидетельств и преданий, к верованиям религиозным и тем поколебать их. Для опровержения их выводов стоит только принять в соображение, что всякое следствие, выводимое из аналитической формулы, не может быть иным чем, как только развитием первоначального предположе- ния, на котором формула основана. Если предположение ложно, то и следствия анализа будут ошибочные. Поэтому, прежде всего, должно разобрать основательно предположение, служащее точкою исхода. Когда этот разбор приведёт нас к заключению, что в духовном мире есть такие факты, которые не подчинены физическим законам, тогда все злонамеренные умствования лжефилософов рушатся сами» (Осн. мат. теор. вер., стр. 326). Марков заявляет, что он никак не может «согласиться с Буня- ковским, будто бы необходимо выделить известный класс рассказов, сомневаться в которых он считает предосудительным». Это своё мне- ние он подкрепляет следующими соображениями:
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ •355 «Во-первых, если событие невозможно, то никакие свидетельские показания не могут сообщить ему даже малой вероятности. Мало- вероятное событие может от согласных показаний многих свидетелей превратиться в весьма вероятное, если совпадение ложных показаний представляется ещё менее вероятным. Но маловероятное событие не станет весьма вероятным от согласного показания таких свидете- лей, которые сговорились друг с другом, или имеют одинаковые не вполне точные сведения о предмете их показаний. Как бы ни был добросовестен очевидец события, но сомнение в том, что он спо- собен был правильно понять совершившееся, может, в известных случаях, лишить его показание всякого значения. Наконец, сообщение о событии может доходить к нам не от очевидцев, а через последовательный ряд свидетелей, которые пере- дают то, что они слышали от других. В этом случае удлинение цепи свидетелей, конечно, затемняет совершившееся. Независимо от мате- матических формул, на которых мы не остановимся, не придавая им большого значения, ясно, что к рассказам о невероятных событиях, будто бы происшедших в давно минувшие времена, следует отно- ситься с крайним сомнением». В этих словах проявляется характер передового честного учёного, который находил в себе силы заявлять во весь голос своё мнение, даже если это мнение подрывало один из устоев существовавшего строя. Наше уважение к Маркову не только как к учёному, но и как к гражданину, только возрастёт, если добавить, что Марков посылал письмо в священный Синод с требованием отлучить его от церкви, после того как был отлучён Лев Толстой; что он отказался от чинов и орденов, что он резко протестовал в связи с неутвер- ждением избрания М. Горького в число членов Академии наук. В качестве прибавления к книге Буняковский поместил свою статью, незадолго перед тем напечатанную в Известиях Петербургской Академии наук, «Определение по приближению пределов потери убитыми и ранеными, претерпеваемой отрядом войск во время сра- жения». Мы не останавливаемся на изложении содержания этой ра- боты, так как гипотезы, положенные в основу решения рассматри- ваемой задачи, представляются в высшей степени произвольными. Интересно всё же привести заключительные слова этого приложения, из которых видно, что Буняковский достаточно ясно представлял себе возможность и интерес совершенно иных применений теории вероятностей и его собственных результатов, а не только их при- менений к «моральным наукам». Буняковский писал, что «Даже независимо от военного дела, эта самая таблица может быть употреблена с выгодою во многих слу- чаях, встречающихся в общественной жизни. Например, если бы требовалось, при приёмке весьма большого числа каких-либо вещей или припасов, определить с достаточной вероятностью пределы ка- чества, не имеющего надлежащей доброты, то, подвергая наудачу 23»
356 ДОПОЛНЕНИЕ 3 испытанию более или менее значительную часть этих предметов, можно посредством употребляемой таблицы, составить себе довольно приблизительное понятие о достоинстве полного количества, пред- полагая, что подробное его освидетельствование по продолжитель- ности своей неисполнимо». Важный шаг, открывший новую страницу в науке, был сделан П. Л. Чебышевым (1821—1894). Число публикаций Чебышева по тео- рии вероятностей невелико — всего четыре, но их влияние на даль- нейшее развитие науки трудно переоценить: его идеи продолжают разрабатываться и в наше время, а полное решение поставленных им задач было получено лишь в последние десять — пятнадцать лет. «С методологической стороны основной переворот, совершённый Чебышевым, заключается не только в том, что он впервые с полной настойчивостью выдвинул требование абсолютной строгости доказа- тельства предельных теорем (выводы Муавра, Лапласа и Пуассона были с формально-логической стороны совсем не безупречны в от- личие, впрочем, от теоремы Бернулли, доказанной её автором с исчер- пывающей арифметической строгостью), но главным образом в том, что Чебышев всюду стремился получить точные оценки отклонений от предельных закономерностей, возможных при хотя бы и большом, но конечном числе испытаний, в виде безусловно правильных при любом числе испытаний неравенств. Далее, Чебышев впервые ясно оценил и использовал всю силу понятий случайной величины и математического ожидания случайной величины. Понятия эти были известны и ранее и являются произ- водными от основных понятий события и вероятности. Но случайные величины и их математические ожидания подчинены гораздо более удобному и гибкому алгоритму. Это в такой мере верно, что сейчас 1иы постоянно рассмотрение события А заменяем рассмотрением его характеристической случайной величины которая равна .единице при осуществлении события А и равна нулю в случае, когда оно не наступает. Вероятность Р{Л} события А есть тогда не что иное, как математическое ожидание МВА величины Соответствующий метод характеристических функций множеств стал систематически приме- няться в теории функций действительного переменного лишь значи- тельно позднее». (А. Н. Колмогоров, Роль русской науки в раз- витии теории вероятностей.) Идеи Чебышева не нашли немедленного отклика среди иностранных учёных, но зато послужили толчком к созданию русской школы тео- рии вероятностей. По характеру исследований деятельность этой школы может быть подразделена на два периода. Первый связан с именами математиков, по преимуществу живших в Петербурге — П. Л. Чебышева, А. А. Маркова (1856—1922), А. М. Ляпунова (1857—1918) и позднее С. Н. Бернштейна и В. И. Романовского. Этот период характерен тем, что основные исследования концентри-
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 357 ровались около двух основных схем — схемы последовательности независимых случайных величин, а позднее схемы цепей Маркова. Второй период начался после Великой Октябрьской социалистической революции и связан с работой группы московских математиков — А. Я. Хинчина, А. Н. Колмогорова, Е. Е. Слуцкого (1880—1948), Н. В. Смирнова и их учеников. Этот период характеризуется при- влечением в теорию вероятностей идей и методов теории функций действительного переменного, широким использованием средств мате- матического анализа, значительным обогащением проблематики и за- вершением исследований ряда классических задач. Нужно сказать, что теперь нет оснований для такого разделения на московскую и ленинградскую и другие школы, так как теперь имеется единая со- ветская школа теории вероятностей. Проблемы, интересующие москов- ских математиков, находят отклик в работах ленинградских, ташкент- ских, киевских учёных. Специфические проблемы бывшей петербургский школы с успехом изучались в Москве и других научных центрах Советского Союза. Важно то, что чебышевские задачи были в центре интересов всех советских учёных. Мы видели, что теоретико-вероятностные проблемы находятся в самой тесной связи с многочисленными задачами естествознания, в первую очередь физики, и техники. Ввиду этого часто исследова- ние в области теории вероятностей, а особенно в области её при- ложений, превращается в решение отдельных специальных задач, требующих порой виртуозного владения математическим аппаратом. Следуя традиции Чебышева, русские, а затем советские математики из этого хаоса отдельных прикладных проблем выделили основные теоретико-вероятностные схемы, позволяющие общими приёмами охва- тывать большое число разнообразных конкретных задач. Эти схемы, в силу их общности, заслуживают глубокого и исчерпывающего изу- чения и сами по себе. Мы остановимся на краткой характеристике достижений отечественной науки на примерах рассмотрения несколь- ких особо важных схем. К этим особенно существенным направле- ниям современной теории вероятностей следует отнести 1) предельные теоремы для сумм независимых случайных величин, 2) цепи Маркова, 3) общую теорию случайных процессов, 4) случайные функции и случайные векторные поля с распреде- лениями, инвариантными по отношению к какой-либо группе преоб- разований. Суммы независимых случайных величин Основные исследования Чебышева и Ляпунова в области теории вероятностей целиком сосредоточены около проблемы изучения по- ведения сумм большого числа независимых слагаемых такого рода, что роль каждого отдельного слагаемого в сумме равномерно мала?
358 ДОПОЛНЕНИЕ 3 Это направление исследований вызывало и продолжает вызывать боль- шой интерес по вполне обоснованным соображениям. В тексте книги мы упоминали о части этих соображений, сейчас же ограничимся лишь указанием, что именно предельные закономерности для сумм независимых слагаемых играют основную роль в теоретико-вероят- ностном обосновании статистических приёмов исследования (теория выборок) и теории ошибок наблюдения. Кроме того, на проблемах предельных закономерностей для сумм независимых слагаемых отта- чиваются методы теории вероятностей, возникают новые вопросы и формулируются новые закономерности. Метод моментов, разработанный Чебышевым, уступил в задачах о законах распределения отдельных сумм место более мощному ме- тоду характеристических функций, систематически использованному Ляпуновым. В тех случаях, когда требуются оценки вероятностей, зависящих от многих сумм, наиболее значительные результаты пока получены «прямыми» методами, разработанными московской школой. Нужно думать, что впоследствии эти методы сменятся методом диф- ференциальных и интегро-дифференциальных уравнений. Первое исследование Чебышева по теории вероятностей «Опыт элементарного анализа теории вероятностей» появилось в печати в 1845 г. и было защищено в качестве магистерской диссертации. В этой работе Чебышеву удалось доказать теорему Бернулли и дать оценку точности получаемых при этом результатов с помощью совер- шенно элементарных средств, использующих из математического ана- лиза только разложение 1п(1-[-х) в ряд Маклорена. В следующем году этот результат он обобщил на закон больших чисел в форме Пуассона. Эти первоначальные публикации послужили Чебышеву отправным пунктом для широкого обобщения закона больших чисел и для создания в работе «О средних величинах» (Математический сборник, т. 2, 1867) замечательного по простоте и силе метода до- казательства, вошедшего с тех пор во все учебники, теории вероят- ностей. Формулировка результата и изложение его метода даны нами в основном тексте книги. Значительное расширение , условий приложимости закона больших чисел было достигнуто А. А. Марковым. В частности, им были до- казаны такие результаты: если последовательность взаимно незави- симых случайных величин $2, ..., Еп, ... такова, что или zz-2 2 (n->oo) или при некотором 8> 0 для всех k (k = 1, 2, 3, .. .) м|ей|1+8<с для некоторого С, то к этой последовательности применим закон больших чисед.
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 359 Мы говорили в главе «Закон больших чисел», что необходимые и достаточные условия применимости закона больших чисел к последо- вательности независимых случайных величин были найдены в 1926 г. А. Н. Колмогоровым. Менее полны результаты, относящиеся к усиленному закону боль- ших чисел. Наиболее законченные результаты, также принадлежащие А. Н. Колмогорову, были сформулированы и доказаны нами в основ- ном тексте. Своеобразное уточнение закона больших чисел было получено А. Я. Хинчиным в 1923 г. сначала для схемы Бернулли, а затем для схемы Пуассона. Позднее широкое обобщение результатов Хинчина было дано А. Н. Колмогоровым. Полученная при этом закономер- ность известна под названием закона повторного логарифма. Введём обозначение п п Зп=|2 ме*|. Рассмотрим функцию и (л). Если с вероятностью единица нера- венство §„>«(«) выполняется только для конечного числа значений л, то функцию и (л) мы назовём верхней функцией, а если оно выполняется для беско- нечного числа значений л, то — нижней функцией. Усиленный закон больших чисел утверждает, что если величины одинаково распре- делены и имеют математическое ожидание, то и (л) = ел является верхней функцией при любом е > 0. Закон повторного логарифма утверждает, что при некоторых достаточно широких условиях, на- ложенных на величины при любом е > 0 функции и (и) = (1 + в) V2Bralnln Вп = 2 DU Л=1 являются верхними, а функции л (л) = (1 — е) У2Вп In In Вп — нижними. В частности, если слагаемые одинаково распределены и имеют конечную дисперсию, то закон повторного логарифма имеет место. Более точное разграничение верхних и нижних функций для слу- чая схемы Бернулли было достигнуто И. Г. Петровским, доказавшим, что если функция v (х) монотонна, то и (п) = v (Вп) будет верхней (нижней) функцией, если интеграл I ~ <о (х) е I 2 dx сходится (расходится).
360 ДОПОЛНЕНИЕ 3 Дальнейшими изысканиями в направлении закона повторного ло- гарифма занимались многие учёные как у нас, так и за границей. В работе «О двух теоремах относительно вероятностей» (При- ложение к 55 тому Записок Академии Наук, № 6, 1887) Чебышев впервые сформулировал теорему о сближении функций распределе- ния сумм независимых случайных величин с нормальным законом распределения. Как в формулировке теоремы, так и в её доказатель- стве Чебышев допустил логические пробелы. Сравнительно скоро, вслед за публикацией Чебышева последовали две публикации А. А. Маркова («Закон больших чисел и способ наименьших квадра- тов», Изв. Физ.-мат. общ. при Казанском университете, 2-я серия, т. VIII, 1898; «Sur les racines de liquation = 0», Изв. Акад. Наук, 1898, т. IX), в которых ему удалось вполне точно сформулировать и доказать предложение, аналогичное предложению Чебышева. Путь, которым шёл Марков, был путь созданного Чебышевым метода моментов. Теорема Маркова. Если последовательность взаимно незави- симых случайных величин $2, ..., ... такова, что при всех целочисленных значениях г^З выполняются соотношения Пт = О, П оо Вп . где п п Вп = 2 DS»; са (г) = 2 М | ?»— М5» Г, ТО dz. В 1900 г. А. М. Ляпунову удалось установить теорему в усло- виях, гораздо менее ограничительных, чем условия Маркова. Форму- лировка и доказательство теоремы Ляпунова были даны нами в основ- ном тексте книги. Условия Маркова делают ясным происхождение условия Ляпунова. Ляпунов впервые систематически использовал метод характеристи- ческих функций, превратившийся с тех пор в один из основных методов теории вероятностей. Помимо доказательства предложения, известного теперь под именем теоремы Ляпунова, в этих работах содержалось также определение границ погрешности, происходящей от замены точного закона распределения суммы предельным. Впослед- ствии уточнениям оценок Ляпунова было посвящено много работ, из которых в первую очередь нужно указать на исследования двух шведских математиков Г. Крамера и Эссеена. Исследование С. Н. Бернштейна 1926 г. («О распространении предельной теоремы теории вероятностей на суммы зависимых случайных
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 361 величин», Успехи мат. наук, т. X, 1944) позволило перенести резуль- тат Ляпунова на суммы слабо зависимых случайных величин, а, также на последовательности случайных векторов. Нам важно сейчас отметить, что в работе Бернштейна предельная теорема была дана даже в несколько более широкой постановке. Бернштейн уже ж требовал от величин ни существования математических ожи- даний, ни дисперсий. Задача ставилась так: при каких условиях можно найти такие постоянные Ап и Вп> 0, чтобы функции рас- пределения сумм п Пк=Л сходились при л->оок нормальному закону. Оказалось, что имеет место следующая теорема: если для последовательности 52, ... взаимно независимых случайных величин при некоторых постоянных Сп выполняются соотношения (е > 0, произвольно) п SP{l^|>ecj->o («->«>)• СГа2 J x2dffc(x)->oo (;г->оо), fc==1 j x i < TO n x ^ = 1 —00 Впоследствии (1935) В. Феллер показал, что условия Бернштейна являются не только достаточными, но и необходимыми при допол- нительном требовании в некотором смысле равномерной малости отдельных слагаемых в сумме. В том же 1935 г. А. Я. Хинчин, В. Феллер и П. Леви незави- симо друг от друга нашли общие условия, при которых функции распределения сумм независимых одинаково распределённых слагае- мых, нормированных и центрированных надлежащим образом подо- бранными постоянными, могут сходиться к нормальному закону. Ока- залось, что для этого необходимо и достаточно, чтобы функция распределения слагаемых удовлетворяла следующему условию: J <ZF(x) = o(^r J x2<ZF(x)}; I х I >X | x | < X Важные уточнения предельной теоремы Ляпунова были даны Ю. В. Линником, применившим к проблемам теории вероятностей методы аналитической теории чисел, разработанные И. М. Виногра- довым.
362 ДОПОЛНЕНИЕ 3 Функции распределения сумм одинаково распределённых слагае- мых были предметом изучения многих авторов. Так, П. Леви и А. Я. Хинчин нашли все распределения, которые могут выступать в качестве предельных для нормированных и центрированных сумм такого рода слагаемых. Оказалось, что для этого необходимо и достаточно, чтобы логарифм их характеристической функции имел вид lg?(0 = ^—+ «)}. где а, р, у, с — действительные постоянные (0<а<^2, |Р|<Д, с > 0, 7 — произвольно) и о (t, а) = tg-g- для лф 1, 2 — In | /1 для а= 1. Это—так называемые устойчивые законы. В 1939 г. Б. В. Гнеденко установил условия сходимости нормированных сумм одинаково распределённых независимых слагаемых к каждому устойчивому закону распределения: оказалось, что в то время как условия сходи- мости к нормальному закону носят совершенно общий характер, не зависящий от природы отдельных слагаемых, условия сходимости к устойчивым законам, отличным от нормального, включают в себя весьма специальные требования. Более общая схема получения предельных распределений для сумм независимых случайных слагаемых была рассмотрена в работах Г. М. Бавли (1936 г.) и А. Я. Хинчина (1937 г.). Задача, которая стояла перед ними, была рассмотрена нами в главе 9 в частном случае слагаемых с конечными дисперсиями (случай Бавли). В общем случае (без предположения конечности дисперсий слагаемых) А. Я. Хинчин также доказал теорему: класс предельных распределе- ний для сумм независимых бесконечно малых слагаемых совпадает с классом безгранично делимых распределений. Б. В. Гнеденко нашёл условия сходимости функций распределе- ния сумм к каждому предельному распределению. Метод, употреб- лённый при этом, состоит в том, что для каждой суммы строится вполне определённый «сопровождающий» неограниченно делимый закон распределения. Бесконечная малость слагаемых влечёт за собой сближение истинного закона распределения с сопровождающим. Вопрос о существовании предельных распределений сводится, таким образом, к более простой задаче разыскания условий сходимости безгранично делимых распределений. Локальная теорема Муавра-Лапласа, несколько обобщённая нами в главе 9, получила для случая одинаково распределённых решетча- тых слагаемых завершение в ряде работ Б. В. Гнеденко. Оказалось, что когда имеет место сходимость функций распределения нормиро-
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 363 ванных сумм к устойчивому закону, тогда имеет место и сближение вероятностей определённых значений с плотностью соответствую- щего устойчивого закона. Сводное изложение результатов относящихся к суммированию независимых случайных величин имеется в монографиях А. Я. Хин- чина (1938), а также Б. В. Гнеденко и А. Н. Колмогорова (1949). Идеи метрической теории функций в теории вероятностей Идеи теории множеств и теории функций, культивировавшиеся в Москве Н. Н. Лузиным и его учениками, определили характер первых исследований московских математиков в теории вероятностей. Детальное изучение основных понятий теории вероятностей — слу- чайного события, вероятности, независимости событий, случайной величины, математического ожидания и пр., а также операций со случайными величинами — показало, что между ними и основными понятиями теории множеств и метрической теории функций можно провести далеко идущие аналогии. Эти аналогии между столь, казалось бы, различными областями науки позволили по-иному осветить логические основы теории вероятностей, обогатить её содержание новыми постановками задач и методами исследования{ а также довести до конца решение классических задач. Начало московской школе теории вероятностей было положено в 1923 г. исследованием А. Я. Хинчина, посвящённым закону повторного логарифма. Приблизительно в то же время Е. Е. Слуц- кий начал (с 1925 г.) создавать новую главу теории вероятностей— теорию случайных функций, т. е. случайных величин, зависящих от непрерывно изменяющегося параметра. Им были введены в рас- смотрение и исследованы понятия стохастических предела, производ- ной, интеграла, измеримости и пр. В том же 1925 г. появилось совместное исследование А. Я. Хинчина и А. Н. Колмогорова, посвящённое выяснению вопроса сходимости рядов из взаимно независимых случайных величин ?2, £3, ... Оказалось, что ряд £1 + ^ + ^+ • • • может сходиться к некоторой величине, вообще говоря, случайной, только с крайними вероятностями 0 и 1 и не может быть случая, чтобы он сходился с промежуточной вероятностью, скажем . Позднее А. Н. Колмогоровым была установлена теорема, утвер- ждающая, что если бэровская функция / (6Х, 5а, ...) счётного числа независимых случайных аргументов не меняется при изменении значений конечного их числа, то вероятность равенства f Gi> • • •) “ а может равняться только нулю или единице,
364 ДОПОЛНЕНИЕ 3 Эти начальные исследования московских математиков в области теории вероятностей нашли широкий отклик в мировой науке. Идеи метрической теории функций привели к построению системы аксиом теории вероятностей, в законченном виде изложенной в 1933 г. А. Н. Колмогоровым. Эта система аксиом — из всех предложенных до настоящего времени наиболее простая — позво- лила охватить не только все классические разделы теории вероят- ностей, но и новые её разделы, вызванные запросами естествозна- ния. Эта аксиоматика была изложена нами в первой главе, а также в дополнении 1. С указанной точки зрения случайное событие есть подмножество множества и «элементарных событий», вероятность — абстрактная мера, определённая на этом множестве и подчинённая условию нор- мированное™ Р(«)=1 ; случайная величина есть измеримая отно- сительно этой меры функция, математическое ожидание есть интеграл Лебега; сходимость случайных величин по вероятности есть не что иное, как сходимость функций по мере, а сходимость с вероятностью единица означает сходимость почти всюду и т. д. Изучение многих важных задач теории вероятностей (усиленный закон больших чисел, сходимость рядов со случайными членами, закон повторного логарифма и др.) привело к необходимости рас- смотрения бесконечномерных распределений. Основные результаты, относящиеся к бесконечномерным распределениям, изложены в книге А. Н. Колмогорова «Основные понятия теории вероятностей». В связи с исследованиями в области механики непрерывных сред были изучены некоторые вопросы теории случайных скалярных и векторных функций (А. Н. Колмогоров, А. М. Обухов). Эти резуль- таты также тесно связаны с исследованиями в области теории слу- чайных процессов. Теория случайных процессов Исторически направление исследований, объединяемое теперь под названием общей теории случайных процессов, имеет два источника. С одной стороны, это—работы А. А. Маркова об «испытаниях, свя- занных в цепь», с другой — исследования французского математика Башелье о «непрерывных вероятностях», начатые по замыслу А. Пуанкаре. Второе из этих направлений приобрело прочную логи- ческую основу лишь после создания теоретико-множественной системы построения основ теории вероятностей. И собственно только работы А. Н. Колмогорова и А. Я- Хинчина превратили наброски элементов теории и притом выполненные на весьма низком математическом и логическом уровне, данные Башелье, а также отдельные разрозненные задачи физики и естествознания, решён- ные различными иногда и весьма крупными учёными, в стройную теорию.
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 365 Многочисленные математические результаты, широкие возмож- ности приложений к естествознанию, а также решающее влияние на классическую проблематику привели к тому, что теория случайных процессов, построенная А. Н. Колмогоровым и А. Я. Хинчиным, ознаменовала собой новый этап в развитии теории вероятностей и в настоящее время стала основным полем приложения творческих усилий математиков, работающих в теории вероятностей. Развитие теории случайных процессов тесно переплетается с тео- рией динамических систем. Заметим при этом*, что обе эти теории соот- ветствуют идеям и представлениям доквантовой физики. Подобная же логико-математическая обработка концепций квантовой физики только ещё начинается. Важнейшие работы в указанном направлении были выполнены Н. М. Крыловым и Н. Н. Боголюбовым. Им же принад- лежат исследования, произведённые в широком плане, по применению разработанного аппарата к проблемам статистической физики. Пусть изучаемая система может находиться в одном из состоя- ний Et, ..., Еп, ... в конечном или счётном числе, и процесс её изменения разложен на «шаги», занумерованные целыми числами t (дискретное время). Пусть, кроме того, условная вероятность пере- хода из состояния Ei в состояние Ej за шаг с номером t не зависит от более ранней истории системы (отсутствие последействия). Такого рода случайный процесс называется цепью Маркова. Только что указанные вероятности мы обозначим символом pq(t), а вероятность перехода из состояния Ег в состояние Ej за $ шагов — через Р^(£;з), если в состоянии Et система находилась в момент t. Совершенно ясно, что Рц(Ь Ы s— «)• k В случае, когда р^(0 = Рф Цепь Маркова называется однород- ной. В главе 3 мы рассмотрели некоторые простейшие задачи их теории. Эргодическая теорема А. А. Маркова, доказанная нами в § 19, послужила прототипом исчерпывающих исследований В. И. Романовского, С. Н. Бернштейна, А. Н. Колмогорова и др. Типичной постановкой задачи в исследованиях Маркова было изучение сумм последовательности случайных величин ^2» • • •» ^п» • • •> определённых тем, что принимает значение а^ если через п шагов от начального состояния система попадает в состояние Ej. Есте- ственно, что суммы, 4~ ?2 + • • • Ч~ могут быть записаны в виде ^=2^(0, 3 где р^(0 есть число попаданий в состояние j за первые t шагов при исходном состоянии Ер
366 ДОПОЛНЕНИЕ 3 Для однородного по времени процесса задачи, связанные с обыч- ным и усиленным законом больших чисел, решены полностью. Закону повторного логарифма посвящены работы Т. А. Сарымса- кова. Интегральной предельной теореме также посвящён ряд важных ис- следований. Исчерпывающая формулировка и доказательство локальной теоремы были даны недавно А. Н. Колмогоровым. Сводное изложе- ние всех полученных результатов имеется в недавней монографии В. И. Романовского «Дискретные цепи Маркова», а также в книге С. Н. Бернштейна «Теория вероятностей» (4-е изд.). Неоднородные цепи Маркова были предметом весьма важных и тон- ких исследований С. Н. Бернштейна, Ю. В. Линника, Н. А. Сапогова. Основные результаты теории цепей Маркова существенно опи- раются на предпосылку отсутствия последействия. Если сохранить это требование, но перейти к произвольному фазовому пространству 2 = {ш} возможных состояний и отбросить ограничение значений времени целыми числами, то мы получаем общую концепцию марков- ского случайного процесса, управляемого вероятностью перехода /2; со, X} за промежуток времени от tx до из состояния со в одно из состояний множества X £ 2. Эти вероятности подчинены при любых < t2 < t& обобщённому уравнению Маркова 4$; «о» 4 = /^ (4» 4; ®> МИ4» а<°}- Q Общая теория марковских процессов и их классификация были даны А. Н. Колмогоровым в 1930 г. В главе 10 нами был дан набросок их теории для случая, когда фазовым пространством является мно- жество действительных чисел. Разработке различных вопросов теории случайных процессов марковского типа было посвящено большое число работ многих советских учёных — С. Н. Бернштейна, А. Я. Хинчина, В. М. Дуб- ровского, Н. Н. Боголюбова, Н. М. Крылова, И. Г. Петровского, М. А. Леонтовича, М. В. Бебутова, А. М. Яглома и др. В качестве нового направления исследований в этой области необходимо отметить недавние статьи А. Н. Колмогорова и его учеников Н. А. Дмитриева, Б. А. Севастьянова, А. М. Яглома, посвящённые созданию и разработке теории ветвящихся случайных процессов, охватившей важные схемы ветвящихся цепных реакций. В случае марковских процессов основную роль играют переход- ные вероятности P(tb со, X) при заданном состоянии <о в момент Самое существование безусловных вероятностей .для того или иного течения процесса здесь, вообще говоря, не предполагается. В теории стационарных случайных процессов становятся на иную точку зрения: исходным является распределение вероятностей в про- странстве функций со (0, где t пробегает действительную прямую, а значения ш берутся из фазового пространства 2. Требование ста-
КРАТКИЙ ОЧЕРК ИСТОРИИ ТЕОРИИ ВЕРОЯТНОСТЕЙ 367 ционарности процесса состоит в том, что вероятность Р{<о(/) с: Л) принадлежности функции со (/), описывающей ход процесса во вре- мени, какому-нибудь множеству А не меняется, если множество А заменить множеством //ТЛ, получающимся при замене каждой функ- ции со (/) из А на со(/—т). Изучение стационарных процессов с фазовым пространством 2 экви- валентно изучению динамических систем с инвариантной мерой в пространстве QR функций ш (Л действительного переменного со значениями из 2. Эта связь была ясна создателю теории стационар- ных процессов А. Я. Хинчину с самого начала. Из общих результатов теории стационарных процессов нужно в первую очередь указать на корреляционную теорию, элементы которой были изложены нами в главе 10, а также на знаменитую эргодическую теорему Биркгофа-Хинчина. В развитии теории стационарных процессов принимали участие Е. Е. Слуцкий, В. И. Романовский, А. Н. Колмогоров, М. Г. Крейн, В. Н. Засухин и др. Обзор работ по корреляционной теории стацио- нарных процессов можно найти в статье А. Н. Колмогорова «Стати- стическая теория колебаний с непрерывным спектром» (юбилейный сборник, посвящённый тридцатилетию Великой Октябрьской социали- стической революции, т. I, Акад. Наук СССР, 1947). В настоящем кратком обзоре мы не касаемся важных исследова- ний по случайным процессам, не укладавающимся в только что описанные схемы. В нашем кратком обзоре не были затронуты многие важные результаты советских математиков в области теории вероятностей. Эта тема заслуживает специального исследования и несравненно большего объёма, чем тот, которым я располагал в настоящем допол- нении. Мне представляется, что здесь и нет необходимости пере- числять все работы и называть все имена, способствовавшие разви- тию науки. Существенно другое: показать, в какой огромной мере расцвела советская наука за последние 30 лет. Теория вероятностей является одним из многих примеров того, как наука, имевшая круп- нейших представителей уже в дореволюционной России, получила всестороннее развитие и имеет в качестве своих представителей не единичных крупных учёных, а многочисленную научную школу, около которой группируется и получает непрерывные стимулы для творческой деятельности талантливая молодёжь. Ведущая роль советской теории вероятностей в современном развитии науки под- чёркивается не только нами, но и всеми прогрессивными учёными как Западной Европы, так и Америки.
ЛИТЕРАТУРА Популярная 1. Э. Б о р е л ь, Случай, ГИЗ, 1923. 2. Б. В. Гнеденко, Как математика изучает случайные явления. Изд. Акад. Наук УССР, Киев, 1947. 3. Б. В. Гнеденко и А. Я. Хинчин, Элементарное введение в тео- рию вероятностей, 2-е изд., Гостехиздат, 1950. Основная философская 1. В. И. Ленин, Материализм и эмпириокритицизм, ОГИЗ, 1946. 2. В. И. Ленин, Философские тетради, ОГИЗ, 1947. 3. И. В. Сталин, Вопросы ленинизма, 11 изд., 1946. 4. Ф. Энгельс, Анти-Дюринг, ОГИЗ, 1948. 5. Ф. Энгельс, Диалектика природы, ОГИЗ, 1948. Учебная и монографическая 1. С. Н. Бернштейн, Теория вероятностей, 4-е изд., Гостехиздат, 1946. 2. Н. Д. Гиленко, Задачник по теории вероятностей, Учпедгиз, 1943. 3. В. И. Гливенко, Курс теории вероятностей, ГОНТИ, 1939. 4. В. И. Гливенко, Интеграл Стильтьеса, ОНТИ, 1936. 5. Б. В. Гнеденко и А. Н. Колмогоров, Предельные распределения для сумм независимых случайных величин, Гостехиздат, 1949. 6. В. Л. Гончаров, Теория вероятностей, Оборонгиз, 1939. 7. А.Н.^Кр лмогоров, Основные понятия теории вероятностей, ОНТИ, 8. Г. К р a i^e р, Случайные величины и распределения вероятностей, 9. Г. Крамер, Математические методы статистики, ГИИЛ, 1948. 10. Р. L£vy, Theorie des proces stochastiques, Paris, 1947. 11. А. А. Марков, Исчисление вероятностей, 4-е изд., ГИЗ, 1924. 12 Р. Мизес, Вероятность и статистика, ГИЗ, 1930. 13. R. Mieses, Wahrscheinlichkeitsrechnung, 1931. 14. В. И. Романовский, Математическая статистика, ОНТИ, 1938. 15. В. И. Романовский, Основные задачи теории ошибок, Гостехиз- дат, 1947. 16. В. И. Романовский, Дискретные цепи Маркова, Гостехиздат, 1949. 17. I. То dh un ter, A history of the mathematical theory of probability, 1865. 18. M. F г ё c h e t, Recherches th£oriques modernes. Traite du calcul des probabilites, Paris, 1937, t. t. I, II. 19. А. Я. Хинчин, Основные законы теории вероятностей, ГТТИ, 1932. 20. А. Я. Хинчин, Асимптотические законы теории вероятностей, ГТТИ, 1936. 21. А. Я. Хинчин, Предельные законы для сумм независимых случайных величин, ОНТИ, 1938.
ЛИТЕРАТУРА 369 22. А. Я. Хин чин, Математические основания статистической механики, Гостехиздат 1943. 23. С. Чандрасекар, Стохастические проблемы в физике и астрономии, ГИИЛ, 1947. 24. Эйнштейн и Смолуховский, Сборник' статей по теории броу- новского движения, ОНТИ, 1936. 25. I. V. Uspensky, Introduction to Mathematical Probability, 1937. Жу рн а л ьная К главе 1 1. С. Н. Бернштейн, Опыт аксиоматического обоснования теории вероятностей, Сообщения Харьк. матем. об-ва, т. 15, 1917. 2. Б. В. Гнеденко, Развитие теории вероятностей в России, Труды ин-та истории естествознания Акад. Наук СССР, т. 2, 1948. 3. Б. В. Гнеденко, Теория вероятностей и познание реального мира, Усп. матем. наук, т. V, вып. 1, 1950. 4. Б. В. ,Гн еде нк о и А. Н. Колмогоров, Теория вероятностей, сборник «Математика в СССР за тридцать лет», 1948. 5. А. Н. Колмогоров, Роль русской науки в развитии теории вероят- ностей, Учён. зап. МГУ, вып. 91, 1947. 6. Н. В. Смирнов, Математическая статистика, сборник «Математика в СССР за тридцать лет», Гостехиздат, 1943. 7. А. Я. Хин чин, Учение Мизеса о вероятностях и принципы физической статистики, Усп. физ. наук, т. IX, вып. 2, 1929. К главе 2 1. С. Н. Бернштейн, Возврат к вопросу о точности предельной фор- мулы Лапласа» Изв. Акад. Наук СССР, т. 7, 1943. 2. Н. 6. С м и р н о в, О вероятностях больших уклонений, Мат. сб., т. 40, № 4, 1933. 3. W. Feller, On the normal approximation to the binomial distribution, Annals of Math, statistics, v. XVI, 1945. 4. А. Я. Хин чин, Ober einen neuen Grenzwertsatz der wahrscheinlichkeits- rechnung, Math. Ann., B. 101, 1929. К главе 3 1. A. H. Колмогоров, Цепи Маркова со счётным множеством возможных состояний, Бюлл. МГУ, т. I, вып, 3, 1937. 2. А. А. Марков, Исследование замечательного случая зависимых испы- таний, Изв. Рос. Акад. Наук, т. 1, 1907. К главе 4 1. Б. В. Гнеденко и Е. Л. Рваче в а, Об одном характеристическом свойстве нормального закона, Труды матем. ин-та Акад. Наук УССР, вып. 12, 1948. 2. Н. Cramer, Ober eine Eigenschaft der normalen Verteilungs function, Math. Zeitschr., B. 41, 1936. 3. A. M. Обухов, Теория корреляции векторов, Учён. зап. МГУ, вып. 45, 1940. К главе 6 1. С. Н. Бернштейн, О законе больших чисел, Сообщ. Харьк. матем. об-ва, т. XVI, 1918. 2. Ю. В. Прохоров, Об усиленном законе больших чисел, ДАН СССР, т. 69, № 5, 1949. 24 Зак. 1826. Б. В. Гнеденко.
370 ЛИТЕРАТУРА 3. Е. Е. Слуцкий, Ober stochastische Asymptoten und Grenzwerte, Met- ron 5, 1925. 4. П. Л. Ч e б ыш eв, О средних величинах, Матем. сб^ т. 2, 1867; Полное собр. соч., т. 2, 1948. К главе 7 1. Б. В. Гнеденко, О характеристических функциях, Бюлл. МГУ, т. L вып. 5, 1937. 2. М. Г. К р е й н, О представлении функций интегралами Фурье-Стильтьеса, Учён. зап. Куйбышевского пед. ин-та, вып. 7, 1943. 3. А. Я. X и н ч и н, Об одном признаке для характеристических функций, Бюлл. МГУ, т. 1, вып. 5, 1937. К главе 8 1. С. Н. Бернштейн, Распространение предельной теоремы теории вероятностей на суммы зависимых величин. Усп. матем. наук, вып. X, 1944. 2. Б. В. Гнеденко, Элементы теории функций распределения случайных векторов, Усп. матем. наук, вып. X, 1944. 3. С. G. Esseen, Fourier analysis of distribution function. A mathematical study of the Laplace-Gaussian law. Acta Mathematica, t. 77, 1945. 4. J. W. L i n d e b e r g, Eine neue Herleitung des Exponentialgesetz in der Wahrscheinlichkeitsrechnung, Math. Zeitschr., B. 15, 1922. 5. Ю. В, Линник, О точности приближения к гауссову распределению сумм независимых случайных величин, Изв. Акад, наук СССР, т. II, 1947. 6. А. М. Ляпунов, Sur une proposition de la theorie des probability, Bull. Acad. Sc. Peter. 13, 1900. 7. A. M. Ляпунов, Nouvelle forme du th6or£me sur la limite des probabi- lity, там же 1901. 8. W. Feller, Ober den zentralengrenzwertsatz der Wahrscheinlichkeitsrech- nung, Math. Zeitschr. B. 40, 1935. 9. П. Л. Чебышев, О двух теоремах относительно вероятностей, Зап. Акад, наук 1887; Полное собр. соч.» т. 2, 1948. К главе 9 1. Г. М. Б а в л и, Ober einige Verallgemeinerungen der Grenzwertsatz der Wahrscheinlichkeitsrechnung, Матем. сб., т. I (43), № 6, 1936. 2. Б. В. Гнеденко, Об одном характеристическом свойстве безгранично- делимых законов распределения, Бюлл. МГУ, т. I, вып. 5, 1937. 3. Б. В. Гнеденко, Предельные законы для сумм независимых случайных величин, Усп. матем. наук, вып. X, 1944. 4. А. Я. X и н ч и н, Новый вывод одной формулы П. Леви, Бюлл. МГУ, т. I, вып. 1, 1937. К главе 10 1. В. М. Дубровский, Обобщение теории чисто разрывных случайных процессов, ДАН СССР, т. XIX, 1938. 2. В. М. Дубровский, Исследование чисто разрывных случайных про- цессов методом интегро-дифференциальных уравнений, Изв. Акад, наук СССР, т. 8, 1944. 3. А. Н. Колмогоров, Об аналитических методах в теории вероят- ностей, Усп. матем. наук, вып. 5, 1938. 4. А. Н. Колмогоров, Интерполирование и экстраполирование стацио- нарных случайных последовательностей, Изв. Акад, наук СССР, 1941.
ЛИТЕРАТУРА 371 5. А. Н. Колмогоров, Статистическая теория колебаний с непрерывным спектром, Юбил. сборник Акад, наук СССР, ч. 1, 1947. 6. А. Н. Колмогоров и Н.А. Дмитриев, Ветвящиеся случайные про- цессы, ДАН СССР, т. 56, №1,1947. 7. А. Н. Колмогоров и Б. А. Севастьянов, Вычисление финальных вероятностей для ветвящихся случайных процессов, ДАН СССР, т. 56, № 8, 1947. 8. Б. А. Севастьянов, Ветвящиеся случайные процессы. Вестник МГУ, № 3, 1948. 9. А. Я. Хинчин, Теория корреляции стационарных стохастических про- цессов, Усп. матем. наук, гып. 5, 1938. 10. В. Феллер, К теории стохастических процессов, Усп. матем. наук, вып. 5, 1938. 11. А. М. Я г л ом, К вопросу о линейном интерполировании стационарных случайных последовательностей и процессов, Усп. матем. наук, т. IV, вып. 4, 1949. К главе 11 1. С. Н. Бернштейн, О доверительных вероятностях Фишера. Изв. Акад, наук СССР, т. 5, 1941. 2. A. Wald, Sequential Tests of Statistical Hypotheses, Ann. of Math. Stati- stics., v. 16., 1945. 3. В. И. Гливенко, Sulla determinatione empirica di una legge di probabi- lita, Giornale dell’lstituto Italiano degli Attuari, t. 4, 1933. 4. A. H. Колмогоров, Sulla determinatione empirica di una legge di dishibutione, Giornale dell’lstituto Italiano degli Attuari, t. 4, 1933. 5. A. H. Колмогоров, Определение центра рассеивания и меры точ- ности по ограниченному числу наблюдений, Изв. Акад, наук СССР, т. 6, 1942. 6. А. Н. Колмогоров и Ю. В. Прохоров, О суммах случайного числа случайных слагаемых, Усп. матем. наук, т. IV, вып. 4, 1949. 7. Ю. Нейман, Статистическая оценка как проблема классической теории вероятностей, Усп. матем. наук, выл. X, 1944. 8. Н. В. Смирнов, Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках, Бюлл. МГУ, т. 2, вып. 2, 1939. 9. Н. В. Смирнов, Приближение законов распределения случайных величин по эмпирическим данным, Усп. матем. наук, т. X, 1944. 10. W. Feller, On the Kolmogorov-Smirnov, Limit Theorems for empirical distribution, Annals of Math. Stat., v. XIX, 2, 1948.
372 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ <р(х) Таблица значений функции ф(х) = & 2 1 —z=* У2л X 0 1 2 3 4 5 6 7 8 9 0,0 0,3989 3989 3989 3988 3986 3984 3982 * 3980 3977 3973 0,1 3970 3965 3961 3956 3951 3945 3939 3932 3925 3918 0,2 3910 3902 3894 3885 3876 3867 3857 3847 3836 3825 0,3 3814 3802 3790 3778 3765 3752 3739 3726 3712 3697 0,4 3683 3668 3653 3637 3621 3605 3589 3572 3555 3538 0,5 3521 3503 3485 3467 3448 3429 3410 3391 3372 3352 0,6 3332 3312 3292 3271 3251 3230 3209 3187 3166 3144 0,7 3123 3101 3079 3056 3034 ЗОН 2989 2966 2943 2920 0,8 2897 2874 2850 2827 2803 2780 2756 2732 2709 2685 0,9 2661 2637 2613 2589 2565 2541 2516 2492 2468 2444 1,0 0,2420 2396 2371 2347 2323 2299 2275 2251 2227 2203 1,1 2179 2155 2131 2107 2083 2059 2036 2012 1989 1965 1,2 1942 1919 1895 1872 1849 1826 1804 1781 1758 1736 1,3 1714 1691 1669 1647 1626 1604 1582 1561 1539 1518 1,4 1497 1476 1456 1435 1415 1394 1374 1354 1334 1315 1,5 1295 1276 1257 1238 1219 1200 1182 1163 1145 1127 1,6 1109 1092 1074 1057 1040 1023 1006 0989 0973 0957 1,7 0940 0925 0909 0893 0878 0863 0848 0833 0818 0804 1,8 0790 0775 0761 0748 0734 0721 0707 0694 0681 0669 1,9 0656 0644 0632 0620 0608 0596 0584 0573 0562 0551 2,0 0,0540 0529 0519 0508 0498 0488 0478 0468 0459 0449 2,1 0440 0431 0422 0413 0404 0396 0387 0379 0371 0363 2,2 0355 0347 0339 0332 0325 0317 0310 0303 0297 0290 2,3 0283 0277 0270 0264 0258 0252 0246 0241 0235 0299 2,4 0224 0219 0213 0208 0203 0198 0194 0189 0184 0180 2,5 0175 0171 0167 0163 0158 0154 0151 0147 0143 0139 2,6 0136 0132 0129 0126 0122 0119 0116 0113 ОНО 0107 2,7 0104 0101 0099 0096 0093 0091 0088 0086 0084 0081 2,8 0079 0077 0075 0073 0071 0069 0067 0065 0063 0061 2,9 0060 0058 0056 0055 0053 0051 0050 0048 0047 0046 3,0 0,0044 0043 0042 0040 0039 0038 0037 0036 0035 0034 3,1 0033 0032 0031 0030 0029 0028 0027 0026 0025 0025 3,2 0024 0023 0022 0022 0021 0020 0020 0019 0018 0018 3,3 0017 0017 0016 0016 0015 0015 0014 0014 0013 0013 3,4 0012 0012 0012 ООН ООН 0010 0010 0010 0009 0009 3,5 0009 0008 0008 0008 0008 0007 0007 0007 0007 0006 3,6 0006 0006 0006 0005 0005 0005 0005 0005 0005 0004 3,7 0004 0004 0004 0004 0004 0004 0003 0003 0003 0003 3,8 0003 0003 0003 0003 0003 0002 0002 0002 0002 0002 3,9 0002 0002 0002 0002 0002 1 0002 0002 0002 0001 0001
Павлина значений функции Ф(х) 373 а »* 1 г —Г . Таблица значений функции Ф(я)==-^== J е az о X Ф(х) X • Ф(х) X Ф(х) X Ф(х) 0,00 0,0000 0,01 0,0040 0,31 0,1217 0,61 0,2291 0,91 0,3186 0,02 0,0080 0,32 0,1255 0,62 0,2324 . 0,92 0,3212 0,03 0,0120 0,33 0,1293 0,63 0,2357 0,93 0,3238 0,04 0,0160 0,34 0,1331 0,64 0,2389 0,94 0,3264 0,05 0,0199 0,35 0,1368 0,65 0,2422 0,95 0,3289 0,06 0,0239 0,36 0,1406 0,66 0,2454 0,96 0,3315 0,07 0,0279 0,37 0,1443 0,67 0,2486 0,97 0,3340 0,08 0,0319 0,38 0,1480 0,68 0,2517 0,98 0,3365 0,09 0,0359 0,39 0,1517 0,69 0,2549 0,99 0,3389 0,10 0,0398 0,40 0,1554 0,70 0,2580 1,00 0,3413 0,11 0,0438 0,41 0,1591 0,71 0,2611 1,01 0,3438 0,12 0,0478 0,42 0,1628 0,72 0,2642 1,02 0,3461 0,13 0,0517 0,43 0,1664 0,73 0,2673 1,03 0,3485 0,14 0,0557 0,44 0,1700 0,74 0,2703 1,04 0,3508 0,15 0,0596 0,45 0,1736 0,75 0,2734 1,05 0,3531 0,16 0,0636 0,46 0,1772 0,76 0,2764 1,06 0,3554 0,17 0,0675 0,47 0,1808 0,77 0,2794 1,07 0,3577 0,18 0,0714 0,48 0,1844 0,78 0,2823 1,08 0,3599 0,19 0,0753 0,49 0,1879 0,79 0,2852 1,09 0,3621 0,20 0,0793 0,50 0,1915 0,80 0,2881 1,10 0,3643 0,21 0,0832 0,51 0,1950 0,81 0,2910 1,11 0,3665 0,22 0,0871 0,52 0,1985 0,82 0,2939 1,12 0,3686 0,23 0,0910 0,53 0,2019 0,83 0,2967 1,13 0,3708 0,24 0,0948 0,54 0,2054 0,84 0,2995 1,14 0,3729 0,25 0,0987 0,55 0,2088 0,85 0,3023 1,15 0,3749 0,26 0,1026 0,56 0,2123 0,86 0,3051 1,16 0,3770 0,27 0,1064 0,57 0,2157 0,87 0,3078 1,17 0,3790 0,28 0,1103 0,58 0,2190 0,88 0,3106 1,18 0,3810 0,29 0,1141 0,59 0,2224 0,89 0,3133 1,19 0,3830 0,30 0,1179 0,60 0,2257 0,90 0,3159 1,20 0,3849
374 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Ф(х) Продолжение X Ф(х) X ф(х) X Ф(х) X Ф(х) 1,21 0,3869 1,56 0,4406 1,91 * 0,4719 2,52 0,4941 1,22 0,3888 1,57 0,4418 1,92 0,4726 2,54 0,4945 1,23 0,3907 1,58 0,4429 1,93 0,4732 2,56 0,4948 1,24 0,3925 1,59 0,4441 1,94 0,4738 2,58 0,4951 1,25 0,3914 1,60 0,4452 1,95 0,4744 2,60 0,4953 1,26 0,3962 1,61 0,4463 1,96 0,4750 2,62 0,4956 1,27 0,3980 1,62 0,4474 1,97 0,4756 2,64 0,4959 1,28 0,3997 1,63 0,4484 1,98 0,4761 2,66 0,4961 1,29 0,4015 1,64 0,4495 1,99 0,4767 2,68 0,4963 1,30 0,4032 1,65 0,4505 2,00 0,4772 2,70 0,4965 1,31 0,4049 1,66 0,4515 2,02 0,4783 2,72 0,4967 1,32 0,4066 1,67 0,4525 2,04 0,4793 2,74 0,4969 1,33 0,4082 1,68 0,4535 2,06 0,4803 2,76 0,4971 1,34 0,4099 1,69 0,4545 2,08 0,4812 2,78 0,4973 1,35 0,4115 1,70 0,4554 2,10 0,4821 2,80 0,4974 1,36 0,4131 1,71 0,4564 2,12 0,4830 2,82 0,4976 1,37 0,4147 1,72 0,4573 2,14 0,4838 2,84 0,4977 1,38 0,4162 1,73 0,4582 2,16 0,4846 2,86 0;4979 1,39 0,4177 1,74 0,4591 2,18 0,4854 2,88 0,4980 1,40 0,4192 1,75 0,4599 2,20 0,4861 2,90 0,4981 1,41 0,4207 1,76 0,4608 2,22 0,4868 2,92 0,4982 1,42 0,4222 1,77 0,4616 2,24 0,4875 2,94 0,4984 1,43 0,4236 1,78 0,4625 2,26 0,4881 2,96 0,4985 1,44 0,4251 1,79 0,4633 2,28 0,4887 • 2,98 0,4986 1,45 0,4265 1,80 0,4641 2,30 0,4893 3,00 0,49865 1,46 0,4279 1,81 0,4649 2,32 0,4898 3,20 0,49931 1,47 0,4292 1,82 0,4656 2,34 0,4904 3,40 0,49966 1,48 0,4306 1,83 0,4664 2,36 0,4909 3,60 0,499841 1,49 0,4319 1,84 0,4671 2,38 0,4913 3,80 0,499928 1,50 0,4332 1,85 0,4678 2,40 0,4918 4,00 0,499968 1,51 0,4345 1,86 0,4686 2,42 0,4922 4,50 0,499997 1,52 0,4357 1,87 0,4693 2,44 0,4927 5,00 0,49999997 1,53 0,4370 1,88 0,4699 2,46 0,4931 1,54 0,4382 1,89 0,4706 2,48 0,4934 1,55 0,4394 1,90 0,4713 2,50 0,4938
ТАБЛИЦА ЗНАЧ1НИЙ ФУНКЦИИ Р*(а) 375 Таблица значений функции (а) » —— X. а Гх^ 0,1 0,2 0,3 0,4 0,5 .0,6 0 0,904837 0,818731 0,740.818 0,670320 0,606531 0,548812 1 0,090484 0,163746 0,222245 0,268128 0,303265 0,329287 2 0,004524 0,016375 0,033337 0,053626 0,075816 0,098786 3 0,000151 0,001091 0,003334 0,007150 0,012636 0,019757 4 0,000004 0,000055 0,000250 0,000715 0,001580 0,002964 5 0,000002 0,000015 0,000057 0,000158 0,000356 6 0,000001 0,000004 0,000013 0,000035 7 0,000001 0,000003 X а ^х 0,7 0,8 0,9 1,0 2,0 3,0 0 0,496586 0,449329 0,406570 0,367879 0,135335 0,049787 1 0,347610 0,359463 0,365913 0,367879 0,270671 0,149361 2 0,121663 0,143785 0,164661 0,183940 0,270671 0,224042 3 0,028388 0,038343 0,049398 0,061313 0,180447 0,224042 4 0,004968 0,007669 0,011115 0,015328 0,090224 0;168031 5 0,000695 0,001227 - 0,002001 0.003066 0,036089 0,100819 6 0,000081 0,000164 0,000300 0,000511 0,012030 0,050409 7 0,000008 0,000019 о;ооооз9 0,000073 0,003437 0,021604 8 0,000002 0,000004 0,000009 0,000859 0,008101 9 0,000001 0,000191 0,002701 .10 0,000038 0,000810 11 0,000007 0,000221 12 0,000001 0,000055 13 0,000013 14 0,000003 15 0,000001
376 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Продолжение л 4,0 5,0 6,0 7,0 8,0 9,0 0 0,018316 0,006738 0,002479 0,000912 0,000335 0,000123 1 0,073263 0,033690 0,014873 0,006383 0,002684 0,001111 2 0,146525 0,084224 0,044618 0,022341 0,010735 0,004998 3 0,195367 0,140374 0,089235 0,052129 0,028626 0,014994 4 0,195367 0,175467 0,133853 0,091226 0,057252 0,033737 5 0,156293 0,175467 0,160623 0,127717 0,091604 0,060727 6 0,104194 0,146223 0,160623 0,149003 0,122138 0,091090 7 0,059540 0,104445 0,137677 0,149003 0,139587 0,117116 8 0,029770 0,065278 0,103258 0,130377 0,139587 0,131756 9 0,013231 0,036266 0,068838 0,101405 0,124077 0,131756 10 0,005292 0,018133 0,041303 0,070983 0,099262 0,118580 11 0,001925 0,008242 0,022529 0,045171 0,072190 0,097020 12 0,000642 0,003434 0,011262 0,026350 0,048127 0,072765 13 0,000197 0,001321 0,005199 0,014188 0,02&616 0,050376 14 0,000056 0,000472 0,002228 0,007094 0,016924 0,032384 15 0,000015 0,000157 0,000891 0,003311 0,009026 0,019431 16 0,000004 0,000049 0,000334 0,001448 0,004513 0,010930 17 0,000001 0,000014 0,000118 0,000596 0,002124 0,005786 18 0,000004 0,000039 0,000232 0,000944 0,002893 19 0,000001 0,000012 0,000085 0,000397 0,001370 20 0,000004 0,000030 0,000159 0,000617 21 0,000001 0,000010 0,000061 0,000264 22 0,000003 0,000022 0,000108 23 0,000001 0,000008 0,000042 24 0,000003 0,000016 . 25 . 0,000001 0,000006 26 0,000002 27 0,000001
ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ 377 к —mA— m==o а & 0,1 02 0,3 0,4 0,5 0,6 .0 0,904837 0,818731 0,740818 0,670320 0,606531 0,548812 1 0,995321 0,982477 0,963063 0,938448 0,909796 0,878099 2 0,999845 0,998852 0,996390 0,992074 0,985612 0,977885 3 0,999996 0,999943 0,999724 0,999224 0,998248 0,997642 4 1,000000 0,999998 0,999974 0,999939 0,999828 0,999606 5 1,000000 1,000000 0,999999 0,999996 0,999986 0,999962 6 1,000000 1,000000 1,000000 1,000000 0,999999 0,999997 7 1,000000 1,000000 1,000000 1,000000- 1,000000 1,000000 \а 0,7 0,8 0,9 1,0 2,0 3,0 0 0,496585 0,449329 0,406570 0,367879 0,135335 0,049787 1 0,844195 0,808792 0,772483 0,735759 0,406006 0,199148 2 0,965858 0,952577 0,937144 0,919699 0,676677 0,423190 3 0,994246 0,990920 0,988542 0,981012 0,857124 0,647232 4 0,999214 0,998589 0,997657 0,996340 0,947348 0,815263 5 0,999909 0,999816 0,999658 0,999406 0,983437 0,916082 6 0,999990 0,999980 0,999958 0,999917 0,995467 0,966491 7 0,999998 0,999999 0,999997 0,999990 0,998904 0,988095 8 1,000000 1,000000 1,000000. 0,999999 0,999763 0,996196 9 1,000000 0,999954 0,998897 10 0,999992 0,999707 11 0,999999 0,999928 12 1,000000 0,999983 13 0,999996 14 0,999999 15 0,100000
378 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Р{Х) оо _g8 Таблица значений функции Р(х)— ----- f 2 dz X \ 1 2 3 4 5 6 7 8 1 0,3173 0,6065 0,8013 0,9098 0,9626 0,9856 0,9948 0,9982 2 1574 3679 57Й4 7358 8491 91-97 9598 9810 3 0833 2231 3916 5578 7000 8088 8850 9344 4 0455 1353 2615 4060 5494 6767 7798 8571 5 0254 0821 1718 2873 4159 5438 6600 7576 6 0143 0498 1116 1991 3062 4232 5398 6472 7 0081 0302 0719 1359 2206 3208 4289 5366 8 0047 0183 0460 0916 1562 2381 3326 4335 9 0027 0111 0293 0611 1091 1736 2527 3423 10 0016 0067 0186 0404 0752 1247 1886 2650 11 0009 0041 0117 0266 0514 0884 1386 2017 12 0005 0025 0074 0174 0348 0620 1006 1512 13 0003 0015 0046 0113 0234 0430 0721 1119 14 ' 0002 0009 С029 0073 0146 0296 0512 0818 15 0001 0006 0018 0047 0104 0203 0360 0591 16 0001 0003 ООП 0030 0068 0138 0251 0424 17 0000 0002 0007 0019 0045 0093 0174 0301 18 0001 0004 0012 0029 0062 0120 0212 19 0001 0003 0G08 0019 0042 0082 0149 20 0000 0002 0005 0013 0028 0056 0103 21 0000 0001 0003 0008 0018 0038 0071 22 0000 0001 0002 0005 0012 0025 0049 23 оосо 0000 0001 0003 0008 0017 0034 24 0000 0000 0001 0002 0005 ООП 0023 25 0,0000 0,0000 0,0001 0,0001 0,0003 0,0008 0,0016 26 0000 0000 0000 0001 0002 0005 0010 27 0000 0000 0000 0001 0001 0003 0007 28 0000 0000 0000 0000 0001. 0002 0005 29 0000 0000 0000 0000 0001 0001 0003 30 0000 оосо 0000 0000 0000 0001 0002
ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Р(х) 379 Продолжение ^\ь 9 10 11 ' 12 13 14 15 1 0,9994 0,9998 0,9999 1,0000 1,0000 1,С0Э0 1,0000 2 9915 9963 9985 0,9994 0,9998 0,9999 1,0000 3 9643 9814 9907 9955 9979 9991 9996 4 9114 9473 9699 9834 9912 9955 9977 - 5 8343 8912 9312 9580 9752 9858 9921 6 7399 8153 8734 9161 9462 9665 9797 7 6371 7254 7991 8576 9022 9347 9576 8 '5341 6288 7133 7851 8436 8893 9238 9 4373 5321 6219 7029 7729 8311 8775 10 3505 4405 5304 6160 6939 7622 8197 11 2757 3575 4433 5289 6108 6860 7526 12 2133 2851 3626 4457 5276 6063 6790 13 1626 2237 2933 3690 4478 5265 6023 14 1223 1730 2330 3007 3738 4497 5255 15 0909 1321 1825 2414 3074 3782 4514 16 0669 0996 1411 1912 2491 3134 3821 17 0487 0744 1079 1496 1993 2562 3189 18 0352 0550 0816 1157 1575 2068 2627 19 0252 0403 0611 0885 1231 1649 2137 20 0179 0293 0453 0671 0952 1301 1719 21 0126 0211 ‘ 0334 0504 0729 1016 1368 22 0089 0151 0244 0375 0554 0786 1078 23 0062 0107 0177 0277 0417 0603 0841 24 0043 0076 0127 0208 0311 0458 0651 25 0030 0053 0091 0148 0231 0346 0499 26 0020 0037 0065 0107 0170 0259 0380 27 0014 0026 0046 0077 0124 0193 0287 28 0010 0018 0032 0055 0090 0142 0216 29 0006 0012 0023 0039 0065 0104 0161 30 0004 0009 0016 0028 0047 0076 0119
380 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Р(х) Продолжение 16 17 18 19 20 21 22 1 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 2 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 3 0,9998 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000 4 9989 9995 0,9998 0,9999 1,0000 1,0000 1,0000 5 9958 9978 9989 9994 0,9997 0,9999 0,9999 6 9881 9932 9962 9979 9989 9994 . 9997 7 9783 9835 9901 9942 9967 9981 9990 8 9489 9665 9786 9867 9919 9951 9972 9 9134 9403 9597 9735 9829 9892 9933 10 8666 9036 9319 9539 9682 9789 9863 11 8095 8566 8944 9238 9462 9628 9747 12 7440 8001 8472 8856 9161 9396 9574 13 6728 7362 7916 8386 8774 9086 9332 14 5987 6671 7291 7837 8305 8696 9015 15 5246 5955 6620 7226 7764 8230 8622 16 4530 5238 5925 6573 7166 7696 8159 17 3856 4544 5231 5899 6530 7111 7634 18 3239 3888 4557 5224 5874 6490 7060 19 2687 3285 3918 4568 5218 5851 6453 20 2202 2742 3328 3946 4579 5213 5830 21 1785 2263 2794 3368 3971 4589 5207 22 1432 1847 2320 2843 3405 3995 4599 23 1137 1493 1906 2373 2888 3440 4017 24 0895 1194 1-550 1962 2424 2931 3472 25 0698 0947 1249 1605 2014 2472 2971 26 0540 0745 0998 1302 1658 2064 2517 27 0415 0581 0790 1047 1353 1709 2112 28 0316 0449 0621 0834 1094 1402 1757 29 0239 0345 0484 0660 0878 1140 1449 30 0180 0263 0374 0518 0699 0920 1185
ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ Р(х) 381 Продолжение \k X 23 24 25 26 27 28 .29 1 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 2 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 3 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 4 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 6 0,9999 0,9999 1,0000 1,0000 1,0000 1,0000 1,0000 7 9995 9997 0,9999 0,9999 1,0000 1,0000 1,0000 8 9984 9991 9995 9997 0,9999 0,9999 1,0000 9 ' 9960 9976 9986 9992 9995 9997 0,9999 10 9913 9945 ‘ 9967 9980 9988 9993 9996 11 9832 9890 9929 9955 9972 9983 9990 12 9705 9799 9866 9912 9943 9964 9977 13 9520 9661 9765 9840 9892 9929 9954 14 9269 9466 9617 9730 9813 9872 9914 15 8946 9208 9414 9573 9694 9784 9850 16 8553 8881 9148 9362 9529 9658 9755 17 8093 8487 8818 9091 9311 9486 9622 18 7575 8030 8429 8758 9035 9261 9443 19 7012 7520 7971 8364 8700 8981 9213 20 6419 6968 7468 7916 8308 8645 8929 21 5811 6387 6926 7420 7863 8253 8591 22 5203 5793 6357 6887 7374 7813 8202 23 4608 5198 5776 6329 6850 7330 7765 24 4038 4616 5194 5760 6303 6815 7289 25 3503 4058 4624 5190 •5745 6278 6782 26 3009 3532 4076 ' 4631 5186 5730 6255 . 27 2560 3045 3559 4093 4638 5182 5717 28 2158 2600 3079 3585 4110 4644 5179 29 1803 2201 2639 3111 3609 4125 4651 30 1494_ 1848 2243 2676 3142 3632 4140
382 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ S(x) Таблица значений функции X X. п X 3 4 5 6 7 8 9 10 11 0,0 0,500 0,500 0,500 0,500 0,500 0,500 0,500 0,500 0,500 0,500 0,1 532 535 537 537 538 538 538 539 539 539 0,2 563 570 573 574 575 576 576 577 577 577 0,3 593 604 608 610 612 613 614 614 614 615 0,4 621 636 642 645 647 648 650 650 65.1 651 0,5 648 667 674 678 681 683 684 685 686 686 0,6 672 695 705 710 713 715 716 717 718 719 0,7 694 722 733 739 742 745 747 748 749 750 0,8 715 746 759 766 770 773 775 777 778 779 0,9 733 768 783 790 795 799 801 803 804 805 1,0 0,750 789 804 813 818 822 825 827 828 830 1,1 765 807 824 834 839 843 846 848 850 851 1,2 779 824 842 852 858 862 865 868 870 871 1,3 791 838 858 868 875 879 883 885 887 889 1,4 803 852 872 883 890 894 898 900 902 904 1,5 813 864 885 896 903 908 911 914 916 918 1,6 822 875 896 908 915 920 923 926 928 930 1,7 831 884 906 918 925 930 934 936 938 940 1,8 839 893 915 927 934 939 943 945 947 949 1,9 846 901 923 935 942 947 950 953 955 957 2,0 0,852 908 930 942 949 954 957 960 962 963 2,2 864 921 942 954 960 965 968 970 972 974 2,4 874 931 952 963 969 973 976 978 980 981 2,6 883 938 960 970 976 980 982 984 . 986 987 2,8 891 946 966 976 981 984 987 988 990 991 3,0 898 952 971 980 985 988 990 992 992 993 3,2 904 957 975 984 988 991 992 994 995 995 3,4 909 962 979 986 990 993 994 995 996 997 3,6 914 965 982 989 992 994 996 996 997 998 3,8 918 969 984 990 994 996 997 997 998 998 4,0 922 971 986 992 995 996 997 998 998 999 4,2 926 974 988 993 996 997 998 998 999 999 4,4 929 976 989 994 996 998 998 999 999 999 4,6 932 978 990 995 997 998 999 999 999 1,000 4,8 5,0 5,2 5,4 5,6 5,8 6,0 935 937 940 942 944 946 947 980 981 982 984 985 986 987 991 992 993 994 994 995 995 996 996 997 997 998 998 998 998 998 998 998 999 999 999 998 999 999 999 999 999 1,000 999 999 999 1,000 999 1,000 1,000
ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ S(x) 383 Продолжение х. п х 12 13 14 15 16 17 18 19 20 оо 0,0 0,500 0,500‘ 0,500 0,500 0,500 0,500 0,500 0,500 0,500 0,50000 0,1 539 539 539 539 539 539 539 539 539 53983 0,2 577 578 578 578 578 578 578 578 578 57926 . 0;3 615 615 616 616 616 616 616 616 616 61791 0,4 652 652 652 652 653 653 653 653 653 65542 0,5 686 687 687 688 688 688 688 688 689 69146 0,6 720 720 721 721 721 722 722 722 722 72575 0,7 751 751 752 752 753 753 753 754 754 75804 0,8 780 780 781 782 782 782 783 783 783 78814 0,9 806 807 808 808 809 809 810 810 810 81594 1,0 831 832 832 833 833 834 834 835 835 84134 1,1 853 854 854 855 856 856 857 857 858 86433 1,2 872 873 874 875 876 876 877 877 878 88493 . 1,3 890 891 892 893 893 894 894 895 895 90320 1,4 906 . 907 908 908 909 ‘ 910 910 911 911 91924 1,5 919 920 921 922 923 924 924 924 925 93319 1,6 931 932 933 934 935 935 936 936 937 94520 1,7 941 943 944 945 945 946 946 947 947 95543 1,8 950 952 952 953 954 955 955 956 956 96407 1,9 958 959 960 961 962 962 963 963 964 97128 2,0 . 965 967 967 967 968 969 969 970 970 97725 2,2 975 976 977 977 978 979 979 979 980 98610 2,4 982. 983 984 985 985 986 986 986 . 987 99180 2,6 988 988 989 990 990 990 991 991 991 99534 2,8 0,991 0,992 0,992 0,993 0,993 0,994 0,994 0,994 0,994 0,99744 3,0 994 994 995 995 996 996 996 996 996 99865 3,2 996 996 996 997 997 997 997 998 998 99931 3,4 997 997 998 998 998 998 998 998 998 99966 3,6 998 998 998 999 999 999 999 999 999 99984 3,8 998 999 • 999 999 999 999 999 999 999 99993 4,0 999 999 999* 999 999 1,000 1,000 1,000 1,000 99997 4,2 999 999 1,000 1,000 1,000 99999 4,4 1,000 1,000 99999
384 ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ К(х) ОО Таблица значений функции К(х)= 2 к =г—да X К(х) X К(х) X К(х) 0,28 0,000001 0,75 0,372833 1,22 0,898104 0,29 0,000004 0,76 0,389640 1,23 0,902972 0,30 0,000009 0,77 0,406372 1,24 0,907648 0,31 0,000021 0,78 0,423002 1,25 0,912132 0,32 0,000046 0,79 0,439505 1,26 . 0,916432 0,33 0,000091 0,80 0,455857 1,27 0,920556 0,34 0,000171 0,81 0,472041 1,28 0,924505 0,35 0,000303 0,82 0,488030 1,29 0,928288 0,36 0,000511 0,83 0,503808 1,30 0,931908 0,37 0,000826 0,84 0,519366 1,31 0,935370 0,38 0,001285 0,85 0,534682 1,32 0,938682 0,39 0,001929 0,86 0,549744 1,33 0,941848 0,40 0,002808 0,87 0,564546 1,34 0,944872 0,41 0,003972 0,88 0,579070 1,35 0,947756 0,42 0,005476 0,89 0,593316 1,36 0,950512 0,43 0,007377 0,90 0,607270 1,37 0,953142 0,44 0,009730 0,91 0,620928 1,38 0,955650 0,45 0,012590 0,92 0,634286 1,39 0,958040 0,46 0,016005 0,93 0,647338 1,40 0,960318 0,47 0,020022 0,94 0,660082 1,41 0,962486 0,48 0,024682 0,95 0,672516 1,42 0,964552 0,49 0,030017 0,96 0,684636 1,43 0,966516 0,50 0,036055 0,97 0,696444 1,44 0,968382 0,51 0,042814 0,98 0,707940 1,45 0,970158 0,52 0,050306 0,99 0,719126 1,46 0,971846 0,53 0,058534 1,00 0,730000 1,47 0,973448 0,54 0,067497 1,01 0,740566 1,48 0,974970 0,55 0,077183 1,02 0,750826 1,49 0,976412 0,56 0,087577 1,03 0,760780 1,50 0^77782 0,57 0,098656 1,04 0,770434 1,51 0,979080 0,58 0,110395 1,05 0,779794 1,52 0,980310 0,59 0,122760 1,06 0,788860 1,53 0,981476 0,60 0,135718 1,07 0,797636 1,54 0,982578 0,61 0,149229 1,08 0,806128 1,55 0,983622 0,62 0,163225 1,09 0,814342 1,56 0,984610 0,63 0,177753 1,10 0,822282 1,57 0,985544 0,64 0,192677 1,11 0,829950 1,58 0,986426 0,65 0,207987 1,12 0,837356 1,59 0,987260 0,66 0,223637 1,13 0,844502 1,60 0,988048 0,67 0,239582 1,14 0,851394 1,61 0,988791 0,68 0,255780 1,15 0,858038 1,62 0,989492 0,69 0,272189 1,16 0,864442 1,63 0,990154 0,70 0,288765 1,17 0,870612 . 1,64 0,990777 0,71 0,305471 1,18 0,876548 1,65 0,991364 0,72 0,322265 1,19 0,882258 1,66 0,991917 0,73 0,339113 1,20 0,887750 • 1,67 0,992438 0,74 0,355981 1,21 0,893030 1,68 0,992928
ТАБЛИЦА ЗНАЧЕНИЙ ФУНКЦИИ К(х) 385 Продолжение X К(х) X К(х) X К(х) 1,69 0,993389 2,00 0,999329 2,31 0,999954 1,70 0,993828 2,01 0,999380 2,32 0,999958 1,71 0 994230 2,02 0,999428 2,33 0,999962 1,72 0,994612 2,03 0,999474 2,34 0,999965 1,73 0,994972 2,04 0,999516 2,35 0,999968 1,74 0,995309 2,05 0,999552 2,36 0,999970 1,75 0,995625 2,06 0,999588 2,37 0,999973 1,76 0,995922 2,07 0,999620 2,38 0,999976 1,77 0,996200 2,08 0,999650 2,39 0,999978 1,78 0,996460 2,09 0,999680 2,40 0,999980 1,79 0,996704 2,10 0,999705 - 2,41 0,999982 1,80 0,996932 2,1 Г 0,999723 2,42 0,999984 1,81 0,997146 2,12 0,999750 2,43 0,999986 1,82 0,997346 . 2,13 0,999770 2,44 0,999987 1,83 0,997533 2,14 0,999790 2,45 0,999988 1,84 0,997707 2,15 0,999806 2,46 0,999989 1,85 0,997870 2,16 0,999822 2,47 0,999990 1,86 0,998023 2,17 0,999838 2,48 0,999991 1,87 0,998145 2,18 0,999852 2,49 0,999992 1,88 0,998297 2,19 0,999864 2,50 0,9999925 1,89 0,998421 2,20 0,999874 2,55 0,9999956 1,90 0,998536 2,21 0,999886 2,60 0,9999974 1,91 0,998644 2,22 0,999896 2,65 0,9999984 1,92 0,998744 2,23 0,999904 2,70 0,9999990 1,93 0,998837 2,24 0,999912 2,75 0,9999994 1,94 0,998924 2,25 0,999920 2,80 0,9999997 1,95 0,999004 2,26 0,999926 2,85 0,99999982 1,96 0,999079 2,27 0,999934 2,90 0,99999990 1,97 0,999149 2,28 0,999940 2,95 . 0,99999994 1,98 0,999213 2,29 0,999944 3,00 0,99999997 1,99 0,999273 2,30 0,999949 Таблица значений функции а = In 0,001 0,01 0,02 0,03 0,04 0,05 0,10 0,15 0,001 6,907 4,604 3,911 3,506 3,218 2,995 2,302 1,896 0,01 6,896 4,595 3,902 3,497 3,209 2,986 2,293 1,887 0,02 6,888 4,585 3,892 3,486 3,199 2,976 2,282 1,877 0,03 6,877 4,575 3,882 3,476 3,188 2,965 2,272 1,867 0,04 6,867 4,564 3,871 3,466 3,178 2,955 2,262 1,856 0,05 6,856 4,554 3,861 3,455 3,168 2,944 2,251 1,846 0,10 6,802 4,500 3,807 3,401 3,114 2,890 2,197 1,792 0,15 6,745 4,443 3,750 3,344 3,056 2,833 2,140 1,735 25 Зак. 1826. Б. В. Гнеденко
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аксиомы теории вероятностей 41—46 Безгранично-делимые законы распре- деления 222—225, 229, 233—236, 263, 362 Борелевское тело множеств 328 Вариационный ряд 277 Вероятнейшее значение 63 Вероятность 14, 17—19, 24, 25, 39, 40, 42 — гипотезы 52 — перехода 99 — - условная 46, 243 Дискретные случайные величины 106, 109 Дисперсия 141—146, 150, 161 Доверительная вероятность 305, 309 Доверительные границы 275, 303 Достоверное событие 13, 21, 329 Задача Бюффона 35 — о встрече 32 Закон больших чисел 85, И59—171 — повторного логарифма 359 — распределения 109 Интеграл Стилтьеса 131—135 , Испытание 23 Исчерпывающая статистика 302 Классическое определение вероятно- сти 17, 23—26 Корреляционная функция 269—272 Коэффициент корреляции 145 Критерий согласия Колмогорова 291 Критическая область 311, 312, 315 Математическая статистика 273, .274 Математическое ожидание 137—141, 146-149 — — условное 139 Матрица перехода 99 Моменты 145, 152—157 Невозможное событие 13, 21, 329 Независимые случайные величины 119 — события 48, 49 Непрерывные случайные величины 110 Неравенство Колмогорова 172 — Чебышева 161 Несовместимые события 22, 42, 329 Нормированное уклонение случай- ной величины 151 Однородные процессы с независимы- ми приращениями 261—263 Парадокс Бертрана 33, 34 Плотность распределения вероятно- стей НО, 111, 117 Поле событий 22, 42 ---- борелевское 42 Полная группа событий 22 Положительно определённые функ- ции 196—201 Последовательный анализ 317—326 Предельная теорема интегральная * 77, 78, 208, 209, 213, 233—239, 360, 361 ----локальная 64, 65, 214, 217, 362 Преобразование Лапласа 335 Проверка гипотез 291, 310—318, 321, 323, 324 Произведение событий 20 Противоположные события 21, 42, 329 Равносильные события 20 Разность событий 20 Распределение биномиальное 62, 183 — Коши 128, 138 — Максвелла 120, 127 — нормальное 106, НО, 111, 115, 117, 119, 120, 124, 125, 128, 130, 138, 143—14*6, 154, 181, 186, 203, 204, 222, 228, 229, 237, 238, 265, 266, 275, 293, 315, 323, 324, 330, 331
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 387 Распределение параметров нормаль- ного распределения 293, 300, 301 — Пуассона 91, 106, 139, 182, 186, 999 990 OQQ равномерное 114, 117, 122, 139, 143, 182, 330 — решетчатое 214 — Симпсона 123 — Стьюдента 129, 308 —У2 125—127, 306, 309 Случайное событие 13, 328 Случайные величины 105, 329 -----дискретные 106, 109 -----независимые 119 -----непрерывные 110 Случайный вектор 113, 141, 144, 145, 202 — процесс без последействия 241 -----марковского типа 241, 366, 367 -----непрерывный 247 -----с независимыми приращениями 261—263 -----стационарный 241, 269, 270, 367 -----чисто разрывный 255 События достоверные 13, 21, 329 — невозможные 13, 21, 329 — независимые 48, 49 — несовместимые и совместимые 22, 42, 329 — противоположные 21, 42, 329 — равносильные 20 Статистическое определение вероят- ности 37—41 Стохастический случайный процесс 240—242, 245 Сумма событий 20 Схема Бернулли 60, 94, 106 Сходимость в основном 188 — по вероятности 160 — почти наверное 278, 279 Теорема Бернулли 85, 88, 89, 163 — Бохнера-Хинчина 198 — Колмогорова 173, 284 — Маркова 167, 360 — Муавра-Лапласа интегральная 73, 84—88, 196, 206 Теорема Муавра-Лапласа локальная 64, 68, 94, 96, 97, 217 — предельная интегральная 77, 78 ----- локальная 64, 65 — Пуассона 89, 90, 166 — сложения 25 — умножения 48 — Хелли 189—191 — Чебышева 162 Уравнение Колмогорова 248, 249 — Колмогорова-Феллер а 256 — Маркова (обобщённое) 246, 366 Усиленный закон больших чисел 171—177, 280 Условие Линдеберга 208 — Ляпунова 213 Условная плотность 243 Условные вероятности 46, 243 Устойчивые законы распределения 362 Формула Бейеса 52, 245 — обращения характеристической функции 183 — полной вероятности 50, 243 Функция распределения 105, 107—109, 121, 127, 193, 330 -----многомерная 113, 116 ----- условная 113, 243 Характеристическая функция 178 — 183, 193, 198, 202—205, 225 Цепь Маркова 98, 99, 365 ----- однородная 99 Частичный случай события 20, 22 Шаг распределения 215, 216 Элементарные системы случайных величин 222 — события 24, 328, 329 Эллипс равных вероятностей 117 Эмпирическая функция распределе- ния 277 Эргодическая теорема 101, 103, 365
Редактор /О. В, Прохоров* Техн, редактор А П. Остроумова, * Подписано к печати 21/IX 1950'г. Бумага 60х92/м- 12,125 бум. л. 24,25 печ. л. 27,83 уч.*изд. л. 42088 тип, зн. в печ. л. Тираж 15000 вкз» Т-07827. Ценд книги 9 р. 55 к. Переплет 2 р» Заказ № 1826. * 4-я типография им. Евг. Соколовой Главполиграфиздата при Совете Министров СССР, Ленинград, Измайловский пр., 29. $