Text
                    ./ ;	:	;:V';	'■’/	\
Б.В.	rHEAEHkO,АЯХИНЧИН
AEMEHTAPHOE
ВВЕДЕНИЕ
С ТЕОРИЮ
ВЕРОЯТНОСТЕЙ


Настоящая книжка двух советских математиков вы¬ держала несколько изда¬ ний в нашей стране и переведена во многих странах: Франции, ГДР, Польше, Венгрии, Чехо¬ словакии, Румынии, Арген¬ тине, КНР. Повсюду она встретила благожелатель¬ ное отношение читате¬ лей. Эта книжка предъ¬ являет минимальные тре¬ бования к математическим знаниям читателей. Мате¬ матического образования в объеме средней школы вполне достаточно для сво¬ бодного понимания всех ее разделов. Изложение ведется на базе рассмот¬ рения примеров практи¬ ческого содержания. При этом, однако, авторы не стремятся углубиться в де¬ тали специально техниче¬ ские, чтобы не затемнять рассматриваемых теоретико - вероятностных вопросов.
,6. В. ГН ЕДЕН КО, А.Я.ХИИЧИН ЛЕМЕНТАРНОЕ ССЕЛЕНИЕ С ТЕОРИЮ СЕРОЯТНОСТЕЙ ИЗДАНИЕ пятое Лсударст(?енное издателЬст(?о Физико-математической литЕрлтурм М о с к В А • а у о а
Гнеденко Борис Владимирович и Хинчпн Александр Яковлевич. Элементарное введение в теорию вероятностей. Редактор С. А. Широкова. Техн. редактор В. И. Крючкова. Корректор О. А. Сигал, Сдано в набор 24/XII 1960 г. Подписано к печати 23/ III 1961 г. Бумага 84 X lOS1^. физ. печ. л. 4,5. Условн. печ. л. 7,38. Уч.-изд. л. 6,71. Тираж 40 000 экз. Т-03124. Цена книги 20 коп. Заказ № 1300. Государственное издательство физико-математической литературы. Москва, В-71, Ленинский проспект, 15. Первая Образцовая типография имени А. А. Жданова Московского городского совнархоза. Москва, Ж-54, Валовая, 28.
ОГЛАВЛЕНИЕ Предисловие к пятому изданию 5 Предисловие к первому изданию 6 ЧАСТЬ ПЕРВАЯ ВЕРОЯТНОСТИ Глава 1. Вероятности событий 7 § 1. Понятие вероятности 7 §2. Невозможные и достоверные события 13 § 3. Задача 14 Глава 2. Правило сложения вероятностей 16 § 4. Вывод правила сложения вероятностей 16 § 5. Полная система событий 19 § 6. Примеры 22 Глава 3. Условные вероятности и правило умножения ... 24 § 7. Понятие условной вероятности 24 § 8. Вывод правила умножения вероятностей ....... 27 § 9. Независимые события 29 Глава 4. Следствия правил сложения и умножения 35 § 10. Вывод некоторых неравенств 35 § 11. Формула полной вероятности 37 § 12. Формула Бейеса 41 Глава 5. Схема Бернулли 47 § 13. Примеры 47 § 14. Формулы Бернулли 50 § 15. Наивероятнейшее число наступлений события ... 53 Глава 6. Теорема Бернулли СО § 16. Содержание теоремы Бернулли 60 § 17. Доказательство теоремы Бернулли 62
4 ОГЛАВЛЕНИЕ ЧАСТЬ ВТОРАЯ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Глава 7. Случайная величина и закон распределения .... 69 § 18. Понятие случайной величины 69 § 19. Понятие закона распределения . . 71 Глава 8. Средние значения 76 § 20. Определение среднего значения случайной величины 76 Глаза 9. Средние значения суммы и произведения 87 § 21. Теорема о среднем значении суммы . . . 87 § 22. Теорема о среднем значении произведения 91 Глава 10. Рассеяние и средние уклонения 94 § 23. Недостаточность среднего значения для характе¬ ристики случайной величины 94 § 24. Различные способы измерения рассеяния случайной величины 96 §25. Теоремы о среднем квадратическом уклонении .... 103 Глава 11. Закон больших чисел 109 § 26. Неравенство Чебышева 109 § 27. Закон больших чисел 111 § 28. Доказательство закона больших чисел 113 Глава 12. Нормальные законы 117 § 29. Постановка задачи 117 § 30. Понятие кривой распределения 119 § 31. Свойства нормальных кривых распределения 123 § 32. Решение задач 130 Заключение \ 33 П р и л о ж е н и е. Таблица значений величины Ф (а) .... 144
ПРЕДИСЛОВИЕ К ПЯТОМУ ИЗДАНИЮ Настоящее издание было подготовлено мной к печати уже после смерти А. Я. Хинчина — выдающегося ученого и пе¬ дагога. Современное развитие теории вероятностей, многие ее идеи и результаты тесно связаны с именем Хинчина. Систематическое использование методов теории множеств и теории функций действительного переменного в теории вероятностей, построение основ теории случайных процес¬ сов, широкое развитие теории суммирования независимых случайных величин, а также построение нового подхода к задачам статистической физики и стройной системы ее изложения — все это заслуга Александра Яковлевича. Он же разделяет с С. Н. Бернштейном и А. Н. Колмогоровым заслугу создания советской школы теории вероятностей, играющей в современной науке выдающуюся роль. Я счаст¬ лив, что мне довелось быть его учеником. Книжка, написанная нами в период победоносного за¬ вершения Великой Отечественной войны, естественно, от¬ ражала в рассмотренных нами примерах элементарные по¬ становки военных задач. Теперь, спустя 15 лет после побе¬ ды, в дни, когда вся страна покрыта лесами новостроек, естественно расширить тематику примеров, иллюстрирую¬ щих общие теоретические положения. Именно поэтому, не меняя изложения и элементарного характера книги, я позволил себе заменить на новые большое число примеров. За малыми исключениями те же изменения были внесены мной и во французское издание нашей книжки (Paris, 1960). Москва, 6.Х. 1960 г, Б. В. Гнеденко
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Знакомство с теоретическими основами той или другой математической науки всегда позволяет более сознательно и активно применять выводы этой науки на практике. Между тем, в области теории вероятностей дело обстоит так, что с практическими приложениями этой науки при¬ ходится иметь дело большому числу командиров (а подчас и рядовых работников) армии, промышленности, сельского хозяйства, экономики и т. д., математическое образование которых весьма ограничено. Наша книжка имеет целью в возможно доступной форме ознакомить работников этой группы с основными понятиями теории вероятностей и методами вероятностных расчетов. Книжка полностью доступна всем окончившим десятилет¬ нюю среднюю школу; она почти целиком доступна и окончив¬ шим семилетку. Почти во всех своих разделах книжка пост¬ роена на базе конкретных практических примеров; однако при выборе этих примеров мы руководствовались в первую очередь не практической их актуальностью, а иллюстратив¬ ной ценностью для усвоения соответствующих теоретиче¬ ских положений. Москва, 7 января 1945 г,
ЧАСТЬ ПЕРВАЯ ВЕРОЯТНОСТИ ГЛАВА ПЕРВАЯ ВЕРОЯТНОСТИ СОБЫТИЙ § 1. Понятие вероятности Когда про какого-нибудь стрелка говорят, что он при данных условиях стрельбы дает 92% попаданий, то это означает, что из сотни выстрелов, произведенных им при некоторых определенных условиях (одна и та же цель на том же расстоянии, та же винтовка и т. д.), в среднем бы¬ вает примерно 92 удачных (и значит, около 8 неудачных). Конечно, не в каждой сотне будет 92 удачных выстрела; иногда их будет 91 или 90, иногда 93 или 94; подчас число их может оказаться даже заметно меньше или заметно больше чем 92; но в среднем при многократном повторении стрельбы в тех же условиях этот процент попаданий будет оставаться неизменным, покуда с течением времени не прои¬ зойдет каких-нибудь существенных изменений (так, наш стрелок может повысить свое мастерство, доведя средний процент попаданий до 95 и выше). И опыт показывает, что у такого стрелка в большинстве случаев число удачных выстрелов на сотню будет близко к 92; такие сотни, в ко¬ торых, например, это число меньше чем 88 или больше чем 96, хотя и будут встречаться, но сравнительно редко. Цифра 92%, служащая показателем мастерства нашего стрелка, бывает обычно очень устойчивой, т. е. процент попаданий в большинстве стрельб (в тех же условиях) будет для данного стрелка почти один и тот же, лишь в редких, исключительных случаях уклоняясь сколько-нибудь значи¬ тельно от своего среднего значения.
8 ВЕРОЯТНОСТИ СОБЫТИЙ [гл. I Рассмотрим еще один пример. На некотором предприя¬ тии было замечено, что в данных условиях в среднем 1,6% изготовленных предметов оказываются не удовлетворяю¬ щими стандарту и идут в брак. Это означает, что в партии, скажем, из 1000 изделий, еще не подвергнутых браковке, будет примерно 16 непригодных. Иногда, конечно, число бракованных изделий будет несколько больше, иногда не¬ сколько меньше, но в среднем это число будет близко к 16, и в большинстве партий по 1000 изделий оно также будет близко к 16. Понятно, что и здесь мы предполагаем усло¬ вия производства (организация технологического процесса, оборудование, сырье, квалификация рабочих и пр.) неиз¬ менными. Ясно, что таких примеров можно привести сколько угодно. Во всех этих примерах мы видим, что при одно¬ родных массовых операциях (многократная стрельба, мас¬ совое производство изделий и т. п.) процент того или дру¬ гого вида важных для нас событий (попадание в цель, нестан¬ дартность изделия и пр.) при данных условиях почти всегда бывает примерно одним и тем же, лишь в редких случаях уклоняясь сколько-нибудь значительно от некоторой сред¬ ней цифры. Можно поэтому сказать, что эта средняя цифра является характерным показателем данной массовой опера¬ ции (при данных строго установленных условиях). Процент попадания описывает нам мастерство стрелка, процент брака оценивает нам доброкачественность продукции. Само собой понятно поэтому, что знание таких показателей очень важно в самых различных областях: военном деле, технике, экономике, физике, химии и пр.; оно позволяет нам не только оценивать уже происшедшие массовые явле- * ния, но и предвидеть исход той или иной массовой опера¬ ции в будущем. Если стрелок в данных условиях стрельбы попадает в цель в среднем 92 из 100 выстрелов, то мы говорим, что для этого стрелка и в этих условиях вероятность попада¬ ния составляет 92% (или 92/100, или 0,92). Если в дан¬ ных условиях в среднем на каждую 1000 готовых изделий некоторого предприятия приходится 16 бракованных, то мы говорим, что вероятность изготовления брака состав¬ ляет для данного производства 0,016 или 1,6%.
ПОНЯТИЕ ВЕРОЯТНОСТИ О Что же мы вообще называем вероятностью событий в данной массовой операции? На это теперь нетрудно от¬ ветить. Массовая операция всегда состоит из повторения большого числа подобных между собою единичных опера¬ ций (стрельба — из отдельных выстрелов, массовое произ¬ водство— из изготовления отдельных предметов и т. п.). Нас интересует определенный результат единичной опера¬ ции (попадание при единичном выстреле, нестандартность отдельного изделия и т. д.) и прежде всего — число таких результатов в той или другой массовой операции (сколько выстрелов попадет в цель, сколько изделий будет забрако¬ вано и т. д.). Процент (или вообще долю) таких «удач¬ ных»*) результатов в данной массовой операции мы и на¬ зываем вероятностью этого важного для нас результата. При этом всегда надо иметь в виду, что вопрос о вероят¬ ности того или другого события (результата) имеет смысл только в точно определенных условиях, в которых проте¬ кает наша массовая операция. Всякое существенное изме¬ нение этих условий влечет за собой, как правило, измене¬ ние интересующей нас вероятности. Если массовая операция такова, что событие А (напри¬ мер, попадание в цель) наблюдается в среднем а раз среди b единичных операций (выстрелов), то вероятность события А a f 100ап/ \ ЛЛ в данных условиях составляет у [^или -у-% )• Можно ска¬ зать поэтому, что вероятностью «удачного» исхода еди¬ ничной операции мы называем отношение в среднем наблю¬ дающегося числа таких «удачных» исходов к числу всех единичных операций, составляющих данную массовую опе¬ рацию. Само собой разумеется, что если вероятность какого- либо события равна у , то в каждой серии из b единичных операций это событие может наступить и более чем а раз, и менее чем а раз; только в среднем оно наступает при¬ мерно а раз; и в большинстве таких серий из b операций *) Во втором примере скорее следовало бы сказать «неудачных». Однако в теории вероятностей принято называть «удачными» те резуль¬ таты, которые приводят к осуществлению события, интересующего нас в задаче.
10 ВЕРОЯТНОСТИ СОБЫТИЙ [ГЛ. I число наступлений события А будет близко к а, в особен¬ ности, если b — большое число. Пример 1. В некотором городе в течение первого квартала родились: в январе ■— 145 мальчиков и 135 девочек, в феврале — 142 мальчика и 136 девочек, в марте — 152 мальчика и 140 девочек. Как велика вероятность рождения мальчика? Доля рожде¬ ний мальчиков: в январе: ^ ^ 0,518=51,8%, вфеврале: ^ ^0,511=51,1%, в марте: 0,520=52,0%. Мы видим, что это среднее арифметическое долей за от¬ дельные месяцы близко к числу 0,516=51,6%; искомая вероятность в данных условиях составляет примерно 0,516, или 51,6%. Эта цифра хорошо известна в демографии — науке, изучающей динамику населения; оказывается, что доля рождения мальчика в обычных условиях в различные периоды времени не будет значительно отклоняться от этой цифры. Пример 2. В начале прошлого века было открыто замечательное явление, получившее название (по имени от¬ крывшего его английского ботаника Броуна) броуновского движения. Это явление заключается в том, что мельчайшие частицы вещества, взвешенные в жидкости *), находятся в хаотическом движении, совершающемся без всяких види¬ мых причин. Долго не могли выяснить причину этого, казалось бы, самопроизвольного движения, пока кинетическая теория газов не дала простого и исчерпывающего объяснения: дви¬ жение частиц, взвешенных в жидкости, есть результат уда¬ ров молекул жидкости об эти частицы. Кинетическая теория газов дает возможность подсчитать вероятность того, что *) То есть находящиеся в состоянии безразличного равновесия.
ПОНЯТИЕ ВЕРОЯТНОСТИ 11 в данном объеме жидкости не будет ни одной частицы взвешенного вещества, вероятность того, что таких частиц будет одна, две, три и т. д. С целью проверки результа¬ тов теории был произведен ряд опытов. Мы приведем результаты 518 наблюдений шведского физика Сведеберга над мельчайшими частицами золота, взве¬ шенными в воде. Было найдено, что в подвергшейся на¬ блюдению части пространства 112 раз не наблюдалось ни одной частицы, 1 частица наблюдалась 168 раз, 2 частицы — 130 раз, 3 частицы — 69 раз, 4 частицы — 32 раза, 5 ча¬ стиц— 5 раз, 6 частиц— 1 раз, 7 частиц— 1 раз. Таким образом: 12 доля 0 частиц равна ^=0,216; 168 1 наблюдающейся частицы равна: ^ =0,325 2 наблюдавшихся частиц 3 130 п 0г 1 » 518=0,251 4 5 6 Ц=о,ш 32 518 =0,062 518 0,010 518 =0,002 ^=0,002. Результаты наблюдений, как оказалось, очень хорошо совпали с теоретически предсказанными вероятностями. Пример 3. В ряде практически важных задач су¬ щественно знание того, как часто могут встречаться в тек¬ сте те или иные буквы русского алфавита. Так, например, при формировании типографских касс нерационально за¬ пасать всех букв по одинаковому числу, так как одни бук¬ вы в тексте встречаются значительно чаще, чем другие.
12 ВЕРОЯТНОСТИ СОБЫТИЙ [ГЛ. Г Поэтому стремятся, чтобы чаще встречающиеся буквы были представлены в большем числе. Исследования, произ¬ веденные над литературными текстами, привели к оценке ча¬ стоты букв русского алфавита, включая пробелы между сло¬ вами, которая сведена в следующую табличку *) (составлена в порядке уменьшения относительной частоты появления). Буква пробел о е, ё 0,072~ а и т и Относит, частота 0,175 0,090 0,062 0,062 0,053 0,053 Буква с Р в л к м д Относит, частота 0,045 0,040 0,038 0,035 0,028 0,026 0,025 Буква п У я ы 3 ь, ъ б Относит, частота 0,023 0,021 0,018 0,016 0,016 0,014 0,014 Буква г ч й X ж ю ш Относит, частота 0,013 0,012 0,010 0,009 0,007 0,006 0,006 Буква ц щ э Ф Относит, частота 0,004 0,003 0,002 0,002 Таким образом, указанные исследования показывают, что в среднем из 1000 наудачу выбранных в тексте промежутков и букв на двух местах будет стоять буква «ф», на двадцати восьми — буква «к», на девяносто — буква «о» и на ста се¬ мидесяти пяти окажутся промежутки между словами. Эти данные являются достаточно ценными указаниями для фор¬ мирования наборных касс. В последние годы подобные исследования, уже не огра¬ ничивающиеся только статистикой букв в русских текстах, начинают широко использоваться для выяснения особен¬ ностей русского языка, а также литературного стиля раз¬ личных авторов. Подобные данные относительно телеграфных сообщений могут быть использованы для создания наиболее экономич- *) Эта табличка заимствована из превосходной популярной книжки А. М. Яглома и И. М. Яглома «Вероятность и информация», 2-е изд., Физматгиз, I960.
НЕВОЗМОЖНЫЕ И ДОСТОВЕРНЫЕ СОБЫТИЯ 13 ных телеграфных кодов, которые позволяли бы передавать сообщения посредством меньшего числа знаков и тем самым быстрее. Выяснилось, что применяемые сейчас телеграфные коды не являются достаточно экономными. § 2. Невозможные и достоверные события Вероятность события, очевидно, всегда есть положитель¬ ное число или нуль. Она не может быть больше единицы, потому что у дроби, которой она определяется, числитель не может быть больше знаменателя (число «удачных» опе¬ раций не может быть больше числа всех предпринятых опе¬ раций). Условимся обозначать через Р(А) вероятность со¬ бытия Л. Каково бы ни было это событие, 0<Р(Л)< 1. Чем больше Р(А), тем чаще наступает событие А. Напри¬ мер, чем больше у стрелка вероятность попадания в цель, тем чаще у него удачные выстрелы, тем выше его мастер¬ ство. Если вероятность события очень мала, то оно насту¬ пает редко; если Р(А) = 0, то событие А либо никогда не наступает, либо наступает крайне редко, так что прак¬ тически можно считать его невозможным. Напротив, если Р(А) близко к единице, то у дроби, которой выражается эта вероятность, числитель близок к знаменателю, т. е. подавляющее большинство операций «удачно»; такое собы¬ тие наступает в большинстве случаев; если Р(А) = 1, то событие А наступает всегда или почти всегда, так что практически можно считать его, как говорят, «достовер¬ ным», т. е. наверняка рассчитывать на его наступление. Если Р(Л) = у, то событие А наступает примерно в по¬ ловине всех случаев; это значит, что «удачных» операций наблюдается примерно столько же, сколько «неудачных». Если Р (Л)>у , событие Л наступает чаще, чем не насту¬ пает; при P{A)<y мы имеем обратное явление. Как мала должна быть вероятность события, чтобы мы практически могли считать его невозможным? На этот
14 ВЕРОЯТНОСТИ СОБЫТИЙ [ГЛ. I вопрос нельзя дать общего ответа, потому что все зависит от того, насколько важно событие, о котором идет речь. Так, 0,01—число небольшое. Если мы имеем партию сна¬ рядов, и 0,01 есть вероятность того, что снаряд при паде¬ нии не разорвется, то это означает, что примерно 1 % выстрелов останется без результата. С этим можно прими¬ риться. Но если мы имеем парашют, и 0,01 есть вероят¬ ность того, что он при прыжке не раскроется, то с этим мириться, конечно, никак нельзя, ибо это означает, что в одном из сотни прыжков будет бесцельно гибнуть ценная жизнь бойца-парашютиста. Эти примеры показывают, что в каждой отдельной задаче мы должны заранее на осно¬ вании практических соображений установить, как мала должна быть вероятность события, чтобы мы без ущерба для дела могли не считаться с его возможностью. § 3. Задача Задача. Один стрелок дает 80 96 попаданий в цель, а другой (при тех же условиях стрельбы) 70%. Найти ве¬ роятность поражения цели, если оба стрелка стреляют в нее одновременно. Цель считается пораженной при попадании в нее хотя бы одной из двух пуль. Пер вый способ решения. Допустим, что производится 100 двойных выстрелов. Примерно в 80 из них цель будет поражена первым стрелком. Остается около 20 выстрелов, в которых этот стрелок даст промах. Так как второй стрелок поражает цель в среднем 70 раз из 100 выстрелов и, значит, 7 раз из 10 выстрелов, то мы можем ожидать, что в тех 20 выстрелах, в которых первый стре¬ лок даст промах, второму удастся поразить цель при¬ мерно 14 раз. Таким образом, при всей сотне выстрелов цель окажется пораженной примерно 80+14=94 раза. Вероятность поражения цели при одновременной стрельбе наших двух стрелков равна поэтому 94%, или 0,94. Второй способ решения. Допустим опять, что производится 100 двойных выстрелов. Мы уже видели, что при этом первый стрелок даст примерно 20 промахов. Так как второй стрелок на сотню выстрелов дает примерно 30 промахов и, значит, на десяток примерно 3 промаха,
§3] ЗАДАЧА 15 то можно ожидать, что среди тех 20 выстрелов, в которых промахнется первый стрелок, будет примерно 6 таких, в которых промахнется также и второй. При каждом из этих 6 выстрелов цель останется непораженной, а . при каждом из остальных 94 выстрелов по крайней мере один из стрелков выстрелит удачно, и значит, цель будет пора¬ жена. Мы снова приходим к выводу, что при двойной стрельбе цель будет поражаться примерно в 94 случаях из 100, т. е. что вероятность поражения составит 94%, или 0,94. Рассмотренная нами задача очень проста. Но тем не менее она уже приводит нас к очень важному выводу: могут быть такие случаи, когда полезно уметь находить по вероятностям одних событий вероятности других, бо¬ лее сложных событий. На самом деле таких случаев бывает очень много, и не только в военном деле, а и во всякой науке и всякой практической деятельности, где мы встре¬ чаемся с массовыми явлениями. Конечно, было бы очень неудобно для каждой новой встретившейся задачи такого рода изыскивать свой особый способ решения. Наука всегда старается создать общие правила, знание которых позволило бы уже механически или почти механически решать отдельные похожие друг на друга задачи. В области массовых явлений наука, которая берет на себя составление таких общих правил, называется теорией вероятностей. В этой книжке будут даны первые основы этой науки. Теория вероятностей есть одна из глав математической науки, подобно арифметике или геометрии. Поэтому путь ее есть путь точного рассуждения, а орудиями ее служат формула, таблица, чертеж и т. п.
ГЛАВА ВТОРАЯ ПРАВИЛО СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ § 4. Вывод правила сложения вероятностей Самым простым и самым важным общим правилом, упо¬ требляемым при расчете вероятностей, является правило сложения, которое мы теперь рассмотрим. При стрельбе по мишени, изображенной на рис. 1, с данного расстояния для каждого стрелка имеется та или другая вероятность попасть в каждую из областей У, 2, 3, 4, 5, 6. Пусть для како¬ го-нибудь стрелка вероят¬ ность попасть в область У составляет 0,24, а вероят- S ность попасть в область 2— 0,17. Как мы уже знаем, это означает, что из сотни пуль, выпущенных этим стрелком, 24 пули попада¬ ют (в среднем) в область У и 17 пуль — в область 2. Пусть в некотором со¬ стязании выстрел признает¬ ся «отличным», если пуля попала в область У, и «хорошим», если она попала в область 2. Какова вероятность того, что вы¬ стрел нашего стрелка будет либо хорошим, либо отличным? На этот вопрос легко ответить. Из каждой сотни пуль, выпущенных стрелком, примерно 24 ложатся в область У и примерно 17 — в область 2. Значит, в каждой сотне пуль будет примерно 24+17=41 пуля, которые попадут либо
ВЫВОД ПРАВИЛА СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ 17 в область 1, либо в область 2. Искомая вероятность равна поэтому 0,41=0,24+0,17. Вероятность того, что вы¬ стрел будет либо отличным, либо хорошим, равна, сле¬ довательно, сумме вероятностей отличного и хорошего выстрелов. Рассмотрим еще другой пример. Пассажир ждет трам¬ вая № 26 или № 16 возле остановки, у которой останав¬ ливаются трамваи четырех маршрутов: № 16, 22, 26, 31. Считая, что трамваи всех маршрутов появляются в среднем одинаково часто, найти вероятность того, что первый по¬ дошедший к остановке трамвай будет нужного пассажиру маршрута. Ясно, что вероятность того, что первым подойдет к ос¬ тановке трамвай № 16, равна такая же вероятность того, что первым подойдет трамвай № 26. Искомая же вероятность, очевидно, равна -у. Но поэтому мы можем сказать, что вероятность появления первым трамвая № 16 или № 26 равна сумме вероятностей появления трамвая № 16 и трамвая № 26. Мы можем теперь провести общее рассуждение. При проведении некоторой массовой операции устано¬ влено, что в каждой серии из Ь единичных операций на¬ блюдается в среднем » » и так далее. Иначе говоря, вероятность события Ах равна а9 » f, » »» + ь и так далее. 2 Б, В. Гнеденко и А. Я. Хинчин
18 ПРАВИЛО СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ [ГЛ. II Как велика вероятность того, что в некоторой единич¬ ной операции наступит какой-либо один (все равно какой) из результатов Аи А2, Лз, ...? Интересующее нас событие можно назвать «Аи либо А 2, либо Лз, либо...» *). Это событие в серии из Ь. операций наступает а1+а2+а3+... раз; значит, искомая вероятность равна а1~1~^2~Ьаз4~ • • > <h_ I ^2_J_^3 I Ь ~ +Г 6 1 6 Г * * * ’ это можно записать следующей формулой: P(AV либо Л2, либо Л3, либо ...) = = P(Al)-\-P(Az)+P(As)+... При этом, как в наших примерах, так и в нашем общем рассуждении мы все время предполагали, что любые два из рассматриваемых результатов (например, Ai и Л2) несо¬ вместимы между собою, т. е. не могут наблюдаться в одной и той же единичной операции. Для примера, подошедший трамвай не может быть одновременно нужного и ненужного маршрута — он либо удовлетворяет потребность пассажира, либо нет. Это предположение о взаимной несовместимости отдель¬ ных интересующих нас результатов очень важно; без него правило сложения становится неверным, и применение его приводит к грубым ошибкам. Рассмотрим, например, задачу, решенную нами в конце предыдущего параграфа (стр. 14). Там как раз отыскивалась вероятность того, что при двойном выстреле попадет в цель либо первый, либо второй стрелок, причем для первого стрелка вероятность попада¬ ния равна 0,8, а для второго 0,7. Если бы мы хотели приме¬ нить к решению этой задачи правило сложения, то мы сразу нашли бы, что искомая вероятность равна 0,8+0,7= = 1,5 — результат явно нелепый, так как мы уже знаем, что вероятность события не может быть больше единицы. К этому неверному и бессмысленному ответу мы пришли потому, что применили правило сложения к такому случаю, где его применять нельзя: те два результата, о которых *) Многоточие здесь и в других подобных случаях означает «и так далее».
§ 5] ПОЛНАЯ СИСТЕМА СОБЫТИИ 19 идет речь в этой задаче, совместимы друг с другом, ибо вполне возможно, что оба стрелка поразят цель при одном и том же двойном выстреле. Значительная часть ошибок, которые делают начинающие при расчете вероятностей, осно¬ вывается именно на таком неправильном применении пра¬ вила сложения; необходимо поэтому тщательно остерегаться этой ошибки и при каждом применении правила сложения проверять, действительно ли среди тех событий, к которым мы его хотим применить, каждые два несовместимы друг с другом. Мы можем теперь дать общую формулировку правила сложения. Правило сложения. Вероятность наступления в некоторой операции какого-либо одного (безразлично какого именно) из результатов А\, А2, . . ., Ап равна сумме вероятностей этих результатов, если каждые два из них несовместимы между собой. § 5. Полная система событий В Третьем государственном займе восстановления и раз¬ вития народного хозяйства в течение двадцатилетнего срока его действия третья часть облигаций выигрывает, а осталь¬ ные две трети выходят в тираж и погашаются по нарица¬ тельной стоимости. Иначе говоря, для этого займа каждая облигация имеет вероятность выигрыша, равную , и о вероятность выхода в тираж, равную у. Выигрыш и вы¬ ход в тираж — противоположные события, т. е. такие два события, из которых одно и только одно обязательно на¬ ступает для каждой облигации. Сумма их вероятностей и это не случайно. Вообще, если Ai и А 2 — два противо¬ положных события и если в серии из b операций событие Al наступает ai раз, а событие А г—а 2 раз, то, очевидно, аН- ~f" $2 — Ь. Но Р(Л,)=21, Р(Аг)=%, 2*
20 ПРАВИЛО СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ [ГЛ. II так что Р(Л,) + Р(Л2)=^+^-=541*-!- Можно получить тот же результат и из правила сложения: так как противоположные события несовместимы между собою, то Р{Ах)\Р{А2) = Р{Ах либо Л2); но событие «Л1 либо А 2» есть событие достоверное, так как из определения противоположных событий следует, что оно наверняка должно наступить; поэтому вероятность его равна единице, и мы снова получаем Р{АХ) + Р{А,)= 1. Сумма вероятностей двух противоположных событий равна единице. Это правило допускает весьма важное обобщение, кото* рое можно доказать тем же способом. Пусть мы имеем п (любое число) событий А1, Л2, ..., Лп, таких, что в каждой единичной операции обязательно должно наступить одно и только одно из этих событий; условимся такую группу событий называть полной системой; в частности, всякая пара противоположных событий, очевидно, образует пол¬ ную систему. Сумма вероятностей событий, образующих полную си¬ стему, равна единице. Действительно, по определению полной системы любые два из событий этой системы несовместимы между собой, так что правило сложения дает: Р(Л1)+Р(Лг)+...+Р(Л„) = = P(AV либо А2, либо..., либо Л„). Но правая часть этого равенства есть вероятность досто¬ верного события и потому равна единице; таким образом, для полной системы р(л1)+р(л2)+...+т,ь 1, что и требовалось доказать.
ПОЛНАЯ СИСТЕМА СОБЫТИЙ 21 Пример 1. Из каждых 100 выстрелов по мишени, изображенной на рис. 1 (стр. 16), стрелок дает в среднем 44 попадания в область У, 30 попаданий » » 2, 15 » » » 3, 6 » » » 4У 4 попадания » » 5, 1 попадание » » 6 (44+30+15+6+4+1 = 100). Эти шесть результатов стрель¬ бы составляют, очевидно, полную систему событий. Вероят¬ ности их соответственно равны 0,44; 0,30; 0,15; 0,06; 0,04; 0,01; мы имеем 0,44+0,сЮ+0,15+0,06+0,04+0,01 = 1, Пули, попадающие в область б, полностью или частично вовсе не попадают в мишень и не могут быть подсчитаны; это не мешает, однако, найти вероятность попадания в эту область, для чего достаточно вычесть из единицы сумму вероятностей попадания во все другие области. Пример 2. Статистика показывает, что на некоторой ткацкой фабрике из каждой сотни остановок ткацкого станка, требующих последующей работы ткачихи, в среднем: 22 происходят из-за обрыва нитей основы, 31 » » » » утка, 27 » » смены челнока, 3 » » поломки погонялок, а остальные остановки из-за прочих причин. Мы видим, что кроме прочих причин для остановок станка имеются четыре определенные причины, вероятности которых соответственно равны: 0,22; 0,31; 0,27; 0,03. Сумма этих вероятностей равна 0,83. Вместе с прочими причинами указанные причины остановок станка составляют полную систему событий; поэтому вероятность остановки станка от прочих причин равна 1—0,83 = 0,17.
22 ПРАВИЛО СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ [ГЛ. II § 6. Примеры На установленной нами теореме о полной системе со¬ бытий часто с успехом основывают так называемый «апри¬ орный», т. е. доопытный расчет вероятностей. Пусть, на¬ пример, изучается попадание космических частиц на ма¬ ленькую площадку прямоугольной формы (рис. 2), которая разбита на шесть равных между собой квадратов, занумеро¬ ванных на рисунке. Интересующие нас площадки нахо¬ дятся в одинаковых условиях, и поэтому нет никаких осно¬ ваний предполагать, что на какой-нибудь из этих шести квадратов частицы будут по¬ падать чаще, чем на другой. Мы допускаем поэтому, что в каждый из шести квадратов частицы будут в среднем по¬ падать одинаково часто, т. е. что вероятности р1? р2, р3, р4, р., р6 попадания частиц в эти квадраты равны между собой. Если допустить, что мы инте¬ ресуемся только частицами, которые попадают лишь на эту площадку, то отсюда будет следовать, что каждое из этих чисел р равно 1/6t так как числа эти равны между собой и в сумме дают единицу в силу доказанной нами теоремы. Конечно, этот вывод, основанный на ряде допущений, тре¬ бует для своего подтверждения опытной проверки; однако мы настолько привыкли в подобных случаях к положитель¬ ному исходу опыта, что с полным практическим основанием полагаемся на наши теоретические допущения и до их опыт¬ ной проверки. Обычно в таких случаях говорят, что данная операция может иметь п различных равновероятных между собой результатов (так, в нашем примере попадание косми¬ ческой частицы на площадку, изображенную на рис. 2, может иметь своим результатом попадание в один из шести квадратов). Вероятность каждого отдельного из этих п результатов в таком случае равна Важность такого рода «априор¬ / 2 3 4 5 6 Рис. 2.
ПРИМЕРЫ 23 ных» расчетов заключается в том, что во многих случаях они позволяют предвидеть вероятность события в таких ус¬ ловиях, где постановка массовых операций либо вовсе не¬ возможна, либо чрезвычайно затруднена. Пример 1. В облигациях наших государственных займов номера серий обычно выражаются пятизначными числами. Пусть мы хотим найти вероятность того, что по¬ следняя цифра наудачу взятой выигравшей серии равна 7 (как, например, в серии № 59607). Согласно нашему оп¬ ределению вероятности, мы должны для этого рассмот¬ реть длинный ряд тиражных таблиц и подсчитать, сколько выигравших серий имеют номера, оканчивающиеся цифрой 7; отношение этого числа к общему числу выигравших серий и будет искомою вероятностью. Однако мы имеем все основания полагать, что любая из десяти цифр 0, 1,2, 3, 4, 5, 6, 7, 8, 9 имеет столько же оснований оказаться на по¬ следнем месте в номере выигравшей серии, как и любая другая. Поэтому мы без всяких колебаний высказываем предположение, что искомая вероятность равна 0,1. Вы легко можете проверить правильность этого теоретического «предвидения»; произведите все необходимые подсчеты в пределах какой-нибудь одной тиражной таблицы, и вы убедитесь, что действительно каждая из 10 цифр будет стоять на последнем месте примерно в всех случаев. Пример 2. Телефонная линия, соединяющая два пункта А и В, отстоящих друг от друга на расстоянии 2 км, порвалась в неизвестном месте. Чему равна вероятность того, что она порвалась не далее чем в 450м от пункта Л? Разложив мысленно всю линию на отдельные метры, мы можем, в силу реальной однородности всех этих участков, допустить, что вероятность обрыва одна и та же для каж¬ дого метра. Отсюда, подобно предыдущему, легко находим, что искомая вероятность равна
ГЛАВА ТРЕТЬЯ УСЛОВНЫЕ ВЕРОЯТНОСТИ И ПРАВИЛО УМНОЖЕНИЯ § 7. Понятие условной вероятности Электрические лампочки производятся на двух заводах, причем первый из них поставляет 70%, а второй 30% всей потребляемой продукции. Из каждых ста лампочек первого завода в среднем 83 стандартных *), а из ста лампочек. второго завода — лишь 63 стандартных. Как легко подсчитать из этих данных, в среднем на каждые 100 электрических лампочек, приобретаемых потре¬ бителем, приходится 77 стандартных **), и, следовательно, вероятность купить стандартную лампочку равна 0,77. Но допустим теперь, что мы выяснили, что лампочки, имею¬ щиеся в магазине, изготовлены первым заводом. Тогда вероятность лампочке быть стандартной изменится — она будет равна Рассмотренный пример показывает, что добавление к общим условиям, в которых происходит операция (в на¬ шем примере — покупка лампочки), некоторого существенно нового условия (у нас в примере — выяснения того, каким заводом изготовлена лампочка) может изменить вероятность того или иного исхода единичной операции. Это и понятно: *) Мы станем называть лампочку стандартной (удовлетворяющей стандарту), если она способна прогореть не менее 1200 часов; в против¬ ном случае мы назовем лампочку нестандартной. **)Действительно, 0,83-70 +0,63-30 = 77.
§7] ПОНЯТИЕ УСЛОВНОЙ ВЕРОЯТНОСТИ 25 ведь само определение понятия вероятности требует, чтобы совокупность условий, при которых проводится данная мас¬ совая операция, была точно определена. Присоединяя к этой совокупности какое-либо новое условие, мы, вообще говоря, существенно изменяем эту совокупность. Наша массовая операция проводится после этого уже в новых условиях; фактически, это — уже другая операция, а потому и вероят¬ ность того или иного результата в ней уже не та, что в пер¬ воначальных условиях. Мы имеем, таким образом, две различные вероятности одного и того же события — покупки стандартной лампочки, но эти вероятности рассчитаны в различных условиях: покуда мы не налагаем добавочного условия (не учитываем, где изготовлена лампочка), мы имеем безусловную вероятность покупки стандартной лампочки, равную 0,77; при наложении же добавочного условия (того, что лампочка изготовлена первым заводом) мы получаем условную вероятность 0,83, несколько отличающуюся от предыдущей. Если мы обозна¬ чим через А событие — покупку стандартной лампочки и через В событие — выпуск ее первым заводом, то обычно обозначают через Р(А ) безусловную вероятность события А и через РВ(А) вероятность того же события при условии, что состоялось событие В, т. е. что лампочка выпущена первым заводом. Мы имеем, таким образом, Р (А) = 0,77; РВ(А) = 0,83. Так как о вероятности того или иного результата данной операции можно говорить лишь при некоторых точно опре¬ деленных условиях, то, строго говоря, всякая вероятность есть условная вероятность; безусловных вероятностей в буквальном смысле этого слова существовать не может. Однако в большинстве конкретных задач дело обстоит так, что в основе всех рассматриваемых в данной задаче опера¬ ций лежит некоторая определенная совокупность условий /С, которые предполагаются выполненными для всех операций. Если при вычислении какой-либо вероятности никаких иных условий, кроме совокупности К, не налагается, то такую вероятность мы назовем безусловной; условной же будет называться вероятность, вычисленная в предположении, что, кроме общей для всех операций совокупности условий /(,
26 УСЛОВНЫЕ ВЕРОЯТНОСТИ И ПРАВИЛО УМНОЖЕНИЯ [ГЛ. Ш выполняются еще те или другие, точно оговоренные допол¬ нительные условия. Так, в нашем примере мы предполагаем, конечно, что изготовление лампочки производится при некоторых опре¬ деленных условиях, одних и тех же для всех выпускаемых в продажу лампочек. Это предположение настолько неиз¬ бежно и самоочевидно, что мы в формулировке задачи о нем даже не нашли нужным упомянуть. Если на данную лам¬ почку мы не налагаем никаких дополнительных условий, то вероятность того или другого результата испытания лам¬ почки мы называем безусловной. Если же сверх этих усло¬ вий мы налагаем еще какие-либо дополнительные требова¬ ния, то вычисляемые при этих требованиях вероятности будут уже условными. - Пример 1. В задаче, описанной нами в начале на¬ стоящего параграфа, вероятность выпуска лампочки вторым заводом, очевидно, равна 0,3. Установлено, что лампочка стандартного качества. Какова после этого наблюдения веро¬ ятность того, что эта лампочка изготовлена на втором заводе? Из каждых 1000 выпущенных в продажу лампочек в сред¬ нем 770 лампочек имеют стандартное качество, причем из них 581 лампочка первого завода и 189 лампочек вто¬ рого завода *). После сделанного наблюдения вероятность выпуска лампочки вторым заводом составляет поэтому Это — условная вероятность выпуска лампочки вторым за¬ водом, вычисленная в предположении, что данная лампочка стандартна. В наших прежних обозначениях мы можем на¬ писать Р(В) = 0,3; РА(В)^ 0,245 (событие В обозначает ненаступление события В). *) Это легко подсчитать следующим способом. Из каждых 1000 лам¬ почек 700 в среднем изготовлены первым заводом, а из каждых 100 лам¬ почек первого завода в среднем 83 имеют стандартное качество. Следо¬ вательно, из 700 лампочек первого завода стандартное качество будут иметь в среднем 7-83=581. Остальные 189 лампочек стандартного ка¬ чества изготовлены вторым заводом.
ВЫВОД ПРАВИЛА УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ 27 Пример 2. Производившиеся в некотором районе многолетние наблюдения показали, что из 100 ООО детей, достигших десятилетнего возраста, до 40 лет доживает в среднем 82 277, а до 70 лет — 37 977. Найти вероятность того, что если человек достигнет сорокалетнего возраста, то он доживет и до 70 лет. Так как из 82 277 сорокалетних до 70 лет доживает в среднем 37 977, то вероятность сорокалетнему дожить до семидесяти лет равна 37 977 П /1А 82277^0’46- Если через А и В обозначить события, состоящие: пер¬ вое — в доживании десятилетнего ребенка до 70 лет, а вто¬ рое — в достижении им 40-летнего возраста, то, очевидно, мы имеем Р (А) =0,37977=^0,38; Ря (Л)^0,46. § 8. Вывод правила умножения вероятностей Вернемся к первому примеру предыдущего параграфа. Из каждой 1000 продаваемых лампочек вторым заводом изготовляется в среднем 300 лампочек, а из этих 300 стан¬ дартными оказываются в среднем 189. Отсюда мы получаем, что вероятность изготовления лампочки вторым заводом (событие В) равна Р{В)~тт=о,з, а вероятность ее стандартного качества при условии, что она изготовлена вторым заводом, равна рг<л)"»=0-63- Так как из каждой 1000 лампочек 189 изготовлены вто¬ рым заводом и в то же время имеют стандартное качество, то вероятность совместного наступления событий А и В равна п/л п\ 189 300 189 п/т л / /.ч Р(А и В)-^ ]Ш — то-Ш—Р {В)'Рв{А).
28 УСЛОВНЫЕ ВЕРОЯТНОСТИ И ПРАВИЛО УМНОЖЕНИЯ [ГЛ. III Это «правило умножения» легко распространить и на общий случай. Пусть в каждой серии из п операций результат В наступает в среднем т раз, а в каждой серии из т таких операций, где результат В наблюдался, / раз наступает результат Л. Тогда в каждой серии из п операций совмест¬ ное наступление событий В и А будет наблюдаться в сред¬ нем / раз. Таким образом, Р<8)-~, Р,М)=~, Р(А и В)_±=2-.1=Р(В)-Р,И). (1) Правило умножения. Вероятность совместно¬ го наступления двух событий равна произведению вероят¬ ности первого события на условную вероятность второго, вычисленную в предположении, что первое событие состоя¬ лось. Разумеется, мы можем называть первым любое из двух данных событий, так что на равных основаниях с форму¬ лой (1) можем писать и Р(А и В) = Р(А)-РЛ{В), (Г) откуда получаем важное соотношение Р(А)'РЛ(В) = Р(В)-Рв(А). (2) В нашем примере было Р(Л и £)=що> ^}(^)==Тоо» ^л(^) = 7то» формула (1') подтверждается. Пример. На некотором предприятии 96% изделий признается пригодными (событие Л); из каждой сотни год¬ ных изделий в среднем 75 оказываются первого сорта (событие В). Найти вероятность того, что изделие, из¬ готовленное на этом предприятии, окажется первого сорта. Ищется Р(А и В), так как, для того чтобы изделие было первосортным, надо, чтобы оно было пригодным (со¬ бытие Л) и первого сорта (событие В).
§9] НЕЗАВИСИМЫЕ СОБЫТИЯ 29 В силу условий задачи Р (Л) = 0,96, РА (В) = 0,75. Поэтому на основании формулы (Г) Р(А и Б) =0,96-0,75 = 0,72. § 9. Независимые события При испытании на крепость двух мотков пряжи, изго¬ товленных на разных машинах, оказалось, что для первого мотка образец некоторой длины выдерживает определенную стандартную нагрузку с вероятностью 0,84, а для второго — с вероятностью 0,78 *). Найти вероятность того, что два образца пряжи, взятых с двух разных мотков, оба в со¬ стоянии выдержать стандартную нагрузку. Обозначим через А событие, состоящее в том, что об¬ разец, взятый из первого мотка, выдерживает стандарт¬ ную нагрузку, и через В аналогичное событие для образца из второго мотка. Так как ищется Р(А и В), то мы при¬ меняем правило умножения: Р(А и В) = Р(А)-Ра(В). Здесь, очевидно, Р(Л)=0,84; но что такое РА (В)? Согласно общему определению условных вероятностей, это есть вероятность того, что образец пряжи из второго мотка выдержит стандартную нагрузку, если такую нагрузку выдержал образец из первого мотка. Но вероятность собы¬ тия В не зависит от того, произошло или нет событие Л, хотя бы потому, что эти испытания мы можем произво¬ дить одновременно, а образцы пряжи выбираются из со¬ вершенно различных мотков, изготовленных на разных машинах. Практически это означает, что процент испыта¬ ний, при которых пряжа из второго мотка выдержит стандартную нагрузку, не зависит от того, какой крепости •) Если стандартная нагрузка, скажем, равна 400 граммов, то это означает следующее: из 100 образцов, взятых с первого мотка, в сред¬ нем 84 образца выдерживают такую нагрузку, а 16 не выдерживают и разрываются.
30 УСЛОВНЫЕ ВЕРОЯТНОСТИ И ПРАВИЛО УМНОЖЕНИЯ [ГЛ. III окажется образец из первого мотка, т. е. Рл (B) = P(B)=0J8- отсюда следует, что Р(А и В) = Р (А)-Р (В) = 0У84 • 0,78 = 0,6552. Особенность, отличающая этот пример от всех преды¬ дущих, состоит, как мы видим, в том, что здесь вероятность результата В не изменяется от того, что к общим усло¬ виям мы прибавляем требование, чтобы состоялось собы¬ тие А. Иначе говоря, условная вероятность РА{В) равна безусловной вероятности Р(В). В этом случае мы будем кратко говорить, что событие В не зависит от события А. Легко убедиться, что если В не зависит от Л, то и Л не зависит от В; в самом деле, если РА(В) = Р(В), то в силу формулы (2) и Рв (Л)=Р(Л), а это и значит, что событие А не зависит от события В. Таким образом, независимость двух событий есть свойство взаимное. Мы видим, что для. взаимно независимых событий правило умножения получает особенно простой вид: Р(А и В) = Р(А)-Р(В). (3) Подобно тому как при всяком применении правила сложе¬ ния необходимо предварительно установить взаимную не¬ совместимость данных событий, так и при всяком приме¬ нении правила (3) необходимо убедиться, что события А и В взаимно независимы. Пренебрежение этим указанием приводит к большому числу ошибок. Если события А и В взаимно зависимы, то формула (3) не верна и должна быть заменена более общей формулой (1) или (Г). Правило (3) легко распространяется на случай, когда ищется вероятность наступления не двух, а трех или более взаимно независимых событий. Пусть, например, мы имеем три взаимно независимых события А, В п С (это озна¬ чает, что вероятность каждого из них не зависит от того, наступили или не наступили два других события). Так как события А, В и С взаимно независимы, то по пра¬ вилу (3) Р(А и В и С) = Р(А и В)-Р(С);
НЕЗАВИСИМЫЕ СОБЫТИЯ 31 вставляя же сюда вместо Р(А и В) выражение этой вероят¬ ности из формулы (3), находим: Р(А и В и C) = P(A)-P(B)-P{Q, (4) и ясно, что такое же правило имеет место в случае, когда рассматриваемая группа содержит любое число событий, лишь бы эти события были взаимно независимы (т. е. ве¬ роятность каждого из них не зависела бы от наступления или ненаступления остальных событий). Вероятность совместного наступления любого числа взаимно независимых событий равна произведению вероят¬ ностей этих событий. Пример 1. Рабочий обслуживает три станка. Вероят¬ ность того, что в течение часа станок не потребует вни¬ мания рабочего, равна для первого станка 0,9, для вто¬ рого 0,8 и для третьего 0,85. Найти вероятность того, что в течение некоторого часа ни один станок не потребует к себе внимания рабочего. Считая, что станки работают независимо друг от друга, находим по формуле (4), что искомая вероятность равна 0,9-0,8.0,85 = 0,612. П р и м е р 2. В условиях примера 1 найти вероятность того, что по крайней мере один из трех станков не потре¬ бует внимания рабочего в течение часа. В этой задаче речь идет о вероятности вида Р(А, или В, или С), и поэтому наша мысль прежде всего устрем¬ ляется, конечно, к правилу сложения. Однако мы немед¬ ленно убеждаемся, что это правило в данном случае непри¬ менимо, так как любые два из трех рассматриваемых собы¬ тий совместимы друг с другом (ничто не мешает двум стан¬ кам проработать спокойно в течение одного и того же часа); да и независимо от этого рассуждения мы сразу видим, что сумма трех данных вероятностей значительно превышает единицу и потому вообще никакой вероятностью быть не может. Для решения поставленной задачи мы заметим, что вероятность того, что станок потребует внимания рабочего, равна 0,1 для первого станка, 0,2 для второго и 0,15 для третьего. Так как эти три события взаимно независимы,
32 УСЛОВНЫЕ ВЕРОЯТНОСТИ И ПРАВИЛО УМНОЖЕНИЯ [ГЛ. Ill то вероятность того, что осуществятся все эти три собы¬ тия, по правилу (4) равна 0,1.0,2*0,15 = 0,0003. Но события «все три станка потребуют к себе внимания') и «по крайней мере один из трех проработает спокойно», очевидно, представляют собой пару противоположных собы¬ тий. Поэтому сумма их вероятностей равна единице, и, следо* вательно, искомая вероятность равна 1—0,0003 = 0,9997. Когда вероятность события столь близка к единице, то это событие можно практически считать достоверным. Это озна¬ чает, что почти всегда в течение часа по меньшей мере один из трех станков будет работать спокойно. ПримерЗ. При некоторых определенных условиях ве¬ роятность сбить самолет противника выстрелом из винтовки равна 0,004. Найти вероятность уничтожения неприятель¬ ского самолета при одновременной стрельбе из 250 винтовок. При отдельном выстреле имеется вероятность 1—0,004= =0,996 того, что самолет не будет сбит. Вероятность того, что он не будет сбит при всех 250 выстрелах, равна, по правилу умножения для независимых событий, произведе¬ нию 250 множителей, каждый из которых равен 0,996, т. е. равна (0,996)250. А вероятность того, что по крайней мере один из 250 выстрелов окажется достаточным для того, чтобы сбить самолет, равна поэтому 1 — (0,996)230. Подробный расчет, который мы здесь приводить не будем, показывает, что это число приблизительно равно Таким образом, хотя вероятность сбить вражеский самолет одним винтовочным выстрелом и ничтожно мала (0,004), но при одновременной стрельбе из большого числа винтовок ве¬ роятность полезного результата становится уже весьма зна¬ чительной. То рассуждение, которым мы пользовались в двух по¬ следних примерах, легко может быть обобщено и приводит к важному общему правилу. В обоих случаях речь шла о вероятности P(Ai, или Л2, или ..., или Ап) наступления по меньшей мере одного из нескольких взаимно независимых
НЕЗАВИСИМЫЕ СОБЫТИЯ 33 событий Аи А2, . . Ап. Если мы обозначим через Ak событие, состоящее в том, что Ak не наступает, то события Ak п Ак взаимно противоположны, так что Р(АЛ)+Р(АЛ)= 1. С другой стороны, события Ai, Л 2, ..., Ап, очевидно, взаим¬ но независимы, так что P(AV и Av и..., и ~Ап) — Р (А х) • Р (А2).., Р(Ап) = = ll-P{Al)b\l-P(A,)]....-[l-P(An)]. Наконец, события (Av или Л2, или ..., или Ап) и (Av и А2, и..., и /4М), очевидно, противоположны друг к другу (одно из двух: либо наступает по меньшей мере одно из собы¬ тий Ак, либо наступают все события Ak). Поэтому P(Alt или А2> или..., или Ап) = = 1 — P(Alt и Аг, и .и !„) = = 1_[1_Р(Л1)].[1_Р(Л2)]...[1-Р(Л„)]. (5) Эта важная формула, позволяющая вычислить вероятность наступления по меньшей мере одного из событий Av Л2,..., Ап по данным вероятностям этих событий, верна тогда и только тогда, когда эти события взаимно независимы. В частном случае, когда все события Ak имеют одну и ту же вероятность р (как мы это имели в примере 3), Р(АХу или Л2, или ..или Лп) = 1 — (1—р)п. (6) П р и м е р 4. Вытачивается деталь прибора в виде прямоугольного параллелепипеда. Деталь считается удач¬ ной, если длина каждого из ее ребер отклоняется от задан¬ ных размеров не более чем на 0,01 мм. Вероятность откло¬ нений, превышающих 0,01 мм, составляет по длине р1==0,08, по ширине р2 = 0,12, по высоте = 0,1; найти вероятность Р непригодности детали.
34 УСЛОВНЫЕ ВЕРОЯТНОСТИ И ПРАВИЛО УМНОЖЕНИЯ [ГЛ. III Для того чтобы деталь оказалась неудачной, нужно по крайней мере в одном направлении иметь уклонение от за¬ данного размера, превышающее 0,01 мм\ так как обычно эти три события могут считаться взаимно независимыми (ибо они в основном вызываются различными причинами), то для решения задачи мы можем применить формулу (5); это дает P=l-(l-Pl).(l-p2).(l-p3)^0,27; мы можем, следовательно, рассчитывать, что удачными из каждых 100 деталей окажутся в среднем 73.
ГЛАВА ЧЕТВЕРТАЯ СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ § 10. Вывод некоторых неравенств Вернемся снова к примеру с лампочками из предыдущей главы (стр. 24). Введем следующие обозначения событий: А — лампочка стандартного качества, А — лампочка нестандартного качества, В — лампочка изготовлена первым заводом, В — лампочка изготовлена вторым заводом. Очевидно, события А и А составляют пару противопо¬ ложных событий; такую же пару составляют события В и В. Если лампочка стандартна (Л), то либо она изготовлена первым предприятием (А и В), либо вторым (А и В); так как два последних события, очевидно, несовместимы друг с другом, то по правилу сложения Р(А) = Р(А и B)i-P(A и В), (1) Тем же путем мы находим: Р (В) = Р (А и Б)-[ Р(А и В). (2) Наконец, рассмотрим событие (А или Б); для его насту, пления имеются, очевидно, следующие три возможности: 1) Л и Б, 2) Л и Б, 3) Л и Б; из этих трех возможностей любые две несовместимы друг
36 СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ [ГЛ. IV с другом; поэтому по теореме сложения Р(А или В) = Р(Л и В) + Р(Л и В)+Р(А и В). (3) Складывая почленно равенства (1) и (2) и учитывая равен¬ ство (3), мы легко находим: Р(А) + Р(В) = Р(А и В) + Р(Л или В), откуда Р(А или В) = Р(А) + Р(В) — Р(А и В). (4) Мы пришли к очень важному результату; при этом, хотя мы и вели рассуждение для частного примера, оно было столь общим, что вывод может считаться установленным для любой пары событий А и В. До сих пор мы получали выражения для вероятности Р(А или В) только при весьма частных предположениях относительно связи между собы¬ тиями А кВ (мы предполагали их сначала несовместимыми, а потом — независимыми между собою). Формула (4), кото¬ рую мы получили теперь, имеет место без всяких дополни¬ тельных предположений для любой пары событий А к В. Правда, мы не должны забывать одного существенного раз¬ личия между формулой (4) и нашими прежними формулами. В прежних формулах вероятность Р(А или В) всегда вы¬ ражалась через одни только вероятности Р(Л) и Р(В), так что, зная вероятности событий Л и В, мы всегда могли однозначно определить вероятность события (Л или В). В формуле (4) дело обстоит иначе: для вычисления по ней величины Р(А или В) необходимо кроме Р(Л) и Р(В) знать еще Р(А и В), т. е. вероятность совместного на¬ ступления событий Л и В; найти же эту вероятность в об¬ щем случае, т. е. при произвольной связи между событиями Л и В, бывает обычно не легче, чем найти Р(Л или В); поэтому для непосредственных практических расчетов фор¬ мулой (4) пользоваться приходится редко, но теоретическое значение ее очень велико. Убедимся прежде всего, что из формулы (4) в качестве частных случаев легко могут быть получены наши преж¬ ние формулы. Если события Л и В несовместимы друг с другом, то событие (Л и В) невозможно, Р(Л и В)=0,
§ 11] ФОРМУЛА ПОЛКОЙ ВЕРОЯТНОСТИ 37 и формула (4) приводит к соотношению Р(А или В) = Р(А)+ Р{В), т. е. к правилу сложения. Если события А я В взаимно не¬ зависимы, то по формуле (3) на стр. 30 Р(А и В) = Р(А)-Р(В), и формула (4) дает Р(А или В) = Р(А) + Р(В) — Р{А)-Р(В) = = 1_ [1— Р(Л)].[1— Р(В)], т. е. формулу (5) на стр. 33 (для случая п=2). Далее, выведем из формулы (4) одно важное следствие. Так как во всех случаях Р(А иВ)^0, то из формулы (4) во всех случаях следует Р(А или В)^Р{А) + Р{В). (5) Это неравенство легко может быть распространено на лю¬ бое число событий. Так, например, в случае трех событий, в силу (5), Р (А, или В, или С) ^ Р (А или 23) + Р (С) ^ <Р(Л)+Р(В) + Р(С), и тем же путем, очевидно, можно от трех событий перейти к четырем и т. д. Получаем общий результат. Вероятность наступления по меньшей мере одного из нескольких событий никогда не превышает суммы вероят¬ ностей этих событий. При этом знак равенства имеет место только в том случае, когда любые два из данных событий несовместимы между собой. § 11, Формула полной вероятности Вернемся еще раз к примеру с лампочками на стр. 24 и будем пользоваться для различных результатов испытания обозначениями, введенными на стр. 35. Вероятность стан¬ дартного качества лампочки при условии, что она изго¬
38 СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ [ГЛ. IV товлена вторым заводом, равна, как мы видели уже не раз, вероятность того же события при условии, чтр лампочка изготовлена первым заводом, составляет Рв(Л)= ^ = 0,83. Допустим, что эти два числа нам известны и что известны также вероятности изготовления лампочки первым заводом Р (В) = 0,7 и вторым Р(В) = 0,3. Требуется найти безусловную вероятность Р(Л), т. е. вероятность стандартности отдельной лампочки, вычислен¬ ную без всяких предположений о месте ее изготовления. Чтобы решить эту задачу, будем рассуждать так. Обо¬ значим через Е двойное событие, состоящее в том, что 1) лампочка выпущена первым заводом и 2) она стандартна, а через F — такое же событие для второго завода. Так как всякая стандартная лампочка изготовлена первым или вто¬ рым заводом, то событие А равносильно событию «Е или F», а так как события Е и F друг с другом несовместимы, то по правилу сложения P(A) = P(E) + P(F). (6) С другой стороны, чтобы имело место событие Еу надо, чтобы 1) лампочка была изготовлена первым заводом (В) и 2) чтобы она была стандартна (Л); поэтому событие Ё равносильно событию «5 и Л», откуда по правилу умно¬ жения Р(Е)-Р(В).РВ(А). Совершенно тем же путем находим: P(F) = P(B)-Pg(A), а подставляя эти выражения в равенство (6): Р {А) = Р(В) ■ Рв (А) + Р (В) • РЪ{А).
§ 11] ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ 39 Эта формула и решает поставленную нами задачу. Под¬ ставляя данные числа, находим Р(А)=0,77. Пример. Для посева заготовлены семена пшеницы сорта I, содержащие небольшое количество примесей дру¬ гих сортов— II, III, IV. Возьмем одно из этих зерен. Со¬ бытие, состоящее в том, что это зерно сорта I, обозна¬ чим через Аг, что оно сорта II — через Л2, сорта III через As и, наконец, сорта IV—через Л4. Известно, что вероятности того, что наудачу взятое зерно окажется того или иного сорта, равны Р(Л1) = 0,96; Р(А2) = 0,01; Р(А3) = 0,02; Я(Л4)=0,01. (Сумма этих четырех чисел равна единице, как это и должно быть для полной системы событий.) Вероятность того, что из зерна вырастет колос, содер¬ жащий не менее 50 зерен, равна: 1) 0,50 из зерна сорта I, 2) 0,15 » » » II, 3) 0,20 » » » III, 4) 0,05 » » » IV. Требуется найти безусловную вероятность того, что колос будет иметь не менее 50 зерен. Пусть К — событие, состоящее в том, что колос будет содержать не менее 50 зерен; тогда по условию задачи PAi(K)= 0,50; РАщ{К) = 0,15; РАл(К) = 0,20; PAi (/С) = 0,05. Нашей задачей является определение Р(К). Обозначим через Ei событие, состоящее в том, что зерно окажется сорта I и колос, выращенный из него, будет содержать не менее 50 зерен, так что Ei равносильно событию (А г и /С); подобным же образом обозначим через Е9 — событие (Л2 и /О, » Еъ— » (Л3 и К), » Еа— » (Л4 и К). Очевидно, что для наступления события К необходимо, чтобы наступило одно из событий Ev Е2, Es, £4, а так
40 СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ [ГЛ. IV как любые два из этих событий друг с другом несовме¬ стимы, то по правилу сложения получаем: Р (K) = P(El) + P (Е2)+Р (Е3)+Р (EJ. (!) С другой стороны, по правилу умножения, P(Ei) = P(Al и K) = P(A3).PAi(K), Р(£2) = Я(Л2 и К) = Р(А2) РА2(К), Р(Е3)=Р(А3 и К) = Р(А3)-РАл(К), P(Et) = P(At и K) = P(AJ.pAt(K). Вставляя эти выражения в равенство (7), мы находим: Р (К) = Р (A J • PAi (К)+Р (А2) - р/ш (/<) + + Р(А3)-РЛ'ХК)-\-Р(Аа)-РЛ1(К), что и решает, очевидно, нашу задачу. Подставляя данные числа, находим: Я (/0 = 0,486. Два примера, которые мы здесь подробно рассмотрели, приводят нас к важному общему правилу; мы можем теперь сформулировать и доказать его без всяких затруднений. Пусть данная операция допускает результаты Av А2, ..., Ап, образующие полную систему событий (напомним: это означает, что любые два из этих событий друг с другом не¬ совместимы и что какое-нибудь из них обязательно должно наступить). Тогда для любого возможного результата К этой операции имеет место соотношение PW=P{AxypAi (/()+ Ч р (А 2)• РАз (К) +... + Р(Ап).рАя(К). (8) Это правило (8) обычно называют формулой полной ве¬ роятности. Доказательство его проводится в точности так же, как в двух рассмотренных нами примерах; во-пер¬ вых, наступление события К требует наступления одного из событий «А( и К», так что по правилу сложения P(K)=±P(Ag и К); (9) i=i
§ 12] ФОРМУЛА БЕЙЕСА 41 во-вторых, по правилу умножения, P(At и K) = P(Ai)-PAi (К)) вставляя эти выражения в равенство (9), мы и приходим к формуле (8). Формулы предыдущего параграфа позволяют нам вы¬ вести один важный результат, имеющий многочисленные приложения. Мы начнем с формального вывода, отложив выяснение реального смысла окончательной формулы до рассмотрения примеров. Пусть снова события Av А2, ..., Ап представляют собой полную систему результатов некоторой операции. Если тогда К означает произвольный результат этой операции, то по правилу умножения Р(А{ и K) = P(Ai)-PAi(K) = P(K)-PK(Ai) (1 или, выражая знаменатель полученной дроби по формуле полной вероятности (8) предыдущего параграфа, Это — формула Бейеса, имеющая много приложений в прак¬ тике вычисления вероятностей. Чаще всего приходится при¬ менять ее в положениях, которые иллюстрируются следую¬ щим примером. Пусть стрельба ведется по цели, расположенной на прямолинейном участке MN (рис. 3), который мы мы¬ сленно разбили на пять небольших участков, а, Ь\ Ь\ с', с\ § 12. Формула Бейеса откуда М N с // г а У Рис. 3.
42 СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ [ГЛ. IV Допустим, что точное местоположение цели нам неизвестно; мы знаем только вероятности того, что цель лежит на том или другом из наших пяти участков; пусть эти вероятности равны Р {а) = 0,48; Р (Ь') = Р (У) = 0,21; Р (с) = Р (с) = 0,05, где через а, Ь\ Ь", с , с обозначены следующие события: цель находится в отрезке а, Ь', Ь\ с\ с (сумма этих чисел равна единице). Наибольшая вероятность соответствует отрезку а, куда мы поэтому, естественно, и направляем наш выстрел. Однако из-за неизбежных ошибок стрельбы цель может оказаться пораженной и тогда, когда она находится не в а, а в каком-либо из других отрезков. Пусть вероят¬ ность поражения цели (события К) составляет: Ра (7\) = 0.56, если цель лежит в отрезке а, РЬ'{К) = 0,18, /V (/<) = 0,16, /V (Ю =0,06, РС" (/0 = 0,02, » » » » bf, » » » » Ь" у » » » » С' у » » » » d\ Допустим, что выстрел произведен и цель оказалась по¬ раженной (состоялось событие К). В результате этого веро¬ ятности различных положений цели, которые мы имели раньше [т. е. числа Я(а), Р(Ь')9 .. .], подвергаются пере¬ оценке; качественная сторона этой переоценки ясна без всяких вычислений; мы стреляли по отрезку а и попали в цель — ясно, что вероятность Р(а) при этом должна уве¬ личиться; но мы хотим точно количественно учесть произ¬ веденную нашим выстрелом переоценку, т. е. мы хотим найти точное выражение вероятностей Рк(а)у PK(b')f ... различных возможных положений цели при условии, что произведенным выстрелом цель была поражена. Формула Бсйеса (10) сразу дает нам ответ на этот вопрос: р (п\ Р (а)‘Ра (К) о. r^U) PW-PaiK)+P(b').pt,VU+ 9 9 +Р (Ь")-Р0„ (Ю+Р (С‘)-Рс, {К)+Р (с")-Рс„(К) мы видим, что Рк(а) действительно больше, чем Р(а). Подобным же образом легко находим и вероятности РК(Ь'), ... других положений цели. Для вычисления полез¬
ФОРМУЛА БЕЙЕСА 43 но заметить, что выражения, даваемые для этих вероятно¬ стей формулой Бейеса, отличаются друг от друга только своими числителями; знаменатель же у них один и тот же; он равен Р(К)ъ0,34. Общая схема подобного рода положений может быть описана так. Условия операции содержат некоторый неиз¬ вестный элемент, относительно которого может быть сде¬ лано п различных «гипотез»: Л,, Л2, Ап> образующих полную систему событий; по тем или другим причинам нам известны вероятности Р(А() этих гипотез до испытания; известно также, что гипотеза Л/ «сообщает» некоторому событию К (например, попаданию в цель) вероятность РаW) есть вероятность события К, вычисленная при условии, что справедлива гипотеза Л/]. Если в результате опыта событие К наступило, то это вызы¬ вает переоценку вероятностей гипотез А{ и задача состоит в том, чтобы найти новые вероятности PK{At) этих гипотез; ответ дается формулой Бейеса. В артиллерийской практике производится так называе¬ мая пристрелка, имеющая целью уточнить наши знания об условиях стрельбы. При этом неизвестным элементом, требующим уточнения, может служить не только положение цели, но и любой другой элемент условий стрельбы, влияю¬ щий на ее эффективность (в частности, та или другая осо¬ бенность употребляемого оружия). Очень часто бывает, что таких пробных выстрелов про¬ изводится не один, а несколько, и ставится задача о вычи¬ слении новых вероятностей гипотез на основе полученных результатов стрельбы. Во всех таких случаях формула Бейеса также легко решает поставленную задачу. Для сокращения записи положим в рассмотренной нами общей схеме Р(А£) = Р£, РаЛК)=р£ (1 </<м), так что формула Бейеса получает простой вид PkW = -tLiEl-- Допустим, что произведено s пробных выстрелов, причем
44 СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ [ГЛ. IV результат К наступил т раз и не наступил s — траз. Обо¬ значим через К* полученный результат серии из s выстре¬ лов. Мы можем допустить, что результаты отдельных вы¬ стрелов представляют собой взаимно независимые события. Если справедлива гипотеза А(, вероятность .результата К равна pt и, значит, вероятность противоположного события (т. е. того, что К не наступит) равна 1—р{. Вероятность того, что результат К наступил при опре¬ деленных т выстрелах, по правилу умножения для незави¬ симых событий равна рТ(1—Pi)s~m. Так как эти т выстре¬ лов, при которых наступил результат К, могут оказаться любыми из s произведенных, то событие К* может осуще¬ ствиться С™ несовместимыми способами. Таким образом, по правилу сложения вероятностей РА. (к*)=с?р? (1 -Piy~* (1 <; <n)f и формула Бейеса дает: (Л,.) = -/'рГ(1 ~-Pif т (1 < i < п), (11) 2v?<i-Pr)*-“ г—1 что и решает поставленную задачу. Понятно, что подобные задачи возникают не только в практике артиллериста, но и в других областях человеческой деятельности. П р и м е р 1. В задаче, рассмотренной нами в начале настоящего параграфа, найти вероятность того, что цель лежит в отрезке а, если два последовательных выстрела по этому отрезку дали попадание. Обозначая через /(* двукратное попадание в цель, мы имеем, согласно формуле (И): Ркг (а) Р_ШРд(К)i2 . ^ w Р {а). [Ра(К)]2+Р (Ь') ■ [Р v (К) ]2+... ’ мы предоставляем читателю произвести несложный расчет и убедиться, что в результате двукратного попадания вероятность того, что цель расположена в отрезке а, еще более увеличилась. Пр имер 2. Вероятность того, что в некотором произ¬ водстве изделие удовлетворяет стандарту, равна 0,96. Пред¬
ФОРМУЛА БЕЙЕСА 45 лагается упрощенная система испытаний *), которая для изделий, удовлетворяющих стандарту, дает положительный результат с вероятностью 0,98, а для изделий, ему не удо¬ влетворяющих,— лишь с вероятностью 0,05. Какова вероят¬ ность, что изделие, дважды выдержавшее упрощенное ис¬ пытание, удовлетворяет стандарту? Здесь полная система гипотез состоит из двух противо¬ положных событий: 1) изделие удовлетворяет стандарту, 2) изделие не удовлетворяет стандарту. Вероятности этих ги¬ потез до опыта соответственно равны Рг=0>96 и Р2= 0,04. При первой гипотезе вероятность того, что изделие выдер¬ жит испытание, равна /^=0,98, а при второй р2=0,05. После двукратного опыта вероятность первой гипотезы на основании формулы (11) равна Ргр] 0,96.(0,98)* _ 0 qqqq piP2_|_P2p2 0,96• (0,98)2+0,04• (0,05)2 ^ Мы видим, что если изделие выдержало указанное в усло¬ вии задачи испытание, то только в одном случае из десяти тысяч мы можем совершить ошибку, считая его стандарт¬ ным. Это, конечно, вполне удовлетворяет требованиям практики. Пример 3. При исследовании больного имеется подо¬ зрение на одно из трех заболеваний: Av Л2, А3. Их вероят¬ ности в данных условиях равны соответственно Для уточнения диагноза назначен некоторый анализ, даю¬ щий положительный результат с вероятностью 0,1 в случае заболевания Ас вероятностью 0,2 в случае заболевания А2 и с вероятностью 0,9 в случае заболевания А3. Анализ был произведен пять раз и дал четыре раза положительный *) Необходимость в упрощенном контроле встречается на практике весьма часто. Например, если бы при выпуске в свет электрических лам¬ почек все они подвергались проверке на способность их горения в те¬ чение не менее чем, скажем, 1200 часов, то потребитель получал бы лишь одни перегоревшие или почти перегоревшие лампочки. Приходится испытание на срок горения заменить другим испытанием, например проверкой лампочки на зажигаемость*
46 СЛЕДСТВИЯ ПРАВИЛ СЛОЖЕНИЯ И УМНОЖЕНИЯ [ГЛ. IV результат и один раз отрицательный. Требуется найти вероятность каждого заболевания после анализа. В случае заболевания А1 вероятность указанных исходов анализов равна, по правилу умножения, p,=CJ(0,1)4-0,9. Для второй гипотезы эта вероятность равна р2==С4 (0,2)4-0,8 и для третьей — p3=C4s(0,9)4-0,1. По формуле Бейеса находим, что после анализов вероят¬ ность заболевания Ах оказывается равной Л Pi Р iP i")r Р 2Р2 Ь^зРз 4-- (0,1)4-0.9 г i ^0,002; Г(0,1)4-0,9+Г • (0,2)4-0,8+j • (0,9)4-0.1 вероятность заболевания А 2 — РгРг 6 Р 1Р|Т“^2Р2+^ЗРЗ j . /П П4.ПО I 1 =0,01 2 (0,1)4.0,9 + ^-(0,2)4-0,8 + ^ • (0,9)4-0,1 и вероятность заболевания А3— PsPs PiPi + P2P2+PsP3~ 4-1 (0,9)4-0,1 13 ^0,988, ~ • (0,1)4-0,9 + i. . (0,2)4-0,8 + 1 . (0,9)4*0,1 Так как эти три события Av Л2, А3 и после опыта обра¬ зуют, очевидно, полную систему событий, то для контроля произведенного расчета можно сложить три полученных числа и убедиться, что сумма их по-прежнему равна единице.
ГЛАВА ПЯТАЯ СХЕМА БЕРНУЛЛИ § 13. Примеры Пример 1. Среди волокон хлопка определенного сорта в среднем 75% имеют длину, меньшую чем 45 мм, и 25% — длину, большую (или равную) 45 мм. Найти вероят¬ ность того, что среди трех наудачу взятых волокон два будут короче, а одно длиннее 45 мм. Обозначим событие — выбор волокна с длиной, меньшей 45 мм у—через Л, а событие — выбор волокна с длиной, большей 45 мм у— через В\ тогда ясно, что Р(Л)=4; Р(В) = 1. Условимся далее схемой ААВ обозначать сложное собы¬ тие: два первых выбранных волокна оказались короче 45 мм, а третье длиннее 45 мм. Ясно, какое значение будут иметь схемы ВВА, АВА и т. п. Наша задача состоит в вычислении вероятности события С, состоящего в том, что из трех воло¬ кон два окажутся короче 45 мм, а одно длиннее 45 мм. Очевидно, для этого должна осуществиться одна из следую¬ щих схем: ААВ, ABA, BAA. (1) Так как любые два из этих трех результатов несовме¬ стимы между собой, то по правилу сложения р (С) = Р (ААВ) + Р (АВА) + Р (ВАА). Все три слагаемых правой части равны между собой, так как результаты выбора волокон мы можем считать взаимно
48 СХЕМА БЕРНУЛЛИ [ГЛ. V независимыми событиями. Вероятность каждой из схем (1) по правилу умножения вероятностей для независимых событий представится как произведение трех множителей, из кото¬ рых два равны Р(А)=3/4, а один — Р(Б) = 1/4. Таким образом, вероятность каждой из трех схем (1) равна /з\« J__jL V 4 ) * 4 “64 1 и, следовательно, что и решает поставленную задачу. Пример 2. В результате наблюдений, продолжав¬ шихся многие десятки лет, найдено, что из каждой тысячи новорожденных в среднем рождается 515 мальчиков и 485 девочек. В некоторой семье шестеро детей. Найти вероят¬ ность того, что среди них не больше двух девочек. Для наступления события, вероятность которого мы ищем, надо, чтобы в семье было либо 0, либо 1, либо 2 де¬ вочки. Вероятности этих частных событий мы обозначим соответственно через Р0, Pv Р£. Очевидно, что по правилу сложения вероятностей искомая вероятность Р = Р. + Рг + Рш- V) Для каждого ребенка вероятность того, что это мальчик, равна 0,515 и, значит, вероятность того, что это девочка, равна 0,485, Проще всего найти Р0; это — вероятность того, что все дети в семье оказались мальчиками. Так как событие — рождение ребенка того или другого пола — мы можем рас¬ сматривать как независимое от рождения остальных детей, то по правилу умножения вероятность того, что все шесть детей окажутся мальчиками, равна произведению шести множителей, равных 0,515, т. е. Ро = (0,515)в^г0,018. Перейдем теперь к вычислению Pv т. е. вероятности того, что среди шести детей в семье один ребенок окажется девочкой, а остальные пять — мальчиками. Это событие может произойти шестью различными способами, смотря по
ПРИМЕРЫ 49 тому, которым ребенком по порядку рождений окажется девочка (первым, вторым и т. д.). Рассмотрим какую-нибудь из разновидностей нашего события, например ту, что девочка родилась четвертым ребенком. Вероятность этой разновид¬ ности по правилу умножения равна произведению шести множителей, из которых пять равны 0,515, а шестой (стоя¬ щий на четвертом месте) равен 0,485, т. е. эта вероятность равна (0,515)3 *0,485. Такова же вероятность и всякой другой из пяти возможных разновидностей интересую¬ щего нас события; поэтому вероятность Рх этого события по правилу сложения равна сумме шести чисел, равных (0,515)3* 0,485, т. е. /\ = 6*(0,515)5*0,485=^0,105. Обращаемся теперь к вычислению Р2 (вероятность того, что два ребенка окажутся девочками, а четыре — маль¬ чиками). Подобно предыдущему, мы сразу замечаем, что событие это допускает целый ряд разновидностей (одной из разновидностей будет, например, такая: второй и пятый ребенок по порядку рождений оказались девочками, а остальные — мальчиками). Вероятность каждой разно¬ видности по правилу умножения равна (0,515)4*(0,485)2, а следовательно, Р2 по правилу сложения равно числу (0,515)4*(0,485)2, умноженному на число всех разновид¬ ностей рассматриваемого типа; к определению этого послед¬ него числа и сводится, таким образом, вся задача. Каждая разновидность характеризуется тем, что из шести детей двое оказываются девочками, а остальные — мальчиками; число различных разновидностей равно, сле¬ довательно, числу различных способов выбора двух детей из шести имеющихся. Число таких выборов равно числу сочетаний из шести предметов по два, т. е. С1=й=15. Таким образом, ^2= Се * (0,515)4 • (0,485)2= 15 • (0,515)4 • (0,485)2 =^0,247. Сопоставляя полученные результаты, находим: р = ро+р1+р2^0,018+0,105+0,247=0,370. 3 Б. В. Гнеденко и А. Я. Хинчин
50 СХЕМА БЕРНУЛЛИ [ГЛ. V Таким образом, немного реже, чем в четырех случаях из десяти (с вероятностью Р ^ 0,37), в таких многодетных семьях будет не более трети девочек и, значит, не менее двух третей мальчиков. § 14. Формулы Бернулли В предыдущем параграфе мы познакомились на ряде примеров со схемой повторения испытаний, в каждом из которых может осуществляться некоторое событие А. В сло¬ во «испытание» мы вкладываем весьма богатый и разнооб¬ разный смысл. Так, если мы производим стрельбу по неко¬ торой цели, то под испытанием мы будем разуметь каждый отдельный выстрел. Если мы испытываем электрические лам¬ почки на длительность горения, то под испытанием станем понимать испытание каждой лампочки. Если мы изучаем состав новорожденных по полу, весу или росту, то под испы¬ танием станем понимать обследование отдельного младенца. Вообще под испытанием мы будем понимать в дальней¬ шем осуществление некоторых условий, при наличии кото¬ рых может наступить некоторое интересующее нас событие. Мы приступили теперь к рассмотрению одной из глав¬ ных схем теории вероятностей, имеющей, помимо приклад¬ ного значения в разнообразных областях знания, большое значение и в самой теории вероятностей, как математиче¬ ской науке. Эта схема состоит в том, что рассматривается последовательность взаимно независимых испытаний, т. е. таких испытаний, что вероятность того или иного резуль¬ тата в каждом из них не зависит от того, какие результаты наступили или наступят в остальных. В каждом из этих испытаний может наступить (или не наступить) некоторое событие А с вероятностью р, не зависящей от номера испы¬ тания. Описанная схема получила название схемы Бернулли: ее изучение ведет свое начало от известного швейцарского ученого Якова Бернулли, жившего в конце XVII века. Мы уже имели дело со схемой Бернулли на примерах; чтобы убедиться в этом, достаточно вспомнить примеры пре¬ дыдущего параграфа. Теперь же мы решим следующую общую задачу, частными случаями которой были все при¬ меры, рассмотренные нами до сих пор в этой главе.
§ 14] ФОРМУЛЫ БЕРНУЛЛИ 51 Задача. При некоторых условиях вероятность появле¬ ния события А в каждом испытании равна р; найти вероят¬ ность того, что серия из п независимых испытаний даст k появлений и п—k непоявлений события А. Событие, вероятность которого ищется, распадается на ряд разновидностей; для получения одной определенной разновидности мы должны произвольным образом выбрать из данной серии какие-нибудь k испытаний и допустить, что именно при этих k испытаниях произошло событие Л, а при остальных п—k оно не произошло. Таким образом, каждая такая разновидность требует наступления п опре¬ деленных результатов, в том числе k появлений и п—k непоявлений события А\ мы получаем по правилу умно¬ жения, что вероятность каждой определенной разновид¬ ности равна число различных возможных разновидностей равно числу различных групп по k испытаний в каждой, которые можно составить из п испытаний, т. е. равно С)г. Применяя пра¬ вило сложения и известную формулу для числа сочетаний rk _п (л — 1).. .(п —{k — 1)) k (k — I).. .2 -1 мы находим, что искомая вероятность k появлений события А при п независимых испытаниях равна рп (*) =Я(Я1(1-‘1)Я~27Г—}Р* 0 -РУ'~‘*’ <3> что и решает поставленную задачу. Часто бывает более удобно представлять выражение Сп в несколько ином виде; умножая числитель и знаменатель на произведение (n—k)(n—(k+1))...2• 1, мы получаем: п(п — 1). . .2* 1 Ln== к{к-\)...2Л'(п — kj{n-(k+ 1)).. .2 1 ’ или, обозначая для краткости через т\ произведение всех целых чисел от 1 до т включительно, rk п\ k\ (n — k)l ’ 3*
52 СХЕМА БЕРНУЛЛИ [ГЛ. V для Рп (k) это дает: ^/(1-р)"-*. (4) Формулы (3) и (4) обычно называют формулами Бернулли. При больших значениях п yl k вычисление Pn(k) по этим формулам затруднительно, так как факториалы n!, klt (п—k)\ — очень большие и громоздко вычисляемые числа. Поэтому при вычислениях этого рода широко пользуются как специально составленными для факториалов таблица¬ ми, так и некоторыми приближенными формулами. Пример. Вероятность того, что расход воды на неко¬ тором предприятии окажется нормальным (не больше опре- з деленного числа литров в сутки), равна—. Найти вероят¬ ности того, что в ближайшие 6 дней расход воды будет нор¬ мальным в течение 0, 1,2, 3, 4, 5, 6 дней. Обозначив через P6(k) вероятность того, что в течение k дней из шести расход воды будет нормальным, найдем з по формуле (3) (где надо положить р =х) Р* Рй{ 5) = 6. D !Л\ г* (3 (1 V г* 34 6'5 З4 15-3‘ Л(4) = Св • т х) =С*т=г в \ v we \ 4 / V 4 ) в 46 2* 1 46 46 З3 20-33 4 в 4» » pe(3)=c:.(4j РЛ 1)=6.|-.(1),=^; наконец, очевидно, Р6(0) (вероятность каждый день из 6 иметь перерасход) составляет Все шесть вероятностей выражаются дробями с одним и тем же знаменателем 4Ь =4096; этим мы, конечно, пользуемся для сокращения расчетов. Вычисления дают: Р6 (6)^0,18; PG (5)^0,36; Рй (4)^0,30; о:ч- р
§ 15) НАИВЕРОЯТНЕЙШЕЕ ЧИСЛО НАСТУПЛЕНИЙ СОБЫТИЯ 53 Мы видим, что наиболее вероятен перерасход воды в те¬ чение одного или двух дней из шести и что вероятность перерасхода в течение пяти или шести дней [Рв(1)+^в(0)] практически равна нулю. § 15. Наивероятнейшее число наступлений события Пример, который мы только что рассмотрели, показы¬ вает, что вероятность нормального расхода воды в течение ровно k дней с ростом числа k сначала возрастает, а затем, достигнув своего наибольшего значения, начинает убывать; яснее всего это видно, если изменение вероятности P6(k) с ростом числа k изобразить геометрически, в виде диа¬ граммы, изображенной на рис. 4. Еще более яркую картину дают диаграммы изменения ве¬ личины Pn(k) с ростом k, когда число п становится больше; так, при п=15 и Р=\ диаграмма имеет вид, изобра¬ женный на рис. 5. Для практики иногда требуется знать, какое число на¬ ступлений события является наивероятнейшим, т. е. при каком числе k вероятность Pn{k) наибольшая (при этом, конечно, р и п предполагаются заданными). Формулы Бернулли позволяют во всех случаях най¬ ти простое решение этого вопроса; этим мы теперь и зай¬ мемся.
56 СХЕМА БЕРНУЛЛИ [ГЛ. V с другой стороны, для чего, по предыдущему, должно иметь место неравенство А,—Клр —(1—р) ИЛИ £0<пр —(1 — р) + 1=пр+р. Таким образом, наивероятнейшее значение 60 числа k должно удовлетворять двойному неравенству пр — (1 — р) < k0 < пр+р; (7) промежуток от пр—(1 — р) до пр+р, в котором должно, таким образом, лежать число kQ, имеет величину 1, как показывает простое вычитание; поэтому если какой-либо из концов этого промежутка, например число пр — (1 — р), не есть целое число, то между этими концами будет обя¬ зательно лежать одно и только одно целое число и k0 будет однозначно определено. Этот случай мы должны рассматри* вать как нормальный: ведь р < 1, и потому лишь в исключи¬ тельных случаях величина пр — (1 — р) будет целым числом. В этом исключительном случае неравенства (7) дают для чис¬ ла k0 два значения: пр — (1 — р) и пр + р, отличающиеся друг от друга на единицу; эти два значения и будут наивероят¬ нейшими; их вероятности равны между собою и превышают вероятности всех других значений числа k. Именно этот исключительный случай имеет место, например, в схеме, изображенной диаграммой на рис. 5; здесь п=15, р=у и, значит, пр — (1—р)=7, пр + р=8; наиболее вероятными зна¬ чениями числа k наступлений события служат числа 7 и 8; их вероятности равны между собою, каждая из них прибли¬ женно равна 0,196 (все это можно видеть на диаграмме). Пример 1. В результате многолетних наблюдений для некоторой местности было выяснено, что вероятность того, что в течение 1 июля выпадет дождь, равна 4/17. Най¬ ти наивероятнейшее число дождливых дней 1 июля за бли¬ жайшие 50 лет. Здесь п=50, Р=jy, л/>-(1-р)=5о4-п=П;
§ 15] НАИВЕРОЯТНЕЙШЕЕ ЧИСЛО НАСТУПЛЕНИЙ СОБЫТИЯ 57 число это оказалось целым; значит, мы имеем дело с исклю¬ чительным случаем; наивероятнейшим значением числа дождливых дней будут равновероятные между собою числа 11 и 12. Пример2. В одном физическом эксперименте произ¬ водятся наблюдения за частицами определенного типа. При одних условиях за промежуток времени определенной длины в среднем появляется 60 частиц и каждая из них с ве¬ роятностью 0,7 имеет скорость большую, чем v0.. При дру¬ гих условиях за тот же промежуток времени в среднем появ¬ ляется лишь 50 частиц, но для каждой из них вероятность иметь скорость, превышающую v0, равна 0,8. Для каких условий опыта вероятнейшее число частиц со скоростью, превосходящей v0, больше? Для первых условий эксперимента /2 = 60, р = 0,7, пр— (1—р) = 41,7, fe0 = 42. Для вторых условий эксперимента /2 = 50, р = 0,8, пр —(1—р) = 39,8, &0 = 40. Мы видим, что вероятнейшее число «быстрых» частиц в пер¬ вых условиях эксперимента несколько больше, чем во вторых. В практике часто встречаются положения, когда число п весьма велико (массовая стрельба, массовое производство изделий и т. п.). В этом случае и произведение пр будет очень большим числом (если только вероятность р не чрез¬ вычайно мала). А так как в выражениях пр — (1—р) и пр + р, между которыми заключено наивероятнейшее число появле¬ ний события, вторые члены (т. е. р и 1 — р) меньше единицы, то оба эти числа, а значит и заключенное между ними наи¬ вероятнейшее число появлений события, близки к пр. Так, если вероятность соединения абонентов за срок, меньший 15 сек., равна 0,74, то мы можем принять 1000*0,74 за вероятнейшее число соединений абонентов за срок, меньший 15 сек., из каждой 1000 вызовов, поступающих на телефон¬ ную станцию. Этому выводу можно придать еще более точную форму. Если kQ означает наивероятнейшее число появлений собы¬ тия при п испытаниях, то ~ есть наивероятнейшая «доля»
58 СХЕМА БЕРНУЛЛИ [ГЛ. V появлений события при тех же п испытаниях; неравенства (7) дают нам: ^ п 11 г 1 п Представим себе, что мы, оставляя вероятность р появле¬ ния события для отдельного испытания неизменной, будем увеличивать все более и более число испытаний п (при этом, конечно, будет увеличиваться и наивероятнейшее число появлений й0). Дроби и стоящие в левой и правой частях последних неравенств, будут становиться все меньше и меньше; значит, при больших п этими дробями можно пре¬ небречь, т. е. можно считать левую и правую части нера¬ венств, а значит, и заключенную между ними дробь ^ рав¬ ными р. Таким образом, наивероятнейшая доля появлений события при большом числе испытаний практически равна вероятности появления события при отдельном испытании. Так, если при некоторых измерениях вероятность совер¬ шить в отдельном измерении ошибку, заключенную между аир, равна 0,84, то при большом числе измерений с наи¬ большей вероятностью можно ожидать примерно в 84% случаев ошибок, заключенных между аир. Это не значит, конечно, что вероятность получить ровно 84% таких оши¬ бок будет велика; напротив, сама эта «наибольшая вероят¬ ность» при большом числе измерений будет очень малой (так, мы видели в схеме рис. 5, что наибольшая вероятность ока¬ залась равной 0,196, причем там речь шла всего о 15 испыта¬ ниях; при большем числе испытаний она значительно мень¬ ше). Эта вероятность является наибольшей только в срав¬ нительном смысле: вероятность получить 84% измерений с ошибками, заключенными между а и р, больше, чем вероят¬ ность получить 83% или 86% таких измерений. С другой стороны, легко понять, что при длинных сериях измерений вероятность того или иного отдельного числа ошибок данной величины не может представлять зна¬ чительного интереса. Если мы, например, производим 209 измерений, то врзтд ли целесообразно вычислять веро¬ ятность того, что ровно 137 из них будут измерены с за¬ данной точностью, так как практически безразлично, будет
§ 15] НАИВЕРОЯТНЕЙШЕЕ ЧИСЛО НАСТУПЛЕНИЙ СОБЫТИЯ 59 это число равно 137, 136 или 138 и даже хотя бы 140. Напро¬ тив, вопрос, например, о вероятности того, что число из¬ мерений, для которых ошибка заключена в данных грани¬ цах, будет более 100 из 200 произведенных измерений, или что это число будет заключено между 100 и 125, или что оно окажется меньшим 50 и т. д., представляет несомненный интерес для практики. Как выразить такого рода вероятно¬ сти? Пусть мы хотим, например, найти вероятность того, что число измерений будет заключено между 100 и 120 (вклю¬ чая 120); точнее, будем искать вероятность неравенств 100</г< 120, где k — число попаданий. Для того чтобы осуществились эти неравенства, нужно, чтобы k оказалось равным одному из двадцати чисел 101, 102, 120; по правилу сложения, эта вероятность равна P(100<*<120) = Peoo(101) + PIOo(102)+... + P100 (120); для непосредственного вычисления этой суммы нам приш¬ лось бы предварительно вычислить 20 отдельных вероятно¬ стей типа Pn(k) по формуле (3); при столь больших числах подобные вычисления представляют непреодолимые труд¬ ности; поэтому сумм полученного нами вида на практике никогда не вычисляют прямым подсчетом. Для этого су¬ ществуют удобные приближенные формулы и таблицы. Составление этих формул и таблиц основано на сложных приемах математического анализа, которых мы здесь ка¬ саться не будем, однако и о вероятностях типа Р (\00<k^ ^120) можно простыми рассуждениями получить сведения, во многих случаях приводящие к исчерпывающему реше¬ нию поставленных задач. Об этом мы будем говорить в сле¬ дующей главе.
ГЛАВА ШЕСТАЯ ТЕОРЕМА БЕРНУЛЛИ § 16. Содержание теоремы Бернулли Вглядимся еще раз в диаграмму на рис. 5 (стр. 54), где вероятности различных значений числа k — появлений рассматриваемого события — числа Pl5(k) изображены вертикальными черточками. Вероятность, приходящаяся на какой-нибудь участок значений k, т. е. вероятность того, что число появлений интересующего нас события ока¬ жется равным какому-нибудь из чисел этого участка, по правилу сложения равна сумме вероятностей всех чисел этого участка, т. е. равна сумме длин всех вертикальных черточек, расположенных над этим участком. Чертеж на¬ глядно показывает, что эта сумма для различных участков одной и той же длины весьма различна. Так, участки 2^&<5 и 7<6<10 имеют одинаковую длину; вероятность каж¬ дого из них выражается суммой длин трех вертикальных черточек, и мы видим, что для второго участка сумма эта значительно больше, чем для первого. Мы уже знаем, что диаграммы вероятностей Pn(k) для всех п имеют такой же, в основном, вид, что и диаграмма на рис. 5, т. е. величина Pn{k) с ростом k сначала возрастает, а потом, после про¬ хождения через свое наибольшее значение, убывает; по¬ этому ясно, что из двух участков значений числа kf имею¬ щих одинаковую длину, во всех случаях большую вероят¬ ность будет иметь тот, который расположен ближе к наивероятнейшему значению kQ. В частности, на участок, имеющий серединой число 60, всегда будет приходиться большая вероятность, чем на любой другой участок той же длины.
СОДЕРЖАНИЕ ТЕОРЕМЫ БЕРНУЛЛИ 61 Но оказывается, что в этом направлении можно выска¬ зать гораздо больше. Всех возможных значений числа k появлений события при п испытаниях имеется п+ 1 (О Возьмем участок, имеющий середину в &0 и заклю¬ чающий в себе только малую долю, например одну сотую, возможных значений числа k\ тогда оказывается, что если общее число испытаний п очень большое, то на этот участок приходится подавляющая вероят¬ ность, а все другие вме¬ сте взятые значения чис¬ ла k имеют вероятность ничтожно малую. Таким образом, хотя выбран¬ ный нами участок и ни¬ чтожно мал по сравне¬ нию с п (на чертеже он ^ займет всего одну со¬ тую ДОЛЮ всей ДЛИ- Рис. 6. ны диаграммы), но тем не менее сумма расположенных над ним вертикаль¬ ных черточек будет значительно больше, чем сумма всех остальных вертикальных черточек. Причина этого в том, что черточки центральной части диаграммы во много раз крупнее черточек, располагающихся по краям. Таким образом, для больших п диаграмма величины PJk) имеет вид, примерно изображенный на рис. 6. Практически все это, очевидно, означает следующее: если мы производим серию из большого числа п испытаний, то с вероятностью, близкой к единице, мы можем ожидать, что число k появлений события А будет очень близко к сво¬ ему наивероятнейшему значению, отличаясь от него лишь на незначительную долю общего числа п произведенных испы¬ таний. Это предложение, известное под именем теоремы Бер¬ нулли и открытое в начале восемнадцатого столетия, пред¬ ставляет собой один из важнейших законов теории вероят¬ ностей; до середины прошлого столетия все доказательства этой теоремы требовали сложных математических средств,
62 ТЕОРЕМА БЕРНУЛЛИ [ГЛ. VI и только великий русский математик П. Л. Чебышев впер¬ вые нашел очень простое и краткое обоснование этого за¬ кона; замечательное доказательство Чебышева мы теперь и приведем. § 17. Доказательство теоремы Бернулли Мы уже знаем, что при большом числе испытаний п наивероятнейшее число kQ появлений события А почти не отличается от величины пр, где р, как всегда, означает вероятность события А для отдельного испытания. По¬ этому нам достаточно доказать, что при большом числе испытаний число k появлений события А будет с подав¬ ляющей вероятностью отличаться от пр весьма мало — не более чем на сколь угодно малую долю числа п (не более чем, например, на 0,01 п или 0,001 п, или вообще не более чем на гп, где е — как угодно малое число); иначе говоря, мы должны показать, что вероятность Р (\k — np\>en) (1) для достаточно боль- ших п будет как угодно п малой. Чтобы в этОхМ убе¬ диться, заметим, что по правилу сложения вероятность (1) равна сумме вероятностей Рп(k) для всех тех значений числа k, которые отстоят от пр больше чем на т\ на нашей обычной диаграмме (рис.7) эта сумма изображается суммою длин всех вертикальных черточек, лежащих вне отрезка А В, как вправо, так и влево от него. Так как общая сумма всех вертикальных черточек (как сумма вероятностей полной системы собы¬ тий) равна единице, то это значит, что подавляющая, почти равная единице часть этой суммы приходится на долю пР Рис. 7.
§ 17] ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ БЕРНУЛЛИ 63 отрезка А В и лишь ничтожно малая часть ее — на области, лежащие вне этого отрезка. Итак, P(\k-np\>en)= 2 PnW- (2) \k — np\>en Обращаемся теперь к рассуждению Чебышева. Так как в каждом члене написанной суммы ел а значит, и то мы можем только увеличить эту сумму, если каждый ее член Рп{Щ заменим выражением поэтому P(\k — np\>en)< 2 (Цг2) P„(k) = \k-7ip\ytn = £ {Ь — пр)*Рп{к)\ \k-np\yzn далее, очевидно, что последнюю сумму мы увеличим еще больше, если в дополнение к уже имеющимся в ней сла¬ гаемым добавим еще новые, заставляя число k пробегать не только участки до пр—гп и отмр+ея, но и весь ряд возможных для него значений, т. е. весь ряд чисел от О до п включительно; мы получаем таким образом, что и подавно п Р (] k — пр | > гп) < - jjj-, X, (k — nPY Рп ik) ■ (3) k = Q Последняя сумма выгодно отличается от всех предыдущих тем, что ее можно в точности вычислить; метод Чебышева и заключается в замене трудно оцениваемой суммы (2) суммой (3), допускающей точное вычисление. Мы приступаем теперь к этому вычислению; как бы длинным оно нам ни показалось, это уже— трудности тех¬ нического порядка, с которыми справится всякий, кто
64 ТЕОРЕМА БЕРНУЛЛИ [ГЛ. VI знает алгебру; замечательная же идея Чебышева нами уже вполне использована, ибо она состоит именно в переходе от равенства (2) к неравенству (3). Прежде всего мы легко находим: 2 (k—np)*pn(k)= k=Q = 2 k2Pn (k) - 2tip 2 kpn (k)+ny 2 Pn (k). (4) k=o k=o k=o Из трех сумм правой части последняя равна единице, как сумма вероятностей полной системы событий. Значит, нам остается только вычислить суммы 2 kpjk) и 2 k'pn(k)i k=0 k=0 при этом в обеих суммах члены, соответствующие k=0, равны нулю, так что можно начинать суммирование с k=l. 1) Для вычисления обеих сумм мы выразим Pn(k) по формуле (4) главы 5 (стр. 52). Мы находим: i№.m=S«xrspp*o-p)”-‘; А=1 k=l так как, очевидно, п\=п{п—1)1 и k\=k (k—1)!, то мы получаем: УУ (k) = Пр _ 1)1 [(i _ i/_ (k — 1)]! x xp*-'(l— или, полагая в сумме правой части k—1 =/ и замечая, что I изменяется от 0 до п—1 при изменении k от 1 до п, 2\kpn (k)—пр X ь (n~i ibvpl (1 — p)n~x"/= ft=l /=o ’4 ' =tip 2 Рп-Л0- 1=0 n— 1 Последняя сумма 2 P„_, (0> разумеется, равна единице,
§ 17] ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ БЕРНУЛЛИ 65 ибо это есть сумма вероятностей полной системы собы¬ тий — всевозможных чисел появлений события I при п—1 п испытаниях. Таким образом, для суммы ^ kPn(k) мы получили чрезвычайно простое выражение 'jfckpu(k) = np. (5) k — 0 2) Для вычисления второй суммы найдем сначала вели- п чину 'y^k(k — 1 )Рп (k)\ так как член, соответствующий fe=l, очевидно, равен нулю, то суммирование можно на¬ чать со значения k=2. Замечая, что п\=п{п—1) (п—2)! и что k\=k (k—\){k—2)!, мы легко заключаем, полагая подобно предыдущему k—2=т: gk (k-\) рп (k)(k-i) pn (k)= у k(k-l)nl *(1_ )n-A = k\(n—k) 1 1 K P) k = 2 V ' = П (м 1) P2 X (k — 2)! — 2) —(ft—2)]! X xp4"2( l —ру"-1»-'*-1»» =n(n-i)P‘£ m = 0 = rt(rt— l)p22 Pn-Am) = n(n— HP*. (6) m — 0 ибо последняя сумма снова равна единице, как сумма вероят¬ ностей некоторой полной системы событий — всевозмож¬ ных чисел появлений события при п—2 испытаниях. Наконец, формулы (5) и (6) дают: 2 k* P. (k):= ± k (k-1) Рп (k)+ 2 ЬР« (ft)= k—l л=1 k—l = n{n— 1) p2-f-np=n2p2+np (1 —p). (7)
С6 ТЕОРЕМА БЕРНУЛЛИ [ГЛ. VI Теперь обе нужные нам суммы вычислены. Вставляя резуль¬ таты (5) и (7) в соотношение (4), мы окончательно находим: 2 {к — прУРп (k) = n2p2+np (1 — р) — 2пр-пр+п2р2 = /г— О = пр( 1 —р); вставляя же полученное чрезвычайно простое выражение в неравенство (3), получаем: (8) Это неравенство доказывает все необходимое. В самом деле, число е мы могли взять, правда, как угодно малым, но, выбрав его, мы уже больше его не меняем; число же испы¬ таний пу по смыслу нашего утверждения, может быть как угодно большим; поэтому дробь Р~1 ~~ ^ может быть 8 YI предположена как угодно малой, так как с возрастанием п знаменатель ее может быть сделан как угодно большим, а числитель при этом не меняется. Пусть, например, р=0,75, так что 1—р=0,25, и Р (1 —Р) = 0,1875 <0,2; выберем 8=0,01; тогда неравенство (8) дает .1 \ ^ 0,2 2000 >тпЛ <7 р( \k — -п ^ ^ VI 4 100 J ^0,0001-л Если, например, п=200 000, то Р( | Л — 150 000 |>2000)<0,01. Практически это означает, например, следующее: если на некотором производстве при установившемся технологиче¬ ском процессе в среднем 75% изделий обладают некоторым свойством (например, принадлежат к 1-му сорту), то из 200 000 изделий с вероятностью, превышающей 0,99 (т. е. практически почти достоверно), этим свойством будут обла¬ дать от 148 000 до 152 000 изделий. К этому необходимо сделать два замечания: 1. Неравенство (8) дает для вероятности P(\k—пр|>еп) весьма грубую оценку; на самом деле эта вероятность, особенно при больших значениях п, значительно меньше;
ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ БЕРНУЛЛИ 67 на практике пользуются поэтому более точными оценками, обоснование которых, однако, значительно сложнее. 2. Оценка, даваемая неравенством (8), становится зна¬ чительно более точной, когда вероятность р очень мала или, напротив, очень близка к единице. Так, если в только что приведенном примере вероят¬ ность того, что изделие обладает некоторым свойством, равна р=0,95, то 1—р=0,05, р( 1—р) < 0,05. Поэтому, вы¬ бирая е=0,005, ц=200 000, мы находим: Р О — р) ^0,05 • 1 000000 ^ 25-200 000 U’U1’ как и прежде. Но теперь гп равно не 2000, а только 1000; отсюда (так как пр=190 000) мы заключаем, что с прак¬ тической достоверностью число изделий, обладающих рас¬ сматриваемым свойством, при общем числе 200 000 изделий окажется заключенным между 189 000 и 191 000. Таким образом, при р=0,95 неравенство (8) практически гарантирует нам, что для ожидаемого числа изделий с ин¬ тересующим нас свойством промежуток имеет вдвое мень¬ шую длину, чем при р=0,75, ибо мы имеем P(\k — 190 0001> 1000) <0,01. Задача. Известно, что одна четвертая часть рабочих некоторой отрасли промышленности имеет среднее образо¬ вание. Для некоторого обследования наудачу выбрано 200 000 рабочих. Найти 1) наивероятнейшее значение числа рабочих со средним образованием среди выбранных 200 000 и 2) вероятность того, что истинное (фактическое) число таких рабочих отклонится от наивероятнейшего не более чем на 1,696. При решении задачи мы исходим из того факта, что вероятность иметь среднее образование равна одной чет¬ верти для каждого из наудачу выбираемых 200 000 рабочих (в этом и заключается смысл слова «наудачу»). Таким обра¬ зом, в нашей задаче « = 200 000, р = \''4, k0 = np = 50000; р(1 —р) = '/1в. Ищется вероятность того, что \k—пр !<Т),016/7.р или \k—пр |< 800, где /е — число рабочих со средним образо¬ ванием.
68 ТЕОРЕМА БЕРНУЛЛИ [ГЛ. VI Выбираем е так, чтобы иметь еп=800; отсюда получаем: е = ~ = 0,004. Формула (8) дает: Р( \k 50 ООО |>800)<16.0,000016-200ооо^®> откуда P{\k — 50 000| <800) >0,94. Ответ. Искомое наивероятнейшее значение равно 50 000, искомая вероятность больше чем 0,94. На самом деле искомая вероятность значительно ближе к единице.
ЧАСТЬ ВТОРАЯ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ ГЛАВА СЕДЬМАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА И ЗАКОН РАСПРЕДЕЛЕНИЯ § 18. Понятие случайной величины Во всем предыдущем мы много раз уже встречались с такими величинами, численное значение которых не мо¬ жет быть раз навсегда определено, а меняется под влия¬ нием случайных воздействий. Так, число мальчиков на сотню новорожденных не будет для всех сотен одним и тем же. Или длина волокон хлопка определенного сорта меняется весьма сильно не только для различных районов, где этот сорт возделывается, но даже для одного куста и одной коробочки. Приведем еще несколько примеров величин такого рода. 1) Стреляя из одного и того же орудия на одном и том же прицеле и при неизменных условиях, мы тем не менее наблюдаем, что снаряды ложатся в разных местах; это явление называют «рассеиванием» снарядов. Расстояние места падения снаряда от места его вылета есть величина, при различных выстрелах получающая, в зависимости от не поддающихся предварительному учету случайных обстоятельств, различные численные значения. 2) Скорость молекулы газа не остается неизменной, а меняется от столкновений с другими молекулами. Ввиду того что каждая молекула может либо столкнуться, либо не столкнуться с каждой другой молекулой газа, измене¬ ние ее скорости носит чисто случайный характер.
70 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЗАКОН РАСПРЕДЕЛЕНИЯ [ГЛ. VII 3) Число метеоритов, падающих на землю в течение года, достигающих ее поверхности, не постоянно, а подвержено значительным колебаниям в зависимости от целого ряда обстоятельств случайного характера. 4) Вес зерен пшеницы, выращенных на некотором участке, не равен некоторой определенной величине, а меняется от одного зерна к другому. В силу невозможности учесть влияние всех факторов (качество участка почвы, на котором вырос колос с данным зерном, условия осве¬ щения зерна, водный режим и пр.), определяющих рост зерна, его вес является величиной, меняющейся в зави¬ симости от случая. Несмотря на всю разнородность рассмотренных приме¬ ров, все они с интересующей нас теперь точки зрения представляют собой одну и ту же картину. В каждом из этих примеров мы имеем дело с величиной, так или иначе характеризующей собой результат предпринятой операции (например, счета метеоритов, измерения длин волокон); каждая из этих величин может при различных операциях, какими бы однородными мы ни старались сделать их условия, принимать различные значения, в зависимости от усколь¬ зающих от нашего контроля случайных различий в обста¬ новке этих операций. Такого рода величины мы называем в теории вероятностей случайными величинами; приведен¬ ных нами примеров уже достаточно, чтобы убедить нас, сколь важным может быть изучение случайных величин для приложений теории вероятностей к самым разнообраз¬ ным областям знания и практики. Знать данную случайную величину — это не значит, конечно, знать ее численное значение, ибо если мы, напри¬ мер, знаем, что снаряд упал на расстоянии 926 м от места вылета, то тем самым уже это расстояние приняло опреде¬ ленное численное значение и перестало быть случайной величиной. Что же мы должны знать о случайной величине, для того чтобы иметь всю возможную полноту сведений о ней именно как о случайной величине? Очевидно, что для этого прежде всего мы должны знать все численные значения, которые она способна принимать. Так, если при стрельбе из орудия при некоторых определенных условиях наименьший наблюдавшийся пролет снаряда равен 904 м,
ПОНЯТИЕ ЗАКОНА РАСПРЕДЕЛЕНИЯ 71 а наибольший — 982 м, то расстояние места падения сна¬ ряда от места его вылета способно принимать все значения, заключенные между этими двумя границами. В примере 3) очевидно, что число метеоритов, достигших земной по¬ верхности в течение года, может иметь своим численным значением любое целое неотрицательное число, т. е. О, 1, 2, 3 и т. д. Однако знание лишь одного перечня возможных значе¬ ний случайной величины не дает о ней еще таких сведе¬ ний, которые могли бы служить материалом для практи¬ чески необходимых оценок. Так, если во втором примере рассмотреть газ при двух разных температурах, то воз¬ можные численные значения скоростей молекул для них одни и те же, и, следовательно, перечень этих значений не дает возможности какой-либо сравнительной оценки этих температур. Между тем, различие температур указывает на весьма существенное различие в состоянии газа — различие, о ко¬ тором один только перечень возможных значений скоростей молекул не дает нам никаких представлений. Если мы хо¬ тим оценить температуру данной массы газа, а нам дают только список возможных значений скоростей его молекул, то мы, естественно, спрашиваем, как часто наблюдается та или другая скорость. Другими словами, мы, естественно, стремимся узнать вероятности различных возможных зна¬ чений интересующей нас случайной величины. § 19. Понятие закона распределения Возьмем для начала совсем простой пример. Произ¬ водится стрельба по мишени, изображенной на рис. 8; попадание в область I дает стреляющему три очка, в об¬ ласть II — два очка и в область III — одно очко *). Рассмотрим в качестве случайной величины число оч¬ ков, выбиваемых при отдельном выстреле; возможными *) Читатель может возразить, сказав, что за попадание в область 111, т. е. за промах, не следует давать и одного очка. Однако, если очко яв¬ ляется правом на выстрел, то тот, кто произвел плохой выстрел, тем са¬ мым уже получил одно очко.
72 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЗАКОН РАСПРЕДЕЛЕНИЯ [ГЛ. VII значениями здесь служат числа 1, 2 и 3; обозначим соответ¬ ственно через р1У р2 и р8 вероятности этих трех значений, так что, например, рз означает вероятность попадания в об¬ ласть / мишени. В то время как возможные значения нашей случайной величины для всех стрелков одни и те же, ве¬ роятности pi, р2 и рз для различных стрелков могут весьма существенно различаться друг от друга, и очевидно, что этим различием и определяется различие в качестве стрельбы. Так, для очень хорошего стрелка может быть, например, рз= =0,8; р2=0,2; pi=0; для среднего стрелка рз=0,3; р2=0,5; pi=0,2; /// для совсем плохого стрелка рз=0,1; Р2=0,3; pi=0,6. Если при некоторой стрельбе про¬ изводится 12 выстрелов, то возмож¬ ными значениями числа попаданий в каждую из областей /, II и III будут служить все целые числа от 0 до 12 включительно; но сам по себе этот факт еще не дает нам возможности судить о качестве стрельбы; напротив, мы можем составить себе исчерпывающее пред¬ ставление об этом качестве, если, кроме возможных значе¬ ний числа попаданий, нам даются и вероятности этих значе¬ ний, т. е. числа, показывающие, как часто среди серий по 12 выстрелов будет встречаться то или другое число попа¬ даний в ту или иную область. Ясно, что так будет обстоять дело и во всех случаях; зная вероятности различных возможных значений случай¬ ной величины, мы тем самым будем знать, как часто следует ожидать появления более выгодных или менее выгодных ее значений; а этого, очевидно, достаточно для суждения об эффективности или доброкачественности той операции, с которой связана данная случайная величина. Практика показывает, что знания вероятностей всех возможных зна¬ чений изучаемой случайной величины действительно доста¬ точно для решения любого вопроса, связанного с оценкой этой случайной величины как показателя доброкачествен¬ ности соответствующей операции. Итак, мы приходим к выводу, что для полной характеристики той или другой
ПОНЯТИЕ ЗАКОНА РАСПРЕДЕЛЕНИЯ 73 случайной величины, как таковой, необходимо и достаточ¬ но знать: 1) перечень всех возможных значений этой случайной величины и 2) вероятность каждого из этих значений. Отсюда видно, что задавать случайную величину удобно посредством таблицы из двух строк: верхняя строка содер¬ жит в каком-нибудь порядке возможные значения случайной величины, а нижняя — их вероятности, так что под каж¬ дым из возможных значений стоит его вероятность. Так, в рассмотренном выше примере число очков, выбиваемых при одном выстреле лучшим из стрелков, может, как слу¬ чайная величина, быть представлено таблицей 1 2 3 0 0,2 0,8 В общем случае случайная величина, возможные зна¬ чения которой суть xv х2, ..., хп, а соответствующие вероят¬ ности pv pz, ..., рп, определяется таблицей *i *2 ... хп Pi Рг ... Рп Задать такую таблицу, т. е. задать все возможные зна¬ чения случайной величины вместе с их вероятностями, означает, как говорят, задать закон распределения этой случайной величины. Знание закона распределения данной случайной величины позволяет решать все связанные с нею вопросы. Задача. Число очков, выбиваемое при одном вы¬ стреле одним стрелком, имеет закон распределения (I);
74 СЛУЧАЙНАЯ ВЕЛИЧИНА И ЗАКОН РАСПРЕДЕЛЕНИЯ [ГЛ. VII такое же число очков для другого стрелка имеет закон рас¬ пределения 1 2 3 0,2 0,5 0,3 Найти закон распределения для суммы очков, выби¬ ваемых обоими стрелками. Ясно, что сумма, о которой идет речь,— случайная величина; наша задача — составить ее таблицу. Для этого мы должны рассмотреть все возможные результаты сов¬ местной стрельбы наших двух стрелков; мы расположим эти результаты в следующую таблицу, где вероятность каж¬ дого результата вычисляется по правилу умножения для независимых событий и где х означает число очков, выби¬ ваемых первым стрелком, а у — число очков, выбиваемых вторым стрелком. № резуль¬ тата X У х+у Вероятность результата 1) 1 1 2 0-0,2=0 2) 1 2 3 0-0,5=0 3) 1 3 4 0-0,3=0 4) 2 1 3 0,2-0,2=0,04 5) 2 2 4 • 0,2-0,5=0,1 6) 2 3 5 0,2-0,3=0,06 7) 3 1 4 0,8-0,2=0,16 8) 3 2 5 0,8-0,5=0,4 9) 3 3 б 0,8-0,3=0,24 Эта таблица показывает, что интересующая нас сумма х+у может принимать значения 3, 4, 5 и 6; значение 2 для нее невозможно, так как вероятность его равна нулю *). *) Можно, конечно, считать число 2 и возможным значением вели¬ чины х-\-у, имеющим вероятность 0, подобно тому, как мы ради общно¬ сти сделали это для значения 1 в таблице (I),
ПОНЯТИЕ ЗАКОНА РАСПРЕДЕЛЕНИЯ 75 Мы имеем х+у=3 в случаях результатов 2) и 4); стало быть, для того чтобы сумма х + у получила значение 3, надобно наступление одного из результатов 2) или 4); вероятность этого по правилу сложения равна сумме вероятностей этих результатов, т. е. равна 0 + 0,04=0,04. Для равенства х+у = 4 надобно наступление одного из результатов 3), 5) или 7); вероятность этого равенства равна поэтому (опять по пра¬ вилу сложения) 0 + 0,1 + 0,16=0,26; подобным же образом мы находим, что вероятность значения 5 для суммы х+у равна 0,06 + 0,4 = 0,46, а вероятность значения 6, наступающего только в случае результата 9), равна 0,24. Таким образом, для случайной величины х+у мы получаем следующую таблицу возмож¬ ных значений: 3 4 5 6 0,04 0,26 0,46 0,24 Эта таблица (III) полностью решает поставленную задачу. Сумма всех четырех вероятностей в таблице (III) равна единице; этим свойством должен, конечно, обладать каж¬ дый закон распределения, так как речь идет о сумме вероят¬ ностей всех возможных значений случайной величины, т. е. о сумме вероятностей некоторой полной системы событий. Этим свойством законов распределения удобно пользоваться как контрольным приемом для проверки правильности про¬ изведенных вычислений.
ГЛАВА ВОСЬМАЯ СРЕДНИЕ ЗНАЧЕНИЯ § 20. Определение среднего значения случайной величины Те два стрелка, о которых мы только что говорили, стреляя вместе, могут выбить,в зависимости от случайных об¬ стоятельств, либо 3, либо 4, либо 5, либо 6 очков; вероятности этих четырех возможных результатов указаны в таблице (III) на стр. 75. Если спросить: «сколько очков выбивают наши два стрелка при одном (двойном) выстреле?», то на этот вопрос мы не сможем ответить, потому что разные выстрелы дают разные результаты. Но для оценки качества стрельбы нашей пары мы будем, конечно, интересоваться результатом не отдельного выстрела (этот результат может быть случайным), а средним результатом за целую серию выстрелов. Сколько же очков дает в среднем один выстрел нашей пары стрелков? Этот вопрос поставлен уже вполне разумно, и на него может быть дан ясный ответ. Будем рассуждать так. Если наша пара стрелков произ¬ водит сто двойных выстрелов, то, как показывает таб¬ лица (III), примерно 4 из этих выстрелов дадут по 3 очка » 26 » » » » » 4 » » 46 » » » » » 5 очков » 24 » » » » » 6 » Таким образом, в среднем, каждая сотня двойных выстре¬ лов даст нашей паре общее число очков, выражающееся суммой 3x4+4x26+5x46+6x24 = 490.
§ 20] ОПРЕД. СРЕДНЕГО ЗНАЧЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 77 Деля это число на 100, мы получаем, что в среднем на один выстрел приходится 4,9 очка; это и дает ответ на поставлен¬ ный нами вопрос. Заметим, что вместо того, чтобы делить на 100 готовую сумму (490) (как мы это только что делали), мы могли бы еще до сложения разделить на 100 каждое из слагаемых; тогда сумма прямо дает нам среднее число очков на один выстрел; проще всего произвести это деление, деля на 100 вторые множители всех слагаемых: ведь эти множи¬ тели были получены умножением вероятностей, указанных в таблице (III), на 100, и для того чтобы разделить их на 100, достаточно просто вернуться к этим вероятностям. Для среднего числа очков, приходящегося на один выстрел, мы получаем, таким образом, выражение 3x0,04+4x0,26+5x0,46+6x0,24 = 4,9. Сумма, стоящая в левой части этого равенства, как мы не¬ посредственно видим, построена из данных таблицы (III) по очень простому правилу: каждое из указанных в верх¬ ней строчке этой таблицы возможных значений умножено на стоящую под ним в таблице его вероятность, и все такие произведения сложены между собой. Проведем теперь это же рассуждение в общем виде. Допустим, что некоторая случайная величина задана таб¬ лицей *1 *2 ... ч Pi Рг ... Pk Вспомним: если вероятность значения величины х равна pv то это означает, что в серии из п операций это значение хг будет наблюдаться примерно п1 раз, где ~ =/+ откуда п1=пр1; аналогично, значение х2 при этом встретится при¬ мерно п2=пр2 раз, ..с. значение xk встретится примерно пк^прк раз.
78 СРЕДНИЕ ЗНАЧЕНИЯ [ГЛ. VIII Таким образом, серия из п операций будет в среднем содержать п1 = пр1 операций, где х = х19 п2 = пр2 » » х=х2, nk = npk операций, где x = xk. Сумма значений величины х во всех п произведенных операциях будет поэтому примерно равна х1п1 + хгпг + ... + xknk == п (xlPl + xiPi + ... + xkPk). Поэтому среднее значение х случайной величины, соот¬ ветствующее отдельной операции и получаемое из только что написанной суммы делением на число п операций в дан¬ ной серии, будет равно X = XlPl + х2р2 + ... +хкРк. Мы приходим, таким образом, к следующему важному правилу: для получения среднего значения случайной ве¬ личины надо каждое из ее возможных значений помножить на соответствующую ему вероятность и сложить между собой все полученные произведения. Какую пользу может сослужить нам знание среднего зна¬ чения случайной величины? Чтобы ответить на этот вопрос более убедительно, рассмотрим сначала несколько примеров. Пример 1. Вернемся еще раз к нашим двум стрел¬ кам; выбиваемые ими числа очков являются случайными величинами, законы распределения которых даются таб¬ лицами (I) для первого стрелка и (II) — для второго (стр. 74). Один внимательный взгляд на эти две таблицы уже показывает нам, что первый стреляет лучше второго; в са¬ мом деле, вероятность самого лучшего результата (3 очка) у него значительно больше, чем у второго стрелка, в то время как вероятности более плохих результатов, напро¬ тив, у второго стрелка больше, чем у первого. Однако такое сравнение не удовлетворяет нас — оно носит чисто качественный характер, при нем мы не видим еще той мерки, того числа, которое своей величиной прямо оценивало бы качество стрельбы того или другого стрелка, подобно тому
§ 20] ОПРЕД. СРЕДНЕГО ЗНАЧЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 79 как температура, например, прямо оценивает степень на- гретости физического тела. Не имея такой оценивающей мерки, мы можем всегда стать перед случаем, когда непо¬ средственное рассмотрение не даст нам никакого ответа или когда этот ответ может оказаться спорным. Так, если бы вместо таблиц (I) и (II) мы имели таблицы: 1 2 3 0,4 0,1 0,5 (У) и 1 2 3 0,1 0,6 0,3 (1Г) для первого стрелка для второго стрелка то трудно было бы одним взглядом на эти таблицы решить, который из двух стрелков стреляет лучше; правда, лучший результат (3 очка) у первого более вероятен, чем у вто¬ рого; но вместе с тем и самый худший результат (1 очко) у первого также более вероятен, чем у второго; напротив, результат 2 очка у второго более вероятен, чем у первого. Составим теперь по указанному выше правилу сред¬ нее значение числа очков для каждого из наших двух стрелков: 1) для первого стрелка: 1 х 0,4+2x0,1 +3х 0,5=2,1; 2) для второго стрелка: 1x0,1+2x0,6+3x0,3=2,2. Мы видим, что второй стрелок дает в среднем несколько большее число очков, чем первый; практически это значит, что при многократной стрельбе второй стрелок будет, вообще говоря, давать несколько лучший результат, чем первый. Теперь мы с уверенностью скажем, что второй стре¬ лок стреляет лучше; среднее значение числа выбиваемых очков дало нам удобную мерку, с помощью которой мы мо¬ жем легко и не оставляющим никаких сомнений способом сравнивать между собой искусство различных стрелков. П р и м е р 2. При сборке точного прибора для наиболее точной подгонки некоторой детали может потребоваться,
80 СРЕДНИЕ ЗНАЧЕНИЯ [ГЛ. VIII в зависимости от удачи, 1, 2, 3, 4 или 5 проб. Таким обра¬ зом, число х проб, необходимых для достижения удовлетво¬ рительной сборки, есть случайная величина с возможными значениями 1, 2, 3, 4, 5; пусть вероятности этих значений даются таблицей 1 2 3 4 5 0,07 0,16 0,55 0,21 0,01 Мы можем быть поставлены перед задачей снабдить дан¬ ного сборщика таким числом деталей, какое необходимо для 20 приборов *). Чтобы иметь возможность ориентиро¬ вочно оценить это число, мы не можем непосредственно использовать данную таблицу — она учит нас только тому, что в разных случаях бывает по-разному. Но если мы найдем среднее значение х числа х проб, необходимых для одного прибора, и умножим это среднее значение на 20, то мы и получим, очевидно, ориентировочное значение искомого числа. Мы находим: х=1 х0,07+2 х 0^16+ 3x0,55+4 X 0,21 +5x0,01 =2,93; 20х = 2,93x20 = 58,6^59. Для того чтобы сборщик имел небольшой запас на случай, если фактический расход деталей превзойдет ожидаемый, практически полезно будет дать ему 60—65 деталей. В рассмотренных примерах мы имеем дело с таким поло¬ жением вещей, когда для некоторой случайной величины практика требует известной ориентировочной оценки; од¬ ним только взглядом на таблицу мы такой оценки дать не можем,— таблица говорит нам только, что наша случай¬ ная величина может принимать такие-то значения с та¬ кими-то вероятностями. Но вычисленное по этой таблице среднее значение случайной величины уже способно дать такую оценку, ибо это именно то значение, которое в сред¬ нем будет принимать наша величина при более или менее *) Мы будем предполагать при этом, что деталь, забракованная при сборке одного прибора* уже не используется при сборке других.
§ 20] ОПРЕД. СРЕДНЕГО ЗНАЧЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 81 продолжительном ряде операций. Мы видим, что с практи¬ ческой стороны среднее значение особенно хорошо харак¬ теризует случайную величину, когда речь идет об операции массовой или многократно повторяемой. Задача 1. Производится ряд испытаний с одной и той же вероятностью р появления некоторого события А, причем результаты отдельных испытаний между собой неза¬ висимы. Найти среднее значение числа появлений события А в серии из п испытаний. Число появлений события А в серии из п испытаний есть случайная величина с возможными значениями 0, 1, 2 причем вероятность значения k равна, как мы знаем, Поэтому искомое среднее значение равно Ъьр„&). k = o Эту сумму мы вычислили при доказательстве теоремы Бер¬ нулли (стр. 65) и видели, что она равна пр. В свое время мы убедились, что наивероятнейшее число появлений собы¬ тия А при п испытаниях в случае большого п близко к пр\ теперь мы видим, что среднее число появлений события А при любом п в точности равно пр. Таким образом, в данном случае наивероятнейшее значение случайной величины совпадает с ее средним зна¬ чением; надо, однако, остерегаться думать, будто это сов¬ падение имеет место для любых случайных величин; вообще говоря, наивероятнейшее значение случайной величины может очень далеко отстоять от ее среднего значения. Так, например, для случайной величины с законом рас¬ пределения 0 5 10 0,7 0,1 0,2 наивероятнейшее значение есть 0, а среднее значение — 2,5. 4 Б. В. Гнеденко и А. Я. Хипчии
82 СРЕДНИЕ ЗНАЧЕНИЯ [ГЛ. VIII Задача 2. Производятся независимые испытания, в каждом из которых с вероятностью 0,8 может произойти некоторое событие А. Испытания производятся до первого появления события А; общее число испытаний не превосхо¬ дит четырех. Определить среднее число произведенных ис¬ пытаний. Число испытаний, которое придется произвести, по ус¬ ловиям задачи может равняться 1, 2, 3 или 4. Мы должны вычислить вероятности каждого из этих четырех значений. Для того чтобы потребовалось произвести только одно ис¬ пытание, надо, чтобы уже при первом испытании появи¬ лось событие Л. Вероятность этого равна /Л = 0,8. Для того чтобы потребовалось произвести два испытания, надо, чтобы при первом испытании событие А не появилось, а при втором — произошло. Вероятность этого по теореме умножения вероятностей для независимых событий равна р2 = (1 — 0,8) х 0,8 = 0,16. Для того чтобы потребовалось три испытания, надо, чтобы в первых двух событие А не появилось, а при третьем оно произошло. Поэтому р3 = (1 —0,8)2 х 0,8 = 0,032. Наконец, потребность в четырех испытаниях возникнет при условии, что три первых испытания не приведут к появле¬ нию события А (независимо от того, что даст четвертое испытание), поэтому р4 = (1 —0,8)5 = 0,008. Таким образом, число производимых испытаний, как слу¬ чайная величина, определяется законом распределения 1 2 3 4 0,8 0,16 0,032 0,008
§ 20] ОПРЕД. СРЕДНЕГО ЗНАЧЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 83 Среднее значение этого числа равно поэтому 1 х 0,8+2 х 0,16+3 х 0,032+4 х 0,008 = 1,248. Если, например, предстоит сделать 100 подобных наб¬ людений, то можно рассчитывать, что при этом придется произвести примерно 1,248x 100^125 испытаний. В практике с подобной постановкой задачи приходится встречаться часто. Для примера, мы испытываем пряжу на крепость и относим ее к высшему сорту, если она не рвется ни разу при нагрузке Я, когда испытываются образцы стан¬ дартной длины из одного и того же мотка (или партии). Испытывается каждый раз не более четырех образцов. Задача 3. Некоторая площадка имеет форму квад¬ рата, сторона которого по данным аэрофотометрических измерений равна 350 м. Качество аэрофотосъемки опреде¬ ляется тем, что ошибка в 0 м имеет вероятность 0,42 + 10 м » » 0,16*) + 20 м » » 0,03 + 30 м » » 0,05 Найти среднее значение площади площадки. В зависимости от случайностей аэрофотометрического измерения сторона площадки есть случайная величина, закон распределения которой дается таблицей 320 330 340 350 360 370 | 380 0,05 0,08 0,16 0,42 0,16 0,08 0,05 Отсюда мы сразу могли бы найти среднее значение этой величины; в данном случае нам нет даже надобности при¬ менять для этого наше вычислительное правило; в самом деле, так как одинаковые ошибки в ту и другую сторону *) Это понимается так, что ошибка +10 м и ошибка —Юм имеют вероятности по 0,16 каждая; так же следует понимать и далее указанные вероятности. 4*
84 СРЕДНИЕ ЗНАЧЕНИЯ [ГЛ. VIII одинаково вероятны, то уже по симметрии ясно, что сред¬ нее значение стороны квадрата равно наблюденному зна¬ чению, т. е. 350 м\ более подробно: выражение среднего значения будет содержать члены: (340 + 360) • 0,16 = [(350 + 10) + (350 — 10>] • 0,16 = = 2-350-0,16, (330+370) - 0,08 = 2 - 350 - 0,08, (320+380) - 0,05 = 2 - 350 ♦ 0,05; оно равно поэтому 350 • (0,42 +2 • 0,16+2 • 0,08 +2 х 0,05) = =350. Можно было бы думать, что из тех же соображений симметрии среднее значение площади квадрата должно рав¬ няться 3502 = 122 500 ж2; это было бы так, если бы среднее значение квадрата случайной величины равнялось квад¬ рату ее среднего значения, однако это не так; в нашем примере площадь квадрата может иметь значения 3202, 3302, 3402, 3502, 3602, 3702, 3802; какое из этих значений имеет место в действительности — это зависит от того, какой из семи представленных в таб¬ лице (I) случаев имеется налицо, так что вероятности этих семи значений те же, что и вероятности таблицы (I); короче говоря, закон распределения площади квадрата дается таб¬ лицей 3202 ЗЗО2 340г О 1.0 со 3602 3702 о со со 0,05 0,08 0,16 0,42 0,16 0,08 0,05 и, следовательно, среднее значение ее равно 3202 - 0,05 + 3302 - 0,08 + 3402 - 0,16+ 3502 - 0,42+ + 3602 -0,16+ 3702 -0,08+3802 -0,05. И здесь полезно для сокращения вычислений воспользо¬ ваться имеющейся симметрией; стоит посмотреть, как это
§ 20] ОПРЕД. СРЕДНЕГО ЗНАЧЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 85 делается, ибо подобные возможности упрощения возникают довольно часто. Мы можем переписать написанное выраже¬ ние в виде 3502 • 0,42+(3402 + 3602) -0,164 (3302 +3702) • 0,08 + 4 (32024-3802)-0,05 = = 3502-0,42+[(350 — 10)24-(350+10)2] -0,16 + 4- [ (350 — 20)2 + (350+20)2 ] • 0,08 + + [(350 — 30)2 + (350+30)2] -0,05 = = 3502[0,42 -[-2-0,164-2-0,08+2-0,05] + +2-10*-0,164-2-202- 0,08 + 2-302-0,05 = = 3502 + 2 • (16+32 4 45 ) = 122 686. При этом способе вычисления все расчеты могут быть про¬ ведены в уме. Мы видим, что среднее значение площади квадрата оказалось несколько больше (практически, правда, раз¬ личие в этом случае неощутимо), чем квадрат среднего зна¬ чения стороны (т. е. чем 3502 = 122 500); легко доказать, что в основе этого лежит общее правило: среднее значение квадрата любой случайной величины всегда больше, чем квадрат ее среднего значения. В самом деле, пусть мы имеем случайную величину х с совершенно произвольным законом распределения *1 Х2 Хк Pi Р2 Рк тогда величина х2 будет иметь закон распределения X2 А А I к Pi Рг Рк
86 СРЕДНИЕ ЗНАЧЕНИЯ [ГЛ. VIII средние значения этих двух величин соответственно равны *=*,Pi+*,/>,+ • ••+**£* И хг=х\рх+х\р2+. . . +xlpk. Мы имеем: v2 — (x)z = x2 — 2(v)2-f-(x)2; так как р^Рг+...+P^l, то три члена правой части могут быть соответственно представлены в виде _ k х2= z = 1 _ _ к k 2 (л:)2 = 2 (х) (х) = 2х 2 xiPi = 2 2хлг,р,-, 1=1 /=1 k k W! = W!2Pi= S WV/; /= 1 I = 1 поэтому л;2 — {xf= 2 {4 — 2^, + (x)2} Р,- = 2 (xt — xyPi\ 1 = 1 i = l так как все члены суммы, стоящей в правой части, неотри¬ цательны, то ?— (*)2>0, что и требовалось доказать.
ГЛАВА ДЕВЯТАЯ СРЕДНИЕ ЗНАЧЕНИЯ СУММЫ И ПРОИЗВЕДЕНИЯ § 21. Теорема о среднем значении суммы Очень часто встречается необходимость вычислить сред¬ нее значение суммы двух (а иногда и большего числа) случайных величин, средние значения которых известны. Пусть, например, два предприятия изготовляют одинако¬ вую продукцию, причем известно, что в среднем первое предприятие ежедневно производит 120 изделий, а вто¬ рое— 180; можем ли мы при помощи этих данных устано¬ вить среднее значение числа изделий, которое следует ожидать ежедневно от обоих предприятий вместе? Или этих данных недостаточно, и мы, кроме Средних значений, должны знать еще что-либо о двух рассматриваемых слу¬ чайных величинах (например, знать полностью их законы распределения)? Весьма важно, что для вычисления среднего значения суммы во всех случаях достаточно знать средние значения слагаемых и что среднее значение суммы выражается во всех случаях через средние значения слагаемых наиболее простым способом, какой только можно себе представить: среднее значение суммы всегда равно сумме средних значений слагаемых. Таким образом, если д; и у — две совершенно произ¬ вольные случайные величины, то х-1у=х-\у. В вышеприведенном примере х — число изделий одного только первого предприятия, у — число изделий второго
88 СРЕДНИЕ ЗНАЧЕНИЯ СУММЫ И ПРОИЗВЕДЕНИЯ [ГЛ. IX предприятия: jc= 120, у =180, и значит, х +у — х - ]- у — 300. Чтобы доказать в общем виде утверждаемое правило, допустим, что величины х и у соответственно подчиняются законам распределения р 1 Рк (I) и У, Уг Ус Ях Я 2 Я1 (И) Тогда возможными значениями величины х+у будут все¬ возможные суммы вида Xi+ijj, где 1 и 1^/^/. Вероятность значения х{+у;-> которую мы будем обозначать через р(-, нам неизвестна; это есть вероятность двойного события x=xit y=yj, т. е. вероятность того, что величина х получит значение xit а величина у — значение уу.. Если бы мы могли считать эти два события взаимно независимыми, то мы по правилу умножения имели бы, конечно, zPi4j> (о но мы отнюдь не станем предполагать независимости этих событий. Итак, равенство (1), вообще говоря, не будет иметь места, и мы должны считаться с тем, что знание таблиц (I) и (II), вообще говоря, ничего не позволяет заключить о ве¬ личинах Pij. По общему правилу, среднее значение величины х+у равно сумме произведений всех возможных значений этой величины на соответствующие вероятности, т. е. х+у= 2 2 (Xi+y;)ри=.2 *i(2Р//)+2 yj (.2р>;)- (2) / = i /— i 7=1 Рассмотрим теперь внимательнее сумму 2 Pij\ это есть сумма вероятностей всевозможных событий вида (x=xit ууj)у где число i — одно и то же во всех членах суммы,
§ 21] ТЕОРЕМА О СРЕДНЕМ ЗНАЧЕНИИ СУММЫ 89 а число / от члена к члену меняется, пробегая весь ряд возможных для него значений (от 1 до I включительно); так как события у=у;- при различных / друг с другом, очевидно, несовместимы, то по правилу сложения сумма i 2р*/ есть вероятность наступления какого-нибудь одного /= 1 из I событий (х=х{} у=у}) (/=1, 2, ..., /). Но сказать «наступило какое-нибудь одно из событий х=хt> y=yj (1^/^/)» — все равно, что просто сказать «наступило событие x=xi»\ в самом деле: 1) если наступило одно из событий {x=xiy у=у}) (/ — все равно какое), то, очевидно, наступило и событие х=Х:\ 2) обратно, если наступило событие х—х(1 то, так как у обязательно при¬ нимает одно из своих возможных значений у2, , . ., ylt должно наступить и какое-нибудь из событий (х=х{, У~У/) Таким образом, 2 Р//» будучи вероят- i=-.\ ностыо наступления какого-нибудь одного из событий (х=х(, у=у)) (1^/^/), равна просто вероятности события х=х[у т. е. 2 Pu=Pi- j= i Совершенно аналогичным образом^ мы убеждаемся, ко¬ нечно, что k i—i вставляя же эти выражения в равенство (2), мы находим: k i _ Х+У= 2 х,р,+ 2 iJj<l]—XJry, 1=1 /= 1 что и требовалось доказать. Теорема, доказанная нами для случая двух слагаемых, автоматически распространяется на случай трех и более слагаемых; в самом деле, в силу того, что мы только что доказали, мы можем написать x+y + z=x+y+z^xi y-\--z и т. д.
90 СРЕДНИЕ ЗНАЧЕНИЯ СУММЫ И ПРОИЗВЕДЕНИЯ [ГЛ. IX Пример. На некотором предприятии установлено п станков и с каждого станка отобрано по одному изделию. Определить среднее число бракованных изделий, если известно, что вероятность изготовления бракованного изде¬ лия первым станком равна рх, вторым станком— р2, ..., п-м станком — рп. Число бракованных изделий при анализе одного изде¬ лия есть случайная величина, способная принимать только два значения: 1, если это изделие бракованное, и 0, если оно годное. Вероятности этих значений для первого станка равны соответственно р, и 1 — pv вследствие чего среднее число бракованных изделий из числа взятых с первого станка равно l-p.+o-o — р1)=р1. Для второго станка среднее число бракованных изделий среди взятых равно р2 и т. д. Общее число бракованных из¬ делий есть сумма бракованных изделий, попавшихся среди изделий, изготовленных на первом, втором и других стан¬ ках. Поэтому, в силу только что установленного нами пра¬ вила сложения средних значений, среднее число бракован¬ ных изделий среди выбранных нами равно Р1+Р2+ • • • +Ря» что и решает поставленную задачу. В частности, если вероятность изготовления бракован¬ ного изделия одна и та же для всех станков {рх=р2=... ...=рп=р), то среднее значение общего числа бракованных изделий равно пр. Этот результат мы уже получили на стр. 65 [формула (5)]. Интересно сравнить громоздкие расчеты, которые понадобились там для этой цели, с тем простым, не требующим никаких вычислений рассужде¬ нием, которое здесь привело нас к тому же результату. Однако мы выгадали не только в простоте, но и в общ¬ ности. При нашем прежнем выводе мы предполагали ре¬ зультаты изготовления отдельных изделий взаимно н е - зависимыми событиями, и действительно, наш преж¬ ний способ вывода годился только при этом предположении; теперь же мы можем обойтись без этого предположения, так как правило сложения средних значений, на которое мы опираемся в нашем новом выводе, имеет место для лю¬
§ 22] ТЕОРЕМА О СРЕДНЕМ ЗНАЧЕНИИ ПРОИЗВЕДЕНИЯ 91 бых случайных величин, без всякого ограничения. Таким образом, какова бы ни была взаимная зависимость между отдельными станками и изготовляемыми ими изделиями, если только вероятность изготовления брака р для всех станков одна и та же, среднее число бракованных изделий среди выбранных п всегда равно пр. § 22. Теорема о среднем значении произведения Тот же вопрос, который мы разрешили для сумм слу¬ чайных величин, часто приходится рассматривать и для их произведений. Пусть случайные величины х и у снова подчиняются соответственно законам распределения, указываемым таблицами (I) и (II). Тогда произведение ху есть случайная величина, возможными значениями которой служат произведения вида лууу (1 1^/^/); вероятность значения xi уу. равна р/у . Задача состоит в отыскании такого правила, которое позволило бы во всех случаях выражать среднее значение ху величины ху через средние значения сомножителей. Однако в об¬ щем случае решение этой задачи оказывается невоз¬ можным. Знанием средних значений х и у величина ху, вообще говоря, не определяется однозначно (т. е. при одних и тех же х и у возможны различные значения ве¬ личины ху)\ вследствие этого никакой общей формулы, выражающей ху через х и у, существовать не может. Но есть один важный случай, когда такое выражение возможно, и тогда получаемая связь носит чрезвычайно простой характер. Условимся называть случайные величины х и у взаимно независимыми, если события х=х{ и у=У/ при любых i и / взаимно независимы, т. е. если условие, что одна из наших двух случайных величин приняла то или другое определенное значение, не влияет на закон распределения второй случайной величины. Если вели¬ чины х и у взаимно независимы в только что определен¬ ном смысле, то Pu=PiQj 2 А; / = 1. 2 О
92 СРЕДНИЕ ЗНАЧЕНИЯ СУММЫ И ПРОИЗВЕДЕНИЯ [ГЛ. IX по правилу умножения для независимых событий; поэтому k i k i k i xy = 2 2*,tyP// = 2 2 xiyipiqj = 2*«P/2P/<7/=Ty; 1=1/=1 i=l j=\ i=z 1 ;= l (Зля взаимно независимых случайных величин среднее зна¬ чение произведения равно произведению средних значений сомножителей. Как и в случае сложения, это правило, выведенное нами для произведения двух случайных величин, авто¬ матически распространяется на произведение любого числа сомножителей; при этом необходимо только, чтобы эти сомножители были взаимно независимыми, т. е. чтобы задание каких-либо определенных значений для части этих величин не влияло на законы распределения остальных величин. Пример 1. Допустим, что требуется измерить площадь прямоугольной формы посредством аэрофото¬ съемки и что измерение сторон этого прямоугольника дало 72 м и 50 м. Закон распределения ошибок измерения неизвестен, но известно, что ошибки одинаковой вели¬ чины в ту и другую сторону одинаково вероятны; тогда ясно из соображений симметрии (и легко может быть доказано, см. задачу 3 на стр. 83), что средние значения сторон прямоугольника совпадают с полученными ре¬ зультатами измерения. Если эти два результата изме¬ рения можно считать взаимно независимыми случай¬ ными величинами, то среднее значение площади по только что выведенному нами правилу умножения будет равно произведению средних значений ее сторон, т. е. 72х X 50 = 3600 м2. Но иногда могут быть основания предпо¬ лагать измерения сторон взаимно зависимыми. Это будет, например, в том случае, если оба измерения производятся одними и теми же недостаточно выверен¬ ными приборами. Если измерение длины дает резуль¬ тат, значительно превосходящий истинную длину, то мы, естественно, имеем основание предполагать, что измерительные приборы вообще склонны давать слиш¬ ком большие величины, вследствие чего повышается
§ 22] ТЕОРЕМА О СРЕДНЕМ ЗНАЧЕНИИ ПРОИЗВЕДЕНИЯ 93 вероятность преувеличенных значений и при измерении ширины, так что эти две величины нельзя считать взаим¬ но независимыми. В таких случаях среднее значение пло¬ щади не может быть принято равным произведению сред¬ них значений сторон прямоугольника, и для определе¬ ния его требуется дополнительная информация. Пример 2. По проводнику, сопротивление кото¬ рого зависит от случайных обстоятельств, течет электри¬ ческий ток, сила которого также зависит от случая. Из¬ вестно, что среднее значение сопротивления проводника равно 25 омам, а средняя сила тока равна 6 амперам. Требуется подсчитать среднее значение электродвижу¬ щей силы Е текущего по проводнику тока. Согласно закону Ома E = RI, где R — сопротивление проводника, / — сила тока. Так как по нашему допущению R =25, 7 = 6, то, предположив величины R и / взаимно независимыми, находим, что E = RI = 25-6 = 150 вольт.
ГЛАВА ДЕСЯТАЯ РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ § 23. Недостаточность среднего значения для характеристики случайной величины Мы уже неоднократно видели, что среднее значение случайной величины дает нам первое примерное, ориен¬ тировочное представление о ней, и есть много случаев, когда для практических целей, стоящих перед нами, этого представления бывает достаточно. Так, для срав¬ нения искусства двух стрелков в соревновании нам до¬ статочно было знать средние значения чисел выбивае¬ мых ими очков; для сравнения эффективности двух раз¬ личных систем подсчета числа космических частиц вполне достаточно знать средние значения числа потерь частиц, которые допускает каждая из систем измерений, и т. д. Во всех этих случаях мы получаем существенную вы¬ году, описывая нашу случайную величину одним чис¬ лом — ее средним значением,— вместо того чтобы зада¬ вать ее сложным законом распределения. Дело обстоит так, как будто бы перед нами была не случайная, а до¬ стоверно известная величина с совершенно определен¬ ным значением. Однако гораздо чаще встречается другое положение вещей, когда наиболее важные для практических целей черты случайной величины ни в какой мере не опреде¬ ляются ее средним значением, а требуют более деталь¬ ного знакомства с ее законом распределения. Типичный случай этого рода мы имеем при исследовании распреде¬ ления ошибок измерений. Пусть х — величина ошибки,
§ 23] НЕДОСТАТОЧНОСТЬ СРЕДНЕГО ЗНАЧЕНИЯ 95 т. е. отклонение полученного значения измеряемой ве¬ личины от ее истинного значения. При отсутствии си¬ стематических ошибок среднее значение ошибки изме¬ рения, которое мы обозначим через х, равно нулю. До¬ пустим, что измерения происходят именно при таком условии. Спрашивается, как будут распределяться ошибки? Как часто будут встречаться ошибки той или иной величины? На все эти вопросы мы, зная только значение х=0, не можем получить никакого ответа. Мы знаем только, что возможны ошибки положительные и отрицательные и что их шансы примерно одинаковы, ибо среднее значение величины ошибки равно нулю. Но мы не знаем самого главного: будут ли результаты измерений в своем большинстве ложиться близко к ис¬ тинному значению измеряемой величины, так что можно будет рассчитывать с большой надежностью на каждый результат измерения, или же они в своей основной массе будут раскиданы на больших расстояниях от истинного размера по обе стороны. Обе возможности вполне до¬ пустимы. Два наблюдателя могут, производя измерения с од¬ ним и тем же средним значением ошибки х, давать изме¬ рения различной степени точности. Может случиться, что один из них дает систематически большее «рассея¬ ние» результатов измерений, чем другой. Это означает, что у этого наблюдателя ошибки в среднем могут прини¬ мать большие значения, а значит, измерения будут дальше отстоять от измеряемой величины, чем у дру¬ гого. И это возможно, хотя для обоих наблюдателей средняя величина ошибки измерения одна и та же. Рассмотрим другой пример. Представим себе, что испытываются на урожайность два сорта пшеницы. В за¬ висимости от случайных обстоятельств (количество осад¬ ков, распределение удобрений, солнечная радиация и пр.) урожай с квадратного метра подвержен значи¬ тельным колебаниям и представляет собой случайную величину. Предположим, что при одинаковых условиях средний урожай для каждого сорта один и тот же —■ 240 граммов с квадратного метра. Можно ли судить о качестве испытываемого сорта только по значению
96 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X среднего урожая? Очевидно, что нет, так как наибольший хозяйственный интерес представляет тот сорт, урожай¬ ность которого меньше подвержена случайным влия¬ ниям метеорологических и других факторов, иными словами, для которого «рассеяние» урожайности меньше. Мы видим, таким образом, что при испытании того или иного сорта пшеницы на урожайность не меньшее зна¬ чение, чем средняя урожайность, имеет размах возмож¬ ных ее колебаний. § 24. Различные способы измерения рассеяния случайной величины Приведенные примеры, так же как и ряд других, им аналогичных, убедительно показывают, что во многих случаях для описания практически наиболее интересных черт случайных величин задания их средних значений бывает совершенно недостаточно. Эти практически ин¬ тересные черты при таком задании остаются совершенно неизвестными, и для освещения их мы должны либо иметь перед собой всю таблицу распределения такой ве¬ личины, что практически почти всегда сложно и неудоб¬ но, либо постараться, кроме среднего значения такой величины, ввести для ее описания еще одно-два числа подобного же рода, так чтобы в своей совокупности эта небольшая группа чисел давала практически достаточ¬ ную характеристику тех черт изучаемой величины, ко¬ торые представляются нам наиболее существенными. Посмотрим, как может быть осуществлена эта последняя возможность. Как показывают рассмотренные нами примеры, во многих случаях практически наиболее важным оказы¬ вается вопрос о том, насколько велики, вообще говоря, отклонения значений, фактически принимаемых данной случайной величиной, от ее среднего значения, т. е. как сильно эти значения раскиданы, рассеяны; будут ли они по большей части тесно сгруппированы вокруг среднего значения (а значит, и между собой), или, напротив, большинство из них будет отличаться от среднего зна¬ чения очень резко (в этом случае некоторые из них по
§24] ИЗМЕРЕНИЯ РАССЕЯНИЯ 97 необходимости будут значительно отличаться и друг от друга). Следующая грубая схема позволяет ясно представить себе картину этого различия. Рассмотрим две случай¬ ные величины со следующими распределениями ве¬ роятностей: —0,01 +0,01 0,5 0,5 (I) — 100 + 100 0,5 0,5 (И) Обе случайные величины, таблицы которых мы выпи¬ сали, имеют своим средним значением нуль, но, в то время как первая из них всегда принимает значения, очень близкие к нулю (и между собой), вторая, наоборот, способна принимать лишь значения, резко отличаю¬ щиеся от нуля (и друг от друга). Для первой величины знание ее среднего значения дает нам вместе с тем и ориентировочные сведения о ее фактических возможных значениях; для второй же — среднее значение удалено от фактических возможных значений весьма значительно и не дает о них никакого представления. Мы говорим, что во втором случае возможные значения рассеяны гораздо больше, чем в первом. Таким образом, наша задача — найти число, которое разумным образом могло бы давать нам меру рассеяния случайной величины, которое хотя бы ориентировочно указывало нам, сколь больших отклонений этой вели¬ чины от ее среднего значения нам следует ожидать. От¬ клонение х—х случайной величины л: от ее среднего зна¬ чения х само есть, очевидно, случайная величина; слу¬ чайной величиной будет и абсолютное значение \х—~х\ этого отклонения, характеризующее его размер вне зави¬ симости от знака. Желательно иметь число, которое могло бы ориентировочно охарактеризовать это случай¬ ное отклонение \х—х\, сказать нам о том, сколь боль¬ шим, примерно, может оказаться это отклонение. Для решения этого вопроса существует много различных
98 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X способов, из которых наиболее употребительны на практике следующие три: 1. Среднее уклонение. За ориентировоч¬ ное значение случайной величины \х—х\ естественнее всего принять ее среднее значение \х—х\. Это среднее значение абсолютной величины уклонения называют средним уклонением величины х. Если случайная вели¬ чина х задается таблицей *1 х2 ... Ч Pi Р 2 ... Pk то таблица случайной величины \х—х\ имеет вид \Xi—x\ \х2 *1 ... fck—xl Pi Pz ... Pk где x='£xipi\ Аля среднего уклонения Мх величины х i= 1 мы получаем формулу = k __ Мх = \х — х\= 'E\xt—x\pi, i— i k где, разумеется, снова л: Для величин, заданных _ *=1 таблицами (I) и (II), л:=0, и мы соответственно имеем: Л1л, = 0,01 и М*п=100. Впрочем, оба примера тривиальны, так как в обоих слу¬ чаях абсолютная величина уклонения оказывается спо¬ собной принимать только одно значение, утрачивая, таким образом, характер случайной величины.
§ 24] ИЗМЕРЕНИЯ РАССЕЯНИЯ S3 Вычислим еще средние уклонения для случайных величин, определяемых таблицами (Г) и (1Г) на стр. 79. Мы видели там, что средние значения этих величин соответственно равны 2,1 и 2,2, т. е. очень близки друг к другу. Среднее уклонение для первой величины равно |1 —2,1 |х0,4 + | 2 — 2,1 |х0,1 4-| 3 — 2,1 |х 0,5=0,9, а для второй — |1— 2,2 |х0,1+| 2 — 2,2 |х 0,6 -|-| 3 — 2,2 |х 0,3 = 0,48. Мы видим, что для второй величины среднее уклонение почти вдвое меньше, чем для первой; практически это означает, очевидно, что хотя в среднем оба стрелка выбивают примерно одинаковое число очков и в этом смысле могут быть признаны одинаково искусными, но в то же время у второго стрелка стрельба носит значи¬ тельно более ровный характер, его результаты значи¬ тельно менее рассеяны, чем у первого стрелка, который при том же самом среднем числе очков стреляет неровно, часто давая результаты как много лучше, так и много хуже средних. 2. Среднее квадратическое укло¬ нение. Измерять ориентировочную величину укло¬ нения с помощью среднего уклонения — очень естест¬ венно, но вместе с тем и очень неудобно практически, так как вычисления и оценки с абсолютными величинами часто бывают сложны, а иногда и совсем недоступны. Поэтому на практике для величины уклонения обычно предпочитают вводить другую меру. Так же, как и уклонение х—л; случайной величины % от ее среднего значения х, квадрат (х—х)2 этого уклонения есть случайная величина, таблица которой в наших старых обозначениях имеет вид (х-х)> (х-х)2 ... (Xk-x)2 Pi р2 •• Pk
100 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X среднее значение этого квадрата равно поэтому i= i Эта величина дает нам представление о том, чему при¬ мерно равен квадрат уклонения х—а; поэтому, извле¬ кая из этой величины квадратный корень мы получаем величину, способную охарактеризовать нам примерный размер самого уклонения. Величина Qx называется средним квадратическим уклонением слу¬ чайной величины х9 а квадрат ее, т. е. величина Ql,— ее дисперсией. Разумеется, эта новая мера величины уклонения носит характер несколько более искусствен¬ ный, чем среднее уклонение, введенное нами выше: здесь мы идем обходным путем, находя сначала ориенти¬ ровочное значение для квадрата уклонения и лишь по¬ том, с помощью извлечения квадратного корня, возвра¬ щаясь к самому уклонению. Но зато, как мы увидим в следующем параграфе, использование средних квад¬ ратичных уклонений Qx значительно упрощает вычисле¬ ния. Именно это и заставляет статистиков на практике преимущественно пользоваться средними квадратиче¬ скими уклонениями. Пример. Для случайных величин, определяемых таблицами (Г) и (1Г) на стр. 79, мы имеем соответственно: Q*r = (1 — 2,1 )2 х 0,4 + (2 — 2,1 )2 х 0,1 + (3—2,1 )2 х 0,5 = 0,89 и Qliv = (1 — 2,2)2 х 0,1 + (2 - 2,2)2 х 0,6+ + (3 —2,2)2х0,3 = 0,36, и, следовательно, Qxv = /0^9^0,94 и Q*n' = 0,6. Выше мы имели для тех же величин средние уклонения: Мх г = 0,9 и ЛЫ1' = 0,48.
ИЗМЕРЕНИЯ РАССЕЯНИЯ J01 Мы видим, что среднее квадратическое уклонение, так же как и среднее уклонение, для первой величины зна¬ чительно больше, чем для второй; будем ли мы измерять рассеяние средним или средним квадратическим укло¬ нением, в обоих случаях мы приходим к тому же выводу, что первая из наших двух величин рассеяна в большей степени, чем вторая. В обоих случаях у нас среднее квадратическое укло¬ нение оказалось больше среднего уклонения; легко сооб¬ разить, что так оно должно быть для любой случайной величины. В самом деле, дисперсия Q*, как среднее зна¬ чение квадрата величины \х—х\, по правилу, доказан¬ ному на стр. 86, не может быть меньше, чем квадрат среднего значения Мх величины \х—х\, а из выте¬ кает QX^MX, 3. Срединное (вероятное) уклоне- н и е. Часто, особенно в военном деле, употребляется иной способ для определения размеров рассеивания; мы изложим его в терминах артиллерийского примера. 0 1 -J—,цг ^^ л рис. 9. Допустим, что ведется артиллерийская стрельба из точки О в направлении ОХ (рис. 9); расстояние х места падения снаряда от места вылета есть случайная вели¬ чина, среднее значение которой указывает нам поло¬ жение «центра попаданий» С(ОС—х), вокруг которого более или менее рассеиваются точки падения отдельных снарядов. Уклонение х—х изучаемой нами случайной величины (дальности полета снаряда) от ее среднего значения есть вместе с тем уклонение точки падения снаряда_от центра попаданий С; всякая оценка величины \х—х\ поэтому оценивает вместе с тем степень рассеяния, раскидывания снарядов вокруг этого центра С и служит, таким обра¬ зом, важнейшим показателем качества стрельбы.
102 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X Если мы отложим от точки С влево и вправо по очень малому отрезку длины а, то лишь немногие снаряды будут ложиться внутри полученного таким образом отрезка длины 2а с серединой в точке С, иначе говоря, вероятность того, что \х—х\<а, при малых а будет еще очень мала. Но будем теперь расширять построен¬ ный нами отрезок, увеличивая число а (которое ведь было выбрано произвольно). Чем больше будет построенный отрезок, тем большая доля снарядов будет падать внутри него и тем больше будет, значит, для отдельного снаряда вероятность попасть внутрь этого отрезка; когда а очень велико, то практически все снаряды будут падать внутри этого отрезка; таким образом, с постепенным воз¬ растанием числа а вероятность неравенства \х — х |<а растет от нуля до единицы; сначала, при малых а, ве¬ роятнее, что \х — х\>а, т. е. что снаряд упадет вне отрезка; а потом, при боль¬ ших а, вероятнее, что будет \х—х|<а, т. е. что снаряд упадет внутри отрезка. Поэтому где-то при переходе от малых значений числа а к более крупным должно быть такое значение а0 этого числа а, что снаряд имеет одина¬ ковую вероятность упасть как внутри, так и вне отрезка длины 2а0, построенного вокруг точки С. Другими сло¬ вами, неравенства \х —х\<а0 и \х—х\>а0 одинаково вероятны, и, значит, вероятность каждого из них равна -i- (если мы условимся пренебрегать ничтожно малой вероятностью точного равенства \х—х|=а). При а<а0 более вероятно второе, при а>а0 — первое из написанных неравенств. Таким образом, существует единственное определенное число а0 такое, что абсолют¬ ная величина уклонения с одинаковой вероятностью мо¬ жет оказаться как больше, так и меньше чем аа.
§ 25] ТЕОРЕМЫ О СРЕДНЕМ КВАДРАТИЧЕСКОМ УКЛОНЕНИИ ЮЗ Как велико а0 —-это зависит от качеств стреляющего орудия; легко видеть, что величина а0 может служить мерой рассеяния снарядов, подобно среднему или сред¬ нему квадратическому уклонению. В самом деле, если, например, а0 очень мало, то это означает, что уже на очень малый окружающий точку С отрезок ложится половина всех выпускаемых орудием снарядов, что свидетельст¬ вует о сравнительно незначительном рассеянии. Напро¬ тив, если а0 велико, то, окружив точку С даже большим отрезком, мы все же должны рассчитывать, что поло¬ вина снарядов будет ложиться за пределами этого от¬ резка; а это, очевидно, показывает, что снаряды сильно рассеиваются вокруг центра. Число а0 называют обычно срединным или вероятным уклонением величины х; таким образом, срединным или вероятным уклонением случайной величины х мы называем такое число, что уклонение х — х с одинаковой вероят¬ ностью может оказаться по абсолютному значению как больше, так и меньше этого числа. Хотя срединное укло¬ нение величины х, которое мы будем обозначать через Ех, для математических расчетов не более удобно, чем среднее уклонение Мх, и значительно менее удобно, чем среднее квадратическое уклонение Qx> тем не менее в артиллерии принято для оценки всех уклонений пользоваться именно величиной Ех. В дальнейшем мы узнаем, почему это на практике не ведет обычно ни к каким затруднениям. § 25. Теоремы о среднем квадратическом уклонении Убедимся теперь, что средние квадратические уклоне¬ ния действительно обладают особыми свойствами, застав¬ ляющими предпочитать их всяким другим характеристи¬ кам величины уклонения — средним, срединным (вероят¬ ным) уклонениям и т. п. Как мы убедимся немного позднее, для приложений основное значение имеет следую¬ щая задача. Пусть мы имеем несколько случайных величин х1,х2,„.,хп со средними квадратическими уклонениями qx, q29...9qn. Положим хх + х2 + ... + хп = X и спросим себя, как найти
104 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X среднее квадратическое уклонение Q величины X, если даны qv qv ..., qn и если мы предполагаем случайные ве¬ личины х£ (1 ^i^n) взаимно независимыми. В силу теоремы о сложении средних значений мы имеем: пользуясь правилом сложения средних значений, находим поэтому: Но так как величины х и xk, согласно нашему предполо¬ жению, при i=^=k взаимно независимы, то по правилу умножения средних значений взаимно независимых величин при 1фк (*, — X;) ■ (Хк — хк) = (Xj — X;) • (хк — Хк) Здесь оба множителя правой части равны нулю, так как, например, таким образом, в последней сумме равенства (2) каждый член в отдельности обращается в нуль, что приводит нас к соотношению X =xi +х2+... -\-хп и, следовательно, X-X = (xi — xl) + (х, — х2) +... + (хл — хп), откуда п _ п п %(х( — х 1')2+2 2(*«—*/)(** —**)• (!) Заметим теперь, что (X - X)2 = Q\ (xt - х,У = ц] (К / < я); п п п (Xj Xj) =х( xt = 0;
§ 25] ТЕОРЕМЫ О СРЕДНЕМ КВАДРАТИЧЕСКОМ УКЛОНЕНИИ Ю5 т. е. дисперсия суммы взаимно независимых случайных величин равна сумме их дисперсий. Мы видим, что в случае взаимно независимых случайных величин к правилу сложения средних значений присоеди¬ няется весьма важное правило сложения дисперсий; для средних квадратических уклонений мы отсюда получаем: <3 = ]/ЛД^. (3) Эта возможность просто выразить среднее квадратическое уклонение суммы через средние квадратические уклонения ее слагаемых в случае их взаимной независимости и пред¬ ставляет собой одно из важнейших преимуществ средних квадратических уклонений сравнительно со средними, сре¬ динными и другими уклонениями. Пример 1. При п выстрелах с одной и той же вероят¬ ностью попадания р среднее значение числа попаданий равно (как мы видели на стр. 90) пр. Чтобы ориентировочно оце¬ нить, сколь большим может оказаться уклонение фактиче¬ ского числа попаданий от этого среднего значения, найдем среднее квадратическое уклонение числа попаданий; проще всего сделать это применением формулы (3). В самом деле, число попаданий при п выстрелах можно (мы это уже делали при рассмотрении среднего числа брако¬ ванных изделий на стр. 90) рассматривать как сумму чисел попаданий при отдельных выстрелах, а так как эти числа мы считаем взаимно независимыми случайными величинами, то по правилу сложения дисперсий мы для вычисления сред¬ него квадратического уклонения Q общего числа попаданий можем воспользоваться формулой (3), где qv qv ..., qn озна¬ чают средние квадратические уклонения чисел попадания при отдельных выстрелах. Но число попаданий xL при i-M выстреле определяется таблицей 1 0 р 1 —р
106 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X поэтому *.=р И q]—(x—лу)2 =(1— р)2р+р2(1—р) = =р{ 1 — р); следовательно, Этим поставленная задача решена. Сопоставляя среднее значение пр числа попаданий с его средним квадратическим уклонением Vпр(\—р), мы видим, что при больших зна¬ чениях п (т. е. при большом числе выстрелов) последнее значительно меньше первого и составляет лишь небольшую долю его. Так, при /2=900, Р=\ среднее значение числа попаданий равно 450, а среднее квадратическое уклонение j/'900*-^—гг = 15, так что фактическое число попаданий другой вдоль некоторой оси и охватываемых с концов неко¬ торой объемлющей деталью (рис. 10). Длина каждой детали может несколько отличаться от соответствующего стан¬ дарта и есть поэтому случайная величина. Предположим эти случайные величины независимыми. Если средние дли¬ ны деталей и дисперсии этих длин равны соответственно то среднее значение и дисперсия длины цепи из п деталей равны В частности, если п = 9, аг = а2 = . . . =ая= 10 см и qx = q2 = .. .= q9 = 0,2 см, то а = 90 см и q =|/9-(0,2)2 = = 0,6 см. ориентировочно лишь на 3— 4% будет уклоняться от сво¬ его среднего значения. / 2 3 Рис. 10. п Пример 2. Представим себе, что производится сборка некоторого механизма, состо¬ ящего из п деталей, прикла¬ дываемых вплотную одна к
§ 25] ТЕОРЕМЫ О СРЕДНЕМ КВАДРАТИЧЕСКОМ УКЛОНЕНИИ Ю7 Мы видим, таким образом, что если в среднем длина каждой отдельной детали уклоняется от своего среднего значения на 2%, то длина цепи из этих деталей отличается от своего среднего значения примерно лишь на 2/,%. Это обстоятельство — уменьшение относительной ошибки при сложении случайных величин — играет значительную роль при сборке точных механизмов. Действительно, если бы не было взаимной компенсации отклонений размеров отдельг ных деталей от заданных нормальных размеров, то при сборке механизмов постоянно встречались бы случаи, когда объемлющие детали не охватывали бы объемлемой цепи или, напротив, при этом оставались бы чрезмерно большие зазоры. В обоих случаях получался бы явный брак; бороться с этим браком по пути уменьшения «допусков», т. е. по пути уменьшения допустимых отклонений фактических раз¬ меров детали от заданных, было бы нецелесообразно, так как сравнительно небольшое увеличение точности обработки значительно повышает ее стоимость *). Пример 3. Допустим, что в неизменных условиях производятся п измерений некоторой величины. В резуль¬ тате целого ряда обстоятельств (положения прибора, на¬ блюдателя, колебания в состоянии воздуха, наличия в кем пылинок и пр.) различные измерения будут давать, вообще говоря, различные результаты— имеют место случайные ошибки измерений. Будем обозначать результаты измерений через хг, хп, приписывая каждому л; в качестве индекса (значка) номер измерения. Среднее значение для всех этих случайных величин одно и то же — х. Среднее квадрати¬ ческое уклонение q> очевидно, также естественно предполо¬ жить одним и тем же для всех измерений, так как они производятся в неизменных условиях. Наконец, мы считаем, как обычно, величины Xj, х2, ... . хп взаимно независимыми. Рассмотрим теперь среднее арифметическое t _ s п результатов п измерений. Это — случайная величина; *) Техническая мысль в последнее время пришла к выводу о необ¬ ходимости создания теории допусков, основанной на соображениях и выводах теории вероятностей. Эта теория допусков сейчас усиленно раз¬ рабатывается советскими учеными.
108 РАССЕЯНИЕ И СРЕДНИЕ УКЛОНЕНИЯ [ГЛ. X найдем ее среднее значение и среднее квадратическое уклонение. По правилу сложения (*!+*!+• ••+^,)=4' (*!+*,+ • ■ • +*„) = 7Й=Я т. е. среднее значение, как это в сущности и ранее было очевидно, то же самое, что и для каждого отдельного изме¬ рения. Далее, среднее квадратическое уклонение суммы хх + + . . •+*„ по правилу сложения дисперсий (3) равно Q=Ynq2=-- qVn, а среднее квадратическое уклонение величины £, составляю¬ щей этой суммы, равно Q _ _я_ п Уп ' Мы приходим к очень важному результату: среднее ариф¬ метическое п взаимно независимых и одинаково распреде¬ ленных случайных величин имеет: а) среднее значение — то же самое, что и каждая из составляющих величин; б) среднее квадратическое уклонение — в Уп раз мень¬ шее, чем каждая из составляющих величин. Так, если среднее значение измеряемой величины л:=200 Му а среднее квадратическое уклонение q=5 м, то среднее арифметическое £ сотни результатов измерений будет, конечно, иметь своим средним значением то же число 200 м\ но среднее квадратическое уклонение его будет в |/166=10 раз меньше, чем для отдельного измерения, т. е. будет составлять всего -^=0,5 м. Таким образом, имеются основания ожидать, что среднее арифметическое сотни фактических результатов измерений будет значительно ближе к среднему значению 200 му чем результат того или другого отдельного измерения. Среднее арифметическое большого числа взаимно независимых величин обладает во много раз меньшим рассеянием, чем каждая из этих величин в отдельности.
ГЛАВА ОДИННАДЦАТАЯ ЗАКОН БОЛЬШИХ ЧИСЕЛ § 26. Неравенство Чебышева Мы говорили уже много раз о том, что знание какого- либо из средних уклонений случайной величины (напри¬ мер, ее среднего квадратического уклонения) позволяет нам создать ориентировочное представление о том, как велики те уклонения фактических значений этой величины от ее среднего значения, которые нам следует ожидать. Однако это замечание само по себе не содержит еще никаких коли¬ чественных оценок и не дает возможности хотя бы при¬ ближенно рассчитать, сколь вероятными могут оказаться большие уклонения. Все это позволяет сделать следующее простое рассуждение, проведенное впервые Чебышевым. Будем исходить из выражения дисперсии случайной вели¬ чины х (стр. 100): Ql= 2 (Xi — xYpi- i— i Пусть а — любое положительное число; если в только что написанной сумме мы выбросим все члены, где \xi—х|Са, и оставим только те, где \х{—х|>а, то от этого сумма может только уменьшиться: Qiss S (Xi—xYpi. I *i—x | > a Но эта сумма уменьшится еще более, если в каждом ее члене мы заменим множитель (xi—х)2 меньшей величиной а2:
110 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. XI Сумма, стоящая теперь в правой части, есть сумма вероят¬ ностей всех тех значений х{ случайной величины *, которые уклоняются от л: в ту или другую сторону больше, чем на а; по правилу сложения это есть вероятность того, что вели¬ чина х получит какое-либо одно из этих значений. Другими словами, это есть вероятность Р(\х—я|>а) того, что фак¬ тически полученное уклонение окажется больше, чем а; таким образом, мы находим: Р(\х— х|>а)<^£, (1) а2 что позволяет нам оценить вероятность уклонений, больших чем любое заданное число а, если только известно среднее квадратическое уклонение Qx. Правда, оценка, даваемая «неравенством Чебышева» (1), часто оказывается весьма грубой; все же иногда она может быть использована и непосредственно практически, не говоря уже о том, что теоретическое значение ее чрезвычайно велико. В конце предыдущего параграфа мы рассматривали та¬ кой пример: среднее значение результатов измерений — 200 м, среднее квадратическое уклонение — 5 м\ при этих условиях вероятность фактически получить уклонение больше 3 м весьма ощутительна (можно думать, что она больше половины; точное значение ее может, конечно, быть найдено только тогда, когда полностью известен закон рас¬ пределения результатов измерений). Но мы видели, что для среднего арифметического £ сотни результатов измере¬ ний среднее квадратическое уклонение составляет всего 0,5 м. Поэтому в силу неравенства (1) Р (| I - 200| >3) < М=^0)03. Таким образом, для среднего арифметического из 100 измерений вероятность получить уклонение более 3 м уже очень мала (на самом деле она еще значительно меньше полученной нами границы, так что практически можно совсем не считаться с возможностью такого уклонения). В примере 1 на стр. 105—106 мы имели для числа попа¬ даний при 900 выстрелах среднее значение 450 и среднее квадратическое уклонение 15; для вероятности того, что
§ 27] ЗАКОН БОЛЬШИХ ЧИСЕЛ 111 фактическое число т попаданий будет заключено, напри¬ мер, между 400 и 500 (т. е. | т—450 50), неравенство Чебышева дает: Р(\т — 450 | ^ 50) = 1 — Р (|т — 450 |> 50) ^ >.-£-0.9., На самом деле эта вероятность еще значительно больше. § 27. Закон больших чисел Пусть мы имеем п взаимно независимых случайных величин xv х2, ... ухп с одним и тем же средним значе¬ нием а и одним и тем же средним квадратическим укло¬ нением q\ для среднего арифметического этих величин t Х\Л~Хг~\~ • * • ~\~Хц * ~~ П как мы видели на стр. 108, среднее значение равно а, а сред- q нее квадратическое уклонение равно ; поэтому нера¬ венство Чебышева дает при любом положительном а Р(||-а|>а)<^. (2) Пусть, например, речь идет о среднем арифметическом п измерений некоторой величины, и пусть, как мы имели прежде, <7 = 5 ж, а—200 ж. Тогда мы получаем: P(|£-200|>a)<J|. Мы можем выбрать а очень небольшим, например а=0,5 ж; тогда Р(||-200|>0,5)<^. Если число измерений п очень велико, то правая часть этого неравенства как угодно мала; так, при «=10 000 она равна 0,01, и мы имеем для среднего арифметического 10 000 измерений Р(|| —2001> 0,5) <0,01.
112 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. XI Если мы условимся пренебрегать возможностью столь мало¬ вероятных событий, то мы можем сказать, что при 10 ООО измерений их среднее арифметическое наверняка будет отличаться от 200 м в ту или в другую сторону не более чем на 50 aw. Если бы мы захотели достигнуть еще боль¬ шей близости, например 10 см, то надо было бы положить а=0,1 м, и мы получили бы p(|i-200[>0,I,«S0-f_-Hf. Чтобы сделать менее 0,01 правую часть этого неравенства, мы должны были бы взять число измерений равным не 10 000 (этого теперь недостаточно), а 250 000. Очевидно, что вообще мы можем, сколь бы мало ни было а, сделать правую часть неравенства (2) как угодно малой — для этого стоит только взять п достаточно большим. Таким об¬ разом, при достаточно большом п мы можем считать сколь угодно близким к достоверности обратное неравенство \1 — а\^а. Если случайные величины xi, Х2, ... , хп взаимно неза¬ висимы и если все они имеют одно и то же среднее значение а и одно и то же среднее квадратическое уклонение, то величина £ Х\~\~%2~\~ * * Г~\~ХП п при достаточно большом п будет с вероятностью, как угодно близкой к единице (практически достоверно), как угодно мало отличаться от а. Это—простейший частный случай одной из самых основ¬ ных теорем теории вероятностей, так называемого закона больших чисел, открытого в середине прошлого столетия ве¬ ликим русским математиком Чебышевым. Глубокое содержа¬ ние этого замечательного закона состоит в том, что,в то время как отдельная случайная величина может (как мы знаем) часто принимать значения, далекие от ее среднего значения (иметь значительное рассеяние), среднее арифметическое большого числа случайных величин ведет себя в этом отно¬ шении совершенно иначе: такая величина очень мало рассея¬ на, с подавляющей вероятностью она принимает лишь зна¬ чения, очень близкие к ее среднему значению. Происходит
ДОКАЗАТЕЛЬСТВО ЗАКОНА БОЛЬШИХ ЧИСЕЛ 113 это, конечно, потому, что при взятии среднего арифмети¬ ческого случайные уклонения в ту и другую сторону вза¬ имно уничтожаются, вследствие чего суммарное уклонение в большинстве случаев и оказывается малым. Важное и часто встречающееся в практике использова¬ ние результатов только что доказанной теоремы Чебышева состоит в том, что по сравнительно небольшой пробе (вы¬ борке) судят о качестве большого количества однород¬ ного материала. Так, например, о качестве хлопка, нахо¬ дящегося в кипе, судят по нескольким маленьким его пучочкам (штапелям), выхваченным случайно из разных мест кипы. Или о качестве большой партии зерна судят по нескольким небольшим пуркам (меркам), наполненным случайно захваченными в пурку зернами из разных мест оцениваемой партии *). Суждения о качестве продукции, сделанные на основании такой выборки, обладают большой точностью, так как, скажем, число зерен, захваченных в пурку, хотя и мало по сравнению со всем запасом зерна, но само по себе велико и позволяет, согласно закону боль¬ ших чисел, достаточно точно судить о среднем весе одного зерна и, значит, о качестве всей партии зерна. Точно так же о двадцатипудовой кипе хлопка судят по маленькому шта¬ пелю, содержащему несколько сотен волокон, весящих всего- навсего какую-нибудь десятую долю грамма, § 28. Доказательство закона больших чисел До сих пор мы рассматривали только случай, когда все величины xv х2, ... имеют одно и то же среднее зна¬ чение и одно и то же среднее квадратическое уклонение. Однако закон больших чисел применяется и в гораздо более общих предположениях. Мы будем теперь рассматри¬ вать случай, когда средние значения величин xv х,2 . . . могут быть какими угодно числами (мы будем обозначать их соответственно через ал, а2, . . .), вообще говоря, между собою различными. Тогда средним значением величины 1 = -^ (*1+*2+- • •+*„)» *) В пурку захватывают, скажем, 100—200 граммов, а вся партии содержит десятки, а может быть даже сотни тонн зерна. 5 Б» В. Гнеденко и А. Я. Хинчин
i 14 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. XI очевидно, будет величина А = — (ai + а2+ ... +ап)> причем, в силу неравенства Чебышева (1), при любом по¬ ложительном а Р(|£_Л|>а)<§. (3) Мы видим, что все сводится к оценке величины Q*, но оценить эту величину здесь почти так же просто, как и в ра¬ нее рассмотренном частном случае. Q: есть дисперсия величины £, которая равна разделенной на п сумме п вза¬ имно независимых случайных величин (предположение о взаимной независимости мы, разумеется, сохраняем). По правилу сложения дисперсий мы имеем поэтому Q;=Jp(<71 + ^2+ • • .+<7 ")> где qiy q2, ... соответственно означают средние квадрати¬ ческие уклонения величин хх> х2, . . . Мы теперь будем предполагать, что эти средние квадратические уклонения, вообще говоря, также различны между собой. Однако мы допустим все же, что, сколь бы много величин мы ни брали (т. е. сколь бы велико ни было число п), средние квадра¬ тические уклонения всех этих величин всегда будут меньше некоторого положительного числа Ь. На практике это усло¬ вие всегда оказывается выполненным, так как складывать приходится величины более или менее однотипные, и сте¬ пень их рассеяния оказывается не слишком различной для различных величин. Итак, мы допустим, что qt<b (i= 1, 2,...); но тогда последнее равенство дает нам вследствие чего мы заключаем из неравенства (3), что Я(||-Л|>«)< Как бы мало ни было а, при достаточно большом числе п
§ 28J ДОКАЗАТЕЛЬСТВО ЗАКОНА БОЛЬШИХ ЧИСЕЛ П5 взятых случайных величин правая часть этого неравенства может быть сделана как угодно малой; это, очевидно, и доказывает закон больших чисел в рассматриваемом нами теперь общем случае. Итак, если величины хх, х2, ... взаимно независимы, а средние квадратические уклонения их все остаются меньше одного и того же положительного числа, то при достаточно. больших п для среднего арифметического £ = ^ (*,+*2+' * •+*») можно с вероятностью, сколь угодно близкой к единице, ожидать сколь угодно малых по абсолютной величине укло¬ нений t Это и есть закон больших чисел в общей форме, при¬ данной ему Чебышевым. Сейчас уместно обратить внимание на одно существен¬ ное обстоятельство. Предположим, что производится изме¬ рение некоторой величины а. Повторив измерения в одина¬ ковых условиях, наблюдатель получит не вполне совпада¬ ющие числовые результаты хх, я2, . . ., хп. В качестве при¬ ближенного значения а он берет среднюю арифметическую а^^{хг\-х2-\-...+хп). Спрашивается, можно ли рассчитывать получить сколь угодно точное значение а, если произвести достаточно боль¬ шое число опытов? Это будет так, если измерения производятся без систе¬ матической ошибки, т. е. если xk = a (при /г = 1, 2, ..., п) и если сами значения не обладают неопределенностью. Иными словами, если при измерениях мы читаем те пока¬ зания на приборе, которые там в действительности полу¬ чаются. Если же прибор устроен так, что он не может давать точности отсчета, большей чем некоторая величина б, на¬ пример из-за того, что ширина деления шкалы, по кото¬ рой производится отсчет, равна б, то понятно, что нельзя и рассчитывать получить точность, большую чем ±б< 5*
116 ЗАКОН БОЛЬШИХ ЧИСЕЛ [ГЛ. XI Ясно, что в этом случае и средняя арифметическая бу¬ дет обладать той же неопределенностью б, как и каж¬ дое из хк. Сделанное замечание учит нас, что если приборы дают нам результаты измерений с некоторой неопределенностью б, то стремиться посредством закона больших чисел получить значение а с большей точностью является заблуждением, а сами производимые при этом вычисления превращаются в пустую арифметическую забаву.
ГЛАВА ДВЕНАДЦАТАЯ НОРМАЛЬНЫЕ ЗАКОНЫ § 29. Постановка задачи Мы видели, что значительное количество явлений при¬ роды, а также производственных процессов и боевых опера¬ ций протекает при существенном участии тех или иных слу¬ чайных величин. Часто до того, как явление, процесс или операция не завершены, все, что мы можем знать об этих случайных величинах,— это их законы распределения, т.е. списки их возможных значений с указанием вероятности каждого из этих значений. Если величина может получать бесчисленное множество различных значений (дальность полета снаряда, величина ошибки измерения и т. п.), то предпочтительнее указывать вероятности не отдельных значений ее, а целых участков таких значений (например, вероятность того, что ошибка измерения будет заключена в пределах от — 1 мм до + 1 мм, от 0,1 мм до 0,25 мм и т. д.). Это соображение не меняет существа дела,— чтобы стать хозяевами случайной величины, чтобы овладеть ею в меру наших сил и возможностей, мы должны получить возможно точное представление о ее законе распределения. Если бы мы, стараясь узнать законы распределения встречающихся нам случайных величин, отказались от всяких рассуждений и догадок общего характера и к каж¬ дой случайной величине подходили без всяких предвари¬ тельных предположений, стремясь найти чисто опытным путем все черты свойственного ей закона распределения, то мы поставили бы себя перед задачей, практически почти невыполнимой по своей трудоемкости. В каждом новом случае потребовалось бы большое число опытов, чтобы
118 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XI установить хотя бы важнейшие черты ксвого, неизвестного нам закона распределения. Поэтому ученые уже давно ста¬ рались найти такие общие типы законов распределения, на¬ личие которых можно было бы с разумным основанием предвидеть, ожидать, подозревать, если не для всех, то по крайней мере для широких классов встречающихся на прак¬ тике случайных величин. И уже давно некоторые такие типы были теоретически установлены, а затем наличие их было подтверждено опытом. Понятно, насколько выгодно бывает, на основании теоретических рассуждений и всего предше¬ ствующего опыта, заранее иметь возможность предугадать, какого типа должен быть закон распределения вновь встре¬ тившейся нам случайной величины. Если такая догадка оказывается правильной, то обычно уже весьма небольшого числа опытов или наблюдений бывает достаточно, чтобы установить все нужные нам черты искомого закона рас¬ пределения. Теоретические исследования показали, что в большом числе встречающихся на практике случаев мы с достаточ¬ ным основанием можем ожидать законов распределения некоторого совершенно определенного типа. Эти законы называются нормальными законами. Об этих законах мы кратко, опуская за их сложностью все доказательства и точные формулировки, расскажем в настоящей главе. Среди случайных величин, встречающихся нам в прак¬ тике, очень многие носят характер «случайных погреш¬ ностей», или «случайных ошибок», или по крайней мере легко сводятся к таким «погрешностям». Пусть, например, мы изучаем дальность х полета снаряда при стрельбе из некоторого орудия. Мы, естественно, допускаем, что суще¬ ствует некоторая нормальная, средняя дальность лг0, на которую мы устанавливаем прицельные приборы; разность х—х0 составляет «погрешность», или «ошибку», дальности, и изучение случайной величины х целиком и непосред¬ ственно сводится к изучению «случайной ошибки» х—х0. Но такая ошибка, меняющая свою величину от выстрела к выстрелу, зависит, как правило, от очень многих причин, действующих независимо друг от друга: случайные коле¬ бания ствола орудия, неизбежный (хотя бы и небольшой) разнобой в весе и форме снарядов, случайные изменения
§ 30j ПОНЯТИЕ КРИВОЙ РАСПРЕДЕЛЕНИЯ 119 атмосферных условий, вызывающие изменения в сопротив¬ лении воздуха, случайные ошибки в наводке (если эта наводка производится заново перед каждым выстрелом или каждой небольшой группой выстрелов),— все эти и многие другие причины способны вызвать ошибки в дальности полета. Все эти частичные ошибки будут независимыми между собой случайными величинами, причем такими, что действие кскнсдой из них составляет лишь очень малую долю их совокупного действия, а окончательная ошибка х—хс, которую мы хотим исследовать, будет просто суммарным действием всех этих случайных ошибок, происходящих от отдельных причин. Таким образом, в нашем примере интересующая нас ошибка является суммой большого числа взаимно независимых случайных величин, и ясно, что подобным же образом дело будет обстоять для большинства случайных ошибок, с которыми мы имеем дело на практике. И вот, теоретическое рассуждение, которого мы здесь не можем воспроизвести, показывает, что закон распреде¬ ления случайной величины, являющейся суммой очень большого числа взаимно независимых случайных величин, уже в силу одного этого, какова бы ни была природа слагае¬ мых, лишь бы каждое из них было мало по сравнению со всей суммой, должен быть близок к закону некоторого со¬ вершенно определенного типа *). Этот тип и есть тип нормальных законов. Таким обра¬ зом, мы получаем возможность предполагать, что весьма значительная часть встречающихся в практике случайных величин (все ошибки, складывающиеся из большого числа взаимно независимых случайных ошибок) приблизительно распределена по нормальным законам. Теперь мы должны будем ознакомиться с основными чертами этих законов. § 30. Понятие кривой распределения В § 15 мы уже имели случай изображать законы рас¬ пределения графически, с помощью диаграмм; этот способ очень полезен, так как позволяет одним взглядом, не при¬ бегая к исследованию таблиц, охватить важнейшие черты *) См. об этом также заключение.
120 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII исследуемого закона распределения. Схема этого изображе¬ ния такова: на горизонтальной прямой откладываются раз¬ личные возможные значения данной случайной величины, начиная от некоторого начала отсчета О, положительные Р5 ■i $ Р* t * (■ *Р' р\ ОС 1 А Рг[ Я7 -Cty 0 X2 Xj Рис. 11. Мм вправо, отрицательные влево (рис. 11). Против каждого такого возможного значения откладывают по вертикали кверху вероятность этого значения.Масштаб в обоих направ¬ лениях выбирается та¬ кой, чтобы вся диаграм¬ ма имела удобную и лег¬ ко обозримую форму. Один беглый взгляд на рис. 11 убеждает нас в том, что характеризуе¬ мая им случайная ве- личина имеет наиверо- -LL^-* ятнейшее значение хь (отрицательное) и что по мере удаления воз¬ можных значений этой величины от числа хь вероятности их непрестанно (и до¬ вольно быстро) убывают. Вероятность того, что величина примет значение, заключенное в каком-либо отрезке (а, Р), по правилу сложения равна сумме вероятностей всех воз¬ можных значений, лежащих в этом отрезке, и геометрически изображается суммой длин вертикальных черточек, распо¬ ложенных над этим отрезком; на рис. 11 Р(а<^х<$) = =P1+Pi+P4t+Pi- Если, как это часто бывает на практике, Р Рис. 12. а
ПОНЯТИЕ КРИВОЙ РАСПРЕДЕЛЕНИИ 121 число возможных значений очень велико, то, чтобы чертеж не слишком вытянулся по горизонтали, берут очень малый масштаб в горизонтальном направлении, вследствие чего возможные значения располагаются чрезвычайно густо (рис. 12), так что верхушки проведенных вертикальных черточек сливаются для нашего глаза в одну сплошную кри¬ вую линию, которую называют «кривой распределения» дан¬ ной случайной величины. И здесь, конечно, вероятность -if— I 1 1 Г ‘ ! Рис. 13. неравенств а <С*<^ графически изображается суммой длин вертикальных черточек, расположенных над отрез¬ ком (а, р). Допустим теперь, что расстояние между двумя соседними возможными значениями всегда равно единице; это будет, например, если возможные значения выражаются рядом по¬ следовательных целых чисел, чего практически всегда можно достигнуть, выбирая достаточно мелкую единицу масштаба. Тогда длина каждой вертикальной черточки численно равна площади прямоугольника, высотой которого служит эта черточка, а основанием — равное единице рас¬ стояние ее от соседней черточки (рис. 13). Таким образом, вероятность неравенств а<х<р графически может быть изображена суммой площадей нарисованных на чертеже прямоугольников, расположенных над этим отрезком. Но если возможные значения расположены очень густо, как на предыдущем рис. 12, то сумма площадей таких прямоуголь¬ ников практически не будет отличаться от площади криво¬ линейной фигуры, ограниченной снизу отрезком (а, (3), сверху —■ кривой распределения, а с боков — вертикаль¬
122 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII ными черточками, проведенными из точек а и Р (рис. 14) *). Таким образом, на криволинейной диаграмме типа рис. 14 вероятность попадания данной случайной величины в любой отрезок просто и удобно выражается площадью, лежащей над этим отрезком ниже кривой распределения. Если закон распределения данной величины задается такой криволи¬ нейной диаграммой, то на ней вовсе не проводят вертикаль¬ ных черточек, которые ни к чему не нужны и только загро¬ моздили бы собой чертеж; да и самый вопрос о вероятностях отдельных значений здесь теряет свою актуальность; если возможных значений очень много (а ведь именно это и лежит в основании всех криволинейных диаграмм), то вероятности отдельных значений будут, как правило, ничтожно малы (практически равны нулю) и теряют всякий интерес. Так, при измерении расстояния между двумя населенными пунктами совсем несущественно знать, что результат изме¬ рения отклонится от истинного значения ровно на 473 см. Напротив, представляет существенный интерес вопрос о вероятности уклонения, заключенного в промежутке от 3 м до 5 м. И так во всех подобных случаях: если случайная величина принимает очень много значений, то нам важно знать вероятности не отдельных этих значений, а вероятно¬ сти целых отрезков таких значений. Но именно эти вероят¬ ности даются наглядно и непосредственно, как мы только что видели, площадями на криволинейных диаграммах. ' *) При этом, конечно, по-прежнему за единицу длины принимается расстояние между двумя соседними возможными значениями.
§ 31] СВОЙСТВА НОРМАЛЬНЫХ КРИВЫХ РАСПРЕДЕЛЕНИЯ 123 § 31. Свойства нормальных кривых распределения Величина, распределенная по нормальному закону, всегда имеет бесчисленное множество возможных значений; поэтому нормальные законы удобно графически изображать криволинейными диаграммами. I I I I Рис. 15. На рис. 15 изображено несколько кривых распределения по нормальному закону. Несмотря на все различия в облике этих кривых, мы видим у них ясно выраженные общие им всем черты: 1) Все кривые имеют одну наивысшую точку, при уда¬ лении от которой вправо или влево они непрестанно пони¬ жаются. Очевидно, это означает, что при удалении значе¬ ний случайной величины от ее наивероятнейшего значения вероятности их непрестанно убывают. 2) Все кривые симметричны относительно вертикальной прямой, проведенной через наивысшую точку. Очевидно, это означает, что значения, равноудаленные от наизероят- нейшего значения, имеют одинаковые вероятности.
124 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. ХП 3) Все кривые имеют колоколообразную форму; вблизи наивысшей точки они обращены выпуклостью кверху, а на некотором расстоянии от нее перегибаются и обращаются выпуклостью книзу; расстояние это (как и наибольшая высота) различно для различных кривых *)• Чем же отличаются друг от друга различные нормаль¬ ные кривые? Чтобы ясно ответить на этот вопрос, мы должны прежде всего вспомнить, что для всякой кривой распределения вся расположенная под нею площадь равна единице, ибо площадь эта равна вероятности того, что дан¬ ная случайная величина примет какое бы то ни было из своих значений, т. е. вероятности достоверного события. Отличие отдельных кривых распределения друг от друга состоит поэтому лишь в том, что эта суммарная площадь, одна и та же для всех кривых, различным образом рас¬ пределена между различными участками. Для нормальных законов, как показывают кривые на рис. 15, вопрос в ос¬ новном заключается в том, какая доля этой суммарной площади сосредоточена над участками, непосредственно примыкающими к наивероятнейшему значению, и какая — над участками, более удаленными от этого значения. Для закона, изображаемого рис. 15, а), почти вся площадь сосредоточена в непосредственной близости наивероятней¬ шего значения; это означает, что случайная величина с подавляющей вероятностью — и, значит, в подавляющем большинстве случаев — принимает значения, близкие к ее наивероятнейшему значению; так как в силу указанной выше симметрии в случае нормального закона наивероят¬ *) Для читателей, знакомых с элементами высшей математики, мы за¬ метим, что уравнение кривой, изображающей нормальный закон, имеет такой вид: где число <?=2,71828... есть основание натуральных логарифмов, тс=3,14159...— отношение длины окружности к ее диаметру, а величины а и а2 представляют собой среднее значение и дисперсию случайной ве¬ личины. Знание аналитической формы нормального закона "может зна¬ чительно облегчить читателю ознакомление с дальнейшим материалом книги. Однако изложение всего последующего доступно и читателю, во¬ все не знакомому с высшей математикой.
§ 31] СВОЙСТВА НОРМАЛЬНЫХ КРИВЫХ РАСПРЕДЕЛЕНИЯ 125 нейшее значение всегда совпадает со средним значением, то мы можем сказать, что случайная величина, подчиненная закону а), мало рассеяна; в частности, ее дисперсия и сред¬ нее квадратическое уклонение малы. Наоборот, в случае, изображенном на рис. 15, в), пло¬ щадь, сосредоточенная в непосредственной близости каи- вероятнейшего значения, составляет лишь небольшую долю суммарной площади [мы сразу увидим различие, если со¬ поставим на рис. 15, а) и в) участки (а, р) одинаковой длины и расположенные над ними площади]. Здесь весьма вероятно поэтому, что случайная величина будет получать значения, заметно уклоняющиеся от ее наизероятнейшего значения. Величина сильно рассеяна, ее дисперсия и среднее квадра¬ тическое уклонение велики. Случай б), очевидно, занимает положение, промежу¬ точное между случаями а) и в). Чтобы наиболее быстрым образом ознакомиться со всей совокупностью нормальных законов и научиться применять эти законы, нам будет целесообразно исходить из двух основных свойств этих законов; эти свойства, которые будут сейчас подробно сформулированы, мы здесь не сможем доказать, так как для этого нам пришлось бы прежде всего точно определить нормальные законы, что потребовало бы от читателя знания высшей математики. Свойство 1. Если величина х распределена по нор¬ мальному закону, то 1) при любых постоянных 00 и d величина cx+d также распределена по некоторому нормальному закону, и 2) обратно, для любого нормального закона найдется такая (единственная) пара чисел с>0 и d, что величина cx-\-d распределена именно по этому закону. Таким образом, если случайная величина х распреде¬ лена по нормальному закону, то законы распределения, которым подчиняются величины cx-\-d при всевозможных значениях постоянных с>0 и d,— это все нормальные законы. Свойство 2. Если случайные величины хп у взаимно независимы и распределены по нормальным законам, то и сумма их г = х + у распределена по некоторому нормаль¬ ному закону.
126 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII Приняв без доказательства эти два основных свойства, мы можем теперь уже строго обосновать ряд вытекающих из них свойств нормальных законов, особенно важных для практики. I. Для любых двух чисел а и q^>0 существует единствен¬ ный нормальный закон со средним значением a w средним квадратическим уклонением q. В самом деле, пусть х — случайная величина, распреде¬ ленная по нормальному закону со средним значением х и средним квадратическим уклонением Qx. На основании свойства 1 наше утверждение будет доказано, если мы покажем, что существует единственная пара чисел с>0 и d, удовлетворяющая тому требованию, чтобы величина cx-\-d имела среднее значение а и среднее квадратическое укло¬ нение q. Если таблица величины х имеет вид A'j x2 *n Pi Pz ... Pn то величине cx+d (где с>0 и d—пока любые постоянные) будет соответствовать таблица cx^+d 1 cx2-\- d j ... cxn-\-d Pi Pz Pn Очевидно, ^ixkPk = x* IL(xk х) Pk~Qx*)* Наши требования сводятся к двум условиям: ^,(cxk+d)pk=a) ^{cxk+d — aypk = q\ П *) Знак 2 ~ сокращенный; он обозначает 2 • k k=l
§ 31] СВОЙСТВА НОРМАЛЬНЫХ КРИВЫХ РАСПРЕДЕЛЕНИЯ 127 Первое из этих условий дает c1lx,<Pk+d'£pk=a, к к (О 2 (cxk+d — сх — dfpk = с2 2 (хк—х)2рк=сг0.% = <?\ к к откуда (так как с>0) (2) и, значит, из (1) d=a — сх=а — ^ . W.X (3) Таким образом, по данным а и q числа с и d с помощью формул (2) и (3) всегда могут быть найдены, и притом единственным способом; величина cx+d подчиняется нор¬ мальному закону со средним значением а и средним квадра¬ тическим уклонением q\ этим наше утверждение полностью доказано. Если не ограничиваться нормальными законами, а рас¬ сматривать всевозможные законы распределения, то задание среднего значения и дисперсии или среднего квадратического уклонения случайной величины дает нам об ее законе рас¬ пределения еще очень мало сведений, так как существует весьма много (и притом существенно различных между собой) законов распределения, обладающих одним и тем же средним значением и одной и той же дисперсией; в общем случае задание среднего значения и дисперсии лишь весьма при¬ близительно характеризует нам закон распределения данной случайной величины. Иначе обстоит дело, если мы соглашаемся ограничиться рассмотрением одних только нормальных законов. Как мы только что убедились, с одной стороны, любое предположе¬ ние о среднем значении и дисперсии данной случайной вели¬ чины совместимо с требованием, чтобы она подчинялась нормальному закону. С другой стороны,— и это самое глав¬ ное,— если мы имеем основание заранее предполагать, что
128 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII данная величина распределена по одному из нормальных законов, то заданием ее среднего значения и дисперсии этот ее закон распределения однозначно определяется, так что ее природа как случайной величины становится полно¬ стью известной. В частности, зная среднее значение и дис¬ персию такой величины, мы можем вычислить вероятность того, что значение ее будет принадлежать тому или другому произвольно выбранному участку. II. Отношение срединного (вероятного) уклонения к среднему квадратическому уклонению одно и то же для всех нормальных законов. Пусть мы имеем два произвольных нормальных закона, и пусть х — случайная величина, подчиняющаяся первому из этих законов. В силу основного свойства I существуют такие постоянные числа с>0 и d, что величина cx+d распре¬ делена согласно второму из данных законов. Обозначим соответственно через Qx и Ех среднее квадратическое укло¬ нение и срединное (вероятное) уклонение первой величины и через q we — те же уклонения для второй величины. По определению вероятного уклонения мы имеем Отсюда, снова по определению вероятного уклонения, сле¬ дует, что у есть вероятное уклонение величины х, т. е. поэтому соотношение (2) показывает, что Р {| (сх-\ d) — (cx+d) | } =— , или Р {c\x — x\<e} = j, или, наконец, е __ я Ex Qx
§ 31] СВОЙСТВА НОРМАЛЬНЫХ КРИВЫХ РАСПРЕДЕЛЕНИЯ 129 откуда т. е. отношение вероятного уклонения к среднему квадра¬ тическому уклонению одинаково для наших двух законов. Так как эти законы, по предположению, были двумя произвольными нормальными законами, то наше утвержде¬ ние доказано. Отношение ~ есть, таким образом, абсолютная постоян¬ ная; обозначим ее буквой К] вычислено, что В силу этой исключительно простой связи между числами е и q для величин, распределенных по нормальным законам, практически безразлично, какой из двух характеристик рассеяния мы будем пользоваться; мы видели выше, что, вообще говоря (т. е. если не ограничиваться величинами, распределенными по нормальным законам), среднее квадра¬ тическое уклонение обладает целым рядом простых свойств, которых лишены другие характеристики и которые в боль¬ шинстве случаев заставляют как теоретиков, так и практи¬ ков выбирать в качестве меры рассеяния именно средние квадратические уклонения. Там же мы указали, что артил¬ леристы, тем не менее, почти всегда пользуются срединными уклонениями. Мы видим теперь, почему эта традиция не может принести никакого ущерба: те случайные величины, с которыми имеют дело артиллерийская наука и практика, почти всегда оказываются распределенными по нормальным законам, а для таких величин, в силу упомянутой выше пропорциональности, выбор той или другой из двух харак¬ теристик практически безразличен. III. Пусть х и у—взаимно независимые случайные ве¬ личины, подчиненные нормальным законам, и z=x+y. Значит, для любого нормального закона
130 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII Тогда E=-\f Е*х+Е'у, где Ех, Е > Ег означают соответственно вероятные уклоне¬ ния величин ху у, z. Аналогичная формула для средних квадратических укло¬ нений, как мы знаем из § 25, имеет место, каковы бы ни * были законы распределения величин х и у. В случае, когда это нормальные законы, величина z в силу основного свойства 2 также распределена по нормальному закону; поэтому в силу предыдущего свойства II Ex = XQx, Ey = kQy, E, = XQt, и, значит, Ег = х У Q*-f q; = /= El+E Мы видим, что в случае нормальных законов одно из наиболее важных свойств средних квадратических укло¬ нений непосредственно переносится и на вероятные (сре¬ динные) уклонения. § 32. Решение задач Условимся называть основным нормальным законом закон, для которого среднее значение равно нулю, а дис¬ персия — единице. Если х есть случайная величина, под¬ чиненная основному нормальному закону, то условимся для краткости писать Р{ |*|<а} = Ф (а) для любого положительного числа а. Таким образом, Ф(а) есть вероятность того, что величина х, подчиненная основ¬ ному нормальному закону, по абсолютному значению не превзойдет числа а. Для величины Ф (а) составлена очень точная таблица, дающая ее значения для различных зна¬ чений числа а. Такая таблица служит незаменимым орудием для каждого, кому приходится иметь дело с расчетами ве¬ роятностей. Она прилагается ко всякой книге, посвященной теории вероятностей. В конце нашей книжки читатель также найдет такую таблицу. Имея таблицу значений функ¬ ции Ф(а) под руками, можно легко и с большой точностью
§ 32] РЕШЕНИЕ ЗАДАЧ 131 производить все расчеты для любых величин, распределен¬ ных по нормальным законам. Мы теперь покажем на при¬ мерах, как это делается. Задача L Случайная величина х распределена по нормальному закону со средним значением х и средним квадратическим уклонением Qx. Найти вероятность того, что уклонение х—х по абсолютному значению не превзойдет числа а. Пусть г — случайная величина, распределенная согласно основному нормальному закону. В силу основного свойства 1 (стр. 126) найдутся такие числа с>0 ий, что величина cz-\-d имеет среднее значение х и среднее квадратическое укло¬ нение Qx, т. е. подчинена тому же нормальному закону, что и данная величина х. Поэтому Р(\х — х\<а) = Р (| {cz+d) — {cz+d) |<а) = = P{c\z — г\<а)\ но в силу формулы (2) на стр. 127 здесь так как Q2=l (для основного нормального закона дис¬ персия равна 1). Поэтому мы находим: Р(\х — х\<a) = P(Qx 12 — г\<а) = <4> Этим поставленная задача решена, так как величину МЫ непосРедственно находим из таблицы. Таким образом, наша таблица с помощью формулы (4) позволяет легко вычислить вероятность любой границы уклонения для величины, подчиненной любому нормальному закону. П р и м е р 1. На станке изготовляется некоторая деталь. Оказывается, что ее длина х представляет собой случай¬ ную величину, распределенную по нормальному закону, и имеет среднее значение 20 см и дисперсию, равную 0,2 см. Найти вероятность того, что длина детали будет заклю¬ чена между 19,7 см и 20,3 см, т. е. что уклонение в ту или другую сторону не превзойдет 0,3 см.
132 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII В силу формулы (4) и нашей таблицы Р{\х — 20 |<0,3}=Ф(£|)=Ф (1,5) =0,866. Итак, около 87% всех изделий, изготовленных в дан¬ ных условиях, будут иметь длины между 19,7 и 20,3 см\ остальные 13% будут иметь большие отклонения от сред¬ него. Пример 2. В условиях примера 1 найти, какую точность длины изделия можно гарантировать с вероят¬ ностью 0,95. Задача состоит, очевидно, в отыскании такого положи¬ тельного числа а, для которого Р{\х — 20|<а}>0,95. Расчет примера 1 показывает, что а = 0,3 для этого мало, ибо в этом случае левая часть только что написан¬ ного неравенства меньше чем 0,87. Так как, согласно уравнению (4), Р{|*-20|<а} = ф(0-у =Ф(5а), то мы должны найти прежде всего в нашей таблице такое значение 5а, для которого Ф (5а)>0,95. Мы находим, что это будет при 5а> 1,97, откуда а>0,394. Таким образом, с вероятностью, превосходящей 0,95, можно гарантировать, что уклонение длины не превзойдет 0,4 см. ПримерЗ. В некоторых практических вопросах счи¬ тают, что случайная величина х, распределенная по нор¬ мальному закону, не обнаруживает уклонения большего, чем три средних квадратических уклонения Qx. Какие осно¬ вания имеются для этого утверждения? Формула (4) и наша таблица показывают нам, что Р{ \х — *[<3<2*} = Ф(3)>0,997,
РЕШЕНИЕ ЗАДАЧ 133 и, следовательно, Р{\х — x|>3Qx}<0,003. Практически это значит, что уклонения, превосходящие по абсолютному значению 3 Qx, будут в среднем встречаться реже, чем три раза на тысячу. Можно ли пренебрегать такой возможностью или ее все же необходимо учитывать — это, конечно, зависит от содержания задачи и не может быть раз навсегда предписано. Заметим, что соотношение Р {\х—х | <3Qx } =Ф(3) является, очевидно, частным случаем формулы Р{\х — х|<а<Ы = Ф(а), (5) вытекающей из формулы (4) и имеющей место для всякой случайной величины х, распределенной по нормальному закону. Пример 4. При среднем весе некоторого изделия в 8,4 кг найдено, что уклонения, по абсолютному значению превосходящие 50 г, встречаются в среднем 3 раза на каждые 100 изделий. Допуская, что вес изделий распределен по нор¬ мальному закону, определить его вероятное уклонение. Нам дано, что Р(\х — 8,4 |>0,05) = 0,03, где х — вес случайно выбранного изделия. Отсюда 0,97 = Р(1* —8.4|<0,05) = Ф(^) ; наша таблица показывает, что Ф(а)=0,97 при аъ2,12. Поэтому 0>Q5_^n in Qx откуда О ~ °’05 ^*^2,12 * Вероятное отклонение, как мы знаем (стр. 129), равно £^ = 0,674(2^0,0155 /сг=15,5 г. Пример 5. При стрельбе из орудия уклонение сна¬ ряда от цели вызывается тремя взаимно независимыми
134 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII причинами: 1) погрешностью в определении положения цели, 2) погрешностью в наводке и 3) ошибкой от причин, меня¬ ющихся от выстрела к выстрелу (вес снаряда, атмосферные условия и т. п.). Предполагая, что все три погрешности распределены по нормальным законам со средним значе¬ нием 0 и что вероятные уклонения их соответственно равны 24 Му 8 м и 12 м} найти вероятность того, что суммарное уклонение от цели не превзойдет 40 м. Так как вероятное уклонение суммарной ошибки х в силу свойства III (стр. 130) равно ]/242 + 82+ 122 = 28 м} то среднее квадратическое уклонение суммарной ошибки равно 28 ~^А\ 5 0,674 ,D и, значит, Р(\Х 1 <40) = Ф (0,964) = 0,665. Уклонения, не превосходящие 40 м, будут, таким обра¬ зом, наблюдаться примерно в 2/3 всех случаев. Задача II. Случайная величина х распределена по нормальному закону со средним значением х и средним квадратическим уклонением Qx. Найти вероятность того, что уклонение х—х по абсолютному значению будет заклю¬ чено между числами а и b (0<а<^Ь). Так как по правилу сложения Р(\х — х\<Ь) = Р (\х — х\<а) + Р (а<\х—х [<Ь), то Р(а<\х — х\<Ь) = Р (\х — х |<й) — Р (\х — * |<а) = =ф(от) ф (ох)’ (б) чем и решается поставленная задача. Для подавляющего большинства запросов практики та таблица значений величины Ф(а), которой мы все время пользовались, представляется, однако, излишне громоздким орудием расчета. Обычно бывает нужно рассчитать лишь вероятности попадания уклонения х—х в более или менее
РЕШЕНИЕ ЗАДАЧ 135 крупные отрезки; поэтому для целей практики желательно, наряду с нашей «полной» таблицей, иметь также и сокра¬ щенные таблицы, которые легко составить из полной таблицы с помощью формулы (6). Приведем пример построения такого рода таблицы, гораздо более грубой, чем таблица в конце книги, и тем не менее во многих случаях совершенно достаточной. Разобьем весь промежуток изменения величины \х—х\ на пять частей: 1) от нуля до 0,32 Qx\ 2) от 0,32 Qx до 0,69 Qv; 3) от 0,69 Qx до 1,15 Qx; 4) от 1,15 Qx до 2,58 Qx и 5) свыше 2,58 Qx. Пользуясь формулой (4), находим: Р (\х — х|<0,32QV) = Ф (0,32)^0,25; P(0,32Qx<\x — x|<0,69QJ = <I> (0,69) — Ф (0,32)^0,25; Р (0,69Qx.<|a: — х\<1,15QJ = Ф (1,15) — Ф (0,69)^0,25; P(l,15Qt<|* — x|<2,58QJ = Ф (2,58) — Ф (1,15)^0,24; Р( \х — x|>2,58Q J = l — Ф (2,58)^0,01. Результат этого расчета удобно изобразить с помощью графической схемы (рис. 16). 0,5% /2% 12J5% /2,5% /2,5%/2,5% 12,5% 12,5% 12% 0,5°% v V-C " у Г-Т.,у лт: у ". г у" ~ ^ 1^5. -2кШх ~1Щ -0,580x 0,320x 0 0,320х0,530х /,/50х 2,580Х Рис. 16. Здесь вся бесконечная прямая разделена на десять участков: пять положительных и пять отрицательных. Над каждым участком указано, какой процент фактически наблю¬ даемых уклонений будет в среднем падать на этот участок. Так, например, согласно вышеприведенному расчету, на участки (—1,15 Qx, —0,69 Qx) и (0,69 Qx> 1,15QX) вместе взятые должно падать примерно 25% всех уклонений. В силу симметрии нормальных законов уклонения будут падать на оба участка приблизительно одинаково часто, так что на каждый из них будет ложиться около 12,5% об¬ щего числа уклонений. Имея под руками эту или подобную ей простую схему, мы можем непосредственно представить
136 НОРМАЛЬНЫЕ ЗАКОНЫ [ГЛ. XII себе в основных чертах распределение уклонений для слу¬ чайной величины, подчиненной нормальному закону с про¬ извольными средним значением и средним квадратичес¬ ким уклонением. Рассмотрим, наконец, как вычисляется вероятность по¬ падания случайной величины, подчиненной нормальному закону, в некоторый произвольно заданный отрезок. Задача III. Зная, что случайная величина х распре¬ делена по нормальному закону (среднее значение х, среднее квадратическое уклонение QJ, вычислить с помощью таб¬ лицы вероятность неравенства где а и b (а<^Ь)— данные произвольные числа. Нам придется рассмотреть три случая, в зависимости от расположения чисел а и Ь относительно х. Первый случай: х^а^Ь. По правилу сложения Р (х<х<Ь) = Р (х<х<а)+Р (а<х<Ь), откуда Р (a<x<b) = Р (x<x<b) — Р (х<х<а) = = Р (0 < а — х <С b — х) — Р (0 < х — х <С а — х). Но при любом с£>0, в силу симметрии нормальных за¬ конов: Р (0 <<а — х<Са) = Р (— а<^х — х < 0) = =уР(-а<^-х<а)=|Р(!х-х|<а)=|ф(|-);(7) поэтому Второй случай: а^х^Ь. Р (а<* < Ь) = Р (о <* <я) JrP (*<•*:< 6) = =Р (а — х<^х — л:<0)+Р (0 <<•*:— х<^Ь — х) — в силу формулы (7).
§ 32] РЕШЕНИЕ ЗАДАЧ 137 Третий случай: а ^Ь^х. Р {а <л; <*) = Я (а <* < 6) + Р (Ь О), откуда Р{а<х<Ь) = Р(аСх<х) — Р(Ь<х<х) = = Р (а — д; <х — х < 0) — Р (Ь — х<х — х < 0) = Задача решена во всех трех случаях. Мы видим, что для случайной величины, распределенной по любому нор¬ мальному закону, наша таблица дает возможность найти вероятность попадания этой величины в любой отрезок и тем самым исчерпывающим образом характеризует ее закон распределения. Для того чтобы посмотреть, как практи¬ чески ведутся расчеты, рассмотрим следующий пример. При м е р. Стрельба ведется из точки О вдоль пря¬ мой ОХ. Средняя дальность полета снаряда равна 1200 м. Предполагая, что дальность полета Н распределена по нормальному закону со средним квадратическим уклоне¬ нием 40 м, найти, какой процент выпускаемых снарядов даст перелет от 60 до 80 м. Для того чтобы снаряд имел такой перелет, мы должны иметь 1260<Я<<1280; применяя заключительную формулу первого случая задачи III, мы находим: Р (1260 <Я< 1280)- -Иф (i2i^)-*(1T?)} -|!ф(2)-Ф(1,5)); из таблицы находим: Ф (2)^0,055, Ф (1,5)^0,866, откуда Р (1260 <#< 1280)^0,044; мы видим, что с указанным перелетом будет падать немного более 4% выпускаемых снарядов.
ЗАКЛЮЧЕНИЕ Теория вероятностей в последние десятилетия преврати¬ лась в одну из самых быстро развивающихся математических наук. Новые теоретические результаты открывают новые возможности для естественнонаучного использования мето¬ дов теории вероятностей. Более тонкое, более детальное изучение явлений природы толкает в то же время теорию вероятностей на разыскание новых методов, новых законо¬ мерностей, которые порождаются случаем. Теория вероят¬ ностей является одной из тех математических наук, которые не отгораживаются от жизни и от запросов других наук, а идут в ногу с общим развитием естествознания и техники. Читатель не должен превратно понять сказанное и подумать, что теория вероятностей превратилась теперь только в под¬ спорье, во вспомогательное средство для решения приклад¬ ных задач. Отнюдь нет: за последние три десятилетия теория вероятностей превратилась в стройную математическую науку со своими проблемами и методами исследования. В то же время оказалось, что наиболее важные и естественные проблемы теории вероятностей как математической науки служат решению актуальных проблем естествознания. Возникновение теории вероятностей относится к сере¬ дине семнадцатого столетия и связано с именами Ферма (1601—1665), Паскаля (1623—1662) и Гюйгенса (1625—1695). В работах этих ученых в зачаточном виде появились понятия вероятности случайного события и математического ожида¬ ния случайной величины. Отправным пунктом для их ис¬ следований явились задачи, связанные с азартными играми. Однако важность новых понятий для изучения природы была им ясна, и, например, Гюйгенс в сочинении «О расчетах в азартных играх» писал: «Читатель заметит, что имеет дело
ЗАКЛЮЧЕНИЕ 139 не только с игрой, но что здесь закладываются основы очень интересной и глубокой теории». Среди позднейших ученых, оказавших значительное влияние на развитие теории вероят¬ ностей, необходимо указать Якова Бернулли (1654—1705), с именем которого мы уже встречались в тексте нашей кни¬ ги, Муавра (1667—1754), Бейеса (ум. 1763), П. Лапласа (1749—1827), Гаусса (1777—1855) и Пуассона (1781—1840).. Мощное развитие теории вероятностей тесно связано с традициями и достижениями русской науки. В то время как в прошлом веке на Западе теория вероятностей зашла в тупик, в России гениальный математик П. Л. Чебышев нашел новый путь ее развития — всестороннее изучение последовательностей независимых случайных величин. Сам Чебышев и его ученики А. А. Марков и А. М. Ляпунов на этом пути получили фундаментальные результаты (закон больших чисел, теорема Ляпунова). Читатели уже знакомы с законом больших чисел, и наша ближайшая задача состоит теперь в том, чтобы дать пред¬ ставление о другом важнейшем предложении теории вероят¬ ностей, получившем название теоремы Ляпунова (или ина¬ че — центральной предельной теоремы теории вероятностей). Причина столь большого ее значения заключается в том, что значительное количество явлений, исход которых зави¬ сит от случая, в основных своих чертах протекает по сле¬ дующей схеме: изучаемое явление подвержено воздействию огромного количества независимо действующих случайных причин, каждая из которых оказывает лишь ничтожно малое влияние на течение явления в целом. Действие каждой из этих причин выражается случайными величинами lv |2, . . . ..., а их суммарное влияние на явление—суммой s;l = 5,4- +62+... + £,|- Так как учет влияния каждой из этих причин (иначе говоря, указание функций распределения вели¬ чин g) и даже простое перечисление их практически невоз¬ можно, то ясно, насколько важно разработать методы, позволяющие изучить их суммарное действие независимо от природы каждого отдельного слагаемого. Обычные ме¬ тоды исследования для решения поставленной задачи бес¬ сильны, на смену им должны прийти другие методы, для которых большое число действующих на явление причин было бы не препятствием, а, наоборот, облегчало бы решение
140 ЗАКЛЮЧЕНИЕ поставленной задачи. Эти методы должны компенсировать недостаточное знание каждой отдельной действующей при¬ чины большим их числом, их массовостью. Центральная предельная теорема, установленная трудами, главным обра¬ зом, академиков П. Л. Чебышева (1821—1894), А. А. Мар¬ кова (1856—1922) и А. М. Ляпунова (1857—1918), утверж¬ дает, что если действующие причины взаимно не¬ зависимы, их число п очень велико и действие каждой из этих причин по сравнению с суммарным их действием неве¬ лико, то закон распределения суммы sn лишь незначительно может отличаться от нормального закона распределения. Приведем примеры явлений, протекающих по только что описанной схеме. При стрельбе из орудия по цели неизбежны отклонения точки попадания снаряда от точки прицеливания. Это — хорошо известное явление рассеивания снарядов. Так как рассеивание является результатом воздействия огромного числа независимо действующих факторов (например, непра¬ вильности в обточке стакана снаряда, головки снаряда, колебания в плотности материала, из которого выточена головка снаряда, ничтожные колебания количества взрывча¬ того вещества в различных снарядах, малые, незаметные для глаза ошибки в наводке орудия, ничтожные изменения со¬ стояния атмосферы при различных стрельбах и многие другие), каждый из которых лишь ничтожно мало влияет на траекторию снаряда, то из теоремы Ляпунова следует, что оно должно подчиняться нормальному закону. Это об¬ стоятельство учитывается теорией стрельбы и кладется в основу при выработке правил стрельбы. Когда мы производим какое-нибудь наблюдение с целью измерить ту или иную физическую константу, то на резуль¬ тат нашего наблюдения неизбежно влияет огромное коли¬ чество факторов, каждый из которых в отдельности невоз¬ можно учесть, но которые порождают ошибки в измерении. Сюда относятся ошибки в состоянии измерительного при¬ бора, показания которого могут нечувствительно меняться под влиянием различных атмосферных, тепловых, механи¬ ческих или иных причин. Сюда относятся ошибки наблю¬ дателя, вызываемые особенностями его зрения или слуха и также нечувствительно меняющиеся в зависимости от пси¬
ЗАКЛЮЧЕНИЕ 141 хического или физического состояния наблюдателя. Фак¬ тическая ошибка измерения, таким образом, является ре¬ зультирующей огромного количества ничтожных по вели¬ чине, независимых между собой, так сказать, элементар¬ ных, зависящих от случая ошибок. В силу теоремы Ляпу¬ нова мы вновь можем ожидать, что ошибки наблюдений бу¬ дут подчинены нормальному закону распределения. Подобных примеров можно привести сколько угодно: положение и скорость молекулы газа, определяемые боль¬ шим числом столкновений с другими молекулами; количество продиффундировавшего вещества; уклонение деталей меха¬ низма от заданного размера при массовом производстве механизмов; распределение роста животных, растений или каких-либо их органов и т. д. Совершенствование физической статистики, а также ряда отраслей техники поставило перед теорией вероятностей большое число совершенно новых проблем, не укладываю¬ щихся в рамки классических схем. В то время как физика или техника интересовало изучение п р о ц е с с а, т. е. явле¬ ния, протекающего во времени, теория вероятностей не имела ни общих приемов, ни разработанных частных схем для решения возникающих при изучении таких явлений проблем. Возникла настоятельная потребность в разработке общей теории случайных процессов, т. е. теории, которая изу¬ чала бы случайные величины, зависящие от одного или не¬ скольких непрерывно изменяющихся параметров. Перечислим несколько задач, приводящих к рассмотре¬ нию случайных величин, изменение которых происходит во времени. Представим себе, что мы задались целью про¬ следить за движением какой-либо молекулы газа или жидкости. Эта молекула в случайные моменты времени сталкивается с другими молекулами, меняет при этом свою скорость и направление движения. Это изменение состояния молекулы подвержено действию случая каждый момент. Целый ряд физических явлений требует для своего изучения как раз умения вычислять вероятности того, сколько моле¬ кул успеют за тот или иной промежуток времени передви¬ нуться на то или иное расстояние. Так, например, если при¬ ведены в соприкосновение два газа или две жидкости, то на¬ чинается взаимное проникновение молекул одной жидкости
142 ЗАКЛЮЧЕНИЕ в другую: происходит диффузия. Как быстро протекает процесс диффузии? по каким законам? когда образующаяся смесь газов становится практически однородной? На все эти вопросы дает ответы статистическая теория диффузии, в основе которой лежат вероятностные расчеты, изучение случайных процессов. Очевидно, что подобная же задача возникает и в химии, когда изучают процесс химического взаимодействия веществ, процесс химической реакции. Какая часть молекул уже вступила в реакцию, как реакция протекает во времени, когда практически реакция уже закончилась? Весьма важный круг явлений протекает по принципу радиоактивного распада. Это явление состоит в том, что атомы радиоактивного вещества распадаются, превращаясь в атомы другого элемента. Каждый распад атома происходит мгновенно, подобно взрыву с выделением некоторого коли¬ чества энергии. Многочисленные наблюдения показывают, что распады атомов происходят в случайные моменты времени и неза¬ висимо друг от друга (при условии, что масса радиоактив¬ ного вещества не слишком велика). Для изучения процесса радиоактивного распада весьма существенно определить, какова вероятность того, что за определенный промежуток времени распадается то или иное число атомов. Эта задача есть типичная задача теории случайных процессов. Фор¬ мально, если задаваться только выяснением математической картины явлений, точно так же протекают и другие явления: загрузка телефонной станции, т. е. число вызовов, поступаю¬ щих на телефонную станцию от абонентов, броуновское дви¬ жение, обрыв нитей на ватерной машине и многие другие. Начало общей теории случайных процессов было поло¬ жено фундаментальными работами советских математиков А. Н. Колмогорова и А. Я. Хинчина в начале тридцатых годов. Несколько раньше, в первом десятилетии нашего века, А. А. Марков начал изучать последовательности зави¬ симых случайных величин, получившие название цепей Мар¬ кова. Развитая им теория, вначале лишь как математическая дисциплина, в двадцатых годах в руках физиков превра¬ тилась в действенное орудие изучения природы. С тех пор многие ученые (С. Н. Бернштейн, В. И. Романовский,
ЗАКЛЮЧЕНИЕ 143 А. Н. Колмогоров, Г. Адамар, М. Фреше, В. Дёблин, Дж. Дуб, В. Феллер и др.) сделали в теорию цепей Маркова значительный вклад. В двадцатых годах А. Н. Колмогоров, Е. Е. Слуцкий, А. Я. Хинчин и Поль Леви нашли тесную связь между теори¬ ей вероятностей и математическими дисциплинами, изуча¬ ющими множества и общее понятие функции (теорией мно¬ жеств и теорией функций действительного переменного). Несколько раньше к этим же идеям подошел Э. Борель. Открытие этой связи оказалось чрезвычайно плодотворным, и именно на этом пути удалось найти окончательное решение классических проблем, выдвинутых Чебышевым. Наконец, следует отметить работы С. Н. Бернштейна, А. Н. Колмогорова иМизеса по построению логически строй¬ ной теории вероятностей, способной к охвату разнообраз¬ ных задач, возникающих перед ней в естествознании, тех¬ нике и других областях знания. В современном бурном развитии теории вероятностей особенно большую роль играет наука СССР, США, Франции, Великобритании, Швеции, Японии, Венгрии. Впрочем, ин¬ терес к этой научной дисциплине сильно возрос во всех стра¬ нах в значительной мере под влиянием настойчивых требо¬ ваний практики в самых разнообразных ее проявлениях.
ПРИЛОЖЕНИЕ. ТАБЛИЦА ЗНАЧЕНИЙ ВЕЛИЧИНЫ Ф (а) 0,00 0,01 0,02 0,03 0, 04 О, 05 0,00 0,07 0,08 0,09 0,10 О, 1 1 О, 12 О, 13 О, 14 О, 15 О, 16 О, 17 О, 18 О, 19 0,20 0,21 0,22 0,23 0,24 0,25 О, 26 0,27 0,28 0,29 0,30 0,31 0,32 О, 33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 Ф (а) 0,000 0,008 0,016 0,024 0,032 0,040 0,048 0,056 0,064 0,072 0,080 О, 088 О, 096 О, 103 0,111 О, 119 О, 127 О, 135 О, 143 О, 151 О, 159 О, 166 О, 174 О, 182 О, 190 О, 197 О, 205 0,213 О, 221 О, 228 0,236 0,243 0,251 0,259 О, 266 0,274 О, 28 1 0,289 0,296 0,303 0,311 0,318 0,326 0,333 0,340 0,347 0,354 0,362 0,369 0,376 0,383 0,390 0,397 0,404 0,4 1 1 0,418 0,425 0,431 0,438 0,445 0,60 0,61 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 О, 75 0,76 0,77 0,78 О, 79 0,80 0,8 1 0,82 0,83 ,84 ,85 О О О, 86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 О, 97 О, 98 0,99 , 00 ,01 , 02 , 03 , 04 ,05 ,06 , 07 ,08 ,09 ,10 , 1 1 , 12 , 13 , Н , 15 , 16 , 17 , 18 , 19 Ф (а) 0,451 0,458 0,465 0,471 0,478 0,484 0,49 1 0,497 0,504 0,510 0,516 0,522 0,528 0,535 0,541 0,547 0,553 0,559 0,565 0,570 0,576 0,582 О, 588 0,593 0,599 0,605 0,610 0,616 0,621 0,627 0,632 0,637 0,642 0,648 О, 653 0,658 0,663 668 673 0,678 О, 683 0,688 0,692 0,697 О, 702 0,706 0,711 0,7 15 0,720 0,724 О, 729 0,733 0,737 0,742 0,746 0,750 0,754 0,758 0,762 0,766 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 4 1 42 43 44 45 46 47 48 ,49 ,50 , 5 1 ,52 53 ,54 ,55 , 86 ,57 ,58 ,59 ,60 ,61 ,62 ,63 ,64 ,65 ,66 ,67 ,68 ,69 ,70 ,71 ,72 , 73 ,74 ,75 ,76 ,77 ,78 ,79 Ф (а) О , 770 0,774 0,778 0,781 0,785 0,789 О, 792 О, 796 0,8 00 0,803 О, 806 0,8 10 0,8 13 0,8 16 0,820 0,823 0,826 0,829 0,832 0,835 О, 838 0,841 0,844 О, 847 0,850 0,853 0,856 0,858 0,861 0,864 0,866 0,867 0,871 0,874 0,876 0,879 0,88 1 0,884 0,886 0,888 0,890 0,893 О, 895 0,897 0,899 0,901 0,903 0,905 0,907 0,909 0,911 0,913 0,915 0,916 0,918 0,920 0,922 0,923 0,925 0,927 1 ,80 1,81 1 ,82 1 , 83 1 ,84 1 ,85 1 ,86 1 ,87 1 ,88 1 ,89 1 ,90 1.91 1.92 1 ,93 1 , 94 1 ,95 1 ,96 1 ,97 1 ,98 1 ,99 2 ,00 2,01 2,02 2.03 2.04 2.05 2.06 2, 07 2,08 2, 09 2,10 2, 1 1 2, 12 2, 13 2, 14 2, 15 2, 16 2, 17 2, 18 2, 19 2,20 2,21 2, 22 Ф (а) 2.30 2.31 2, 32 2.33 2.34 2.35 2.36 2.37 2, 38 2,39 0,928 0,930 0,93 1 0,933 0,934 0,936 0,937 0,939 0,940 0,94 1 0,943 0,944 0,945 О , 946 0,948 0,949 0,950 0,951 0,952 О , 053 О, 955 0,956 0,957 О ,958 0,959 О, 960 0,961 0,962 0,962 0,963 О, 964 0,965 0,966 0,967 0,968 0,968 0,969 0,970 0,971 0,971 0,972 О, 973 0,974 0,974 О, 975 0,976 0,976 0,977 0,977 0,978 0,979 О, 979 0,980 О, 980 0,981 0,981 О, 982 0,982 0,983 0,983 2.40 2.41 2.42 2, 43 2.44 2.45 2.46 2.47 2.48 2.49 2, 55 2.56 2.57 2, 58 2.59 2.60 2,61 2,62 2,63 2, 64 2, 65 2, 66 2, 67 2, 68 2,69 2 , 70 2,72 2,74 2, 76 2,78 2,80 2,82 2,84 2,86 2,88 2, 90 2,92 2, 94 2,96 2,98 3,50 3,60 3,70 3,80 3,90 4 , 00 5,00 Ф (а) 0,984 О, 984 0,984 О, 985 0,985 0,986 О, 986 О, 986 0,987 0,987 О, 988 О, 988 0,988 0,989 0,989 0,989 О, 990 О, 990 0,990 0,990 0,991 0,991 0,991 0,991 0,992 0,992 0,992 0,992 0,993 О, 993 0,993 0,993 0,994 О, 994 О, 995 0,995 О, 995 0,995 0,996 О, 996 О, 996 О, 996 0,997 0,997 0,997 О, 997 О, 998 0,999 0,999 О, 999 О,9995 0,9997 0,9998 0,99986 0,99990 0,99994 0,99999994
Теория вероятностей — математическая наука, изу¬ чающая закономерности случайных явлений, — за последние десятилетия превратилась в один из основных математических методов современного естествознания и техники. Проблемы физики и био¬ логии, автоматического ре¬ гулирования и лингвистики приводят к необходимости решать многочисленные вопросы, связанные с вы¬ яснением возможного хо¬ да процессов, на кото¬ рые влияют случайные факторы. Попытки отбро¬ сить влияние случая при¬ водят к искажению реаль¬ ного процесса. Нужно отметить, кроме того, что роль теоретико-вероят¬ ностных методов в самых разнообразных областях знания возрастает с каж¬ дым годом. Вот почему важно, чтобы элементар¬ ные сведения об этой науке делались достояни¬ ем все более широких кругов читателей.
Цена 20 коп.