Text
                    Мир
МАТЕМАТИКИ
24
Укрощение
случайности
D^AGOSTINI

Мир математики
Мир математики Фернандо Корбалан, Херардо Санц Укрощение случайности Теория вероятностей Москва - 2014 D^AGOSTINI
УДК 51(0.062) ББК22.1 М63 М63 Мир математики: в 40 т. Т. 24: Фернандо Корбалан, Херардо Санц. Укрощение случайности. Теория вероятностей. / Пер. с исп. — М.: Де Агостини, 2014. — 160 с. «Укрощение» случайности, то есть описание ее с помощью чисел и прогнозирование будущего — настоящий подвиг, плодами которого мы пользуемся уже довольно давно. Например, сегодня мы можем с достаточной точностью определить, кто победит на выбо- рах, еще до того, как они состоятся, или оценить, сколько времени будет работать энерго- сберегающая лампочка. И все же до полного покорения случайности — еще очень далеко. Случайность — одно из последних белых пятен на наших математических картах, которое вызывает немало тревог в обществе, жаждущем надежности и уверенности. Ведь мы жи- вем не в идеальном мире, а в настоящем океане неопределенности. Данная книга — свое- образный призыв изучить случайность и поразмышлять о ней. На этом пути читателей ждет немало задач, открытий и сюрпризов. ISBN 978-5-9774-0682-6 ISBN 978-5-9774-0719-9 (т. 24) УДК 51(0.062) ББК 22.1 © Fernando Corbalan, Gerardo Sanz, 2010 (текст) © RBA Coleccionables S.A., 2011 © ООО «Де Агостини», 2014 Иллюстрации предоставлены: iStockphoto. Все права защищены. Полное или частичное воспроизведение без разрешения издателя запрещено.
Содержание Предисловие.......................................................... 9 Глава 1. Искусство точного подсчета 11 Первые шаги........................................................... И Выборы представителей.............................................. И Основной принцип подсчета, или Принцип умножения.................. 15 Принцип ящиков, или Принцип Дирихле .............................. 15 Комбинаторные задачи ................................................ 16 Формирование выборок.............................................. 16 Распределение предметов по ящикам ................................ 17 Перестановки и факториалы ........................................ 18 Размещения.......................................................... 20 Сочетания........................................................... 23 Биномиальные коэффициенты............................................ 27 Свойства ......................................................... 27 Треугольник Паскаля.............................................. 29 Лабиринт Комельяса............................................... 30 Музыкальная «игра в кости» Моцарта............................... 32 Кено и комбинаторика в поэзии..................................... 33 Глава 2. История теории вероятностей................................. 35 Истоки теории вероятностей...................................... 38 Рождение теории вероятностей ....................................... 42 Развитие теории вероятностей........................................ 46 Новейшая история теории вероятностей................................. 53 Глава 3. Вероятность и случайность . 57 Определение вероятности............................................. 59 Эксперименты со статистическими закономерностями................. 59 Равновероятные события .......................................... 62 Составные эксперименты.............................................. 67 Аксиоматическое определение вероятности ............................. 72 5
СОДЕРЖАНИЕ Глава 4. Неочевидные ситуации .................................... 75 Определение ситуации ............................................. 75 Определение вероятности для заданной ситуации...................... 77 Дни рождения..................................................... 77 Походка пьяного................................................. 80 Другие ситуации................................................. 81 Кот и мышь................................................... 81 Большие семьи................................................ 82 Геометрическая вероятность...................................... 83 Предположение и реальность................................... 83 На поверхности сферы......................................... 84 Свадьбы в древности............................................. 85 Свадьба в Мачурии............................................ 85 Свадьба в Ремачурии ......................................... 87 Другие ситуации................................................. 87 Выигрыш в теннис............................................. 87 Ставка: три фишки............................................ 89 Задача о пальто ............................................. 90 Коллекции наклеек ........................................... 91 Глава 5. Лотереи и жеребьевки..................................... 93 Жеребьевки с небольшим числом участников.......................... 94 Жеребьевки с несимметричной монетой............................. 94 Жеребьевки для трех человек и более............................. 95 Жеребьевки с большим числом участников............................ 96 Грамотно разработанная официальная жеребьевка .................... 99 Лотереи и математическое ожидание ............................... 102 Испанская рождественская лотерея .............................. 104 Всегда выигрывают те, кто живет в другом городе ............... 105 Примитивные лотереи.............................................. 106 Привлекательность примитивных лотерей и пари Паскаля............. 109 Глава 6. Преимущества «нормальности» ............................ 111 Большие числа.................................................... 111 Теорема Бернулли................................................... 114 Даже самое плохое когда-нибудь заканчивается. Или нет?............. 119 6
СОДЕРЖАНИЕ Несколько слов о статистике ...................................... 120 Кривая Гаусса и нормальность...................................... 122 Нормальная кривая ............................................. 122 Теория ошибок измерений........................................... 125 Гипотеза об элементарных ошибках............................... 126 Центральная предельная теорема.................................... 127 Доска Гальтона.................................................... 128 Глава 7. Вероятность в обществе................................... 131 Таблицы смертности ............................................... 131 Ожидаемая продолжительность жизни, EV(x)....................... 133 Вероятность смерти, q(x)....................................... 133 Теоретическое число смертей, d(x).............................. 133 Число доживающих, L(x) ........................................ 133 Среднее число лет, прожитых в последний год жизни по достижении возраста х, т(х) ............................... 133 Стационарное население в возрасте х, РЕ(х) .................... 133 Таблицы смертности в Испании 134 Страхование....................................................... 136 Пенсионный возраст и пенсии....................................... 138 Другие способы применения......................................... 139 Вероятность и статистика в медицине............................... 139 Вероятность и ДНК ................................................ 140 Эпилог............................................................ 145 Библиография ..................................................... 147 Алфавитный указатель ............................................. 149 7

Предисловие Помимо видимых и измеримых достижений, как, например, покорение высокой горы, существуют и другие достижения, которые не столь заметны, хотя они могут быть намного важнее. Одно из них — «укрощение» случайности, описание ее с по- мощью чисел и прогнозирование того, что произойдет, — настоящий подвиг, плода- ми которого мы пользуемся уже давно. И все же от полного покорения случайности мы еще очень далеки. В этой книге мы приглашаем читателя совершить экскурс в историю, чтобы увидеть, как люди пытались понять случайное и непредсказуемое. Переход от веры в то, что будущее известно лишь богам, а познать его можно только с помощью магии и ритуалов, к количественному измерению вероятности событий требовал немалых усилий. Но сегодня мы можем с достаточной точностью определить, кто победит на выборах, еще до того, как они состоятся, рассчитать вероятность того, что мы больны, по результатам анализов, и оценить, сколько вре- мени будет работать энергосберегающая лампочка. Все это стало возможным сравнительно недавно. История математики насчиты- вает немало столетий, а некоторые ее разделы, например геометрия Евклида, — бо- лее двух тысяч лет, но многие важные формулы и понятия теории вероятностей, при- меняемые на практике, были открыты едва ли сто лет назад. Мы расскажем о том, как непросто было древним понять неопределенность, а затем, благодаря игрокам в азартные игры, вы узнаете, что не все события равновероятны. Героями нашего рассказа будут такие великие умы, как Паскаль и Ферма, которые первыми смогли понять основы теории вероятностей. Вы увидите, как анализ ошибок, совершенных при повторных измерениях (эти ошибки — неотъемлемая часть процесса измере- ний), позволил сформулировать закон, которому подчиняется распределение многих других переменных, описывающих как технические системы, так и социальные яв- ления. Этот закон встречается столь часто, что его называют законом нормального распределения и изображают в виде колокола Гаусса — прекрасной кривой, назван- ной в честь одного из великих математиков. Мы познакомимся с играми, проведем количественную оценку их сложности (для этого нам потребуется сделать точные подсчеты) и определим величину среднего проигрыша в лотерею. Мы придем к понятию математического ожидания — оно лежи! в основе расчетов, описывающих такие привычные понятия, как страховые премии. Нам встретится немало сюрпризов: мы увидим, что вероятности знакомых всем нам событий могут оказаться совершенно неожиданными. 9
ПРЕДИСЛОВИЕ Эта книга — своеобразный призыв изучить случайность и поразмышлять о ней. Мы живем не в идеальном мире, к которому стремились люди в эпоху Просвещения, а в настоящем океане неопределенности. Чтобы познать мир, мы должны покорить случайность — одно из последних белых пятен на наших математических картах, которое вызывает столько тревог в обществе, жаждущем надежности и уверенно- сти. На пути вас ждет немало задач, открытий и сюрпризов, и мы надеемся, что эта книга станет для вас прекрасным началом большого путешествия в мир случайного. 10
Глава 1 Искусство точного подсчета Первые шаги В главе 1 мы повторим основные понятия очень важного искусства счета. Довольно часто возникает необходимость подсчитать все возможные случаи. Сколько лет можно использовать ту или иную систему нумерации номерных знаков автомоби- лей? Каково число возможных комбинаций в лотерее или жеребьевке? Сколько су- ществует способов сочетать предметы одежды в гардеробе? Чтобы ответить на эти и другие похожие вопросы, мы, конечно, можем исполь- зовать обычный счет «на пальцах». Однако в математике существует особый раздел (комбинаторика), цель которого — определить число объектов или групп объектов в ситуациях, подобных описанным выше, не подсчитывая их по одному. Все по- ставленные задачи имеют общие свойства, что позволяет использовать для их реше- ния несколько математических моделей. Если вам известны эти модели, то, отвечая на заданные выше вопросы, потребуется всего лишь применить соответствующую формулу. Выборы представителей Мы хотим выбрать двух представителей, делегата и секретаря, для проведения слож- ных переговоров с руководством. Нас всего 25 человек, каждый имеет право голоса и каждый может быть выбран представителем. Сколько вариантов выбора существу- ет? Вначале выберем делегата. На эту должность претендует 25 кандидатов, следо- вательно, возможно 25 вариантов. При каждом из них существует 24 варианта вы- бора секретаря, таким образом, общее число вариантов равняется 25 • 24 = 600. Что произойдет, если мы будем выбирать делегата и секретаря одновременно? Сколько вариантов выбора существует в этом случае? Если мы будем производить подсчет так же, как и в предыдущем случае, то мы учтем каждую пару кандидатов дважды: нет никакой разницы, если мы сначала выберем Марию, а затем Ивана, или наоборот. В этой задаче число вариантов будет равно: И
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА 2 Эта и другие похожие ситуации, когда нужно подсчитать все возможные слу- чаи, часто встречаются в повседневной жизни. Обычно при подсчете не требуется по очереди перечислять все возможные ситуации — достаточно найти суммарное число вариантов с помощью методов, которые и рассматриваются в комбинатори- ке. Предметом изучения этой науки является группировка и перестановка множеств объектов вне зависимости от их природы. К типичным задачам комбинаторики отно- сятся формирование выборки из множества объектов, определение числа способов, которыми можно разместить объекты в нескольких коробках или которыми можно разделить некое множество на части. Для решения подобных задач применяются размещения, сочетания и перестановки. Чтобы выполнить подсчет, важно правильно организовать исходные данные. Мы будем использовать деревья — важную модель, допускающую множество при- менений (так, позднее мы применим ее при вычислении вероятностей). Графы — это математические объекты, очень полезные для обозначения связей между объектами. При построении графов сами объекты обозначаются точками (их называют вершинами графа), отношения между ними — линиями (их называют ре- брами графа). Деревья — это простые графы, в которых каждую пару вершин меж- ду собой соединяет максимум одно ребро. Из начальной вершины PQ, которая на- зывается корнем дерева, исходит несколько ребер, соединяющих ее с другими точ- ками (в нашем случае — Рр Р2 и Р3). Эти вершины, в свою очередь, в общем случае соединяются с другими и т. д. Каждая ветвь дерева имеет последнее ребро, которое оканчивается конечным узлом, из которого не исходит ни одного ребра. В изобра- женном нами дереве конечными узлами являются Р3, Р4, Р5 и Р6, как показано на иллюстрации: Рассмотрим пример. В шкафу лежат трое брюк серого (СБ), голубого (ГБ) и черного цвета (ЧБ), две рубашки: одна голубого (ГР), другая — белого цвета (БР), и два свитера — голубой (ГС) и коричневый (КС). Каждое утро я выбираю 12
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА себе брюки, свитер и рубашку. Сколькими способами я могу сочетать предметы одежды при условии, что все они должны быть разного цвета? Составим дерево, в котором перечислим все возможные варианты, и определим порядок выбора: сначала — брюки, затем — рубашка, после нее — свитер. Для брюк существует три варианта выбора: серые, голубые и черные. Следователь- но, из корня дерева будут выходить три ребра — по одному на каждый вариант. На концах ребер запишем соответствующие варианты: <СБ ГБ ЧБ Допустим, что мы находимся на конце первого ребра (СБ): мы выбрали серые брюки. Теперь мы можем выбрать любую из двух рубашек, так как цвет брюк и ру- башки будет отличаться в любом случае. Следовательно, нужно изобразить два ребра: СБ ГБ ЧБ ГР БР Перейдем в конец второго ребра (ГБ): мы выбрали голубые брюки. Так как цвет предметов одежды не должен повторяться, мы можем выбрать рубашку только од- ного цвета — белого (БР), поэтому к дереву нужно добавить одно ребро: В вершине третьего ребра, выходящего из корня дерева (ЧБ — черные брюки), вновь возможен выбор любой из двух рубашек. Добавим к дереву два ребра: ГР БР БР ГР БР 13
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Дерево описывает все возможные варианты сочетания брюк и рубашки. Оста- лось выбрать свитер. Проведем аналогичные рассуждения и проанализируем до- бавленные к дереву вершины. Так, в вершине ГР ветви СБ — ГР (серые брюки и голубая рубашка) можно выбрать только один свитер, коричневый (КС), так, чтобы цвет предметов одежды не повторялся. Добавим узел КС, который будет конечным на этой ветви. Полученная ветвь дерева будет обозначать вариант «серые брюки, голубая рубашка и коричневый свитер». Повторив аналогичные действия для всех остальных ветвей, получим полное дерево вариантов: ГР БР БР ГР БР — КС г ГС \ КС КС — КС / гс >. КС СБ-ГР-КС СБ—БР—ГС СБ—БР—КС РА—БР—КС ЧБ-ГР-КС ЧБ—БР—ГС ЧБ—БР—КС Ответом к задаче из нашего примера будет семь — таково общее число ветвей дерева. Может показаться, что построить дерево намного сложнее, чем просто под- считать варианты, однако такое построение применимо во многих ситуациях и дает хорошие результаты. На рисунке ниже приведена полная схема рассуждений: СБ .СБ^ ^ГР ~^БР *СБ< ^ГР БР . СБ< ^•ГР БР ГБ < ГБ ГБ - — БР < —-ГБ - — БР ЧБ ЧБ ЧБ ГР ~^БР СБ-ГР-КС СБ—БР—ГС СБ—БР—КС РА—БР—КС ЧБ-ГР-КС ЧБ—БР—ГС ЧБ—БР—КС ГР • КС БР КС ГР — КС , гс БР < \ КС БР — КС Далее мы опишем базовые принципы подсчета. 14
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Основной принцип подсчета, или Принцип умножения Этот общий принцип подсчета заключается в том, что если мы проводим два экс- перимента, один из которых имеет тп возможных исходов, а другой — п, то общее число результатов обоих экспериментов будет равно т • п. Если использовать тер- мины теории множеств, то этот принцип будет звучать так: если одно множество содержит т элементов, другое — п, то выбрать пару элементов (по одному из каж- дого множества) можно т • п способами. В общем виде этот принцип можно изложить так: если проведено k экспери- ментов, первый из которых имеет возможных исходов, второй — п2 и т. д. до nfe, то общее число исходов будет равно п1 • п2 • ... • nk. Принцип ящиков, или Принцип Дирихле Согласно этому принципу, если у нас есть три голубя и две голубятни, то очевидно, что в одной из голубятен будет находиться больше одного голубя. Это простое рас- суждение, применимое во всех случаях, когда число голубей больше числа голубя- тен, лежит в основе многих задач подсчета. Допустим, нужно разложить т предметов по п ящиков. Если т делится на п, то мы можем положить в каждый ящик, например, т/п предметов. Однако т не всегда будет делиться на п. Кроме того, случай, когда в каждом ящике лежит одинаковое число предметов, не представляет особого интереса. На ос- нове принципа Дирихле можно утверждать следующее: — если дано т предметов, которые нужно разложить в п ящиков, при этом т > п, то в одном из ящиков будет как минимум два предмета; — если т предметов разложено по п ящикам (при этом т не кратно п), то в од- ном из ящиков будет лежать минимум р + 1 предмет, где р — результат деления т на п нацело. Например, если на прошлой неделе Павел отправил 29 срочных посылок, то в один из дней он обязательно отправил как минимум 5 посылок. Рассуждения просты: нужно распределить 29 предметов (посылок) по 7 ящикам (дням недели). При этом в одном из них окажется больше 4 предметов (представьте себе, что мы положили по 4 предмета в каждый ящик, в этом случае один предмет окажется лиш- ним, следовательно, в какой-то ящик нужно будет положить 5 предметов). 15
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА ЛЮДИ С ОДИНАКОВЫМ ЧИСЛОМ ВОЛОС НА ГОЛОВЕ Принцип Дирихле позволяет гарантировать, что в городе, где проживает миллион че- ловек, найдется как минимум два человека с одинаковым числом волос на голове. Будем считать человеческую голову сферой, измерим ее диаметр, вычислим площадь поверхности черепа (можно считать, что она чуть больше половины общей поверхности сферы) и определим число волосков на единицу площа- ди (например, один волос на квадратный миллиметр). Отсюда следует, что число волос будет равно площади нашей головы, выраженной в квадрат- ных миллиметрах. Исследования показывают, что число волос на голове не может превышать 200 тысяч. Допустим, что это число может достигать 250 тысяч. Следовательно, число «ящиков» (группы людей с определен- ным числом волос) в этом случае будет равно 250 тысячам, а так как в городе проживает миллион человек, то можно утверждать, что у многих людей число волос на голове будет одинаковым. Более того, существует 750 тысяч человек, у которых их будет столько же, сколько у другого жи- теля города (или даже нескольких жителей): мы сможем распределить по различным «ящикам» 250 тысяч человек, а 750 тысяч остальных нужно будет поместить в уже заполненные «ящики». Можно сделать ответ еще точнее: для одно! о из жителей города с населением свыше 250 тысяч человек гарантированно найдется пара с тем же числом волос на голове. Комбинаторные задачи Существует два вида ситуаций, которые представляют особый интерес: формирова- ние выборок и распределение предметов по ящикам. Формирование выборок Речь идет о подсчете числа вариантов, которыми можно сформировать выборку из совокупности объектов. Как правило, известно общее число объектов и число объектов, образующих выборку (размер выборки). Необходимо рассмотреть раз- личные ситуации: 16
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА — предметы могут быть одинаковыми или разными; — выборка может содержать или не содержать повторяющиеся элементы; — порядок выборки элементов может учитываться либо нет (иными словами, выборка может быть упорядоченной или неупорядоченной). В описанной выше задаче о выборах представителей требовалось определить, сколько разных выборок размера 2 можно сформировать из совокупности, содержа- щей 25 разных элементов, при этом элементы выборки не могли повторяться (один и тот же человек не может занимать две должности сразу), а порядок выборки имел значение (выбранные представители должны были выполнять разные функции). Распределение предметов по ящикам В этом случае нужно подсчитать, сколькими способами можно разложить опреде- ленное число предметов в заданное число ящиков. Возможны различные ситуации: — предметы могут быть одинаковыми или разными; — ящики могут быть одинаковыми или разными; — можно ли помещать в один ящик несколько предметов; — допустимо ли, чтобы какие-то ящики оставались пустыми; — следует ли рассматривать порядок размещения предметов. Если в забеге участвует восемь спортсменов, сколько существует вариантов по- лучения ими золотой, серебряной и бронзовой медали? Нужно определить, скольки- ми способами можно разместить три разных предмета (медали) по восьми ящикам (их роль в этой задаче играют спортсмены). При этом в один ящик нельзя положить несколько предметов, так как ни один спортсмен не может получить сразу несколько медалей. Первый предмет можно поместить в любой из восьми ящиков. После этого второй можно поместить в один из семи оставшихся ящиков. Затем останется шесть свободных ящиков, в один из которых можно будет поместить третий предмет. Об- щее число вариантов равно 8 • 7 • 6 = 336: в этом забеге существует 336 комбина- ций выигрыша. Математические модели комбинаторики позволяют решать подобные задачи. Эти модели можно использовать в задачах двух видов, что позволяет провести аналогии между разными типами задач. Однако с помощью одной модели нельзя решить все возможные разновидности подобных задач, порой требуются и другие методы. 17
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Перестановки и факториалы Перестановка — это расположение ряда предметов в определенном порядке, или, иными словами, различные способы упорядочить п элементов множества. Число перестановок Р для п объектов найти нетрудно: первый элемент можно выбрать п способами, второй — п — 1 способами, число вариантов для третьего элемента будет равно п — 2 и т. д. В общем виде число перестановок п различных элементов опре- деляется так: Рп = и • (п — 1) • (п — 2) • • 3 • 2 • 1. Произведение, равное числу перестановок п элементов, называется «и фактори- ал» и обозначается п!: и! = и • (и - 1) • (и - 2) •... • 3 • 2 • 1 = РП. ГОЛОВОКРУЖИТЕЛЬНЫЙ РОСТ С увеличением п значение л! возрастает намного быстрее, чем можно ожидать. Это нетрудно подтвердить с помощью калькулятора. Например, 5! - 120, 10! - 3628800. Эти величины сравнительно невелики, однако 20! равняется уже 2432902008176640000 - 2,4 • 1018. Это число содержит 19 цифр, а 50! - 3,04 • 1064 - целых 65 цифр Чтобы упростить вычисления, по определению 0! принимается равным 1. Если нам нужно найти все возможные перестановки, то можно использовать тот же метод, что и при поиске их общего числа. Рассмотрим первый элемент и про- анализируем возможные варианты выбора второго. Для каждого из этих вариантов рассмотрим все варианты выбора третьего элемента и т. д. Все возможные пере- становки чисел 1, 2, 3 и 4 (то есть все возможные числа, которые можно составить из этих цифр) приведены в таблице ниже. 1234 2134 3124 4123 1243 2143 3142 4132 1324 2314 3214 4213 1342 2341 3241 4231 1423 2413 3412 4312 1432 2431 3421 4321 18
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА МЕНЮ НА НЕДЕЛЮ Если нужно разложить т разных предметов по п разным ящикам так, чтобы в каждом ящи- ке находился один предмет, то число возможных вариантов будет равно числу перестановок п элементов. Если у нас есть 7 разных меню, то сколькими способами их можно распределить по 7 дням недели так, чтобы составить меню на неделю? Ответом будет число перестановок семи элементов: Р7 - 7! -7-6-5 4-3-2-1- 5040. Больше пяти тысяч вариантов! Однако если мы рассмотрим другие ситуации, это число покажется не слишком большим. Всем нам знакома картина Леонардо да Винчи «Тайная вечеря», на которой изображен Иисус Христос и его 12 апостолов. Если бы Леонардо решил написать несколько копий картины так, чтобы на каждой из них Христос и апостолы сидели бы в разном порядке, ему пришлось бы создать всего 13! - 6227020800 картин - больше шести миллиардов! Если бы Леонардо решил, что Иисус всегда должен изображаться в центре, число картин заметно сократилось бы, но все равно оставалось внушительным: 12! - 479001600, то есть более 479 миллионов картин. Конечно, число картин является конечным, поэтому рано или поздно можно написать их все, но все равно сделать это было бы в высшей степени сложно. «Тайная вечеря» — фреска работы Леонардо да Винчи, написанная в 1495-1497 годах на стене доминиканского монастыря Санта-Мария-делле-Гоацие в Милане. Если мы рассматриваем перестановку элементов, которые можно упорядочить (буквы алфавита, числа, слова и т. д.), то главной перестановкой будет называться та, элементы которой будут располагаться в привычном порядке. Ситуация услож- няется, когда некоторые элементы перестановки равны между собой. 19
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Мы хотим узнать, сколько существует способов упорядочить буквы слова АНА- ФЕМА. В этом слове 7 букв, если бы все они были разными, искомое число было бы равно Р7 = 7! = 7 - 6 - 5 - 4 - 3 - 21 = 5040. Но если мы поменяем местами две одинаковые буквы, то получим ту же перестановку, в которой положение букв Н, Ф, Е и М останется неизменным. Число перестановок для трех букв А равно 6, так как Р3 = 3 ’ 2 • 1 = 6. Ситуация аналогична для любого расположения букв Н, Ф, Е и М в слове, следовательно, общее число различных перестановок будет равно: n=5.=^=84o. р3 6 В подобных случаях речь идет о перестановках с повторениями. В общем случае, если дана совокупность из п предметов, которая содержит а экземпляров предме- та?!, b экземпляров предмета В, z экземпляров предмета Z(a + b+ ...+z = п), то общее число возможных перестановок с повторениями будет равно: н! Игрок в шахматы хочет расставить в ряд две белые и четыре черные пешки. Сколькими способами это можно сделать? Нужно найти число перестановок с по- вторениями для 6 элементов, один из которых повторяется 2 раза, другой — 4: 6! _ 720 -4! — 2- Размещения Два приведенных выше примера (задача о выборе представителей и задача о на- граждении спортсменов) имеют общие свойства: — в обоих случаях нужно сформировать выборку (2 из 25 и 3 из 8); — нужно учитывать порядок выбора (сначала выбираем делегата, затем секре- таря, то же — в задаче о медалях); — элементы выборки не могут повторяться (один человек не может совмещать две должности, один и тот же спортсмен не может получить сразу несколько медалей). 20
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА В обоих случаях речь идет о размещениях. Для данного множества из т различ- ных элементов размещениями из т по п (т > п) называются все упорядоченные наборы из п различных элементов, взятых из некоторого множества различных т элементов. Два размещения считаются различными, если отличаются хотя бы одним элементом или порядком их расположения. Размещения обозначаются Рассмотрим множество 1, 2, 3, ..., т. Сформируем размещения из этих т эле- ментов по п и подсчитаем их число. Очевидно, что каждый из элементов по отдель- ности является размещением порядка 1: 1 2 3 4 5 ... т. Следовательно, их число равно Д^т = т. Если справа от каждого размещения порядка 1 мы поместим элемент множества, не входящий в это размещение, то получим размещения порядка 2: 12 13 14 1m 21 23 24 .. 2m т 1 m2 m3 .. m(m —1). Следовательно, число размещений порядка 2 будет равно произведению чис- ла размещений порядка 1 и числа элементов, которое можно добавить к каждому из них, то есть т — 1. Иными словами, = т • (т — 1). Если справа от каждого размещения порядка 2 мы поместим элемент множества, не входящий в это размещение, то получим размещения порядка 3: их число будет равно произведению и числа элементов, которое можно добавить к каждому из них, то есть т — 2. Таким образом, А^т = /Рт • (т — 2) = m • (m — 1) • (m — 2). Продолжив аналогичные рассуждения, получим: Ат = т-(т — l)(m — 2)(т — 3) = m • (m — 1) • (т — 2) • (т — 3) • (т — 4) В общем случае имеем = т • (т — 1) • (т — 2) •...• (т — п +1). 21
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА ДРУГАЯ ФОРМУЛА Согласно определению факториала, m!=m-(m-l)-(m-2)-... -(т-п+1) (т-п) (т-п-1) ... -3-2 1“Длт-(т-п)' Поэтому /Утакже можно вычислить по следующей формуле: .п_ т\ т (т-п)\ Перестановки п объектов - это размещения, которые можно сформировать, взяв п из п объ- ектов, то есть все возможные объекты. Следовательно, Рп» Дпп(не будем забывать, что 0! » 1). Вышеописанную ситуацию можно также сравнить с задачей о раскладывании предметов по ящикам. Рассмотрим две предыдущие задачи снова: — первый случай аналогичен распределению двух разных предметов (должно- стей) по 25 разным ящикам (их роль будут играть рабочие), во второй задаче речь идет о распределении трех разных предметов (медалей) по восьми раз- ным ящикам (они обозначают спортсменов); — помещать несколько предметов в один ящик нельзя; — нужно учитывать порядок размещения предметов. Обобщив результаты наших наблюдений, получим вывод: «различные способы разложить т разных предметов по п разным ящикам так, чтобы в каждом ящике находилось не более одного предмета, называются размещениями из т по и». Если допустить возможность повторения элементов, получим размещения с по- вторениями. Для данного множества из т элементов размещениями с повторениями порядка п называются все наборы из п элементов из некоторого множества различ- ных т элементов, часть которых может повторяться. Два размещения считаются различными, если отличаются хотя бы одним элементом или, если все элементы со- впадают, порядком их расположения. Размещения с повторениями мы будем обо- значать Дп . т Проведем рассуждения, аналогичные тем, что мы использовали для вычисления Дт. Единственное различие заключается в том, что теперь, взяв за основу раз- мещения порядка 1, мы можем на каждом шаге добавлять все элементы (так как допускаются повторения), поэтому нетрудно прийти к выводу: = тп- Сколько чисел можно составить из четырех цифр? Так как всего в нашем рас- поряжении имеется десять разных цифр (0,1, 2, ..., 8, 9), речь идет о размещениях с повторениями из 10 цифр по 4: A^q = Ю4 = 10000 чисел (при этом числа, подоб- 22
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА ные 0325, 0076 И 0005, считаются четырехзначными). В скольких из этих чисел все цифры различны? Найдем число размещений без повторений: = 10 • 9 • 8 • 7 = = 5040. Остальные четырехзначные числа (их 4960) содержат повторяющиеся цифры. КАК ГАРАНТИРОВАТЬ ВЫИГРЫШ Если мы хотим гарантированно выиграть в футбольной лотерее, нужно заполнить лотерейные билеты всеми возможными результатами. Напомним? что число возможных исходов футболь- ного матча равно трем, в рассматриваемой футбольной лотерее нужно угадать исходы 14 игр. Сколько лотерейных билетов нужно будет заполнить? Ответом будет число размещений с по- вторениями из 14 элементов по 3, то есть - 314 - 4732 969. Если мы хотим верно указать ис- ходы всех 15 игр тура, то число билетов будет в три раза больше, то есть А^5 - З15 - 14348907. Очевидно, что мы потратим больше денег на лотерейные билеты, чем получим в качестве приза. Сочетания Рассмотрим две задачи: как выбрать четверых из 22 учеников в классе, которые будут играть на флейте, и как можно приготовить стаканчики с двумя шариками мороженого, если всего доступно пять разных вкусов? Обе задачи имеют общие свойства: — нужно сформировать выборку (требуется выбрать четверых из 22 учеников и два из пяти вкусов мороженого); — порядок выбора не имеет значения (все четыре ученика будут играть на оди- наковых флейтах, а сочетания вкусов «клубника и сливки» и «сливки и клуб- ника» ничем не отличаются); — элементы не могут повторяться (ученик не может играть на нескольких флей- тах сразу, вкусы шариков мороженого также должны отличаться). В обоих случаях речь идет о сочетаниях. Для данного множества из т элементов сочетаниями из т по п называются все наборы из п различных элементов, взятых из некоторого множества различных т элементов. Два сочетания различны толь- ко тогда, когда они отличаются хотя бы одним элементом. Сочетания обозначают- ся С14. 23
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Рассмотрим множество 1,2,3, ...,т. Сформируем сочетания из т по п и найдем их общее количество. Как и в случае с размещениями, каждый элемент множества по отдельности представляет собой сочетание порядка 1: 1 2 3 4 5 ... т. Следовательно, С^ = т. Образуем сочетания порядка 2, поместив справа от сочетаний порядка 1 элемен- ты, следующие за теми, что образуют эти сочетания: 12 13 14 15 16 1m 23 24 25 26 ... 2m 34 35 36 3m 45 46 ... 4m. Продолжим выполнять аналогичные действия, то есть припишем справа от каж- дого сочетания элемент, следующий за последним элементом сочетания, и получим сочетания порядка 3: 123 124 125 126 127 12 m 134 135 136 137 13 m 234 235 236 237 .. . 23m 145 146 147 . 14m 245 246 247 .. . 24m 345 346 347 34m. Продолжим действовать аналогичным образом и составим сочетания порядка 4, 5 и т. д. Рассмотрим все сочетания из пяти элементов (1, 2, 3, 4 и 5) по 3: 123 124 125 134 135 145 234 235 245 345. Взяв каждое из этих сочетаний по очереди и сформировав все возможные пере- становки элементов для каждого из них, мы получим размещения из 5 элементов по 3. Рассмотрим, например, первое сочетание и образуем все возможные переста- новки для него. Получим: 123 132 213 231 312 321. 24
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Как следствие, число размещений из 5 элементов по 3 можно выразить следую- щим образом: Л3 = С3 • Р откуда имеем: сз = ^=5±3 = 60 = 10 Р3 3-2-1 6 Обобщив этот результат, мы можем найти С": т! Qn- А" _ + _ (т — п)! _ ml Р «•(« —1)-...-3-2-1 п! п!-(т — п)! Число вариантов, которыми можно выбрать четырех учеников из 22, равно: _ Л22 _ 22-21-20-19 _ 175 560 _7315 22~ Р ~ 4-3-21 24 4 Число стаканчиков мороженого с двумя шариками разного вкуса будет равно: Также можно использовать модель с размещением предметов по ящикам. — Первая задача — о распределении четырех одинаковых предметов (флейт) по 22 разным ящикам (это ученики). Во второй задаче речь идет о распреде- лении двух одинаковых предметов (шариков) по пяти разным ящикам (вку- сам). — В обоих случаях в ящике может находиться не более одного предмета. — Порядок расположения предметов не важен. Различные способы разложить т одинаковых предметов по п разным ящикам так, чтобы в каждом ящике находилось не более одного предмета, также являются сочетаниями из т элементов по п. 25
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Если элементы повторяются, получим сочетания с повторениями. Для данного множества из т элементов сочетаниями с повторениями порядка п называются все наборы из п элементов, взятых из множества т так, что некоторые элементы набо- ров могут повторяться. Два сочетания считаются различными, если они отличаются хотя бы одним элементом. Сочетания с повторениями обозначаются С,". Сочетания с повторениями образуются аналогично простым сочетаниям. Нужно лишь учитывать, что при переходе от сочетаний одного порядка к сочетаниям более высокого порядка мы приписываем справа от элемента сочетания не только следую- щие за ним элементы, но и само сочетание. Вывод формулы для числа сочетаний с повторениями сложен, поэтому мы огра- ничимся тем, что приведем саму формулу: С" = С” = О»*»-* 1)! ш+м-1 / 4 \ I * nl-(m — 1)! В задаче с мороженым получим следующее число стаканчиков с двумя шариками мороженого (возможно, оба шарика будут иметь одинаковый вкус): С2 = -^- 6 2!-4! 720 2-24 = 15. Как и следовало ожидать, это десять стаканчиков с двумя шариками разного вкуса (это число нам уже известно) плюс пять стаканчиков с двумя шариками од- ного вкуса. РАЗЛИЧИЯ МЕЖДУ СОЧЕТАНИЯМИ И РАЗМЕЩЕНИЯМИ Чтобы различать, когда речь идет о сочетаниях, а когда - о размещениях, рассмотрим следу- ющую ситуацию. Даны 12 разных цветов, и мы хотим: 1) изготовить трехцветные флаги с горизонтальными полосами; 2) получить новые цвета путем смешивания трех разных цветов из уже имеющихся. Каким будет ответ в первом и втором случае? Во второй задаче порядок следования цве- тов не важен, так как это не повлияет на конечный результат. Ответом будет число сочетаний из 12 цветов по 3 (всего 220 разных сочетаний). В задаче о флагах порядок следования цветов имеет значение: ответом будет число размещений из 12 цветов по 3 (всего 1320 вариантов). 26
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Биномиальные коэффициенты Биномиальным коэффициентом из т по п называется число сочетаний из т элемен- тов по п. Это число обозначается т По определению, имеем: »' mi! m!-(im —м)! Число т, записанное снизу, обычно называют нижним индексом, число п, запи- санное сверху, — верхним индексом. Должно выполняться условие: m > п. Пример: <5>|- 5! - 5'4'3! _ j 3!-2!— 3!-2 ” 2 10^1 10! 10-9-8! 10-9 _ =-----=----------=--------= 45. ^2 J 2!-8! 2-8! 2 Свойства Биномиальные коэффициенты обладают рядом свойств. 1. Биномиальный коэффициент порядка 0 равен 1: Ml О mi ! mi! --------------= — = 1. О! (mi — 0)! in! 2. Биномиальный коэффициент порядка 1 равен своему верхнему индексу: Ml 1 in! mi-(mi —1)! -------------=-------------= Hl. 1!‘(mi — 1)! (mi- 1)! 27
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА 3. Любой биномиальный коэффициент, верхний и нижний индексы которого сов- падают, равен единице: т т! т J т !-0! ml ml 4. Рассмотрим биномиальные коэффициенты, для которых сумма нижних ин- дексов равна верхнему: Эти биномиальные коэффициенты будут равны между собой (это равенство на- зывается правилом симметрии): т т! т- nJ (т-п)1-п! ml nl-(m — n)l 5. Сумма двух биномиальных коэффициентов с одинаковыми верхними и ниж- ними индексами, отличающимися на единицу, равна биномиальному коэффи- циенту, верхний индекс которого на единицу больше, чем верхний индекс сла- гаемых, а нижний индекс равен большему нижнему индексу слагаемых: Л ( \ т т 4- п) 1"+0 т +1 ^м + 1 Рассмотрим следующие примеры. 1 f100W100V ioq! 98 J 2 J 21-98! 100-99-98! 100-99 -----------=--------= 4950. 2-98! 2 И J I6 J 6И! 7-6! 6! 4! W W 0!-4! 1 0! 28
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА ПОКЕР В игре в покер используются различные комбинации карт - «руки» (пять карт из стандартной колоды в 52 карты) разной ценности: чем сложнее получить ту или иную руку, тем большую цен- ность она имеет. Общее число различных рук равно числу сочетаний из 52 карт по 5: 52' 521 -^—=2598 960. 51-47! Совсем неплохо - больше двух с половиной миллионов вариантов. Сколько из этих комбинаций карт будут называться каре или покер (четыре карты одного достоинства плюс еще одна карта)? Так как колода содержит 13 карт каждой масти, четыре карты одного достоинства можно выбрать 13 способами. В каждом из этих случаев пятая карта может быть любой из 48 оставшихся карт колоды. Следовательно, искомое число комбинаций К равно К - 13 • 48 - 624. В комбинации фулл-хаус (три карты одного достоинства и две - другого) три карты одного достоинства можн< выбрать четырьмя способами для каждого из 13 возможных вариантов: С43- С)4= 13 • 4 = 52 . Так как достоинство карт в паре и в тройке должно отличаться (все пять карт не могут быть одного достоинства, а если у нас на руках четыре карты одного достоин- ства, такая комбинация называется покер), существует 12 возможных пар карт двух мастей, следовательно, число вариантов выбора пары будет равно 12 С4 - 12 6 - 72. У нас на руках могут одновременно находиться любая тройка и любая пара карт, следовательно, общее число комбинаций фулл-хаус Сбудет равно F= 52 • 72 = 3744. Как видите, эта цифра невелика, но она в шесть раз больше общего числа комбинаций каре. В случае с комбинацией стрейт- флаш (пять последовательных карт одной масти), так как колода содержит 13 карт каждой масти, нужную комбинацию можно выбрать девятью разными способами для каждой масти, следовательно, общее число вариантов будет равно 36. Приведенные нами числа справедливы для первого игрока в раздаче, для остальных они будут зависеть оттого, какие карты получили остальные игроки. Треугольник Паскаля Полную последовательность биномиальных коэффициентов, например: 29
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА проще всего вычислить, построив треугольник Паскаля до нужного ряда. Этот чис- ловой треугольник был известен уже древним индийцам (за 2000 лет до Паскаля) и китайцам (за 1700 лет до Паскаля), однако именно Паскаль использовал его мно- жеством способов при расчете вероятностей. Построить этот числовой треугольник несложно: все ряды начинаются и заканчиваются единицей; первый ряд состоит из двух единиц; каждое промежуточное число в последующих рядах равно сумме двух чисел, расположенных справа и слева от него на один ряд выше. Числа, запи- санные в n-м ряду треугольника Паскаля, соответствуют биномиальным коэффици- ентам с верхним индексом п. Таким образом, найти интересующую нас последовательность биномиальных коэффициентов несложно. В нашем случае это будет четвертый ряд треугольника Паскаля: Лабиринт Комельяса Иногда подсчитывать все возможные случаи приходится в самых неожиданных си- туациях. В книге «Обозначения просодии и их применение в стихотворных разме- рах» Бартоломео Комельяса, опубликованной в Пальма-де-Мальорке в 1876 году, в разделе «Лабиринты», предлагается такой пример: сколькими способами можно составить фразу «Dios esta en todas partes» (исп. «Бог вездесущий»), начиная с лю- бой буквы D и заканчивая любой буквой S, которые расположены на гипотенузах изображенных ниже треугольников? 30
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА ч е S я X "'° D a*j НТВ Т В S В S D I I О О S S в О S В S BEST Комельяс приводит ответ: 10242 = 1048576 способов. Больше миллиона вари- антов! Оставим читателю выбор: найти решение самому или последовать за рассуж- дениями автора. Приведем комментарии Комельяса: «В лабиринте заключено несколько аллегорических и символических идей. Треугольники обозначают Бога Триединого и Справедливого. На гипотенузе первого треугольника записано имя Бога. В центре всей фигуры записана начальная буква, эквивалентная греческому символу, с ко- торого начинаются слова Theos — Бог и греколатинские названия «Теоло- гия» и «Теодицея», которые к нему относятся. Окружность, или корона из звезд, на которой можно прочесть свойства Бога, представляет Вечность, подобно тому как древние изображали ее в виде свернувшейся змеи, кусающей себя за хвост, и неизмеримость и всемогуще- ство Бога-творца. Круг символизирует католицизм. Катеты треугольников, образующие крест, символизируют христианство как истинную религию и веру в Бога. Два треугольника, имеющие форму песочных часов, повернутых вокруг центра, символизируют время, которое неподвижно для Бога, существующе- го вне времени. Невозможность прочесть все формы лабиринта, не повторив их и не пере- путав друг с другом, выражает непонятное и необъяснимое в истинной вере как одно из проявлений бесконечного и божественного». 31
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА Особый интерес представляет последний абзац, который, однако, применим к любой религии. Музыкальная «игра в кости» Моцарта Вольфганг Амадей Моцарт (1756—1791) придумал игру, в которой при помощи двух игральных костей можно создавать музыкальные произведения длиной до 16 тактов, не имея ни малейшего представления о том, как пишутся музыкальные произведения, и о музыке вообще. Его игра Musikalisches Wiirfelspiel — своеобраз- ный генератор музыкальных произведений: он представляет собой систему, в кото- рой по результатам броска двух костей можно составить великое множество разных композиций из 16 тактов. Моцарт записал 176 тактов, присвоил им номера от 1 до 176 и представил их в виде таблицы из 16 столбцов и И строк. В каждой ячейке этой таблицы записано по одному такту. Чтобы составить из них музыкаль- ное произведение, нужно бросить две игральные кости 16 раз (по числу столбцов) и после каждого броска выбрать такт, записанный в строке, номер которой укажет сумма очков на игральных костях (число возможных результатов равно И — от 2 до 12). 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 96 22 141 41 105 122 11 30 70 121 26 9 112 49 109 14 3 32 6 128 63 146 46 134 81 117 39 126 56 174 18 116 83 4 69 95 158 13 153 55 110 24 66 139 15 132 73 58 145 79 5 40 17 113 85 161 2 159 100 90 176 7 34 67 160 52 170 6 148 74 163 45 80 97 36 107 25 143 64 125 76 136 1 93 7 104 157 27 167 154 68 118 91 138 71 150 29 101 162 23 151 8 152 60 171 53 99 133 21 127 16 155 57 175 43 168 89 172 9 119 84 114 50 140 86 169 94 120 88 48 166 51 115 72 111 10 98 142 42 156 75 129 62 123 65 77 19 82 137 38 149 8 11 3 87 165 61 135 47 147 33 102 4 31 164 144 59 173 78 12 54 130 10 103 28 37 106 5 35 20 108 92 12 124 44 131 Не вдаваясь в подробности (некоторые такты совпадают, хотя обозначены раз- ными номерами), укажем, что число возможных композиций равно И16! Если ис- полнять все возможные композиции подряд и на исполнение каждой будет уходить 32
ИСКУССТВО ТОЧНОГО ПОДСЧЕТА всего 30 секунд, в общей сложности потребуется более 40 миллиардов лет непре- рывного звучания. По оценкам ученых, Большой взрыв, давший начало Вселенной, произошел 13—15 миллиардов лет назад, а наше Солнце погаснет через 5 миллиар- дов лет. Для исполнения всех возможных композиций, собранных с помощью игральных костей, придется покорить новые солнечные системы. Да, этой музыки нам хватит надолго! Кено и комбинаторика в поэзии Поэт и математик Раймон Кено (1903—1976), член группы УЛИПО, провел экс- перимент с сонетами, похожий на игру Моцарта. Кено создал книгу под названием Cent milliards de poemes («Сто тысяч миллиардов стихотворений»). Как утверждает сам автор в прологе, «благодаря этому небольшому произведению весь мир сможет сочинить миллиарды сонетов, и все они будут правильны и понятны». Книга Кено невелика: в ней всего десять листов, на каждом из которых запи- сано по одному сонету. Одна особенность: каждый лист разделен на четырнадцать полос, на которых и записаны отдельные строки сонета. Сочетая горизонтальные полосы, можно составить 1014 сонетов. Если мы будем тратить на чтение каждого из них полминуты (что довольно мало) и не будем тратить ни секунды на переход к следующему сонету, потребуется свыше 95 миллионов лет, чтобы прочесть их все, не останавливаясь ни на минуту. Экземпляр книги «Сто тысяч миллиардов стихотворений», название которой обозначает число сонетов, которые можно записать, комбинируя строки из книги. Этот пример с сонетами, как и музыка Моцарта, дают понять, как много наборов можно составить из небольшого числа исходных элементов. И это означает, что в разных ситуациях необходимо иметь подходящие методы для подсчета всех воз- можных вариантов. 33

Глава 2 История теории вероятностей Математика, как и почти вся наша культура, зародилась в Древней Греции. Основы этой науки были заложены примерно 2300 лет назад: именно тогда Евклид создал «Начала» — один из величайших бестселлеров в истории не только научной лите- ратуры, но и литературы вообще. Евклид преследовал две цели: с одной стороны, он хотел создать своего рода энциклопедию известных на тот момент математических знаний, с другой стороны — сформировать модель, в соответствии с которой можно было бы доказывать утверждения и создавать математические теории на основе ак- сиом и правил вывода. Таким образом ему удалось отделить математическую истину от реалий физического мира. Взяв за основу несколько результатов, которые были «очевидны» сами по себе, с помощью заранее установленных правил Евклид полу- чил новые истинные утверждения. Все здание математики опиралось на аксиомы, таким образом, при смене аксиом возникала новая математика. Именно это произо- шло в XIX веке, когда был поставлен под сомнение пятый постулат, один из наи- менее очевидных: «в плоскости через точку, не лежащую на данной прямой, можно провести одну и только одну прямую, параллельную данной». Отвергнув этот по- стулат, математики пришли к новым геометриям, которые стали называться неев- клидовыми. Конечной целью древнегреческой математики и геометрии как ее кульминации был поиск истины. Древние греки хотели доказать последовательность неоспори- мых истин исходя из нескольких аксиом (принимаемых без доказательства). Они стремились к поиску абсолютной истины и отвергали все неопределенные высказы- вания. Поэтому путь, которым шли древнегреческие математики, не слишком под- ходил для изучения неопределенности и случайности. Ни в «Началах», ни в других, более поздних греческих трактатах вы не найдете ничего, что было бы связано с вероятностью: для эллинов переход к вероятностям сопровождался непреодолимыми препятствиями. Хотя греки, подобно другим на- родам, любили азартные игры, особенно игры с бабками и игральными костями, о чем свидетельствуют археологические находки, они считали, что в непредсказуе- мых событиях, к которым относятся и броски игральных костей, проявляется воля 35
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ богов. Таким образом и следует воспринимать выпавший результат, даже не пытаясь понять, почему так происходит. Именно об этом говорится в некоторых работах Со- крата и Платона. Существовало и еще одно неудобство, которое делало изучение случайности в Древней Греции практически невозможным: греческая система счисления была не слишком удобной для расчетов (хотя это не мешало грекам использовать ее для изучения более интересных для них тем, например свойств чисел или различных их разновидностей — простых, совершенных, дружественных или треугольных). Гре- ки, как и римляне, обозначали числа буквами и, так как греческий алфавит состоял из 24 букв, первые девять обозначали числа от 1 до 9, девять следующих — десят- ки от 10 до 90, шесть остальных букв и еще три символа — сотни от 100 до 900. Грекам был неизвестен ноль, который значительно позже ввели индийцы. Все это делало греческую систему счисления малопригодной для вычислений. Известно, что она была в этом отношении даже хуже римской. Еще одна трудность заключалась в том, что источники случайных событий были неправильной формы: бабки имели шесть граней, но только четыре из них были до- статочно широкими, чтобы обеспечить бабке устойчивость. В зависимости от того, кость какого животного использовалась для изготовления бабки, вероятность вы- падения двух граней составляла около 40 %, двух других — около 10 %. Небольшая греческая терракотовая скульптура, датируемая 340-330 годом до н.э. Скульптура изображает женщин, играющих в бабки. В руках они держат небольшие игральные кости. 36
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Несмотря на то что греческая культура лежала в основе римской, в Древнем Риме произошла смена математической парадигмы. Для римлян самым важным в математике были не истина и красота, которые так волновали греков, а возмож- ность ее применения для измерений, вычислений и расчетов. Математика должна была быть удобной и обеспечить военное превосходство. Она перестала быть од- ним из важнейших разделов знания и перешла в разряд прикладных дисциплин. Несомненно, именно поэтому история не сохранила ни одного имени выдающегося римского математика (в отличие от плеяды греков, имена которых известны до сих пор: Пифагора, Фалеса, Евклида, Диофанта, Архимеда и других). Однако римляне использовали математику при строительстве впечатляющих дорог, мостов и акведу- ков во всех уголках своей империи, и многие следы этого можно увидеть в Европе, Азии и Северной Африке. Хотя римляне считали случайность проявлением воли богов, они начали анали- зировать вероятности. Цицерон писал: «Вероятность ведет нас по жизни». Он при- менил эту максиму на практике, усомнившись, что результат броска костей зависит от вмешательства конкретного божества — Венеры. Это привело к тому, что Цице- рон усомнился и в астрологии, чрезвычайно популярной в то время и не утратившей популярности и сейчас. Как бы то ни было, он оставил нам в наследство слово «веро- ятность» (производное от латинского «probabilis»), которое мы используем сегодня. В Средневековье никаких исследований вероятности не проводилось. К недо- статочному развитию науки в этот период следует добавить еще одно важное пре- пятствие: влияние религиозных догматов, согласно которым Бог был вездесущ. «Какие-то причины известны, другие — нет, но ничто не происходит без причи- ны», поэтому ничто не является случайным. Считалось, что исход любого события, важного или незначительного, зависел от божественного провидения, и эта точка зрения была серьезным препятствием на пути к развитию теории вероятностей. Так, в XV веке французский король Людовик XI запретил не только азартные игры, но и изготовление игральных костей, приравняв это к другим порицаемым деяни- ям — излишнему посещению таверн и распутству. 37
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ ПЕРВЫЕ АЗАРТНЫЕ ИГРЫ Картины, скульптуры, рукописи подтверждают, что игра в бабки была известна многим древним цивилизациям: египетской, греческой и римской. Во время археологических раскопок на захо- ронениях, возраст которых оценивается в 40 тысяч лет, было найдено почти в пять раз больше бабок, чем других костей. Даже в очень далекие времена людям были известны азартные игры, а в некоторых средиземноморских странах, например в Испании, Франции и Греции, детская игра в бабки дошла почти до наших дней. Чаще всего в азартных играх используются игральные кости в форме куба. Древнейшие из извест- ных нам игральных костей были керамическими. Они были найдены на севере Ирака и датируются III тысячелетием до н.э. Расположение точек на них отличается от современного (сегодня сумма очков на противоположных гранях равна 7), как показано на рисунке. Истоки теории вероятностей Первые отголоски понятия, которое позднее стали называть вероятностью, можно встретить в трудах великих ученых итальянского Возрождения: Тартальи, Певе- роне, Галилея и Кардано. Их рассуждения неизменно приводятся в контексте азарт- ных игр, как, например, в случае с так называемой задачей о разделе ставок. Лука Пачоли (ок. 1445 — ок. 1517) в 1494 году сформулировал эту задачу так: «Две команды играют в мяч так, что для победы нужно набрать 60 очков, а каждый гол приносит 10 очков. Ставки равны 10 дукатам. По какой-то причине закончить игру не удалось. Когда игра прервалась, у одной команды было 50 очков, у другой — 20. Нужно узнать, сколько денег причитается каждой команде». Никколо Фонтана по прозвищу Тарталья (1499—1557) предложил такое реше- ние: «Предположим, что нужно забить шесть голов, команда А забила пять, коман- 38
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ В Египте также были обнаружены игральные кости эпохи фарао^в, на грани которых были на- несены точки. Геродот описывает, как в Древней Ливии удалось справиться с голодом, поразившим страну около 1500 года до н. э.: люди играли весь день без остановки, чтобы не чувствовать голода, а на следующий день принимали пищу и не играли. Геродот пишет, что так ливийцы прожили почти восемнадцать лет. В Греции и Риме азартные игры были невероятно популярны. Гомер упоминает, что, будучи ребенком, Патрокл так рассердился на соперника по игре в бабки, что едва не убил его. В Риме игра в бабки стала настолько популярной, что в разные годы она запрещалась законом - с этого началась долгая история запретов азартных игр. Римский император Клавдий так любил игру в ко- сти, что играл во время путешествий и даже написал книгу об этой игре. Карточная колода появилась позднее, однако и ее не обошла дурная слава азартных игр. Несмо- тря на обилие гипотез, мы не знаем, как именно были созданы первые карты, но их появление произвело настоящий переворот в сфере досуга средневекового человека. Первое упоминание о карточных играх в Европе датировано 1376 годом, когда во Флоренции был издан указ, запре- щавший карты. По сути, несмотря на то что древних карт почти не сохранилось, распространение этой игры можно проследить по запретам, которые издавались в разных частях Европы. да В — три. Я считаю, что справедливо разделить ставки 2 к 1, так какЛ опережа- ет В на 2 гола. Это 1/3 от числа всех голов. Следовательно, А следует забрать 1/3 ставок. Остаток делится между командами поровну, таким образом, А имеет преимущество над В в соотношении 2 к 1». Однако сам же Тарталья был не вполне согласен с собственными рассуждениями и признавал: «Ответ на этот вопрос дол- жен быть скорее судейским, нежели математическим, поэтому каким бы ни был спо- соб разделения ставок, всегда найдется причина для спора». В 1558 году Джованни Франческо Певероне (в книге «Два коротких и легких трактата по началам арифметики и основам геометрии») привел более правильное решение: «Допустим, что А нужно выиграть одну партию, чтобы получить приз, и что ставка равна единице. Если В также осталось победить в одной партии, эта команда также ставит единицу. Если В осталось победить в двух партиях, нужно заплатить еще 2 единицы, чтобы перейти в позицию, когда останется победить всего 39
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ в одной партии. Следовательно, ставки нужно разделить в соотношении 3 к 1. Если команде В осталось выиграть три партии, ей вновь нужно заплатить в два раза боль- ше. В задаче Пачоли ставки делятся 7 к 1». ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ: ДОИСТОРИЧЕСКИЙ ПЕРИОД При изучении теории вероятностей удобно рассматривать комбинаторные задачи. Если мы совершим краткий экскурс в историю, то увидим, что уже в знаменитой китайской «Книге пере- мен», датируемой 1200 годом до н.э., можно встретить мистические сочетания гексаграмм. Греческие философы иногда рассуждали о задачах, которые сегодня решаются методами ком- бинаторики, но не создали какой-либо теории, касающейся их. Римский мыслитель Боэций (V век н.э.) также достаточно подробно описал правило, позволяющее найти число сочетаний из л предметов по 2. Правила расчетов числа размещений и сочетаний изучали еврейский астроном Авраам ибн Эзра (XI век) и Леви бен Гершом (XIV век). В Средневековье комбина- торные задачи связывались с магическими символами. Создателем теории сочетаний считают каталанского мыслителя и алхимика Раймунда Луллия (XIII век): он хотел представить все эле- менты Вселенной посредством истинных знаков, а затем, составив все возможные их сочетания, найти истинные символы для всех возможных составных высказываний. Галилей перечислил 216 разных результатов броска трех идеальных игральных костей, однако при решении этой задачи он использовал не комбинаторику, а чисто арифметические методы. С изобретением книгопечатания стали издаваться не вполне точные трактаты о различных модных играх, правила которых ранее передавались из уст в уста. Дже- роламо Кардано (1501—1576) стал автором «Книги об азартных играх» (Liber de ludo aleae) — первой книги, в которой рассказывалось о случайности. Целью Кар- дано было вычислить различные вероятности выпадения очков при бросках костей, а также решить задачи о разделе ставок. Так как в его распоряжении не было под- ходящей системы обозначений, Кардано использовал конкретные примеры. В его трактате не используются современные выражения для объединения и пересечения событий, а применяются, главным образом, два метода: подсчет числа возможных исходов и вычисление среднего выигрыша. Любопытно, что книга начинается с по- учений о вреде азартных игр. Кардано работал с понятиями, которые сегодня связы- вают с классическим определением теории вероятностей, однако не дал этим поня- тиям четких определений. Он первым стал присваивать событию, исход которого 40
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ неизвестен, число (вероятность) р в интервале от 0 до 1, принимая во внимание об- щее число исходов и число благоприятных исходов. Он также предвосхитил закон, известный сегодня как закон больших чисел, указав, что если вероятность некоторо- го события равна р, то после большого числа повторений N разумно ставить на то, что это событие произойдет примерно Np раз. Однако Кардано не разглядел теоре- тическую важность этих понятий: он считал подобные соотношения чисто арифме- тическими и не рассматривал их как меры вероятности случайных событий. Позднее Галилео Галилей (1564—1642) вновь решил некоторые задачи, постав- ленные Кардано, и в 1613—1624 годах написал трактат об этом. В избранных со- чинениях Галилея, опубликованных в 1718 году, этот трактат приведен под названи- ем «Рассуждение об игре в кости» (Considerazione Sopra il Gioco dei Dadi). В эту книгу включена следующая задача: «При броске симметричной игральной кости с равной вероятностью могут выпасть 1, 2, 3, 4, 5 или 6 очков. При броске двух костей сумма выпавших очков заключена между 2 и 12. И 9, и 10 можно получить из чисел 1, 2, 3, 4, 5, 6 двумя разными способами: 9 = 3 + 6 = 4 + 5и10 = 4 + 6 = = 5 + 5. В задаче с тремя костями и 9, и 10 очков можно получить множеством способов: сумма в 10 очков получается при любом из исходов {(1, 3, 6), (1, 4, 5), (2, 2, 6), (2, 3, 5), (2, 4, 4) и (3, 3, 4)}, а исходы, при которых сумма выпавших очков равна 9, таковы: {(1, 2, 6), (1, 3, 5), (1, 4, 4), (2, 2, 5), (2, 3, 4) и (3, 3, 3)}. В обоих случаях насчитывается по шесть благоприятных исходов. Почему же, если бросить три кости много раз, сумма в 10 очков выпадет чаще, чем 9?» Чтобы решить эту задачу, Галилей тщательно проанализировал возможные сум- мы очков при броске трех костей и определил, что общее число возможных исходов равно 216. Из них в 27 случаях сумма очков равна 10, в 25 случаях — 9. Примеча- тельно, что его рассуждения аналогичны современным, и это наводит на мысль о том, что понятие «равновероятных» граней игральной кости было известно уже в XVI веке. Однако основным вкладом Галилея в теорию вероятностей стало создание теории ошибок измерения. Галилей полагал, что ошибки измерения неизбежны и делятся на две группы: систематические, обусловленные методами и средствами измерения, и случайные, которые изменяются непредсказуемым образом от одного измерения к другому. Эта классификация используется и сейчас. Галилей не только внес вклад в теорию вероятностей, но и заложил основы статистики. 41
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ СТАТИСТИКА Древние цивилизации не создали трактатов по теории вероятностей (о ней сохранились лишь немногие упоминания), однако до наших дней дошли свидетельства о некоторых статистических исследованиях древности. В Китае переписи населения проводились уже в 2000 году до н.э., во времена династии Ся, а в эпоху династии Чжоу (1111 год до н.э, - 211 год до н.э.) су- ществовала административная должность ответственного за переписи населения. В Римской империи также существовал важный пост цензора, задачей которого было проведение цензов. Сохранились упоминания о статистических исследованиях, проводившихся в Индии в IV веке и в Древнем Египте эпохи фараонов, когда регистрировался уровень воды в Ниле. Статистика косвенно упоминается и в Ветхом Завете. Однако лишь в XVII веке Джон Граунт (1620-1674) составил первые прогнозы смертности, связав статистику и теорию вероятностей. Его методы используются и сейчас. Первый статистический ценз в Испании прошел в 1495 году, когда по приказу короля Ферди- нанда Католика была проведена перепись населения королевства Арагон. Подсчет численности населения производился по числу очагов на территории королевства. Целью переписи было определить экономическое положение королевства и число рекрутов, которых можно было на- брать в случае возможного нападения французских войск. Результатом тщательного подсчета численности населения всех населенных пунктов (с указанием рода занятий), а также учета бедных (не вносящих вклад в экономику государев а) стала ценная информация об уровне производства и составе населения (место проживания, абсолютная и относительная числен- ность христиан и мусульман). Рождение теории вероятностей В создание теории вероятностей в той или иной мере внесли вклад многие ученые, однако исследователи практически единодушно считают, что она родилась в пе- реписке между Паскалем и Ферма, которые пытались решить задачи, предложен- ные Паскалю шевалье де Мере. Примерно в 1652 году, во время путешествия, строгий и набожный Блез Па- скаль (1623—1662) познакомился с Антуаном Гомбо, известным как шевалье де Мере (1607—1684) — одним из многих знатных любителей игр в кости и карты, профессиональным игроком, образованным и умным человеком, который понимал, что знание игр и размышления о них могут оказаться выгодными. В одной из бесед 42
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Портреты Пьера Ферма (слева) и Блеза Паскаля. он предложил Паскалю ряд задач, которые заинтересовали математика, и тот рас- сказал о них Пьеру Ферма (1601—1665). В переписке между Ферма и Паскалем совместными усилиями двух великих умов было дано серьезное начало исчислению вероятностей. Ферма и Паскаль были французами, жили в Тулузе и Париже соответственно (расстояние между ними, равное примерно 600 километрам, сегодня считается небольшим) и тесно сотрудни- чали, однако никогда не встречались лично. Их общение проходило исключительно в форме переписки (поэтому мы должны ценить современные возможности обще- ния и то, в какой мере они помогают совершать научные открытия). Три задачи, которые де Мере предложил Паскалю, звучали так: 1. Допустим, что два игрока Л и В сделали ставки, сумма которых равна 60 мо- нет. Первый, кто набирает 3 очка, забирает банк, однако в тот момент, когда у А было 2 очка, у В — 1, по взаимному согласию игроки решили прекратить игру. Как следует разделить ставку в 60 монет? 2. Кто имеет больше шансов на победу при броске трех костей: тот, кто ставит на 9, или тот, кто ставит на 10? 3. Выгодно или нет ставить на то, что шестерка выпадет как минимум один раз при четырех бросках игральной кости? 43
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Говоря о второй задаче, де Мере признался Паскалю: он предчувствовал, что вы- годнее ставить на 10, однако не мог это четко объяснить, поскольку и 10, и 9 можно представить в виде суммы трех слагаемых от 1 до 6 (таковы возможные результаты броска игральной кости) шестью способами: 9 = 1 + 2 + 6 = 1 + 3 + 5 = 1 + 4 + 4 = 2 + 2 + 5 = 2 + 3 + 4 = 3 + 3 + 3; 10 = 1 + 3 + 6 = 1 + 4 + 5 = 2 + 2 + 6 = 2 + 3 + 5 = 2 + 4 + 4 = 3 + 3 + 4. Предположение де Мере было обоснованным, так как простой подсчет числа благоприятных исходов позволяет определить: — вероятность выигрыша при ставке на 9 равна 25/216; — вероятность выигрыша при ставке на 10 равна 27 /216. Иными словами, ставить на 10 выгоднее, чем на 9, пусть разница и составляет всего 1/108. Но если в одной отдельно взятой игре она почти незаметна, при боль- шом числе игр разница будет ощутимой. Нет никаких сомнений, что де Мере об- ладал богатым опытом и, как следствие, интуицией игрока. Решение третьей задачи, которое привел Паскаль, на современном языке звучит так: вероятность того, что при броске кости не выпадет 6, равна 5/6; так как все броски независимы между собой (результат одного броска никак не влияет на ре- зультат другого), вероятность того, что шестерка не выпадет ни одного раза из че- тырех бросков, равна: Р (6 не выпадет ни разу) = 5/6-5/6-5/6-5/6 = 54/64 = 671/1 296 = 0,518 = 51,8 % (объяснение этого решения приведено в следующей главе). Эта вероятность чуть больше 0,5, следовательно, выгодно ставить на то, что 6 не выпадет ни разу. Однако на практике почувствовать разницу между вероят- ностью в 51,8 и 48,2% можно будет только по результатам большого числа игр. И вновь умный игрок оказался прав. Чтобы увидеть, как Паскаль и Ферма решали эти задачи, рассмотрим, немного переформулировав, первую задачу — о разделе ставок, которую Пачоли и Кардано изучили за сто лет до этого. Паскаль нашел решение не сразу: он размышлял в тече- ние двух лет, после чего сообщил Ферма о полученных результатах. В одном из пер- вых писем (за которым последовала переписка в течение двух лет) Паскаль расска- зал Ферма о встрече с де Мере и привел свое решение задачи о разделе ставок: 44
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ «Здесь я приблизительно изложу, как я поступил, чтобы узнать цену каждой пар- тии, когда два игрока играют, например, три партии, и каждый поставил по 32 моне- ты. Предположим, что первый набрал два очка, второй — одно. Теперь они играют очередную партию, и если первый одержит верх, то заберет все деньги, которые есть в игре, то есть 64 монеты. Если же выиграет второй, то счет будет два очка против двух очков, и, как следствие, если игроки захотят разойтись, то каждый должен будет забрать столько же, сколько поставил, то есть 32 монеты. Обратите внима- ние, милостивый государь, что если выигрывает первый, то получает 64 монеты, если проигрывает — 32. Если же они не желают рисковать и хотят поделить деньги без игры, первый должен сказать: «Я уверен в том, что получу 32 монеты, поскольку даже поражение принесет мне столько; что же до остальных 32, возможно, они до- станутся мне, возможно — вам; шансы равны, поэтому мы разделим эти 32 монеты поровну». Таким образом, одному из игроков достанется 48 монет, другому — 16». Письмо заканчивается широко известной фразой «У шевалье де Мере очень хо- роший ум, но он не геометр [математик], а это, как вам известно, большой недо- статок». Эта фраза и сегодня говорит об уважении к своей профессии, привычном среди математиков, но не столь распространенном в обществе в целом. Почти в то же самое время Ферма решил эту задачу совершенно другим мето- дом и, кроме того, привел решение в общем виде, что побудило Паскаля написать: «Теперь вы видите, что истина одинакова и в Тулузе (где жил Ферма. — Авт.), и в Париже (где проживал Паскаль. — Авт.)». Результатом этой переписки стал целый ряд работ по комбинаторике, написан- ных Паскалем: в 1665 году был опубликован его «Трактат об арифметическом треу- гольнике» — важнейший труд по комбинаторике среди существовавших на тот мо- мент. Книга начиналась с построения числового треугольника, который с тех времен известен как треугольник Паскаля (о нем мы уже рассказывали). Примерно в 1655 году голландский ученый Христиан Гюйгенс (1629—1695) по- знакомился с идеями Паскаля и Ферма благодаря Робервалю, преподавателю мате- матики в Коллеж де Франс, и начал работать над задачами, связанными с исчисле- нием вероятностей, которые изложил в своей книге «О расчетах при азартных играх» (De ratiociniis in ludo aleae) в 1657 году. Помимо решения интересных задач, связанных с играми, в книге он также объясняет понятие «математического ожида- ния» на примере переменной, принимающей конечное множество значений. Робер- валь ввел это понятие при решении задач о ренте и налогах, для чего ему потребова- лось проанализировать ожидаемую продолжительность жизни на основе данных, собранных в Лондоне. Он осознавал всю важность вычисления вероятностей, ска- 45
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ ПАРИ ПАСКАЛЯ По итогам своих размышлений Паскаль использовал вероятности в религиозных рассуждениях - в конце жизни он посвятил себя религии и попытался доказать истинность католической веры. Рассуждения Паскаля известны под названием «пари Паскаля» и приведены в разделе VIII его «Мыслей о религии и других предметах». Он пишет: «Разумнее верить, чем не верить, в то, чему учит христианская религия. Бог есть или Бога нет. Но на которую сторону мы склонимся? Разум тут ничего решить не может Нас разделяет бесконечный хаос. На краю этого бесконечного расстоя- ния разыгрывается игра, исход которой неизвестен. На что вы будете ставить? Взвесим выигрыш и проигрыш, ставя на то, что Бог есть. Возьмем два случая: если выиграете, вы выиграете все; если проиграете, то не потеряете ничего. Поэтому, не колеблясь, ставьте на то, что Он есть. «Отлично, следует так поступить; но, может быть, я делаю слишком большую ставку?» Посмотрим. Так как случайности выигрыша и потери одинаковы, то если бы вам представлялась возможность выиграть только две жизни за одну, то и тогда рискнуть этою одною не было бы неразумно. А если бы можно было выиграть три жизни, риск был бы еще уместнее (так как вы в необходимости играть), и вы поступили бы неблагоразумно, не рискнув своею жизнью ради выигрыша трех жизней в такой игре, где случайности выигрыша и проигрыша одинаковы». Эти рассуждения часто использовались для того, чтобы заставить верующих следовать церков- ным заповедям: хотя вероятность того, что заповеди верны, невелика, выигрыш, получаемый за их соблюдение, бесконечен (вечное счастье), поэтому разумно ставить на то, что Бог есть. Похожие рассуждения применяются, когда речь идет об играх с малой вероятностью выигрыша и большим зав: «Читатель заметит, что мы говорим не только об играх, но скорее об основаниях новой теории, глубокой и интересной одновременно». Так понятие вероятности по- явилось при решении задач, связанных с играми, а затем начало прокладывать себе путь в другие сферы жизни общества, и основы теории вероятностей заложили Па- скаль, Ферма и Гюйгенс. Развитие теории вероятностей По итогам переписки Паскаля и Ферма теория вероятностей вошла в число матема- тических теорий, переживавших в то время бурный рост благодаря открытиям мно- жества талантливых европейских ученых. Основы применения теории вероятностей в различных сферах жизни общества, в том числе в морали и экономике, заложил Якоб Бернулли (1654—1705). Его труд «Искусство предположений» был опубликован в Базеле в августе 1713 года, спустя 46
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ призом. В массе своей люди делают вывод: такая игра стоит риска; хотя вероятность выиграть большой приз мала, но если нам повезет, то мы в мгновение ока разбогатеем. Поэтому такие игры очень популярны. «Пари Паскаля» обсуждали многие мыслители и философы, выдвигая интересные и провока- ционные аргументы. Дидро заметил: «Существует множество других крупных религий, например ислам, в котором также обещается спасение души. Применимо ли пари Паскаля к исламу? И если да, то следует ли нам принять все основные религии одновременно?» Уильям Джеймс в своем сочинении «Воля к вере» приводит более простые рассуждения в под- держку веры в Бога: так как существование Бога не доказано и не опровергнуто, человеку следует сделать такой выбор, в результате которого он станет более счастливым на протяжении жизни (по мнению Джеймса, этим выбором была вера в существование вечной жизни). Герберт Уэллс, рассуждая о неопределенности, вызванной существованием атомной бомбы, ука- зывал, что нам неизвестно, сможет ли мир выжить в атомной войне. Однако нужно жить и действо- вать так, как если бы мы были уверены в том, что выживем: «Если в конечном итоге наш оптимизм окажется неоправданным, по меньшей мере мы проживем жизнь в хорошем расположении духа». Пари Паскаля не забыто и в наши дни. Так, оно является одной из основных тем в творчестве режис- сера Эрика Ромера, который связывает его со случайностью и предопределением и возвращается к этой теме снова и снова в фильме «Моя ночь у Мод». восемь лет после его смерти, однако Бернулли работал над этой книгой с 1685 года, когда познакомился с трудами Гюйгенса. Бернулли определил вероятность как сте- пень уверенности в том, что некоторое событие может произойти в будущем. На- звание своей книги он объяснял так: «Определим искусство предположений, или искусство вероятностей, как искусство оценивать наиболее возможную вероятность вещей так, что в наших суждениях и действиях мы всегда можем основываться на том, что лучше, уместнее, вернее и благоразумнее всего; и ни мудрость философа, ни предусмотрительность государственного мужа не могут обойтись без нее». Первые три из четырех частей «Искусства предположений» представляют собой продолжение работ Гюйгенса, систематическое изложение полученных им результа- тов, связанных с комбинаторикой, и способов их применения в азартных играх. Чет- вертая часть книги существенно отличается от предыдущих: в ней рассматриваются новые темы, доказывается теорема Бернулли о больших числах, а также вводится важное понятие доверительного интервала. 47
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Бернулли рассматривает два типа случайных событий. К одним он относит те, что связаны с азартными играми, где вероятности известны в силу самих правил игры, и их можно смоделировать с помощью шаров и коробок. Второй тип — это ситуации, в которых вероятности определяются апостериори, после того как событие произошло большое число раз. Бернулли считал, что с увеличением числа испытаний можно получить все более и более точное значение вероятности события. Он пи- шет: «Предположим, что в одной коробке лежит 3000 белых шаров и 2000 черных. Чтобы определить их число, мы извлекаем шары из коробки по очереди, а затем возвращаем в коробку. Мы замечаем, с какой частотой мы извлекаем белый шар, с какой — черный. Можете ли вы извлечь столько шаров, [...] что соотношение извлеченных вами белых и черных шаров будет равно 3:2, как и соотношение числа белых и черных шаров в коробке?» НЕ СТОЛЬ ОЧЕВИДНО Чтобы понять, как сложно изучать случайность, следует вспомнить, что выдающиеся математи- ки, блистающие в других областях, спотыкались на теории вероятностей. Например, Готфрид Вильгельм Лейбниц (1646-1716), один из величайших мыслителей всех времен, который также любил играть в кости (что должно было помочь ему), был убежден, что при броске двух костей 11 и 12 очков выпадает с одинаковой вероятностью. Он приводил настолько очевидный, на- сколько и ошибочный довод: и 11, и 12 очков можно представить в виде суммы очков только одним способом (12 = 6 + 6; 11= 5 + 6). В действительности вероятность того, что выпадет 11, в два раза больше вероятности того, что выпадет 12: И можно получить, если на первой кости выпадет 5 очков, на второй - 6, и наоборот, в то время как 12 можно получить только тогда, когда и на пер ой, и на второй кости выпало 6 очков. Еще один важный результат, полученный Бернулли, касается многократных бро- сков несимметричной монеты, для которой вероятность выпадения решки равна р, вероятность выпадения орла равна q = 1— р (р и q не равны 1/2). Если подбросить монету дважды, вероятность того, что решка выпадет 2, 1 или 0 раз, будет равна р2, 2pq и q2 — это члены многочлена (р + q)2 = р2 + 2pq + q2. Если подбросить мо- нету трижды, то вероятности того, что решка выпадет 3, 2, 1 или 0 раз будут равны (р + q)3 = р3 + 3p2q + 3q2p + q\ Можно сделать обобщение: если мы бросаем монету п раз, то вероятность выпадания решки тп раз равна 48
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ п ж т n—tn р я , то есть соответствующему члену (р + q)n. Таким образом, имеем так называемое биномиальное распределение. Сам Бернулли осознавал важность своего открытия. В частности, он писал: «Я ценю это открытие (расширение теории вероятностей на другие задачи помимо тех, что связаны с азартными играми.— Авт.) намного больше, чем если бы мне удалось решить саму задачу о квадратуре круга, поскольку если бы она в самом деле была решена, то пользы от нее было бы не слишком много». Спустя двадцать лет после выхода книги Бернулли была опубликована знамени- тая задача Бюффона об игле (Жорж Луи Леклерк де Бюффон включил ее в «Эссе по арифметике морали», 1733). Задача звучит так. На дощатый пол, ширина досок которого равна L, бросают иглу длиной L/2. Какова вероятность того, что игла упа- дет поверх одной из щелей между досками пола? Так в задаче теории вероятностей впервые появилась геометрическая составляющая. Кроме того, решение этой задачи было тесно связано со знаменитым числом Л (и вновь далекие друг от друга мате- матические понятия оказались близкими), так как искомая вероятность равна 1/л. Таким образом, стало возможным вычислить значение Л экспериментально со сколь угодно высокой точностью — достаточно было повторить эксперимент необходимое число раз. Результаты броска иглы поверх сетки из параллельных линий. Автором этой задачи является граф де Бюффон, объединивший геометрию и теорию вероятностей 49
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Еще одним выдающимся ученым, сделавшим большой вклад в развитие тео- рии вероятностей, был Абрахам де Муавр (1667—1754). Он родился во Фран- ции, но из-за религиозных преследований в Европе вынужден был искать убежи- ща в Англии. Причиной отъезда де Муавра послужила отмена Людовиком XIV в 1685 году Нантского эдикта, гарантировавшего свободу вероисповедания. Де Муавр был гугенотом, поэтому ему пришлось покинуть страну. В Англии он стал членом Лондонского королевского общества и близким другом Ньютона. В книге The Doctrine of Chances (она выдержала несколько изданий, в которые включались новые результаты) де Муавр продолжает рассуждения Гюйгенса и Бернулли, одна- ко использует методы анализа бесконечно малых, который зарождался в то время. Де Муавр расширил работу Бернулли о несимметричных монетах. Если число бросков и число решек — большие числа, то с точностью вычислить биномиальные коэффициенты непросто. Де Муавр вывел формулу, которая устанавливала прибли- женную связь биномиального распределения Бернулли с нормальным распределе- нием: Де Муавр первым явно выразил эту связь, которая, как вы увидите далее, сыгра- ла важнейшую роль в развитии теории вероятностей и статистики. Пьер-Симон Лаплас написал свой первый труд о вероятностях в 1773 году, когда анализ бесконечно малых уже широко применялся. В этом труде Лаплас рассматри- вал прежде всего математические аспекты вероятностей, оставив в стороне фило- софские рассуждения, которые занимали важное место в трудах его предшествен- ников. Позднее, в 1820 году, в «Опыте философии теории вероятностей», который стал введением к третьему изданию монументального труда «Аналитическая теория вероятностей» (первое издание увидело свет в 1812 году), Лаплас высказал свою знаменитую гипотезу о всеобщем детерминизме: «Мы должны рассматривать ны- нешнее состояние Вселенной как результат его предшествующего состояния и как причину состояния, которое воспоследует. Разум, которому в настоящий момент были бы известны все силы, движущие природой, и относительное положение всех существ, ее составляющих, и который был бы достаточно обширным, чтобы под- вергнуть все эти данные анализу, подытожил бы в одной и той же формуле дви- жения величайших тел Вселенной и мельчайших атомов: для этого разума ничто не было бы неопределенным, и грядущее, равно как и прошлое, предстали бы перед его глазами», — писал он. 50
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Следует отметить: Лаплас не утверждает, что высший разум способен опреде- лить все следствия законов природы, напротив, целью ученого было развитие науки о вероятностях, которое позволило бы точнее узнать законы природы. Так он при- шел к знаменитому выводу, согласно которому «в настоящей книге видно, что тео- рия вероятностей по своей сути есть не более чем здравый смысл, сведенный к ис- числению: эта теория позволяет нам оценить то, что точные умы чувствуют своим инстинктом, который часто не осознают». ПЬЕР-СИМОН ЛАПЛАС (1749-1827) Этот французский астроном и математик стал автором некоторых важнейших открытий в тео- рии вероятностей, в том числе так называемого правила Лапласа - одного из самых известных законов присвоения вероятностей. Родные хоте- ли, чтобы ученый посвятил свою жизнь церкви, но его истинным призванием стала матема- тика. Также Лаплас проявил большие способ- ности к общественным наукам и политике. Он получил должность преподавателя в Военной академии, где провел некоторые из важнейших своих исследований. Затем он занял должность экзаменатора и как-то раз экзаменовал блестя- ще образованного и многообещающего 16-лет- него юношу, который очень интересовался математикой. Этим юношей был Наполеон Бона- парт. После Великой французской революции Лаплас отстаивал республиканские убеждения и, в отличие от некоторых других ученых, легко пережил то неспокойное время: так, Лавуазье, отец современной химии, в буквальном смысле лишился головы. Позднее, когда Наполеон пришел к власти, Лаплас был провозглашен министром внутренних дел, однако пробыл в этой должности всего месяц. Впоследствии он занимал различные политические посты и предложил сделать Наполеона членом Парижской академии наук, добившись тем самым его благосклон- ности. После свержения императора и реставрации монархии ученый вновь адаптировался к новым условиям и даже получил от Людовика XVIII титул маркиза. Его имя в числе имен 72 вы- дающихся ученых выгравировано на Эйфелевой башне. 51
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Его труд состоял из двух частей: в первой он изложил теорию производящих функций и рассуждения, используемые для нахождения приближенных результатов формул с большими числами; во второй части он рассмотрел общую теорию вероят- ностей. Благодаря Лапласу и его ближайшим последователям, в частности Тауссу и Ле- жандру, теория вероятностей была достаточно развита, требовалось лишь система- тизировать ее, улучшить и пересмотреть некоторые результаты. Эта задача была решена в XIX веке. Новая теория применялась все шире и через статистическую механику проложила свой путь в физику. Теорией вероятностей занималось множество выдающихся ученых XIX века: Пуассон, де Морган, Курно и Чебышев, ставший основателем русской школы тео- рии вероятностей, к которой принадлежали его ученики Марков и Ляпунов. С их по- мощью в науку пришел Андрей Колмогоров, сформулировавший аксиоматическую теорию вероятностей, о которой рассказывается в следующей главе. Колмогоров, понимая, что его работа положила конец длительной борьбе с неопределенностью, сказал: «Эпистемологическая ценность теории вероятностей основана на том факте, что случайные явления, рассмотренные совокупно и в больших масштабах, создают неслучайный порядок». Начался новый этап покорения случайности. АНДРЕЙ НИКОЛАЕВИЧ КОЛМОГОРОВ (1903-1987) Сменив в юности несколько профессий, Колмогоров на- чал изучать математику в Московском государственном университете и еще в студенческие годы опубликовал несколько работ, получивших международную извест- ность. Он преподавал математику в МГУ и занимался исследованиями в различных ее областях (анализе, топологии и т.д.), однако особо важен его вклад в те- орию вероятностей и ее применение в разных сферах, в частности в динамических системах. В 1965 году Колмогоров был удостоен Ленинской премии - одной из высших наград бывшего СССР, присуждаемой за до- стижения в науке, технике и культуре. 52
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Особого упоминания заслуживает бельгийский математик Адольф Кетле (1796—1874), который проявлял особый интерес к применению теории вероятно- стей и статистики в различных сферах жизни и считается создателем современной статистики. Он собрал различные данные, характеризующие жизнь общества, и описал их, применив закон нормального распределения, который он называл за- коном случайных причин. Начиная с 1835 года Кетле доказывал возможность использования кривой нор- мального распределения для моделирования данных о жизни общества (числа ново- рожденных, умерших, преступлений и самоубийств). Кетле понимал, что подобные события применительно к каждому человеку в отдельности непредсказуемы, однако при изучении населения в целом можно выделить статистические закономерности. Он воплотил эту идею в жизнь, введя понятие «среднего человека» — этот тер- мин, который стал широко использоваться позже, означает вымышленного челове- ка, среднего во всех отношениях. При этом Кетле рассматривал среднего человека не только как математическое понятие, но и как выражение идеи социальной спра- ведливости. В 1844 году ученый посрамил всех скептиков: проанализировав рост мужчин с помощью закона нормального распределения, он обнаружил подложные данные, касавшиеся уклонения от военной службы во Франции. Теоретические прогнозы Кетле показали, что около 2 тысяч молодых людей избежали призыва, указав, что их рост меньше минимально допустимого. Новейшая история теории вероятностей Вы попали в финал телевизионного конкурса, и перед вами — три закрытые двери. За одной из них — главный приз, автомобиль, за двумя другими — ничего ценного. Нужно выбрать одну из трех дверей. Когда вы указали на одну из дверей, ведущий решил подогреть интерес зрителей: он открыл одну из двух оставшихся дверей, за кс торой не оказалось ничего, и дал вам шанс выбрать дверь снова. Разумеется, можно остановиться на той двери, которую вы уже выбрали, но можно изменить выбор и указать на другую закрытую дверь. Как следует поступить? Изменится ли результат, если мы изменим свой выбор? Кажется, что смена выбора никак не меняет шансы на выигрыш. Однако эта задача (известная как парадокс Монти Холла) вызвала множество дискуссий с уча- стием видных математиков. Это доказывает, что теорию вероятностей по-прежнему полностью понимают далеко не все. 53
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ С 1963 по 1990 год на американском телевидении выходила передача под на- званием Let’s Make a Deal, которую вел знаменитый Монти Холл, и описанная нами задача основана на реальных событиях. Также в течение многих лет более чем в 300 американских газетах публиковалась колонка вопросов и ответов под названи- ем «Спросите Мэрилин». Автор колонки, Мэрилин вое Савант, упомянута в Книге рекордов Гиннесса как человек с самым высоким в мире коэффициентом интеллек- та — 228, ее муж — врач и ученый Роберт Джарвик, создатель искусственного сердца. В одно из воскресений сентября 1990 года в колонке был опубликован во- прос, относящийся к предыдущей задаче: «Выгодно ли участнику конкурса изме- нить первоначальный выбор?» Мэрилин ответила, что выбор будет лучше изменить. В результате на нее об- рушилась лавина писем от читателей (около 10 тысяч), которые были практически единодушны: 92 % утверждали, что Мэрилин ошибается, и добавляли, что чувству- ют себя обманутыми, потому что такой умный человек дал неверный ответ на столь простой вопрос. Среди авторов писем были и возмущенные преподаватели матема- тики. Один из них писал: «Позвольте объяснить вам: если вам указывают на дверь, за которой ничего нет, это меняет вероятность угадывания для любого из оставших- ся вариантов, и нет никакой причины, по которой шансы на выигрыш для какой- либо из дверей превышали бы 1/2. Как профессиональный математик, я крайне обеспокоен недостатком математических знаний у широкой публики. Пожалуйста, признайтесь, что совершили ошибку, и будьте более осмотрительны в будущем». В другом письме говорилось: «Я потрясен: после того как вас поправили по меньшей мере трое математиков, вы все еще не видите своей ошибки». А также: «Сколько возмущенных математиков необходимо, чтобы вы изменили свое мнение?» Письма продолжали поступать в промышленных масштабах, пока Мэрилин не вернулась к этой теме снова и не положила конец разногласиям. Вос Савант была права, а все, кто писал ей (и профессиональные математики, и простые читатели), ошибались. Приведем схему (для исходной задачи, в которой за одной из трех дверей нахо- дится автомобиль, за другой — коза), на которой показано, что если игрок не изме- нит выбор, то вероятность выигрыша (выбрана одна дверь из трех) будет равна 1/3, если же он изменит выбор, то вероятность выигрыша составит 2/3, то есть шансы на победу возрастут в два раза. 54
ИСТОРИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ Правильность этих рассуждений можно подтвердить не только с помощью изо- браженной выше схемы, но и экспериментально: можно положить на стол, напри- мер, три карточки, на обратной стороне одной из которых будет изображена ма- шина, перемешать их, после чего выбрать одну и сменить выбор. Чтобы получить значимое число результатов, попробуйте провести этот эксперимент с друзьями, и вы увидите, что полученные результаты будут соответствовать указанным вероят- ностям. Вы также можете смоделировать ситуацию на компьютере, необходимые для этого программы можно найти на различных сайтах, например на странице Stick or switch сайта Университета штата Юта (http://enlvm.usu.edu/ma/nav/activity. jsp?sid=nlvm&cid=4_2&lid=117). Удивительно, что с возражениями выступали не только обычные математики — даже венгр Пол Эрдёш, один из величайших математиков XX века, сказал, что по- добная ситуация невозможна, и признал ошибку только после того, как ознакомился с результатами компьютерного моделирования. 55

Глава 3 Вероятность и случайность Каждый день мы слышим новости, в которых говорится о возможности какого-либо события, вероятности выигрыша приза, странных совпадениях, вероятности того, что лампочка проработает свыше 1000 часов, возможности победы в футбольном чемпионате и т. д. Десятки опросов сообщают нам наше мнение по множеству тем, причем удивительно, что хотя мы лично не участвовали в этих опросах, их результа- ты обычно соответствуют реальному положению вещей. Для большинства перечисленных событий и явлений мы можем определить все возможные исходы, однако спрогнозировать конкретный результат невозможно. Эти явления и эксперименты подвержены влиянию случайности. Но некоторые из упомянутых событий не укладываются в эту категорию. Так, сложно поверить, что результат футбольной встречи лучшего клуба Европы и команды любителей бу- дет случайным. Мы будем рассматривать только те эксперименты и события, кото- рые можно считать случайными или удовлетворяющими законам случайности. Что такое случайность? В толковом словаре случайность определяется как нечто появившееся, возникшее непреднамеренно, непредвиденно. Возможно, если каждо- го из нас спросят, что мы понимаем под «случайностью», мы не сможем дать четкого ответа и скорее всего попытаемся объяснить это слово на примере. Дать определе- ние случайности сложно, однако можно понять общий смысл этого слова и решить, например, стоит ли участвовать в азартной игре, и если да, то на каких условиях. Понятие вероятности тесно связано с понятием случайности и помогает оценить шансы на выигрыш в азартной игре или проанализировать результаты опроса. Лаплас писал: «Замечательно, что наука, которая началась с рассмотрения азартных игр, стала важнейшим объектом человеческого знания». Два столетия спу- стя смысл этой фразы стал еще очевиднее, причем не только в повседневной жизни, но и в сфере науки и техники. Понять и изучить случайность необходимо, поскольку вероятность — это необходимая опора для принятия решений в любой области. 57
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Чтобы было понятней, о чем идет речь, заметим, что существуют события, ре- зультаты которых легко предсказать, — такие события называются детерминиро- ванными. Когда мы проводим детерминированный эксперимент, его результат мож- но безошибочно предсказать на основе исходных данных, и он изменится только при изменении какого-либо из начальных условий. Так, если мы бросаем предмет с за- данной высоты, то можно гарантировать, что он упадет на землю, а также вычис- лить его скорость и время падения. Однако в других событиях подобного не происходит: при одних и тех же на- чальных условиях можно получить разные результаты. Такие события называются случайными. Классический пример — бросок игральной кости, результат которого всякий раз непредсказуем, зависит от воли случая. Можно предположить, что если мы с точностью измерим все исходные данные, описывающие положение играль- ной кости, угол и силу, с которой мы ее бросаем, учтем колебания воздуха и другие параметры, то, зная уравнения движения, мы сможем предсказать результат бро- ска. Именно об этом Лаплас говорил, утверждая, что вероятность есть мера нашего незнания. Однако малейшие отклонения в исходных данных приведут к тому, что результат броска изменится. Если некоторое событие случайно, то есть его конкретный исход нельзя пред- сказать, это не означает, что о нем ничего нельзя узнать. Здесь в игру вступает тео- рия вероятностей, которая в течение многих лет заполняла пробелы в человеческих знаниях. Как можно убедиться на примере многих ситуаций и игр, если повторить один и тот же эксперимент со случайным исходом много раз, можно увидеть много- численные закономерности. Результат броска кости невозможно определить, одна- ко общий результат нескольких тысяч бросков можно предсказать почти с абсолют- ной точностью. Можно сказать, что «в случайном порядок проявляется с течением времени и с повторениями». Как говорил создатель Шерлока Холмса Артур Конан Дойл (1859—1930), имея в виду общество, «каждый отдельно взятый человек — неразрешимая головоломка, но обо всех людях вместе можно говорить с математи- ческой точностью. Люди меняются — проценты остаются». То же самое можно сказать о броске игральной кости: результаты отдельных бросков меняются, но со- отношения остаются. Повторив эксперимент со случайным исходом, можно убе- диться, что не все исходы наблюдаются одинаковое число раз: некоторые из них отмечаются чаще, чем другие. Если мы будем бросать одну «нормальную» играль- ную кость, то все ее грани будут выпадать одинаковое количество раз, но если мы 58
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ будем бросать две «нормальные» монеты и смотреть, сколько раз выпадет решка (О, 1 или 2), то чаще всего будет выпадать только одна решка. Если мы будем вытаски- вать по одной карте из колоды, то карты-«картинки» (валет, дама, король и туз) будут появляться не так часто, как остальные. Определение вероятности Как мы уже говорили, вероятность — это число, указывающее, насколько возмож- ным является результат случайного события или эксперимента. Во многих случаях присвоить вероятность событию можно интуитивно, в других случаях ее значение будет совершенно неизвестным. Эксперименты со статистическими закономерностями Начнем с того, что объясним несколько идей и понятий, связанных с повторяющи- мися случайными экспериментами. Произведем бросок двух игральных костей и вычислим разницу между выпавшими очками. В таблице приведены результаты сначала для 189 реальных бросков, затем — результаты компьютерного моделиро- вания 50 тысяч, 100 тысяч и 1 миллиона бросков. Разность 189 бросков 50 тысяч бросков 100 тысяч бросков 1 МИЛЛИОН бросков 0 32 8143 16 570 166 600 1 50 13 551 27 280 277 782 2 34 11249 22 513 221871 3 45 8479 16 834 167 562 4 18 5806 11 455 110 363 5 10 2772 5348 55 822 Абсолютные частоты (число случаев, когда было отмечено каждое значение раз- ности), приведенные в таблице, не содержат много информации. Найдем отношение частоты к общему числу бросков — так называемую относительную частоту. Ее значения в следующей таблице содержат больше информации и позволяют четче формулировать выводы. 59
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Разность 189 бросков 50 тысяч бросков 100 тысяч бросков 1 МИЛЛИОН бросков 0 0,169 0,163 0,166 0,167 1 0,265 0,271 0,273 0,278 2 0,180 0,225 0,225 0,222 3 0,238 0,170 0,168 0,168 4 0,095 0,116 0,115 0,110 5 0,053 0,055 0,053 0,056 Таблица подтверждает принцип статистической закономерности, которому под- чиняется случайность. Согласно этому принципу, чем больше раз мы будем по- вторять случайный эксперимент, тем ближе будет относительная частота каждого результата к определенному значению. Далее вы увидите, что этот принцип обрел статус теоремы, называемой законом больших чисел, и приведенная таблица явля- ется ее эмпирическим подтверждением. Будем называть вероятностью события значение, к которому последовательно приближается относительная частота этого события при многократном повторении эксперимента (в математике такое значение называется предельным). Так как вероятность — это предельное значение относительной частоты, она об- ладает свойствами относительных частот. 1. Вероятность Р (S) события S — это число, заключенное в интервале от 0 до 1, так как число случаев, в которых произойдет это событие, заключено в интер- вале между 0 и общим числом экспериментов: O^P(S)<1. 2. Вероятность невозможного события равна 0. Вероятность достоверного со- бытия равна 1. Эти два свойства позволяют нам определить шкалу вероятно- стей. Если событие никогда не происходит, его вероятность равна 0, если оно происходит всегда, его вероятность равна 1, если оно происходит в некоторых случаях, его вероятностью будет число, лежащее в интервале от 0 до 1. Со- бытие тем вероятнее, чем ближе к 1 его вероятность. Когда какое-то событие происходит очень часто, мы говорим, что оно весьма вероятно: его вероятность близка к 1. Событие, которое происходит очень редко, мы называем маловеро- ятным: его вероятность близка к 0. Есть очень важная разница между высокой (и очень высокой) вероятностью и достоверностью: даже если вероятность некоторого события очень высока, это не гарантирует, что событие абсолютно точно произойдет в каком-то кон- кретном случае. 60
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ 3. Вероятность события, включающего несколько различных исходов, равна сумме вероятностей этих элементарных исходов. 4. Сумма вероятностей всех возможных исходов случайного эксперимента (эле- ментарных исходов) равна 1. 5. Сумма вероятностей двух противоположных событий равна 1: Р (5) + + Р(не5) = 1. Это свойство интересно потому, что во многих случаях мы можем найти веро- ятность искомого события по известной вероятности противоположного события (рассчитать которую, возможно, будет проще). Так, событие «чтобы выпало 6 оч- ков, потребуется больше одного броска игральной кости» противоположно событию «6 выпадет при одном броске игральной кости». Так как мы знаем, что вероятность выпадения 6 очков при одном броске равна р = 1/6 = 0,167, вероятность противо- положного события будет равна: Р (потребуется более одного броска) = 1 — 0,167 » 0,833. Следует отметить, что для экспериментального определения вероятностей по- требуется повторить эксперимент «большое» число раз. Иными словами, не следует путать упомянутый закон больших чисел с законом, который иногда шутливо на- зывают законом малых чисел и который мы часто применяем, делая общие выво- ды по результатам небольшого числа экспериментов. Если, например, мы съездили в другую страну, нас ограбили на улице и мы слышали, как еще в двух случаях с пу- тешественниками в этой стране произошло то же самое, при этом нам неизвестно о других подобных случаях, мы решаем, что в этой стране вас с большой вероятно- стью ограбят на улице (хотя опыт больших групп путешественников и объективная статистика доказывают обратное). Возможно, человеческий мозг предрасположен к тому, чтобы делать общие вы- воды даже на основании ограниченного количества событий, чтобы создать некие алгоритмы действий. В действительности общие выводы часто делаются со ссылкой на этот ложный закон малых чисел. Например, некий журналист предложил читате- лям «безошибочный» метод, позволяющий оценить размах безработицы: «Спросите себя, сколько безработных в вашей семье, затем спросите соседей, друзей и знако- мых и сложите полученные результаты. Сравните эту цифру с числом ваших род- ственников и знакомых всех тех, кого вы спросили. Так вы получите точную цифру, указывающую уровень безработицы». Выводы, полученные на основании ограниченного опыта, часто ошибочны. 61
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Равновероятные события Чтобы присвоить событию вероятность, не всегда нужен эксперимент. Свойства симметрии позволяют предположить, что при броске симметричного игрального ку- бика вероятность выпадения для всех граней будет одинаковой. Поэтому шесть воз- можных результатов броска равновероятны, то есть вероятность каждого из них равна 1/6 = 0,167 (каждая грань будет выпадать в 16,7 % случаев). Если мы достаем одну карту из итало-испанской колоды с 12 «картинками» на 40 карт, то разумно предполагать, что извлеченная карта будет «картинкой» в 30 % случаев (12/40 • 100), вероятность этого события равна 12/40 = 0,30. Из этих двух примеров мы видим, что иногда определить вероятность различных исходов можно интуитивно. Свойств симметрии игрального кубика достаточно, что- бы определить, что вероятность выпадения для каждой его грани равна 1/6. Часто мы можем определить вероятность следующим образом: если при прове- дении случайного эксперимента возможны N различных исходов и можно гаранти- ровать, что вероятность всех этих исходов одинакова (они равновероятны), то веро- ятность каждого из них по отдельности будет равна р = 1/7V. В примере с игральным кубиком множеством всех возможных результатов (оно называется пространством элементарных событий) будет множество Е = {1, 2, 3, 4, 5,6}. Если кубик симметричный, то все элементарные исходы будут равновероятны. Их вероятность будет равна: р(1)=р(2) =Р(3) =Р(4) =Р(5) =Р(6) = 1/6-0,167 (16,7 %). Теперь рассмотрим несколько составных событий, как, например, «выпало нечетное число очков» или «выпало число, кратное 3». Какова их вероятность? Если в результате броска выпало 2, 4 или 6 очков, то наступило событие «выпало четное число очков». Так как вероятность составного события равна сумме вероятностей элементарных исходов, из которых оно состоит (здесь мы используем свойство 3, приведенное выше), имеем Р (нечетное число) =р({1, 3, 5})=р(1)+р(3)+р(5) = 1/6 + 1/6 + 1/6 = 3/6 = = 0,5 (50 %). 62
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Вероятность того, что выпадет число очков, кратное 3, равна: Р(кратно 3) =р({3, 6}) =р(3) +р(6) = 1/6 + 1/6 = 2/6-0,333 (33,3 %). Обратите внимание на результаты: Р (нечетное число) — ?>16>,Р (кратно 3) = 2/6. Эти два результата подтверждают, что в каждом случае вероятность равна от- ношению числа элементарных событий, образующих составное событие (Зв первом случае и 2 во втором), к общему числу исходов, или элементарных событий, которые могут произойти в рассматриваемой ситуации. В общем случае можно утверждать, что если результатом эксперимента является Л равновероятных событий, то вероятность события 5, состоящего из п элементар- ных событий, равна: p(S) = 1//V+ 1/7V +... + 1//V (и слагаемых, равных 1//V) = n/N, иными словами: , Число элементарных событий, образующих событие S р(о)=----------------------------------------------. Общее число элементарных событий Таким образом, вероятность события 5 равна отношению числа благоприятных результатов, при которых произойдет рассматриваемое событие, и общего числа возможных результатов. Это определение известно как правило Лапласа: «Если все элементарные события равновероятны, то вероятность события S равна отношению числа благоприятных исходов и числа всех возможных исходов»: Число благоприятных исходов, при которых наступает событие S Число возможных исходов Правило Лапласа считается классическим определением вероятности и первым известным нам определением этого понятия. Оно очень полезно для вычисления вероятностей составных событий в ситуациях, когда вероятность всех событий оди- накова. Для того чтобы найти вероятность события, нужно только подсчитать общее число элементарных исходов (возможных случаев) и число благоприятных исходов. Чтобы подсчитать общее число исходов, можно использовать методы комбинатори- ки, о которых мы уже рассказали. 63
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ КАРТЫ Источником случайных событий часто служит колода карт (поэтому известно так много карточных игр). Существует два основ- ных типа колод: привыч- ная нам французская колода и итало-испанская, популярная на юге Европы. Испанская колода - стилизация средневекового общества. В ней четы- ре масти: монеты, кубки, мечи и палицы, которые обозначали четыре европейских сословия: буржуазию, или коммерсантов (золотые монеты), духовенство (кубки, которые использовались в литургиях), знать (рыцарские мечи) и крестьянство (палица или дубина). В этой колоде 40 карт (по 10 каждой масти), три из них - «картинки», или фигуры (валет, конь и король). Французская колода - стилизация времен года. Ее четыре масти обозначают четыре вре- мени года. В каждой масти 13 карт, их общее число равно 4 13 - 52 по числу недель в году. Если сложить цифры на всех картах (1 + 2 + 3 + ... + 12 + 13 - “ 91), умножить на четыре масти и добавить к ним джо- кера, получится 365 (4 • 91 + 1 - 365) - число дней в году. Очень важно гарантировать, что все элементарные исходы эксперимента равно- вероятны (учтите, что вероятности часто бывают обманчивыми) и что число воз- можных исходов является конечным. Последнее утверждение может показаться странным читателю, не знакомому с математикой, однако на простом примере легко убедиться, что эксперимент может иметь бесконечное число исходов. 64
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Допустим, мы бросаем дротик в мишень. Если в качестве возможных результа- тов мы будем рассматривать все точки мишени, число исходов будет бесконечно ве- лико, поэтому приведенное выше правило будет неприменимо. Но если мы упростим эксперимент и разделим мишень на четыре сектора одинаковой площади, число воз- можных исходов будет равно четырем, и все они будут равновероятными (предпо- лагается, что бросающий — неопытный игрок и бросает дротик не прицеливаясь). Деление на сектора разной площади, как в мишенях, которые используются на со- ревнованиях, не позволяет применить вышеуказанное правило, поскольку не все результаты будут равновероятными. В этих случаях уместно выбрать в качестве ве- роятности для каждого сектора отношение его площади к общей площади мишени. Большинство азартных игр удовлетворяют правилу Лапласа, а в тех случаях, когда это не так, следует указать, каким способом будут присваиваться вероятности. Рассмотрим испанскую колоду карт. Какова вероятность, что при выборе произ- вольным образом одной карты на ней будут изображены палицы? А какова вероят- ность того, что эта карта будет «картинкой»? Или того, что она будет «картинкой» и на ней будут изображены палицы? В этом случайном эксперименте возможно 40 исходов (по числу карт), и все они равновероятны, если карты не крапленые. Из 40 карт палицы изображены на 10: для события «вытащить карту, на которой изображены палицы» число благоприятных исходов равно 10. Вероятность этого события будет равна: 10 1 Р(палицы) = — — — — 0,25 (25 %). 40 4 Вероятности для других предложенных событий равны: 12 3 Р(фигура) = — = — = 0,3 (30 %); 40 10 3 Р(палицы и фигура) = — = 0,075 (7,5 %). Если мы одновременно вытащим из испанской колоды две карты, какова ве- роятность, что на обеих будут изображены монеты? В этой ситуации все возмож- ные группы из двух карт, которые мы можем выбрать, равновероятны, и можно использовать определение Лапласа. Число возможных исходов будет равно чис- 65
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ лу способов, которыми можно выбрать 2 карты из 40, то есть числу сочетаний из 40 карт по 2: 40! _40-39 2!-(40-2)!— 2 В колоде на 10 картах изображены монеты, поэтому число благоприятных исхо- дов равно числу различных способов, которыми можно выбрать 2 карты из 10, то есть числу сочетаний из 10 элементов по 2: 10! ” ^2 J 2!-(10—2)! 2 Следовательно, вероятность того, что на обеих вытянутых картах будут изобра- жены монеты, равна: С 45 Р(две монеты) = —~ 0,0577 (5,77 %). С42о 780 Вероятность не изменится, если вместо монет мы будем рассматривать карты любой другой масти (кубки, мечи или палицы). Этот же результат является ответом и еще на один вопрос: какова вероятность того, что две произвольно выбранные карты будут разной масти? Ответить на этот вопрос проще, рассчитав вероятность противоположного события. Так как противоположным событием в этом случае бу- дет выбор карт одной масти (вероятность этого события равна сумме вероятностей того, что обе эти карты будут одной из четырех мастей), имеем: Р (разной масти) = 1 — Р (одной масти) = 1 — [Р (две монеты) 4- Р (два кубка) 4- 4- Р (два меча) 4- Р (две палицы)] «1 — [0,0577 4- 0,0577 4- 0,0577 4- 0,0577] = = 1 - [4 • 0,0577] = 1 - 0,2308 = 0,7692 (76,92 %). Мы рассматривали ситуации, в которых вероятность события определялась теоретически, на основе модели (идеального кубика, колоды карт и т.д.), однако в жизни обычно нельзя составить теоретическую модель. В любой реальной ситуа- ции хотелось бы знать вероятность событий, которая, как мы помним, есть мера возможности того, что некоторое событие произойдет. Что же делать? 66
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Сравнительно недавно в прогнозах погоды на страницах газет стали указывать вероятность (в процентах). Так, согласно прогнозу, завтра может пойти дождь с ве- роятностью 60%. Раньше в прогнозе указывалось только, пойдет дождь или нет. Что обозначают эти проценты? Обозначают они 60 % территории или 60 % вре- мени? Или были опрошены десять синоптиков, шесть из них сказали, что будет дождь, а остальные четверо — нет? Ответ лежит глубже. Эта вероятность обозначает частоту случаев, в которых в прошлом при погодных условиях, достаточно похожих на те, что указаны в про- гнозе на завтра, шел дождь. Расчет производится по доступным данным. Иными словами, эта вероятность указывает величину неопределенности, характерную для утверждения «завтра пойдет дождь», и получена в результате сложных расчетов на основе необозримого множества результатов наблюдений. В этом смысле гово- рить о погоде на завтра как о вероятности того, что пойдет дождь, намного точнее, чем просто указывать, пойдет дождь или нет, так как прогноз погоды содержит ин- формацию, необходимую для составления планов на день. Отличие этого измерения вероятности от того, что используется при анализе игр и лотерей, в том, что здесь вероятность определяется не на основе модели, а посред- ством анализа статистических данных. Это же происходит и во многих других слу- чаях (когда речь идет об эффективности лекарства, безопасности различных видов транспорта и т.д.), поэтому статистика и связана с теорией вероятностей: именно благодаря статистике мы можем присваивать вероятность тем или иным событиям. Составные эксперименты С точки зрения теории вероятностей извлечь две карты из колоды — то же самое, что извлечь одну карту и, не возвращая ее в колоду, извлечь вторую карту. Речь идет о повторении эксперимента «извлечь карту из колоды», однако в этих двух случаях колоды отличаются. При анализе случайных событий часто возникают си- туации, предполагающие повторение одного и того же простого эксперимента несколько раз или требующие одновременного проведения нескольких разных экс- периментов. Такие эксперименты называются составными. Так как речь идет о подсчете числа возможных исходов, то для организации дан- ных, если это возможно, удобно использовать дерево. Соответствующий метод мы продемонстрировали в начале книги. Рассмотрим задачу о двух монетах. 67
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ 1. Определим события, составляющие эксперимент, и установим их порядок: 1-я монета/2-я монета/3-я монета. При броске двух монет установим поря- док 1-я монета/2-я монета. Установленный порядок можно определить разны- ми способами: эксперимент не изменится, если мы сначала подбросим одну монету, затем — другую, или если мы будем считать монеты разными, или если будем выделять монету, которая упала ближе к нам, и т. д. 2. Проанализируем возможные исходы первого события (возможные исходы броска первой монеты) и представим их в виде дерева. Из корня дерева вы- ходит две ветви, соответствующие событиям «выпала решка» и «выпал орел». 3. Проанализируем результаты второго эксперимента для каждого из возмож- ных результатов первого эксперимента и также представим их на диаграмме. Из каждой из двух вершин будет выходить по две ветви, которые будут соот- ветствовать событиям «выпала решка» и «выпал орел» для второй монеты. 4. Если эксперимент содержит еще какие-либо испытания, будем анализировать результаты третьего испытания для всех возможных результатов второго ИТ. д. 5. Возможные результаты эксперимента обозначены ветвями дерева. Каждая ветвь состоит из нескольких ребер (по числу испытаний, проводимых в ходе эксперимента). 1-я монета 2-я монета Мы можем подсчитать число благоприятных исходов в примере с монетами (вы- пало две решки, решка и орел и т. д.) и определить вероятность каждого из них. Де- рево имеет четыре ветви, обозначающие четыре возможных равновероятных собы- тия. Две из них обозначают событие «выпала решка и орел» (РО и ОР), поэтому его вероятность будет равна: 68
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ 2 1 р = - = - = 0,5 (50%). 4 2 В этом случае все представленные события были равновероятны. При рассмо- трении более сложных явлений нужно присвоить различным ветвям дерева вероят- ности соответствующих событий, после чего вычислить вероятность события, пред- ставленного одной или несколькими ветвями. В нашем случае этого не требуется, но выполним эти действия в качестве примера. Вероятность для каждой из двух начальных ветвей дерева будет равна 1/2, равно как и для ветвей, обозначающих результаты броска второй монеты: 1-я монета 2-я монета Р РР О РО Р ОР о оо Если мы бросим две монеты очень много раз, какова доля экспериментов, ког- да решка выпадет на обеих монетах? Вероятность, которую нужно присвоить вет- ви РР, равна 1/4. В этой простой задаче мы можем обойтись и без помощи дерева: примерно в половине случаев при броске первой монеты выпадет решка и в поло- вине из этих случаев при броске второй монеты также выпадет решка. Следователь- но, две решки выпадут в половине половины случаев, то есть в четверти возможных случаев. Эти дроби и будут соответствовать разным ветвям дерева. Имеем: Р (решка-решка) 2 2 4 В общем случае вероятность события, обозначенного ветвью дерева, находится как произведение вероятностей, соответствующих ребрам этой ветви. 69
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ В скольких случаях выпала одна решка и один орел? Нужно учитывать как слу- чаи, когда первая монета упала решкой вверх, а вторая — орлом (РО), так и об- ратные (ОР). Исход РО, обозначенный второй ветвью, будет наблюдаться в по- ловине от половины случаев. Исход ОР, обозначенный третьей ветвью, также будет наблюдаться в половине от половины случаев. Общая вероятность для случаев, ког- да выпадет одна решка и один орел, будет равна сумме вероятностей обоих исходов: 1111 11 1 Р(орел-решка) =---1---= — Ч— = —. 2 2 2 2 4 4 2 Таким образом, чтобы определить вероятность события, которое обозначается несколькими ветвями дерева, нужно найти вероятности для каждой ветви и сложить их. В нашем случае результат второго эксперимента не зависит от результата перво- го: вне зависимости от того, какой стороной упадет монета при первом броске, ве- роятность выпадения решки и орла при втором броске будет одинаковой. Такие со- бытия называются независимыми. Если события независимы, то вероятность того, что результатом первого события будет результатом второго — S2 и т. д., равна: P(S1hS2h...)=p(S1)p(S2)-... Иными словами, вероятность того, что будут наблюдаться все указанные исхо- ды, равна произведению вероятностей каждого из них. Часто в составном эксперименте исход одного события влияет на остальные. В этом случае речь идет о зависимых событиях. Екатерине нужно подготовить ответы по десяти темам, но она приготовила только восемь. Экзамен включает три темы, выбранные произвольно. Какова ве- роятность того, что Екатерина ответит по всем трем темам? Чтобы сдать экзамен, нужно правильно ответить как минимум на вопросы по двум темам. Какова вероят- ность успешной сдачи? Рассмотрим исходы трех событий: ответ на первый вопрос, на второй и на третий. В каждом случае Екатерина либо подготовилась к ответу и, следовательно, ответит хорошо (X), либо не подготовилась, и тогда она ответит плохо (П). Представим возможные исходы в виде дерева. Не имеет значения, какой номер носит тема, по которой нужно ответить: первая, вторая, третья и т. д. Важно только одно: подготовлен ответ по этой теме или нет. Таким образом, из корня дерева будут выходить две ветви, обозначающие два возможных варианта. Их вероятности будут 70
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ равны 8/10 (X) и 2/10 (П). Если мы предположим, что Екатерина хорошо отве- тила по первой теме (конечная вершина первого ребра), значит, осталось девять ва- риантов второй темы (ответ на один вопрос уже был дан). Из этих девяти тем Ека- терина подготовила семь (ей уже досталась одна из тем, по которой она подготови- лась). Следовательно, для этой ветви дерева вероятность будет равна 7/9. Так как останутся две неизученные темы, вероятность для второй ветви будет равна 2/9. Рассмотрим и ситуацию, когда Екатерина плохо подготовилась к ответу по первой теме (П). При присвоении вероятностей ветвям дерева следует учитывать, что ис- ход одного события влияет на остальные: речь идет о зависимых событиях. Завершив анализ второго события, перейдем к третьему (третьей теме экзамена) и рассмотрим все его исходы. Например, в первой ветви дерева (X—X) третья тема выбирается из восьми оставшихся, из которых Екатерина подготовила только 6. Вероятности для двух ветвей будут равны 6/8 и 2/8, как показано на схеме: 6/8^ X 2/8^ П 7/8 X П XXX ххп хпх хпп пхх пхп ппх ппп Построение дерева завершено, и мы можем ответить на первый вопрос: вероят- ность того, что Екатерина хорошо ответит по всем трем темам (XXX) равна произ- ведению вероятностей для трех ребер, составляющих эту ветвь: — • — •—==0,47 (47%). 10 9 8 71
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ Когда речь идет о зависимых событиях, вероятность того, что исходом первого события будет исходом второго — S2, исходом третьего — Sr равна: p(S} и S2 и S3...) =p(S1) -p(S2/SJ -p(S3/S} и S2) •... Здесь p (S2/S}) обозначает вероятность того, что S2 произойдет при условии, что до этого произошло S1 (аналогично для остальных вероятностей). Ответ на второй вопрос задачи будет положительным для четырех из восьми вет- вей дерева: XXX, ХХП, ХПХ, ПХХ. Искомая вероятность будет равна сумме вероятностей для этих четырех ветвей. Вероятность для каждой ветви определяется как произведение вероятностей образующих ее ребер: 8 7 6 8 7 2 8 2 7 2 8 7 л „ п/ч р =-----------h----------1---------1---------=0,933 (93,3%). 10 9 8 10 9 8 10 9 8 10 9 8 Это означает, что если на экзамене представлено десять тем, из которых случай- ным образом выбирается три, и для положительной оценки достаточно ответить по двум из них (что больше привычной половины правильных ответов, которой обычно достаточно для положительной оценки), а мы подготовили всего восемь (то есть не подготовили 20% тем), то вероятность не сдать экзамен будет равна всего 6,7 %. Возможно, перед тем как готовиться к экзамену, стоит провести веро- ятностный анализ? Это позволит оптимальнее использовать время на подготовку (здесь мы говорим не о том, чтобы выучить материал, а о том, чтобы сдать экзамен, кроме того, существует ненулевая вероятность не сдать экзамен). Аксиоматическое определение вероятности До сих пор мы рассматривали вероятность в рамках интуитивного подхода, когда все рассуждения получены с использованием привычного нам дедуктивного метода. Однако этот подход имеет недостатки, особенно если множество элементарных со- бытий не является конечным или если возможные исходы не являются равновероят- ными, что бывает достаточно часто. Кроме того, это определение вероятности неу- добно применять на практике: повторить эксперимент бесконечное число раз невоз- можно, но никто не знает, сколько раз необходимо провести эксперимент, чтобы полученная относительная частота была корректной. В начале XX века многие математики видели необходимость в том, чтобы фор- мализовать понятие вероятности. В 1930-е годы Колмогоров выдвинул ряд аксиом, позволивших дать аксиоматическое определение вероятности. В рамках этого под- 72
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ хода не давалось концептуальное определение вероятности и не использовались экс- перименты — приводились исключительно свойства, которым по определению должна удовлетворять вероятность. Кроме того, аксиоматическое определение со- держало все свойства, которые мы вывели интуитивно, то есть Колмогорову удалось привести в соответствие формальную математику и эксперименты со случайными событиями. Помимо этого, аксиомы Колмогорова легли в основу еще одного раз- дела математики, тесно связанного с вероятностями, — теории меры. Исходя из аксиом Колмогорова, с помощью логических правил вывода можно определить множество свойств и следствий, которые не являются очевидными и ко- торые нельзя вывести иным способом. Важность понятия вероятности при изучении других наук и широта его применения заставляют вновь вспомнить слова Лапласа: «Важнейшие вопросы жизни в большинстве своем есть не более чем задачи теории вероятностей». Возможно, поэтому теория вероятностей применяется шире, чем другие разделы математики. Аксиоматическое определение вероятности обычно приводится в следующем виде. Для данного пространства элементарных событий Е, которому соответствует случайный эксперимент и множество его исходов F, вероятностью называется любое числовое значение Р (S.), соответствующее каждому событию S. из множества F, такое, что выполняются следующие свойства. 1. Для любого события S. из множества F Р (S.) > 0. 2. Вероятность достоверного события равна единице: Р (Е) = 1. 3. Для совокупности несовместных событий S2, S3, ..., Sn, ... из множества F справедливо следующее равенство: P(S} или S2 или ... или Sn...) = P(S1) + ...+P(Sn) + ... Как мы говорили выше, приняв эти три свойства в качестве аксиом, можно найти другие важные свойства вероятностей. Рассмотрим некоторые из них. 1- P(S.) = 1 — P(S ), где S, и S. — противоположные события. 2.P(5,)S1. 3. Р(0) — 0, где 0 — невозможное событие. 4. Для двух произвольных событий S, и S2 из множества F справедливо: PCS.IJS^ P(SJ + P(S2) - p(Sxns2). 73
ВЕРОЯТНОСТЬ И СЛУЧАЙНОСТЬ В приведенном выше равенстве символ U обозначает, что должно произойти либо первое, либо второе событие, а символ П указывает, что оба события проис- ходят одновременно. ТЕОРЕМА ОБ ОБЪЕДИНЕНИИ И ПЕРЕСЕЧЕНИИ Выражение, обозначающее вероятность объединения событий (вероятность того, что произой- дет хотя бы одно из них), в общем виде выглядит так: если Д2.....Ап- произвольные события, то р(Д1и...иАп)“р(А1) + р(А2)+...+р(Ап)-р(А1ПА2)-р(А1ПА3)-...- -p(AtnAn) - р(Д2ПД3)-.....-р(Ап_1ПАп)+р(А1ПА2ПА3)+...+ +Р(А1ПД2ПАп) + ...-р(Д1ПА2ПА3ПА4)-...+ + (-1)л1Р(Д1ПА2П...ПАп). Иными словами вероятности отдельных событий склады- аются, затем из полученной суммы вычитаются вероятности пересечений событий, взятых попарно (вероятности того, что эти со- бытия произойдут одновременно), к разности прибавляются вероятности пересечений событий, взятых по три, и т. д., при этом знаки всякий раз будут чередоваться. 74
Глава 4 Неочевидные ситуации Рассмотрим ряд повседневных ситуаций. Их исход можно найти с помощью мето- дов, изложенных на предыдущих страницах, и он противоречит тому, что кажется очевидным. Вы сможете проверить полученные теоретические результаты экспери- ментально и увидите, что при работе с вероятностями интуиция часто подводит нас. Читатель, готовься удивляться — весьма вероятно, что впереди тебя ждет немало интересных и неожиданных примеров. Определение ситуации Иногда, чтобы разобраться в чем-то, стоит рассмотреть ситуацию, противополож- ную привычной. Так мы и поступим: мы предложим несколько ситуаций, вероятно- сти которых уже известны, чтобы подтвердить исходные утверждения. Ситуация А. В урне лежит несколько шаров белого и черного цвета. Из урны достают два шара. Первый игрок ставит на то, что эти шары будут одного цвета, второй — на то, что эти шары будут разного цвета. Игроки хотят, чтобы вероят- ность выигрыша была одинаковой. Сколько шаров каждого цвета должно находить- ся в урне? Ситуация Б. Иван и Вера бросают необычные игральные кубики: на их гранях нет точек, а вместо этого одни грани покрашены в синий цвет, другие — в красный. Игра проста: если при броске верхние грани оказываются одного цвета, выигры- вает Иван, если верхние грани разного цвета, выигрывает Вера. Мы хотим, чтобы оба игрока имели одинаковые шансы на победу. У одного из кубиков пять граней окрашено в синий цвет, одна — в красный. Как следует раскрасить грани второго кубика? Ситуация В. Дано одинаковое количество белых и черных шаров (например, де- сять) и две одинаковые урны. Нужно поместить шары в урны (ни одна урна не мо- жет остаться пустой) так, чтобы при извлечении шара вероятность того, что он ока- жется белым, была бы наибольшей. Чему будет равна эта вероятность? Может ли она быть больше 1/2 (то есть больше 50 %)? 75
НЕОЧЕВИДНЫЕ СИТУАЦИИ Решение А. Кажется, что шаров каждого цвета должно быть поровну, но это не так. Одним из возможных решений будет положить в урну три шара одного цвета (например, белого) и один — другого (черного). Убедимся, что искомые вероят- ности будут равны: 3 2 2 1 Р(ББ) = 4 3 4 2 Вероятность того, что первым вытащат белый шар, равна 3/4, так как белых шаров три из четырех. Вероятность того, что второй шар также будет белым, равна 2/Ъ, так как в урне останется два из трех белых шаров. Если вероятность того, что будут вытащены два белых шара, равна 1/2, то вероятность того, что вытащенные шары будут разного цвета, также будет равна 1/2. Решение Б. У второго кубика в каждый цвет должно быть окрашено по три грани. Вероятность того, что при броске двух кубиков выпадут грани одного цве- та, равна сумме вероятности того, что обе грани будут синими, и вероятности того, что обе грани будут красными. Вероятность каждого из этих двух событий, в свою очередь, равна произведению вероятностей того, что верхняя грань каждого кубика будет иметь именно такой цвет. Имеем: Р(одного цвета) = Р(две синие грани) + Р(две красные грани) = 5 3 1 3 15 3 18 1 =-----+---=—+—=—=_. 6 6 6 6 36 36 36 2 Вероятность того, что выпадут грани разного цвета, также 1/2. Решение В. На второй вопрос читатели обычно отвечают, что поскольку число шаров каждого цвета одинаковое, то ответ будет равен 50 %, или 1/2. Однако зада- ча наводит на мысль о том, что итоговую вероятность можно как-то увеличить. Если мы положим в одну урну один белый шар, а все остальные — в другую, то итоговая вероятность существенно возрастет: Р (белый) = Р (выбор урны 1) • Р (белый шар в урне 1) + Р (выбор урны 2) • Р (белый шар в урне 2) — — • 1 + — • — = — = 0,7368 73,68 %. 2 2 19 38 Видите, насколько мы увеличили общую вероятность, всего немного подумав! 76
НЕОЧЕВИДНЫЕ СИТУАЦИИ Определение вероятности для заданной ситуации Дни рождения Ситуация А. Первая задача о днях рождения. На встрече собралось N человек, вы- бранных случайным образом. Какова вероятность того, что по крайней мере два из них празднуют день рождения в один и тот же день? Или, точнее, сколько людей должно прийти на встречу, чтобы вероятность такого совпадения равнялась 1/2 (50 %)? Ситуация Б. Вторая задача о днях рождения. Теперь нужно найти не двух чело- век, отмечающих день рождения в один день, а человека, день рождения которого совпадает с моим. Сколько человек должно прийти на встречу, чтобы вероятность такого совпадения превысила 50 %? Решение А. Приведем некоторые рассуждения. Сколько людей необходимо со- брать, чтобы гарантировать, что двое из них родились в один день? Достаточно 367 человек, так как каждый из первых 366 может отмечать день рождения в раз- ные дни года (включая 29 февраля), а 367-му не останется другого выбора, кроме как отметить день рождения в один день с кем-либо из предыдущих 366 человек. Если не учитывать високосные годы (как и в последующих задачах), достаточно 366 человек. Сколько человек нужно, чтобы вероятность подобного совпадения равнялась 50 %? Кажется очевидным, что людей должно быть в два раза меньше (то есть 183), но если нас попросят обосновать этот ответ, вряд ли мы сможем это сделать. Будем считать, что в году 365 дней. Найдем вероятность того, что все люди, пришедшие на встречу, отмечают день рождения в разные дни. Затем вычтем полу- ченную вероятность из 1 (или из 100, если вычисления ведутся в процентах) и полу- чим ответ. Рассмотрим группу из N человек. Выберем одного из них случайным образом. Он может отмечать день рождения в любой из 365 дней, равно как и второй, третий и т. д. до N-ro. Следовательно, число возможных вариантов таково: ВИ (возможные исходы) = 365 • 365 • 365 •... • 365 = 365w. Посмотрим, в скольких из этих 365л случаев не будет совпадающих дней рожде- ния. Подсчитаем случаи, когда дни рождения не повторяются. Возможны 365 дат для дня рождения первого человека, 364 — для второго, 363 — для третьего и т. д. 77
НЕОЧЕВИДНЫЕ СИТУАЦИИ до TV-го человека, который может отмечать день рождения в один из 365 — (TV — 1) дней. Следовательно, число несовпадающих дат рождения N человек равно 365! БИ (благоприятные исходы) = 365 • 364 (365 — N +1) =---------- (365 -N)! Вероятность того, что все люди будут отмечать дни рождения в разные дни, равна 365! £Я_(365 —N)!_ 365! ВИ ~ 365" ~ 365" • (365 - N)!' Нас интересует вероятность противоположного события: найдется как минимум два человека, дни рождения которых будут совпадать. Эта вероятность равна: 365! 365" -(365-N)! [1] Вычислим значение выражения [1] для разных /V. Например, при 7V = 50 имеем р = 0,97: вероятность того, что в группе из 50 человек два человека празднуют день рождения в один день, равна 97 %. Для N = 23 р = 0,507: уже в группе из 23 чело- век эта вероятность превысит 50 % (точное ее значение равно 50,7 %). В следующей таблице представлены значения вероятности (в виде десятичной дро- би и в виде процентов) для различного числа людей, рассчитанные по формуле [1]. N p(N) p(N)% N p(N) p(N)% 10 0,11695 11,7 35 0,81438 81,4 15 0,2529 25,3 40 0,89123 89,1 20 0,41144 41,1 45 0,94098 94,1 22 0,4757 47,6 50 0,97037 97 23 0,5073 50,7 55 0,98626 98,6 25 0,5687 56,9 60 0,99412 99,4 30 0,70632 70,6 65 0,99768 99,8 78
НЕОЧЕВИДНЫЕ СИТУАЦИИ В группе из 60 человек можно быть практически уверенным в том, что как мини- мум у двоих совпадут дни рождения (из 1000 групп это будет примерно в 994 слу- чаях). Однако нужно быть очень внимательным с этим «практически», так как абсо- лютно уверенными мы можем быть, только если группа состоит из 366 человек. Это означает, что если мы постоянно будем ставить на то, что в группе из 60 человек дни рождения совпадут хотя бы у двух людей, то будем выигрывать очень часто, однако можем и проиграть. ДНИ РОЖДЕНИЯ ФУТБОЛИСТОВ Так как f любом футбольном матче на поле находятся 22 игрока и арбитр, вероятность того, что как минимум у двоих из них совпадают дни рождения, превышает 50%. Добавим двух линейных судей (таким образом, общее число членов группы возрастет до 25), вероятность совпадения достигнет 56,87%. Если мы рассмотрим 50 человек, участвовавших в двух матчах (например, в полуфиналах турнира), вероятность совпадения превысит 97%. Чтобы проверить эти рас- суждения, достаточно ооратиться к результатам матчей любого чемпионата. Роберт Мэпьюз и Фиона Стоунз проверили десять матчей английской Премьер-лиги, состоявшихся 19 апреля 1997 года: совпадения наблюдались в шести случаях. В двух матчах из этих шести произошло еще менее вероятное событие: дни рождения совпали сразу у двух пар игроков! Другой пример - 16 национальных сборных, участвовавших в чемпионате Европы по футболу 2008 года (победу в котором одержала сборная Испании, а сборная России завоевала бронзо- вые медали). В состав каждой команды входили 23 игрока, и в восьми командах (в половине случаев) нашлось по двое игроков, которые родились в один и тот же день: это были сборная Турции, Швейцарии, Германии, Греции, Австрии, Франции, России и Швеции. Но и это еще не все: в четырех командах (они названы последними) нашлось сразу по две пары игроков, у которых совпали дни рождения. Насколько вероятно такое совпадение? Неужели игроков в сборную отбирают так, чтобы их дни рождения совпадали? Нет, футболисты ничем не отлича- ются от обычных людей - о них всего лишь доступно больше информации. С любыми другими группами из 23 человек произошло бы то же самое. Решение Б. В этом случае подобные совпадения случаются намного реже. Веро- ятность того, что день рождения одного человека не совпадет с днем рождения дру- гого, равна 364/365, поэтому если на встрече присутствует N человек, вероятность того, что день рождения автора не совпадет ни с одним из них, будет равна 79
НЕОЧЕВИДНЫЕ СИТУАЦИИ \v-i 364 365 ? Следовательно, вероятность того, что найдется хотя бы один человек, который ро- дился в тот же день, что и автор, равна 1 минус приведенное выше значение: р = 1- 364 365 В этой задаче р будет равно 0,5 не при N = 23, как в предыдущем случае (при N = = 23 р = 0,058571, то есть меньше 6 %), а при N — 254 (в этом случае р = 0,5005). Этот результат намного ближе к тому, что подсказала нам интуиция, чем в пре- дыдущей задаче. Возможно, мы слишком эгоцентричны и подсознательно думаем о собственном дне рождения! Походка пьяного До изобретения алкотестеров классическая проверка выпивших водителей заключа- лась в том, что им нужно было пройти по прямой линии. Обычно любой из нас легко справится с этим заданием, но для человека, находящегося под воздействием алко- голя или наркотических веществ, эта задача может оказаться непростой. Вспомним так называемую походку пьяного: сделав шаг в одну сторону, пьяный может сделать следующий шаг в любом другом направлении и даже назад, вернувшись в исходную точку. Эта ситуация наблюдается на каждом последующем шаге. Три возможных пути пьяного, прошедшего десять шагов от фонаря F. 80
НЕОЧЕВИДНЫЕ СИТУАЦИИ Если мы идем по прямой линии и длина каждого нашего шага равна одному ме- тру, то, совершив N шагов, мы окажемся в N метрах от исходной точки. Если мы бу- дем идти словно пьяные, сколько шагов нам потребуется, чтобы пройти те же самые N метров? Или на каком расстоянии от исходной точки будет находиться пьяный, сделав N шагов? Пока вы обдумываете этот вопрос, отметим, что речь идет не просто о занима- тельной задаче — она используется, например, при моделировании распростране- ния тепла и помогает понять, почему когда мы включаем отопление, комната на- гревается не сразу, сам обогреватель уже почти дымится, вблизи от него достаточно тепло, а чуть дальше — уже холодно. При нагревании молекулы воздуха начинают двигаться быстрее, перемещаясь случайным образом, как и пьяный. Вернемся к нашей задаче. Чтобы решить ее, можно составить простые модели. Например, походку пьяного можно смоделировать с помощью броска монеты: решка будет означать шаг вперед, орел — шаг назад. В среднем, чтобы продвинуться впе- ред на /V метров, потребуется /V2 шагов: чтобы отойти от исходной точки на 10 ме- тров, нужно сделать примерно 100 шагов (100 = 102). С увеличением состояния это соотношение будет только возрастать: чтобы продвинуться вперед на 50 метров, потребуется уже 2500 шагов. Теперь вы понимаете, почему обогреватель так долго не может прогреть комнату? Кроме того, с увеличением расстояния молекулы ох- лаждаются. Как видите, даже из походки пьяного можно извлечь полезные выводы! Другие ситуации Кот и мышь Участники этой игры из теории вероятностей ведут себя не совсем обычно. Игровое поле разделено на клетки. В одной из клеток находится кот, в другой — мышь. По- винуясь инстинкту, кот хочет поймать мышь, а мышь пытается сбежать. Но в нашей задаче животные согласились следовать определенным правилам игры. И кот, и мышь делают шаг одновременно (он заключается в переходе из одной клетки в со- седнюю по вертикали или горизонтали, но не по диагонали) случайным образом. Кот двигается вправо или вверх, мышь — влево или вниз. Если в какой то момент времени кот и мышь окажутся в одной клетке, кот съест мышь. Если они ни разу не окажутся в одной клетке, мышь коту не достанется. Какова вероятность того, что кота ждет сытный обед? И какова вероятность того, что мыши удастся спастись? 81
НЕОЧЕВИДНЫЕ СИТУАЦИИ мышь кот Мы можем постепенно расширять игровое поле: сначала оно будет иметь разме- ры 4x4, затем — 5x5 клеток и т. д. При этом условия игры и расположение кота и мыши (в противоположных углах поля) сохраняются. Решение. В задаче требуется найти вероятности противоположных событий, сле- довательно, их сумма равна 1: если р (или Р%) — вероятность того, что кот съест мышь, то вероятность того, что мыши удастся уйти, будет равна (1 — р) (или 100 — — Р %). Перемещения кота и мыши можно смоделировать, бросая две монеты (одна будет обозначать кота, другая — мышь), при этом, например, решка будет обозна- чать перемещение по горизонтали, орел — по вертикали. Кот и мышь могут встре- титься только в клетках, расположенных на диагонали квадрата (той, что не соеди- няет клетки, в которых кот и мышь находятся изначально). Ив одной из таких клеток и кот, и мышь должны оказаться одновременно. На игровом поле 3x3 кот и мышь могут одновременно попасть в одну из трех клеток. Для этого им нужно сделать два шага, следовательно, вероятность того, что кот и мышь окажутся в клетках на концах диагонали, равна (1/2) х (1/2) = 1/4. Для центральной клетки, куда можно прийти двумя путями (мышь должна двигать- ся «влево — вниз» и «вниз — влево», кот — противоположным образом), эта ве- роятность в два раза больше: 2/4 = 1/2. Вероятность того, что кот и мышь встре- тятся на одном из концов диагонали, равна (1/4) х (1/4) = 1/16; вероятность того, что они встретятся в центре поля — 2/4 х 2/4 = 4/16. На множестве из трех кле- ток, где могут встретиться кот и мышь, эта вероятность будет равна 1/16 + 1/16 + + 4/16 = 6/16 = 3/8 (или 37,50 %). Следовательно, мыши удастся уйти с вероят- ностью 10/16 = 5/8 (или 62,50%). Решение задачи для игрового поля с большим числом клеток мы предлагаем чи- тателю найти самостоятельно. Укажем лишь, что с увеличением игрового поля веро- ятность того, что мыши удастся спастись, существенно возрастает. Большие семьи В нашей стране в семьях обычно немного детей, и редко встретишь семью, в которой сразу четыре отпрыска. Однако в прошлых поколениях детей рождалось больше, и во многих уголках планеты эта традиция сохраняется до сих пор. Известно, что 82
НЕОЧЕВИДНЫЕ СИТУАЦИИ вероятность рождения мальчика и девочки практически одинакова. В семье четверо детей. Какая ситуация более вероятна: в семье два мальчика либо две девочки или же три ребенка одного пола и всего один — другого? Решение. Эту задачу можно смоделировать броском четырех монет, при этом решка будет соответствовать одному полу, орел — другому. Можно построить де- рево, указав на каждой из четырех ветвей вероятности выпадения орла и решки. Из 16 ветвей дерева в восьми случаях родится трое детей одного пола (вероятность равна 1/2 = 50%); в шести случаях — по двое детей каждого пола (вероятность равна 3/8 = 37,5%), в двух оставшихся случаях все четверо детей будут одного пола (вероятность равна 1/8 = 12,5%). Если вы повторите опыт большое число раз, то получите результаты, очень близкие к указанным. Геометрическая вероятность Предположение и реальность Иногда мы считаем, что ситуация должна сложиться определенным образом, одна- ко факты не всегда соответствуют нашим представлениям. 1. Дана квадратная сетка размером 5x5 квадратов, которую мы хотим раскра- сить в два цвета, красный (К) и синий (С). Цвет каждой клетки будет опре- деляться случайным образом. Как вы думаете, как будет выглядеть закрашен- ная сетка? Раскрасьте сетку так, как вам кажется наиболее вероятным. 2. Перейдем к действию: рассмотрим вероятности, чтобы убедиться, что сетка действительно будет выглядеть так, как вы нарисовали. Возьмите монету и бросьте ее один раз для каждой клетки. Если выпала решка (Р), закрасьте клетку красным (К), если орел (О) — синим (С). Сетка выглядит так, как вы предполагали? Если вы проводили этот эксперимент с другом, сравните ваши результаты. 83
НЕОЧЕВИДНЫЕ СИТУАЦИИ 3. Теперь представьте, что наша квадратная сетка — это плитка во дворе дома. Начинает идти снег, и снежинки падают так медленно, что их можно посчи- тать на лету. Как вы думаете, как распределятся 100 первых снежинок по 25 плиткам? 4. Смоделируйте падение 100 снежинок. Для этого потребуется бросить два ку- бика 100 раз: число очков на первом укажет строку сетки, число очков на вто- ром — столбец (если выпало 6 очков, нужно бросить кубик еще раз). Соот- ветствует ли результат ожидаемому? На сколько плиток упало 0,1, 2, 3, 4 или больше снежинок? Сравните результат с результатом друга. Одна из самых больших трудностей при изучении случайных событий такова: мы склонны думать, что результаты будут подчиняться какой-то схеме. В пун- кте 1 люди, как правило, закрашивают каждым цветом примерно половину кле- ток, при этом очень редко закрашивают одним цветом несколько соседних клеток. В задаче со снежинками (пункт 3) люди полагают, что на каждую плитку упадет примерно 4 снежинки, что не подтверждается при моделировании (да и в реально- сти). Но чем больше человек участвуют в эксперименте, тем ближе его результаты к теоретическим. Теоретические результаты определяются согласно закону больших чисел, который мы понимаем интуитивно, но ошибочно полагаем, что он выполняет- ся и при относительно небольшом числе событий. На поверхности сферы Выберем три произвольные точки на поверхности сферы. Какова вероятность того, что все они будут находиться в одной полусфере (будем считать, что большой круг, ограничивающий полусферу, принадлежит ей)? Решение. Перед тем как приступить к решению задачи, приведем некоторые рассуждения о геометрии пространства и геометрии сферы. Для любых трех точек, не лежащих на одной линии, всегда существует плоскость, проходящая через них. Именно поэтому стол может устойчиво стоять на трех ножках, не расположенных на прямой линии. Вернемся к сфере. Произвольная плоскость, пересекающая ее, определяет круг, размер которого будет наибольшим (его радиус будет равен ра- диусу сферы), если секущая плоскость проходит через центр сферы. Если же она не проходит через центр сферы, то весь круг будет находиться в полусфере, обра- зованной сечением сферы плоскостью, которая параллельна этому кругу и проходит через центр сферы. Следовательно, если плоскость, проходящая через три данные 84
НЕОЧЕВИДНЫЕ СИТУАЦИИ точки, проходит через центр сферы, эти три точки принадлежат большому кругу, ограничивающему полусферу. В остальных случаях они будут принадлежать мень- шему кругу. Но в обоих случаях все три точки будут лежать в одной полусфере. Следовательно, ответ будет неожиданным: три произвольно выбранные точки на поверхности сферы всегда будут лежать в одной полусфере. Свадьбы в древности Свадьба в Мачурии В стране Мачурии (она располагается не в каком-то конкретном географическом регионе — это страна мачизма, которая простирается во времени и пространстве), если девушка хотела выйти замуж, она должна была спросить разрешения. Вместе со своим женихом она шла во дворец вождя, тот вкладывал в закрытую ладонь де- вушки шесть равных кусков тонкой веревки, концы которых свисали по разные сто- роны ладони. Жених должен был попарно связать все концы веревки, при этом де- вушка не раскрывала ладони и нельзя было определить, где находится конец какой нити. Когда юноша связывал шесть узлов, девушка раскрывала ладонь: если верев- ка оказывалась завязанной в кольцо, молодые могли пожениться, в противном слу- чае свадьба откладывалась. Чтобы молодые люди в Мачурии могли сыграть свадьбу, девушка зажимала в ладони куски веревки так, как показано на иллюстрации вверху слева, а жених должен был связать концы веревок. Если в результате получалось кольцо (как на иллюстрации вверху справа), молодые могли сыграть свадьбу. В противном случае (на фото внизу) свадьба откладывалась. 85
НЕОЧЕВИДНЫЕ СИТУАЦИИ Спустя год жених и невеста могли попытать счастья снова. Если результат и в этот раз оказывался отрицательным, они теряли право жениться. Оцените, на- сколько сложно было выйти замуж в Мачурии? Решение. Может показаться, что вождь был небольшим сторонником браков между своими подданными, поскольку вероятность того, что жених сможет связать веревки в кольцо, очевидно очень мала. Но интуиция иногда обманывает. Найдем вероятность того, что молодые смогут пожениться в первый год, опреде- лив число благоприятных исходов (БИ) и возможных исходов (ВИ). Вначале рас- смотрим концы веревок с одной стороны. Связать их можно следующим образом: для первого узла мы выбираем один из концов, который можем связать с любым из оставшихся пяти, затем мы выбираем второй конец, который можно будет свя- зать только с одним из трех оставшимися. После того как мы завязали второй узел, останется всего два свободных конца, и мы свяжем их между собой. Следовательно, ВИ = 5 • 3 • 1 = 15. В скольких случаях веревки окажутся связанными в кольцо? Число этих случаев будет равно БИ. После того как мы выбрали один из концов веревок, мы должны привязать его к любой веревке, кроме той, которая уже привязана к этой веревке; иными словами, возможны четыре варианта. Завязывая второй узел, нужно будет выбрать любую веревку кроме той, что уже привязана к этой веревке (в противном случае образует- ся кольцо из четырех веревок), таким образом, возможных вариантов два. После этого останется всего два свободных конца, из которых завязывается узел. Это оз- начает, что БИ = 4 • 2 • 1 = 8. Вероятность того, что молодые поженятся в первый год, равна: р = —=—=0,53 (53%) ВИ 15 Живительно: первая попытка удачна больше чем в половине случаев. Рассмотрим результаты за два года. Вероятность того, что в первом году жених не сможет связать веревки в кольцо, равна (1-р) = 1-0,53 = 0,47. Вероятность того, что ему не удастся сделать это два года подряд (то есть ни в одной из двух попыток) равна произведению отдельных вероятностей: (1 _ р) - (1 _ р) = 0,47 • 0,47 = 0,22. 86
НЕОЧЕВИДНЫЕ СИТУАЦИИ Это означает, что если жениху придется решать эту задачу два года подряд, ве- роятность того, что ему ни разу не удастся связать веревки в кольцо, будет равна всего 22 %, а 78 % пар получат разрешение на брак. Вероятность успеха во второй год можно рассчитать иначе. Вероятность того, что все веревки окажутся связанными в одно кольцо, снова будет равна 53 %, одна- ко здесь мы рассматриваем всего 47 % пар, которым не удалось пожениться в пер- вый год. Так как 0,53 • 0,47 » 0,25, во второй год связать веревки в кольцо смогут 25 % женихов, которые не справились с испытанием с первого раза. Следовательно, пожениться не смогут всего 47 — 25 % — 22 % пар. Оказывается, пожениться в Мачурии не так уж и трудно! Свадьба в Ремачурии Вождь страны Ремачурии, расположенной поблизости от Мачурии, был еще стро- же и хотел еще больше ужесточить условия, позволяющие вступать в брак: жених решал ту же задачу, но уже не с шестью, а с восьмью веревками. Насколько труднее сыграть свадьбу в Ремачурии? Проведя те же рассуждения, что и в предыдущем случае, получим, что вероят- ность заключения брака в первый год равна БИ 6-4-2-1 48 р =---=---------=----=0,457 (45,7 %). ВИ 7-5-3-1 105 Вероятность того, что жених не справится с испытанием два года подряд, равна: (1 _р) - (1 _р) = 0,284 (28,4 %). Это означает, что сыграть свадьбу смогут 71,6 % пар. Как видите, вождь Рема- чурии был суров, но не слишком-то разбирался в теории вероятностей. Другие ситуации Выигрыш в теннис Ваня и Аня дружат, их родители дружат семьями, и все они очень любят играть в теннис. Ваня и Аня хотят, чтобы их отпустили в путешествие, но родители поста- вили условие: дети смогут отправиться в поездку, только если обыграют их в теннис. Мамы объяснили это так: «Выберите того из вас, кто сыграет против нас двоих. Тот, 87
НЕОЧЕВИДНЫЕ СИТУАЦИИ кого вы выберете, должен будет сыграть с нами три матча. Мы будем играть по оче- реди. Если вы выиграете две партии подряд, сможете отправиться в свое путеше- ствие». Мама Ани играет намного лучше, чем мама Вани. Против какой из мам должен сначала сыграть тот из детей, кто играет лучше, чтобы вероятность выигры- ша была больше? Решение. Можно последовать «здравому смыслу» (как видите, в теории вероят- ностей здравый смысл не всегда оказывается здравым) или вычислить вероятности, что кажется несложным, так как возможно всего два решения: тот из детей, кто играет лучше, сначала сыграет либо против мамы Вани, либо против мамы Ани. Сложность заключается в том, что нам неизвестно ни одного числа (чтобы мы могли выполнить какие-либо действия и почувствовать, что приближаемся к решению). Кажется очевидным, что лучше сыграть два матча против мамы Вани, так как она играет хуже, и у детей будет больше шансов на победу. Обозначим через И ве- роятность выиграть у мамы Вани, через А — вероятность обыграть маму Ани. Ни значение И, ни значение А нам неизвестны. Однако мама Вани играет хуже, то есть ее проще обыграть, поэтому И будет обязательно больше, чем А (И > А). Мы предлагаем читателю представить условие задачи в виде деревьев, рассмотреть вероятности в каждой из двух последовательностей (мама Вани — мама Ани — мама Вани или мама Ани — мама Вани — мама Ани) и сравнить результаты. Рассмотрим последовательность игр: мама Вани — мама Ани — мама Вани. Родители отпустят детей в поездку в любом из двух следующих случаев. 1. Мама Вани и мама Ани проиграют (третий матч не потребуется, так как дети одержат победу в двух партиях подряд). Вероятность подобного исхода Р} равна Рх = И — А. 2. В первый раз мама Вани выиграет, однако в следующих двух матчах мамы по- терпят поражение. Вероятность этого исхода Р2 равна Р2 = (1 — И) • А • И. Вероятность выигрыша Р в этом случае будет равна сумме Р1 и Р2: Р = Р] + Р2 = И-А+А-И-(1-В) = И-А-(1 + 1-И) = ИА-(2-И). Теперь рассмотрим последовательность игр: мама Ани — мама Вани — мама Ани. Дети победят в следующих случаях. 88
НЕОЧЕВИДНЫЕ СИТУАЦИИ 1. Мама Вани и мама Ани проиграют (результат третьего матча в этом случае не будет иметь значения). Вероятность R} этого исхода равна R} — А • И. 2. Мама Ани одерживает верх в первом матче, затем мама Вани и мама Ани про- игрывают. Вероятность этого исхода R2 будет равна R2 = (1 — А) • И • А. Вероятность выигрыша R в этом случае будет равна сумме Rx и R2: R = RX+R2=AH + HA(1-A) = HA(2-A). Чтобы определить, в каком случае вероятность больше, нужно сравнить Р и R, которые отличаются только последним множителем. Так как И > А, (2 — И) < <(2-Л) , то R > Р. Следовательно, мы пришли к выводу, который противоречит «очевидному»: нужно сыграть два раза против лучшего игрока — мамы Ани! Но если мы как следует поразмышляем над задачей, то придем к такому же ре- зультату. В последовательности из трех игр удобнее всего выигрывать вторую, так как в этом случае мы сможем начать или продолжить серию из двух побед подряд. Следовательно, второй матч удобнее сыграть против того, у кого проще выиграть. Ставка: три фишки В коробке с непрозрачными стенками лежат три фишки: одна с обеих сторон окра- шена в белый цвет, на одной стороне второй фишки нарисован красный крест (вто- рая сторона этой фишки также белого цвета), на обеих сторонах третьей фишки на- рисованы кресты. Некто достает одну фишку из коробки и кладет ее на стол белой стороной вверх. Он предлагает нам угадать, что изображено на другой стороне фишки. На какой из вариантов выгоднее ставить? Или же вероятность выигрыша в обоих случаях одинакова? Решение. Кажется, что можно с одинаковой вероятностью ставить на любой цвет — вероятность выигрыша будет равна 50%. Однако мы покажем, что это не так — более вероятно, что вторая сторона будет окрашена в тот же цвет, что и первая. Почему? (Эта задача очень похожа на задачу Монти Холла из главы 2.) Проанализируем, какая фишка может лежать на столе. У нее обе стороны могут быть белыми, или это фишка, на одной стороне которой нарисован крест, лежащая белой стороной вверх. Из шести возможных сторон три — белого цвета. Как только мы увидели, что фишка лежит белой стороной вверх, выбор сужается до двух фи- шек, имеющих по крайней мере одну белую сторону. Две из трех неизвестных нам 89
НЕОЧЕВИДНЫЕ СИТУАЦИИ сторон (четвертая — та, что мы видим) будут окрашены в белый. Как следствие, вероятность того, что и другая сторона фишки также белая, равна 2/3, а не 1/2, как можно было бы подумать (аналогично, если фишка лежит крестом вверх, следует ставить на то, что и на другой ее стороне изображен крест). Если мы сыграем в эту игру много раз, будет выгоднее ставить на то, что другая сторона фишки окрашена в тот же цвет, что и видимая: в среднем мы будем выигрывать два раза из трех. Задача о пальто N молодых людей пришли в ночной клуб зимой и оставили пальто в гардеробе. Каж- дому была выдана бирка с номером. Внезапно в клубе выключился свет, друзьям пришлось выходить из клуба на ощупь и каждый взял пальто, не глядя на номер. Какова вероятность того, что ни один из молодых людей не получил свое пальто? Зависит ли эта вероятность от /V? Решение. Задачу можно решить разными способами. Один из простых вариан- тов — взять карточки с номерами (например, от 1 до 10), перемешать их, выложить в ряд лицевой стороной вниз и, перевернув, проверить, находится ли одна из них на том же месте в ряду, что указывает ее номер. Повторив эксперимент несколько раз (его удобнее проводить в компании — результаты удивят ваших друзей, вы также сможете быстро получить множество результатов), вы получите примерное представление о том, какой будет искомая вероятность. Изменив число карточек (например, взяв 15, а не 10), можно увидеть, изменится ли ответ. Если мы обозначим за А событие «молодой человек i взял свое пальто», объеди- нением событий А}, А2, А3, А^ будет событие А — «один из молодых людей взял свое пальто». Нужно найти вероятность обратного события, то есть того, что никто из молодых людей не взял свое пальто. Если известно р (Л), то искомая вероятность будет равна 1 — р (Л). Вычислив вероятности, получим общий результат для N человек: . .. . 1 1 1 1 / -1 \N+l 1 р(А)=1-----+-------+----... + (-1) — . 2! 3! 4! 5! N! Так как р (А) обратно пропорционально факториалам (они, как вы увидели, воз- растают очень быстро), то при относительно больших N значение р (А) практически не будет меняться (напомним, что 10! = 3628 800, таким образом, 1/10! можно пре- небречь) и будет стремиться к следующему числу: 90
НЕОЧЕВИДНЫЕ СИТУАЦИИ р(Л) = 1—-=0,63, е где е — число, определяемое как предел: Г 1 Y е — lim 14----= 2,71. tv J По сути, вероятность того, что ни один из молодых людей не возьмет свое паль- то, практически не зависит от их числа и равняется 0,37 (37 %). Коллекции наклеек Страсть к коллекционированию наклеек охватила уже несколько поколений де- тей — со временем менялись только темы, которым посвящались наклейки. Конеч- но, всегда есть подозрение, что изготовители выпускают большое количество всех наклеек кроме двух или трех, которые можно найти, только если купить очень много пакетиков с наклейками. Оставив в стороне этот животрепещущий вопрос, рассмо- трим задачу: если выпущено одинаковое число всех наклеек, сколько наклеек нужно купить, чтобы собрать полную коллекцию? Решение. Допустим, что коллекция состоит из 50 наклеек. Первая наклейка, которую мы купим, обязательно будет новой, вторая будет новой с вероятностью 49/50, третья — 48/50 и т. д. Если у нас уже есть 40 разных наклеек, то вероят- ность того, что купленная нами наклейка окажется новой, составит 10/50 (до пол- ного набора из 50 будет не хватать 10) = 1/5. Следовательно, в этом случае следу- ет купить 5 = 50/10 наклеек (число, обратное 10/50). Аналогичные рассуждения можно провести и во всех остальных случаях. Таким образом, интуитивно понятно, что общее число наклеек, которое нужно купить, равно: 50 50 50 50 50 50 -----1-------1----4-... 4------4--------1----- 50 49 48 3 2 1 r J 1 1 11 50 —4- — 4-...4--4-- 150 49 2 1 Результат можно обосновать с помощью теории вероятностей, таким образом, в этом случае интуиция согласуется с теорией. Выражение в скобках называется 91
НЕОЧЕВИДНЫЕ СИТУАЦИИ гармоническим числом. Его значение с хорошей точностью равно 4,5 (в этом можно убедиться, сложив несколько членов выражения на калькуляторе). Это означает, что даже если все наклейки выпускаются одинаковыми партиями, нужно купить примерно 50 • 4,5 = 225 наклеек, чтобы собрать коллекцию целиком. Но ведь так и проис- ходит! В общем случае, если выражение в скобках оканчивается не 50, а большим чис- лом N, его значение будет равно 0,58 + In N (где In N — натуральный логарифм N, значение которого можно вычислить с помощью инженерного калькулятора). К счастью, собрать коллекцию целиком можно быстрее, если обмениваться по- вторяющимися наклейками с друзьями и знакомыми — может быть, у них найдется такая наклейка, какой нет у вас. Также можно оценить прибыль от выпуска наклеек в зависимости от числа людей, участвующих в обмене. Но этот вопрос требует более подробного изучения, и мы не будем рассматривать его в нашей книге. 92
Глава 5 Лотереи и жеребьевки Разработать справедливую лотерею или жеребьевку (то есть такую, в которой веро- ятность выигрыша для всех участников будет одинаковой) несколько сложнее, чем может показаться. Не стоит думать, что эта задача касается только любителей азартных игр. В течение жизни мы участвуем во многих жеребьевках, порой даже не осознавая этого, например при выборе присяжных или наблюдателей на выборах. А в европейских странах с помощью жеребьевок распределяются социальное жилье и вакансии государственных чиновников. История знает примеры нечестных жеребьевок и плохо продуманных лотерей. Всякий раз ошибка была непреднамеренной, и организаторы считали, что поступа- ют правильно. Это говорит о том, что и в сфере лотерей возникают трудности с пла- нированием и реализацией проектов. Поэтому сначала мы рассмотрим различные жеребьевки и приведем некоторые размышления, которые позволят лучше понять ситуацию. Слово «лотерея» происходит от итальянского lotto — «доля», «судьба». Лотереи упоминаются уже в Ветхом Завете, а в Китае они использовались для сбора средств на постройку Великой Китайской стены. В Европе история лотерей берет начало в 1498 году в Португалии. Средства, вырученные от первой лотереи, были направлены на помощь бездомным и поддерж- ку экономики страны. В 1727 году в Нидерландах была основана старейшая в мире лотерея, которая проводится до сих пор. Ее целью был сбор средств, необходимых для пополнения казны, финансирования новых войн и проведения общественных работ. Первая лотерея в Испании была учреждена в виде монополии в 1763 году, во времена правления Карла III. Современная испанская Национальная лотерея была создана 25 декабря 1811 года, во время Пиренейской войны за независимость Испании, как «средство увеличения доходов государственной казны без ущерба для 93
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ участвующих». В народе эта лотерея стала называться современной лотереей, чтобы отличить ее от так называемой примитивной. Чтобы гарантировать честность розыгрыша, организаторы использовали детей: их невинность служила гарантией беспристрастности. С 1771 года в розыгрыше ло- тереи участвуют ученики школы Сан-Ильдефонсо. Жеребьевки с небольшим числом участников Жеребьевки с несимметричной монетой Жеребьевки, в которых используются монеты, встречаются нечасто, но на их при- мере вы сможете лучше понять проблемы, возникающие при проведении жеребье- вок. Допустим, у нас есть одна монета и мы хотим провести справедливую жере- бьевку для двух человек. Что же делать? Первый вариант — считать монету сим- метричной, то есть принять вероятности выпадения орла и решки одинаковыми. В этом случае задача решается просто: нужно подбросить монету и посмотреть, что выпадет — орел или решка. Но мы не можем заранее определить, симметрична ли монета. Хотя если немного подумать, то можно разработать такую жеребьевку, ко- торая будет справедливой независимо от того, какую монету мы используем. Предположим, что вероятность выпадения решки (Р) равна р (эта вероятность нам неизвестна, и она будет равна 0,5, если монета симметрична). Тогда вероятность выпадения орла (О), то есть противоположного события, будет равна (1 — р). Како- ва вероятность выпадения РО (решка — орел) именно в такой последовательно- сти? Так как броски монеты независимы, их результаты не влияют друг на друга, искомая вероятность будет равна произведению вероятностей: Р (РО) =р • (1-р). А какой будет вероятность выпадения ОР (орел — решка)? Как и в предыду- щем случае, имеем: Р(ОР) = (1-р)р = Р(РО). Следовательно, мы нашли способ провести справедливую жеребьевку для двух человек с помощью произвольной монеты. Монету нужно бросить дважды: если выпадет РО, выиграет первый игрок, если выпадет ОР — второй. Единственное небольшое неудобство этой жеребьевки заключается в том, что мы не сможем учи- тывать результаты ОО и РР — монету нужно будет бросать до тех пор, пока не вы- 94
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ падет последовательность ОР или РО. Читатель может убедиться в том, что если не принимать во внимание результаты ОО и РР, это никак не повлияет на шансы участников (в разделе «Грамотно разработанная официальная жеребьевка» этой главы рассматривается похожий случай). Следовательно, справедливую жеребьевку для двух человек можно произвести с помощью любой монеты. Можно использовать и любой другой предмет, для кото- рого возможны два разных исхода, независимо от того, какой будет их вероятность. Жеребьевки для трех человек и более Теперь предположим, что нам нужно провести жеребьевку для трех человек и нам предлагают следующий способ: взять мешок (или коробку с непрозрачными стенка- ми) и положить в него три шара (один белый и два черных). Разумеется, все шары имеют одинаковые размеры и неразличимы на ощупь. Каждый участник вытаскива- ет из мешка по одному шару, которые не кладутся обратно в мешок. Выигрывает тот, кто вытянет белый шар. Справедлива ли такая жеребьевка? Если нет, то кто имеет большую вероятность выигрыша? Если мы окажемся в подобной ситуации и будем иметь возможность выбора, то каким по очереди лучше вытаскивать шар из мешка? Для простоты предположим, что шары имеют номера 0, 1 и 2, при этом белый шар имеет номер 0. Вычислим вероятность выигрыша для каждого из трех участни- ков. Шары могут быть извлечены из мешка шестью разными способами, которые соответствуют шести различным перестановкам трех предметов: 012 021 102 120 201 210. Сразу же видно, что в двух из шести случаев шар под номером 0 будет извлечен первым, еще в двух случаях — вторым, в двух оставшихся — третьим. Иными сло- вами, порядок извлечения шаров не имеет значения. Если мы применим правило Лапласа, то станет очевидно: вероятность того, что первый участник вытащит черный шар, равна 2/6 (два благоприятных исхода, 012 и 021, из шести возможных). Вероятность того, что черный шар вытащит вто- рой или третий участник, также равна 2/6. Рассмотрим задачу с точки зрения условной вероятности. Так как шаров три, вероятность того, что победит первый участник, равна Р (1-й) = 1/3. Чтобы победу одержал второй участник, первый должен вытащить черный шар, а второй участ- ник — белый шар. Иными словами, второй участник должен иметь такую возмож- 95
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ ность (вероятность того, что белый шар не вытащил первый участник, равна 2/3) и, кроме того, он должен вытащить белый шар (на этот момент в мешке останется один черный и один белый шар). Таким образом, Р (2-й) = 2/3 • 1/2 = 1/3. На- конец, Р (3-й) = 1 _ 1/3 - 1/3 = 1/3. Если мы рассмотрим эту задачу не для трех, а для 100 или N участников, поло- жим в мешок 100 (или /V) шаров и проведем аналогичные рассуждения, то придем к выводу: вероятность выигрыша для каждого участника равна 1/100 (или 1/7V). Эта ситуация равносильна следующей: преподаватель хочет разыграть приз сре- ди N учеников, для чего на листе бумаги записывает число от 1 до А и опрашивает учеников в алфавитном порядке. Каждый должен назвать число от 1 до N, а выигра- ет тот, кто угадает число, написанное преподавателем. И вновь порядок участия в розыгрыше (на этот раз преподаватель называет учеников в алфавитном порядке) не имеет значения. Жеребьевки с большим числом участников Проанализируем трудности, возникающие в жеребьевках с большим числом участ- ников, на двух исторических примерах, связанных с армией. В обоих случаях орга- низаторы стремились сделать жеребьевку справедливой и хотели, чтобы вероят- ность быть призванным в армию для всех участников была одинаковой. Сначала мы перенесемся в США, в 1970-й год, когда война во Вьетнаме достиг- ла своего апогея. Армии были нужны новые солдаты, а общество требовало прекра- щения войны. Тогда было решено определить тех, кто будет отправлен во Вьетнам, с помощью жеребьевки. Здесь в интересах участников было проиграть в жеребьев- ке. В капсулы были помещены бумажки, обозначавшие 366 дней года (от 1 января до 31 декабря, включая 29 февраля), которые затем были выбраны случайным об- разом. Призыву подлежали юноши, рожденные в период с 1941 по 1952 год в дни, указанные жеребьевкой. Справедлив ли такой жребий? Перенесемся в Испанию, в 1997 год, когда служба в армии была обязательной для всех мужчин определенного возраста. В ряды вооруженных сил было призвано 165 342 человека, однако места хватило не всем, и 16 442 человека оказались «лиш- ними». В этом случае все участники жеребьевки хотели, чтобы выбрали именно их. Жеребьевка была организована следующим образом: сначала каждому из 165 342 че- ловек, участвовавших в розыгрыше, был случайным образом присвоен номер. В же- ребьевке использовалось шесть лототронов с шарами в каждом (по одному лототро- 96
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ ну на каждую из цифр числа, начиная с которого планировалось отобрать 16442 «лишних» призывников). Если по достижении последнего номера не было выбрано необходимое число призывников, отбор продолжался с номера 1. В первом лото- троне находилось пять шаров с номером 1 и пять — с номером 0 (эти числа обозна- чали сотни тысяч), во всех остальных — по 10 шаров, пронумерованных от 0 до 9. Если бы из второго лототрона (в котором находились шары, обозначавшие десятки тысяч) был извлечен шар с номером больше 6 (именно так и произошло), шар был бы выбран снова. Что вы скажете об этой жеребьевке? Справедлива ли она? Перед тем как продолжить рассказ об этих двух армейских жеребьевках, рас- смотрим еще одну схему, которая одно время использовалась для выбора кандида- тов в ситуациях, когда спрос превышал предложение, например при отборе учеников в некоторых языковых школах. Кандидатам присваивались номера в том порядке, в каком они подавали заявку, после чего в ходе жеребьевки определялся номер. Если было свободно, например, 50 мест, то они доставались кандидату с выбранным но- мером и 49 кандидатам с последующими номерами. Почему такая жеребьевка несправедлива? Представим, что мы хотим записаться в школу, где отбор учеников происходит именно таким образом. Если мы убедим 30 друзей записаться перед нами и если номера будут присваиваться в порядке записи, то мы будем иметь пре- имущество, так как все наши друзья откажутся поступать в школу. В этом случае мы делаем ставку не только на свой номер, но и еще на 30 предшествующих номеров наших друзей. Читатель может подумать, что этот способ повысить вероятность выигрыша слишком сложен, однако он использовался в течение долгого времени. Теперь применяют другие алгоритмы отбора, и кандидатам уже не присваиваются номера в порядке записи. По этой же причине была изменена аналогичная схема жеребьевки при распреде- лении социального жилья, которая использовалась в некоторых странах (в этом слу- чае подобная схема работала не всегда, поскольку те, кто подавал заявление, а потом отказывался от жилья, попадали в черный список). Вернемся к жеребьевке, с помощью которой определяли солдат американской армии. По результатам жеребьевки в числе призванных оказалось намного больше тех, кто родился в последние месяцы года. Так как дата рождения считается случай- ной (хотя это может стать предметом отдельной дискуссии), следовало ожидать, что даты рождения призывников также будут распределены случайным образом. Что же пошло не так? В барабан были помещены капсулы, обозначавшие 1 января и т. д. до 31 декабря, при этом очередность дат строго соблюдалась. Однако кап- сулы были перемешаны не слишком тщательно, поэтому те, кто родился в конце 97
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ года (капсулы с датами их рождения находились вверху), имели намного большую вероятность быть призванными в армию, чем ожидалось. Как можно было сделать эту жеребьевку более простой и справедливой? Например, можно было, предвари- тельно перемешав капсулы в барабане, извлечь случайным образом одну дату и при- звать на службу необходимое число юношей, рожденных после выбранной даты. Этот способ был бы более быстрым и справедливым. Вернемся к примеру с испанской армией. Так как из первого барабана с равной вероятностью мог быть извлечен шар с номером 0 или с номером 1 (всего в барабане находилось по 5 шаров с каждым номером), вероятность выпадения для разных чи- сел (и, как следствие, вероятность оказаться «лишним» при призыве) оказывалась неодинаковой. Так, если мы не будем учитывать вероятность того, что шар из второ- го барабана потребуется извлечь повторно, вероятность выпадения для чисел от 1 до 99 999 будет равна: 1 1 р(Р)=-------- 2 99 999 =0,000005, в то время как для остальных чисел она равна: -----5—=0,00000765. 2 65 343 Иными словами, вероятность выпадения числа из последней группы была на- много выше, чем из первой, — примерно на 50 % выше. Результатом жеребьевки стало число 155611. Первая цифра 5 была определена только со второго раза: пер- вым из второго барабана был извлечен шар с номером 8 (больше допустимого 6). От призыва были освобождены юноши начиная с этого номера и до последнего, за- тем отбор продолжился с номера 1, пока не было отобрано 16442 человека. Завершая рассказ об этом примере, приведем одно замечание. Политик, ответ- ственный за организацию жеребьевки, в то время занимал пост заместителя мини- стра обороны. В ответ на вопросы журналистов о вероятностях он без стеснения сказал: «Я не владею теорией вероятностей, я гуманитарий». Результаты жеребьев- ки так и не были пересмотрены — согласно заявлению Вооруженных сил Испа- нии, «все участники имели равные возможности, поскольку номер каждому из них был присвоен случайным образом». Это утверждение верно, так как для расчета истинной вероятности того, что номер выбранного призывника выпадет при жере- бьевке, приведенные нами вероятности следует умножить на вероятность того, что призывнику будет присвоен номер от 1 до 99999 или от 100000 до 165343. Это 98
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ доказывает, что многим непросто понять теорию вероятностей. В итоге, несмотря на некомпетентность организаторов жеребьевки, ее результаты оказались коррект- ными. В следующем разделе показано, как можно провести справедливую жере- бьевку в подобных условиях. По той же причине несправедлива жеребьевка, при которой члены жюри или присяжные определяются путем выбора двух первых букв фамилии. В этом случае не все фамилии равновероятны: например, человек с фамилией Иващенко может быть выбран только в том случае, если результатом жеребьевки будут буквы «ИВ», однако его опередят кандидаты с более распространенными фамилиями, например Иванов. Грамотно разработанная официальная жеребьевка Правительство испанского автономного сообщества Арагон обратилось на кафедру статистических методов университета Сарагосы с просьбой разработать схему же- ребьевки, которая позволила бы распределить социальное жилье так, чтобы все, кто подал заявление, имели равные шансы. Этот пример станет логичным продолжени- ем раздела о жеребьевках с большим числом участников. Когда на получение социального жилья подает заявки очень много людей, то на- писать номера всех участников на шарах и загрузить их в лототрон будет непросто с практической точки зрения. Поэтому в подобных случаях рекомендуется исполь- зовать несколько лототронов, с помощью каждого из которых будет определяться по одной цифре искомого числа. В каждом лототроне должно находиться 10 ша- ров с цифрами от 0 до 9. Для простоты предположим, что в жеребьевке участвует больше 10000 человек, то есть необходимо пять лототронов: с помощью первого будут определяться единицы, с помощью второго — десятки, третьего — сотни, четвертого — тысячи, пятого — десятки тысяч. Если число участников больше 1000 и меньше либо равно 10 000, то все вышеизложенное будет по-прежнему вер- но, однако потребуется всего четыре лототрона. Аналогично, если в жеребьевке участвует от 100 до 1000 человек, потребуется всего три лототрона. Для жеребье- вок, где участвует 100 человек и менее, рекомендуется использовать один лототрон. Если вы решите использовать несколько лототронов, потребуется всего два, при этом второй, для определения десятков, будет использоваться так же, как пятый барабан в ситуации, описанной ниже. Кроме того, следует отметить, что одним из чисел в розыгрыше должен быть ноль, то есть если речь идет о 10000 чисел, они будут лежать в диапазоне 99
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ от 0 до 9999, как это и происходит при розыгрыше лотерей. Во многих случаях по разным причинам 0 не присваивается никому из участников. В этом случае про- цедуру розыгрыша следует немного изменить, что никак не повлияет на шансы участников. Об этих изменениях мы расскажем позже, и необходимы они потому, что в розыгрыше с несколькими лототронами выпадение нуля так же вероятно, как и выпадение любого другого числа1. Рассмотрим жеребьевку с пятью лототронами (в розыгрыше участвует более 10000 человек). Предположим, например, что число участников розыгрыша крат- но 10000, например 30000, то есть участникам присвоены номера от 0 до 29999. В этом случае в пятый барабан следует поместить только шары с номерами от 0 до 2. Чтобы определить выигрышный номер, нужно будет извлечь по одному шару из каждого лототрона. Теперь рассмотрим случай, когда число участников розыгрыша не кратно 10000 и равно, например, 53427. В этом случае в пятый лототрон, с помощью ко- торого определяются десятки тысяч, нужно поместить шары с номерами от 0 до 5. Далее нужно выполнить те же действия, что и в предыдущем случае: извлечь по од- ному шару из каждого лототрона и получить таким образом число от 0 до 59 999. Если полученный результат превышает число участников, следует вернуть все шары в лототроны и повторить розыгрыш. При необходимости действия следует повто- рять до тех пор, пока не будет получено корректное число2. Чтобы показать, что при этой процедуре все участники имеют равные шансы, рассмотрим конкретный пример. Чтобы упростить рассуждения, не будем присваи- вать ноль никому из участников. Допустим, что их номера находятся в интервале от 1 до 53427. При описанной нами процедуре используется пять лототронов (с их помощью определяются единицы, десятки, сотни, тысячи и сотни тысяч искомого числа). В первые четыре лототрона помещаются шары с номерами от 0 до 9, в пя- тый — шары с номерами от 0 до 5. Далее из каждого лототрона извлекается по од- ному шару и составляется число. Если оно находится в интервале между 1 и 53 427, это будет выигрышный номер, если же полученным числом будет 0 (00000) или же оно будет больше 53 427, все шары нужно будет вернуть в лототроны и повторить розыгрыш, пока не будет получено число в интервале от 1 до 53427. 1 Часто организаторы считают ноль «некрасивым» числом и не присваивают его никому из участников. 2 Также можно поместить в пятый лототрон шары с номерами от 0 до 9 и действовать аналогичным образом, то есть не учитывать все результаты, соответствующие числам за пределами требуемого диапазона. Но такая процедура будет слишком трудоемкой, поскольку результаты розыгрыша часто будут оказываться за пределами требуемого диапазона. 100
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ Чтобы подтвердить, что такая жеребьевка справедлива, нужно показать, что ве- роятность выпадения для всех чисел от 1 до 53427 одинакова (и равна 1/53427). Рассмотрим конкретное число, например 12525, и вычислим вероятность того, что в результате жеребьевки оно окажется выигрышным. Во-первых, следует заметить, что при извлечении шаров из каждого лототрона вероятность выпадения для всех чисел от 00000 до 59 999 равна 1 1 1 1 j__1 10 10 10 10 6 ~ 60000’ так как вероятность извлечь из лототрона шар с определенным номером равна еди- нице, разделенной на число шаров. Так, вероятность того, что при первом розыгры- ше выпадет число 12525, равна 1 60 ООО ‘ Но может случиться так, что результатом первого розыгрыша станет число за пределами диапазона, и потребуется повторить жеребьевку, результатом которой также может оказаться 12525. Общее количество некорректных чисел равно 6572 (числа в диапазоне от 53428 и 59999) плюс 1 (00000), поэтому вероятность того, что результатом первого розыгрыша будет некорректное число, равна: Некорректные числа _ 6573 Все числа 60 000 Следовательно, вероятность того, что результатом второго розыгрыша будет число 12525, равна вероятности того, что результат первого розыгрыша будет некорректным, 6573 60 000 ’ умноженной на вероятность того, что при втором розыгрыше выпадет число 12525, то есть на-----. Искомая вероятность равна: 60 000 6573 (60 000)2 ’ Повторив эти вычисления для ситуаций, в которых результаты первых п розы- грышей оказались некорректными, а результат (и + 1)-го розыгрыша равен 12525, и сложив все полученные таким образом вероятности, определим искомую вероят- ность того, что число 12 525 окажется выигрышным: 101
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ Р(12 525 выиграло) = 1 1 6573 1 ( 6573 Л -------1---------------1-------------- 60 000 60 000 60 000 60 000 (60 ОСЮ 1 ' 6573 5 1 + 60 000 k 60 000, что равносильно 1 1 1 60 000 __1 60 000 1 _ 6573 ~ 60 000 53 427 ” 53 427 ' 60 000 Это доказывает, что предложенная схема жеребьевки справедлива. Лотереи и математическое ожидание Общество традиционно не желает платить налоги, за исключением одного случая, когда налог платится добровольно и с удовольствием — речь идет о налоге на выи- грыш в лотерею. Поэтому нет никаких сомнений, что в лотереи всегда выигрывает государство. Эта ситуация породила немало афоризмов, один из них принадлежит Генри Филдингу (1707—1754): «Лотерея — это налог на всех глупцов мироздания. И, хвала небесам, этот налог взимается с величайшей простотой: доверчивость никогда не выходит из моды». НЕПРАВИЛЬНО ОРГАНИЗОВАННЫЕ ЛОТЕРЕИ Государство (или организатор лотереи) выигрывает всегда, за исключением случаев, когда ло- терея организована неправильно. Известны несколько примеров подобных лотерей: одна из них была проведена в 1728 году в Париже с целью сбора средств для уплаты городских долгов. Известный мыслитель Вольтер (1694-1778) высказывался о случайности следующим обра- зом: «Случай - слово, лишенное смысла; ничто не может существовать без причины» и, подоб- но другим ученым, был сторонником гипотезы о всеобщем детерминизме. С помощью своего друга-математика он определил, что парижская лотерея - мечта любого игрока: покупка всех лотерейных билетов до единого гарантировала выигрыш. Вольтер поступил именно так: он с друзьями создал специальное общество и поправил свое финансовое положение, не пере- ставая в то же время получать доход от публикации книг и других предприятий. 102
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ Анализ азартных игр представляет несомненный интерес с точки зрения не толь- ко математики, но и социологии. Если учесть, что население государства велико, и в его распоряжении находятся значительные средства, эта тема приобретает осо- бую важность. Согласно официальным данным, испанская рождественская лоте- рея — первая в мире по доле сборов, выплачиваемых в виде выигрышей. Так как во многих лотереях есть вероятность выиграть разные призы, важным понятием является математическое ожидание выигрыша, указывающее средний вы- игрыш, на который мы можем рассчитывать. Чтобы вычислить математическое ожидание, сначала нужно рассчитать вероят- ности выигрыша каждого приза традиционным методом, то есть найти отношение числа благоприятных исходов к общему числу возможных исходов. В лотерее, где выпущено сто билетов, разыгрывается первый приз и два вторых. Вероятность вы- играть первый приз, купив один билет, равна 1/100 = 0,01 (или 1%), вероятность выиграть второй приз — 2/100 = 0,02 (2%). Вероятность не выиграть ни один из призов равна 97/100 = 0,97 (97 %). АЗАРТНЫЕ ИГРЫ КАК БИЗНЕС Суммы, которые вносят в казну государства любители азартных игр (включая лотереи, казино и другие игровые залы), в некоторых странах составляют до 3% ВВП. Суммы, которые тратят игроки, остаются неизменными даже в кризис. При этом в игру вступают не только деньги, но и всевозможные суеверия и предрассудки: везение, странное предчувствие по отношению к определенным номерам, вещие сны и «счастливые» кассы продажи билетов. Считается, что особенно высоки шансы на выигрыш у тех, кто выжил в несчастном случае, - своеобразная компенсация от высших сил. Приведем историю игрока, который выиграл первый приз в лоте- рею, поставив на число, заканчивающееся на 48. Он объяснил свой выбор так: «Мне снилось число 7 семь ночей подряд, а так как 7 умножить на 7 будет 48, я поставил на 48!» Как же нам заставить этого провидца поверить, что 7 7 = 49? Математическое ожидание выигрыша в игре равно сумме произведений воз- можных выигрышей на вероятности их получения, из которой вычитается сумма, уплаченная за право участвовать в розыгрыше. Если в приведенном выше примере каждый лотерейный билет стоит 5 евро, первый приз равен 100 евро, два вторых — по 40 евро, то математическое ожидание выигрыша будет равно 100 • 0,01 + 40 X 103
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ X 0,02 — 5 = 1 + 0,8 — 5 = —3,2 евро. Если математическое ожидание является отрицательным числом (как в этом случае), организатор лотереи имеет преимуще- ство. Если бы математическое ожидание было положительным (а это бывает только в неправильно организованных лотереях), преимущество было бы на стороне игро- ка, а если бы математическое ожидание равнялось нулю, то игра была бы равновес- ной для обеих сторон. Испанская рождественская лотерея В Испании участие в рождественской лотерее уже стало обычаем, почти таким же обязательным атрибутом Рождества, как обмен подарками или традиционное ла- комство под названием туррон. Испанцы покупают билеты вместе с коллегами, дру- зьями или родственниками, хотя, по сути, эта лотерея представляет собой добро- вольную уплату дополнительных налогов. Взглянув на любой билет, мы увидим, каковы суммы призов для 85 000 серий билетов от 00000 до 84 999. Вероятность выиграть главный приз, купив один билет, равна 1/85 000 = 0,00001176, так же как и выиграть второй или третий приз (оценить, насколько мала эта вероятность, вы сможете, прочитав рассказ на врезке «Рождественская сказка»). Вероятность вы- играть один из двух четвертых призов или один из восьми пятых равна 2/85000 и 8/85000 соответственно. Вероятность выиграть один из 1774 утеши- тельных призов в 1774 раза больше, чем вероятность выиграть главный приз. Сло- LOTFRlA NACIONAL Optima parte derbillete para J sorteo del dia 22 de diciembre de 200<* . - l )11иС'<М)ДОЕЯА1 llllllllllliillllllllllillillllllillll 5102908092>0616463744 4 Билет испанской рождественской лотереи, прошедшей 22 декабря 2009 года. 104
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ жив все призы, получим, что их общее число равно 13 334 (включая совпадения трех первых цифр, двух последних и остальные варианты), поэтому вероятность выи- грать какой-либо приз, купив единственный билет, равна 13334/85000 = = 0,156870588 — почти 1/6, то есть чуть меньше 16%. Рассмотрим ситуацию с точки зрения игрока: если некий человек покупает 25 билетов каждый год, то в среднем он будет выигрывать четыре приза в год, половина из которых будут равны стоимости лотерейного билета. Умножив призы лотереи на вероятность выигрыша и найдя сумму этих произве- дений, вы увидите, что математическое ожидание выигрыша для одного билета (его стоимость равна 20 евро) равна —6 евро (30 % от цены билета). Иными словами, игра невыгодна для игрока и прибыльна для государства. РОЖДЕСТВЕНСКАЯ СКАЗКА У Хуана есть друг, который живет в городе Сьюдад-Реаль. Хуан уже давно не видел его и даже не знает его нынешнего адреса. Во время последней встречи друзья пообещали отправить друг другу по одной, самой любимой книге. Несколько дней назад Хуан встретил еще одного друга, Луиса, который сказал ему, что едет в Сьюдад-Реаль. Хуан вспомнил о том, что не вы- полнил обещание, и попросил Луиса передать другу книгу. Чтобы не поцарапать обложку, Луис положил книгу в большой конверт. Прибыв в Сьюдад-Реаль, он припарковал машину на той улице, где нашлось свободное место, вышел из машины и протянул конверт первому встречному со словами: «Возьмите эту книгу, ее передал вам ваш друг Хуан из Сарагосы». Этот человек, выбранный совершенно случайным образом, ответил: «Как здорово, что он не забыл! Я жду эту книгу уже который год!» Хотя друзья клянутся, что история правдива, кажется невероятным, что первый же встре- ченный на улице человек оказался именно тем, кого искал Луис. Вероятность этого немного больше, чем вероятность выиграть главный приз в рождественской лотерее. Согласно официальным данным, на 1 января 2009 года в Сьюдад-Реале проживало 74213 человек, а число билетов рождественской лотереи равно 85000. Всегда выигрывают те, кто живет в другом городе Рождественская лотерея невероятно популярна в Испании, в ней участвует столько людей, что многие из них придумывают самые разные стратегии, чтобы хоть как-то увеличить ничтожную вероятность выигрыша. 105
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ Некий любитель азартных игр, который жил в маленьком городке, всегда просил купить билеты родственника, жившего в большом городе, со словами: «Купи мне билет — всегда выигрывают те, кто живет в другом городе». Повысил ли этот игрок шансы на выигрыш? Разумеется, нет, но эта точка зрения достаточно популярна, и многие покупают лотерейные билеты в каком-нибудь особом месте. Если много людей купит билеты в одной и той же кассе, вероятность того, что выигрышный билет будет продан именно в ней, возрастет, однако вероятность того, что выиграет конкретный билет, купленный в этой кассе, не изменится. Еще больший оптимизм испытывают те, кто говорит: «Я всегда покупаю ло- терейный билет, когда они только поступают в продажу, — так я точно знаю, что выигрышный билет еще не купили». Здесь можно вспомнить задачу, в которой из мешка поочередно доставались шары, один из которых был выигрышным: по- рядок извлечения шаров не имел значения. Наконец, если рассуждения, приведенные в начале этого раздела, верны (вы- игрышный билет с большей вероятностью будет продан в другом городе), то, воз- можно, есть какой-то способ повысить шансы на выигрыш в рождественской лоте- рее? Вынуждены вас разочаровать: такого способа не существует. Примитивные лотереи Лотереи, которые называются примитивными, заключаются в том, что нужно вы- брать т чисел от 1 до Л. В Испании проводится три таких лотереи: Примитивная лотерея, Lotto 6/49 в Каталонии (нужно выбрать 6 чисел от 1 до 49) и 7/39, про- водимая организацией ONCE. В Великобритании также проводится лотерея 6/49, в Швейцарии — 6/45, в Новой Зеландии — 6/40, в Швеции — две лотереи: 7/35 и 6/48. Во всех случаях с незначительными изменениями (о которых мы поговорим да- лее) выигрыш достается тому, кто угадывает все или несколько чисел в розыгрыше. В испанской Примитивной лотерее нужно угадать 6 чисел, 5 чисел + другое число, выпавшее при розыгрыше (дополнительное), 5, 4 или 3 числа. Рассмотрим эту лотерею подробнее. Главный приз достается тому, кто угадывает шесть чисел от 1 до 49. Общее число способов, которыми можно выбрать 6 чисел из 49 возможных (при условии, что порядок выбора не важен), как вы увидели в главе 1, равно: 106
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ 49-48-47-46-45-44 6! = 13 983 816. Почти 14 миллионов! Вероятность угадать все шесть чисел крайне мала: ----------« 0,000007 %. 13 983 816 Что касается других призов, то для каждого случая вероятность равна возможные исходы Р = 13 983 816 Таким образом, нужно найти число возможных исходов для каждого случая. Можно не угадать одно из шести чисел, и в таком случае шестым числом может быть любое из 49 — 6 = 43 оставшихся. Следовательно, существует 6 • 43 = = 258 комбинации из пяти чисел. Сюда же входят случаи, когда шестое число со- впадает с дополнительным (их 6) и когда не совпадает. Проведя похожие рассужде- ния, получим, что количество благоприятных исходов для четырех чисел будет равно Се • С« = 13 545. Для трех чисел благоприятных исходов Се • С« = 246 820. Вероят- ности выигрыша равны: Билет Примитивной лотереи. 107
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ 5 + Д: р = 6/13 983 816 = 1/2330 636. 5 р = 252/13 983 816=1/55 491. 4 р = 13 545/13 983 816 = 1/1032. 3 р = 246 820/13 983 816 = 1/57. Сложив все эти вероятности, получим, что вероятность выигрыша равна 1,86 %. Как видите, это очень мало. От розыгрыша к розыгрышу вероятности не меняются, СКОЛЬКО ЧИСЕЛ НУЖНО ВЫБРАТЬ Почему в Испании проводится лотерея 6/49, а в Швейцарии - 6/45? Формула лотереи связа- на с числом жителей страны: она меняется в зависимости от числа потенциальных игроков и направлена на то, чтобы увеличить вероятность выигрыша больших призов. Рассмотрим кон- кретный пример. В Каталонии, где проживает около 7 миллионов человек, можно сыграть в Lotto 6/49, но так как число возможных вариантов в этой лотерее равно почти 14 миллионов, то с большой вероятностью никто не угадает ни 6 чисел, ни 5 + дополнительное число. Так и про- изошло в восьми из десяти прошедших подряд розыгрышей с 19 сентября по 21 октября 2009 года. Только в розыгрыше 7 октября были разыграны оба приза: тому, кто угадал шесть чисел, досталось 2453 000 евро, 5 + Д - 50 643 евро. В розыгрыше от 14 октября никто не уга- дал шесть чисел и всего один участник верно указал пять чисел плюс дополнительное: его вы- игрыш составил 11600 евро. Таким образом, лотерея, основной интерес к которой возникает из-за больших призов, теряет немалую долю своей привлекательности. Лотерея, проводимая по этой формуле, подходит для проведения во всей Испании: в этом случае потенциальное чис- ло участников возрастет. С 2004 года с примитивными лотереями в Европе соперничает новая, более сложная раз- новидность лотереи - EuroMillions, которая проводится сразу в нескольких европейских странах. В этой лотерее нужно выбрать пять чисел от 1 до 50 и две звезды с номерами от 1 до 9. Про- ведя рассуждения, аналогичные представленным выше, получим, что общее число возможных вариантов в этой лотерее равно: С5 -С2 = ^50 9 50 <5 50-49-48-47-46 9 8 ->с =-------------------= 2118 760 -36 = 76 275 360 5! 2! Это число в пять раз больше, чем для испанской Примитивной, следовательно, вероятность верно указать все числа в пять раз меньше, однако главные призы весьма и весьма внуши- тельны. 108
ЛОТЕРЕИ И ЖЕРЕБЬЕВКИ а поскольку в году 52 недели, то примерно раз в году (если покупать по одному би- лету в каждом розыгрыше) будет выпадать билет с тремя верными числами. Прочие вероятности настолько малы, что больших выигрышей не следует ожидать слишком часто: чтобы угадать даже четыре числа, потребуется несколько лет. Привлекательность примитивных лотерей и пари Паскаля Почему примитивные лотереи так популярны? Дело в том, что на подсознательном уровне игроки проводят рассуждения, напоминающие знаменитое пари Паскаля. Математическое ожидание в примитивной лотерее, как и во многих других, зависит от того, какой процент от суммы, полученной от продажи билетов, составляют вы- игрыши. В примитивной лотерее призы могут оказаться намного больше, чем в дру- гих лотереях. Из-за возможности в одночасье разбогатеть люди делают вывод: игра стоит того, чтобы рисковать. Вот и ответ на вопрос о популярности лотерей. 109

Глава 6 Преимущества «нормальности» Большие числа Перед тем как бросить игральный кубик, спросим кого-нибудь, какова вероятность того, что выпадет 4. Вполне возможно, что этот человек ответит: «1/6», даже если не совсем четко представляет, что такое вероятность. Но что он имеет в виду, когда говорит о вероятности в одну шестую? Ответы на этот вопрос могут существенно отличаться в зависимости от уровня знаний человека и даже его привычек. Наиболее часты следующие три ответа. 1. Кубик имеет шесть граней, и может выпасть любая из них. 2. Если мы бросим кубик много раз, то примерно в одной шестой части случаев выпадет четыре очка. 3. Если мы будем делать ставки на то, выпадет 4 или нет, то коэффициент ставки должен быть 5 к 1. Первый ответ подсказывает нам интуиция, для него не нужны знания математи- ки. Третий ответ идеально подходит для тех, кто привык делать ставки на разные со- бытия, и продиктован скорее жизненным опытом, чем знанием теории вероятностей. На свете именно потому существует столько игр, что многие люди будут со всей уверенностью доказывать, что именно третий ответ наиболее правильный. А вот второй ответ среди людей, ничего не знающих о теории вероятностей, най- дет меньше всего сторонников. Но именно этот вариант можно доказать математи- чески. 111
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ. Поразмыслив несколько секунд, мы можем сделать вывод: это утверждение описывает достаточно сложные математические понятия. Любой может сказать, что оно не будет абсолютно точным, если число бросков кубика не кратно шести. Что же на самом деле означает второй ответ? Он означает, что если число бросков кубика будет очень, очень, очень большим, то доля случаев, когда выпадет четыре очка (равно как и любое другое число очков), будет сколь угодно близкой к 1/6. Подобные утверждения в теории вероятностей называются законом больших чисел (теперь понятно, откуда это название). Также напомним читателю о понятии статистической закономерности, о котором мы гово- рили в главе 4. Если вы по-прежнему скептически относитесь к подобным законам, рассмотрим еще один пример, который поможет развеять сомнения. Игра в рулетку — одна из самых известных азартных игр. Каждый день в нее во всем мире играет больше людей, чем в любые другие игры, да и выигрыши могут быть немалыми. Европейская рулетка представляет собой цилиндр, внутри которого находится вращающийся диск, разделенный на 37 секторов, окрашенных поочередно в крас- ный и черный цвета и пронумерованных от 1 до 36 (сектор 0 обычно окрашен в дру- гой цвет, например зеленый). Цель игры — угадать, на каком секторе остановится шарик, брошенный крупье. Существуют различные варианты игры в рулетку: на- пример, американская рулетка имеет дополнительный сектор «00». Есть и слегка видоизмененные варианты, которые отличаются ставками или выигрышем. Погово- рим о европейской рулетке. Сначала игроки делают ставки, затем крупье раскручивает рулетку и бросает ша- рик на внешнюю часть круга. Когда рулетка замедляется, шарик падает в часть кру- га, разделенную на сектора, и перескакивает с места на место, пока не остановится на одном из 37 секторов. Магия вращения привлекала людей с момента изобретения рулетки. Центр ко- леса, который кажется неподвижным, колесо, которое движется тем быстрее, чем дальше мы от центра, невозможность предугадать, на каком секторе остановится шарик, — все это стало причиной появления множества игр с колесом. Как утверждают историки, колесо рулетки и правила игры, очень похожие на со- временные, придумал Паскаль, правда, в его рулетке было 36 секторов (без нуля). 112
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ' Кажется, что выбор 36 чисел еще больше увеличивает магическую притягатель- ность рулетки, так как сумма первых 36 чисел равна в высшей степени магическому числу: 1 + 2 + 3 + 4 + ... + 33 + 34 + 35 + 36 = 666. Хотя существует множество способов делать ставки при игре в рулетку, для про- стоты предположим, что можно ставить только на четное или нечетное, красное или черное, малые или большие номера (малыми называются номера от 1 до 18, больши- ми — от 19 до 36). На каждый поставленный евро игрок получает свою ставку об- ратно плюс еще один евро сверху. Какова вероятность выиграть поставленный евро? Важно отметить, что сектор 0 не имеет цвета и не считается ни четным, ни нечет- ным, ни малым, ни большим. Следовательно, вероятность выигрыша для любой из указанных нами ставок равна 18/37, вероятность проигрыша — 19/37. Вероят- ность выигрыша казино на 1/37 больше (примерно на 2,70 %). Так как вероятность выиграть один евро равна 18/37, а вероятность проиграть 1 евро равна 19/37, мате- матическое ожидание, или средний выигрыш для каждой игры будет равен: (+1) • — + (-1) • — = - -0,027. 37 37 37 Иными словами, в каждой игре мы будем терять в среднем 2,7 евроцента. Аналогичная ситуация сложится и когда мы будем ставить на выбранное число: в этом случае вероятность выигрыша составит 1/37, вероятность проигрыша — 36/37, при ставке в 1 евро выигрыш составит 1 + 35 евро. Средний выигрыш также будет равен 1 , „ 36 (-1) 35-—+(-1)- — = ^- = 37 37 37 -0,027. Рассмотрим простые ставки на красное и черное. Предположим, что мы сыграли в рулетку сто раз и всякий раз ставили 1 евро на красное или черное. Проиграем ли мы по окончании ста игр 100 • 0,027 = = 2,7 евро? Очевидно, что ни выигрыш, ни проигрыш не могут выражаться неце- лым числом. Что более вероятно — проиграть примерно 2,7 евро или выиграть, например, 50 евро? Мы задаемся аналогичным вопросом, когда анализируем броски игрального кубика: выпадет ли четыре очка ровно в шестой части случаев, если мы бросим кубик очень много раз? Можно представить и другие ситуации, когда возникают похожие вопросы. Если эффективность лекарства составляет 80 %, означает ли это, что при лечении боль- шого числа пациентов оно поможет только 80 % из них? Если лекарство имеет по- 113
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» бочные эффекты в 1 % случаев, означает ли это, что побочные эффекты будут на- блюдаться у 1 % пациентов, получивших лекарство? Ответ на эти вопросы поможет дать закон больших чисел. Вернемся к рулетке, игральному кубику и другим ситуациям, когда можно при- своить вероятность определенному событию или исходу. Существует два типа во- просов, связанных с вероятностями. С одной стороны, можно задаться вопросом: как будут соотноситься с теоретическими вероятностями результаты, которые мы получим на практике? С другой стороны, можно предложить обратную задачу: можно ли определить теоретическую вероятность по результатам испытаний? Эти два вопроса имеют различную природу, и чтобы ответить на них, нужно провести обратные рассуждения. В первом случае на основе теоретических вероят- ностей мы хотим определить результаты эксперимента, а во втором случае мы хо- тим вывести теоретические вероятности, зная результаты. Второй вопрос относится к статистике, и к нему мы вернемся чуть позже. Рассмотрим первый случай и по- пытаемся ответить на вопросы, поставленные в начале главы. Теорема Бернулли Бросим игральный кубик большое число раз. Выпадет ли четыре очка 50 раз из 300 бросков? Что произойдет, если мы бросим кубик 3 тысячи раз? Читатель может подумать, что никто, находясь в здравом уме, не будет бросать кубик тысячи раз и записывать результаты. И если нам скажут, что некий математик в действи- тельности провел такой опыт, это станет лишь подтверждением того, что все мате- матики немного не в себе. Но единственный способ подтвердить правильность тео- ретических результатов, это провести эксперимент, поэтому математика намного ближе к экспериментальным наукам, чем принято думать. Именно такой экспери- мент провел французский натуралист Жорж-Луи Леклерк, граф де Бюффон (1707—1788): он подбросил монету 4040 раз, из которых 2048 раз выпала решка. Таким образом, доля исходов, в которых выпала решка, составила 2048/4040 = 0,5069, или 50,69%. Иногда в особых случаях человек вынужден чем-то заняться, чтобы сохранить рассудок и спокойствие. Именно это произошло с южноафриканским математиком Джоном Керричем, который был арестован во время Второй мировой войны. В тю- ремной камере он развлекался тем, что 10 тысяч раз подбрасывал монету, и решка выпала 5067 раз: вероятность выпадения решки составила 5067/10000 = 0,5067 114
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» (50,67%). Иногда доля решек заметно отклонялась от желаемых 50%, однако с увеличением числа бросков она постепенно приближалась к этому значению. В первых десяти бросках решка выпала всего четыре раза (40 %), в десяти последу- ющих — 6 раз, таким образом, в первых 20 бросках решка выпала ровно в 50 % случаев! После 100 бросков доля решек составила всего 44%, после 200 — воз- росла до 50,2 % и, наконец, по итогам 10 тысяч бросков решка выпала в 5067 слу- чаях — 50,67 %, что достаточно близко к ожидаемым 50 %. НАМНОГО ПРОЩЕ Сегодня, к счастью, подобные эксперименты нетрудно повторить сколь угодно большое число раз с помощью компьютерного моделирования. Смоделировать броски монеты и определить, сколько раз выпадет орел или решка, можно на следующей интернет-странице: http://nlvm. usu.edu/es/nav/ftames asid 305 g 3 t 5.hbnl?from-topic t 5.html. На ней всем желающим предоставляется доступ к виртуальному манипулятору, разработанному в Университете штата Юта, а также к моделям для других ситуаций. Якоб Бернулли (1654—1705) посвятил несколько десятилетий изучению этой задачи и математически доказал, что доля решек, выпавших при броске монеты, будет бесконечно приближаться к 50 %. При броске игрального кубика, согласно теореме Бернулли, доля случаев, когда выпадет четыре очка, будет приближаться к 1/6. Бернулли назвал свою теорему золотой, однако в современной формулировке она известна как закон больших чисел. Большие числа, о которых идет речь в на- звании закона, означают, что он выполняется, если эксперимент повторяется беско- нечное число раз. Очевидно, что мы не можем проводить эксперимент вечно, даже с помощью самого мощного компьютера. Мы можем повторить его очень много раз, но число повторений всегда будет конечным. Что же на самом деле означает закон больших чисел? Или, точнее, для чего нужен вывод, который мы никогда не сможем подтвердить? Здесь появляется важное математическое понятие предела, так как закон боль- ших чисел гласит, что с увеличением числа бросков монеты (или игрального кубика) доля случаев, в которых выпадет решка, будет приближаться к теоретической веро- ятности этого результата: в примере с броском монеты — к 1/2, в примере с играль- ным кубиком — к 1/6. 115
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ. Эта швейцарская марка посвящена Якобу Бернулли и его закону больших чисел. Бернулли повелел высечь на своем надгробии (слева) логарифмическую спираль и латинское изречение Eadem mutata resurgo («Измененная, я вновь воскресаю») — их вы можете видеть внизу. Тем не менее мастера изобразили на его надгробии спираль Архимеда (фотография Владислава Сойки). Закон больших чисел подсознательно знает любой человек, даже не владеющий математикой. Можно сказать, что он записан в нашем генетическом коде (но при этом он прекрасно уживается с ложным законом малых чисел, о котором мы рас- сказали в главе 3). При работе над исходной формулировкой золотой теоремы Бернулли представил себе ящик, в котором лежит 5 тысяч одинаковых шаров: 3 тысячи белых и 2 тысячи черных. Достанем из ящика шар, запишем его цвет и положим его обратно (чтобы не нарушать исходного состояния). Затем извлечем из ящика еще один шар и повто- рим этот эксперимент много раз (эта процедура называется «выбор с возвращени- ем»). Очевидно, что вероятность вытащить белый шар будет всякий раз равна 3 к 5, то есть 60 %. Бернулли задался вопросом: с какой точностью эта вероятность будет равна 60 % и с какой вероятностью будет достигнута эта точность? Хотя этот вопрос может показаться малопонятной игрой слов, мы продемон- стрируем всю глубину задачи, предложенной Бернулли. Если мы извлечем из ящика с черными и белыми шарами 200 шаров, то среди них может оказаться 120 белых шаров (60%), или 100 (50%), или 125 (62,5%). Какова вероятность того, что процент белых шаров будет находиться на интервале от 55 до 65 %? Если мы хотим дать более точный ответ, можно рассмотреть вероятность того, что доля белых ша- 116
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ. ров будет близка к 60 % и будет находиться, например, на интервале от 59 до 61 %. Последний вопрос звучит так: увеличится ли доля белых шаров, если мы достанем из ящика не 200 шаров, а миллион? В подобных вопросах, которым была посвящена работа Бернулли, рассматрива- ются два типа ошибок, или неопределенностей, которые следует устранить. С одной стороны, это отклонение от реальной доли шаров, которое мы готовы допустить: так, доля белых шаров среди извлеченных может составлять от 59 до 61 %. С дру- гой стороны, мы никогда не сможем с абсолютной уверенностью утверждать, что доля белых шаров будет заключена именно на заданном интервале, но мы можем го- ворить, что желаемое соотношение выполняется во многих экспериментах, например с точностью 95 %, то есть в 95 % экспериментов, в которых мы достанем из ящика 200 шаров (или миллион). Спрогнозировать обе описанные нами ошибки невозможно. Бернулли доказал, что если мы повторим эксперимент достаточное число раз, то есть достанем из ящи- ка достаточно много шаров, то сможем добиться того, что доля белых шаров будет сколь угодно близкой к 60 %. Выражение «сколь угодно близкой» может означать, что доля белых шаров будет составлять от 59 до 61 %, или же от 59,9999 ТЕОРЕМА БЕРНУЛЛИ Допустим, что в результате эксперимента может произойти некоторое событие, которое мы обо- значим через А. Вероятность этого события равна р. Повторим эксперимент раз и запишем, сколько раз произошло событие А. Если оно произошло т раз, то отношение m/л будет означать долю случаев, в которых произошло событие А (его относительную частоту). Разность между вероятностью р и относительной частотой m/л указывает ошибку, которую мы совершим, если будем использовать относительную частоту вместо истинной вероятности события. Бернулли доказал: эта разница может быть сколь угодно малой, и с увеличением л она будет стремиться к нулю. На языке математики это утверждение записывается так. Если 8 - сколь угодно малое по ложительное число, то выполняется соотношение: lim. m л ,Р\-----Р>£ =0. I л I 117
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» И 60,0001%, то есть лежать в произвольных выбранных нами пределах. Кроме того, теорема Бернулли содержит формулу, позволяющую определить, сколько по- вторений потребуется, чтобы достичь указанных значений. Теорема Бернулли состоит из двух разных частей. Первая, возможно более важ- ная, гласит, что заданной точности можно достичь при конечном числе эксперимен- тов. Вторая часть позволяет рассчитать, сколько именно экспериментов потребуется для того, чтобы достичь желаемой точности. Вторая часть теоремы Бернулли имеет практическое применение. При проведении любого опроса можно установить допу- стимое значение ошибки и определить число анкет, которые должны будут запол- нить участники опроса, чтобы мы получили результат с заданной точностью. Для простоты предположим, что нам известно, какова доля жителей, поддерживающих политика на выборах мэра. Допустим, мы хотим определить точность, с которой рейтинг политика по результатам опроса некоторого числа горожан отклоняется от заранее определенного теоретического значения. Применив теорему Бернулли, мы узнаем, сколько человек нам нужно опросить. Полученные результаты оказались не столь применимы на практике, как мы рас- считывали: Бернулли выполнял многие вычисления приближенно, и рассматривае- мое нами число опрошенных оказалось слишком велико. Также следует отметить, что мы говорим о результатах, полученных в конце XVII века, с помощью доступ- ных тогда инструментов. На результаты влияет и заданная нами точность: Бернулли всегда использовал величину, которую он называл «моральной уверенностью», оз- начавшую точность в 99,9 %. Закон больших чисел в современной формулировке позволяет более точно оце- нить число необходимых экспериментов. Но если мы установим избыточное значе- ние точности, например 99,9999 %, и относительно малое отклонение от ожидаемо- го значения, то потребуется опросить больше людей, чем проживает во всем городе! Таким образом, не следует использовать ни слишком малое значение ошибки, ни из- лишне высокую точность. Якоб Бернулли умер в 50 лет, так и не закончив рукопись, где приводилась его теорема. Редакторы обратились к его брату Иоганну с просьбой закончить работу, однако получили отказ и от него, и от Николая Бернулли, племянника Иоганна. Рукопись оставалась незаконченной восемь лет и наконец была опубликована в 1713 году под названием «Искусство предположений». Даже сегодня этот труд представляет немалый интерес. Бернулли показал, как с помощью вычислений мож- но расширить наши знания о вероятностях. 118
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ. JACOBI BERNOULLI, ProfclE Balil. & utriulquc So-iet. Reg. Saentiar. Gail. & Prutf SodaL Matmkmatici CtumifMi, ARS CONJECTANDI, CPUS POSTHUMVM- TRACTATUS DE SERIEBUS INFINITIS, Et£ * uro* л Gtlbcc fcripta DE L V I) О P I L J£ KETI С U L Д IIS. В A S I L E IB., Impenfi» THURN1SIORUM, Ftatnun. els bee xiii. Обложка «Искусства предположений» — незаконченной работы Якоба Бернулли. Интерес, глубина и красота задачи, которую предложил и решил Бернулли, так велики, что любая последовательность экспериментов, которые повторяются неза- висимо друг от друга в неизменных условиях и имеют два возможных исхода (на- пример, эксперимент с извлечением белых и черных шаров из урны), описывается так называемой формулой Бернулли. Даже самое плохое когда-нибудь заканчивается. Или нет? Закон больших чисел гласит, что если мы наблюдаем событие, вероятность которого равна р, то частота, с которой наблюдается это событие, будет приближаться к р с ростом числа наблюдений. Получается, что если по результатам ряда испытаний наблюдаемая частота заметно ниже или выше прогнозного значения, то в какой-то момент несколько испытаний подряд закончатся так, что наблюдаемая частота при- близится к теоретической? Если мы участвуем в игре, вероятность выигрыша в ко- торой близка к 1/2, и мы проиграли много партий, то непременно должна будет на- чаться светлая полоса, и доля выигранных партий приблизится к вероятности выи- грыша? Представьте себе игру в казино, в которой участвуют два игрока: банк и вы. Вы раз за разом проигрываете. Если за игрой наблюдает кто-то, знакомый с математи- кой, кажется разумным, что он будет ставить на наш выигрыш, ведь вы уже прои- грали много раз. Но он решает не делать ставку. Логично ли его поведение? Да. 119
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ. Закон больших чисел не утверждает, что число случаев, в которых наблюдается со- бытие, будет выравниваться при малом числе испытаний — эксперимент требуется повторить множество раз. Никто не может утверждать, что за полосой поражений последует полоса побед или наоборот. Закон больших чисел выполняется, когда на- блюдаемая частота события очень близка к пределу последовательности частот, но нет причины, чтобы этот закон выполнялся для произвольного конечного числа наблюдений. Другими словами, случайность не имеет памяти, и это нетрудно дока- зать. Пусть 40 человек бросят монету по 50 раз и запишут результаты. Ни у одного из них результаты не будут распределены равномерно и ни у кого не будет наблю- даться уравновешивающих последовательностей. Однако если мы рассмотрим все 2 тысячи результатов в совокупности, частота выпадения решки (или орла) будет близка к 1 /2. Вы, возможно, сами видели, как кто-то играет в автомат, где нужно вытащить игрушку, и после нескольких попыток он все же выигрывает главный приз. Проти- воречит ли это описанному выше? Игрок рискнул проиграть несколько раз, так как надеялся, что затем к нему придет удача. Возможно, вы видели, что перед этим игроком на автомате играли другие и неизменно проигрывали. В отличие от наблю- дателя из предыдущего примера с казино, этот игрок решил попытать счастья, когда посчитал, что вот-вот выпадет главный приз. В подобных играх результат является случайным, но по закону автоматы должны возвращать в виде выигрышей опреде- ленную сумму (например, 70%) в длительной серии игр (например, из 40 тысяч игр). В действительности автоматы не запрограммированы так, что большой приз выпадает в конце серии игр — вместо этого выигрыши распределяются равномерно в соответствии с требованиями законодательства. По прошествии определенного числа игр (которое может меняться) выпадает главный приз. Если мы прибавим к этому тот факт, что все результаты контролируются программой и не являются полностью случайными, то станет понятно, почему многие предпочитают наблюдать за игроками, но не играют сами. Несколько слов о статистике Теперь представим, что мы повторяем эксперимент с целью увидеть событие, веро- ятность которого нам неизвестна. Мы повторили эксперимент много раз и увидели, что нужное нам событие произошло. Будет ли относительная частота его наблюде- ний адекватной оценкой неизвестной нам вероятности? Даже если, как нам кажется, вероятность события известна априори, и мы провели эксперимент много раз, мы 120
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» можем изменить известную нам теоретическую вероятность с учетом относительной частоты наблюдений выбранного события. Сбор информации в ходе экспериментов и определение на ее основе вероятности события и других свойств эксперимента изучает статистика. В теории вероятностей используются дедуктивные рассуждения, в статистике — индуктивные. В теории вероятностей некая вероятностная модель принимается в качестве истинной, и на ее основе делаются выводы о результатах эксперимента. В статистике также может предлагаться модель эксперимента, но ее точные характеристики обычно неизвест- ны. Поэтому задача статистики — наблюдение результатов и определение харак- теристик эксперимента (например, вероятности заданного события) на их основе. В обоих случаях результаты определяются с некоторой погрешностью, измери- мой как методами теории вероятностей, так и методами статистики. Главную роль при этом играет закон больших чисел и другие теоремы, в частности центральная предельная теорема, о которой мы поговорим далее. В примере с ящиком Бернулли, зная соотношение шаров, с помощью методов теории вероятностей мы можем определить вероятность (или интервал, в котором она находится) того, что после выбора п шаров с возвращениями доля белых шаров будет сколь угодно близкой к 3/5. Мы также можем определить, сколько шаров по- требуется извлечь, чтобы вероятность того, что отклонение относительной частоты от 3/5 находится в определенных пределах (сколь бы малы они ни были), сколь угодно близка к 1. Но может случиться так, что нам будет известно лишь то, что в ящике находятся белые и черные шары, но мы не знаем ни их количества, ни процентного соотноше- ния. Мы начнем доставать шары из ящика, записывать их цвет и возвращать обрат- но в ящик. Определив относительную частоту белых и черных шаров по результатам наблюдений, мы сможем установить их соотношение с некоторой точностью. Вер- нее, мы сможем узнать вероятность того, что это соотношение лежит в тех или иных пределах. В этом решении используются методы статистики. Эти же методы лежат в основе статистических опросов. Чтобы узнать, какой процент избирателей готов отдать голоса за кандидата на выборах мэра, мы опросим множество людей (извлечем шары из ящика), зафиксируем их ответы (цвет шаров) и определим доверительный интервал (вероятность), на котором будет находиться процент голосов (процент белых шаров), отданных этому кандидату, с определен- ной степенью точности. Это удивительно, но при уровне вероятности, равном 0,955, можно предсказать результаты будущих выборов с погрешностью менее 3%, при этом потребуется опросить всего 1 тысячу человек. Если мы опросим всего 900 че- 121
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» ловек, ошибка возрастет до 3,3 %. Приближенно определить погрешность резуль- татов опроса для упомянутого уровня надежности можно по следующей формуле: 1 —=, где п — число опрошенных. Кривая Гаусса и нормальность Сэр Фрэнсис Гальтон (1822—1911) говорил: «Чем больше число и чем больше ка- жущийся хаос, тем совершеннее будет наблюдаемый в нем порядок. В этом заклю- чена высшая несправедливость: всякий раз, когда мы формируем большую выборку хаотических элементов и упорядочиваем их по размеру, возникает неожиданная и удивительная закономерность, скрытая среди них». Бернулли стремился доказать, что вероятность того, что отклонение относитель- ной частоты от вероятности может быть сколь угодно малым, стремится к единице. Однако он никогда не намеревался точно оценить эту вероятность — это позволяют сделать закон нормального распределения и центральная предельная теорема. Нормальная кривая Абрахам де Муавр (1667—1754) предложил вычислить сумму членов бинома Нью- тона (а + Ь)п для очень большого натурального п. Он связал биномиальные коэф- фициенты с вероятностью события, обозначив через п число повторений экспери- мента, в результате которого наблюдается интересующее нас событие. Сначала он рассмотрел случай (1 + 1)п, соответствующий эксперименту со всего двумя возмож- ными результатами, вероятность которых одинакова. Де Муавр хотел вычислить вероятность того, что если мы повторим эксперимент п раз, то интересующее нас событие будет наблюдаться примерно п/2 раз. Он показал, что относительно точ- ную оценку этой вероятности можно получить с помощью интеграла Этот интеграл описывает закон, известый сегодня как закон нормального распреде- ления. Распределение Гаусса, или нормальное распределение, — это распределение ве- роятности, определяемое следующей функцией плотности (это непрерывный экви- валент функции вероятности для дискретных переменных): 122
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ' 1 1 (*-юд /(*) =-----г=е 2 °2 » Ол/2 Л где |1 и (У2 — среднее значение и стандартное отклонение. График этой функции, который иногда называют колоколом Гаусса, выглядит так. Лаплас уточнил результат де Муавра, доказав: пусть дан эксперимент, в кото- ром может произойти событие Е с вероятностью р или противоположное ему (с ве- роятностью 1 — р). При повторении эксперимента п раз в неизменных условиях со- бытие Е произошло т раз. Вероятность того, что разница между т/п и р заключена между определенными значениями, а именно будет приблизительно равна 7Г о dx + Это утверждение стало первой версией теоремы, известной сегодня как цен- тральная предельная теорема. С ее помощью можно объяснить эффективность большинства методов статистики. Смысл центральной предельной теоремы таков: свойства очень большой выборки воспроизводят свойства генеральной совокупно- сти, из которой взята эта выборка, следовательно, эту генеральную совокупность можно изучить методами статистики и теории вероятностей. 123
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» Де Муавр пытался найти сумму членов тех рядов треугольника Паскаля, кото- рые располагаются в самом низу (соответствуют большим п). Сегодня подобные расчеты можно сравнительно точно и быстро выполнить с помощью карманного калькулятора или не самого мощного компьютера. Однако, например, в 200-м ряду можно увидеть числа из 59 цифр (здесь калькулятор нам уже не поможет), а воз- можности вычислительных машин XVIII века были намного скромнее, чем у со- временных. Задача, к решению которой приступил де Муавр, была очень трудной. Ввиду ограниченных возможностей вычислительных средств Бернулли и де Муавр выполняли расчеты приближенно, и результаты становились все точнее с появлени- ем новых методов и средств вычислений. Но вернемся к треугольнику Паскаля. Выберем числа, например из пятого ряда, и изобразим каждое из них на диаграмме так, что высота столбца будет пропор- Если мы построим аналогичную диаграмму для 16-го ряда, получим: 124
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» По мере того как мы будем строить подобные диаграммы для все новых рядов треугольника Паскаля, их форма будет приближаться к кривой нормального распре- деления. Оказалось, приближенные значения биномиальных коэффициентов можно найти с помощью закона нормального распределения — именно в этом заключалось открытие де Муавра. Теория ошибок измерений В разное время небосвод, планеты, звезды и кометы были объектами самого при- стального наблюдения ученых, поскольку знания о Солнечной системе (и других звездных системах) считались необходимыми для понимания нашей жизни. В XVIII веке ученые, занимавшиеся физикой, математикой и небесной механи- кой, часто сталкивались с расхождениями в результатах наблюдений. По-видимому, уже в XVI веке существовала практика выполнять измерения неизвестной величи- ны несколько раз в одних и тех же (или максимально приближенных друг к другу) условиях, чтобы получить как можно более достоверное значение. По результатам нескольких измерений требовалось определить истинное значение измеренной вели- чины. В качестве «наилучшего» значения можно было взять среднее арифметиче- ское, однако в XVIII веке существовал и другой подход, представители которого считали истинным результат измерений, проведенных «с особой тщательностью». Разногласия были устранены лишь тогда, когда в качестве адекватной модели, опи- сывающей ошибки измерения, стало использоваться нормальное распределение. Закон нормального распределения начал применяться особенно широко, ког- да Карл Фридрих Гаусс (1777—1855) счел, что он адекватно описывает ошибки, возникающие при использовании метода наименьших квадратов, разработанного для коррекции ошибок при астрономических наблюдениях. Заключался этот метод в следующем. Допустим, нам необходимо определить значение некоторого параме- тра, который зависит от ряда величин, не подверженных ошибкам. Мы измеряем значения этого параметра (в ходе измерений возникают ошибки) и пытаемся найти функцию, которая точнее всего описывает эти значения так, чтобы сумма квадратов отклонений между значениями этой функции и результатами наблюдений была наи- меньшей (квадраты используются для того, чтобы учитывать отклонения в боль- шую и меньшую сторону одинаковым образом). Предположив, что ошибки измерений подчиняются закону нормального распре- деления, Гаусс доказал, что при использовании метода наименьших квадратов ошиб- ки будут наименьшими для той функции, для которой результаты наблюдений будут 125
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ' наиболее вероятными или правдоподобными. В итоге нормальное распределение стало играть важную роль при изучении ошибок, а метод наименьших квадратов стал применяться в астрономии и геодезии. Было показано, что результаты астроно- мических наблюдений согласуются с законом нормального распределения. Гипотеза об элементарных ошибках Еще одно доказательство того, что ошибки измерений можно описать с помощью закона нормального распределения, пришло из теории элементарных ошибок. За- ключается оно в том, что каждая ошибка, возникающая в результате измерений или наблюдений параметра, является суммой большого числа ошибок, вызванных раз- личными независимыми причинами, при этом каждая из этих ошибок очень мала по сравнению с их суммой. С помощью этого принципа было доказано, что распре- деление общей ошибки подчиняется нормальному закону. Это утверждение извест- но как центральная предельная теорема. Принцип элементарных ошибок начал повсеместно использоваться в XIX веке. Немецкий математик Фридрих Вильгельм Бессель (1784—1846) применил ме- тод наименьших квадратов при решении множества задач и привел эмпирические результаты, подтверждающие, что ошибки измерений подчиняются нормальному закону, как и предполагал Гаусс. Бессель ввел следующее условие: «Ошибка на- блюдения есть сумма большого числа элементарных ошибок, обусловленных раз- личными причинами, не зависящими друг от друга. Ни одна элементарная ошибка существенно не превосходит остальные, а положительные и отрицательные ошибки равной величины возникают с одинаковой частотой. Кроме того, законы, описыва- ющие элементарные ошибки, могут отличаться». Гипотеза Бесселя содержит два важных момента: во-первых, ни одна ошибка не выделяется среди остальных, во-вторых, положительные и отрицательные ошиб- ки распределяются симметрично. Когда преподаватель хочет оценить работы учеников, он присваивает им число- вые оценки от 0 до 10. Но способен ли он на самом деле объяснить разницу между оценками в 8,8 и 8,9 балла? Рискнем предположить, что нет. При выставлении оценок он может совершить ошибку. Пятая и сороковая работа будут воспринимать- ся по-разному: у преподавателя накапливается усталость, ученики по-разному из- лагают свои мысли и время, выделенное на оценку каждой работы, может суще- ственно отличаться. И все эти причины, влияющие на итоговую оценку, — источни- ки элементарных ошибок! Можно предположить, что числовая оценка варьируется 126
ПРЕИМУЩЕСТВА -НОРМАЛЬНОСТИ» в результате накопления причин ошибок, но это вовсе не означает, что оценка будет несправедливой. Возможно, именно по этой причине считается, что преподаватели ставят оценки или корректируют их в соответствии с законом нормального распре- деления. Центральная предельная теорема Центральная предельная теорема (ЦПТ) гласит, что если некий параметр обуслов- лен множеством факторов (подтвержденных ошибками), которые воздействуют на результат независимо друг от друга, при этом ни один фактор не выделяется в об- щей сумме, то общая сумма этих факторов подчиняется нормальному закону вне зависимости от того, какой закон описывает каждый из факторов в отдельности. Если рассмотреть пример с монетой, подброшенной много раз, то согласно ЦПТ доля решек будет приближаться к 50 % по мере увеличения числа бросков, а веро- ятность того, что разница между фактической и теоретической долей будет лежать на определенном интервале, можно определить с помощью закона нормального рас- пределения. Например, если мы подбросим монету 100 раз, вероятность того, что доля решек заключена в интервале между 48 и 52 %, будет равна 0,3108. Если мы подбросим монету 400 раз, то эта вероятность будет составлять 0,5762, если же мы подбросим монету 5 тысяч раз, она возрастет до 0,9958 — иными словами, мы смо- жем с очень большой долей уверенности утверждать, что доля решек будет лежать на указанном интервале. Приведенные вероятности были определены с помощью закона нормального распределения. Еще один пример. Изготовитель энергетических батончиков указывает на упа- ковке, что вес батончика равен 60 граммов. В каких-то случаях реальный вес будет меньше заявленного, в каких-то — больше, однако он будет подчиняться нормаль- ному закону. Разумно предположить, что на упаковке указан средний вес, а с по- мощью закона нормального распределения мы сможем найти вероятность того, что вес батончика лежит в определенных пределах. Два приведенных примера позволяют выделить два аспекта, которые побудили ученых начать исследования, приведшие к открытию ЦПТ: это расчет вероятности того, что средняя ошибка наблюдения будет лежать в определенных пределах (исто- рически эта задача интересовала астрономов и геодезистов), а также формулировка гипотезы об элементарных ошибках как основного принципа, согласно которому ошибки, возникающие в процессе измерения, подчиняются нормальному закону. 127
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» В упрощенном виде математическая формулировка ЦПТ звучит так: «Пусть Хр Х2, ...— случайные величины (результаты измерений), которые не зависят друг от друга и подчиняются одному и тому же закону распределения. Общее среднее значение этих величин конечно и равно т, среднее значение их квадратов также ко- нечно. Вероятность того, что нормализованная сумма Xt + Х2 + ... + Хп заключена между значениями а и b при неограниченном росте и, будет описываться кривой нормального распределения». Точная математическая формулировка этой теоремы выглядит так: НтРт а < где (У2 = Е (X2) — Ц2 называется дисперсией. ЦПТ можно перефразировать, указав, что рассматриваемые переменные под- чиняются нормальному закону, но важно отметить, что теорема выполняется неза- висимо от того, какому закону распределения подчиняются отдельные переменные. В некотором смысле это означает, что мы не можем спрогнозировать поведение от- дельных переменных или людей, однако способны предсказать их поведение в сред- нем по генеральной совокупности. ЦПТ до сих пор является наиболее важной теоремой, касающейся результатов наблюдений и их связи с физическим миром. Аналогичные идеи были применены для изучения различных социальных параметров, и, к удивлению многих, было по- казано, что во многих случаях фактические параметры соответствуют прогнозным значениям, полученным с помощью ЦПТ. Доска Гальюна Доска Гальтона — это устройство, позволяющее экспериментально продемонстри- ровать нормальный закон распределения и центральную предельную теорему. Она представляет собой вертикальную доску, в которую вбиты колышки, образующие треугольник Паскаля. Сверху в ящик через воронку бросают шары. Под воронкой расположен один колышек, под ним — еще два (один — справа, другой — слева) и т. д. 128
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» Схематичное изображение доски Гальтона. Когда шарик падает сверху вниз, рано или поздно он ударяется об один из ко- лышков и падает влево или вправо от него. В конце концов все шарики падают в секции, расположенные под последним рядом колышков. Шарики распределяют- ся по столбикам в виде кривой нормального распределения. Этот процесс трактуется так: изначально шарик обозначает ошибку, которую мы совершаем при измерении параметра. Указанная ошибка измерения (или случайная величина) может принимать всего два значения (лево и право, больше и меньше) с равной вероятностью. Затем, когда шарик падает в следующий ряд, возникает 129
ПРЕИМУЩЕСТВА «НОРМАЛЬНОСТИ» новая ошибка, которая прибавляется к предыдущей. Если мы представим падение шарика как процесс накопления ошибок, то итоговый результат (номер секции, в ко- торую упадет шарик) будет представлять собой сумму ошибок, число которых бу- дет равно числу рядов на доске Гальтона. Если мы наложим на доску треугольник Паскаля, то числа треугольника укажут, сколько путей ведет к каждому колышку. 130
Глава 7 Вероятность в обществе Таблицы смертности Таблицы смертности — это статистические таблицы, позволяющие изучить число смертей в различных группах в заданный период времени. Чаще всего они применя- ются в страховании. Первые подобные таблицы составил Джон Граунт, который вместе с Уильямом Петти во второй половине XVII века провел статистические ис- следования населения, став основоположником современной демографии. ДЖОН ГРАУНТ (1620-1674) Джон Граунт был владельцем галантерейного магазина, который приносил достаточный доход, и Граунт мог посвя- тить себя столь далеким от торговли занятиям, как анализ населения Лондона. С XVII века все рождения и смерти (а также возраст умершего и предположительная при- чина смерти) фиксировались в так называемых списках умерших в многочисленных церковных приходах Лондона, благодаря чему власти могли отслеживать распростране- ние эпидемий, опустошавших город. С 1603 года, когда разразилась одна из крупнейших эпидемий чумы, записи умерших стали вестись еженедельно. Граунт изучил со- бранные данные, представил информацию в виде таблиц, которые сегодня называются таблицами смертности, и проанализировал ее: например, в городах, в отличие от сельской местности, число умерших превосходило число родившихся. Так начались первые демографические исследования. В 1662 году была опубликована книга Граунта «Естественные и политические наблюдения над списками умерших» (англ. Natural and Political Observations Made upon the Bills of Mortality), которая вызвала большой интерес английских читателей, а ее автор был избран членом Королевского общества. 131
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Чтобы изучить уровень смертности, Грау нт сформировал выборку из 100 чело- век и показал, как их численность постепенно уменьшалась с течением времени. Момент времени Число доживающих Зачатие 100 К концу шестого года 64 К концу 16-го года 40 К концу 26-го года 25 К концу 36-го года 16 К концу 46-го года 10 К концу 56-го года 6 К концу 66-го года 3 К концу 76-го года 1 К концу 86-го года 0 Как мы видим, детская смертность в течение первых шести лет жизни в Лон- доне XVII века составляла 36 %, и лишь для 1 % населения продолжительность жизни превышала 76 лет. Единственные существенные изменения, внесенные в современные таблицы смертности, заключаются в том, что анализ выборки начинается в момент рожде- ния, а не в момент зачатия. Кроме того, сейчас используются выборки большего размера, а в таблицах приводится более подробная информация. Подобные таблицы можно использовать в совершенно разных ситуациях и для анализа разных выборок. Основная цель их составления — изучение смертности, или, если говорить в более положительном ключе, средней продолжительности предстоящей жизни или ожи- даемой продолжительности жизни населения. Таблицы смертности населения составляются для целых стран или отдельных групп, выделенных по географическим, этнографическим и административным признакам. Методология составления таблиц смертности изложена в протоколах Human Mortality Database (HMD). Если изначально основным параметром при составлении таблиц была продол- жительность жизни, то теперь учитываются различные биометрические показатели, которые позволяют изучать характеристики населения, связанные с продолжитель- ностью жизни отдельных людей. Все эти показатели рассчитываются для каждого из возрастов, приведенных в таблице. 132
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Ожидаемая продолжительность жизни, EV(x) Ожидаемая продолжительность жизни указывает среднее число лет предстоящей жизни человека начиная с данного возраста х при том, что общие условия жизни населения останутся неизменными. EV рассчитывается как среднее на основе анали- за гипотетической группы людей, отобранных из общего населения страны. Данные о смертности ежегодно обновляются, что повышает достоверность результатов. Вероятность смерти, q(x) В таблицах смертности обычно приводится ожидаемое число умерших на 1 тысячу жителей, то есть вероятность смерти, умноженная на 1000. По этой причине в та- блицах указывается чистая вероятность, также называемая риском смертности. Теоретическое число смертей, d(x) Теоретическое число умерших соответствует каждому возрасту, приведенному в та- блице. Число доживающих, Цх) Обозначает число людей, доживших до конкретного возраста. Среднее число лет, прожитых в последний год жизни, по достижении возраста х, т(х) Среднее число лет, прожитых по достижении возраста х, людьми, умершими в х лет. Например, если человек по достижении возраста х прожил еще шесть месяцев, то т(х) = 0,5. Стационарное население в возрасте х, РЕ(х) Стационарное население — это теоретическое население, достигшее возраста х (в отличие от L(x) — реального числа доживающих). 133
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ НЕКОТОРЫЕ ФОРМУЛЫ Среди этого множества показателей можно выделить отношения, позволяющие понять, каким образом вычисляются описанные параметры. Некоторые отношения очевидны: например, число доживших до возраста х + 1 равно числу доживших до возраста х минус теоретическое число умерших в этом возрасте: L(x+lf=L(x)-d(x). Также очевидно, что ожидаемая вероятность смерти в возрасте х равна отношению теорети- ческого числа умерших и доживших до этого возраста: q(x) = d(x)/L(x). Ожидаемая продолжительность жизни указывает среднее число лет. которое осталось про- жить человеку возраста х, принадлежащему к исходной выборке. Ее значение определяется как отношение общего времени (в годах), которое осталось прожить представителям выборки по достижении возрастах, и числа людей в выборке, доживших до возрастах. Иными словами, EV(x)=EyaxL(jO/L(x). Стационарное население рассчитывается следующим образом. Для каждого человека, до- жившего до возраста х + 1, к стационарному населению добавляется единица, для каждого из умерших в возрасте х - т(х) единиц: РЕ(х) = L(x+1) + т(х) d(x). Таблицы смертности в Испании В качестве примера приведем фрагмент таблицы смертности в Испании в период с 1991 по 2008 год для выборки в 100 тысяч человек без учета пола. В таблице ука- заны только биометрические показатели, соответствующие первым годам жизни, интервалам в 10 лет и последним годам жизни. Риск смерти, указанный в таблицах, обозначает число умерших на тысячу человек; число доживших — количество лю- дей, доживших до указанного возраста, на выборке в 100 тысяч человек. Кроме того, в графе «среднее число лет, прожитых в последний год жизни» для людей в возрасте 100 лет и более указано среднее число лет, прожитых по достижении 100 лет. Сравним данные за 2008 и 1991 год. 134
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Год 2008 Оба пола Ожидаемая продолжи- тельность предстоящей жизни Риск смерти Теоретическое число смертей Число доживших Среднее число лет, прожитых в последний год жизни Стационарное население Возраст ЕУ(х) <7(х) ад Цх) гад рад 0 81,241026 3,465529 346,552939 100 000,000000 0,137237 99 701,007085 1 80,523071 0,304421 30,336627 99 653,447061 0,440764 99 636,481736 2 79,547457 0,145453 14,490482 99 623,110434 0,513622 99 616,062577 3 78,558955 0,129156 12,865094 99 608,619953 0,562170 99 602,987224 10 71,617435 0.074764 7,441380 99 531.332011 0.422968 99 527.038100 20 61,757984 0.382588 37,997440 99 316,952351 0,517152 99 298,605348 30 51,980293 0,447539 44,274141 98 928,107308 0,494027 98 905,705789 40 42,290481 1,154064 113,408522 98 268,813976 0,493815 98 211,408302 50 32,971282 3,121249 301,106291 96 469,799099 0,490568 96 316,406013 60 24,170848 6,846135 632,746012 92 423,825316 0.500213 92 107,586949 64 20,821734 8,686309 779,849021 89 779,097834 0,508596 89 395,876772 65 19,999726 9,334626 830,774669 88 999,248813 0,490080 88 575,620021 66 19.183557 8,982544 791.977173 88 168,474144 0,503076 87 774,921405 70 15,970797 14,674447 1236,837873 84 285,144687 0,519073 83 690,315864 80 9,037833 46,184531 2996,543216 64 881,966822 0,502567 63 391,386179 90 4,375735 148,716217 3998,115689 26 884,194463 0,492627 24 855,657500 100 2,004780 1000,000000 2019.430719 2019,430719 2,004780 4048,513560 Год 1991 Оба пола Ожидаемая продолжитель- ность предсто- ящей жизни Риск смерти Теоретическое число смертей Число доживших Среднее число лет, прожитых в последний год жизни Стационарное население Возраст EV(x) QW ад ад т(х) рад 0 77.081728 7,203662 720,366150 100 000,000000 0,143286 99 382,85 1 76,639988 0,661279 65,651531 99 279,633850 0,456575 99 243,96 2 75,690400 0,402539 39,937448 99 213,982319 0,480805 99 193,25 3 74,720687 0,298234 29,577085 99 174,044870 0,471074 99 158,40 10 67,832377 0,221059 21,889151 99 019,491510 0,457712 99 007,62 60 21,561757 8,564080 759,484760 88 682,590420 0,506036 88 307,43 65 17,590282 13,629036 1146,193043 84 099,350342 0,493264 83 518,53 70 13.907275 22,260000 1720,168525 77 276.213859 0.50473 76 424,27 80 7,676978 66,739361 3547,145111 53 149,221627 0,504951 51 393,21 100 2,706079 1000,000000 822,631577 822,631577 2,706079 2226,11 135
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Сравнивая таблицы для 1991 и 2008 годов, увидим, что значительно снизились показатели детской смертности — более чем на 50% (в!991 году на каждую тыся- чу новорожденных умерших приходилось 7,2, в 2008 году — 3,46). При анализе первых нескольких лет жизни наблюдается аналогичная ситуация. Снижение дет- ской смертности оказало большое влияние на ожидаемую продолжительность жизни, которая возросла с 77,08 года для родившихся в 1991 году до 81,24 года в 2008 году — прирост составил свыше четырех лет! Если мы рассмотрим ожидае- мую продолжительность предстоящей жизни для достигших возраста 65 лет (офи- циального возраста выхода на пенсию в Испании в 2010 году), то увидим, что она возросла с 17,59 года в 1991 году почти до 20 лет в 2008 году, то есть прирост со- ставил почти 2,5 года — заметно меньше, чем прирост ожидаемой продолжитель- ности жизни для новорожденных. Более подробный анализ каждой возрастной группы играет основную роль в де- мографических исследованиях и позволяет оценить множество величин, начиная от суммарных пенсионных выплат и заканчивая возможными расходами на здраво- охранение. Для изучения этих и других показателей составляются специальные та- блицы, например таблицы смертности для каждого пола в отдельности или для на- селения, не имеющего инвалидности. Ожидаемая продолжительность жизни учиты- вается при расчете индексов благополучия и развития человеческого потенциала, позволяющих сравнить уровень жизни в разных странах. Но в этом разделе мы не планируем подробно осветить варианты применения таблиц смертности и пред- лагаем читателю самостоятельно ознакомиться с публикациями на эту тему и сайта- ми соответствующих организаций. Страхование Одним из наиболее выгодных видов бизнеса сегодня является страхование. Страхо- вые компании предлагают услуги по страхованию жизни, автомобиля, здоровья, имущества и т. д. В основе всех видов страхования лежит ряд математических рас- четов, в которых учитываются как риск (вероятность того, что страховой компании нужно будет возместить ущерб), так и время, в течение которого мы можем полу- чить возмещение ущерба. Очень востребовано страхование жизни, при котором в случае смерти застрахо- ванного лица его семья получает некоторую сумму денег. Страховые платежи и сум- ма, выплачиваемая в случае смерти, определяются с помощью ряда математических и статистических расчетов, цель которых — предсказать, сколько времени прожи- 136
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ вет застрахованный. И хотя продолжительность жизни отдельного человека пред- сказать нельзя, на больших группах людей наблюдается ряд закономерностей, кото- рые позволяют с помощью методов теории вероятностей и статистики оценить сред- нюю продолжительность жизни людей в определенной группе. Страховой бизнес древнее, чем мы можем себе представить: до наших дней дош- ли документальные свидетельства о страховании кораблей и грузов, отправленных морем, в Древней Греции и Риме. В Средние века паломники, направлявшиеся в Святую землю, могли заключить договор «страхования от похищения»: они вноси- ли определенную сумму, и если во время путешествия их похищали и требовали вы- куп, он выплачивался страхователем. Но страховок на случай смерти не существо- вало — сама мысль о подобном считалась кощунственной, так как жизнь и смерть людей подчинялись воле Бога и их страхование шло вразрез с божьим промыслом. В эпоху Возрождения нормы морали ослабли, что способствовало росту торгов- ли и, как следствие, развитию страхования жизни. Однако в ряде стран страхование жизни по-прежнему было запрещено, и если негласных норм было недостаточно, вводились прямые запреты: в Испании страхование жизни было запрещено в 1570 году, в Голландии — в 1598-м. А сто лет спустя расчеты вероятности смерти и ожидаемой продолжительности жизни применялись повсеместно и уже не вызы- вали протестов. Даже те, кто возражал против подобных расчетов, заявляли, будто статистические закономерности, наблюдаемые при изучении населения, также не что иное, как проявление божественного порядка. Расчет страховых выплат подобен азартной игре: компании определяют вероят- ность всех возможных рисков, страхование от которых они предлагают, умножают вероятность риска (она оценивается на основе данных за последние годы) на сред- ний ущерб и складывают все возможные риски. К этой величине добавляются ад- министративные расходы и желаемая прибыль. Если продолжить аналогию с азарт- ными играми, то игроками будут страхователи, которые играют против «казино» — страховой компании. Но в этом случае выигрыш не представляет никакого интереса: он подразумевает несчастный случай. Например, если мы разделим риски, связанные со страхованием автомобиля, на три категории (см. таблицу ниже), а страховая компания будет располагать ин- формацией, представленной в таблице, математическое ожидание (МО) ущерба в ДТП будет равно: МО = 0,003 • 7000 + 0,05 • 3000 + 0,3 • 500 = 21 + 150 + 150 = 321 евро. 137
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Происшествие Вероятность Стоимость восстановления Автомобиль не подлежит восстановлению 3/1 000 = 0,003 7000 евро Серьезный ущерб 5/100 = 0,05 3000 евро Незначительный ущерб 3/10 = 0,3 500 евро Как следствие, стоимость Р страхового полиса равна: Р = МО + административные расходы + желаемая прибыль. Страхование можно рассматривать как игру, которая почти всегда невыгодна для страхователя (если только не происходит страхового случая), однако за относитель- но небольшую сумму он избегает риска: при аварии ему не придется выложить круп- ную сумму за ремонт автомобиля или покупку нового. При заключении страхового договора мы вносим сравнительно небольшую сумму каждый год (или единовремен- но) и ожидаем, что если с нами произойдет несчастный случай (что маловероятно, но возможно), то благодаря страховому возмещению мы сможем справиться с ситу- ацией. В общем случае страхование можно рассматривать как лотерею, игру, ставки в которой, возможно, оправданны. Пенсионный возраст и пенсии Одно из самых важных достижений современного общества с системой социальной защиты — это забота о пожилых людях, которым по достижении определенного возраста выплачиваются пенсии. В большинстве стран Европы регулярно возника- ют споры о том, следует ли повысить пенсионный возраст, то есть должны ли люди работать дольше, чтобы получить право на пенсию. И в этих спорах неизменно учи- тывается продолжительность жизни. Чем больше живет человек — тем дольше он будет получать пенсию, если не умрет, не достигнув пенсионного возраста. Как и в случае со страхованием жизни, составление точных таблиц смертности и расчет ожидаемой продолжительности жизни играют главную роль при поиске ответов на подобные вопросы. Однако здесь требуются не только точные таблицы смертности, но и корректный их анализ, так как в общем случае знания одной лишь ожидаемой продолжительности жизни новорожденных недостаточно: необходимо проанализировать ожидаемую продолжительность предстоящей жизни для интере- сующего нас возраста, а также другие биометрические показатели. 138
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Другие способы применения Очевидно, существует множество других способов применения таблиц смертности. Например, в механике и инженерном деле аналогом ожидаемой продолжительности жизни служит срок полезного функционирования детали или механизма. Наличие точных таблиц смертности играет важнейшую роль во многих промышленных про- цессах. Хотя может показаться, что вышеприведенный пример оказывает не слишком большое влияние на нашу повседневную жизнь, в действительности это не так. Речь идет о том, сколько времени в среднем пройдет до момента, когда нашему телевизо- ру или стиральной машине потребуется ремонт. Если немного подумать, то можно предположить, что одни производители используют «таблицы смертности», а дру- гие — нет. Это означает, что некоторые производители устанавливают гарантийные сроки на продукцию, учитывая неизвестный нам срок службы изделий. Некоторые устройства, например телевизоры, ломаются реже, однако другие, например сти- ральные машины, более подвержены износу. Не возникало ли у вас ощущения, что неполадки происходят именно тогда, когда заканчивается гарантийный срок? Такая ситуация неслучайна: компании тщательно анализируют срок службы своей продукции. Очевидно, что никакая гарантия не будет превышать ожидаемый срок службы устройства. К счастью, вероятности и статистика доступны любому, кто захочет ознакомиться с ними, поэтому государственные организации, распола- гая информацией, предоставленной экспертами, могут пресечь недобросовестную практику и установить минимальный срок гарантии для товаров, который произво- дители обязаны будут соблюдать. Вероятность и статистика в медицине Располагая результатами лабораторных анализов, врач рассматривает ряд данных, которые после обработки с использованием методов теории вероятностей и стати- стики помогают ему назначить больному лекарство. Хотя итоговое решение прини- мает врач, сделать это ему помогают сами данные, их обработка и итоговое пред- ставление. Какая-то информация может сыграть определяющую роль в принятии решения. Например, нам известно, что признаком болезни может служить выход некоторых показателей за пределы нормы. Что это означает? 139
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ В медицине нормальными показателями считаются значения, которые наблю- даются у большинства половозрастной группы, к которой относится пациент. Эти значения определяются с помощью центральной предельной теоремы и нормального закона распределения. Чтобы найти нормальные значения показателей, необходи- мо определить, каковы границы интервала, которому с определенной вероятностью принадлежит среднее значение. Эту задачу решил уже Лаплас. Интервал, которому должно принадлежать среднее значение, в современной статистике называется до- верительным интервалом. Похожую задачу решает педиатр, который сообщает родителям, что по росту и весу их ребенок входит в 85-й и 95-й перцентиль. Доверительные интервалы для разных возрастов, которые используют педиатры, определяют граничные значения веса и роста, в пределах которых находится рост и вес детей, образующих референт- ную группу. Если ребенок входит в 80-й перцентиль по росту и в 75-й — по весу, это означает, что 80 % детей того же возраста будут не превосходить его по росту, а 75 % — по весу. При этом очень важно учесть: если референтная группа, которую мы используем для определения нормального веса и роста, по своим параметрам будет заметно отклоняться от генеральной совокупности, полученные результаты будут некорректны. Именно поэтому для мальчиков и девочек всегда формируются отдельные референтные группы. Вероятность и ДНК С середины 1980-х годов анализ ДНК начал использоваться в судебных разбира- тельствах для установления отцовства, родства между людьми, а также для опреде- ления вины или невиновности подозреваемых. Суть этого анализа заключается в сравнении ДНК детей и их предполагаемых отцов либо в сравнении ДНК, взятого из образцов, найденных на месте преступле- ния, с ДНК подозреваемого или подозреваемых. Методы анализа ДНК постоянно улучшались, и сегодня он служит основным доказательством во многих судебных процессах ввиду значительного разнообразия ДНК разных людей, даже если они принадлежат к одной и той же этнической группе. Эти методы стали очень попу- лярными после использования в некоторых судебных процессах, а также после вы- хода на экраны криминальных сериалов, в частности «С. S.I.: Место преступления». Не все знают, что при анализе ДНК используются методы теории вероятностей, которые дали начало отдельной дисциплине — судебной статистике. 140
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Один из первых судебных процессов, в котором был применен анализ ДНК, прошел в Англии в 1987 году. Шестнадцатилетний юноша обвинялся в убийстве двух девушек в 1983 и 1987 годах. Некоторые улики и досье подозреваемого ука- зывали: нет никаких сомнений в том, что именно он совершил преступление. Юно- ша попросил провести анализ крови и ДНК и сравнить образцы с теми, что были обнаружены на телах жертв. Результаты анализов ошеломили всех: убийцей обеих девушек был один и тот же человек, но это не был подозреваемый. В процессах, когда необходимо определить личность преступника, обычно рас- считывается определенный параметр, позволяющий установить возможную связь обвиняемого и совершенного преступления. Эта идея очень проста, однако при ее реализации на практике возникают трудности. Основная заключается в том, чтобы найти какую-либо характеристику, которая с точностью будет определять челове- ка. Одной из таких характеристик являются отпечатки пальцев, которые позволяют с большой точностью установить личность человека. Но любой профессиональный преступник старается не оставлять отпечатков, кроме того, их легко повредить или вообще стереть. Анализ ДНК в этом смысле более выгоден, так как позволяет почти безоши- бочно установить личность человека (за исключением случаев, когда речь идет о го- мозиготных близнецах: удивительно, но их ДНК, в отличие от отпечатков пальцев, совпадает). При этом ДНК содержится в ядре любой клетки, поэтому для анализа достаточно минимального объема органического материала (это может быть волос, капля крови, частички кожи). Также ДНК очень стабильна и не подвергается изме- нениям в течение долгого времени. Единственное неудобство заключается в техни- ческих ограничениях, не позволяющих проанализировать ДНК со всей точностью: анализируются лишь некоторые генетические маркеры, и хотя цепочки ДНК прак- тически уникальны, ограниченное число маркеров у разных людей иногда может полностью совпадать. Мы не будем говорить о том, как именно анализируется ДНК, но расскажем, ка- ким образом теория вероятностей помогает определить виновность подозреваемого. Рассмотрим упрощенный и не вполне реалистичный пример, который, однако, будет вполне показательным. Было совершено преступление, полиция собрала образцы ДНК и задержала подозреваемого, у которого также были взяты образцы ДНК на анализ. Допустим, что каждый образец ДНК представляет собой простой тип данных. Хотя в реальном суде чаще всего рассматривается несколько возможных исходов, мы ограничимся двумя вариантами: подозреваемый виновен (В) или неви- 141
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ новен (Н). Суд примет окончательное решение по результатам анализа ДНК. Сле- довательно, цель анализа — выбрать одну из двух следующих гипотез. 1. Оба образца принадлежат одному человеку (В). 2. Образцы принадлежат разным людям (Н). Обозначим через Ev ситуацию, в которой образец ДНК, взятый на месте пре- ступления, совпадает с образцом ДНК подозреваемого, через S — остальные си- туации. Нужно использовать теорему Байеса, согласно которой для двух данных собы- тий А и В и условной вероятности события А при условии наступления события В Р (А | В) и при условии, что Р (В) Ф 0, справедливо равенство: Р(Л|В) = (Р(В|Л)Р(Л))/Р(В). Использовав условные вероятности и теорему Байеса, получим отношение веро- ятностей того, что подсудимый виновен, и того, что он невиновен: P(B\Ev,S) P(Ev\b,S) p(b|s) P(H\Ev,S) ~ P(Ev\h,S) P(H|S) ’ Из этого выражения следует, что нужно определить две основные вероятности: вероятность события Ev в случае, если подозреваемый виновен, и вероятность на- ступления этого события в случае, если он невиновен. Здесь недостаточно рассмо- треть только вероятность наступления этого события в случае, когда подозреваемый невиновен, и на основании малого значения этой вероятности сделать вывод о винов- ности подозреваемого. Также следует принять во внимание вероятность наступле- ния этого события в случае, если подозреваемый виновен. Следует отметить, что эти две вероятности не соответствуют противоположным событиям, и обе они могут быть очень малыми. Подобные тонкости рассматривают адвокаты и прокуроры, и неверное толкова- ние этих понятий теории вероятности может привести к тому, что невиновный ока- жется в тюрьме, а виновный — на свободе. Приемы, которые используют адвока- ты, имеют мало общего с теорией вероятности и касаются трактовки вероятностей в пользу той или иной стороны. Выражение, приведенное выше, также показывает зависимость вероятности того, что подсудимый виновен, от результатов другой про- цедуры (S), которую не следует недооценивать. 142
ВЕРОЯТНОСТЬ В ОБЩЕСТВЕ Определение вероятностей наступления события Ev в случае, когда подозрева- емый виновен или невиновен, является одним из источников противоречий в судеб- ных процессах, в которых используется анализ ДНК. Методы анализа позволяют максимально точно установить вину подсудимого: так, используются референтные группы, разбитые по национальности и полу. Однако во многих случаях эту задачу решить не удается, так как вся информация о том, как именно были сформированы базы данных и проведены вычисления, обычно недоступна. Кроме того, при анали- зе ДНК, как правило, рассматривается множество маркеров, поэтому вероятность того, что все они присутствуют в образце, равна произведению отдельных вероятно- стей, если мы будем считать, что все эти маркеры присутствуют в ДНК независимо друг от друга (этот вопрос является предметом для дискуссий). Анализ ДНК также играет огромную роль при установлении личностей жертв военных конфликтов, катастроф и несчастных случаев. 143

Эпилог Можем ли мы сказать, что случайность полностью укрощена? Мы подошли к концу нашего рассказа об укрощении случайности. Если в древности люди объясняли события, которые нельзя предсказать, сверхъестественными при- чинами, то затем они перешли к анализу сложных ситуаций путем их представления в виде параметров, которые можно контролировать и тем самым понять скрытые закономерности. Как сказал индийский статистик Кальямпуди Радхакришна Рао, «случайность описывает порядок посреди беспорядка, хаос — беспорядок посреди порядка». Человечество прошло долгий и трудный путь, но по-прежнему далеко от того, чтобы достичь конечной цели. Почти все, что связано с вероятностями, не поддается нашей интуиции. Здесь мы имеем дело с логикой, где выбор вариантов шире, чем «да» или «нет», «все» или «ничего», которые в силу культурных особенностей мы понимаем лучше. Мы прекрасно осознаем, что при нажатии кнопки выключателя свет загорается, при повторном нажатии — гаснет, но если в каких-то случаях свет будет загораться, а в каких-то — нет, эта ситуация перестанет быть для нас понят- ной, и эту неопределенность потребуется оценить. Случайность тесно связана с неопределенностью, с незнанием того, что произой- дет, с неуверенностью, которая так неприятна для нас, ведь мы хотим все держать под своим контролем. Мы живем во время, когда под нашим контролем находится все больше социальных факторов, и тем сильнее нас раздражает неопределенность (погода, инфекционные заболевания, несчастные случаи), которая является неотъ- емлемой частью нашей жизни. Нам действительно было бы трудно жить, если бы слишком много событий были полностью непредсказуемы, но жить в мире, где все с точностью предопределено, скучно. К счастью, даже в нашем организованном обществе будущее — это удивительная смесь детерминированного и случайного, и поэтому, как говорил один выдающийся статистик, «пусть жизнь сложна, но она не лишена интереса». 145

Библиография ADAMS, W.J., The Life and Times of the Central Limit Theorem, Nueva York, Ameri- can Mathematical Society, 2009. BARROW, J.D., El salto del tigre. Las matematicas de la vida cotidiana, Barcelona, Critica, 2009. CORBALAN, F., Matematicas de la vida misma, Barcelona, Grab, 2007. ENGEL, A., Probabilidad у estadistica (tomos 1 у 2), Valencia, Mestral, 1988. FERMAT, P., Pascal, B., La geometria del azar (correspondencia entre ambos), edi- tion de J. Basulto у J. A. Camunez, Madrid, Nivola, 2007. HAIGH, J., Matematicas у juegos de azar, Barcelona, Tusquets, 2003. HOLLAND, B.K., What are the chances?: Voodoo Deaths, Office Gossip <fc Other Adventures in Probability, Baltimore, The Johns Hopkins University Press, 2002. MLODINOW, L., El andardel borracho. Como el azar gobierna nuestra vidas, Barcelona, Critica, 2008. RADHAKRISHNA RAO, C., Estadistica у verdad. Aprovechando el azar, Barcelona, PPU, 1994. 147

Алфавитный указатель Lotto 93,106,108 ONCE 106 Архимед 37, 116 Байеса теорема 142 Бернулли теорема 114—119 Бернулли, Якоб 46, 47—50,114—119, 121,122,124 Бессель, Фридрих Вильгельм 126 большие числа 41, 47, 52, 111—115 Бюффон, Жорж-Луи Леклерк де 49, 114 вероятность смерти 133, 134, 137 условная 95—96, 142 Вольтер 102 Гальтон, Фрэнсис 122, 128—129 Гаусс, Карл Фридрих 52, 125—126 Гаусса кривая 9, 122—125 геометрия Евклида 9 Граунт, Джон 42, 131—132 Гюйгенс, Христиан 45—47, 50 де Мере, шевалье 42—45 де Муавр, Абрахам 50, 122—125 дерево 67—72 Дидро, Дени 47 Диофант 37 ДНК 140-143 доверительный интервал 140 Евклид 35, 37 европейская рулетка 112 задачи о днях рождения 77—80 закон больших чисел 60, 61, 112, 114—116, 119-121 малых чисел 61, 116 история статистики 42 Кардано, Джероламо 38, 40—41, 44 Кено, Раймон 33 Керрич, Джон 114 Кетле, Адольф 53 «Книга перемен» 40 Колмогоров, Андрей Николаевич 52, 72-73 комбинаторика И, 12, 17, 33, 40, 45 комбинаторные конфигурации 27—33, 40 комбинаторные модели И Конан Дойл, Артур 58 кривая нормального распределения 53, 122-125,128,129 Лаплас, Пьер-Симон 50—52, 57, 63— 66, 73,123 Леонардо да Винчи 19 лотерея примитивная 106—109 испанская национальная 93 рождественская 103, 104—106 Луллий, Раймунд 40 Марков, Андрей 52 математическое ожидание 45,102-105, 109, ИЗ, 137 Монти Холл 53—54, 89 149
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Моцарт, Вольфганг Амадей 32—33 нормальное распределение 9, 50, 53, 122,123,125-129,140 нормальный закон распределения 128-129 ожидаемая продолжительность жизни 45,132-139 Паскаль, Блез 42—47, 112 Паскаля пари 46—47, 109 Паскаля треугольник 29—30, 45, 124, 125,128,130 пенсии 136, 138 первая перепись населения в Испании 42 перестановки 12, 18—20, 22, 24 с повторениями 20 покер 29 походка пьяного 80-81 правило Лапласа 51, 63, 65, 95 принцип Дирихле 15, 16 умножения вероятностей 15 пространство элементарных событий 62, 73 размещения 12, 20—26, 40 с повторениями 22—23 случайность 9-10, 37-39, 57-74, 102-103,145 события детерминированные 58 несовместные 73 противоположные 61, 73 равновероятные 62—69 случайные 52, 58, 64, 67, 73, 84 составные 62—63 сочетания 12, 23—26, 27, 40, 66 с повторениями 26 списки умерших 131 справедливая лотерея 93 жеребьевка 93, 84 статистика 42, 50, 52, 53, 67, 114, 120-123,137,139-140 статистическая закономерность 59—60, 112, 137 страхование жизни 136-137 от похищения 137 страховые премии 9 таблицы смертности 131—139 Тарталья 38—39 теорема центральная предельная 122, 123, 127-128,140 факториал 18—20, 22, 90 Фердинанд Католик 42 Ферма, Пьер де 9, 42—46 Филдинг, Генри 102 Цицерон 37 частота абсолютная 59 относительная 59-60, 72,118, 121-122 Чебышев, Пафнутий 52 эксперименты зависимые 70-72 независимые 70 составные 67—72 Эрдёш, Пол 55 150
ДЛЯ ЗАМЕТОК
ДЛЯ ЗАМЕТОК 152
ДЛЯ ЗАМЕТОК 153
Научно-популярное издание Выходит в свет отдельными томами с 2014 года Мир математики Том 24 Фернандо Корбалан, Херардо Санц Укрощение случайности. Теория вероятностей РОССИЯ Издатель, учредитель, редакция: ООО «Де Агостини», Россия Юридический адрес: Россия, 105066, г. Москва, ул. Александра Лукьянова, д. 3, стр. 1 Письма читателей по данному адресу не при- нимаются. Генеральный директор: Николаос Скилакис Главный редактор: Анастасия Жаркова Выпускающий редактор: Людмила Виноградова Финансовый директор: Наталия Василенко Коммерческий директор: Александр Якутов Менеджер по маркетингу: Михаил Ткачук Менеджер по продукту: Яна Чухиль Для заказа пропущенных книг и по всем вопро- сам, касающимся информации о коллекции, за- ходите на сайт www.deagostini.ru, по остальным вопросам обращайтесь по телефону бесплатной горячей линии в России: ® 8-800-200-02-01 Телефон горячей линии для читателей Москвы: ® 8-495-660-02-02 Адрес для писем читателей: Россия, 600001, г. Владимир, а/я 30, «Де Агостини», «Мир математики» Пожалуйста, указывайте в письмах свои кон- тактные данные для обратной связи (телефон или e-mail). Распространение: ООО «Бурда Дистрибьюшен Сервисиз» УКРАИНА Издатель и учредитель: ООО «Де Агостини Паблишинг» Украина Юридический адрес: 01032, Украина, г. Киев, ул. Саксаганского, 119 Генеральный директор: Екатерина Клименко Для заказа пропущенных книг и по всем вопро- сам, касающимся информации о коллекции, за- ходите на сайт www.deagostini.ua, по остальным вопросам обращайтесь по телефону бесплатной горячей линии в Украине: ® 0-800-500-8-40 Адрес для писем читателей: Украина, 01033, г. Киев, а/я «Де Агостини», «Мир математики» Укра'ша, 01033, м. КиТв, а/с «Де Агоспш» БЕЛАРУСЬ Импортер и дистрибьютор в РБ: ООО «Росчерк», 220037, г. Минск, ул. Авангардная, 48а, литер 8/к, тел./факс: (+375 17) 331-94-41 Телефон «горячей линии» в РБ: ® + 375 17 279-87-87 (пн-пт, 9.00-21.00) Адрес для писем читателей: Республика Беларусь, 220040, г. Минск, а/я 224, ООО «Росчерк», «Де Агостини», «Мир математики» КАЗАХСТАН Распространение: ТОО «КГП «Бурда-Алатау Пресс» Издатель оставляет за собой право увеличить реко- мендуемую розничную цену книг. Издатель остав- ляет за собой право изменять последовательность заявленных тем томов издания и их содержание. Отпечатано в соответствии с предоставленными материалами в типографии: Grafica Veneta S.p.A Via Malcanton 2 35010 Trebaseleghe (PD) Italy Подписано в печать: 14.05.2014 Дата поступления в продажу на территории России: 01.07.2014 Формат 70 х 100 / 16. Гарнитура «Academy». Печать офсетная. Бумага офсетная. Печ. л. 5. Усл. печ. л. 6,48. Тираж: 50 000 экз. © Fernando Corbaian, Gerardo Sanz, 2010 (текст) © RBA Collecionables S.A., 2011 © ООО «Де Агостини», 2014 ISBN 978-5-9774-0682-6 ISBN 978-5-9774-0719-9 (т. 24) @ Данный знак информационной про- дукции размещен в соответствии с требования- ми Федерального закона от 29 декабря 2010 г. № 436-ФЗ «О защите детей от информации, при- чиняющей вред их здоровью и развитию». Издание для взрослых, не подлежит обязатель- ному подтверждению соответствия единым требо- ваниям, установленным Техническим регламентом Таможенного союза «О безопасности продукции, предназначенной для детей и подростков» ТР ТС 007/2011 от 23 сентября 2011 г. № 797.
Укрощение случайности Теория вероятностей «Укрощение» случайности, то есть описание ее с помощью чисел и прогнозирование будущего - настоящий подвиг, плодами которого мы пользуемся уже довольно давно. Например, сегодня мы можем с достаточной точностью определить, кто победит на выборах, еще до того, как они состоятся, или оценить, сколько времени будет работать энергосберегающая лампочка. И все же до полного покорения случайности - еще очень далеко. Случайность - одно из последних белых пятен на наших математических картах, которое вызывает немало тревог в обществе, жаждущем надежности и уверенности. Ведь мы живем не в идеальном мире, а в настоящем океане неопределенности. Данная книга - своеобразный призыв изучить случайность и поразмышлять о ней. На этом пути читателей ждет немало задач, открытий и сюрпризов.