Text
                    A. H. БОРОДИН
Элементарный
КУРС
ТЕОРИИ
ВЕРОЯТНОСТЕЙ
и математической
СТАТИСТИКИ
РЕКОМЕНДОВАНО
Министерством общего и профессионального образования
Российской Федерации в качестве учебного пособия
для студентов высших учебных заведений,
обучающихся по нематематическим специальностям
&
Санкт-Петербург
1999

ББК 22.17 Б 83 Бородин А. Н. Б 83 Элементарный курс теории вероятностей и математичес- кой статистики. Серия «Учебники для вузов. Специальная ли- тература» / Оформление обложки С. Шапиро, А.Олексенко. — СПб.: Издательство «Лань», 1999. — 224 с. ISBN 5—8114—0076—4 Учебник содержит систематическое изложение основных разде- лов элементарного курса теории вероятностей и математической ста- тистики. К традиционным разделам добавлен один новый — «Проце- дура рекуррентного оценивания», ввиду особой важности этой проце- дуры для приложений. Теоретический материал сопровождается большим количеством примеров и задач из разных областей знаний. Рецензенты: доктор физ.-матем. наук А. Ю. Зайцев, академик И. А. Ибрагимов, профессор Я. Ю. Никитин. ББК 22.17 Оригинал-макет подготовлен автором в пакете Т^Х Охраняется законом РФ об авторском праве. Воспроизведение всей книги или любой ее части запрещается без письменного разрешения издателя. Любые попытки нарушения закона будут преследоваться в судебном порядке. © Издательство «Лань», 1999 © А. Н. Бородин, 1999 © Издательство «Лань», художественное оформление, 1999
ОГЛАВЛЕНИЕ Предисловие ..................................................... 5 Список обозначений............................................... б Часть 1 ТЕОРИЯ ВЕРОЯТНОСТЕЙ 1. Элементы комбинаторики....................................... 7 2. Случайные события............................................15 3. Классическое определение вероятности.........................22 4. Геометрические вероятности ..................................29 5. Условные вероятности. Независимость событий..................32 б. Общее определение вероятности................................39 7. Формула полной вероятности и формула Байеса..................52 8. Последовательные испытания (схема Бернулли) .................56 9. Предельные теоремы для схемы Бернулли........................62 10. Случайные величины и функции распределения..................69 11.. Совместные функции распределения нескольких случайных величин .... 78 12. Числовые характеристики случайных величин ..................84 13. Производящие и характеристические функции ...................97 14. Законы распределения случайных величин ....................107 15. Распределения сумм независимых случайных величин. Свертки распределений .......................................116 16. Неравенство Чебышева. Закон больших чисел .................122 17. Центральная предельная теорема ............................129
Часть 2 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 18. Случайная выборка. Эмпирическая функция распределения.....136 19. Оценки параметров распределения. Выборочные моменты.......146 20. Асимптотические свойства выборочных моментов............ 156 21. Доверительные интервалы ................................ 159 22. Неравенство Рао-Крамера ..................................165 23. Проверка статистических гипотез...........................171 24. Оценка параметров общей линейной модели (метод наименьших квадратов) ..................................178 25. Метод максимального правдоподобия ........................185 26. Процедура рекуррентного оценивания .......................191 Ответы и решения к задачам.....................................194 Таблицы........................................................214 Литература.....................................................220 Предметный указатель...........................................221
Предисловие Изложение теории вероятностей и математической ста- тистики сразу в строго формализованном виде на основе теории меры не способствует выработке у читателя пра- вильных интуитивных понятий, связанных с этими дисци- плинами. Существует своего рода вероятностное мышле- ние, которое формируется поэтапно, по мере углубления в эти своеобразные разделы математики. Появление, данно- го учебника продиктовано желанием создать краткий курс теории вероятностей и математической статистики, в кото- ром материал был бы изложен на довольно строгом уровне и в то же время был бы понятен широкому кругу читателей. Это предъявляет жесткие требования к отбору материала. В учебник включены основополагающие результаты теории Вероятностей и математической статистики, для строгого доказательства которых не требуется слишком громоздкий аналитический аппарат. Изложение сопровождается боль- шим количеством примеров и задач, которые снабжены ре- шениями. В конце каждого параграфа приводится набор задач для самостоятельного решения. Задачи подобраны так, чтобы Проиллюстрировать применение значительной части мате- риала, изложенного в параграфе. В конце учебника даны ответы, а для наиболее интересных задач дано частичное Или полное решение. Учебник предназначен, в основном, для студентов нема- тематических специальностей и тех, кто решил приобрести Начальные знания по теории вероятностей и математической Статистике. Он также может быть полезным преподавате- лям элементарного курса теории вероятностей и математи- ческой статистики для систематизации материала.
6 Список ОБОЗНАЧЕНИЙ Рп - число перестановок - число размещений С* - число сочетаний, биномиальные коэффициенты £2 - пространство элементарных событий ш А - событие дополнительное к А Р( ) - вероятность события Е(-) - математическое ожидание случайной величины D(’) - дисперсия случайной величины cov(-, •) - ковариация случайных величин Ф(ж) - функция Лапласа ф(х) - функция Гаусса - стандартное нормальное распределение £(х) - функция распределения Колмогорова Рк(а?) - функция распределения Пирсона с к степенями свободы «$*(ж) ~ функция распределения Стьюдента с к степенями свободы (ж) - индикатор множества А i/>(z) - производящая функция <f>(z} - характеристическая функция / * 0(0 ~ свертка функций f и д Хп - выборочное среднее S„ - выборочная дисперсия zp - квантиль порядка р zp - выборочная квантиль порядка р ^(к) ~ к-ая порядковая статистика 1п(0) - информационное количество Фишера - символы, определенные на стр. 62
7 Часть 1 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Теория вероятностей - это математическая наука, изуча- ющая закономерности случайных явлений. § 1. Элементы комбинаторики Комбинаторикой называется область математики, в кото- рой изучаются вопросы о том, сколько различных комбина- ций, подчиненных тем или иным условиям, можно составить из заданных объектов. Определение 1. Множество (совокупность элементов) называется занумерованным, если каждому элементу этого множества сопоставлено свое натуральное число (номер) от 1 до п. В случае, когда п является конечным, говорят, что мно- жество состоит из п элементов. Если п = оо, то множество называется счетным. Для краткости занумерованные множества также будут Называться наборами. Определение 2. Отличающиеся друг от друга поряд- ком наборы, составленные из всех элементов данного конеч- ного множества, называются перестановками этого множе- ства. Пример 1. Множество, состоящее из трех элементов {1,2,3}, имеет следующие перестановки: (1,2,3), (1,3,2), (2,3,1), (2,1,3), (3,2,1), (3,1,2). Число всех перестановок множества из п элементов обозначается Рп. Теорема 1 (о числе перестановок). Число перестановок Рп определяется по формуле Рп = п!, где п\ = 1 • 2 • 3 •... • п. Доказательство. Отведем для размещения элементов данного набора п занумерованных ячеек (мест). Первое ме- сто может занимать элемент с любым из номеров 1,2,..., п. Пусть, например, это элемент с номером 1. На остальных п — 1 местах могут стоять элементы с различными набора- ми номеров из чисел 2,3,..., и, отличающиеся друг от дру- га лишь порядком. Число возможных таких наборов равно
8 ТЕОРИЯ ВЕРОЯТНОСТЕЙ числу перестановок Pn-i- Таким образом, число различных наборов, состоящих из п элементов, у которых на первом ме- сте стоит элемент с номером 1, равно Pn~i. Случай, когда на первом месте стоит элемент с номером 1, ничем не отличает- ся от случая, когда на первом месте стоит элемент с любым другим номером. Следовательно, число различных наборов с фиксированным первым элементом равно Рп-1- Поскольку на первое место можно поместить п различных элементов с номерами от 1 до п, то число всех отличающихся друг от друга наборов множества из п элементов будет nPn-i, т. е. Рп = пРп-1. Это равенство справедливо для любого п, поэтому можно написать цепочку равенств Рп =пРп 1 = п(п - 1)Рп-2 = = п(п — 1)(п — 2)Рп_з = • • • = п(п — 1)(п — 2)... 2Pi. Остается лишь заметить, что Pi = 1. Задача 1. Сколькими различными маршрутами можно разнести корреспонденцию в 5 адресов? Решение. Занумеруем адреса цифрами от 1 до 5. Ка- ждому маршруту можно сопоставить один из наборов, со- стоящих из этих пяти цифр, например, (2,5,3,4,1). Такой на- бор означает, что сначала выбирается второй адрес, затем пятый, третий, четвертый и первый. Всего различных марш- рутов, т. е. отличающихся порядком наборов пяти цифр бу- дет 5!= 120. Задача 2. Цифры 0,1,2,3 написаны на четырех карточках. Сколько различных четырехзначных чисел можно составить из этих карточек? Решение. Число различных комбинаций из четырех цифр равно 4!. Не все эти комбинации являются четырех- значными числами, т. к. есть комбинации, начинающиеся с нуля. Таких комбинаций будет 3! и их нужно исключить. В результате число различных четырехзначных чисел равно 4! - 3! = 18. Определение 3. Упорядоченные наборы, состоящие из k различных элементов, выбранных из данных п элементов, называются размещениями из п элементов по k. Размещения могут отличаться друг от друга как элемен- тами так и порядком.
1 ЭЛЕМЕНТЫ КОМБИНАТОРИКИ 9 Пример 2. Различными размещениями множества из трех элементов {1,2,3} по два будут наборы (1.2), (2,1), (1,3), (3,1), (2,3), (3,2). Число всех размещений из п элементов по к обознача- ется А*. При к = п число размещений совпадает с числом перестановок. Теорема 2 (о числе размещений). Число размещений из и элементов по к определяется по формуле Л‘ = П(п-1)...(П-* + 1) = ^. Доказательство. Отведем для элементов размещения к занумерованных мест. Поскольку размещения упорядоче- ны, то это означает, что у каждого элемента есть номер ме- ста, на котором он расположен: 1-й, 2-й, ... или к-й. На Первом месте в размещении может стоять элемент с любым Из номеров 1,2,..., п. Поставим на первое место, например, Элемент с номером 1. Для того, чтобы получить различные размещения из п элементов по к, у которых единица стоит На первом месте, нужно из оставшихся п — 1 элементов соста- рить всевозможные размещения по к— 1 элементу и поставить их на свободные к — 1 мест. Следовательно, число различных размещений с единицей на первом месте будет равно A„2i- На первое место можно поставить также любой из элемен- тов 2,3,... или п, и каждый раз число различных размещений е фиксированным первым элементом будет равно A„Zi • Так как на первое место можно поместить п различных элемен- тов, то число всех размещений из п элементов по k будет »А„1|, т. е. А* = пА*1|. Это равенство верно для любых к,п таких, что к п. Используя этот факт и очевидное со- отношение А*_л+1 = п - к 4-1, получим 4 = n(n - l)4j:’ = n(n - 1 (п - 2). . ;> = = n(n- l)...Ai_jb+i = n(n- 1) (n-fc + 1) = Задача 3. Студентам надо сдать 4 экзамена за 8 дней. Сколькими способами можно составить расписание сдачи экзаменов?
10 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Решение. Занумеруем дни сдачи экзаменов цифрами 1,2,...,8. Составлять различные расписания можно следую- щим образом. Сначала выберем дни для сдачи экзаменов, например, (2,4,5,7), а затем порядок сдачи экзаменов. Таким образом, нужно составить различные наборы четырех чисел из восьми, которые отличаются друг от друга не только эле- ментами, но и порядком. Таких наборов =8-7-6-5 = 1680. Определение 4. Неупорядоченные наборы, состоящие из к элементов, взятых из данных п элементов, называются сочетаниями из п элементов по к. Сочетания отличаются друг от друга только элементами. Пример 3. Для множества {1,2,3} сочетаниями по 2 эле- мента являются {1,2}, {1,3}, {2,3}. Число всех сочетаний из п элементов по к обозначается С*. Теорема 3 (о числе сочетаний). Число сочетаний из п элементов по к определяется по формуле Гк - та! п kl(n - к)!' Доказательство. Формулу для числа сочетаний про- ще всего вывести, основываясь на формулах для числа раз- мещений и перестановок. Для получения этой формулы за- дадимся вопросом о том, как можно образовать различные размещения из п элементов по к. Можно составить различ- ные сочетания из п элементов по Ат, а потом в каждом из сочетаний различными способами поменять порядок. Та- ким образом, чтобы получить всевозможные размещения, нужно для каждого из сочетаний осуществить А?! пере- становок. Следовательно, А* = С„ • к\. Отсюда получаем Сп = _ ку • Задача 4. В хоккейном турнире участвуют 6 команд. Ка- ждая команда должна сыграть с каждой одну игру. Сколько игр сыграно в турнире? Решение. Различные пары команд образуют сочетания из 6 по 2, поскольку порядок среди двух команд, играющих в одной игре, нам безразличен. Следовательно, число игр будет равно С% = = 15.
1. ЭЛЕМЕНТЫ КОМБИНАТОРИКИ 11 Задача 5. Имеется прямоугольник, разбитый на клетки. При этом вдоль одной стороны п клеток, а вдоль другой - т. Рис. 1 Пусть можно двигаться только по сторонам клеток либо вправо, либо вверх. Сколько существует различных путей Из левого нижнего угла в правый верхний? Решение. Сопоставим ходам вдоль клеток цифры 0 и 1. При этом 0 означает, что мы идем вправо, а 1 - вверх. Тогда каждому пути соответствует набор из т 4- п цифр, например, 00110...10, в котором будет ровно п нулей и т единиц. Сколько таких различных наборов цифр? Всего в таком наборе имеется т 4- п позиций, и надо среда них раз- местить т единиц, а остальные места оставить для нулей. Выбрать т позиций среда т 4- п можно С™+п способами. Столько существует различных путей. Коэффициенты С„ называются биномиальными коэффи- циентами, так как они входят в формулу бинома Ньютона (а4-6)я = £с*а*6п-*. k=0 Свойства коэффициентов С*: 1)£с* = 2"; 2)с*=сг‘; 3)С* = С£} + С*-1, 4=0
12 ТЕОРИЯ ВЕРОЯТНОСТЕЙ где полагаем 0! = 1 и = С„ = 1. Первое свойство следует из формулы бинома Ньютона при а = 1,6 = 1. Второе свойство непосредственно выте- кает из формулы для числа сочетаний С*. Третье свойство можно проверить следующим образом: , Ск _ (»~!)! , (п ~ !)! _ П"1 П-1 (к - 1)!(п - Л)! Т fc!(n - к - 1)! = (п-1)! ( 1 = С""1)1_______Л =Ск (fc-l)!(n-fc-l)!\n-* */ (к - 1)!(п - к - 1)! (п - к)к п' Третье свойство позволяет последовательно вычислять би- номиальные коэффициенты Ск с помощью так называемого треугольника Паскаля: CS с? с* СО z^l /^2 2 ^2 ^2 СО /^>2 /^>3 з '-'3 ^3 ^3 СО /^»1 /^2 /^>3 /^>4 4 О 4 V4 О4 1 1 1 1 2 1 13 3 1 1 4 6 4 1 Здесь каждое число кроме крайних единиц является сум- мой двух вышерасположенных. Формула Стирлинга (без доказательства) п! = 72^(2)" (1+^), где |ап| 1/12, а ей 2.718 - основание натурального лога- рифма. Эта формула является полезной при больших п. Напри- мер, из нее следует, что 1п(п!) с точностью до 1/(12п) при- ближается выражением 11п(2х) 4- (п 4-In п - п. Рассмотрим вопрос о числе комбинаций элементов, со- ставленных из элементов различных групп. Считаем, что в состав комбинации входит по одному элементу из каждой группы и порядок элементов безразличен.
1 ЭЛЕМЕНТЫ КОМБИНАТОРИКИ 13 Теорема 4 (о числе комбинаций). Число различных ком- бинаций элементов вида (а1, а2,..., аг), где а1 ~ некоторый эле- мент l-й группы, состоящей изгц элементов, равно гцпг ... пг. Доказательство. Докажем сначала теорему для ком- бинаций элементов вида (а1, а2), составленных из элементов двух групп, т. е. рассмотрим сначала случай г = 2. Соста- вим из пар элементов (a*,aj), i = 1,2, j = 1,2, ...,П2, прямоугольную таблицу (матрицу), содержащую ni строки #2 столбцов, так чтобы пара (а,, а2) стояла на пересечении i-й строки и j-ro столбца: («1.0?) (al,«D (а1>аз) .. (a2> аз) (aj,a2) • («2,апа) (aj.aj) • (4,0 («пцвз) • -• (а)ц,апа) Каждая из пар (а,1, а2) встречается в этой таблице один И только один раз, и число таких пар равно произведе- нию П1П2. Тем самым, утверждение теоремы справедливо при г = 2. Для случая произвольного числа групп элемен- те формула о числе комбинаций доказывается по индук- ции. Предположим, что она верна для г = к и докажем ее для г = к 4- 1. Первые к элементов можно рассматривать как один элемент вида Ъ1 = (a1, а2,.. .,ак). По предположе- нию число различных элементов этой объединенной груп- пы равно т = П1П2...П*. Любой элемент (a1,a2,...,ai+1) Из группы, состоящей из к 4- 1 элемента, представим в виде (a1,a2,...,a*+1) = (61,a*+1). Используя полученную формулу для числа различных элементов, составленных из Двух групп, получим, что число комбинаций элементов ви- да (a1,a2,...,a*+1) определяется равенством N = mnt+i = *= П1П2 • - >П£П&+1' Тем самым, формула о числе элементов верна для г = Л 4-1. Индукционный переход от г = к кг = 44-1 завершен, а значит, доказана и теорема 4. Задача 6. Из трех классов спортивной школы нужно со- ставить команду для соревнований, взяв по одному учени- ку от класса. Сколько различных команд можно составить,
14 ТЕОРИЯ ВЕРОЯТНОСТЕЙ если в одном классе учатся 18, в другом - 20, а в третьем - 22 ученика? Решение очевидно: 18 • 20 • 22 = 7920. Задачи Задача 1.1. Имеется пять видов конвертов без марок и че- тыре вида марок одного достоинства. Сколькими способами можно выбрать конверт с маркой для посылки письма? Задача 1.2. Сколько прямых линий можно провести через 8 точек, из которых ровно 3 лежат на одной прямой? Задача 1.3. Сколько словарей нужно издать, чтобы пе- реводить с любого из 5 языков на любой другой из этих языков. Задача 1.4. Есть пятиразрядный цифровой замок. Кодо- вое устройство замка состоит из пяти вращающихся дисков, каждый из которых имеет шесть цифр от 0 до 5. Только одна комбинация из пяти цифр позволяет открыть замок. Сколько таких комбинаций? Задача 1.5. Сколькими способами можно упорядочить множество {1,2,..., 2п} так, чтобы каждое четное число име- ло четный номер? Задача 1.6. Сколькими способами можно упорядочить множество {1,2,...,п} так, чтобы числа 1,2,3 стояли рядом и в порядке возрастания? Задача 1.7. Какое количество различных символов (букв, чисел и т. д.) можно передать не более чем пятью знаками кода Морзе, использующего точку (•) и тире (—)? Задача 1.8. Автомобильные номера состоят из трех букв и четырех цифр. Найти число таких номеров, если исполь- зуются 32 буквы алфавита. Задача 1.9. (сказка) Жил-был странный правитель. Ре- шил он своих подданных различать не по именам, а по зу- бам. Себе все 32 зуба оставил как и были белыми. Ближай- шим подданным повелел один зуб на разных позициях окра- сить в черный цвет, чтобы их отличать. Далее шли вассалы с двумя черными зубами на разных позициях, и так далее. В самых низших слоях были люди с одним белым зубом на разных местах, и был один только с черными. Сколько было подданных у правителя?
2. СЛУЧАЙНЫЕ СОБЫТИЯ 15 Задача 1.10, Сколько машинных (различающихся по на- писанию и не обязательно имеющих смысл) слов можно со- ставить из букв слова КОЛОКОЛ, из букв слова ВОДО- РОД? Задача 1.11. Сколькими способами можно посадить за круглый стол 7 мужчин и 7 женщин так, чтобы никакие две женщины не сидели рядом? Задача 1.12. Сколькими способами 9 одинаковых конфет можно разложить по пяти различным пакетам, если ни один из пакетов не должен быть пустым? Тот же вопрос, но паке- ты могут быть пустыми. § 2. Случайные события В основе теории вероятностей лежит понятие случайного эксперимента. Эксперимент считается случайным, если он может закончиться любым из совокупности известных ре- зультатов, но до осуществления эксперимента нельзя пред- сказать, каким именно. Примеры случайного эксперимента: бросание монеты, бросание игральной кости, проведение лотереи, азартные игры, стрельба по цели, поступление звонков на телефон- ную станцию. Различные результаты эксперимента мы будем называть исходами. Определение 1. Множество всех взаимно исключаю- щих исходов эксперимента называется пространством эле- ментарных событии. Взаимно исключающие исходы - это те, которые не мо- гут наступить одновременно. В дальнейшем под термином “исход” подразумеваются только такие исходы. Пространство элементарных событий мы будем обозна- чать буквой Q, а его исходы - буквой ш с различными ин- дексами и без них или другими понятными из контекста сим- волами. Термины “элементарное событие” и “исход” будем считать синонимами. Определение 2. Произвольное подмножество про- странства элементарных событий называется событием. Событие может состоять из одного или нескольких эле- ментарных событий, а также состоять из счетного или не-
16 ТЕОРИЯ ВЕРОЯТНОСТЕЙ счетного числа элементарных событий. События будут обо- значаться заглавными латинскими или русскими буквами А, В, С,..., Г,Р,Ч, ... , или записываться словами, напри- мер, {выпало четное число очков на игральной кости}. Осо- бо следует выделить событие, состоящее из пустого множе- ства исходов. Оно будет обозначаться символом 0. Говорят, что событие А наступило, если эксперимент заканчивается одним из исходов, входящих в событие А. Примеры: 1) Бросание монеты. Предполагаем, что мо- нета достаточно тонкая и при бросании не встает на ре- бро. Пространство элементарных событий состоит из двух исходов: Г = {выпал герб}, Р =s {выпала решетка}, т. е. Я = {Г,Р}. 2) Бросание игральной кости, т. е. кубика, сделанного из однородного материала, грани которого занумерованы цифрами 1,2,3,4,5,6. Число очков, выпавшее при бросании игральной кости - цифра на верхней грани кубика. Про- странство элементарных событий О = {1,2,3,4,5,6}. Собы- тие Ч = {выпало четное число} состоит из трех исходов, т. е. Ч = {2,4,6}. Считаем, что Ч наступило, если выпало либо 2, либо 4, либо 6. В зависимости от задачи в одном и том же эксперимен- те можно по-разному выбирать пространство элементарных событий. Так, при бросании игральной кости, если нас инте- ресует лишь то, что выпало четное или нечетное число, мож- но считать П ={Ч,Н}, где Ч ={четное число}, Н ={нечетное число}. Пример неправильно выбранного пространства элемен- тарных событий. Пусть при бросании игральной кости Ч ={четное число очков}, Т={число очков, кратное трем}. То- гда Q ={Ч,Т,1,5} составляет все исходы эксперимента, од- нако исходы Ч и Т могут наступать одновременно. Пример пространства с несчетным числом элементарных событий. Пусть есть проволока длиной, например, 1 метр. Мы растягиваем ее за концы, в результате чего происходит разрыв в какой-то точке. Множество исходов - это все точки на проволоке, которые математически можно задать отрез- ком [0,1], т. е. П = [0,1], а каждому исходу ы соответствует координата точки разрыва.
2. СЛУЧАЙНЫЕ СОБЫТИЯ 17 Определение 3. Суммой двух событий А и В (обо- значается А 4- В) называется событие, состоящее из всех ис- ходов, входящих либо в А, либо в В. Другими словами, под А + В понимают следующее собы- тие: произошло или событие А, или событие В, либо они произошли одновременно, т. е. произошло хотя бы одно из событий А или В. Определение 4. Произведением двух событий А и В (обозначается АВ) называется событие, состоящее из тех исходов, которые входят как в А, так и в В. Иными словами, АВ означает событие, при котором со- бытия А и В наступают одновременно. Определение 5. Разностью двух событий А и В (обо- значается А—В) называется событие, состоящее из исходов, входящих в А, но не входящих в В. Смысл события А — В состоит в том, что событие А на- ступает, но при этом не наступает событие В. Определение 6. Симметрической разностью двух Событий А и В (обозначается АДВ) называется событие, состоящее из исходов, входящих в А или в В, но не входя- щих в А и В одновременно. Смысл события АДВ состоит в том, что события А и В наступают, но не одновременно. Определение 7. Противоположным (дополнитель- ным) для события А (обозначается А) называется событие, состоящее из всех исходов, которые не входят в А. Наступление события А означает просто, что событие А не наступило. Примеры. Пусть при бросании игральной кости А = {выпало четное число}, В = {выпало число кратное трем}. Тогда А+В = {2,4,6}+{3,6} = {2,3,4,6}, АВ = {2,4,6}{3,6} = = {6}, А - В = {2,4,6} - {3,6} = {2,4}, ЛДВ = {2,3,4}, В = {1,2,4,5}. Если события изобразить множествами на плоскости, то результат определенных операций над событиями выглядит следующим образом:
18 ТЕОРИЯ ВЕРОЯТНОСТЕЙ А+В Рис. 2 Событие П, состоящее из всех исходов эксперимента, на- зывается достоверным событием. Оно обязательно проис- ходит, так как эксперимент всегда заканчивается каким- нибудь исходом. Пустое множество исходов эксперимента называется не- возможным событием и обозначается символом 0. Пример невозможного события. При бросании игрально- го кубика на ровную поверхность событие 0 состоит в том, что кубик встал на вершину. Определение 8. События А и В называются несо- вместными, если нет исходов, входящих как в А, так и в В, т. е. АВ = 0. Это означает, что события не могут наступать одновре- менно. Определение 9. Говорят, что событие А содержится в событии В (обозначается А С В), если все исходы события А входят в событие В. Иными словами, включением А С В обозначается такая ситуация, при которой наступление события А обязательно влечет наступление события В. Свойства операций над событиями. 1)А + В = В + А; 2) АВ = BA; 3)A + A_=fi; 4)AQ = A; _5)АВ.СА; 6)АА=_0; 7)А = А; 8) А — В - АВ; 9) АДВ = АВ + АВ; 10) (А_+ В)С = АС 4- ВС; 11) А + В = АВ; 12) АВ = А + В; 13) (А - В) С = АС - ВС. Свойства 1) - 9) непосредственно следуют из определе- ния операций над событиями.
2. СЛУЧАЙНЫЕ СОБЫТИЯ 19 Доказательство свойства 10). Возьмем произволь- ный исход ы из события (А 4- В)С (будем обозначать это следующим образом: ш Е (А+В)С). Тогда ш G А+В и ш G С. Из включения ш G А 4- В следует, что ш принадлежит хотя бы одному слагаемому. Пусть, например, ш Е А. Из ш Е А и <4 Е С следует, что о/ € АС, и, следовательно, w Е АС 4- ВС. Таким образом, любой исход события (А 4- В)С является исходом события АС 4- ВС, т. е. (А 4- В)С С АС 4- ВС. Ана- логично можно показать, что любой исход события АС4-ВС является исходом события (А 4- В)С. Отсюда следует свой- ство 10), так как события его левой и правой частей состоят из одних и тех же исходов. Доказательство свойства 11). Принадлежность исхо- да ш событию А 4- В означает, что он не принадлежит собы- тию А 4- В, то есть не принадлежит ни А, ни В. Не принад- лежит А значит принадлежит А, не принадлежит В значит принадлежит В, а это влечет, что w принадлежит А и В одновременно, т. е. ш Е АВ. Следовательно, выполняется включение А 4- В С AZL Рассуждая в обратном порядке, мы получим включение АВ С А4- В. Это доказывает равенство И). Доказательство свойства 12). Применим свойство 11) к событиям А, В вместо А,В. Имеем А4- В = АВ = АВ. Во втором равенстве мы воспользовались свойством 7). Взяв дополнение к левому и правому событиям этого ра- венства и снова используя 7), получим свойство 12). Доказательство свойства 13). Воспользуемся свой- ствами 8), 12) и 10). Тогда имеем цепочку равенств АС - ВС = АС ВС = АС(В 4- С) = АС В = (АВ)С = (А - В)С. Операции над событиями можно последовательно осу- ществлять несколько раз. Так, например, по определению, А4-В4-С = (А4-В)4-Си АВС = (АВ)С. В силу свойств 1) и 2) порядок осуществления операций сложения и умножения безразличен. Событие Ai 4- • • • 4- Ап = А* заключает- ся в том, что происходит по крайней мере одно из событий Ai, А2,..., A„_i или Ап. Событие AiA2 ... An_iAn = П"=1 состоит в том, что все события Ai, А2,..., An_j, Ап наступа- ют одновременно.
20 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Следствиями свойств 10) - 12) являются следующие свойства операций над событиями: 1О')В^Л4 = ^ВЛ1; И')^ДЬ = ЦЛ»; fc=l fc=l fc=l 4=1 12')ПЛ‘ = Е>‘- fc=l fc=l Эти равенства верны и для п = оо. Задача 1. Монета подбрасывается три раза подряд. Ис- ходом каждого бросания служит выпадение “герба”- Г или “решетки”- Р. Описать пространство элементарных собы- тий данного эксперимента и описать событие А, состоящее в том, что выпало не менее двух “гербов”. Решение. Исходом данного эксперимента является по- явление либо трех “гербов”, либо трех “решеток”, либо ком- бинаций “гербов”и “решеток”. Эти исходы будем записы- вать следующими наборами символов: ГГГ, РРР, ГРГ и т. д. Используя эти обозначения, пространство элементарных событий О можно записать следующим образом: Q = {ГГГ, ГГР, ГРГ, РГГ, РРР, РРГ, РГР, ГРР}. Событие А состоит из четырех исходов: А = {ГГГ, ГГР, ГРГ, РГГ}. Задача 2. Двое играют в шахматы. Событие А означает, что выиграл первый игрок, событие В - что выиграл второй игрок. Что означают события а) В; б) ЛДВ; в) Л + В; г) В-А; д) А-В? Решение. Нужно учесть, что АВ = 0, поскольку од- новременное наступление событий “выиграл первый” и “вы- играл второй”невозможно. Тогда указанные события озна- чают, что а) первый игрок выиграл или сыграл вничью; б) партия закончилась вничью; в) возможен любой исход партии; г) партия закончилась вничью; д) партия закончилась вничью.
2. СЛУЧАЙНЫЕ СОБЫТИЯ 21 Задачи Задача 2.1. Из таблицы случайных чисел наудачу взято одно число. Событие А - выбранное число делится на 5; со- бытие В - данное число оканчивается нулем. Что означают события А — В и АВ? Задача 2.2. Событие А - хотя бы одно из имеющихся че- тырех изделий бракованное, событие В - бракованных из- делий среди них не менее двух. Что означают противопо- ложные события А и В? Задача 2.3. Когда возможны равенства: а) А 4- В = А; б) АВ = Х; в) А + В = АВ? Задача 2.4. Совместны ли события А и А + В? Задача 2.5. Бросают две игральные кости. Пусть А - событие, состоящее в том, что сумма очков равна пяти, а В - событие, заключающееся в том, что хотя бы на одной из цостей выпала единица. Описать события АВ и АВ. Задача 2.6. Рабочий изготовил п деталей. Пусть событие Ai, i = 1,2, ...,п, заключается в том, что i-я изготовленная Им деталь имеет дефект. Записать событие, заключающееся р том, что: а) ни одна из деталей не имеет дефектов; б) хотя бы одна деталь имеет дефект. Задача 2.7. Событие А - спортсмен прыгнул дальше 7 Метров, событие В - мужчина прыгнул дальше женщины, событие С - спортсменка прыгнула дальше 7 метров. Что означают события АВС, А — АВ и АВС? Задача 2.8. Пусть А, В, С - три произвольных события. Найти выражения для событий, состоящих в том, что из А, В, С а) произошло только А; б) произошли А и В, но С не произошло; в) все три события произошли; г) произошло по крайней мере одно из этих событий; д) произошли по крайней мере два события; е) произошло ровно одно из этих событий; ж) произошло ровно два из этих событий; з) ни одно событие не произошло; и) произошло не больше двух событий.
22 ТЕОРИЯ ВЕРОЯТНОСТЕЙ § 3. Классическое определение вероятности Вероятность события характеризует возможность (шанс) осуществления события в ходе случайного эксперимента. Смысл вероятности раскрывается в следующих требовани- ях, налагаемых на вероятности событий. Вероятность собы- тия выражается долей от целого, т. е. является числом от нуля до единицы. При этом за единицу принимается веро- ятность наступления достоверного события, т. е. события, которое обязательно происходит в ходе эксперимента. Ве- роятности невозможных событий считаются равными нулю. Если взять произвольный конечный или счетный набор со- бытий, таких что никакие два из них не могут произойти од- новременно, то вероятность наступления хотя бы одного из этих событий должна быть равна сумме вероятностей этих событий. Иными словами, шанс наступления суммы попар- но несовместных событий равен сумме шансов каждого из событий. Указанные требования налагают жесткие ограни- чения на численные значения вероятностей. Вычисление значений вероятностей событий в различных случайных экспериментах является предметом теории ве- роятностей. Для конкретного случайного эксперимента ве- роятность конкретного события - объективно существую- щая величина. Оказывается, что численное значение этой величины проявляется следующим образом. Если случай- ный эксперимент многократно повторить при одних и тех же условиях и вычислить частоту появлений конкретного со- бытия среди всех проведенных экспериментов (частота по- явлений события есть отношение числа появлений события к числу экспериментов), то при неограниченном возраста- нии числа экспериментов эта частота в пределе совпадает с вероятностью события. При определенных исходных пред- положениях теории вероятностей это - строго доказанное утверждение (см. §16). Основной задачей теории вероят- ностей является разработка правил вычисления вероятно- стей событий, появляющихся в сложных случайных экспе- риментах, по известным вероятностям событий более про- стых экспериментов. Изучение основ теории вероятностей мы начнем с рассмотрения простых случайных эксперимен- тов, имеющих конечное число исходов.
3. КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 23 Пусть пространство элементарных событий конечно: О = Будем говорить, что на пространстве й заданы вероят- ности, если каждому исходу щ сопоставлено неотрицатель- ное число р(ш]) так, что выполнено условие нормировки f}p(W|) = 1. 1=1 Определение 1. Вероятностью события А = = ,a>i3..uik} называется число Р(А), равное сумме ве- роятностей элементарных исходов, составляющих событие А, т. е. Р(А) = Е ₽("')• Рассмотрим простейшую модель теории вероятностей, которую часто называют “классической схемой”. Если в силу тех или иных свойств, обычно связанных с сим- метрией, каждый элементарный исход эксперимента имеет одинаковую возможность осуществиться (исходы равновоз- можны), то этим исходам естественно сопоставить одина- ковые вероятности. Пусть й = {о>1,а>2,... ,о>п}, и все исходы о>1,W2, • • • ,(*>п равновозможны. Тогда полагаемp(u>i) = р(о>2) = = • • • = р(шп) = р. В силу условия нормировки пр = 1 или p(w/) — р = 1/п, где п - число исходов эксперимента. Для любого множества А символом card А (кардинальное число множества А) будем обозначать количество элементов это- го множества. Исходы, составляющие событие А, называют- ся благоприятными для этого события. Тогда в “классиче- ской схеме”мы имеем card й = n, p(w/) = ——> I — 1,2,..., п, caxd лб и р(л) = ЕрМ = рс“<1л = ^' Таким образом, в случае, когда все исходы равновозможны, вероятность события А равна отношению числа благопри- ятных исходов для события А к общему числу исходов экс- перимента. Это - классическое определение вероятности.
24 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Примеры. При бросании правильной монеты Р(Г) = = Р(Р) = 1/2. При бросании игральной кости Р(1) = Р(2) = — • • • = Р(6) — 1/6, Р(выпало четное число) — 3/6 = 1/2. В формулировках многих задач при случайном выборе чего-либо будет употребляться слово “наудачу”. Это сло- во означает беспристрастный выбор, при котором все ком- бинации элементов, которые могут быть выбраны, равно- возможны. Иногда слово “наудачу” будет заменяться экви- валентным выражением “случайным образом”. Задача 1. Для участия в лотерее, на карточке, содер- жащей 49 чисел, нужно отметить 6 чисел. Затем эти числа сверяются с 6 числами, отобранными случайным образом. В зависимости от числа совпавших номеров выплачивается выигрыш. Какова вероятность угадать в лотерее 6 чисел из 49? Решение. В этой задаче Q - совокупность всех сочета- ний из 49 чисел по 6, и cardQ = C%Q. Столько существу- ет различных вариантов заполнения карточки, и каждый из них имеет одинаковый шанс стать выигрышным. Благо- приятствует выигрышу только одно событие: номер на кар- точке совпал с отобранным. Поэтому Р(угадать 6 из 49) = _ 1 _ 1 ~ 1 — Cfg “ 13083816 ~ 14000000' Задача 2. В ящике т белых и п черных шаров. Шары тщательно перемешаны. Наудачу вынимаются сразу два ша- ра. Какова вероятность того, что оба шара белые? Решение. Шары можно для удобства пронумеровать числами от 1 дош + п. Поскольку нам не важно, какой шар первый, а какой второй, то возможными исходами экспери- мента будут различные сочетания из тп-Ьп чисел по 2. Тогда cardQ = С^+п. Событию А = {оба белые} отвечают лишь сочетания из т чисел по 2. Следовательно, card Л = €%, и pm - С™ - т(т ~ ' ст+п (т + п)(т + п - 1)* Задача 3 (де Мере). Еще в XVII-ом веке француз Ше- валье де Мере задался вопросом: какая сумма очков имеет больше шансов выпасть при бросании двух игральных ко- стей - 11 или 12? Сумму 11 могут составить лишь два чи-
3 КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 25 ела - 5 и б, а сумму 12 тоже два числа - 6 и б. На первый взгляд шансы у этих событий равны. Так ли это? Решение. Будем различать игральные кости. Пусть мысленно одна будет красной, а другая - белой. Различ- ных комбинаций очков на разноцветных костях согласно те- ореме 4 о числе комбинаций (§1) будет б б = 36. Следо- вательно, cardQ = 36. Сумма 12 выпадает лишь при одной комбинации, когда на красной кости 6 и на белой 6. Таким образом, Р(12) = 1/36. Сумма 11 выпадает при двух комби- нациях, когда на красной б, а на белой 5, и наоборот. Тогда Р(11) = 2/36. Следовательно, сумма очков 11 имеет в два раза больше шансов выпасть, чем 12. Обратимся еще раз к обсуждению понятия вероятности, используя уже рассмотренные нами примеры экспериментов с конечным числом исходов. С математической точки зрения вероятность - неотрицательное число, которое сопоставля- ется случайному исходу эксперимента, при этом сумма всех вероятностей, отвечающих различным исходам эксперимен- та, равна единице. Абстрактная теория занимается в основном разработкой правил пересчета одних вероятностей в другие, предпола- гая, что исходные вероятности даны и не нуждаются ни в каких обоснованиях их действительных численных значений Выяснению численных значений вероятностей в различ- ных конкретных экспериментах посвящена другая матема- тическая дисциплина - статистика. Существуют также экс- перименты, в которых априори ясно, чему равны значения Вероятностей. Таковы, в частности, эксперименты с равно- возможными исходами, в которых исходам сопоставляются равные вероятности. По существу это заложено в самом по- нятии “равновозможности”. Чаще всего вывод о том, какие исходы считать равновозможными, основан на соображени- ях, связанных с симметрией и однородностью. Если, напри- мер, монета симметрична и сделана из однородного матери- ала, то шансы выпадения герба и решетки совпадают, т е. вероятности равны 1/2. Какой же смысл вкладываем мы подсознательно во фра- зу “при бросании правильной монеты вероятность выпаде- ния герба равна 1/2”, кроме того, что монета симметрична?
26 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Оказывается, что вероятность проявляет себя, когда один и тот же случайный эксперимент проводится много раз, при- чем так, что результаты уже осуществленных экспериментов никак не влияют на последующие. При этих условиях часто- та наступления события при неограниченном возрастании числа экспериментов стремится к вероятности события. Пусть правильная монета бросается п раз, и пусть число выпадений герба при этом равно пг- Тогда при неограничен- ном увеличении числа бросаний монеты частота выпадений герба будет стремиться к -, т. е.--> - при п -+ оо. Этому будет дано строгое математическое обоснование в, § 16. Эксперименты не обязательно проводить последователь- но, можно одновременно провести много одинаковых экспе- риментов. Например, в лотерее из задачи 1 участвуют сра- зу много людей. Считаем, что один человек заполняет од- ну карточку, в которой отмечает 6 чисел из 49 возможных. Процесс заполнения карточки отдельным человеком - слу- чайный эксперимент. В результате доля людей, угадавших 6 из 49, будет близка к вероятности, которую мы вычислили в задаче 1. Так, если в лотерее участвовало 56 млн. чело- век, то угадавших 6 чисел будет скорее всего 4, поскольку 4 _ i 56000000 “ 14000000' Свойства вероятностей. 1) Р(й)=1 в силу условия нормировки; 2) Р(0) = О, поскольку сумма, в которой нет слагаемых, равна нулю; 3) если А С В, то Р(А) $ Р(В), так как выражение для вероятности Р(В) по сравнению с Р(А) содержит дополни- тельные неотрицательные слагаемые; 4) 0 Р(А) 1 для любого события А, что следует из свойств 3) и 1); 5) Р(А) — 1 — Р(А), так как Р(Л) 4- Р(А) = 52 + 52 ~ 52 = 1; wiEA wiEA u>ieQ 6) (формула сложения вероятностей) для любых собы- тий А и В Р(А + В) = Р(А) + Р(В) - Р(АВ).
3. КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 27 Действительно Р(Л + В)= $2 = wi€A+B = Е р(“<) + Е - Е ₽(“<)=р<л>+pw - р(лв)- wiGA Ш(ЕВ u>iEAB Следствие 1. Если АВ — 0, т. е. события А и В несо- вместны, то Р(Л + В) = Р(А) 4- Р(В). Следствие 2. Если события Ai,l = 1,2, попарно не- совместны, т. е. AiAj = 0 для любых I / j, то р(5>)=£ри<). /=1 /=1 Ото равенство несложно доказать по индукции, используя следствие 1 и свойство 10') §2, из которого следует несо- вместность событий и JZf-i Ai для любого к. Следствие 3. Если С С D то P(D — С) = P(D) — Р(С). Действительно, события D—С и С несовместны, а их сум- Ма составляет событие D. Тогда по следствию 1 Р(П) = P(D - С) + Р(С). Задачи Задача 3.1. В выпуклом двадцатиугольнике случайным образом берут две вершины и соединяют отрезком. Чему равна вероятность того, что отрезок является диагональю двадцатиугольника? Задача 3.2. Наудачу взят телефонный номер, состоящий из пяти цифр. Чему равна вероятность того, что все цифры различные?
28 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 3.3. На полке стоят 15 книг, 5 из них в переплете. Берут наудачу три книги. Какова вероятность того, что все три книги в переплете? Задача 3.4. В ящике 20 шаров с номерами 1,2,..., 20. На- удачу выбираются шесть шаров. Найти вероятность того, что среди них есть шары с номерами 1 и 2. Задача 3.5. Среди 100 фотокарточек есть одна фотокар- точка знаменитого артиста. Взяли наудачу 10 фотокарто- чек. Какова вероятность того, что среди них есть фото ар- тиста? Задача 3.6. Из 12 лотерейных билетов, среди которых есть 4 выигрышных, наудачу берут 6. Какова вероятность того, что хотя бы один из них выигрышный? Задача 3.7. Бросают две игральные кости. Какова веро- ятность того, что сумма очков не более трех? Задача 3.8. В ящике 2 белых и 4 черных шара. Один за другим вынимаются все имеющиеся в нем шары. Найти вероятность того, что последний шар будет черным. Задача 3.9. В течение пяти дней случайным образом по- ступают сообщения о банкротстве одного из пяти банков, назовем их условно А,В,С,О>Е. Чему равна вероятность того, что сообщения о банкротстве банков А и В не следу- ют друг за другом? Задача 3.10. При наборе телефонного номера абонент за- был две последние цифры и набрал их наудачу, помня толь- ко, что эти цифры нечетные и разные. Найти вероятность того, что номер набран правильно. Задача 3.11. Найти вероятность того, что дни рождения 12 человек придутся на разные месяцы года. Задача 3.12. В ящике 10 красных и 6 белых шаров. Вы- нимаются наудачу два шара. Какова вероятность того, что шары будут одноцветными? Задача 3.13. Найти вероятность того, что наудачу взятое двузначное число окажется кратным 2, либо 5, либо тому и другому одновременно. Задача 3.14. Из последовательности чисел 1,2,..., п нау- дачу выбираются два числа. Какова вероятность, что одно из них меньше к, а другое больше к, где 1 < к < п - произ- вольное целое число?
4. ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ 29 Задача 3.15. Бросаются 4 игральные кости. Найти ве- роятность того, что на них выпадет по одинаковому числу очков. Задача 3.16. На шахматную доску из 64 клеток ставятся наудачу две ладьи белого и черного цвета. С какой вероят- ностью они не будут “бить” друг друга? Задача 3.17. Сколько раз нужно бросить игральную кость, чтобы с вероятностью не меньше а) 0.5; б) 0.9 хо- тя бы один раз выпала шестерка (шесть очков)? § 4. Геометрические вероятности Пусть в пространстве задана некоторая область, на- пример, отрезок, если пространством служит прямая, ква- драт, если пространством служит плоскость, или куб, если пространство трехмерно. Пусть результатом эксперимента является случайный выбор точки из этой области. Предпо- ложим, что по каким-то соображениям, обычно связанным с Симметрией либо однородностью, выбор любой точки обла- сти равновозможен. Чему равны вероятности событий в та- ком эксперименте? Ответ на этот вопрос связан с понятием геометрических вероятностей. Пример. Однородная проволока растягивается за кон- цы. Результатом эксперимента является разрыв проволоки В какой-то точке. Всю область исходов эксперимента можно отождествить с отрезком, равным длине проволоки. Заданную в пространстве область обозначим Q. В экс- перименте, связанном со случайным выбором только одной точки из Q, множество Q служит пространством элементар- Ных событий. Случайными событиями в этом эксперименте Можно считать различные подмножества Q. Будем говорить, что событие А наступило, если случайно выбранная точ- ка принадлежит множеству А С О. Возникает вопрос: какая Вероятность соответствует событию А? Символом mes обо- значим меру Лебега в пространстве: для прямой это длина, для плоскости - площадь, для трехмерного пространства - объем. В фразу “выбор любой точки области равновозмо- жен” вкладывается следующий смысл: шансы выбрать точки из любых двух множеств одинаковой меры Лебега равны между собой. Разобьем Q на п частей одинаковой меры Ле-
30 ТЕОРИЯ ВЕРОЯТНОСТЕЙ бега. Пусть событие А таково, что оно целиком состоит из к чзажх. частей. Тогда эксперимент случайного выбора точ- ки из Q может быть описан с помощью классической схемы. Исходом здесь служит выбор точки из той или иной выде- ленной части. Всего п равновозможных исходов. При этом вероятность события А равна отношению числа частей, со- ставляющих Л, к общему числу частей, т. е. _/ .. к mes А Р(А) = - =--- 4 ' п mes if Считая, если необходимо, п произвольным и применяя предельный переход при п -+ оо, можно показать, что любо- му событию А, для которого определена мера Лебега, соот- ветствует вероятность pw=^- Вероятности* заданные по этой формуле, называют гео- метрическими. Свойства геометрических вероятностей точно такие же, как и для вероятностей в классическом определении. В примере о разрыве однородной проволоки можно рас- смотреть событие А = {проволока разорвалась ближе к цен- тру, чем к концам}. Здесь, чтобы вычислить вероятность со- бытия А, можно разбить проволоку на четыре равные части. Событию А отвечает точка разрыва, появляющаяся в одной из двух средних частей. Следовательно, Р(А) = = |. Задача 1. Наудачу выбираются два числа из промежутка [0,1}. Какова вероятность, что их произведение меньше 1/2? Решение. Слово “наудачу”здесь означает, что появле- ние любой пары чисел (ж, у) из квадрата [Q, 1] X [0,1] = й рав- новозможно. Множество А = {(ж, у) 6 [0,1} х [0,1] : ху 1/2} составляет случайное событие, вероятность которого нуж- но найти. Очевидно, mesQ — 1. Множество А образуют те точки квадрата О, которые лежат под кривой у = С ле- 2х довательно, 1 mesА — х + / — ^(1 + 1п2). 2 J 2т 2 * 1/2
4. ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ 31 Это и есть искомая вероятность. Задача 2 (о встрече). Два, человека в течение промежутка времени fO, Т] случайным образом приходят к месту встречи и ждут время т < Т. Какова вероятность, что они встретят- ся? Решение. Пусть х - время прихода первого человека, а у - второго. Тогда (л, у) G [0,7] X [0,7] = D. Поскольку они приходят случайным образом, то все исходы Q равновоз- можны. Событие А = {они встретятся} можно задать так: А — {(ж, у) G [0,7] х [0,7] : [у — ж| т}. Множество А обра- зуют те точки квадрата П, которые лежат между прямыми у = зв — т и у = х+т. Поэтому mesA = 7^—(Т—т)2. Поскольку mesSl = Г2, то mesA . /. т\2 mesft \ т) Задача 3. Какой толщины должна быть монета радиуса Я, чтобы вероятность падения на ребро была равна 1/3? Р ешени е. Укажем лишь на основные моменты решения, дающего ответ R/y/2. Монету рассматриваем как вписан- ную в сферу. Если радиус, проведенный из центра сферы в направлении, выбранном наудачу, пересекает поверхность монеты, составляющую ребро, то считаем, что монета упа- ла на ребро. Вероятность падения монеты на ребро равна отношению площади сферического пояса, заключенного ме- жду круглыми сторонами монеты, к площади сферы Задачи Задача 4.1. На плоскость с нанесенной квадратной сет- кой со стороной 4 см бросают монету радиуса 1 см Найти вероятность того, что монета не пересечет линии Задача 4.2. В круг вписан квадрат. Какова вероятность того, что точка, брошенная в круг наудачу, окажется внутри квадрата? Задача 4.3. Из промежутка [0,1] выбрали наугад два чи- сла. Какова вероятность, что их сумма больше либо равна 1, а их разность меньше либо равна О? Задача 4.4. На отрезке [А, В] длиной I поставили наугад две точки - L и М. Найти вероятность того, что L будет ближе к точке М, чем к А.
32 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 4.5. Какова вероятность того, что сумма двух на- угад взятых положительных чисел, каждое из которых мень- ше либо равно 1, будет меньше либо равна 1, а их произве- 2 дение будет не больше -? Задача 4.6. На отрезке длиной / наугад ставятся две точ- ки, которые разбивают его на три отрезка. Найти вероят- ность того, что из этих отрезков можно составить треуголь- ник. Задача 4.7. Электрон вылетает из случайной точки нити накала и движется по перпендикуляру к нити. С какой ве- роятностью он свободно пройдет через сетку, окружающую нить и имеющую вид винтовой линии радиуса Я, толщиной 6 и шага Н? Задача 4.8. Спутник Земли движется по орбите, кото- рая заключена между 60° северной и 60° южной широты. Считая падение спутника в любую точку поверхности Зе- мли между указанными параллелями равновозможным, най- ти вероятность того, что спутник упадет выше 30° северной широты. §5. Условные вероятности. Независимость событий Рассмотрим вопрос о том, как определить вероятность какого-либо события А при условии, что уже произошло другое событие В. Начнем с примера, в котором возникает условная веро- ятность. Пусть брошена игральная кость и нам неизвестен результат, но известно, что выпало четное число. Мы же хотим, зная эту информацию, подсчитать вероятность того, что выпало число больше трех. Тогда речь идет об услов- ной вероятности события А = {выпало число больше трех} при условии, что произошло событие В = {выпало четное число}. Нам уже известно, что выпало либо 2, либо 4, либо 6 очков, и все эти исходы равновозможны. Среди этих исхо- дов событию А удовлетворяют лишь исходы 4 и 6. Поэтому „ 2 условной вероятностью естественно считать отношение -. Вероятность события А при условии, что произошло со- бытие В, называется условной вероятностью и обознача- ется Р(А|В).
5. УСЛОВНЫЕ ВЕРОЯТНОСТИ. НЕЗАВИСИМОСТЬ СОБЫТИЙ 33 Условную вероятность мы будем рассматривать лишь для таких событий В, вероятность наступления которых от- лична от нуля. Вопрос об условных вероятностях для собы- тий, имеющих нулевую вероятность тоже имеет смысл, но его изучение выходит за рамки элементарного курса. Определим условные вероятности Р(А|В) для схемы, ко- гда все исходы равновозможны. Пусть Q - пространство элементарных событий. Поскольку известно, что событие В произошло, то будем рассматривать только те элементар- ные исходы, которые составляют событие В. Рассмотрим новое пространство элементарных событий Qi = В. Выбе- рем множество исходов из А, которые входят в В, и обозна- чим его Ах. Очевидно Ах = АВ, За условную вероятность P(AjB) естественно взять вероятность события Ах при усло- вии, что рассматриваются только события, содержащиеся в В. Чему равна эта вероятность? Мы снова оказались в рам- ках “классической схемы”, только для нового пространства элементарных событий Пх. Поэтому эта вероятность равна card Ах/card Qi. Следовательно, л|о\ cardAi cardAi/cardQ Р(АВ) ' ' cardQi cardili/cardQ P(B) Это соотношение оправдывает следующее формальное определение условной вероятности. Определение 1. Условной вероятностью события А при условии, что произошло событие В с Р(В) 0, называ- ется число Р(А|В), которое определяется формулой Р(Л|В) = К такому же определению мы придем, если будем рас- сматривать геометрические вероятности. Это и не удиви- тельно, поскольку при определении геометрических вероят- ностей мы использовали подход, основанный на “классиче- ской схеме”. В силу того, что условная вероятность - это обычная ве- роятность, но лишь на более узком пространстве элементар- ных событий, то для нее справедливы все свойства обычной вероятности.
34 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Свойства условных вероятностей. 1) P(fi|B) = 1; 2) Р(0|В) = 0; 3) 0 Р(А|В) 1; 4) если А С С, то Р(А|В) Р(С|В); 5)Р(Л|В) = 1 - Р(Л|В); 6) (формула сложения условных вероятностей) для любых событий А и С Р(А + С|В) = Р(А|В) + Р(С|В) - Р(АС|В); 7) (формула умножения вероятностей) для любых со- бытий А и В Р(АВ) = Р(В)Р(А|В) = Р(А)Р(В|А). Эта формула является непосредственным следствием оп- ределения условной вероятности. 8) (общая формула умножения вероятностей) для лю- бых событий Ах, А2,..., Ап Р(А1А2...Ап)3= = Р(А1)Р(А2|А1)Р(Аз|А1А2) .. .Р(А„|АхА2 ... А„_х). Эту формулу можно получить, применяя последовательно п раз формулу умножения вероятностей 7). Действительно, полагая А = АП) В = АхА2 ... An_i и применяя 7), получаем Р(АХА2.. .А„) = Р(АМ2... An_i)P(An|A1A2... Ап_х). Это равенство справедливо для любых п, поэтому можно продолжить цепочку равенств Р(А1А2...А„) = = P(AiA2. .. An_2)P(An_i|AiA2... Ап_2)Р(Ап|А1А2 .. .Ап_х) = = Р(А1)Р(А2|А1).. .Р(АП_1|А1А2... АП_2)Р(А„|А1А2... Ап-х). Задача 1. В ящике т белых и п черных шаров. Шары тщательно перемешаны. Наудачу вынимаются сразу два ша- ра. Какова вероятность того, что оба шара белые? Решение (ранее (§3) данная задача решалась другим способом). Взять два шара сразу или сначала взять один
5. УСЛОВНЫЕ ВЕРОЯТНОСТИ. НЕЗАВИСИМОСТЬ СОБЫТИЙ 35 шар, а потом другой - это одно и то же, ведь руку мож- но не вынимать из ящика, когда берется один шар, а за- тем другой. События {оба шара белые} и {1-й шар белый и 2-й шар белый} совпадают. Поэтому достаточно вычи- слить вероятность второго события, которое представимо в виде произведения событий А = {1-й шар белый}, В = {2-й шар белый}. Очевидно, Р(А) = * Кроме того Р(В|А) = "~^п 21 > поскольку, если событие А произошло, то в ящике уже остался т 4- п — 1 шар, среди которых т — 1 белых, и вероятность снова вынуть белый шар будет рав- на —-----г- Теперь воспользуемся формулой произведения вероятностей: Р(оба белые) = Р(АВ) = Р(А)Р(В|А) = Задача 2. Бросают три игральные кости. Какова вероят- ность того, что хотя бы на одной из них выпадет шестерка, если на всех трех костях выпали разные числа? Решение. Определим события А = {хотя бы на од- ной из трех костей выпала шестерка} и В = {на трех ко- стях выпали разные числа}. Нам нужно вычислить вероят- ность P(AjB). Для этого воспользуемся свойством 5), по- скольку вероятность Р(А|В) вычислить легче. Будем раз- личать кости, например, считая их окрашенными в разные цвета. По теореме 4 § 1 число различных комбинаций чи- сел на трех костях равно 6-6-6 = 216. Число комбина- ций разных чисел на трех костях равно числу размещений из 6 элементов по 3, т. е. Мы берем А|, а не Cf, по- скольку мы различаем кости. Тогда Р(В) = А|/216. Собы- тие АВ означает, что на трех костях выпали разные числа и нет ни одной шестерки. Аналогично предыдущему, име- ем Р(АВ) = A|/216. По определению условной вероятности Р(Л|В) = Р(АВ)/Р(В) = А?/А? = 144 = I- По свойству 5) О * <> л окончательно получаем Р(А|В) = 1 — - = -. Определение 2. Событие А называется независимым от события В с Р(В) £ 0, если Р(А|В) = Р(А), т. е. вероят- ность наступления события А не зависит от того, произошло событие В или нет.
36 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Пример. Пусть при бросании игральной кости А = {выпало число меньше трех}, В = {выпало четное число}. Поскольку А = {1,2}, а В = {2,4,6}, то Р(А) = и Р(А|В) = Р(ЛВ) _ 1/6 _ 1 Р(В) “ 1/2 “ з‘ Следовательно, событие А не зависит от события В. Лемма 1 (о взаимной независимости событии). Если событие А не зависит от В при Р(А) / О, Р(В) / 0, то и событие В не зависит от А. Доказательство. Используя свойство 7), получим р/о. - Р(Л|В)Р(В) _ Р(А)Р(В) _ р/д\ Р(51Л) р(д) ~ - Р(5)> и, следовательно, событие В не зависит от А. Таким образом, события А и В не зависят друг от друга. При этом согласно свойству 7) Р(АВ) = Р(Л|В)Р(В) = Р(А)Р(В). Это равенство позволяет дать следующее определение не- зависимости событий, симметричное по отношению к собы- тиям А и В и применимое к событиям нулевой вероятности. Определение 3. События А и В называются незави- симыми, если Р(АВ) = Р(А)Р(В). Это определение удобно тем, что его легко можно рас- пространить на совокупность нескольких событий. Определение 4. События Ai,A2,...,An называются независимыми в совокупности, если для любого набора индексов 1 /1 < 1% < • • • < Ik п выполняется равенство Р(А Лз • • • Л*) = р(Лх )Р(Л2)... Р(А1к). Определение 5. События Ai, Аг,..., Ап называются попарно независимыми, если P(At-Aj) = Р(А<)Р(Ау) для любых пар г,}, 1 i < j п. Замечание 1. Из попарной независимости событий Ai, А2, . ..An_i,An не следует независимость этих событий в сово- купности.
5. УСЛОВНЫЕ ВЕРОЯТНОСТИ. НЕЗАВИСИМОСТЬ СОБЫТИЙ 37 Убедимся в справедливости этого замечания на примере бросания двух игральных костей. Определим три события следующим образом: А={нечетное число на первой кости}; В = {нечетное число на второй кости}; С = {нечетная сум- ма}. Применяя теорему 4 § 1 о числе комбинаций для двух групп, имеем: ph)=р(в)=Н=|; р<с>=^4^=I’ р(лв>=Н=I’ р(АС)=р(вс> = Н=г Таким образом, эти три события попарно независимы. Од- нако, АВС = 0 и, следовательно, Р(АВС) = 0, а это озна- чает, что вероятность произведения АВС не равна произве- дению вероятностей Р(А)Р(В)Р(С) = -. Задача 3. Доказать, что если события А, В и С неза- висимы в совокупности, то события А, В, С также независи- мы в совокупности, и независимы в совокупности события А, В, С. Решение. Проверим сначала, что вероятность произве- дения событий А, В,С распадается в произведение вероят- ностей. Применяя следствие 3 § 3, получим Р(АВ С) = P(AB(Q - С)) = Р(АВ - АВС) = = Р(АВ) - Р(АВС) = Р(А(П - В)) - Р(А(П - В)С) = = Р(А) - Р(АВ) - Р(АС) + Р(АВС) = = Р(А) - Р(А)Р(В) - Р(А)Р(С) + Р(А)Р(В)Р(С) = = Р(А)(1 - Р(В))(1 - Р(0) = Р(А)Р(В)Р(С). Теперь нужно убеди£ься,_что_для произведений любых пар событий, т. е. для АВ, АС к ВС вероятность тоже распада- ется в произведение вероятностей. Действительно Р(АВ) = Р(А) - Р(АВ) = Р(А)Р(В), Р(АС) = Р(А) - Р(АС) = Р(А)Р(С).
38 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Применяя 11-ое свойство операций над событиями и форму- лу сложения вероятностей, получим Р(ВС) = Р(ВТС) = 1 - Р(В 4- С) = = 1 - Р(В) - Р(С) - Р(ВС) = = (1 - Р(В))(1 - Р(С)) = Р(В)Р(С). Аналогично можно доказать независимость в совокупно сти событий А, В, С. Задача 4. Доказать, что если события А, В vl С незави- симы в совокупности, то события А — В, С независимы, а также независимы события А 4- В, С. Решение. Воспользуемся предыдущими результатами и восьмым свойством операций над событиями. Тогда Р((А - В)С) = Р(АВС) = Р(А)Р(В)Р(С) = = Р(АВ)Р(С) = Р(А - В)Р(С). Несложно также доказать, что события А 4- В, С незави- симы. Приведенные в задачах утверждения свидетельствуют в пользу следующего факта, который мы сформулируем без доказательства. Пусть п независимых в совокупности событий разбиты на к групп, не содержащих общих событий, к п. Над собы- тиями внутри каждой группы произведены любые операции: сложения, умножения, вычитания и т. д. Тогда получившие- ся в результате к новых событий будут тоже независимыми в совокупности. Этот факт отвечает нашим интуитивным представлениям о независимости. Задачи Задача 5.1. Пусть события А и Bi независимы и незави- симы также события А и Вг, при этом В1В2 = 0. Доказать, что события А и Bi 4- Вг независимы. Задача 5.2. Бросили монету и игральную кость. Опреде- лить, зависимы или независимы события: А = {выпал “герб”}; В = {выпало четное число очков}.
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 39 Задача 5.3. Брошены последовательно три монеты. Опре- делить, зависимы или независимы события: А = {выпадение “герба”на первой монете}; В = {выпадение хотя бы одной “решки”}. Задача 5.4. В урне 9 белых шаров и 1 черный шар. Выну- ли сразу три шара. Какова вероятность того, что все шары белые? Задача 5.5. Буквы слова ПОКОЛЕНИЕ выписаны на карточках. Наудачу вынимают одну карточку за другой и укладывают попорядку. Найти вероятность того, что полу- чится слово ПОЛЕ. Задача 5.6. В двух ящиках находятся шары, отличающи- еся только цветом, причем в первой урне 5 белых шаров, 11 черных и 8 красных, а во второй соответственно 10, 8 и 6. Из каждого ящика наудачу извлекается по одному шару. Какова вероятность, что оба шара одного цвета? Задача 5.7. Два стрелка поочередно стреляют по мише- ни до первого попадания. При каждом выстреле вероятность попадания для первого стрелка равна 0.2, а для второго рав- на 0.3. Найти вероятность того, что первый стрелок сделает больше выстрелов, чем второй. Задача 5.8. Партия из ста деталей подвергается выбо- рочному контролю. Условием непригодности всей партии является наличие хотя бы одной бракованной детали сре- ди пяти проверяемых. Какова вероятность для данной пар- тии быть непринятой, если она содержит 5% бракованных деталей? § 6. Общее определение вероятности До сих пор мы рассматривали такие примеры случайных экспериментов, в которых все исходы были равновозможны. Однако для многих экспериментов исходы не являются рав- новозможными. Приведем простой пример. Пример. Пусть есть однородная проволока длиной 1 метр с несколькими узлами, например, с тремя. Тогда мы не можем считать, что при растяжении проволоки за концы вероятность разрыва в узле будет такой же, как и в осталь- ных точках проволоки. Вероятнее всего проволока будет рваться в узлах. Пусть все узлы одинаковы, и вероятность
40 ТЕОРИЯ ВЕРОЯТНОСТЕЙ разрыва в каждом из них равна положительному числу р, такому, что р < 1/3, поскольку вероятность всех исходов должна быть равной единице. Разрывы в остальных точ- ках ввиду однородности проволоки равновозможны, поэто- му вероятность разрыва в А - множестве точек проволо- ки, не содержащем узлы, должна быть пропорциональна его длине, т. е. пропорциональна mesA. Отсюда легко понять, что если множество А не содержит узлы, то естественно по- ложить Р(Л) = (1 - Зр) mesA, если А содержит один узел, то Р(А) = (1 — 3p)mesA 4- р, если А содержит два узла, то Р(А) = (1 — 3p)mes А 4- 2р, и если А содержит три узла, то Р(А) = (1 — Зр) mes А 4- Зр. В этом примере мы встретились со смешанной ситуацией, в которой участвуют как геометрические вероятности, так и вероятности, отвечающие классической схеме. Это доста- точно простой пример. В сложных примерах невозможно вы- писать явные формулы для вероятностей произвольных со- бытий, однако можно сформулировать общие свойства, при- сущие вероятностям любых событий. Перейдем к изучению основ теории вероятностей в общем случае. Естественно ожидать, что они будут учитывать все известные нам результаты для частных случаев. Пусть Q - произвольное множество, природа элементов которого нам совершенно безразлична. Оно может быть как счетным, так и несчетным. Предположим, что Q являет- ся пространством всех элементарных исходов для какого- нибудь случайного эксперимента, каждому результату ко- торого соответствует ровно одна точка из Q, а разным ре- зультатам отвечают разные точки. Выделим некоторую со- вокупность подмножеств Q, обозначим ее А. Множества из А будем трактовать как случайные события. Естественно потребовать, чтобы события, полученные из А в результате рассмотренных нами выше (в § 2) операций над событиями, снова принадлежали бы А. Это, конечно, налагает на сово- купность множеств А некоторые условия, что приводит нас к следующим ниже определениям алгебры и <т-алгебры со- бытий. Определение 1. Совокупность А подмножеств множе- ства Q называется алгеброй, если выполнены следующие
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 41 условия: 1) Q G Л;_2) если А Е А и В Е А, то А 4- В G А; 3) если A G Л, то A G А. Пример. Пусть Q = [0,1). Тогда на отрезке [0,1) все множества, состоящие из конечного числа интервалов вида [a, ft), образуют алгебру. Оказывается, что условий 1) - 3) достаточно для того, чтобы другие операции над событиями из А не выводили бы нас за пределы алгебры Л. Это вытекает из следующего утверждения. Предложение 1. Пусть А - алгебра. Тогда а) 0 Е А , б) если А Е А и В Е А, то АВ € Л; в) если А Е А и В Е А, то А- В Е Л; г) если Aj Е А, I = 1,2,..., п, то Ai Е А; и П?=, А е А Доказательство, а) В силу условий 1), 3) имеем 0 = = П G Л. __ _ _ б) По свойству 10) §2 АВ = А 4- В, и, следовательно, АВ = АВ = А 4- В. Согласно условию 3) А Е Л, В 6 Л, а тогда по условию 2) А 4- В Е А. Снова воспользовавшись условием 3), имеем А 4- В Е Л, а это и означает, что АВ Е А. в) В силу определения разности событий А — В = АВ. Согласно условию 3) В Е А, и по свойству б) АВ Е А. г) Первое включение устанавливается с помощью много- кратного применения условия 2). Если Ai 4- А2 € А и A3 Е А, то по условию 2) выполняется (Ai 4- Аг) 4- A3 Е А и т. д. Второе включение устанавливается аналогично с помощью многократного применения свойства б). Если А1А2 Е А и Аз € Л, то по свойству б) (А1Аг)Аз Е А и т. д. Из предложения 1 следует, что любое конечное число из- вестных нам операций над событиями из Л не выводит за пределы алгебры. Однако, при рассмотрении многих задач теории вероятностей приходится иметь дело и с бесконеч- ным числом операций. Пример. Пусть эксперимент состоит в последовательном бросании монеты. Нас интересует событие А = {хотя бы один раз выпал герб}. Определим события Ак = {в первые k — 1 бросаний выпала решетка, а при k-м бросании выпал герб}, k = 1,2,.... Тогда ясно, что А = Л*.
42 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Для того, чтобы можно было рассматривать бесконечное число операций над событиями, необходимо усилить огра- ничения, налагаемые на алгебру А. Определение 2. Совокупность множеств А называется сг-алгеброй, если выполнены условия 1), 3) из определения алгебры и 2') если Ai ЕА,1 = 1,2,..., то £2^ А/ Е А. Условие 2Z) сильнее, чем 2), поскольку из 2') вытекает 2). Действительно, пусть Ai Е А и Az Е А. Положим А; = 0 при i 3. Тогда Ai + Az = А<, поскольку добавляя в сумму невозможные события 0, мы ничего не меняем. Теперь из условия 2') очевидно следует 2). Используя условие 3) и равенство Пьл Al ~ Ai легко убедиться в справедливости следующего утверждения. Предложение 2. Пусть А — tr-алгебра. Тогда, если A; Е А, I = 1,2,..., то П^1 Ai е А. Таким образом, счетное число операций суммирования или перемножения событий не выводит за пределы <т- алгебры. Событиям из ff-алгебры А сопоставляются их вероятно- сти. Вид явных формул, конечно, зависит от конкретной за- дачи, однако и в общей ситуации можно сформулировать естественные аксиомы и вывести некоторые свойства веро- ятностей, которые будут выполняться для всех частных слу- чаев. Определение 3. Если каждому множеству из А сопо- ставлено некоторое число, то будем говорить, что на А за- дана функция множеств. Определение 4. Вероятностью называется функция множеств, заданная на а-алгебре А подмножеств изО и удо- влетворяющая следующим условиям: 1) Р(А) 0 для любого А Е А; 2) Р(П) = 1; 3) если события А1,Аг,... попарно несовместны, т. е. Ai Aj = 0 для любых i j, то оо оо р(5»=£т). /=1 f=l
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 43 Условия 1), 2'), 3) в определении а-алгебры А и условия 1), 2), 3) в определении вероятности составляют аксио- мы теории вероятностей. Тройка (Й,Л, Р), удовлетворяю- щая этим аксиомам, называется вероятностным простран- ством. Остальные уже хорошо известные нам по §3 свойства вероятности выводятся из аксиом. В §3 мы вывели эти свой- ства, опираясь на классическое определение вероятности для случая конечного числа исходов эксперимента. Здесь мы выведем эти свойства исходя из аксиом теории вероят- ностей. Свойства вероятностей. 1) P(Q) = 1. Это свойство входит в определение вероятности. 2) Р(0) = 0. Действительно, по аксиоме 3) Р(0 + J2S1 'М = Р(0)+ + Р(А) и P(ESi Ai) = D=i P(At). Кроме того, 0 + = Ai, поэтому левые части этих равенств совпадают. Отсюда следует совпадение правых частей и вы- полнение требуемого свойства. Следствие 1. Если события Ai и Az несовместны, то p(A + a2) = p(A) + p(^2). Это утверждение вытекает из свойства 2) и аксиомы 3), если в нем положить Аз = 0, А4 = 0,.... Следствие 2. Если события Ai,l = 1,... , п, - попарно не- совместны, т. е. AiAj = 0 для любых i / j, то Р(ЕЛ-) = £Р(Л,)- 1=1 1=1 3) если Л С В, ТО Р(А) Р(В). Воспользуемся тем, что В = (В — А) + А при А С В. По- скольку события В — А и А несовместны, то применяя след- ствие 1 и аксиому 1), получим Р(В) = Р(В — Л) + Р(Л) Р(Л). 4) 0 Р(Л) 1 Для любого события А. Это свойство выполняется в силу свойства 3) и аксиом 1). 2).
44 ТЕОРИЯ ВЕРОЯТНОСТЕЙ 5) Р(Л) = 1 - Р(А). Поскольку события А и А несовместны и Q — А + А, то 1 = Р(П) = Р(А + А) = Р(А) + Р(А). 6) (формула сложения вероятностей) для любых собы- тий А и В Р(А + В) = Р(А) + Р(В) - Р(АВ). Доказательство. Справедливы следующие предста- вления: А+В = А+(В—А), где события А и В—А несовмест- ны; В = АВ + (В — А), где события АВ и В —А несовместны. Поэтому в силу следствия 1 имеем Р(А+В) = Р(А)+Р(В—А) и Р(В) = Р(АВ)+Р(В—А). Исключая из этих двух равенств Р(В — А), получим формулу сложения вероятностей. Следствие 3. Для любых событий Ац1 = 1,2,..., п, р(х»<£р<л'). J=1 1=1 Для п — 2 эта оценка следует из свойства 6). Тогда для произвольного п 2 можно написать р(£>)<р(Ел)+р(л.). 1=1 1=1 Для оценки вероятности суммы п - 1 событий снова мож- но воспользоваться такой же оценкой, и т. д. В результате получим требуемую оценку. 6') (общая формула сложения вероятностей) для лю- бых событий Ai, I = 1,2,..., п, p(f>) = - Ер(л'Л)+ i=i 1=1 i<j + 23 p^^-.^-ir-’pfn*). Kj<k 1=1 Эту формулу можно вывести из формулы 6) с помощью ме- тода математической индукции. Нужно положить Ai 4- Аг 4-
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 45 . • • 4- Лп-1 = А, Ап = В, воспользоваться формулой 6) и для п — 1 слагаемых применить общую формулу сложения веро- ятностей, предположив, что она верна. Подробно проделаем это лишь для п = 3. Дважды применяя формулу 6), имеем Р(А1 4- А2 4- Аз) = P(Ai 4* Аг) 4- Р(Аз) — P((Ai 4- Аг)Аз) = = P(Ai) 4- Р(А2) - Р(АМ2) 4- Р(А3) - Р(АХА3 4- А2А3). Для последнего слагаемого, снова применяя формулу 6), получим P(AiA3 4- А2А3) = Р(АхАз) 4- Р(А2А3) - Р(А1А3А2А3). Учитывая, что А1А3А2Аз = А1А2Аз и подставляя это выра- жение в предыдущую формулу, окончательно будем иметь Р(Ах 4- А2 4- А3) = P(Ai) 4- Р(А2) 4- Р(А3)- - P(AiА2) - Р(АМз) - Р(А2А3) 4- Р(А!А2А3). 7) свойства непрерывности: если Aj С А2 С Аз С ..., то Jim, P(An) = Р ( $2 Ль) 5 если Ai D А2 D А3 D .. •, то Jim, P(An) = Р ( П Л) • Доказательство. Поскольку А*_1 С А*, то сю сю 12Ак = - Л-1), fc=l fc=l где Ао = 0, и события А* — A^-i, k = 1,2,... попарно несо- вместны. Тогда по третьей аксиоме вероятности ОО ОО п Р(2>) =EF(^-M = „Um = fc=l fc=l fc=l = lim УХРИО-РИ»-,)) = lim (Р(Л„)-Р(0)) = lim P(A„). n—*oo z—* v n—*oo n—*oo Докажем второе свойство непрерывности. Поскольку Afc_i Э А*, то Afc_i С Ад,, и по первому свойству непрерывности сю "оо ,ь»р(д.)=р^4)=р(П4). fc=l к-1
46 ТЕОРИЯ ВЕРОЯТНОСТЕЙ роятностей Последнее равенство справедливо в силу свойства 12') §2 (п = оо). Переходя к дополнительным вероятностям, полу- чаем оо пНт(1-Р(Л„))=1-Р(Пл4), fc=l а это и есть второе свойство непрерывности. Лемма 1. Пусть события Qm таковы, что P(Qra) = 1 для любага натурального т. Тогда оо Р(П«™) = 1- т=1 Доказательство. Применяя свойство 12') §2 и след- ствие 3, получим ~п п п 0 < р(П n"0=р(£ < £ р(й>»)=°’ m=l т=1 т—1 так как Р(Пт) = 1 — P(Qm) = 0. По пятому свойству ве- = 1. Поскольку при к = 1,2,... 1 ' к — 1 к П D П то по второму свойству непрерывности т=1 т—1 вероятности окончательно имеем оо п Р(П«’»)=„«“Р(П«’») = 1- т—1 т=1 По аналогии с классическим случаем дадим следующее определение условной вероятности. Определение 5. Условной вероятностью события А при условии, что произошло событие В с Р(В) / 0, называ- ется число Р(А|В), которое определяется формулой Р(АВ) Р(В) • Используя это определение и свойства вероятности, не- сложно убедиться, что условная вероятность обладает все- ми свойствами вероятности.
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 47 Свойства условных вероятностей. 1) Р(Й|В) = 1; 2) Р(0[В) = 0; 3) 0 Р(А|В) 1. Эти свойства следуют непосредственно из определения. 4) если А С С, то Р(А[В) Р(С|В). Действительно, из А С С следует АВ С СВ} и по тре- тьему свойству вероятностей Р(АВ) Р(СВ). Поделив это неравенство на Р(В) и применив определение условной ве- роятности, получим требуемое утверждение. 5) Р(А|В) = 1 - Р(А|В). Это свойство является следствием цепочки равенств: _ P(fiB) _ Р((Л + А)В) _ Р(В) - Р(В) - = РС^+лв) = Р(Д»НР(Л?) = Р(Я|В)+Р(л1в). 6) (формула сложения условных вероятностей) для любых событий А и С Р(А 4- С|В) = Р(А|В) 4- Р(С|В) - Р(АС|В). Доказательство. Применяя формулу сложения обыч- ных вероятностей, имеем Р((А 4- С)В) = Р(АВ 4- СВ) = Р(АВ) 4- Р(СВ) - Р(АСВ). Поделив левую и правую части этого равенства на Р(В), получим формулу 6). 7) (формула умножения вероятностей) для любых со- бытий А и В Р(АВ) = Р(А)Р(В|А) = Р(В)Р(А|В). Формула непосредственно следует из определения условной вероятности. 8) (общая формула умножения вероятностей) для лю- бых событий Ai, Аг,..., Ап P(^42...An) = = Р(А1)Р(А2|А1)Р(А3|А1А2).. .Р(Ап|А1А2 ... Ал-1).
4а ТЕОРИЯ ВЕРОЯТНОСТЕЙ Вывод этой формулы из формулы 7) был осуществлен в § 5. Сохраняются в силе все определения, связанные с неза- висимостью событий, сформулированные в § 5. Большинство задач, которые возникают в теории ве- роятностей, связано, по-существу, с пересчетом вероятно- стей. Нужно подсчитать вероятность, возникающую в какой- нибудь сложной модели, когда вероятности, отвечающие простым компонентам этой модели, известны. При этом нас не интересует природа возникновения этих элементарных вероятностей. Их величина может быть получена из сообра- жений, связанных с симметрией и однородностью, или их приближенное значение может быть вычислено с помощью методов математической статистики. Рассмотрим одну задачу, решение которой опирается на полученные выше общие свойства вероятностей. Задача 1 (о расчете надежности электрических цепей). Пусть есть некоторая цепь элементов, соединенных после- довательно и параллельно. Например, цепь вида Рис. 3 Пусть известно, что элемент I выходит из строя (происходит разрыв цепи в этом элементе) с вероятностью р/. Естествен- но также предположить, что все элементы выходят из строя независимо друг от друга. Какова вероятность того, что вся цепь выйдет из строя, т. е. через нее не пойдет ток? Решение. Сначала нужно рассчитать вероятности от- каза элементарных цепей, т. е. цепей вида
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 49 |~Ч 1 I— -| 2 —Г~3~|--Г~4~1— 1) 2) Рис. 4 Введем события А/ = {выход из строя элемента /}. То- гда Р(А/) = рь Элементарная цепь вида 1) выходит из строя, когда события Ai и Аг наступают одновременно. Следовательно, Р(цепь 1) выходит из строя) = Р(А1А2) = Р(А1)Р(Аг) = Р1Р2- Элементарная цепь вида 2) выходит из строя, когда наступает либо событие Аз, либо А4. Поэтому Р(цепь 2) выходит из строя) = Р(Аз4-А4) = Р(Аз)4-Р(А4) — Р(АзА4) = рз 4- Р4 — рзР4- Нашу сложную цепь можно упро- стить с помощью укрупнения. Это означает, что мы элемен- тарные цепи рассматриваем как новые элементы (они вы- делены на рис. 4 пунктирной линией), вероятности отказа которых мы уже знаем: это Pi = рхрг и Рг = рз 4- Р4 — РзР4- Но упрощенная цепь будет снова вида 1), и вероятность ее отказа будет равна РхР2 = Р1Рг(рз + Р4 - РзР4)- Методом последовательного укрупнения схем можно рас- считывать вероятности отказа любых цепей, если вероятно- сти отказов элементов известны. Задача 2 (о разорении игрока). Рассмотрим игру в “ор- лянку”, когда игрок выбирает “герб”или “решетку”, после чего бросается монета. Если выпадает сторона монеты, на- званная игроком, то он выигрывает, получая 1 руб.; в про- тивном случае столько же проигрывает. Пусть начальный капитал игрока составляет х руб. и игрок ставит себе це- лью довести его до некоторой суммы s руб. большей чем х руб. Игра продолжается до тех пор, пока либо игрок на- берет заранее определенную сумму s, либо разорится, про- играв весь имеющийся у него капитал. Какова вероятность того, что игрок разорится?
50 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Решение. Введем события: Hi — {игрок выиграл на первом шаге}, Н2 = {игрок проиграл на первом шаге}, А = {игрок разорится, имея начальный капитал ® руб.}. Обозначим через рх = Р(А) искомую вероятность. Оче- видно, эта вероятность определена для любого целого х, очевидно ро = 1,р« = 0. Поскольку монета симметрична, то Р(Я1) = Р(Я2) — Если наступает событие Я1, то капитал игрока стал х 4- 1, а если наступает событие Н2, то капитал игрока стал х — 1. После этого можно считать, что игра начинается снова, и согласно принятому обозначению Р(А|Я1) = Р(А|Я2) = = p®-i, где х - любое число 1 х s — 1. Поскольку А = AQ = А(Я1 4- Я2) = AHi 4- АН2 и события Hi и Яг несовместны, то по формуле сложения вероятностей Р(А) = Р(ЛЯ1)4-Р(ЛЯг). Применяя формулу умножения ве- роятностей, получим Р(А) = Р(Я!)Р(Л|Я1) + Р(Я2)Р(А|Я2). Это в силу принятых обозначений дает следующее рекур- 1 , 1 рентное уравнение для вероятности рх: рх = -px+i 4- -px-i, 1 х s— 1. Известно, что решением этого уравнения явля- ется только линейная функция рх = ci 4- c2«, где ci, с2 - про- извольные коэффициенты. Эти коэффициенты можно опреде- лить, подставляя в выражение для рх значения х = 0 и х — s и пользуясь граничными условиями ро = 1,р, = 0. Имеем ci = l,Cj. 4-c2s = 0. Откуда следует, что сх = 1,с2 = — | и значит рх = 1 — 0 х 8. Задачи Задача 6.1. Двое бросают монету. Выигрывает тот, у ко- го первого выпадет герб. Найти вероятность выигрыша для каждого. Задача 6.2. Прибор содержит четыре узла: Ai, А2, А3, А4. Узел А2 дублирует Ai, а А4 дублирует A3. При отказе про- исходит автоматическое переключение. Надежность пере- ключающего устройства равна р. Надежность в течение за-
6. ОБЩЕЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ данного времени каждого из узлов равна Pi, i = 1,2,3,4. Вы- числить надежность прибора. Задача 6.3. Вероятность хотя бы одного попадания в ми- шень при трех выстрелах равна 0.875. Найти вероятность попадания при одном выстреле. Задача 6.4. Для того, чтобы разрушить мост, нужно по- падание не менее двух бомб. Независимо сбросили три бом- бы с вероятностями попадания 0.1, 0.3 и 0.4. Какова веро- ятность, что мост разрушен? Задача 6.5. Рассчитать вероятность отказа цепи (не идет ток), 1 4 F Рис. 5 где pi - вероятность отказа z'-ro элемента. Задача 6.6. Рассчитать вероятность отказа цепи (не идет ток), Рис. 6 где - вероятность отказа i-го элемента. Задача 6.7. Для того, чтобы сбить самолет достаточно одного попадания. Было сделано три выстрела с вероятно- стями попадания 0.1, 0.2 и 0.4 соответственно. Какова веро- ятность того, что самолет сбит?
52 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 6.8. Какова вероятность того, что при многократ- ном бросании игральной кости шестерка впервые выпадет на четвертом броске? Задача 6.9. Какова вероятность того, что при многократ- ном бросании правильной монеты герб впервые выпадет на четном броске? §7. Формула полной вероятности и формула Байеса При решении вероятностных задач часто возникает сле- дующая ситуация. Все пространство элементарных событий можно разбить на события, не содержащие общих исходов, тем самым выделяется группа несовместных событий, кото- рые в совокупности составляют достоверное событие. Пусть известно, каким образом вычислить условную вероятность при условии, что то или иное событие из этой группы про- изошло. Пусть, кроме того, ясно как вычислить вероятно- сти самих событий, входящих в эту группу. В таком случае очень полезным оказывается результат, получивший назва- ние “формула полной вероятности”. Определение 1. Набор событий Я1,Яг,...,Нп назы- вается полной группой событий, если они попарно несо- вместны и их сумма составляет достоверное событие: Hi 4- #2 4- • —h Нп — $2. Теорема 1 (формула полной вероятности). Пусть Hi,1 = 1,2,..., п, - полная группа событий, и Р(Я/) > 0- Тогда для лю- бого события А Р(А) = £Р(Я|)Р(А|Я1). 1=1 Доказательство. В силу свойств операций над собы- тиями (§2) А = ДГ2 = л4(Д1 -|- Н% 4" • • • 4" Нп) — АН^ 4" АН2 4- • • • 4-АНп. Поскольку события Hi попарно несовместны, то и события AHi тоже попарно несовместны. Тогда в силу следствия 2 §6 п Р(А) = Р(АЯ1 + АН2 + • + АН„) = 52 Р(АЯ|). 1=1
7. ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ И ФОРМУЛА БАЙЕСА 53 Теперь, применяя к слагаемым Р(АЯ/) формулу умножения вероятностей (§6), получим утверждение теоремы. Задача 1. Пусть в коробке есть 3 новых и 3 уже исполь- зованных теннисных мяча. Для первой игры наудачу берут из коробки 2 мяча и затем их возвращают в коробку. Како- ва вероятность для второй игры из этой коробки наудачу вынуть два новых мяча? Решение. Введем событие А — {вынуть два новых мя- ча для второй игры}. Ситуация перед второй игрой описы- вается следующими взаимоисключающими возможностями: Нз = {в коробке три новых мяча}, если в первый раз игра- ли двумя старыми мячами, = {в коробке 2 новых мяча}, если играли одним старым и одним новым, Н\ = {в коробке 1 новый мяч}, если играли двумя новыми мячами. Собы- тия Я1,Я2, Я3 составляют полную группу событий, так как они несовместны и в сумме составляют все возможные исхо- ды. Используя комбинаторные формулы, получим Р(Я3) = С?/С62 = 1/5,Р(Я2) = 3 3/С62 = 3/5,Р(Я0 = С32/С2 = 1/5. Далее имеем Р(А|Я3) = Cj/C? = 1/5,Р(А|Я2) = 1/Cj = = 1/15,Р(А|Я1) = 0. Теперь, используя формулу полной ве- роятности, найдем Р(А) = 1 • 0 + - • — 4-1.1 = 2_. v 7 б б 16 5 б 25 В рамках ситуации, которая была описана в начале па- раграфа, можно ответить и на следующий вопрос. Пусть известно, что произошло некоторое событие. Какова веро- ятность того, что при этом реализовалось то или иное со- бытие из выделенной полной группы событий? Ответ на этот вопрос дает следующий результат. Теорема 2 (формула Байеса). Пусть даны полная груп- па событий Hi,H2,...,Hn и некоторое событие А. Тогда для любого к = 1,2,...,п условная вероятность события Нь при условии, что событие А произошло, задается формулой I Р(н>)Р(л|н>) v 1 ' E"=i Р(я,)Р(л|»,)’
54 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Доказательство. В силу определения условной веро- ятности Р(Я*|Л) = Р(Я*Л)/Р(Л). Согласно формуле умно- жения вероятностей (§ 6) имеем Р'(НкА) = Р(Я*)Р(Л|Яд.). Следовательно, Р(Я1|Л) = £И^. Подставляя сюда выражение для Р(Л) из формулы полной вероятности, получим формулу Байеса. Задача 2. Два охотника одновременно и независимо стре- ляют в кабана. Известно, что первый попадает с вероятно- стью 0.8, а второй - 0.4. Кабан убит, и в нем обнаружена одна пуля. Как делить кабана? Решение. Наиболее естественным является следующий принцип деления. Делить следует пропорционально услов- ным вероятностям попадания каждого при условии, что в кабане имеется одна пуля. Дело в том, что при неограни- ченном (хотя бы и мысленном) повторении описанной си- туации частота, с которой будет добиваться успеха каждый из стрелков, будет сближаться с соответствующей условной вероятностью. Пусть А = {в кабане имеется одна пуля}. Ка- кую выбрать полную группу событий? Выберем такие собы- тия: Ноо = {не попал ни первый, ни второй}, Яю = {попал первый, не попал второй}, Hqi = {не попал первый, попал второй}, Ян — {попал первый, попал второй}. Нам нуж- но найти вероятности Р(Яю|Л) и Р(Яо1|Л). Очевидно, что Р(Л|Я00) = 0,Р(Л|Я1о) = 1, Р(Л|Я01) = 1,Р(Л|ЯП) = 0. По- скольку стрелки стреляют независимо друг от друга, то по формуле умножения вероятностей Р(Яю) = Р(попал первый)Р(не попал второй) = 0.8-0.6 = 0.48, Р(Яо1) = Р(не попал первый)Р(попал второй) = 0.2 0.4 = 0.08. Применяя формулу Байеса, получим р№°И) = б^Дбб = ? р(я°*И) = бетЕ = ?• Таким образом, первому следует отдать 6 долей из 7, а вто- рому - одну.
7. ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ И ФОРМУЛА БАЙЕСА 55 Задачи Задача 7.1. На рис. 8 изображена схема дорог. Рис. 7 Туристы вышли из пункта О, выбирая наугад на развет- влении дорог один из возможных путей (изменять направле- ние более чем на 90° нельзя). Какова вероятность того, что они попадут в пункт А? Задача 7.2. Есть четыре кубика с цифрами на гранях 1,2,..., 6 и одна правильная пирамида с цифрами на гранях 1,2,3,4. Наугад выбрали предмет и бросили. Выпала цифра 4. Какова вероятность того, что взяли кубик? Задача 7.3. Есть 10 симметричных монет, 8 нормальных, а на двух герб находится с обеих сторон. Наудачу взятая монета бросается три раза. Найти вероятность того, что выпадут три герба. Задача 7.4. В ящике 3 белых и 7 черных шаров. Один шар вынули наудачу и отложили в сторону. Следующий наугад вынутый шар оказался белым. Какова вероятность того, что отложенный шар был белым? Задача 7.5. В ящике 3 белых и 7 черных шаров. Один шар вынут и отложен в сторону. Какова вероятность, что следующий вынутый шар будет белым, если цвет первого неизвестен? Задача 7.6. Число грузовых машин, проезжающих мимо колонки, относится к числу легковых машин как 3:2. Вероят- ность того, что грузовая машина будет заправляться равна 0.1, а того, что будет заправляться легковая - 0.2. У бензо- колонки заправляется машина. Найти вероятность того, что это грузовая машина.
56 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 7.7. Три охотника одновременно и независимо стреляют в кабана. Известно, что первый попадает с ве- роятностью 0.8, второй - 0.4, а третий - 0.2. Кабан убит, и в нем обнаружены две пули. Как делить кабана? §8. Последовательные испытания (схема Бернулли) Схема Бернулли заключается в следующем. Проводятся п последовательных независимых одинаковых эксперимен- тов (испытаний), в каждом из которых может наступить или не наступить событие А. Под независимыми понимаются такие эксперименты, в которых любые события, возникаю- щие в разных экспериментах, являются независимыми в со- вокупности. Так как испытания одинаковы, то в любом из них событие А наступает с одинаковой вероятностью, обо- значим ее р — Р(Д). Вероятность дополнительного события обозначим q. Тогда q — Р(Л) = 1 — р. Наступление события А обычно называют успехом, а ненаступление - неудачей. Пример 1. Симметричная однородная монета бросается 10 раз. В каждом из бросаний нас интересует событие А = {выпал герб}. Здесь 10 испытаний, и так как монета симме- трична и однородна, то р — Р(Л) = 1/2, q — Р(А) = 1/2. Пример 2. Игральная кость бросается три раза. При каждом бросании нас интересует событие А = {выпала шестерка}. Здесь три испытания, и поскольку кубик сим- метричен и однороден, то р — Р(Л) = 1/6, q — Р(Л) = 5/6. Теорема 1 (формула Бернулли). Обозначим Рп(тп) = = Р (событие А наступило т раз в п испытаниях). Тогда Pn(™) = C™pmqn-m. (8.1) Доказательство. Пронумеруем испытания числами от 1 до п. Обозначим Ai — {наступление А в l-м испытании}. Ясно, что Р(Л) = р,Р(Л) = 1 — р = q, и события Ai,l = 1,2,..., п, независимы в совокупности. Для того, чтобы про- яснить суть доказательства, рассмотрим сначала конкрет- ный случай, когда п = 3, т — 2. Можно написать следующее представление для интересующего нас события: {А наступи- ло 2 раза в трех испытаниях } = А1А2А3 + А1А2А3 + А1А2А3. Число слагаемых здесь равно Cj — 3, что равно числу
8. ПОСЛЕДОВАТЕЛЬНЫЕ ИСПЫТАНИЯ 57 возможностей выбрать два числа среди трех чисел 1,2,3 без учета порядка. Это соответствует выбору пар номе- ров испытаний {1,2}, {1,3}, {2,3}, в которых наступает собы- тие А. Оставшийся номер отводится событию А. Слагаемые А1А2Аз, А1А2А3, А1А2А3 несовместны, так как не может, на- пример, наступать и одновременно не наступать событие А в третьем испытании. Каждое слагаемое является произве- дением независимых событий. Поэтому, применяя формулу сложения для несовместных событий и формулу умножения для независимых событий, получаем Р(А) = Р(Л1Л2Л;) + Р(Л1ЛМз) + Р(Л7Л2Лз) = р(Л1)р(л2)рда+риордарслз)+рдар(л2)р(Лз) = РРЧ + РЧР + ЧРР = Зр2ч = С^ч- Тем самым мы установили формулу Бернулли для п = 3,т = 2. Формула для общего случая доказывается анало- гично. Существует ровно С™ различных возможностей вы- брать т номеров испытаний, в которых наступает событие А. Таким образом, имеется С™ несовместных событий типа А1Л2Л3 ... AfcAfc+i... Ап, среди множителей которых т собы- тий вида Ai и п — т событий вида Ау. В сумме эти С™ несо- вместных событий составляют событие {А наступило т раз в п испытаниях}. Каждое из слагаемых имеет вероятность Р(А1А2Аз ... А*А*_|_ 1... Ап) = Р(А1)Р(А2)Р(А3).. .P(Afc)P(A*+i).. .Р(А„) = pmqn~m. Поскольку эти вероятности одинаковы, то суммарная веро- ятность имеет требуемый вид C™pmqn~m. Теорема 2. Пусть mi,m2 - целые числа, 0 mi т2 п. Обозначим через Pn(mi, m2) вероятность того, что событие А наступило не менее mi и не более m2 раз в п испытаниях. Тогда Ш2 P„(mi,m2)= £ СУ9»-‘, (8.2) ^=ГП1 или nil - 1 п P„(mi,m2) = l- (8.3) k=0 fc=m2+l
58 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Замечание 1. Следует использовать ту формулу, в кото- рой число слагаемых меньше. Доказательство теоремы 2. Для краткости фразу “в п испытаниях” будем опускать. Справедливо представление {Л наступило не менее mi и не более тг раз} = ГП2 — {А наступило ровно к раз}. fc=mi Все слагаемые являются несовместными событиями, так как А не может наступать различное число раз в п испытаниях одновременно. Используя формулу сложения вероятностей и формулу Бернулли, получим Pn(mi,m2) = Р(А наступило не менее mi и не более тг раз) т2 тг = У2 Р(-^ наступило ровно к раз) = У^ C*pfcgn-fc. k—mi jfe=mi Второе выражение для Pn(mi,m2) справедливо в силу фор- мулы бинома Ньютона: ECnW‘ = (₽+,)» = !. к=0 Определение 1. Число наступлений события А на- зывается наивероятнейшим, если оно имеет наибольшую вероятность по сравнению с вероятностями наступления А любое другое количество раз. Теорема 3. Наивероятнейшее число наступлений события А в п испытаниях заключено между числами пр — q и пр Ар. Замечание 2. Если пр — q - целое число, то наивероят- нейших чисел два: пр — q и пр + р. Доказательство. По формуле Бернулли при m = 1,2,. . . , 71, Рп{т) _ C™pmqn~m _ n!(m - l)!(n - m 4-1)!р _ (п 4-1 - т)р Pn(m-1) C^l-1p’n_1gn~m+1 m!(n - m)!n!g ~ m(l - p)
8. ПОСЛЕДОВАТЕЛЬНЫЕ ИСПЫТАНИЯ 59 Следовательно, вероятность Pn(m) будет больше, равна или меньше вероятности Рп(т — 1) в зависимости от того, какое из следующих трех соотношений будет выполняться (n 4-1 — т)р т(1 — р) >1, (п 4-1 — т)р т(1 - р) (п 4-1 - т)р 1 7П(1 — р) Если переписать эти соотношения в более простом виде (n + l)p>m, (n4-l)p = m, (п 4- 1)р < тп, то мы приходим к выводу, что Рп(пг) > Рп(т — 1), если т < (п 4- 1)р, (8-4) Рп(т) = Рп(тп — 1), если т = (п 4- 1)р, (8-5) Рп(т) < Рп(т — 1), если m > (п 4-1)р. (8-6) Следовательно, вероятность Pn(m) сначала возрастает, ко- гда т < (п 4- 1)р, а затем убывает, когда т > (п 4- 1)р. В случае, когда (п4- 1)р не является целым числом, для наиве- роятнейшего числа наступлений события А (обозначим его то) должно выполняться неравенство Рп(т,о 4- 1) < Pn(mo), что согласно (8.6) возможно при то 4- 1 > («4- 1)р, т. е. при т0 > пр — д, а также должно выполняться неравен- ство Рп(т0 — 1) < Рп(^о)> что в силу (8.4) возможно при то < пр 4- Р- Таким образом, пр — q < то < пр + р. Это и утверждается теоремой. Заметим, что разность между пр4-р и пр — q равна единице, и значит число то единственно. В случае, когда пр 4- р является целым числом, то то = пр 4- р будет наивероятнейшим числом наступлений события А, од- нако mo — 1 тоже будет таковым, поскольку в силу (8.5) Рп(шо) = Pn(mo —1). Поэтому таких чисел будет два, а имен- но т^ = пр — q, т(02) = пр + р. Задача 1. Вероятность попадания в цель при каждом вы- стреле из лука равна 1/3. Производится шесть выстрелов. Какова вероятность ровно двух попаданий? Какова вероят- ность не менее двух попаданий? Каково наивероятнейшее число попаданий? Решение. Обозначим А — {попадание при одном выст- реле}, р = Р(Л) = 1/3, q = 1 — р = 2/3. Число выстрелов
60 ТЕОРИЯ ВЕРОЯТНОСТЕЙ п = 6. Естественно предположить, что выстрелы не зависят друг от друга. Тогда ответ на первый вопрос находим по формуле Бернулли p.m-r’PVPV- 1516 - 80 -“5Г--йз~з- Ответ на второй вопрос следующий: вд,.)..-й(1),(й‘-огй)'(9‘-4-¥-ЙЧ- Наивероятнейшее число попаданий лежит в пределах от 6 • - — - до 6 • 4- т. е. от 1^ до 2^. Следовательно, оно 3 3 3 3 3 3 равно двум. Задача 2 (Банаха). Некий курящий математик носит с собой две коробки спичек. Каждый раз, когда он хочет до- стать спичку, он выбирает наугад одну из крробок. Найти вероятность того, что когда математик вынет в первый раз пустую коробку, в другой коробке окажется ровно г спичек, О < г п, где п - число спичек, бывших первоначально в каждой из коробок. Решение. Пусть А - событие, которое состоит в том, что вынимается спичка из коробка, который в конце оказал- ся пустым. Если вынутая коробка пуста, а другая коробка содержит г спичек, то это означает, что спички брались все- го 2п—г раз. При этом событие А наступило ровно п раз, так как коробок стал пустым. Поскольку каждый раз коробок выбирается наугад, то Р(А) = 1/2. По формуле Бернулли событие А наступает п раз в 2п — г испытаниях с вероятно- стью Задачи Задача 8.1. В семье 10 детей. Считая вероятности ро- ждения мальчика и девочки равными 1/2, определить ве- роятность того, что в данной семье: а) пять мальчиков; б) мальчиков не менее трех, но и не более восьми. Задача 8.2. Что вероятнее выиграть у равносильного шахматиста (ничейный исход партии исключен): больше од- ной партии из четырех или больше двух партий из пяти?
9. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СХЕМЫ БЕРНУЛЛИ 61 Задача 8.3. (Проблема Джона Смита) В 1693 г. Джо- ном Смитом был поставлен следующий вопрос: одинаковы ли шансы на успех у трех человек, если первому надо полу- чить хотя бы одну шестерку при бросании игральной кости 6 раз, второму - не менее двух шестерок при 12 бросаниях, а третьему - не менее трех шестерок при 18 бросаниях. Задача 8.4. В кошельке лежат 8 монет достоинством 5 копеек и 2 монеты достоинством 3 копейки. Наудачу выби- рается монета и бросается 5 раз. Какова вероятность того, что в сумме будет 15 очков, если герб принимается за 0. Задача 8.5. Какова вероятность выпадения хотя бы двух шестерок при трех бросаниях игральной кости? Задача 8.6. В помещении четыре лампы. Вероятность ра- боты в течение года для каждой лампы 0.8. Найти вероят- ность того, что к концу года горят три лампы. Чему равно наивероятнейшее число ламп, которые будут работать в те- чение года? Задача 8.7. Партия изделий содержит 1 % брака. Каков должен быть объем контрольной выборки, чтобы вероят- ность обнаружить в ней хотя бы одно бракованное изделие была не меньше 0.95. Задача 8.8. Два баскетболиста делают по три броска в корзину. Вероятность попадания мяча при каждом броске равна соответственно 0.6 и 0.7. Найти вероятность того, что у обоих будет равное количество попаданий. § 9. Предельные теоремы для схемы Бернулли Сохраним все обозначения предыдущего параграфа. В случае, когда число испытаний велико, формулу Бернулли применять неудобно. Для больших п существуют прибли- женные формулы. Эти формулы тем точнее, чем п больше. Рассмотрим сначала случай, когда с ростом п вероят- ность р уменьшается обратно пропорционально п. При ма- лых р, речь идет о появлении очень редких событий, так как вероятность их наступления в отдельном испытании ма- ла. Однако вероятность появления одного или нескольких редких событий в длинной серии испытаний уже не будет малой величиной. В этом параграфе и далее соотношение ап ~ Ьп, где {ап}
62 ТЕОРИЯ ВЕРОЯТНОСТЕЙ и {&„} - две числовые последовательности, означает, что ап1Ъп —► 1 при п —► оо, или, что то же самое, ап = 6П(1-Ь -Н>(1)), где о(1) обозначает некоторую величину, стремящу- юся к нулю. Соотношение ап « Ьп, означает, что ап — Ъп —► О при п —► оо Теорема 1 (Пуассона). Предположим, что произведение пр является постоянной величиной, когда п неограниченно возрастает. Обозначим А = пр. Тогда для любого фиксирован- ного т и любого постоянного А lim Рп(т} — П-+ОО ' ' пр=Л Ат -А "ПГе • т: Доказательство. Применяя формулу Бернулли, по- лучим 1 хт / а\ п~т = — n(n - 1).. . (п - т 4-1)— (1-) = т! ' ' х ' пт \ п) Поскольку при любом фиксированном в имеет место сходи- мость 1 — - —* 1 при п —► оо, то Рп(ш) ~ Теперь, используя замечательный предел несложно убедиться в справедливости утверждения теоре- мы. Задача 1. Радиоаппаратура состоит из 2000 элементов. Вероятность отказа одного элемента в течение года равна 0.001. Какова вероятность отказа двух элементов за год? Какова вероятность отказа не менее двух элементов за год?
9. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СХЕМЫ БЕРНУЛЛИ 63 Решение. Работу каждого элемента рассматриваем как отдельное испытание. Обозначим А = {отказ элемента за год}. Имеем р = Р(Л) = 0.001, А = пр = 2000 • 0.001 = 2. По формуле Пуассона о2 Р20оо(2) SS ^е"2 = 2е-2 « 0.2707. Ответ на второй вопрос дается формулой Ргооо(2,2000) = 1 — Ргооо(О) — Ргооо(1) « 1 - ~е’2 - |уе~2 = 1 - Зе"2 » 0.594. Рассмотрим еще одну приближенную формулу для веро- ятности Рп(тп), когда п велико. В отличие от предыдущего результата число успехов тп в этом случае тоже растет с ростом п, а вероятность успеха постоянна. Теорема 2 (Муавра-Лапласа (локальная)). Положим хп — Предположим, что т —* оо,п —* оо и величины, хп являются ограниченными. Тогда y/npqPn(m) ~ —==е~Т*/2. В частности, если хп —► х, то y/npqPn(m) -> -L=e-®2/2. V ATT Доказательство. В силу ограниченности величин хп разность п—т стремится к оо вместе спит. Воспользуемся формулой Стирлинга из § 1 для к = п,к = тик = п — т. Тогда получим
64 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Поскольку в силу определения хп имеем т = пр + хп y/npq, (9-1) п — т — п — пр — Хпу/npq — nq — xnyfnpq, (9.2) то т 1 xny/q ! — 1 + — ~ 1, пр у/пр (9-3) и п — т _ 1 _ хПу/р 1 nq х/пч (9.4) Поэтому, при достаточно большом п, /--D \ 1 Л . ®пх/р\-(П"т) = -4= exp (-т In (1 + — (n — т) In fl — v2x \ \ y/np / ' \ y/nq / / Далее воспользуемся следующим асимптотическим выра- жением: ,2 ln(l + z) = z — -^-(1 + о(1)) при z —> 0. Тогда 0wP„(m) ~ ^ехр(-т{^ - ^(1 + 0(1))}- -("-т){-Э*-^(1+о(1))})- (98) В силу (9.1), (9.2), (fzi —~ ТП^у^Р rnjq\ t \ ---(nqp ~ Хп У™™ ~'ПРЧ~Хп у/прм) = = -®n(p + g) = -а?п- Применяя (9.3), (9.4), получим, что d{<^±(i+o(1))+^(1+o(1))}^
9. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СХЕМЫ БЕРНУЛЛИ 65 ~ ^{р(1 + 0(1)) + «(1 + 0(1))} ~ ^(р + «) = Т- Подставляя полученные выражения в (9.5), имеем TnpgPn(m) - -i=exp(-a?2 + ^-(1 4-о(1))) ~ -4=ехр(-^-). Теорема доказана. Рассмотрим приближенную формулу для вероятности Pn(mi,m2) того, что событие А наступило не менее mi и не более тг раз в п испытаниях, когда п велико. Предполо- жим, что числа mi и тг растут с ростом п, а вероятность успеха постоянна. Теорема 3 (Муавра-Лапласа (интегральная)). Поло- жим mi — пр , та — пр Нп ............... ..- , Vfl — . ... . sjnpq y/npq Предположим, что mi —* оо, п —* оо, и величины ап и Ьп явля- ются ограниченными. Тогда ъ» ал Доказательство. По локальной теореме Муавра- Лапласа Р„(т) = —2—+ 0^,(1)), где хп(т) = mi m тг и от(1) - величина, стре- мящаяся к нулю при п —► оо. Величина от(1) зависит от т. При доказательстве теоремы 2 можно было бы установить, что справедливо равномерное предельное соотношение: lim sup |om(l)| = 0. (9.6) n-+oo m]l^,n^ni3 Это привело бы к значительному усложнению выкладок, по- этому мы принимаем это соотношение без доказательства. Согласно теореме 2, § 8 та та Р„(т1,т2)= £ Р»(т)= £ T^^^d + ’-d))- m=mi m=mi v
ТЕОРИЯ ВЕРОЯТНОСТЕЙ Обозначим хп(т+1)—хп(тп) = Дхп(т). Тогда Дхп(т) = -^х, упР9 и вероятность Pn(mi > m2) представима в виде П>2 P„(mi,m2) = 4= V + m=mi Отсюда следует, что «а |Pn(mi,m2)- 52 е~*^го>/2Д®п(т)| < m=mi *»э sup |om(l)|-~= 52 е~*»(т>/аДа?п(т). т^т^т, V“« _ По определению интеграла е-«;(’»)/2ДЛп(т) Подставляя это выражение в предыдущее неравенство и учитывая соотношение (9.6), найдем >n(mi,m2) Теорема доказана. Положим а? О Отметим одно очевидное свойство функции Ф(г), она явля- ется нечетной. Значения функций ф(х) и Ф(г) находятся из таблиц, при этом таблицы даны лишь для неотрицатель- ных значений х. Функция ф(х) называется функцией Гаусса, а функция Ф(г) называется функцией Лапласа. Используя
9. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ СХЕМЫ БЕРНУЛЛИ 67 функции ф(а?) и Ф(®), сформулированные выше результаты можно кратко выразить так: локальная теорема Муавра- Лапласа утверждает, что р"<т) ~ где х"=^’ (9-7) а интегральная теорема Муавра-Лапласа - что Рп(т1,т2) « ^(Ф(М -Ф(ап)), (9.8) где ап = п-, bn = т\ nj}. Требование о том, что ве- y/npq y/npq золувхны. ап,Ъп предполагаются ограниченными, не является существенным. Это будет следовать из теоремы 2 § 17 (см. пример 1). Задача 2. Найти вероятность того, что при 150 выстре- лах мишень будет поражена ровно 70 раз, если вероятность попадания при одном выстреле равна 0.4. Решение. Данная задача решается с использованием схемы Бернулли: п = 150, А = {попадание при одном выстреле}, р = Р(А) = 0.4, q = 1 — р = 0.6, т = 70. При- меним локальную теорему Муавра-Лапласа. Имеем y/npq = = >/150 • 0.4 • 0.6 = 6, хп = « 1.67. Тогда О 6 Р15о(7О) ~ |#1.67) « j • 0.0989 « 0.0165. Задача 3. Город ежедневно посещают 1000 туристов, ко- торые днем идут обедать. Каждый из них выбирает для обе- да один из двух городских ресторанов с равными вероят- ностями и независимо друг от друга. Владелец одного из ресторанов желает, чтобы с вероятностью приблизительно 0.99 все пришедшие в его ресторан туристы могли там од- новременно пообедать. Сколько мест должно для этого быть в его ресторане? Решение. Пусть А = {турист пообедал у заинтересо- ванного владельца}. Наступление события А будем считать “успехом”, р = Р(А) = 0.5, п = 1000. Нас интересует такое наименьшее число т, что вероятность наступления не менее
68 ТЕОРИЯ ВЕРОЯТНОСТЕЙ чем т “успехов* в последовательности из п = 1000 незави- симых испытаний с вероятностью успеха р = 0.5 приблизи- тельно равна 1 — 0.99 = 0.01. Это как раз вероятность пере- полнения ресторана. Таким образом, нас интересует такое наименьшее число т, что Рюоо(”», 1000) « 0.01. Применим ин- тегральную теорему Муавра-Лапласа. Имеем y/npq = 5>/10, . 1000 - 500 ,п ЛГ(\ l т~500 т in /in bn —-----7=— = lOylO, bn = 7=- = —t= — 10vl0, m неиэ- 5У1о ’ ” 5\/1б 5У10 ’ вестно. Тогда 0.01 И P1000(m, 1000) ss 1 (ф(ЮД0) - ф(^5 - Ю-До))м Откуда следует, что ф(пй-10^°)и0-98- Используя таблицы для функции Ф(ж) находим, т 5\/10 — Юл/ТО « 2.33, и, значит, т ~ 2.33 • 5а/10 + 500 « 536.8. Сле- довательно, в ресторане должно быть 537 мест. Задачи Задача 9.1. Текст содержит 20000 букв. Каждая буква может быть неправильно напечатана с вероятностью 0.0004. Какова вероятность, что в тексте не менее двух опечаток? Задача 9.2. Телефонная станция обслуживает 600 або- нентов. Вероятность любого позвонить в течение часа равна 0.005. Какова вероятность того, что в течение часа позвонит один или два человека? Задача 9.3. Игральную кость бросают 80 раз. Найти приближенно границы, в которых число выпаданий шестер- ки будет заключено с вероятностью 0.9973. Задача 9.4. В партии из 768 арбузов каждый арбуз ока- зывается неспелым с вероятностью 1/4. Найти вероятность того, что количество спелых арбузов будет в пределах от 564 до 600.
10. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 69 Задача 9.5. Вероятность найти белый гриб среди прочих равна 1/4. Какова вероятность того, что среди 300 грибов белых будет 75? Задача 9.6. Завод отправил в магазин 5000 лампочек. Ве- роятность того, что лампочка разобьется при транспорти- ровке равна 0.0002. Найти вероятность того, что в магазин привезли не более трех разбитых лампочек. Задача 9.7. При социологических опросах граждан ка- ждый человек независимо от других может дать неискрен- ний ответ с вероятностью 0.2. Найти вероятность того, что из 22500 опросов число неискренних ответов будет не более 4620. $ 10. Случайные величины и функции распределения Рассмотрим сначала случайный эксперимент с дискрет- ным пространством исходов, т. е. с таким пространством элементарных событий Q = {o>i,W2,. •которое состоит из конечного или счетного числа исходов. Пусть есть величи- на, которая в результате случайного эксперимента прини- мает различные числовые значения в зависимости от насту- пления того или иного исхода, при этом каждому исходу соответствует только одно число. Иными словами, на про- странстве элементарных событий задана функция. Определение 1. Функция, заданная на пространстве элементарных событий Q = {wi,о>2,...}, называется случай- ной величиной. Для любого исхода w значение х = Х(ш) - это реализа- ция случайной величины при данном исходе. Поскольку в ходе случайного эксперимента реализуется липп» один какой-то исход, то это означает, что в результа- те эксперимента наблюдается липп» какое-то одно значение случайной величины (одна реализация) из всех возможных. Обозначать случайные величины будем заглавными ла- тинскими буквами X, У,..., а конкретные их значения соот- ветствующими строчными буквами х, у... Пример 1. Пусть бросается игральная кость. Величина X, равная числу выпавших очков, является случайной вели- чиной. Величина X принимает значения 1, 2, 3, 4, 5, 6.
70 ТЕОРИЯ ВЕРОЯТНОСТЕЙ В этом примере элементарный исход - это выпадение той или иной грани игрального кубика. В стандартной ситуации (игральная кость) на гранях кубика написаны цифры 1, 2, 3, 4, 5, 6. Однако можно этим граням сопоставить и другие числа. Тогда мы получим другую случайную величину, хо- тя пространство элементарных исходов и соответствующие им вероятности 1/6 останутся прежними. Лля дискретных пространств Q = {iui, сиг, • • •} будем обо- значать xi = X(cuj), I = 1,2,.... Величина X принимает при этом не более чем счетное число значений {zi, а?г, • • •} и на- зывается дискретной. Значение zj случайной величины X наступает с некоторой вероятностью, обозначим ее рь Яс- но, что pi = У2 Pfa). Кратко это будем записывать :Х(ш1 )=з?1 так: pi = Р(Х = xi). В силу аксиом 3) и 2) из определения вероятности (§ 6) следует, что ео ео сю 'Еп = £р(* =*<)=p(L<* = «>)) = »• 1=1 1=1 1=1 Определение 2. Соответствие, которое каждому зна- чению хг дискретной случайной величины X сопоставля- ет его вероятность р/, называется законом распределения случайной величины X. Закон распределения величины X удобно задавать в виде таблицы: X а?1 «2 ... р Р1 Р2 Рп Пример 2. Пусть X - число гербов, выпавших при че- тырех бросаниях правильной монеты. Величина X может принимать значения 0, 1, 2, 3, 4. По формуле Бернулли о) (о) = 77» и> Следовательно, X/ \х/ 1о закон распределения имеет вид X 0 1 2 3 4 р 1 16 4 16 6 16 4 16 1 16
10. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 71 Замечание 1. Если X - дискретная случайная величина, то для любой функции д величина Y — д(Х) тоже является дискретной случайной величиной. Эта величина принима- ет значения yi = g(xi) с вероятностями pi = Р(Х = xi), I = 1,2,..., п, если функция д взаимно однозначна. Если же зна- чения g(xi) совпадают для различных xi с величиной у™, то Y — д(Х) принимает общее значение ym с вероятностью, равной сумме вероятностей pi, отвечающих всем таким xi, для которых д(хг) = ут. Задача 1. Дискретная случайная величина X имеет закон распределения X -2 -1 0 1 2 р 0.1 0.2 0.3 0.3 0.1 Построить закон распределения случайной величины Y = = Х2 + 1. Р ешение. Значение 1 величина Y принимает только, ко- гда величина X принимает значение 0, с вероятностью 0.3. Значение 2 величина Y принимает, если величина X при- нимает значение —1 или 1 с вероятностями 0.2 и 0.3 соот- ветственно. Тогда эти вероятности нужно сложить, что даст вероятность события Y = 2. Аналогично вероятность того, что Y = 5 будет равна 0.1 + 0.1 = 0.2. Следовательно, закон распределения случайной величины У = X2 + 1 имеет вид У 1 2 5 р 0.3 0.5 0.2 Рассмотрим случайные величины, которые могут уже быть не дискретными. При определении таких случайных величин множество Q уже не является счетным и мы должны опираться на аксиомы теории вероятностей § 6. Будем счи- тать, что из подмножеств пространства элементарных со- бытий Q выделено семейство множеств А, которое является с-алгеброй. Множества из А составляют всевозможные со- бытия случайного эксперимента. Предположим также, что
72 ТЕОРИЯ ВЕРОЯТНОСТЕЙ на А задана вероятность Р, удовлетворяющая аксиомам те- ории вероятностей. Определение 3. Случайной величиной называется функция X = Х(о>), заданная на пространстве элементарных событий Q, для которой событие {X < ж} = {w : Х(ш) < х} принадлежит а-алгебре А для любого вещественного х. Условие {X < х] G А дает возможность рассматривать вероятности событий {X < х], поскольку вероятности опре- делены только на множествах из А. Кроме того, через собы- тия {X < ж}, х G (—оо,оо), с помощью известных операций над событиями можно выразить сколь угодно сложное собы- тие, связанное со случайной величиной X. Такое событие будет также принадлежать <т-алгебре А, и, следовательно, для него определена вероятность. Вся совокупность вероятностей Р(Х < ж), ж 6 (~оо,оо) за- дает закон распределения случайной величины X в общем случае. Часто для краткости закон распределения называ- ют просто распределением случайной величины X. Определение 4. Функция F(x) = Р(Х < ж), ж G [— оо,оо], называется функцией распределения случайной величины X. Замечание 2. Для дискретных случайных величин F(x) = Р(Х <«) = Р(Е„<Г{Х = «,}) = E^Ppr = х.) = Ясно, что функция F(x) однозначно определяет все вероят- ности pi. Пример 3. Функция распределения величины X, равной числу гербов, выпавших при четырех бросаниях симметрич- ной монеты, имеет вид Рис. 8
10. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 73 Свойства функции распределения. 1) если < а?2, то F(xi) Ffo), т. е. F(x) - неубывающая функция; 2) F(-oo) = 0,F(oo)=l; 3) функция F(x) непрерывна слева: lim^y F(x) = F(y). Доказательство этих свойств целиком опирается на свойства вероятностей (§б). Положим А = {X < Ж1},В = {X < жг}. При «1 < Х2 выполняется включение А С В, т. к. если Х(ш) < Xi, то и Х(ш) < жг< По третьему свойству веро- ятностей имеем Р(А) Р(В), а это по определению функции распределения и означает, что F(xi) F(xz). Поскольку {X < —оо} = 0, а {X < оо} = Q, т. е. эти события являются соответственно невозможным и досто- верным, то по первому и второму свойству вероятностей Р(Х < —оо) = 0, а Р(Х < оо) = 1. Это составляет второе свойство функции распределения. Выберем произвольную монотонно возрастающую после- довательность жп, стремящуюся к точке у. Тогда для к = 2,3,... выполняется {X < a?*-i} С {X < ж*}, vl {X < у} - ОО = £{Х < xk}. По седьмому свойству вероятностей при k—1 п —+ оо оо Р(Х < хп) - р(£{х < «»}) = р(х < »)• к=1 В силу определения функции распределения это соотноше- ние можно переписать следующим образом: F(xn) —+ F(y) при хп Т у. Таким образом, справедливо третье свойство функций распределения. Лемма 1. Для любых а <Ь выполняется равенство Р(а X < b) = F(b) - F(a). (10.1) Доказательство. Очевидно, что {X < b} = {X < а} 4- {а X < 6}, при этом события {X < а} и {а X < &} несовместны. Ис- пользуя формулу сложения вероятностей, получим Р(Х < Ь) = Р(Х < а) + Р(а < X < Ь),
74 ТЕОРИЯ ВЕРОЯТНОСТЕЙ и, следовательно, Р(а X < Ь) = Р(Х < 6) - Р(Х < а) = F(b) - F(a). Определение 5. Если существует такая неотрицатель- ная функция /(у), что функция распределения F(x) для ка- ждого х G (—оо,оо) представима в виде F(») = f fWv, (Ю-2) —оо то f(x) называется плотностью распределения случайной величины X. Если случайная величина X имеет плотность распреде- ления, то ее функция распределения непрерывна, поскольку интеграл - непрерывная функция верхнего предела. В случае существования плотности формулу (10.1) можно записать следующим образом: ъ а ь Р(а X < Ъ) = J f(y)dy- J f(y)dy = J f(y)dy. (10.3) —оо —оо а Для непрерывной плотности распределения из формулы (10.3) и теоремы о среднем для интегралов следует, что при Д —* 0 справедливо соотношение Р(Х G [яг, х + Д)) и /(х)Д. (10.4) Это соотношение раскрывает суть плотности распределе- ния, выражающуюся в том, что вероятность попасть в про- извольно малый интервал, содержащий данную точку, сколь угодно близка к произведению плотности распределения в точке на длину интервала. Свойства плотности распределения. ОО 1) f f(y)dy = l\ “ОО 2) /(а?) = F'(x), если функция распределения дифференци- руема.
10. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 75 Для проверки первого свойства достаточно в (10.3) по- ложить а = —оо,6 = оо и заметить, что тогда слева в (10.3) стоит вероятность достоверного события. Дифференцируя равенство (10.2), получим второе свойство. Пример 4. Однородная проволока длиной 1 метр рас- тягивается за концы и разрывается. Пусть X - случайная величина, равная расстоянию от точки разрыва до левого конца проволоки. Используя геометрические вероятности, найдем, что Р(»! X < х2) = —= х2 - Х1 mes(0,1) для любых 0 1. Следовательно, функция рас- пределения и плотность распределения этой случайной ве- личины имеют вид ' 0, при х $о, F(x) = < X, при 0 5 £ а? 1, 1, при 1 3 $ ' О, при х < О, /(а?) = < 1, при 0 х < 1, k 0, при 1 х. Пусть у — д(х) — монотонно возрастающая функция, х = <7-1(у) _ обратная функция. Если X ~ случайная величина, то Y — д(Х) тоже является случайной величиной, посколь- ку {У < у} = {</(Х) < у} = {X < <7-1 (*/)}, и, следовательно, событие {У < ?/} принадлежит а-алгебре А для любого ве- щественного j/, поскольку {X < <7-1(?/)} принадлежит А. Для функций распределения величин X и У справедливо соотношение Fy(y) = Р(У < у) = Р(Х < = Гх(Г*(У)). (10.5) Если случайная величина X имеет плотность распределе- ния /х(®)» а функция д(х) дифференцируема, то случайная величина У тоже имеет плотность распределения /y(j/) и /у(!/) = /х(Г1(!/))(Г*Ы)'- (10.6) Это равенство, в силу второго свойства плотности рас- пределения, является следствием результата дифференци- рования соотношения (10.5). При использовании равенства (10.6) бывает полезной формула (rW = WGr’W)-
76 ТЕОРИЯ ВЕРОЯТНОСТЕЙ В случае, когда у = д(х} - монотонно убывающая дифферен- цируемая функция, можно показать, что Му) = Л(Г*(»))/1»'(Г1(»))|. (ю.7) Эта формула верна и для взаимно однозначных (существует обратная функция) кусочно монотонных функций д(х). Тот факт, что возможно для счетного числа точек (концов ин- тервалов монотонности) этой формулой значения /у (у) не определяются, не является принципиальным. Плотности на выделенном счетном множестве можно придать любое зна- чение, при этом функция распределения не изменится в силу свойств интеграла. Существует широкий класс функций д(х), не обязательно монотонных, для которых У = д(Х) будет случайной величи- ной. К нему относятся, например, все непрерывные функции. Обсуждение этой проблемы выходит за рамки элементарно- го курса, так как требует дополнительных знаний из теории функций. Задача 2. Случайная величина X имеет распределение Коши с плотностью распределения = при -оо<х<оо. Вычислить плотность распределения обратной случайной величины У = 1/Х. Решение. Функция у — 1/х не определена в нуле, убыва- ет на интервалах (—оо,0), (0,оо) и имеет однозначную обрат- ную функцию х = 1/у. Применяя формулу (10.7), получим Му) = ^,,Л^ = —1—, при -оосрсоо. Следовательно, величина, обратная величине, распределен- ной по закону Коши, также имеет распределение Коши. Задачи Задача 10.1. В урне 5 белых и 25 черных шаров. Выну- ли 2 шара. Случайная величина X - число вынутых белых
10. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 77 шаров. Построить закон распределения и функцию распре- деления величины X. Задача 10.2. Построить закон распределения и функцию распределения числа попаданий мячом в корзину при трех бросках, если вероятность попадания каждый раз равна 0.8. Задача 10.3. Случайная величина X имеет плотность распределения Г о, /(®)=S |зп1ж, I О, при тг < X, при 0 < X 7Г, при х 0. а) Определить функцию распределения F(x)', б) найти веро- ятность того, что величина X примет значение, заключенное в интервале (0,тг/4). Задача 10.4. Дискретная случайная величина X имеет закон распределения X 0 7Г 6 7Г 2 5тг 6 7Г 1 3 1 2 3 р — ж ___ 10 10 10 10 10 Построить закон распределения случайной величины Y = sinX. Задача 10.5. Случайная величина X имеет плотность распределения /х(®) = е~х,х 0. Найти функцию распре- деления случайной величины Y = е~х. Задача 10.6. Случайная величина X распределена с плотностью распределения fx(x). Найти плотность распре- деления случайной величины Y = X2. Задача 10.7. Построить закон распределения для вели- чины X, равной числу выпадений очков кратных трем при четырех бросаниях игральной кости. Задача 10.8. Случайная величина X имеет плотность распределения вида Г ах2, при 0 х 2, /(ж) = { I 0, при х < 0, 2 < х.
78 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Вычислить константу а и определить вероятность того, что Х> 1. Задача 10.9. Случайная величина X имеет плотность распределения вида ,, ч / Ф “ О2» ПРИ 1 ® 5, па?) = < I 0, при а? < 1, 5 < х. Вычислить константу а и определить вероятность того, что 3 < X < 4. Задача 10.10. Вычислить плотность распределения вели- чины Y = у/Х, где X - величина из задачи 10.8. Задача 10.11. Вычислить плотность распределения вели- чины Y = (X + 1)/2, где X - величина из задачи 10.9. § 11. Совместные функции распределения НЕСКОЛЬКИХ СЛУЧАЙНЫХ ВЕЛИЧИЯ Рассмотрим сначала две дискретные случайные величины X и Y. Пусть случайная величина X принимает значения a?i,a?2,...,®n, а случайная величина Y принимает значения У1, у2, • • ., Ут • Одновременное наступление событий {X = а?,} и {У = у,} будем обозначать {X = а?»,У = у>}, т. е. {X = Xi,Y = Vj} = {X = х,){У = щ}. Обозначим pij — Р(Х = а?*, У = yj). Определение 1. Соответствие, которое каждой паре значений (а?», у?) дискретных случайных величин Хи У со- поставляет ее вероятность ptj, называется совместным за- коном распределения случайных величин X и У. Совместный закон распределения величин (X, У) можно задавать таблицей (Х,У) ... Ут) (®2,У1) . . . (®п, У1) ♦ • * (гп>Ут) р Р1.1 РЦт Р2,1 РП,1 ) Рп,т Задача 1. В ящике два шара, на каждом из которых на- писана цифра 1, и три шара, на каждом из которых написа- на цифра 2. Один за другим наудачу вынимают два шара.
11. РАСПРЕДЕЛЕНИЯ НЕСКОЛЬКИХ СЛУЧАЙНЫХ ВЕЛИЧИН 79 Пусть величина X - это номер на. первом шаре, a Y — номер на. втором. Найти сотдестный закон распределения величин (JK.Y). Р еш ение. Используя формулу умножения вероятностей, найдем Р((Х, У) = (1,1)) = Р(Х = 1)Р(У = 1|Х = 1) = | | = Поступая аналогично для вычисления других вероятно- стей, получим (-ХЛ) (1.1) 0,2) (2,1) . (2,2) F 1 10 а 10 а ( 10 3 10 Свойства вероятностей р%. 1) Е рп - рГ» где - р(у = i=l т 2) Е Р« =Н*’. где И*’ = Р(* = >=1 3) Ё 27^ = 1. 1=1 Докажем, например, второе свойство. Поскольку EjLiO^ = t/j} = £2, то используя свойства 10*) и 4) |2, полу- чим т т £{Х=«.,У = W} = {X = xj£{y = %} = 7=1 7=1 = {X = x,}Q = {X = Xi}. Так как события {X = a?,-, Y = yj} при разных j несовместны, то применяя формулу сложения вероятностей, получим т Р? = Р(Х = х<} = Р QT{* = = %)) = j=i т т = £р(х = ^у=и)=Х}к,. J=1 j=l Определение 2. Дискретные случайные величины X и У называются независимыми, если для всех пар (i, j) вы- полняются соотношения
80 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Р(Х = Xi,Y = %) = Р(Х = Х()Р(У = Vj), т. е. события {X — Xi} и {Y = у,} являются независимыми. Замечание 1. Если X и У две дискретные случайные величины, то для любой функции двух переменных h(x,y) величина Z — h(X,Y) тоже является дискретной случай- ной величиной, которая принимает значения Zjj = Л(аг,-,уу) с вероятностями р,у = Р(Х = ж,-,У = = 1,2, ...,n,j = l,2,.. .,m, если h(x,y) является взаимно однозначной функ- цией. Если же значения Л(ж»,!/>) совпадают для различных пар с величиной zjim, то Z = Л(Х,У) принимает об- щее значение z\>m с вероятностью, равной сумме вероят- ностей p,j, отвечающих всем таким для которых h(Xj, ®j) = 27,m ♦ Рассмотрим теперь общую ситуацию, когда имеется k 2 произвольных случайных величин Xi,Ха,..., X*. Поскольку для описания этого случая отправной точкой служат акси- омы теории вероятностей (§6), то мы предполагаем, что за- дано Q - пространство элементарных событий, из подмно- жеств которого образована а-алгебра Л и на ней задана вероятность Р. При этом предполагается, что при любых I — 1,2, и х € (—оо,оо) события {X/ < а?} принадле- жат Л. Это условие позволяет рассматривать вероятности событий к {X, < XI,Х2 < х2...Хк<хк} = Ц{Х, < х,}. 1=1 Определение 3. Функция F(x\, а?2,... ,хк) = P(Xi < xi, Хг < а?2,... , X* < ж*), Хк € [—оо, оо] называется совместной функцией распреде- ления величин Xi, Хг,..., X*;. Свойства совместной функции распределения. 1) функция F(a?i,a?2, • • •,ж*) является неубывающей функ- цией каждого аргумента, при условии, что другие фиксиро- ваны; 2) если xi — —оо при некотором I, то F(xi,xz,.. . ,ж*)= О, а если положить х/ — оо, то F(xi,.
11. РАСПРЕДЕЛЕНИЯ НЕСКОЛЬКИХ СЛУЧАЙНЫХ ВЕЛИЧИН 81 как функция к — 1 переменной будет являться совмест- ной функцией распределения к — 1 случайных величин Xi,.. •, Xi-1, Xi+i,..., X*, среди которых отсутствует вели- чина Х{\ 3) по каждой переменной х/ функция F(xi,X2, .. .,х*) не- прерывна слева: lim F(xb ..., X/,..., xfc) = F(xx,..., у,..., xfc). Доказательство этих свойств точно такое же, как для функции распределения одной случайной величины. Доста- точно выделить один из сомножителей в произведении мно- жеств < xi}> отвечающий выбранной координате функции распределения, и для него почти дословно повто- рить то, что делалось для доказательства свойств функции распределения. Набор случайных величин X = (Xi, Х2,..., Хк) называ- ют случайным вектором, функцию F(x) — F(xi, хг,..., х*) - функцией распределения случайного вектора X. Определение 4. Случайные величины Х1,Хг, ...,Хк называют независимыми, если для любых (xi,X2, •• -tXk) € R‘ Р(Х1<»„X2<x2,.... X„<xt) = P(Xi<®i)P(X,<»2).. .P(Xt<xt). Это соотношение можно выразить в терминах функций распределения F(xi,x2, ...,xfc) = Fi(x1)F2(x2)...Fk(xk)i (П-1) где Fi[x) - функция распределения случайной величины X/. Лемма 1. Если величины Xi,X2i.. . .X* независимы, а gi(x),l = 1,2,...,к, - монотонно возрастающие функции, то в величины Yi — ^1(Х1),У2 = 02(Х2),...,У* = fffc(Xfc) являются независимыми. Справедливость этого утверждения следует из цепочки равенств Р(У1 < 1/1, К2 < j/2,..., Ук < Ук) - = Р(%! < »г1(я),%2 < sj'W......Xt < = = P(Xj < 4гГ*(и))Р(Х2 < д2 *(»)) • .Р(Х* < ^(w)) = = Р(У1 < й)Р(У2 < S2) • • Р(П < П).
82 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Замечание X Утверждение леммы 1 верно для широкого класса функций gf(x). К этому классу относятся, например, непрерывные функции. Определение 5. Если существует такая неотрица- тельная функция /(jn, рй,..., у*), что функция распределения F(xi, х2,..., хн) для всех a?i, а?2, • • • > представима в виде ^11^2» £1 S* Хк)= J J ••• J Ж, —СО —OQ —ОО У2^--,Ук)^У^у2--‘Лук, то f(xi, г2,..., Хк) называется совместной плотностью рас- пределения случайных величин Xf, Х2,..., X*. Свойства совместной плотности распределения. 1) f ••• / f(xi,x2,...,xk)dx1dx2...dxk = 1; —оо —оо 2) f(xltX2r...,Xk) = если функция F(xiiX2,* • является дифференцируемой; 3) для любого I функция со fi(xi,...,xi-ltxi+1,...,Xk) = / f(x1,...,xi,...,Xk)dxi —оо является совместной плотностью распределения к — 1 слу- чайных величин Xi,..., Xj_i, Xj4-i,..., X*, средн которых от- сутствует величина X;. Свойства 1) и 2) устанавливаются аналогично тому, как это было сделано для плотности одной случайной величины в § IO. Убедимся в справедливости свойства 3). Воспользу- емся определением плотности и свойством, что можно ме- нять порядок интегрирования. Полагая г г = оо получим F(xi,...,xi-_1,cx),xi+i,...lxk) = «1 rk оо = У ••• угу /(^^.^ui^.^ukyduijdui^.^dui^^.^duk. —оо —оо —оо Согласно второму свойству совместной функции распреде- ления слева стоит совместная функция распределения вели- чин Xi,..., Xj-i, Xj+i,..., Хк. Снова используя определение
11. РАСПРЕДЕЛЕНИЯ НЕСКОЛЬКИХ СЛУЧАЙНЫХ ВЕЛИЧИН 83 плотности, получаем, что выражение в скобках является со- вместной плотностью распределения этих величин. Аналогом соотношения (10.3) является следующее: P(ai Xi < &1, а2 С Х2 < ^2, •.., Хк < 6fc) bi *з Н J J f(xi,x2i...,xk)dx1dx2...dxk. (11.2) at вд а* Если у случайных величин Xi,Ха,.. .,Х* существует со- вместная плотность распределения, то в силу свойства 3) существуют плотности распределения у каждой из величин Xi в отдельности. Продифференцировав равенство (11.1) по каждой из переменных хц / = 1,2, легко убедить- ся в том, что свойство независимости случайных величин Xi,Х2,.. .^Хк через плотность распределения выражается так: для любых (xi,x2jt € В.* f(xi, X2l . .., Xfc) — (11.3) где fi(x) - плотность распределения случайной величины X/. Задача 2. Некто получил д ва кредита, каждый из которых он должен вернуть по первому требованию. Требование вер- нуть кредит 1(1 = 1,2) приходит в случайный момент времени И, причем "Л имеет плотность распределения Р1(х), опреде- ляемую формулой pi(x) = сц ехр (—сцх) при х 0 и pi(x) = О при х < 0. Требования приходят независимо. Найти рас- пределение длительности случайного промежутка времени, в течение которого в распоряжении заемщика будут нахо- диться оба кредита. Решение. Вычислим функцию распределения интересу- ющей нас случайной величины min(ri,T2), которая как раз и равна времени, в течение которого заемщик может пользо- ваться обоими кредитами. Имеем Р(тт(п,т2) < х) = = 1 - P(min(Ti, т2) > х) = 1 - P({ti > ®}{т2 > ж}) = = 1 - Р(п > х)Р(т2 > х) = 1 - (1 - Р(п < х))(1 - Р(т2 < х)).
84 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Учитывая вид плотности распределения, получаем, что при «>0и/=1,2, х P(ti < ж) = J cq exp (—aix)dx = 1 — exp (—с^ж), о и поэтому P(min(rj, т^) < ж) = 1 — exp (—(ai + аг)ж). Задачи Задача 11.1. В кошельке лежат 8 пятикопеечных монет и б двухкопеечных. Наудачу вынимают одну за другой 2 монеты. Пусть величина X - достоинство первой монеты, У - 2-й. Составить совместный закон распределения величин (Х,У). Задача 11.2. Определить совместную плотность распре- деления двух положительных случайных величин X и У по заданной функции распределения Р(ж,у) = (1—е“а®)(1—е”*у). Задача 11.3. Определить функцию распределения вели- чины равной максимуму из двух независимых случайных ве- личин X и У с функциями распределения Рх (ж) и Ру (ж) со- ответственно. Задача 11.4. Определить функцию распределения вели- чины равной минимуму из двух независимых случайных ве- личин X и У с функциями распределения Fx(x) и Ру (ж) со- ответственно. Задача 11.5. Плотность распределения двух случайных величин (Х,У) задается формулой: f(x,y) = |вт(ж + г/), при О ж тг/2, 0 у тг/2. Для других значений аргументов полагаем ее равной нулю. Определить совместную функцию распределения величин X и У. § 12. Числовые характеристики случайных величин 1. Дискретные случайные величины. Пусть X - дискретная случайная величина, принимающая значения ж/, / = 1,2,..., п, с вероятностями — Р(Х = и). Определение 1. Математическим ожиданием дис- кретной случайной величины X называется число Е(Х) = £ «да. i=i
12. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 85 Замечание 1. Если случайная величина X имеет счет- ное число значений, т. е. п — оо, то говорят, что математи- оо ческое ожидание существует, если ряд сходится, в /=1 противном случае говорят, что математического ожидания не существует. оо Величину Е(|Х|) = $2 называют абсолютным мо- »=1 ментом дискретной случайной величины X. Смысл математического ожидания наиболее ясно про- является при рассмотрении схемы равновозможных исходов. Это среднее арифметическое значение всех возможных ре- ализаций случайной величины, которые могут появиться в ходе случайного эксперимента. Действительно, пусть N - число всех равновозможных исходов эксперимента. Пусть значение xj соответствует mi исходам, / = 1,2,...,п, и mi + m2 4----Ь mn = N. Поскольку исходы равновозможны, то pi = Р(Х = xi) = Тогда 1=1 f=l = 1 + х 1 4-... + X1 + X 2 + X 2 4-... + X 2 +... + Хп + Хп + ... + Хп). mi m2 тп Правая часть этого равенства и является средним арифме- тическим всех возможных реализаций случайной величины X. Поэтому Е(Х) часто называют средним значением ве- личины X. Замечание 2. Если есть дискретная случайная величи- на X, принимающая п различных значений, и некоторая взаимно однозначная функция р(ж), то случайная величи- на д(Х) принимает значения g(xi) с вероятностями pi = Р(Х = а?/), I = 1, ...,п (см. замечание 1 §10). Поэтому »(»(*)) = Это равенство выполняется и для функций д, не имеющих обратную, поскольку согласно за- мечанию 1 § 10 д(Х) принимает совпадающее для разных xi значение с соответствующей суммарной вероятностью. Отметим важный частный случай. Определим Г 1, при к е А, *a(x) = 1 А л л I 0, при х £ А,
86 ТЕОРИЯ ВЕРОЯТНОСТЕЙ - индикатор множества Л. Пусть А - счетное множество, р(ж) = 1д (ж). Тогда спра- ведливо соотношение п Е(1л(Х)) = £ >л(«|)й = Е и = Р(х е А). 1=1 Замечание 3. Если даны две дискретные случайные ве- личины X и У с совместными вероятностями рц — Р(Х = ж,, У = j/j), i = j — и A(x,j/) - некоторая функция двух переменных, то в силу замечания 1 § 11 мате- матическое ожидание случайной величины А(Х, У) вычисля- ется по формуле п т Е(Л(Х,У)) = «=13=1 Свойства математического ожидания. 1) (свойство линейности) для любых постоянных а и 6 Е(аХ + 5) = аЕ(Х) + 6; 2) (свойство аддитивности) для любых двух случайных величин X и У Е(Х + У) = Е(Х) + Е(У); 3) если случайные величины X и У независимы, то Е(ХУ) = Е(Х)Е(У), и более того для широкого класса функций д(х) и h(y) Е(9(Х)Л(У)) = Е(9(Х))Е(Л(У)); 4) если X 0 то Е(Х) 0, если X У, то Е(Х) Е(У). Доказательство. Первое свойство следует из свой- ства линейности операции суммирования. Действительно, Е(аХ + b) = У^(аж/ + b)pi = а = аЕ(Х) + Ь. 1=1 1=1 1=1
12. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 87 Согласно замечанию 1 § 11 величина X+Y является случай- ной величиной, принимающей значения Xi + yj с вероятно- стями pij = Р(Х = xit Y = yj), i = 1,...,n, j = 1,..., m, и ее математическое ожидание вычисляется согласно замечанию 3. Используя свойства 1) и 2) для вероятностей имеем пт пт т п Е(Х 4- У) = £ Yfa + Уз)&з = 52 Xi 12^3 + 52 Уз 5Х = i=l j=l »=1 j=l J=1 i=l = Е +52 пр? = Е w+Е<у )• i=l з=1 Убедимся в справедливости третьего свойства. Поскольку величины X и У независимы, то РО = Р(Х = Xi, Y = и) = Р(Х = Xi)P(Y = в) =₽!’₽(”. Тогда п т пт Е(,(Х)Л(У)) = ££>(Xi)h{yj)pij = i=lJ=1 1=1J=1 п т = = EfcWWW)- »=1 3=1 Докажем четвертое свойство. У неотрицательной случай- ной величины математическое ожидание будет неотрица- тельным, поскольку это сумма неотрицательных слагаемых. Если X > У, то X - У 0, и Е(Х - У) 0. По второму и первому свойствам Е(Х — У) = Е(Х) —Е(У). Следовательно, Е(Х) - Е(У) 0, а значит Е(Х) Е(У). Следствие 1. Для любой случайной величины X |Е(Х)| < Е(|Х|). (121) Действительно, поскольку X |Х| и —X |Х|, то по свойствам 4) и 1) имеем Е(Х) Е(|Х|) и —Е(Х) Е(|Х|). Что и требовалось доказать.
88 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Следствие 2. Для любых случайных величин Xi, Хг> • • •, X* k k E(SX') = Eew- Z=1 1=1 Это утверждение доказывается с помощью свойства 2) по индукции. Определение 2. Дисперсией дискретной случайной п величины X называется число D(X) = — E(X))2pj. i=i В силу замечания 2 дисперсией случайной величины X служит математическое ожидание (среднее) случайной ве- личины (X — Е(Х))2, т. е. D(X) = Е(Х — Е(Х))2. Смысл дис- персии заключается в том, что она характеризует средний квадратичный разброс случайной величины вокруг своего математического ожидания. Замечание 4. Если D(X) = 0, то в силу определения дис- персии Р(Х = Е(Х)) = 1, т. е. фактически X - детермини- рованная (не случайная) величина. Пример 1. Пусть X - число гербов, выпавших при че- тырех бросаниях правильной монеты. Тогда, используя ре- зультат примера 2 из §10, получим Е(Х) = 0 • — + 1— + 2— + 3 • — + 4 • — = 2, v } 16 16 16 16 16 ’ D(X) = (0-2)2i + (l-2)2A+ + (2 - 2)2 • £ + (3 - 2)2 • ± + (4 - 2)2 ± = 1. Свойства дисперсии. 1) для любой случайной величины X D(X) = Е(Х2) - Е2(Х); 2) для любых постоянных а и b D(aX + 6) = a2D(X); 3) если случайные величины X и У независимы, то D(X + У) = D(X) + D(K).
12. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 89 Доказательство. Первое свойство устанавливается с помощью следующей цепочки равенств: п п D(X) = - Е(Х))2И = - 2«,В(Х) + Е2(Х))р, = /=1 1=1 = £ Jpi - 2Е(Х) £ xlPl + Е2(Х) £ pi = /=1 1=1 1=1 = Е(Х2) - 2Е(Х)Е(Х) + Е2(Х) = Е(Х2) - Е2(Х). Используя определение дисперсии и свойство линейности математического ожидания, получим Ъ(аХ + b) = Е(аХ + b - Е(аХ + 5))2 = = Е(аХ - аЕ(Х))2 = а2Е(Х - Е(Х))2 = a?D(X). Для доказательства третьего свойства воспользуемся уже доказанным первым свойством дисперсии и вторым и тре- тьим свойствами математического ожидания. Имеем D(X + У) = Е(Х + У)2 - Е2(Х + У) = = Е(Х2 + 2XY + У2) - (Е(Х) + Е(У))2 = = Е(Х2) + 2Е(ХУ) + Е(У2) - Е2(Х) - 2Е(Х)Е(У) - Е2(У) = = Е(Х2) - Е2(Х) + Е(У2) - Е2(У) = D(X) + D(y). Следствие 3. Длл независимых случайных величин Xit Х2,...,Хк d(L*') = £d(x,)- /=1 1=1 Это утверждение доказывается с помощью свойства 3 по индукции. 2. Случайные величины, имеющие плотность распределения. Пусть функция распределения F(x) случайной величины X имеет плотность распределения /(а?). Определение 3. Математическим ожиданием слу- чайной величины X с плотностью распределения /(ж) назы- ОО вается число Е(Х) = J xf(x)dx.
90 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Говорят, что математическое ожидание у случайной ве- личины X существует, если у нее конечен абсолютный мо- ОО мент Е(|Х|) = J |®|/(x)dx. —оо Замечание 5. Если есть случайная величина X с плотно- стью распределения /(я?) и некоторая непрерывная функция д(х), то математическое ожидание случайной величин д(Х) вычисляется по формуле ОО Е($(Х)) = У g(x)f(x)dx. — ОО Если д(х) - монотонно возрастающая функция, то эта фор- мула является следствием формулы (10.6) и правила замены переменной интегрирования. Для важного частного случая, когда д(х) = где А - интервал (а,Ь) или объединение интервалов такого вида, справедливо соотношение ОО Е(1Л(Х)) = J IA(x)/(x)dx = J f(x)dx = Р(Х е Л), -оо А Замечание 6. Если даны две случайные величины X и У с совместной плотностью распределения f(x,y) и случайная величина Л(Х,У), где h(x,y) - непрерывная функция двух переменных, то ОО оо Е(Л(Х,У)) = J J h{x,y)f(x,y)dxdy. — ОО —оо Определение 4. Дисперсией случайной величины X с плотностью распределения /(®) называется число оо D(X) = J (х - Е(Х))2 f(x)dx. — ОО Справедливы все свойства математического ожидания и дисперсии, сформулированные для дискретных величин.
12. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 91 Принципиальных отличий в доказательстве этих свойств от доказательств соответствующих свойств для дискретных ве- личин нет. Доказательство второго и третьего свойства дис- персии вообще не использует дискретность X, а использует лишь свойства математического ожидания. Докажем свойство аддитивности математического ожида- ния. Пусть /(®, у) совместная плотность распределения ве- личин X и У. Воспользуемся свойством 3) совместной плот- ности двух случайных величин, согласно которому функция /1(«) = /(®, y)dy является плотностью распределения ве- личины X, а функция /г(у) = f(x>y)dx является плотно- стью распределения величины У. Для вычисления матема- тического ожидания суммы X 4- У применим замечание 5. Тогда получим оо оо Е(Х + У) = У У (х + y)f(x, y}dxdy = — оо —оо оо оо f(x>y)dydx+ I у I —оо —оо —оо —оо оо оо f xf1(x)dx + J s/j(»)d» = E(X)+E(y). —оо —оо Свойство аддитивности доказано. Для того, чтобы убедить- ся в справедливости третьего свойства математического ожидания, воспользуемся соотношением (11.3), которое для двух случайных независимых величин X и У имеет вид: f(xty) = /1(®)/2(у)- Для вычисления Е(у(Х)Л(У)) снова при- меним замечание 5. Тогда будем иметь Е(,(Х)Л(У)) = ОО ОО со со = У У g(x)h(y)f(x,y)dxdy = У у g(x)h(y)f1(x)f2(y)dxdy= — оо —оо —оо —оо оо оо = У g(x)fi(x)dx У h(y)f2(y)dy = 'E(g(X))'El(g(X)). —со —оо
92 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Пример 2. Пусть имеется однородная проволока, растя- гиваемая за концы. Любой точке проволоки сопоставим ко- ординату, равную расстоянию от этой точки до левого кон- ца плюс некоторое число а. Тогда левый конец проволоки имеет координату а. Пусть b - координата правого конца проволоки. Очевидно, что а < Ъ. Пусть X - случайная вели- чина, равная координате точки разрыва. Ясно, что разрыв происходит в промежутке [а, 6]. Используя геометрические вероятности, аналогично примеру 4 $ 10 найдем, что функ- ция распределения и плотность распределения X имеют вид при х а, при а < х <Ь, при Ъ X, при х а, при а < х < 6, при b х. Случайная величина с таким распределением называется равномерно распределенной на отрезке [а, 6]. Ее матема- тическое ожидание и дисперсия имеют следующие значения Е(Х) = — [ xdx = --- —— = — k ' b — aj b-a 2 2 ’ a b (b-a)/2 D(X) = -1- f v2dv = &^-. v 7 b-a J \ 2 / b — a J 12 a (a-b)f2 Лемма 1 (неравенство Коши-Буняковского). Для лю- бых случайных величин X и У Е(|ХУ|) < (Е(Х2))1/2(Е(У2))1/‘. (12.2) Доказательство. Для любых вещественных чисел z±, Z2 и а справедливо неравенство *1*2 |(^*i + А2)» которое вытекает из очевидного неравенства (a^zi—azz)2 0. Используя это неравенство и свойства 1), 2) и 4) матема- тического ожидания, несложно убедиться, что Е(|ХУ|) < е(1(£х2 + а2У2)) < 1(±Е(Х2) + а2Е(У2)). Полагая здесь а2 = (Е(Х2))1^2/(Е(У2))1^2', получаем (12.2).
12. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 93 Следствие 4. Для любой случайной величины X Е(|Х|) < (Е(Х2))1/2. (12.3) Убедиться в справедливости этого неравенства можно, положив в (12.2) У = 1. Пусть к - некоторое натуральное число. Определение 5. Моментом порядка к случайной ве- личины X называется число т* = Е(Х*). Определение 6. Абсолютным моментом порядка к случайной величины X называется число Е(|Х|*). Определение 7. Центральным моментом порядка к случайной величины X называется число д* = Е(Х—Е(Х))*. Определение 8. Ковариацией (корреляционныммо- ментом) двух случайных величин X и У называется число cov(X,y) = Е((Х - Е(Х))(У - Е(У))). Свойства ковариации. 1) для любых случайных величин X и У соу(Х,У) = Е(ХУ) - Е(Х)Е(У); 2) (аддитивности) для любых X, У и Z cov(X + У, Z) = cov(X, Z) + cov(y, Z), cov(X, У + Z) - cov(X, У) + cov(X, Z). Это свойство легко распространяется на сумму произволь- ного числа слагаемых. Первое свойство в силу линейности математического ожидания вытекает из равенств cov(X, У) = Е(ХУ - УЕ(Х) - ХЕ(У) + Е(Х)Е(У)) = = Е(ХУ) - Е(Х)Е(У) - Е(Х)Е(У) + Е(Х)Е(У). Второе свойство столь же очевидно. Определение 9. Коэффициентом корреляции двух случайных величин X и У называется число г(Х, У) = _ cov(X, У) “ v/D(X)D(y)-
94 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Моменты и коэффициент корреляции определены не все- гда. Например, для существования обычных и центральных моментов mki Ць необходимо, чтобы был конечен абсолют- ный момент: Е|Х|* < оо. Корреляционный момент и коэффициент корреляции ха- рактеризуют степень линейной зависимости случайных ве- личин. Чем больше по модулю коэффициент корреляции, тем сильнее линейная зависимость между величинами. Определение 10. Если ковариация или коэффициент корреляции равны нулю, то такие величины называются не- коррелированными. Для любых случайных величин X и У D(X ± У) = Е(Х ± У - (Е(Х) ± Е(У)))2 = = Е((Х - Е(Х))2 ± 2(Х - Е(Х))(У - Е(У)) + (У - Е(У))2) = = Е((Х - Е(Х)2) ± 2Е((Х - Е(Х)(У - Е(У)) + Е((У - Е(У))2 = = D(X) ± 2 cov(X, У) + В(У). (12.4) Отметим, вытекающее из (12.4), важное свойство некорре- лированных величин. Если случайные величины X и У не- коррелированы, то D(X 4- У) = D(X) + D(y). Следствие 3. Для попарно некоррелированных случайных величин Xi,.. . D^) = £W Это утверждение доказывается по индукции с применени- ем свойства аддитивности ковариации и вышеприведенного свойства некоррелированных величин. Свойства коэффициента корреляции. 1) Для любых постоянных а,6,с, d r(aX + b,cY + d) = sign(ac)r(X,y), где signa: = ж/jrj- функция знака. Это свойство можно прокомментировать так: линейные преобразования случайных величин не изменяют степени их линейной зависимости. При этом меняется лишь знак зави- симости, если а и с разных знаков.
12. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН 95 2) |г(Х,У)| 1, и |г(Х, У)| = 1 тогда и только тогда, ко- гда существуют такие постоянные а и Ъ, что У = аХ 4- Ь с вероятностью единица. 3) Если величины X и У независимы, то г(Х,У) = 0. Доказательство. В силу свойства линейности мате- матического ожидания имеем cov(aX 4- 6, cY 4- d) = = Е((аХ 4- 5 - Е(аХ 4- 6))(сУ 4- d - Е(сУ 4- d))) = = Е((аХ - аЕ(Х))(сУ - сЕ(У))) = ас cov(X, У). Поскольку D(aX 4- b) = a2D(X), В(сУ 4- d) = е21Э(К)> то cov(aX + b,cY + d) _ cov(X,Y) 0>(aX +b)D(cY + d) ~ ^(x)D(y)- Докажем свойство 2). Положим X = -7==== vdh) Таким образом, первое свойство установлено. ’ vW)' Согласно (12.4) D(X ± У) = D(X) ± 2 cov(X, У) 4- В(У) = =§Ш±2^О)+^=2(1±Г(ВД (125) Поскольку левая часть этого равенства неотрицательна, то 1 4- г(Х,У) 0 и 1 — г(Х, У) 0, что эквивалентно -1 г(Х,У) < 1 или |г(Х,У)| < 1. При г(Х,У) ~ ±1 из (12.5) следует, что D(X 4= У) = 0. Согласно замечанию 4 это влечет X 4= У = Е(Х) 4= Е(У) с вероятностью единица, и, следовательно, у=±^йх+(е<к)*^Ше™)- Пусть теперь У = аХ4-6. Согласно первому свойству имеем r(X,y) = eign(a)r(X,X) = sign(a)S^^^^a=eign(a).
96 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Убедимся в справедливости третьего свойства. Если вели- чины X и У независимы, то согласно определению, величи- ны X — Е(Х) и У — Е(У) тоже будут независимы. Поэтому по третьему свойству математического ожидания cov(X, У) = Е(Х - Е(Х))Е(У - Е(У)) = 0-0 = 0. Следовательно, коэффициент корреляции независимых ве- личин равен нулю. Обратное утверждение неверно, т. е. из равенства нулю коэффициента корреляции не следует независимость вели- чин. Подтверждением этому служит следующий пример. Пример. Пусть случайная величина X принимает зна- чения ±1, ±2 с вероятностями 1/4, и пусть У = X2. Тогда совместный закон распределения величин (X, У) следующий (X.Y) (-1,1) (1,1) (2,4) (-2,4) р 1 4 1 4 1 4 1 4 и нетрудно убедиться в том, что величины X и Y зависимы, а их коэффициент корреляции равен нулю. Задача 1. Вычислить коэффициент корреляции случай- ных величин X и У, определенных в задаче 1 § 11. Решение. По первому свойству коэффициента корреля- ции он совпадает с коэффициентом для величин Xi = X — 1 и У1 = У — 1, совместный закон распределения которых имеет вид (Х1.У1) (0,0) (0,1) (1,0) (1.1) р 1 10 3 10 3 10 3 10 По свойству вероятностей j из § 11 закон распределения 2 3 Xi следующий P(Xi = 0) = P(Xi = 1) = Аналогичное О D 3 3 з2 распределение имеет Уь Тогда E(Xi) = D(Xi) =- — -- = о э о* 6 3 = —, Е(Х1У1) = —. Окончательно имеем Е(Х,У1)-(Е(Х,))г 1 Г<Х1'У>) - ----ВД--------“ - “4-
13. ПРОИЗВОДЯЩИЕ И ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 97 Задачи Задача 12.1. Вычислить математическое ожидание и дис- персию величины из задачи 10.8. Задача 12.2. Вычислить математическое ожидание и дис- персию величины из задачи 10.9. Задача 12.3. Есть правильный жетон, у которого на од- ной стороне стоит цифра 2, а на другой - 0, и есть правиль- ный кубик, у которого на противоположных гранях написа- ны цифры 1,2 и 3 соответственно. Жетон и кубик бросаются на стол. Пусть X - случайная величина, равная сумме очков на жетоне и кубике. Построить закон распределения вели- чины X, вычислить математическое ожидание и дисперсию. Задача 12.4. Есть два правильных жетона, у одного из них на одной стороне стоит цифра 3, на другой - 5, а у другого на одной стороне стоит цифра 1, на другой - 5. Жетоны бросаются на стол. Пусть X - случайная величина, равная сумме очков на жетонах. Вычислить математическое ожидание и дисперсию. Задача 12.5. Есть правильный кубик, у которого на про- тивоположных гранях написаны цифры 1,2 и 3 соответствен- но. Пусть X - число единиц, выпавших при трех бросаниях кубика. Найти закон распределения, вычислить математи- ческое ожидание и дисперсию. Задача 12.6. Вычислить дисперсию и коэффициент кор- реляции величин X и У, определенных в задаче 11.1. Задача 12.7. Вычислить дисперсию и коэффициент кор- реляции величин X и У, определенных в задаче 11.5. § 13. Производящие и характеристические функции Пусть X - неотрицательная целочисленнозначная случай- ная величина, т. е. X принимает значения 0,1,2,... с вероят- ностями pk = Р(Х = к). Определение 1. Производящей функцией целочи- сленнозначной неотрицательной случайной величины X на- зывается функция — ®(хх), определенная для комплексных х таких, что |z| 1. Для jz| 1 ряд, опреде- ляющий производящую функцию, равномерно сходится, так
98 ТЕОРИЯ ВЕРОЯТНОСТЕЙ как оо оо оо м*)| = 52 52 м**’* 52р* = i. k=Q k=Q k=Q Замечание 1. Производящая функция однозначно опре- деляет распределение случайной величины, поскольку рп = = 4^)1 • n! dzn v 'L=0 Действительно, дифференцируя под знаком суммы, получим оо = £ t(t - 1)... (t - п + 1)2‘-”р*. (13.1) к=п При z = 0 все слагаемые в правой части (13.1) кроме пер- вого обращаются в нуль. Первое же слагаемое равно п!рп. Лемма 1 (о вычислении моментов). Пусть неотрица- тельная целочисленнозначная случайная величина X имеет момент п-го порядка. Тогда Лп I = Е(Х(Х - 1).. .(X - n + 1)). Доказательство леммы непосредственно следует из формулы (13.1), если в ней положить z = 1. Поскольку D(X) = Е(Х2) - Е2(Х) = Е(Х(Х - 1)) + Е(Х) - Е2(Х), то из леммы 1 вытекает следующий результат. Следствие 1. Математическое ожидание и дисперсия вы- ражаются формулами Е(Х) = ,>'(1), D(X) = ф"(1) + *'(1) - W'(l))2- Свойства производящих функций. 1) 1#*)1 1 при kl 1- Действительно, так как X неотрицательна IVWI < Е(|гх|) = Е(|г|*) < 1.
13. ПРОИЗВОДЯЩИЕ И ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 99 Для того, чтобы различать производящие функции раз- ных случайных величин, будем случайную величину припи- сывать к производящей функции в качестве индекса. 2) Для любых вещественных а и b 1paX+b(z) = Zb^x(za). Доказательство опирается на свойство линейности математического ожидания: Ф,х+Ь^) = Е(г<оХ+6>) = ?E((z«)x) = 3) Если X и Y независимые случайные величины, то ^х+у(*) = V’xOOV’yC*)- Доказательство. Поскольку величины X и Y незави- симы, то, используя третье свойство математического ожи- дания, получаем ^х+у(г) = Е(?х+У)) = E(zxzy) = E(zx)E(zy) = ^х(*#у(*)- Задача 1. Найти закон распределения случайной величи- ны X с производящей функцией ip(z) = |(1 + г)2. Решение. Поскольку V’(z) = |(1 + г)2 = | 4- ±z + ±z2, то сравнивая это выражение с определением производящей функции i/>(z) = zkpk, где рк = Р(Х = k), получаем, что Р(Х = 0) = 1 Р(Х = 1) = |, Р(Х = 2) = 1, Р(Х = k) = 0, при k > 2. Определение 2. Характеристической функцией слу- чайной величины X называется комплекснозначная функция y>(t) = E(eux), определенная для всех действительных зна- чений t.
100 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Для дискретной случайной величины с вероятностями р* = Р(Х = хь),к = 1,2,..., характеристическая функция будет определяться формулой оо *=i (13.2) а для величины, имеющей плотность распределения /(я), - формулой оо у>(/)= у eiixf(x)dx. (13.3) —оо Для случайной величины с произвольной функцией рас- пределения F(x) математическое ожидание Е(е’<х) опреде- ляется с помощью интеграла Стилтьеса, т. е. характеристи- ческая функция определяется формулой оо у -оо e“*dF(x). (13.4) Для непрерывной ограниченной функции р(х) и неубыва- ющей ограниченной непрерывной слева функции F(x) инте- ОО грал Стилтьеса J g(x)dF(x) существует и его можно опре- -оо делить равенством Jg(x)dF(x) = ^m £ ,(£)(F(*±1) - F(l)). — оо fc——па Формула (13.4) является более общей, чем (13.2) и (13.3). Так, согласно определению интеграла Стилтьеса, при ^(х) = Рк\хк,(ю)(х) 1=1 из (13.4) следует (13.2), а в случае, когда у F(x) существует плотность (dF(x) = f(x]dx)t (13.4) превращается в (13.3).
13. ПРОИЗВОДЯЩИЕ И ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 101 Замечание 2. Для целочисленных случайных величин НО ~ Не<*)- Свойства характеристических функций. 1) у>(0) = 1 и |у>(01 1 для всех t. Действительно: у>(0) = Е(е°) = Е(1) = 1; Е|еиХ| = = Е(1) = 1. Для того, чтобы различать характеристические функ- ции разных случайных величин, будем случайную величину приписывать к характеристической функции в качестве ин- декса. 2) Для любых вещественных а и b = eltb<px(at). 3) Если X и Y независимые случайные величины, то У>х+у(0 = Свойства 2) и 3) следуют, в силу замечания 2, из анало- гичных свойств для производящих функций. То обстоятель- ство, что замечание 2 сформулировано для целочисленных величин принципиального значения для вывода свойств 2) и 3) не имеет. Следствие 2. Если Xi,Хг,..., Xk - независимые случай- ные величины, то к ’’EL.x.W = 1М’ 1=1 т. е. характеристическая функция суммы независимых слу- чайных величин распадается в произведение характеристиче- ских функций слагаемых. 4) Характеристическая функция <p(t) является равномерно непрерывной функцией. Доказательство. Так как F(—оо) = 0, F(oo) = 1, а функция F(x) неубывает, то для любого е > 0 можно выбрать столь большое с > 0, что будут выполняться неравенства F(—c) е, 1 — F(c) е. Тогда для любого h > 0 получим оо с |p(t + Л) - < I |е‘<'+к>*-е“’|</Г(г)^ [ \eih‘ - l\dF(x)+ -ОО -с
102 ТЕОРИЯ ВЕРОЯТНОСТЕЙ 4-2 J dF(x) ^hj |ж|с?Г(ж) 4- 2(F(-c) 4-1 - F(c)) he 4- 4е. |r|>c -C В силу, того, что € и h выбирались произвольными, из этой оценки следует равномерная непрерывность функции $?(<). Лемма 2 (о вычислении моментов). Пусть случайная величина X имеет абсолютный момент п-го порядка. Тогда характеристическая функция случайной величины X диффе- ренцируема п раз и при 0 fc п Е(^‘) = Доказательство. Используя формулу дифференциро- вания показательной функции, получим ^^)=^Е(«“Х) = Е(^е“х) = Е(>‘Х‘е«х) = (‘Е(Х‘е‘1Х). Деля это равенство на ik и полагая в нем t = 0, получим тре- буемое утверждение. Внесение дифференцирования под знак математического ожидания корректно, так как математиче- ское ожидание - это либо сумма, либо интеграл, а вносить дифференцирование под знак суммы и интеграла в указан- ных предположениях можно. Поскольку D(X) = Е(Х2) —Е2(Х), то из леммы 2 вытекает следующий результат. Следствие 3. Математическое ожидание и дисперсия вы- ражаются формулами Е(Х) = -.У(0). Dffl = -/'(0) + (/(О))2. Теорема 1 (формулы обращения). Справедливы следую- щие утверждения: 1. Для целочисленнозначной случайной величины X Ж И = Р(Х = k) = 2- у e-^tydt, — 1Г k = 0,±l,±2,... .
13. ПРОИЗВОДЯЩИЕ И ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 103 2. Если характеристическая функция <p(t) случайной вели- чины X абсолютно интегрируема, то существует плотность распределения f(x), определяемая формулой оо = £ J — оо Доказательство. Для любого не равного нулю цело- го числа т имеем (13.5) eiimdt = 2_/е«тгт _ e-inm im ' Тогда можно написать следующее равенство, справедливое для всех целых т: 1 2тг О, т / О, 1, т = 0. Используя это равенство и определение характеристиче- ской функции целочисленнозначной получим 7Г 7Г случайной величины, ОО /=—оо оо — оо * оо I e“(’-ll>dt= £ Pllw(l-k) = pk. _ l=-oo Первый пункт теоремы 1 доказан. Перейдем к доказа- тельству второго пункта. Для этого нам нужно убедиться, что функция f(x), определенная равенством (13.5), является плотностью функции распределения F(x), для которой у>(<) определяется равенством (13.4). Так как функция <p(t) аб- солютно интегрируема, то для произвольных а < 6 в силу (13.5) имеем Ь оо Ь J f(x)dx = У 9?(0 У а -оо а С 6 [ ^(0 j e~itxdxdt. (13.6) — с
104 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Используя формулу (13.4), получим e~*ixdxdt e~itxdxdl = оо Ъ /Г ₽«с(у—«) _ ₽|'с(х —у) dF(y) / dxe- * = -оо а оо b со С(Ь~У) = 2 / dF(y) J= 2 J dF(y) / ^dv. —oo a -oo c(a—y) (13.7) Известно, что oo 0 oo Поэтому отдельно рассматривая случаи 0 а — у < b — у, а — у <Ъ — у 0 и а - у < 0 < Ь — у, получим lim с—юо с(Ь-К) с(а-у) о, к 2’ У G (М)» У $ [а,Ч, У = а, у - Ъ. Пусть а и b точки непрерывности функции F(y). Тогда при с —> оо правая часть (13.7) стремится к ь 2тг / dF(y) = 2%j(F(6) - F(a)). Учитывая это и используя (13.8) и (13.7), имеем F(6) —F(a). (13.8) Поскольку функция распределения непрерывна слева, то с помощью предельного перехода при ап | а, bn | &, где On и Ьп - точки непрерывности функции F(y)} равенство (13.8) распространяется на произвольные точки а и &. Теперь из (13.8) по определению следует, что f(x) является плотно- стью функции распределения F(x).
13. ПРОИЗВОДЯЩИЕ И ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 105 Теорема 2 (о единственности). Функция распределения однозначно определяется своей характеристической функцией. Справедливость этой теоремы в случае, когда функ- ция распределения отвечает целочисленнозначной случай- ной величине или имеет плотность распределения, следует из формул обращения (теорема 1). В общем случае теорема 2 тоже следует из общей формулы обращения, которую мы не рассматриваем. Задача 2. Найти закон распределения случайной величи- ны X с характеристической функцией <p(t) = cost. Решение. Характеристическая функция <p(t) = cost не является абсолютно интегрируемой на всей прямой, поэто- му естественно предположить, что X - дискретная случай- ная величина. Тогда характеристическая функция имеет вид ¥>(*) = $2 «***”₽* = 52 cos(ixb)Pk + »J2sin(ta?*)p*, (13.9) *=i fc=i fc=i где мы воспользовались формулой Эйлера е** = cos г 4- isinz. Сравнивая выражение (13.9) с функцией cost получаем, что величина X должна принимать лишь два значения 4-1 и —1 с равными вероятностями, т. е. Р1 = Р(Х = 1) = 1 И = Р(Х = -1) = 1. & л Задачи Задача 13.1. Найти законы распределения, которым со- ответствуют следующие производящие функции: 1) 5(1-5*) 2)^-3)(1+|г)". Задача 13,2. Найти законы распределения, которым со- ответствуют следующие характеристические функции: 1) cos21; 2) ^(cos14- cos 2t); 3) 14-1 cos 3t.
106 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 13.3. Пусть X - неотрицательная целочисленно- значная величина с производящей функцией V’(^)- Выразить через производящие функции величин X + 1 и 2Х. Задача 13.4. Найти характеристическую функцию тре- угольного распределения с плотностью Ра(ж) = 0 а(1 —а|ж|), при |а?| а \ Задача 13.5. Найти математическое ожидание и диспер- сию случайной величины X, характеристическая функция которой равна одной из следующих функций i) ^sin(a/) (a / 0); 2) ^-cosZsin2(|); 3) ^sin2^). Задача 13.6. Вычислить характеристическую функцию случайной величины с плотностью при 0 х 1, при х < 0, 1 < х. Задача 13.7. Найти моменты случайной величины X, ха- рактеристическая функция которой <p(t) = —Цр 1 +1 Задача 13.8. Найти характеристическую функцию слу- чайной величины X, плотность вероятности которой имеет вид /(«) = Задача 13.9. Случайная величина X имеет плотность ве- роятности распределения /(ж) — 2h2xe~h*x2 при а? > 0, и /(ж) = 0 при отрицательных х. Найти характеристическую функцию случайной величины X.
14. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 107 § 14. Законы распределения случайных величин 1. Дискретные распределения. 1. Биномиальное распределение. Пусть X - случайная величина, равная числу успехов в п испытаниях Бернулли, и пусть вероятность успеха в каждом испытании равна р. Тогда величина X имеет биномиальное распределение с параметрами пир: Р(Х = т) = €™рт(1 - р)п~т, m = 0,1,2,..., п. Вычислим производящую функцию биномиального рас- пределения. Учитывая, что Р(Х = т) = 0 при т > п, и, используя фомулу бинома Ньютона (§1), получим V’(^) = zmP(X = m) = m=0 = £ С™(гр)т(1 -p)"-m = (zp +1 -p)". m=0 Для вычисления математического ожидания и дисперсии воспользуемся следствием 1 § 13: Е(Х) = t/>'(z)b=i = np(zp+l - р)п"%=1 = пр, D(X) = Г(*)Ь=1 + ^(1) - (^(1))2 = = пр(п - l)p(zp + 1 - р)п“2|г=1 + пр - (пр)2 = = п(п — 1)р2 — п2р2 4- пр = пр(1 — р). 2. Распределение Пуассона. Это распределение явля- ется предельным для биномиального распределения, когда п —> оо, а А = пр остается постоянным (см. §9). Говорят, что случайная величина X имеет распределение Пуассона с параметром А > 0, если Р(Х = т) = ^-е"А, т = 0,1,2,... . Производящая функция распределения Пуассона вычи- сляется следующим образом: оо оо $(z) = V zmP(X = т) = е~А У2 ~ = е“АеА* = еА^-1\ т=0 т=0
108 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Применяя следствие 1 предыдущего параграфа, для ма- тематического ожидания и дисперсии получим выражения: Е(Х) = = Л, D(X) = ^"(г)|,=1 + ^(1) - ($'(I))2 = А. Задача 1. Число космических частиц, попадающих в ап- паратный отсек ракеты за время ее полета распределено по закону Пуассона с параметром А. При этом условная веро- ятность для каждой из этих частиц попасть в уязвимый блок равна р. Найти закон распределения числа частиц, попада- ющих в уязвимый блок. Решение. Обозначим Л* ={в уязвимый блок попало к частиц}, Я/ ={в аппаратный отсек попало I частиц}. Тогда события Hi, I = 0,1,2,..., составляют полную группу собы- тий и по формуле полной вероятности (п = оо) (§ 7) оо оо ₽Ц») = = ^Р(Я()Р(Л*|Я|). 1=0 1=к поскольку при I < к очевидно Р(Л*|Я|) = 0. Согласно усло- вию Р(Я/) = -це~> I = 0,1,2,... . Несложно понять, что ве- роятности Р(Л*|Я1) при 0 Z имеют биномиальное рас- пределение с вероятностью “успеха” (частица попала в уяз- вимый блок) р. Поэтому Р(Л&|Я/) = С{крк(1—р)1~к, 0 к /. Окончательно имеем Р(Л) = Е - р)'-‘ = Е - ₽)'* = - *кРке~* V' - (Mfce~x Afl-p) _ (М* -Ag “ fc! Z-/ (f-fc)! kl “ k\ Таким образом, число частиц, попадающих в уязвимый блок, тоже распределено по закону Пуассона, но с параме- тром равным произведению Ар. 3. Геометрическое распределение. Проводится беско- нечная последовательность независимых одинаковых испы- таний, в каждом из которых событие А наступает с вероят- ностью р = Р(А) > 0. Пусть X - случайная величина, равная
14. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 109 числу испытаний до момента первого наступления события Л. Тогда Р(Х = *) = (1-р)‘р, 4 = 0,1,2.... Действительно, если Л/ = {наступление события А в 1-м испытании), то {X = к} — AiA2.. Принимая во вни- мание независимость событий Л/, получим P(X = k) = P(A1A2...AkAk+1) = = Р(Л!)Р(Л2)... P(A)P(4fc+1) = (1 - р)‘р. Это распределение называется геометрическим, так как ве- роятности Р(Х — к) образуют геометрическую прогрессию. Вероятность того, что событие А наступит не раньше мо- мента т задается формулой Р(Х > т) = £ (1 - р)‘р = (1 - J = (1 - р)«. к=т Производящая функция геометрического распределения определяется формулой ОО 00 ^w=L?<1-p)‘p=»>Ewi -р)>* = к=0 к=0 ' * Для математического ожидания и дисперсии имеем B(x) = ^)|,_> = ir^L?[=i = y, D(X) = + ^(i) - (^(i))2 = - 2p0 ~ p)3 I 4- 1-P — t1 ~ P\2 — - (1-*(1-P)PU1 P ' P } ~ _ 2(1 - p)3 1 -p _ (1 - p)3 _ 1-p p2 p p2 p2 2. Распределения, имеющие плотность. 1. Равномерное распределение для любых а < 6 задает- ся плотностью {1 о”°' при х € [а, 6], при х $ [а, 6].
110 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Характеристическая функция равномерного распределе- ния вычисляется следующим образом: оо Ъ /1 f P*ib _ _»ta —оо а В § 12, пример 2, были вычислены математическое ожида- ние и дисперсия равномерного распределения: Е(Х) = —у-, D(X) = 2. Показательное распределение возникает как пре- дельное для геометрического в следующей схеме. Рассмо- трим уплотняющиеся при А | 0 моменты времени fcA, fc = 0,1,2,.... В моменты времени ЛА осуществляются независи- мые одинаковые испытания, в каждом из которых событие А наступает с вероятностью рд = ЛА, где А > 0 - постоянная величина. Обозначим Хд - время до момента первого насту- пления события А. Тогда величина —— равна числу испы- таний до первого наступления события А и имеет геометри- ческое распределение. Поскольку любому фиксированному х соответствует т « испытаний, то согласно п. 3 P(XA>x) = p(^>f)«p(^>m) = = (1 - рд)” « (1 - АД)*'д ss e-Al, Д 1 0. В последнем приближенном равенстве использован замеча- тельный предел (см. § 9). Переходя к дополнительным веро- ятностям, получаем, что предельное распределение для Хд имеет вид ч Г 1 — е“Аг, при г > 0, г (а?) = < t 0, при х < 0. Это - показательное распределение, имеющее плотность Г Ае”**, при х > 0, fix) = < ( 0, при х < 0. Для характеристической функции показательного распре- деления имеем выражение: оо y>(t) = A f eitxe~Xxdx = — г 4 ' I А - tt о
14. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 111 Математическое ожидание и дисперсию вычислим с по- мощью следствия 3 § 13: Е(Х) = -^(0) = =0= D(X) = + (?W = - (^U+Ф2 = Задача 2. Пусть время ожидания регистрации прибором солнечного нейтрино распределено по показательному зако- ну с параметром А. К моменту времени s частица не заре- гистрирована. Какова вероятность того, что начиная с мо- мента времени s ожидать регистрации придется не меньше чем время h? Решение. Обозначим X - время ожидания регистрации с момента включения прибора. Поскольку величина X рас- пределена по показательному закону, то при t 0 выполня- ется равенство Р(Х /) = e~xt. Нас интересует вероятность Р(Х s 4- з). По определению условной вероятности Р(хжЧХ>,) = ^ = ^=е-» Таким образом, если время ожидания события распределено по показательному закону, то информация о том, что собы- тие не наступило к данному моменту не улучшает шансы на его наступление в дальнейшем. Это свойство называется отсутствием последействия, и им обладает только показательное распределение. 3. Нормальное распределение задается плотностью 1 л/2тгсг где <т > 0 и а € (—оо, оо) - некоторые параметры. Это распределение часто также называют гауссовским распределением. Если а = 0 и ст = 1,то нормальное распределение с такими параметрами называется стандартным. Функция распреде- { (х-ау\ expl — I —оо < х < оо, \ 2а2 /
112 ТЕОРИЯ ВЕРОЯТНОСТЕЙ ления в этом случае имеет вид где Ф(а?) - функция Лапласа, уже встречавшаяся нам в § 9. Легко убедиться, что Ф(а?) является при х G (0,оо) функци- ей распределения величины |Х|, где X - случайная величина со стандартным нормальным распределением. Действитель- но X Р(|Х| < х) = Р(-х < X < х) = -Д= / e-^^dt = Ф(а?). (14.2) V J —X В силу этого свойства Ф(а?), х G (0,оо) иногда называют функцией отраженного нормального распределения. Для отрицательных х распределение следует полагать равным нулю. Вычислим характеристическую функцию нормального рас- пределения. Используя определение характеристической функции и делая замены переменных в интегралах, получим оо = —оо оо = ^е<,а Jfa- -оо = J ~ Г*’ — 00 Теперь, используя метод контурного интегрирования, мож- но последний интеграл преобразовать
14. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 113 Следовательно, p(t) = Для вычисления математического ожидания и дисперсии нормального распределения применим следствие 3 § 13: Е(Х) = - »/(0) = —i(«a - <r2Oei,“-’’,’/2|1=o = -На = a, 1ЦХ) = -/'(0) + У(0))2 = = -(-»’ + (.ia - <r2i)2)ei<a-’’*’/2|,=o + (fa)2 = = <r2 + a2-a2 = <r2. Таким образом, параметры а и a имеют для нормального распределения следующий смысл: a - математическое ожи- дание, сг - квадратный корень из дисперсии. Для нормального распределения со средним ноль неслож- но с помощью леммы 2 § 13 вычислить все моменты. При а = 0 характеристическую функцию нормального распреде- ления можно представить в виде следующего ряда Поэтому = S (-l>’w2^2f - 1)... (21 - 4 + l)t2'-‘, и, следовательно, п₽и к - четном’ О, при к — нечетном. Согласно лемме 2 § 13 имеем, что все нечетные моменты рав- ны нулю, а для четных справедлива формула E(X2') = ^^ = 1z2'(2f-l)!!,
114 ТЕОРИЯ ВЕРОЯТНОСТЕЙ где принято обозначение (21 — 1)!! = 1 • 3 • 5 •... ♦ (21 — 1). Используя функцию Лапласа Ф(ж), можно выразить веро- ятность того, что случайная величина X, распределенная по нормальному закону с параметрами аиа, лежит в заданных пределах. Справедлива следующая формула Р(Х1<Х<х,) = 1(ф(2^)-ф(2^)). (14.3) Действительно, величина ----- имеет стандартное нор- мальное распределение, поскольку в силу формулы (10.6) (сту т а - о)2 \ _ 1 -у»/2 2а2 J \/2тг Применяя формулы (ЮЛ) и (14.1), получим Следствие 1 (правило “За”). Для нормально распреде- ленной случайной величины X со средним а и дисперсией <т2 Р(|Х - а| < За) = Ф(3) « 0.9973. Правило “За” означает, что с большой вероятностью, рав- ной 0,9973, значения нормально распределенной случайной величины X лежат в интервале (а — За, а + За). Доказательство правила “За”основано на формуле (14.3). Применяя (14.3) с a?i = — За + а,а?2 = 3а+ а, получим Р(|Х - а| < За) = Р(—За + а<Х<За + а) = = Иф(т) -ф(-?)) = |(ф(3)-ф(-3>) = ф(3)' С нормальным распределением мы уже встречались в ин- тегральной теореме Муавра-Лапласа (§9). Формула (9.8) mi — пр . m2 — пр при ап = —р=-,оп = —, - утверждает, что вероятность y/npq -уПРЯ наступления события А не менее mi и не более тг раз при
14. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН 115 большом количестве испытаний (п —► оо) приближенно рав- на вероятности того, что случайная величина X со стан- дартным нормальным распределением принимает значения в пределах от ап до Ьп. 4. Двумерное нормальное распределение. Пусть X и Y - независимые нормально распределенные случайные вели- чины с параметрами oi,ai и 02,0-2 соответственно. Тогда по формуле (И.З) совместная плотность распределения равна произведению f(x, у) = _1_ expf — . ' ' 2тг(71(Т2 2ст1 2(72 / В общем случае совместная плотность двумерного нор- мального распределения имеет вид Ж У) = _ 1 р„п / (д-<ч)2 , г(г-О1Ку-О2) _ (у-«2)2 X 2*471(725/1-Г* 2(l-r2)aJ (1—г2 ^(71 (72 2(1- г2)«г|/ Смысл параметров, входящих в эту формулу, следующий: аг = Е(Х),д2 = Е(У),сг? = D(X),<rj = D(K),r = г(Х,У) - коэффициент корреляции. Замечание 1. При г = 0 плотность двумерного нормаль- ного распределения величин (Х,У) распадается в произве- дение плотностей величин X и У, а это означает, что вели- чины X vl У независимы. Таким образом, свойство независи- мости компонент двумерных нормально распределенных ве- личин полностью характеризуется условием равенства нулю коэффициента корреляции. Задачи Задача 14.1. Случайная величина X распределена по нормальному закону с математическим ожиданием т = 40 и дисперсией сг2 = 400. Вычислить вероятность попадания случайной величины в интервал (30,80). Задача 14.2. Две игральные кости бросают до выпаде- ния числа 6 хотя бы на одной из них. Найти вероятность того, что впервые число б появится при fc-ом бросании, * = 1,2..
116 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 14.3. Пусть Xi,Х2,.. -}Хп - независимые слу- чайные величины, распределенные равномерно на отрез- ке [0,1]. Найти функции распределения случайных величин У = maxi^n Xk и. Z = mim^n X*. Задача 14.4. Случайная величина X распределена равно- мерно с математическим ожиданием Е(Х) = 4 и дисперсией D(X) = 3. Найти плотность распределения величины X. Задача 14.5. Пусть XitXz - независимые случайные ве- личины, имеющие геометрическое распределение: Р(Х/ = к) = g*(l — g), к = 0,1,2,..., 1 = 1,2. Найти распреде- ление величины Z = max(Xi, Хг). § 15. Распределения сумм независимых СЛУЧАЙНЫХ ВЕЛИЧИН. СВЕРТКИ РАСПРЕДЕЛЕНИЙ Рассмотрим сначала две независимые целочисленнознач- ные неотрицательные случайные величины X и У с распре- делениями р* = Р(Х = к), к = 0,1,2,..., и qi = Р(У = /),/ = 0,1,2,.... В силу того, что величины независимы, событие {X = k,Y = 1} имеет вероятность р*дь Сумма S = X 4-У есть случайная величина, и событие {5 = г] равно сумме событий {X — кtY = г — А},к = 0,1,...,г. Поскольку слагае- мые несовместны, то вероятность ur = P(S = г) равна сумме вероятностей событий и, следовательно, задается формулой г «г = 1>Нг-ь Г = 0,1,2........... (15.1) *=0 Распределение U = определенное этими равен- ствами по распределениям Р = {р*}ь=о и Q = на" зывается сверткой распределений Р и Q и обозначается U = P*Q. Свертка U = Р *Q является распределением суммы S = = X + У независимых величин X и У с распределениями Р и Q соответственно. Теорема 1. Пусть распределениям Р = {р* }£10, <?={®)ёо. U = {ur}£L0 отвечают производящие функции 00 оо оо k=0 1=0 r-0
15. РАСПРЕДЕЛЕНИЯ СУММ СЛУЧАЙНЫХ ВЕЛИЧИН 117 Тогда, если U = P*Q, то фи(г) = ^p(*)^(z) в наоборот, если фц(г) = фр(г)фд(г), то U — P*Q. Доказательство. Перемножив функции фр{г), фд(г) так, чтобы в результате получился ряд по степеням г, полу- чим 00 г $р(х)Фд(х) = <15-2) г=0 fc=O Из этого равенства следует утверждение теоремы. Дей- ствительно, из (15.2) и (15.1) следует, что произведение функций фр и фд является производящей функцией свертки распределений U, и наоборот, производящая функция сверт- ки распределений распадается в произведение производя- щих функций компонент. Пример 1. Пусть независимые величины X и У имеют распределения Пуассона с параметрами Ai и Аг соответ- ственно. Тогда сумма S = X + У снова распределена по закону Пуассона с параметром А = Ai 4- Аг. Действительно, фх(г) = фу(г) = еЛ2(2-1), а тогда, согласно теоре- ме 1, фз(г) = Это снова производящая функция распределения Пуассона, но с параметром А = Ai 4- Аг- Пусть имеются независимые целочисленнозначные нео- трицательные величины XiJ = 1,2, ...,п, с распределения- ми Pi = {pjPjfcLo- Каким будет распределение суммы Sn = = 52Р-! Xj? Составляя сумму последовательно, т. е. ка- ждый раз прибавляя по одному слагаемому, несложно по- лучить, что распределение величины Sn будет иметь вид Pi * Р2 * • •_ • * Рп • Свертку нескольких распределений определяем рекур- рентным способом: сначала сворачиваем первые два рас- пределения, затем результат сворачиваем с третьим и т. д. Из теоремы 1 следует, что свертка распределений обладает свойствами коммутативности Pi * Р2 = Р2 ♦ Pi и ассоциатив- ности (Pi * Рг) * Рз = Pi * (Рг * Рз), поэтому в i жой последо- вательности сворачивать распределения, безразлично. Задача 1. Бросаются независимо друг от друга две пра- вильные пирамидки, на гранях каждой из которых есть ци- фры 1,2,3,4, выпадающие с равными вероятностями. Найти распределение суммы цифр, выпавших на обеих пирамид- ках. Вычислить функцию распределения этой суммы.
118 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Решение. Возможные значения суммы выпавших цифр составляют множество {2,3, ... ,8). Обозначим рь вероят- ность того, что величина X, равная сумме цифр, принимает значение к. Прямым подсчетом можно проверить, что для к = 2,3,...,8 выполняется рь = (4 — |5 — fc|)(l/4)2. Так, на- пример, pi = (1/4)2, а ре = 3(1/4)2, поскольку сумму 2 дает только один набор (1,1), а сумму 6 составляют 3 таких набо- ра: (2,4), (3,3), (4,2). Тогда функция распределения равна О, Рз = 1/16, Р2 + РЗ = 3/16, Рг+Рз+Р4 = 6/16, Р2 +Р3 +р4 + Р5 = 10/16, Р2 + РЗ + Р4 + Р5 + Рб = 13/16, Р2 + РЗ +Р4 + Ре + Рб + Р1 = 15/16, Р2 + РЗ + Р4 + РЗ + Рб + Р7 + Р8 = 1, при X 2, при 2 < х 3, при 3 < х 4, при 4 < х 5, при 5 < х 6, при 6 < х 7, при 7 < х 8, при 8 < х < оо Рассмотрим теперь независимые случайные величины X и У, имеющие плотности распределения /(а?) и д(у) соответ- ственно. Согласно (11.2) и (11.3) для любых а < Ь и с < d вероятность того, что случайный вектор (Х,У) принадлежит прямоугольнику [a, b) х [с, d), равна Ъ d Р(а X < Ь, с Y < d) = J f f(x)g(y)dxdy. а с Поскольку любое достаточно хорошее множество А на плос- кости можно представить в виде суммы непересекающихся прямоугольников, то Р((х,у)еЛ) = f(x)g(y)dxdy. А Пусть S = X + Y. Обозначим А = {(х, у) : х + у < а}. Тогда {$<»} = {(х,у)ел}и Р(Х + У<») 8 ОО =у/ f(x)g(y)dxdy = 1 и -оо -оо f(x)g(y — x)dx]dv.
15. РАСПРЕДЕЛЕНИЯ СУММ СЛУЧАЙНЫХ ВЕЛИЧИН 119 В силу определения плотности из этого представления сле- дует, что функция ОО h(v) = J f(x)g(v — x)dx (15.3) -оо является плотностью распределения суммы X + У. Опре- деленную этой формулой функцию h называют сверткой функций f и д и обозначают h(v) = f * g(v) или, без ука- зания аргумента, h = f * д. Таким образом, плотность рас- пределения суммы двух независимых случайных величин, имеющих плотности распределения, равна свертке плотно- стей распределений слагаемых. Если величины X и У неотрицательны, т. е. /(а?) = 0 при х < 0, и д(у) = 0 при у < 0, то формула свертки (15.3) превращается в следующую: при v О V h(v) — J f(x)g(v — x)dx, (15.4) о а при v < 0 имеем h(v) = 0. Равенство нулю плотности при отрицательных значениях аргумента отражает тот факт, что сумма двух неотрицательных величин неотрицательна. Теорема 2. Пусть f,g u h - плотности распределения и 00 оо у>/(<) = У eitxf(x)dx, (pg(t) = У ettxg(x)dx, — оо -оо оо ^>л(/) — у ettxh(x)dx — ОО - соответствующие им характеристические функции. Тогда, если h = f * g, то <Ph(t) — 'Pft.tyPgtt) 11 наоборот, если = = rno h = f *g. Доказательство. С помощью замены переменной ин- тегрирования легко убедиться, что произведение характе- ристических функций и <pg(t) можно представить в сле- дующем виде:
120 ТЕОРИЯ ВЕРОЯТНОСТЕЙ оо оо = J J eitxf(x)eiiyg(y)dxdy = “ОО — оо = / / eitxf(x)e^v-^g(v - x)dxdv = -ОО “ОО ОО ОО = [ etiv ( [ f(x)g(v — x)dx]dv. — 00 —оо Из этого равенства следует, что произведение является характеристической функцией свертки h = f *д, и наоборот, характеристическая функция свертки плотностей распределения распадается в произведение характеристиче- ских функций компонент. Свертка нескольких плотностей распределения определя- ется рекуррентным способом: сначала сворачиваются пер- вые две плотности, затем результат сворачивается с тре- тьей и т. д. Из теоремы 2 следует, что свертка плотно- стей распределений обладает свойством коммутативности Л * h = /2 ♦ fi и ассоциативности (Д ♦ /2) ♦ /з = /1 * (Л ♦ /з), поэтому не имеет значения, в каком порядке сворачивать плотности распределения. Ясно, что плотность распределе- ния суммы Sn = ^Ld=iXi> где “ независимые случайные величины с плотностями распределения /<(«), равна свертке плотностей слагаемых, т. е. h(s) = Л ♦ /2 * • • • * Пример 2. Пусть Sn = Xi 4- Х2 4- • • • 4- Хп, где Xi - не- зависимые случайные величины, распределенные по пока- зательному закону с параметром Л, т. е. Xj тлеют общую плотность г/ \ / Ае-Аа?, при О О, /(а?) = < ( 0, при х < 0. Тогда плотность распределения суммы Sn имеет вид О1"1)’ I О, при s О, при s < 0.
15. РАСПРЕДЕЛЕНИЯ СУММ СЛУЧАЙНЫХ ВЕЛИЧИН 121 Убедимся в справедливости этой формулы с помощью ин- дукции. Для п = 1 эта формула верна, поскольку gi(s) = = /(s). Предположим, что она верна для п = к и докажем ее для п = к 4-1. Поскольку величины неотрицательны то применяя равенство (15.4), имеем W+1(«) = 9» * Л») = / = О kl дк+1в-Ав Г Х,Ха\к —-----г- / х dx = ———е (Л — 1)! J ’• О Задача 2. Найти плотность вероятности распределения суммы двух независимых случайных величин Z — X 4- У, где величина X равномерно распределена в интервале [а, 6], а У имеет нормальное распределение с параметрами тиа2. Решение. Обозначим h(z) - плотность вероятности рас- пределения суммы Z. По формуле (15.3) ь [ 1 1 ! Ь — a >/2ira ((z-x)- 2а2 или после замены переменных h(z) — г~—7== f е~* i2di. Используя определение функции Лапласа |9, окончательно получим Задачи Задача 15.1. Брошены две игральные кости. Какова ве- роятность выпадения на двух костях в сумме 6 очков?
122 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Задача 15.2. Смешаны две группы однотипных деталей, содержащих тц и пг деталей каждая. Число бракованных деталей в каждой группе X и Y имеют биномиальные рас- пределения Р(Х = т) = С™рт(Д т = 0,1,2..щ, P(Y = т) = С™рт(1 т = 0,1,2.п2, соответственно. Найти закон распределения числа брако- ванных деталей (X + У) в смешанной группе. Задача 15.3. Пусть Xi распределена с показательной плотностью 4е-4г, О, О х, х < О, а Х2 не зависит от Xi и распределена равномерно с плот- ностью /2(«) = < 1 2’ о, 2 0 0, х < 2, 4 < х. Найти плотность для суммы Z = X 4- У. Задача 15.4. Случайная величина X равномерно распре- делена в интервале [0,2], случайная величина У равномерно распределена в интервале [—1,1], X и У независимы. Найти плотность вероятности величины Z = X + Y. Задача 15.5. Пусть случайная величина X имеет показа- тельную плотность с параметром а, а величина У распре- делена равномерно на интервале [0,6]. Найти плотность для Х + У и X-Y. § 16. Неравенство Чебышева. Закон больших чисел В теории вероятностей часто оценивают вероятности со- бытий, порожденных случайной величиной, через моменты случайной величины. Лемма 1. Пусть X - неотрицательная случайная величи- на, т. е. X 0. Тогда для любого € > О Р(Х > <•) Е(Х) е
16. ЗАКОН БОЛЬШИХ ЧИСЕЛ 123 Доказательство. Очевидно, что для неотрицатель- ной случайной величины X справедливо равенство 1[0,е)(Х) + = 1, где 1л (ж) - индикатор множества А. Согласно четвертому свойству математического ожида- ния (§ 12) из очевидного неравенства XI[C1Oo)(X) el[C(OO)(X) следует, что E(Xl[CjOO)(X)) €Е(1[С(ОО)(Х)). Используя эту оценку и тот факт, что математическое ожидание неотрица- тельной случайной величины неотрицательно, получим Е(Х) = Е(Х(1[0,е)(Х) + l[t,oo)(X))) = = Е(Х1[0,е)(Х)) + Е(Х1[е,«,)(%)) E(XI[C|OO)(X)) > £E(I[s,оо)(Х)) = еР(Х > е). Поделив правую и левую части этого неравенства на е, по- лучим требуемую оценку. Лемма 2 (неравенство Чебышева). Для любой случай- ной величины Y с конечным вторым моментом и любого 6 > О Р(|У-Е(У)|^«)<^Р. (16.1) Доказательство. В силу неравенства (12.3) из конеч- ности второго момента следует, что математическое ожида- ние и дисперсия существуют. Применим лемму 1 для слу- чайной величины X = (У — Е(У))2 и е = <52. Тогда имеем Р(|У - Е(У)| ^ <$) = Р((У - Е(У))2 62) Е(У - Е(У))2 _ Б(У) £2 ~ $2 * Следствие 1. Для любой случайной величины У с конеч- ным вторым моментом и любого 6 > О Р(|У-Е(У)|<6)£1-^Я (16.2) Поскольку сумма вероятности события и вероятности его дополнения равна единице, то оценка (16.2) непосредственно вытекает из (16.1).
124 ТЕОРИЯ ВЕРОЯТНОСТЕЙ Следствие 2. Пусть Xi}X2}...,Xn независимые случай- ные величины с конечными вторыми моментами. Тогда для любого 6 > О P(|f> -£ЕМ > «) < (16.3) 1=1 1=1 1=1 P(|f> - £ЕМ <«)>!- ^£d(X,). (16.4) 1=1 1=1 1=1 Доказательство. Положим Y = £4=1® силу ад- дитивности математического ожидания Е(У) = 5Z”=iE(X|). По следствию 3 § 12 имеем D(y) = £3”=1 В(Х<). Подставляя эти выражения в (16.1) и (16.2), получаем (16.3) и (16.4) соответственно. Задача 1. Изнашивание орудия при стрельбе ведет к то- му, что каждый выстрел уменьшает вероятность попадания в цель на 1 %. При первом выстреле вероятность попадания равна 0.8. Производится 100 выстрелов. Найти границы, в которых с вероятностью не меньшей 0.85 будет заключено число попаданий. Решение. Поскольку каждый выстрел уменьшает веро- ятность попадания на 1 %, то при втором выстреле она рав- на р2 = 0.8-0.99, а при l-м равна pi = 0.8 • (0.99)*“ г. Пусть величина Х[ принимает значение 1 в случае попадания при l-м выстреле и 0 в случае промаха. Сумма Sn = E2?=i Xi будет числом попаданий при п выстрелах. Поскольку E(X/) = l-pf = 0.8(0.99)*-\ D(X/) = Е(Х2) - Е2(Х,) = 0.8(0.99)*”1 - (О.в^Э)*"1)2, то, используя известную формулу для суммы членов геоме- трической прогрессии, получим
16. ЗАКОН БОЛЬШИХ ЧИСЕЛ 125 При п = 100 из (16.4) следует, что 100 100 Р (52 Е(*|) - « < S100 < 52 *№ + 0 > 1=1 1=1 100 ^1-^EDW = 0-85, 1=1 где 6 выбирается так, чтобы выполнялось последнее равен- ство, т. е. 6 = ($2i=i D(X|)/0.15)^2 ~ 12.35. Таким образом, 100 юо $2 Е(Х,) — 6 « 38.37, $2 Е(Х,) + 63.07. Следовательно, 1=1 1=1 с гарантированной вероятностью 0.85 число попаданий при ста выстрелах будет заключено в пределах от 38 до 63. Рассмотрим различные виды сходимости последователь- ностей случайных величин. Определение 1. Говорят,что последовательность слу- чайных величин Хп сходится при п —♦ оо к величине X в среднем квадратичном, если Е(ХП — X)2 —► 0. Определение 2. Говорят,что последовательность слу- чайных величин Хп сходится при п —► оо к величине X по вероятности, если Р(|ХП — Х| б) —♦ 0 для любого е > 0. Определение 3. Говорят что последовательность слу- чайных величин Хп сходится при п —♦ оо к величине X с вероятностью единица, если вероятность множества всех исходов из Q, для которых имеет место сходимость число- вых последовательностей Хп(ш) —* X(w), имеет единичную вероятность, т. е. Р(о>: Хп(ш) -♦ Х(ш\) = 1. Следующий фундаментальный результат теории вероят- ностей имеет название “закон больших чисел”. Пусть про- водится большое количество независимых одинаковых экс- периментов, в каждом из которых наблюдается случайная Величина одной и той же природы. С математической точки зрения это означает, что наблюдается последовательность независимых случайных величин с одинаковыми распреде- лениями. Предполагается, что существует математическое ожидание отдельно взятой величины. Обозначим его т. За- метим, что математические ожидания у одинаково распреде- ленных случайных величин одинаковы. Тогда среднее ариф- метическое всех значений случайных величин, полученных
126 ТЕОРИЯ ВЕРОЯТНОСТЕЙ в результате экспериментов, приближается при возрастании числа экспериментов к неслучайному числу т. Теорема 1 (закон больших чисел). Пусть {Х/}^ - последовательность независимых одинаково распределенных случайных величин с математическим ожиданием т = E(Xj) и конечными дисперсиями D(X,) < оо. Тогда величина Хп = 1 ” = - 52 Х1> равная среднему арифметическому первых п ве~ п 1=1 личин из последовательности {Х|}”=1, сходится при п —> оо в среднем квадратичном, по вероятности и с вероятностью единица к математическому ожиданию т. Доказательство. Мы докажем лишь сходимость в среднем квадратичном и по вероятности. Утверждение о сходимости с вероятностью единица оставим без доказа- тельства, поскольку доказательство такой сходимости по- требовало бы значительных дополнительных сведений из те- ории вероятностей. Докажем сходимость в среднем квадратичном. Для этого вычислим квадратичное отклонение Е(ХП — т)2. Используя свойства линейности и аддитивности математического ожи- дания, несложно убедиться в том, что Е(Х„) = е(1£хЛ = i£E(X,) = 1 пт = т. 1=1 1=1 Тогда по определению дисперсии Е(ХП — т)2 = D(Xn)- Для вычисления дисперсии воспользуемся свойством 2) и след- ствием 3 § 12. В результате получим п Е(ХО - т)2 = D(X„) = D (i £ X,) = 1=1 = = = (16.5) 1=1 1=1 В последнем равенстве мы воспользовались тем, что случай- ные величины Х| одинаково распределены и, следовательно, имеют одинаковые дисперсии. Правая часть в (16.5) стре- мится к нулю при п —► оо, а это и означает, что Хп —► т в среднем квадратичном.
16. ЗАКОН БОЛЬШИХ ЧИСЕЛ 127 Докажем сходимость по вероятности. Воспользуемся оцен- кой (16.3) с 6 = пе. Для любого е > 0 по неравенству Чебы- шева имеем п п Р(|Х„ - т| > е) = р( - £в(Х<)| ns) < 4 1=1 1=1 < ,SD(%-> D№) n2e2 пе2 Правая часть этого соотношении стремится к нулю при п —> <х> для любого фиксированного е. Согласно определению это означает, что Хп —♦ т по вероятности. Пример 1. Пусть п раз бросается симметричная одно- родная монета. Выпадению герба будем приписывать зна- чение 1, а выпадению решетки - 0. Иными словами, про- водятся п случайных экспериментов, в каждом из которых наблюдается случайная величина Xt, I = 1,2,..., п со значе- ниями 1 и 0 в зависимости от выпадения герба или решет- ки, где I - номер бросания. Величины Xi независимы, по- скольку бросания никак между собой не связаны. Посколь- ку монета симметричная, то вероятности выпадения герба и решетки совпадают и равны 1/2. Тогда т = Е(Х/) = = 11 + 0.1 = 1 D(X,) = (1 - 1)21 + (о - 1)21 = 1. Величина Хп = - выражает долю выпавших гер- бов при п бросаниях монеты. Согласно закону больших чисел Хп стремится к 1/2, т. е. к вероятности выпадения герба. Если бы монета была несимметричной, т. е. веро- ятность выпадения герба была бы равна р, р ф 1/2, то т = Е(Х/) = 1 • р 4- 0 • (1 — р) = р, и по закону больших чисел доля выпадений герба будет стремиться к р. Таким образом, бросая монету большое число раз и вычисляя величину Хп, можно с большой точностью вычислить р, т. е. установить, симметричная монета или нет. В более общей ситуации, если проводятся п независимых одинаковых случайных экспериментов, в каждом из которых Может наступить или не наступить событие А, то частота появления этого события, в силу закона больших чисел, бу- дет стремиться к Р(А). Действительно, как и в примере 1,
128 ТЕОРИЯ ВЕРОЯТНОСТЕЙ положим величину Х[, равной 1, если А наступило в l-м экс- перименте, и равной 0, если не наступило. Величины Х[, I = 1,2,. ..,п независимы, так как независимы эксперимен- ты. Тогда Хп = - $2”=1 Xi - частота появления события А, Очевидно E(Xf) = Р(А), D(XZ) = Р(А) - Р2(А) = Р(А)Р(А). Можно применить закон больших чисел, из которого следу- ет, что Хп —► Р(А). Задача 2. На перрон станции метро каждые 5 минут при- ходит случайное число пассажиров, распределенное по за- кону Пуассона с параметром А = 250. За то же время с пер- рона отправляются проходящие поезда, которые могут увез- ти количество пассажиров, имеющее равномерное распреде- ление в промежутке [195,205]. Можно ли рассчитывать, что перрон не переполнится, если такой режим поддерживается постоянно? Решение. Пусть X* - число пассажиров, пришедших на перрон в течение fc-ro пятиминутного отрезка (отсчет можно вести от произвольного момента), а У* - число свободных мест в проходивших за эти 5 минут поездах. Заметим, что Е(Х*) = А = 250 и Е(У*) = (195 + 205)/2 = 200. Пусть Nn - число пассажиров, добавившихся за п пятиминуток к имев- шимся на перроне, а с - произвольное положительное число. Поскольку Nn и Е(Х*) ~ Е(У*;) = 50, то при п > с/50 справедливо п P(N„ < с) < Р - У() < с) = \=1 п = р(£(х‘ - у‘ - Е(*‘)+Е(у‘)) <с -50п) < \=1 п р (1- п - Е(х*) + Е(И))| > 50п - с) £D(X*-n) < fc=i_________ D(ai - У1) ; q (50п — с)2 п(50 — с/п)2 при п —> оо. Последнее неравенство выполнено благодаря (16.3). Таким образом, переполнение перрона неизбежно, поскольку P(Nn > с) —* 1 для любого с.
17. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 129 Задачи Задача 16.1. Устройство состоит из 60 независимо рабо- тающих элементов. Вероятность отказа каждого элемента за время t равна 0.05. Оценить снизу вероятность того, что число отказавших за время t элементов будет не больше че- тырех. Задача 16.2. Монета бросается 1000 раз. Оценить сни- зу вероятность отклонения частоты появления герба от 1 /2 меньше, чем на 0.1. Задача 16.3. Вероятность наступления некоторого собы- тия А в каждом из 1500 испытаний равна 0.2. Используя неравенство Чебышева, оценить сверху вероятность того, что отклонение числа наступлений события А от математи- ческого ожидания будет более 40. Задача 16.4. Вероятность того, что изделие является ка- чественным, равна 0.9. Сколько следует проверить изде- лий, чтобы с вероятностью не меньшей 0.95 можно было утверждать, что абсолютная величина отклонения доли ка- чественных изделий от 0.9 не превысит 0.01? § 17. Центральная предельная теорема Многие из случайных явлений возникают в результате взаимодействия большого числа малых случайных возму- щений. Примерами могут служить помехи в радиотехнике, диффузии в жидкостях и газах, рост некоторых микроорга- низмов и т. д. При определенных условиях действие таких возмущений приводит к неожиданному феномену: величина результирующего (суммарного) воздействия становится ма- ло отличной от нормально распределенной случайной вели- чины. Пель настоящего параграфа - дать математическое обоснование этому феномену. Сам феномен составляет суть предельной теоремы, которая в силу особой важности назы- вается центральной. При доказательстве предельных теорем, т. е. теорем о сходимости при п —♦ оо функций распределения некоторых случайных величин, зависящих от индекса п, к распреде- лению предельной величины, удобно иметь дело не с рас- пределениями величин, а с характеристическими функция- ми этих величин. Это связано с тем, что характеристиче-
130 ТЕОРИЯ ВЕРОЯТНОСТЕЙ ские функции более удобны для аналитического изучения, и с тем, что сходимость распределений и сходимость характе- ристических функций эквивалентны, о чем свидетельствует следующий результат. Теорема 1. Пусть ~ характеристические функции случайных величин Zn, a Fn(x) - функции распределения Zn, т. е. у>п(<) = Е(еИИп), Fn(x) = P(Zn < х). Пусть <p(t) - харак- теристическая функция случайной величины Z, a F(x) - функ- ция распределения Z, т. е. <p(t) = E(e’*z), F(x) = P(Z < x). Тогда следующие утверждения эквивалентны’. 1) в каждой точке непрерывности функции F(x) имеет ме- сто сходимость Fn(x) —+ F(x) при п —* оо; 2) <pn(t) —* <p(t) для любого t G R1 при п -+ оо. Этот результат приводится без доказательства, так как для доказательства потребуются сложные математические рассуждения. Лемма 1. Если функция распределения F(x) непрерывна на всей прямой, то сходимость Fn(x) —* F(x) для любого х € R1 эквивалентна равномерной сходимости’, при п —* оо sup |F„(x) - F(x)H 0. (17.1) «ен.1 Доказательство. Для произвольного е > 0 разобьем интервал [0,1] на интервалы [у*,j/t+i),k = 0,1,...,m, так, чтобы 0 < j/fc+i - yk €. Считаем, что j/o = 0, ym+i = 1- Поскольку функция F(x) непрерывна и не убывает, то су- ществуют такие точки я*, что F(xk) = Ук и Хк < Xk+i,i: = = 0,1,..., т. Поскольку Fn(a?*) —♦ F(xk) при п —* оо, то можно указать столь большое N, что при п ДГ будут выполнены неравенства |Fn(x*)- F(arfc)| < е, k = 0, l,...,m+ 1. В силу этих оценок для любого n N и£ = 0,1,..., m будем иметь 0 Fn(xk+i) - Fn(xk) |Fn(a!fc+i) — F(xfc+i)|4- 4- F(r*;+i) — F(xk) 4- |F(a?fc) — Fn(xfc)J 3e.
17. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 111 Используя теперь монотонность функций Fn(x) и F(a?), для п > N получим sup |Fn(z) - F(z)| max { sup (Fn(z) - Fn(zfc))+ reR1 + |F„(xfc)-F(x*)|+ sup (F(x)-F(xk))}^ max {Fn(xk+1) - Fn(xk) + |Fn(zfc) - F(a?fc)|+ + F(xk+1) - F(xk)} 3г + £ + £ = 5г. Так как £ выбиралось произвольным, из этой оценки следует утверждение леммы. Теорема 1 об эквивалентности утверждений о сходимо- сти характеристических функций и функций распределения играет принципиальную роль при доказательстве следую- щего основополагающего результата теории вероятностей. Теорема 2 (центральная предельная теорема). Пусть {Х/}~г - последовательность независимых одинаково распре- деленных случайных величин с математическими ожидания- ми Е(Х/) = а и конечными дисперсиями D(Xj) = а2. Положим Sn = 52"=i Xi- Пусть Fn(x) = P(Zn < х) - функция распределе- ния случайной величины Zn = а V(®) - функция рас- пределения нормального закона со средним 0 и дисперсией 1. Тогда при п —► оо sup |Fn(a?)-V(a?)H0. (17.2) ген1 Доказательство. Характеристическая функция нор- мального распределения со средним 0 и дисперсией 1 имеет вид е~* /2 (см. §14). Пусть = E(e‘^n) - характеристи- ческая функция величины Zn. Согласно теореме 1 и лемме 1 достаточно доказать, что для любого t G R1 (17.3) Пусть <p(t) = = E(e*/r‘) - характеристическая функция величины Yi = ——-. Величину Zn представим в виде суммы <7
132 ТЕОРИЯ ВЕРОЯТНОСТЕЙ величин У, деленной на у/п: Величины У/ независимы и одинаково распределены, по- скольку таким свойством обладают величины Xj. Используя свойство 2 и следствие 2 для характеристических функций (§13), получим По формуле Тейлора, примененной к функции у>(<), имеем *>(*) = »К0) + V'(0)t + ^t2 + a(t)t2, (17.5) 41 где a(t) —> 0 при t —> 0. Согласно первому свойству характе- ристической функции 9?(0) = 1. По следствию 3 § 13 Е(У,) = -i/(0), D(K() = -/'(») + (/(О))2- Используя известные нам свойства, вычислим математиче- ское ожидание Е(У/) и дисперсию D(Y/) : Е(У() = е(^) = i(E(X,) - а) = 0, D(y,) = ±D(X,) = 1. В результате имеем 9?'(0) = 0, 9?z,(0) = — 1. Подставляя эти значения в (17.5), получим ¥>(*) = 1 - L + а(/^2 Поэтому формулу (17.4) можно переписать в виде Обозначим Тогда п/?п(£) —> — /2/2, /3n(t) —* 0, и, принимая во внимание хорошо известное пре- дельное соотношение ПшСИ-/?)17'3 = е,
17. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 133 получим МО = ((1 + /М‘))1/'М,,)П'М‘) - е’|,/2- Требуемое соотношение (17.3), а, следовательно, и теорема 2 доказаны. Замечаете 1. Как следует из доказательства, величину Zn тложя.0 представить в виде Zn — Yn /, где слагаемые Уп i = ~7= независимы и одинаково распределены со средним Е(Упд) = 0 и дисперсией Е(Уп2?) = ~ ~ обратно пропорцио- нальной числу слагаемых. Часто оказывается, что зависи- мость слагаемых Упд от п является более сложной, чем зави- симость вида Yi/y/n. Тем не менее, если эти слагаемые при каждом п независимы, имеют среднее 0 и дисперсию, обрат- но пропорциональную п, то при некотором дополнительном ограничении справедливо соотношение (17.2). Очень важ- ным обстоятельством является то, что центральная предель- ная теорема справедлива для случайных величин X/ с любы- ми распределениями, для которых ЕХ/ = 0,D(Xj) — а2 < оо. Замечание 2. Из формул (17.2), (10.1) и (14.1) следует, что для Si < S2 Пример 1. Приведем вывод интегральной теоремы Муав- ра-Лапласа (§ 9) из центральной предельной теоремы. Про- водятся п испытаний Бернулли и нас интересует число на- ступлений события А. Пусть случайная величина Xi прини- мает значение 1, если в /-м испытании событие А наступило, и 0 в противоположном случае. Тогда Е(Х|) = р, D(Xj) = pq, где р = Р(А) и q = 1 — р. Обозначим Sn = E”=i Величина Sn равна числу наступлений события А в п испытаниях. Для
134 ТЕОРИЯ ВЕРОЯТНОСТЕЙ mi — пр , m2 — пр mi < m2 положим ап = —;-, оп = — -. Используя вве- y/npq y/npq денные обозначения и (17.6), получим, что для Pn(mi,m2) (определение см. § 8) справедливо соотношение P„(mi, m2) = P(mi Sn т2) = Р(тх Sn < т2 + 1) « к Кф(6»+-ф(а"»- В последнем приближенном равенстве мы воспользовались равномерной непрерывностью функции Ф(ж). Полученное со- отношение и составляет утверждение интегральной теоремы Муавра-Лапласа. Задача 1. Производится стрельба с большого расстояния по круглой мишени так, что при каждом выстреле попада- ние равновозможно в любую точку мишени. Промахов нет. Мишень разделена концентрическими окружностями, рав- ноотстоящими друг от друга на 10 областей. Центральная область является кругом с радиусом, равным расстоянию между окружностями, и попадание в нее оценивается в 10 очков. Попадание в прилегающее к ней кольцо оценивается в 9 очков, в последующее - 8 очков, и так далее - до 1 очка для последнего кольца. Вычислить приближенное значение вероятности того, что при 100 независимых выстрелах бу- дет набрано от 360 до 430 очков. Решение. Поскольку все точки мишени равновозможны для поцадания, то шансы попадания в каждое из колец опи- сываются геометрическими вероятностями. Площадь круга равна тгг2, где г - радиус. Обозначим расстояние между окружностями через d. Легко подсчитать, что площадь к- го кольца равна ird2((k 4- I)2 — к2) = 7г с/2 (2& + 1). За нуле- вое кольцо принимается центр круга, а за 9-е - последнее кольцо. Площадь всей мишени равна ЮОтп/2. Следователь- но, вероятность попадания в к-е кольцо равна (2к + 1)/100, к — 0,1,2,..., 9. Пусть X - случайная величина, равная чи- слу очков, набранных при одном выстреле. Тогда закон рас- пределения X задается следующей таблицей X 10 9 8 7 6 5 4 3 2 1 р 1 100 3 100 5 100 7 100 9 100 11 100 13 100 15 100 17 100 19 100
17. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 135 Вычисляя математическое ожидание и дисперсию вели- чины X, получим Е(Х) = 3.85, Р(Х) = Е(Х2) - Е2(Х) = = 5.5275. Следовательно, «2.351. Пусть Xj - случайная величина, равная числу попаданий при 1-м выстреле. Тогда Sn = ~ суммарное число очков при п выстрелах. Применяя центральную предельную теорему (точнее формулу 17.6), для любых mi < m2 полу- чим Подставляя в правую часть этого соотношения значения ма- тематического ожидания, дисперсии и параметров mi = 360, m2 = 430, получим, что вероятность набрать при стрельбе от 360 до очков 430 приблизительно равна |(Ф(1.91) - Ф(-1.06)) = |(Ф(1.91) + Ф(1.06)) « 0.825. Задачи Задача 17.1. При выстреле по мишени стрелок попадает в десятку с вероятностью 0.5, в девятку - 0.3, в восьмерку - 0.1, в семерку - 0.05, в шестерку - 0.05. Стрелок сделал 100 выстрелов. Какова вероятность того, что он набрал не менее 900 очков? Задача 17.2. Предположим, что на станцию скорой помо- щи вызовы в течение суток поступают по закону Пуассона с параметром А = 73 и в разные сутки их количество не за- висит друг от друга. Определить вероятность того, что в течение года (365 дней) общее число вызовов будет в пре- делах от 26500 до 26800.
las' Часть 2 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Математическая статистика - это дисциплина, изучаю- щая методы оценивания и сравнения распределений случай- ных величин и их характеристик по наблюдениям случайных величин. 118. Случайная выборка. Эмпирическая функция распределения Пусть X - случайная величина с функцией распределения F(x) — Р(Х < х). Если в ходе случайного эксперимента на- блюдается одно значение случайной величины X, то суще- ственной информации о распределении X или ее характери- стиках получить нельзя. Однако, если проводится большое количество не зависимых друг от друга одинаковых случай- ных экспериментов, в каждом из которых наблюдается зна- чение случайной величины X, то при достаточно большом количестве экспериментов можно получить хорошие оцен- ки функции распределения величины X и ее характеристик. Построение таких оценок и является одной из основных за- дач статистики. Определение 1. Случайной выборкой объема п, от- вечающей случайной величине X с функцией распределения F(x), называется набор п независимых случайных величин Xi, Хг,..., Хп, каждая из которых имеет распределение F(x). Определение 2. Случайная величина, являющаяся функцией случайной выборки, называется статистикой. Таким образом, для любой достаточно хорошей (на- пример, кусочно-непрерывной) функции д(х), величина <gi(Xi, Хг,..., Хп) - статистика. Величина Х(*) = 0fc(Xi, Хг,..., Хп), где дк - отображе- ние из Rn в R1, сопоставляющее каждому вектору х G Rn ту из его координат, которая занимает к-е по порядку зна- чение в упорядоченном по возрастанию наборе, составлен- ному из координат вектора, называется fc-й порядковой статистикой. В частности, X(i> = тт{Х1,Хг,.. .,ХП} и
18. СЛУЧАЙНАЯ ВЫБОРКА 137 Х(п) = max{Xi,X2, ...,ХП}. Набор упорядоченных случай- ных величин X(i) Х(2) Х(п) называется вариацион- ным рядом. Часто для краткости случайную выборку Х1,Хг,.. .,Хп объединяют в один случайный n-мерный вектор X = = (Х1,Хг,... ,ХП). Экспериментатор (статистик), как пра- вило, располагает одной реализацией этой случайной вы- борки, т. е. набором чисел х = (®i,a?2,... ,а?п), получен- ных в результате наблюдений величины X при п незави- симых повторениях случайного эксперимента в одинаковых условиях. Согласно теории, оценки параметров величины X или ее распределения, построенные по случайной выборке (Xi, Хг,..., Хп), будут сходится при п —> оо к истинному зна- чению параметра или распределению либо по вероятности, либо с вероятностью единица, т. е. для почти всех реали- заций выборки. Таким образом, уже по одной реализации (®i, Х2, •.. ,хп) случайной выборки, когда п велико, можно построить оценку, с большой вероятностью хорошо аппрок- симирующую истинный параметр или распределение. Пример 1. Рассмотрим задачу о приближенном вычисле- нии вероятности выпадения герба для несимметричной мо- неты. Пусть р - вероятность выпадения герба, а 1 — р - ве- роятность выпадения решетки. Для того, чтобы приближен- но вычислить параметр р, производятся независимые броса- ния монеты, и каждый раз выпавшему гербу сопоставляется единица, а решетке - ноль. Таким образом, мы имеем после- довательность независимых одинаково распределенных слу- чайных величин {1, если при /-м бросании выпадает герб, л t к О, если при 1-м бросании выпадает решетка. Набор величин (Xi, Хг,..., Хп) является случайной вы- боркой для величины X с Р(Х = 1) = р, Р(Х = 0) = 1 — р. Поскольку E(Xj) = 1 • р 4- 0 • (1 — р) = р, то из закона больших чисел (см. часть 1, §16) следует, что случайная величина Хп = равная доле выпавших гербов, сходится с вероятностью единица при п —+ оо к величине р. Следовательно, статистика Хп является хорошей оцен- кой для р, если п достаточно велико. При многократном
138 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА бросании монеты наблюдатель имеет лишь набор п чисел вида (1,0,1,1,0,..., 1) = (a?i,a?2, •• -^п), т. е. одну конкрет- ную реализацию случайной выборки (Xi,Xa,. ..,ХП). Вме- сто случайной величины Хп он тоже имеет ее реализацию хп = — 52”=1 С математической точки зрения реализация случайной выборки (a?i,...,хп) представляет собой значение случайного вектора X при каком-то элементарном исходе. Поскольку сходимость Хп —* р имеет место для почти всех исходов (с вероятностью единица), то и хп при достаточно больших п будет близка к р. Замечание 1. Одна из основных задач математической статистики состоит в построении по случайным выборкам X других случайных величин, которые служат оценками пара- метров или распределений. Эти оценки при неограниченном увеличении числа наблюдений компонент выборки, сходят- ся с вероятностью единица или по вероятности к истинному значению параметра наблюдаемой величины или ее распре- делению. Прикладная статистика имеет дело с конкретны- ми реализациями случайных величин, полученными в ходе случайных экспериментов. Она использует оценки и форму- лы математической статистики, при этом вместо случайных величин Xi подставляются их конкретные реализации Х[. Рассмотрим задачу о построении оценки для функции распределения F(x) случайной величины X по случайной выборке X = (Х1,Хг, • • • ,ХП). Такой оценкой будет служить так называемая эмпирическая функция распределения. Определение 3. Эмпирической функцией распреде- ления, построенной по случайной выборке (Xi,Хг, • • •,Хп), называется случайная функция 1=1 где 1а(у) ~ индикатор множества А. Замечание 2. Для конкретной реализации (®i, Жг> • • • > ^п) выборки (Xi, Хг,..., Хп) и фиксированного числа х величина Fn(aj) равна доле тех значений xj, которые меньше х. Замечание 3. Свойства эмпирической функции распре- деления Fnix) аналогичны свойствам обычной функции рас-
18. СЛУЧАЙНАЯ ВЫБОРКА 139 пределения: Fn(x) - неубывающая функция по х, О С Fn(x) 1 для любого х, и Fn(-oo) = 0,Fn(oo) = 1. Замечание 4. Эмпирическую функцию распределения можно описать следующим образом. От минус бесконечно- сти вплоть до первой порядковой статистики X(i) значение Fn(x) равно нулю. Далее значение Fn(x) увеличивается на - п к в каждой из точек X(fc), т. е. Fn(x) = - при х G (X(fc), X(fc+1)]. При х большем чем n-я порядковая статистика Х(п) значе- ние Fn(x) равно 1. Для любого фиксированного х случайная величина Fn(x) имеет следующее распределение p(f„(«) = £) = C*(F(x))“(l - FW\ k = 1,2,. ,.,п. Действительно, событие {/п(ж) = состоит в том, что произошло ровно к из событий {Xj < а?}, I = 1,2, ...,п, и, следовательно, произошло п — к противоположных событий. Воспользуемся схемой Бернулли (§ 8). Будем говорить, что в /-м испытании наступил успех, если {Xj < х}, и неудача, если {X/ ж}. Тогда вероятность успеха р = P(Xj < ж) = = F(x), а вероятность неудачи q = P(Xf ж) = 1 — F(x). По формуле Бернулли (8.1) вероятность наступления ровно к успехов равна Ckpkqn~k) и эта вероятность равна вероятно- f к 1 сти события (^п(ж) = Что и требовалось доказать. В рамках приведенной схемы легко вычислить функ- цию распределения порядковой статистики Х(т). Событие {Х(т) < ж} означает, что наступило не менее чем т событий вида {Xj < ж}, I = 1,2,..., п. Вероятность такого события по формулам (8.2), (8.3) равна Р(Х(га) < х) = Р„(т,п) = £ С‘(Р(х))‘(1 - Р(®))-‘ = к=т = 1 - L C„W))‘(1 - *(*))"-*• к=а Для крайних порядковых статистик эти формулы принима- ют простой вид: Р(Х(1) < х) = 1 - (1 - Р(«))", Р(Х(П) < х) = (Р(х))".
140 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Пример 2. Пусть наблюдается следующая реализация выборки: 0.2; —1.7; —3.6; 2.1; 5.2; —3.4; 4.1; 1.8; —1.3; 2.6. График эмпирической функции распределения для этой реализации имеет вид Рис. 9 Это ступенчатая функция, имеющая в точках выборки скачки размера 0.1. Следующий результат утверждает, что эмпирическая функция распределения Fn(x) является хорошей оценкой для функции распределения F(a?). Теорема 1 (Гливенко). С вероятностью единица при п —> оо sup - F(z)| -> 0. (18.1) Доказательство. Мы докажем это утверждение лишь для случая, когда функция распределения F(x) непрерыв- на. Для произвольной функции F(x) доказательство осуще- ствляется аналогично, хотя и требует дополнительных рас- суждений. Пусть е > 0 - произвольное малое число, для ко- торого число т = 1/е целое. Так как функция F(x) непрерыв- на и не убывает, то можно выбрать такую возрастающую по- следовательность чисел Xq = —оо, a?i,..., = оо, что Г(жо) = 0, F(®i) = e, ..., F(xk) = Ek, .. .,F(xm) = 1.
18. СЛУЧАЙНАЯ ВЫБОРКА 141 Поскольку фунции Fn(x) и F(x) являются неубывающими, то для любого k и х G [ж*, Xk+i) справедливы соотношения Fn(x) - F(x) Fn(xk+1) - F(xk) = Fn(xk+1) - F(xk+1) + £, Fn(x) - F(x) Fn(xk) - F(xk+1) = Fn(xk) - F(xk) - e. Отсюда следует, что sup |Гп(ж)-Г(ж)| max |Гп(ж*) - F(zfc)| 4- е. (18.2) Положим Yi — I(-oo>a;)(Xi). Поскольку величины X/ неза- висимы и одинаково распределены, то и величины У/ незави- симы и одинаково распределены. В силу определения мате- матического ожидания и первого свойства дисперсии имеем Е(Г|) = £(!(_„,,)(*,)) = Р(Х, е (-<»,«)) = Р(Х; < «) = F(x), D(yl) = E(I^)(X,))-E2(«) = = F(x) - F2(x) = F(x)(l - F(x)) 1. Тогда, согласно закону больших чисел (теорема 1, § 16), для любого фиксированного х F»w = ;Ey<^E(y') = pw 1=1 с вероятностью единица. Поэтому для конечного набора то- чек #о5 • • ч хт каждое из предельных соотношений Fn(xk) -> F(xk)t к = 0,1,...,пг, будет выполняться с вероятностью единица. Теперь, прини- мая во внимание оценку (18.2), получим, что с вероятностью единица limsup sup |Fn(«) — Г(ж)| г = —. п—»оо rgR1 т Событие, состоящее из тех исходов, для которых выполняет- ся это неравенство, обозначим Qm. Это неравенство спра- ведливо для всех натуральных т. Следовательно, для тех
142 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА исходов, которые входят во все события одновременно, т. е. входят в произведение Пт=1^™’ выполняется соотно- шение (18.1). Согласно Лемме 1 § 6 Р^Пт=1 = 1- Таким образом, множество исходов, для которых выполняется со- отношение (18.1), имеет вероятность единица. Сформулируем без доказательства еще один результат, который характеризует качество оценки Fn(x). Из него сле- дует, что оценка Fn(x) является достаточно хорошей оценкой функции распределения F(®). Теорема 2 (Колмогорова). Пусть ОО (-1/ехр(—2/222), при 0 < 2, /С(^) — |=—оо 10, при 2^0, - функция распределения Колмогорова. Тогда, если функ- ция распределения F(x) непрерывна, то для любого г P(\/n max |Fn(z) — F(a?)] < 2) —► £(2), при п —> оо. хбН.1 Этот результат можно переформулировать следующим образом: случайная величина Zn = -Уйтахген.1 |Fn(a?) — F(x)| при больших п имеет функцию распределения, мало отлича- ющуюся от £(2). В силу этого, для любого наперед заданно- го малого числа а, выбирая z\-a так, чтобы JC(2i-a) = 1—а, мы получим, что оценка шахжен.1 |Fn(a;) — F(x)| < выпол- у/П няется с вероятностью, приблизительно равной 1 — а. Та- ким образом, с вероятностью, близкой к единице, для всех х оценка Fn(x) отличается от F(«) не более, чем на z\_a!y/n. Перейдем к оцениванию плотности распределения слу- чайной величины X. Пусть f(x) - плотность распределе- ния величины X, и пусть (Х1,%2, • • -,Хп) - случайная вы- борка, отвечающая величине X. Выберем произвольное чи- сло h > 0. Положим Xh = [x/h]h, где [а] - обозначает целую часть числа а, т. е. [а] - наибольшее целое число, не пре- восходящее а (например: [2.31] = 2, [—2.11] = —3). Определение 3. Эмпирической плотностью распре- деления, построенной по случайной выборке (А\, Х2,. ..,Хп),
18. СЛУЧАЙНАЯ ВЫБОРКА 143 называется случайная функция 1 п fn,h(x) = V2 At*?» ,*?»+*) (^)- /=1 Рассмотрим эту функцию подробнее. Когда х пробегает всю вещественную ось от —оо до оо, число к = [ж/Л] принимает все целые значения ..., -2,-1,0,1,2,.... Обозначим - чи- сло тех значений величин X;, которые попадают в интервал [fcfc, (fc-pl)A), т. е. vk = £ 1[*Л)(*+1)А)(Х0- пРи kh < х < (*+1)* 1=1 имеем к = [x/h]tXh = kh, и, следовательно, /п,л(ж) = “£• Те- перь ясно, как построить график функции который называется гистограммой распределения случайной вели- чины X. Нужно разбить всю вещественную ось на интерва- лы длины h и каждому интервалу [kh, (к + 1)Л) сопоставить число —. nh Пример 3. Пусть дана следующая реализация выборки, состоящей из 20 компонент: 0.78; -0.12; -0.61; 0.92; 0.55; 1.63; -1.16; 0.01; -0.45; 0.20; -0.38; 0.62; 0.46; -0.22; 1.11; -0.77; 0.37; 0.72; -0.24; 0.42. Гистограмма с шагом h — 0.4 для этой реализации имеет следующий вид: Рис. 10
144 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Эмпирическая плотность распределения fn,h(x) использу- ется в качестве оценки для /(ж) - плотности распределения случайной величины X. Теорема 3 (о сходимости эмпирических плотностей распределения). Пусть п —> оо и h —> 0 так, что nh —> оо. Тогда в каждой точке х, в которой плотность f(x) непрерыв- на, fn>h(x) —► /(ж) по вероятности. Доказательство. В целях упрощения доказатель- ства мы не будем переходить к пределу одновременно при п —>оо, Л —► О и nh —+оо. Предельный переход будет осуще- ствлен последовательно. Сначала перейдем к пределу при п —> оо при фиксированном Л, а затем - при h —> 0. Пред- ложенное ниже доказательство хорошо отражает существо дела. Доказательство утверждения теоремы 3, в котором осуществляется одновременный предельный переход, не на- много сложнее, но оно использует вариант закона больших чисел, который мы не рассматривали. Положим Yi = Как и Xi, величины Yi явля- ются независимыми и одинаково распределенными. Матема- тическое ожидание и дисперсия величины У} имеют вид Е(У|) = Р(х е + Л)), D(y,) = Р(Х е , хь + Л)) - Р2(Х G [«»,»» + Л)) $ 1. Применяя закон больших чисел (теорема 1, § 16), получим, что при п —* оо АД*) = Е Yi - = £р(* 6 к». Ъ + А)) (=1 по вероятности. Далее, поскольку /(ж) непрерывна, а ж/, —> ж при h —> 0, имеем ®л+Л 1р(хекь,«» + л)) = 1 [ f(y)dy^f(x). Таким образом установлено, что по вероятности Jim lim fn,h(x) = /(ж). h-*On-*oo
18. СЛУЧАЙНАЯ ВЫБОРКА 145 Именно это мы и планировали доказать. Замечание 5. Чтобы обеспечить выполнение условий те- оремы 3, следует при построении эмпирической плотности распределения выбирать h в зависимости от п так, чтобы при больших п и малых h произведение nh тоже было боль- шим, например, Л = 1/\/п. В дальнейшем нам потребуется следующая характеристи- ка функции распределения. Определение 2. Квантилью порядка р функции рас- пределения F(x) называется такое число zPi для которого F(zp) р, a F(x) р, если оно единственно, а если множество таких чисел составляет целый интервал, то по- лагаем zp - средняя точка интервала. Для непрерывной строго возрастающей функции F(x) при любом 0 < р < 1 квантиль zp единственна и F(zp) — р. Квантиль порядка 1/2 функции распределения F(x) назы- вают медианой распределения. Для случайной величины с непрерывной строго возраста- ющей функцией распределения вероятность того, что вели- чина примет значение меньше медианы равна вероятности того, что она примет значение больше медианы и равна 1/2. Многие численные характеристики эмпирического рас- пределения служат в качестве выборочных характеристик. Определим выборочную квантиль порядка р, как кван- тиль порядкар для эмпирического распределения Fn(x)t т. е. определим ее равенством {Л([пр]+1), если пр - не целое число, 2^(М + если пР ” Целое число, где [а] - целая часть числа а. Выборочная медиана - это медиана эмпирического рас- пределения. Она равна величине Х(£+1), если п = 2к + 1 - нечетное, и + X(*+i)), если п = 2к - четное. В следующем параграфе речь пойдет о других выбороч- ных характеристиках. Задача 1. Вычислить выборочную квантиль порядка р = = 0.35 для реализации выборки из примера 2. Определить выборочную медиану.
146 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Решение. В примере 2 хм = — 3.6, z(2) = — 3.4, х(3) = —1.7, — —1.3, Ж(8) = 0.2, — 1.8,ж(т) = 2.1, з?(в) — 2.6, яру — 4«1, ж<10) = 5.2. Так как п= 10, то [пр} = [3.5} = 3. Следовательно, «0.35 = ®(4) = _ 1-3. Поскольку 10 - четное число, то выбороч- ная медиана равна ^(т(5)+ж(в)) = |(0.2+1.8)=1. § 19. Оценки параметров РАСПРЕДЕЛЕНИЯ. ВЫБОРОЧНЫЕ МОМЕНТЫ Пусть X = (Х1,Хз,..., Хп) - случайная выборка, отвеча- ющая величине X с функцией распределения F(x). Пусть в - некоторый параметр, характеризующий распределение слу- чайной величины X, например, О — Е(Х) - математическое ожидание, или 0 = D(X) " дисперсия, или 0 = E(Xfc) - мо- мент порядка к. Пусть по случайной выборке X для параме- тра в построена некоторая оценка 7П(Х), которая является случайной величиной. Определение 1. Оценка 7пР0 называется состоя- тельной! оценкой параметра 0, если 7п(Х) —► 0 по вероят- ности при п —> оо. В этом определении, если говорить абсолютно строго, речь идет о состоятельной последовательности оценок, а термин “состоятельная оценка” служит сокращенным назва- нием для этого понятия. Определение 2. Оценка уп(X) называется несмещен- ной оценкой праметра 0, если Е(7П(Х)) = 0. Определение 3. Оценка уп (X) называется инвариант- ной относительно сдвига (безразличной к сдвигу), если для любой постоянной с 7п(-^1 + С,%2 + С5 • • • fXn + с) = 7п(Х1,Х2) • • • ,Хп). Рассмотрим конкретные оценки параметров распределе- ния случайной величины X. Для того, чтобы в дальнейшем не усложнять формулировки теорем, мы сразу предположим, что выполняется следующее условие: если рассматривается оценка или момента порядка к центрального момента поряд- ка к, то у случайной величины X конечен момент порядка 2k. Это условие нам потребуется для того, чтобы применять закон больших чисел (§16).
19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 147 1. Выборочное среднее. В качестве оценки для ма- тематического ожидания т — Е(Х) используется оценка Хп — ~XZ”=i которая называется выборочным средним. Замечание 1. Выборочное среднее является средним значением (математическим ожиданием) для эмпирической функции распределения. В этом утверждении присутствует необычное наслоение, связанное с понятием случайный. Эмпирическая функция распределения сама зависит от случая, т. е. каждому значе- нию случайной выборки отвечает своя реализация эмпири- ческой функции распределения. Рассматривая эту реализа- цию как обычную функцию распределения, мы можем вычи- слить среднее той случайной величины, которая ей соответ- ствует. Согласно замечанию 4 § 18 эта величина принимает значения (если их упорядочить) к = 1,2,..., п, с равны- ми вероятностями Среднее же этой дискретной случай- те ” 1 ной величины по определению (см. § 12) равно £2 ^(*)_ = _ к=1 п = Хп, т. е. равно выборочному среднему. Теорема 1. Выборочное среднее Хп является несмещенной состоятельной оценкой математического ожидания Е(Х). Доказательство. Несмещенность является следстви- ем цепочки равенств Е(Х„) = 1е(ЕХ') = 1=1 1=1 1=1 Состоятельность Хп следует из закона больших чисел (§ 16), согласно которому Хп —> m по вероятности. Для выборочного среднего очевидно следующее равен- ство Xn(Xi + с,..., Хп + с) = п = |$2(Х| + с) = с + Хп(Х1,Х2..х„), (19.1) 1=1 которое можно охарактеризовать как свойство аддитивности выборочного среднего.
148 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 2. Выборочная дисперсия. В качестве оценки для дисперсии D(X) используется оценка 1=1 которая называется выборочной дисперсией. Выборочная дисперсия характеризует среднеквадратич- ное отклонение выборочных величин от выборочного сред- него. В определении выборочной дисперсии множитель ----- 71 — 1 взят вместо множителя - для того, чтобы добиться важного п свойства несмещенности оценки . Теорема 2. Выборочная дисперсия S% является инвари- антной относительно свдига несмещенной состоятельной оценкой дисперсии D(X). Доказательство. Используя равенство (19.1), полу- чим Sn(Xi + с,..., Хп + с) = п = + с-Х„(Х1+с,...,Х„ + с))2 = 1=1 п = ....X„))2 = S2(X11...,Xn). (19.2) 1=1 Это доказывает инвариантность оценки S2 относительно сдвига. Проверим несмещенность. Пусть т = Е(Х,),<т2 = D(Xj). Положим Yi = Xi — т. Тогда E(Yj) = Е(Л}) — т — 0,D(Y/) = = D(Xf) = а2. В силу инвариантности относительно сдвига S2(X) — Sn(Y). Далее имеем з?(?) = гл - F»)2 = гл ZX -2y,F"+F»> = 1=1 1=1
19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 149 _ 1 \ л у2 । п у^ __ -^ГТД>у| - ^гтк" + ^ттгп - 1=1 = (19-3) 1=1 Используя третье свойство математического ожидания (§ 12) и равенства Е(У/) = 0, получим e(f")=xi»2=Xix+25»= 1=1 1=1 l<3 = < 1=1 l<j 1=1 Теперь, применяя (19.3), найдем, что E(S’(X)) = E(S2(?)) = = — УВД’) - —Е(У2) = -5!± - -2- . £ =<А п — 1 ' ' ' п — 1 ' п — 1 п — 1 п 1=1 Следовательно, S„(X) является несмещенной оценкой диспер сии случайной величины X. Докажем состоятельность. Аналогично (19.3) имеем 1=1 = ^ЕХ?-^)- (19-4) 1=1 В силу состоятельности выборочного среднего Хп —► Е(Х) по вероятности. Поскольку квадраты независимых одинако- во распределенных случайных величин являются независи- мыми одинаково распределенными величинами, то по закону больших чисел (§ 16) имеем if;x,2-E(x2)
150 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА по вероятности. Так как —> 1, то из (19.4) следует, что S*(X) - Е(Х2) - Е2(Х) = D(X) по вероятности, а это и означает состоятельность оценки S’(X). Замечание 2. Для различных вычислений часто бывает удобней пользоваться следующей формулой для выбороч- ной дисперсии: S’(X) = -ЦЕх? - -2-х’. 71' ' п. — 1 / * п — 1 1=1 Эта формула содержится в (19.4). 3. Выборочные моменты. Выборочным моментом порядка к, построенным.по выборке X, называется величи- на х<‘) = 1у'х|‘. п п 1 1=1 Аналогично случаю с выборочным средним легко убе- диться, что выборочный момент порядка к является момен- том порядка к для эмпирической функции распределения. Теорема 3. Выборочный момент Хп ' является несмещен- ной состоятельной оценкой момента т*. Доказательство. Несмещенность следует из равенств Е^4) = Ы£х,‘) = 1 £е(Х‘) = Е(Х‘) = тк. 1=1 1=1 Состоятельность непосредственно вытекает из закона боль- ших чисел: при п —> оо 1=1 по вероятности. Выборочным центральным моментом порядка к, к 2, построенным по выборке X, называется величина 1=1
19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 151 —(4) Теорема 4. Выборочный центральный момент Sn явля- ется инвариантной относительно сдвига состоятельной оцен- кой центрального момента Ць- Доказательство. Инвариантность относительно сдви- га оценки S^\x) устанавливается точно так же, как инвари- антность оценки S2(X) (см. доказательство теоремы 2). Для доказательства состоятельности воспользуемся равенством Jb-l ak - bk = (а - b) 22 m=0 В силу этого равенства iE(X,-X„)‘-iDxf-E(X))‘ = 1=1 1=1 п k—1 = (X. - Е(Х))1 £ £(Х, - Х„Г(Х, - ЕрС))*-1— = /=1 т=0 к—1 п = (х„ - Е(Х)) - ХпУМ - E(x))k-l-m- т=0 п 1=1 (19.5) Применяя оценки (12.1), (12.2) и свойства 1), 2) математи- ческого ожвдания (§ 12), получим Е(|'^(х, -Х„)га(Х, -Е(Х))‘-1-т|) < < £Е(|(Х! -ХпГЧХ -Е(х))‘-‘-’п|) < 1=1 п так {(е(Х/ - Хп)2го)1/2(е(Х/ - Е(Х))2*-2"2та)1/2}. В силу состоятельности выборочного среднего Хп— Е(Х) —>0 по вероятности. С помощью прямых вычислений можно про- верить, что математические ожидания квадратов случайных величин (Х{ —Хп)т и (Xi — Е(Х))к~1~т конечны и не зависят
152 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА от /. Таким образом, в правой части (19.5) стоит величина, равная произведению величины, стремящейся по вероятно- сти к нулю, на величину, абсолютный момент которой рав- номерно ограничен по п. Можно доказать, что произведение таких величин стремится к нулю по вероятности. Тогда из (19.5) следует, что для того, чтобы доказать состоятель- ность выборочного центрального момента Sn , достаточно убедиться, что 1 £(Х, - Е(Х))‘ - Е(Х - Е(Х))‘ 1=1 по вероятности. Этот факт следует из закона больших чи- сел, так как величины (X/ — Е(Х))* являются независимыми и одинаково распределенными. 4. Выборочный коэффициент корреляции. В §18 дано определение случайной выборки объема п, отве- чающей одной случайной величине. Аналогичное понятие можно ввести для двух и более случайных величин. Определение 4. Случайной выборкой объема п, от- вечающей паре случайных величин (X, У), называется на- бор п независимых одинаково распределенных пар случай- ных величин (Xi, У1), (Хг, Уг),..., (Хп, Уп), каждая из которых имеет такое же совместное распределение, как и пара вели- чин (X, У). Оценкой для соу(Х,У), построенной по выборке (X,У) = = ((Х1,У1),..., (ХП,УП)), служит выборочная ковариация, определяемая по формуле п /=1 В качестве оценки для коэффициента корреляции г(Х,У) используется выборочный коэффициент корреляции, оп- ределяемый по формуле Е(Х<-ХП)(У,-У„) R (X У) = г___________________________________ a/s2(x)s2(F) /f(xz-x„)2 Е(У|-У„)2 V <=i i=i
19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 153 Для выборочной ковариации и для выборочного коэффици- ента корреляции несложно получить следующие выражения: С„(Х,У) = ^£*'у' - (19-7) 1=1 J Е хм - xnYn Rn(X, У) = . (19.8) Теорема 5. Выборочная ковариация Сп(Х,У) является ин- вариантной относительно сдвига несмещенной состоятель- ной оценкой ковариации cov(X, У). Доказательство. Используя формулу (19.6) и вы- кладки, аналогичные (19.1), (19.2), несложно проверить, что для любых ci,C2 справедливо равенство Сп(Х + с1,У + с‘2) = С„(Х,У), где ci = (ci,ci,..., ci), С2 = (б2, С2,...,сг) — n-мерные вектора с одинаковыми компонентами. Это равенство и означает, что выборочная ковариация Сп(Х , У) инвариантна относительно сдвига. Докажем несмещенность оценки (19.7). В силу инвари- антности относительно сдвига можно считать, что Xi и У/ имеют нулевые средние (ЕХ/ = ЕУ/ = 0), иначе из этих ве- личин можно вычесть математические ожидания, не изменив оценку. При нулевых средних п Е(Х„У„) = ^£>(Х,У,) = 1Е(ХУ). 1=1 Теперь несложно убедиться в несмещенности оценки: ес„(х,у) = r4f>x,y') - (^т)Е<^-у-) = 1=1 = ^уЕ(ХУ) - ^Е(ХУ) = Е(ХУ) = соу(Х,У).
154 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Последнее равенство верно, поскольку мы предположили, что величины X и У имеют нулевые средние. Для доказательства состоятельности воспользуемся фор- мулой (19.7). Поскольку двумерные величины (Х/,У/) явля- ются независимыми и одинаково распределенными, то про- изведения их координат X(Yi будут независимыми одинако- во распределенными величинами. Применим закон больших чисел (§16), согласно которому 1£х,у,^е(ху) 1=1 по вероятности. Так как выборочное среднее является состо- ятельной оценкой, то имеем Хп —* Е(Х), Уп —> Е(У) по веро- ятности. Используя эти предельные соотношения в формуле (19.7), получим, что п С„(^,У) = ^(1 J3x(y,-xny„) —* Е(ХУ) — Е(Х)Е(У) 1=1 по вероятности. Правая часть этого соотношения равна cov(X, У). Следовательно, СП(Х,У) является состоятельной оценкой ковариации. Теорема6. Выборочный коэффициент корреляции Rn(X,Y) является инвариантной относительно сдвига состоятельной оценкой коэффициента корреляции r(X,Y). Доказательство. Поскольку выборочный коэффици- ент корреляции равен отношению выборочной ковариации к корню из произведения выборочных дисперсий, то инвари- антность относительно сдвига и состоятельность этой оцен- ки следует из аналогичных свойств выборочной ковариации и выборочных дисперсий. Задача 1. При обработке данных 15 испытаний спор- тивного самолета были получены следующие значения его максимальной скорости: 422.2; 418.7; 425.6; 420.3; 425.8; 423.1; 431.5; 428.2; 438.3; 434.0; 411.3; 417.2; 413.5; 441.3; 420.0 м/сек. Определить несмещенные оценки математиче- ского ожидания и дисперсии максимальной скорости само- лета.
19. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 155 Решение. Для того чтобы упростить вычисления вос- пользуемся свойством инвариантности относительно сдви- га для выборочной дисперсии, а для выборочного среднего используем равенство (19.1). Тогда вместо исходной реа- лизации выборки можно рассмотреть, например, реализа- цию х: 2.2; -1.3; 5.6; 0.3; 5.8; 3.1; 11.5; 8.2; 18.3; 14.0; —8.7;—2.8;—6.5; 21.3; 0.0, которая отличается от исходной на значение с = 420. Выборочное среднее этой реализа- 1 15 ции равно «is = — 52 Х1 — 4.73. Для вычисления выбо- 15 1=1 рочной дисперсии воспользуемся равенством (19.4). Имеем «1s = п ё ~ 1391.08-1|(4.73)2 « 75.392. Сле- довательно, оценка математического ожидания максималь- ной скорости спортивного самолета равна 424.73 м/сек. Не- смещенная оценка дисперсии приблизительно равна 75.392 м2/сек2. Задачи Задача 19.1. Произведено 16 измерений начальной ско- рости снаряда. Результаты измерений (в м/с) следующие: 1235.6; 1237.5; 1232.9; 1236.2; 1238.5; 1234.2; 1235.9; 1233.3; 1234.5; 1236.8; 1237.6; 1233.1; 1234.3; 1237.5; 1235.4; 1234.7. Вычислить оценки математического ожидания и дисперсии начальной скорости снаряда. Задача 19.2. На телефонной станции производились на- блюдения за числом неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты: 3, 1, 3, 4, 2, 1, 1, 3, 2, 7, 2, 0, 1, 2, 1, 2, 4, 0, 3, 0, 2, 0, 1, 3, 3, 1, 2, 0, 3, 4, 2, 0, 2, 1, 4, 3, 4, 2, 0, 2, 3, 1, 1, 2, 2, 3, 1, 4, 2, 2, 1, 2, 5, 1, 1, 0, 1, 1, 1, 5. Оценить среднее и дисперсию числа неправильных соеди- нений. Задача 19.3. Сырье, поступающее на завод из карьер^,, содержит два полезных компонента - минералы А и В. Ре- зультаты анализов десяти образцов сырья, поступившего в разное время из разных мест карьера, приведены в таблице,
156 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА где х и у - выборочные значения случайных величин X и Y, выражающих соответственно процентное содержание мине- ралов А и В в образцах. х 67 54 72 64 39 22 58 43 46 34 у 24 15 23 19 16 И 20 16 17 13 Оценить коэффициент корреляции величин X и У. §20. Асимптотические свойства выборочных моментов Пусть 0 - некоторый параметр распределения случайной величины X, значение которого нам неизвестно, и 7n(j?) = = 7n(Xi,X2, •• •,Хп) - оценка параметра 0t построенная по выборке X. Хорошая оценка, естественно, должна быть со- стоятельной, т. е. 7п(-Х) должно сходиться к 0 при неогра- ниченном возрастании п. В этом случае разность уп(Х) — 0 стремится к нулю. Естественно ожидать, что, домножив ее на некоторый возрастающий множитель, можно получить в пределе случайную величину, неравную постоянной. Ока- зывается, и это является следствием центральной предель- ной теоремы, что для большинства оценок таким множите- лем является у/п. Определение 1. Оценка уп(X) называется асимпто- тически нормальной с дисперсией А2, если функция рас- пределения случайной величины ^\Уп(Х) — 0) сходится при п —> оо к функции распределения стандартного нормального закона. Исследуем условия асимптотической нормальности кон- кретных оценок. Как и в предыдущем параграфе мы предпо- ложим, что если рассматривается оценка момента порядка к или центрального момента порядка А?, то у случайной ве- личины X конечен момент порядка 2А?. 1. Выборочное среднее. Теорема 1. Выборочное среднее Хп асимптотически нор- мально с дисперсией А2 = D(X). Доказательство. Воспользуемся центральной пре- дельной теоремой (§ 17). Обозначим т = Е(Х/), А2 = D(X}), Sn = 5Z”=i-X/. Величина Хп служит оценкой для т, и
20. АСИМПТОТИЧЕСКИЕ СВОЙСТВА МОМЕНТОВ 157 нам нужно убедиться в том, что нормированная разность ^(Хп — т) распределена в пределе по нормальному закону со средним 0 и дисперсией 1. Имеем £(X„-m) = £(l£x,-m) = 1=1 Sn — тп Иу/п Поскольку величины Xi независимы и одинаково распреде- лены со средним т и дисперсией Д2, то, согласно централь- ной предельной теореме, распределение величины Zn = = — тп) сходится при п —> оо к стандартному нор- мальному распределению, что и требовалось доказать. 2. Выборочный момент порядка к. Выборочный момент Х|* является оценкой для т*. = Е(Х*). Теорема 2. Выборочный момент Хп асимптотически нормален с дисперсией Д2 = Ш2к — пг^. Доказательство. Применим центральную предель- ную теорему для величин У/ = Хк. Тогда Sn = У/ и Е(У,) = E(Xf) = тк, D(y) = Е(У<2) - Е2(У,) = E(X2fc)- -Е2(Х*) = mik - = Д2. Имеем п -Х(Х„ -т‘)---д75 Величины У/ независимы, поскольку независимыми являют- ся величины Xi, и одинаково распределены со средним тк и дисперсией Д2 = rri2k — . Согласно центральной предель- ной теореме распределение величины Zn = д^(^п - сходится при п —> оо к стандартному нормальному распре- делению. 3. Выборочная дисперсия. Пусть Цк = Е(Х - т)к - к-й центральный момент случайной величины X со средним т. Заметим, что р,2 = or2 = D(X), т. е. второй центральный момент совпадает с дисперсией. Выборочная дисперсия S’2 является оценкой для дисперсии а2.
158 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Теорема 3. Выборочная дисперсия S2 асимптотически нормальна с дисперсией Д2 = //4 — Доказательство. Имеет место следующее предста- вление ч/ВД - <?) = ^(-4 £(Х, - Х„)’ - а’) = 1=1 1=1 Множитель п/(п — 1) на предельное поведение не влияет, поскольку п/(п — 1) —> 1. Далее, так как Хп —> m со ско- ростью 1/у/п в том смысле, что среднеквадратичное от- клонение имеет порядок 1/п (см. (16.5)), то можно дока- зать, что предельное поведение нормированной суммы в правой части не изменится, если в ней слагаемые заменить на У/ = (Xi — т)2 — <г2. Это доказательство довольно гро- моздкое и мы его опускаем. Таким образом, предельное по- ведение нормированной разности ,/n(S2 — а2) совпадает с предельным поведением величины х/п • * /=1 Случайные величины Yj независимы, одинаково распределе- ны и Е(У,) = Е(Х/ - т)2 - а2 = О, D(y) = D((XZ - тп)2) = E(XZ - т)4 - E2(XZ - т)2 = R - р2. По центральной предельной теореме распределение величи- ны Zn/\/Д4 — сходится при и -юо к стандартному нор- мальному распределению. Аналогичным будет и предельное поведение распределения величины y/n(S„ — <t2)/vA*4 — ^2- Это и требовалось доказать. В следующем параграфе свойство асимптотической нор- мальности будет использовано при построении граничных значений для оцениваемого параметра.
21. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ 159 §21. Доверительные интервалы При решении некоторых практических задач вместо оцен- ки неизвестного параметра распределения случайной вели- чины важнее знать границы, в которых этот параметр на- ходится. Границы интервала, содержащего неизвестный па- раметр, строятся по выборке. При небольшом объеме вы- борки, как правило, не удается указать верхнюю и нижнюю границы, достаточно близкие к параметру с большой веро- ятностью. Чем больше компонент в выборке, тем более точ- ные границы с более близкой к единице вероятностью можно построить. Пусть 0 - неизвестный параметр распределения случайной величины X, и X — (Xi,X2> • • • , Хп) - случайная выборка, отвечающая величине X. Пусть а - некоторое чи- сло между нулем и единицей, а 0[Х),0(Х) - две функции от случайной выборки X такие, что 0_(Х} 0(Х). Определение 1. Интервал (£(Х),0(Х)) называется до- верительным интервалом для оценки параметра 0, отвеча- ющим доверительной вероятности а, если Р(0(Х) < 0 < 0(Х)) а. Величина 0(Х) называется нижней доверительной грани- цей, а 0(Х) - верхней доверительной границей для параме- тра 0. Иными словами, доверительным называется такой интер- вал, который с наперед заданной вероятностью содержит оцениваемый параметр. Границы 0(Х) и 0(Х) кроме наблю- дений X будут зависеть от а и от числа наблюдений п. Рассмотрим методы построения доверительных интерва- лов для конкретных параметров. 1.Доверительные интервалыдля неизвестно- го математического ожидания т = Е(Х) при из- вестной дисперсии а2 = D(X). Согласно свойству асимптотической нормальности выбо- рочного среднего Хп имеем
160 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Тогда для любого z > О р(-г < ^(Хп - т) < « N(z) - N(-z). Очевидно, что неравенства —z < ~(ХП — т) < z эквивалентны неравенствам у za т ' Y Z(r л п — “7= < X п п rsz. у/п у/п Поэтому, используя формулу N(x) = i + ^Ф(я), выражаю- щую функцию распределения стандартного нормального за- кона через функцию Лапласа Ф(х) = -j= f e~v '2dv, получим V о р(х„ - < т < Ха + и 1(ф(г) - Ф(-2)) = Ф(«). \ v ** v *• * * В последнем равенстве мы использовали нечетность функ- ции Лапласа Ф(х). Для значений функции Лапласа и ее квантилей существуют таблицы. Поэтому, если в качестве z взять za - квантиль порядка а функции Ф(а?), то окончатель- но будем иметь р(хп - С т < Хп + ^0 « Ф(га) = а. (21.1) Сравнивая это с определением доверительного интерва- ла, мы видим, что случайный интервал [Хп — Хп + ) является доверительным интервалом для математического ожидания m с доверительной вероятностью приблизитель- но равной а. Для того, чтобы приближенные равенства были более точными, необходимо, чтобы п было велико. Таблица значений функции Лапласа позволяет по заданной величине “ In а найти значение za. Выборочное среднее Хп = -У2/-, Xi вычисляется по наблюдениям выборки X, сг - известно, п
21. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ 161 - известно, поэтому полностью определен и доверительный интервал, указанный выше. 2. Доверительные интервалы для неизвестно- го математического ожидания Е(Х) при неиз- вестной дисперсии D(X). Можно поступить аналогично предыдущему случаю, ко- гда дисперсия а2 была известна. Однако, поскольку теперь она неизвестна, то ее следует предварительно оценить. В качестве оценки для а2 возьмем выборочную дисперсию 1 п — 1 а2 _ £(Х,-Х„)2. 1=1 Поскольку S2 —> а2 при п —♦ оо по вероятности, то можно доказать, что если в приближенном равенстве (21.1) вместо сг использовать \/S^, то мы получим аналогичное прибли- женное равенство < т < Хп 4- а- Таким образом, случайный интервал (х„- у/п / ’ (21-2) где za - квантиль порядка а функции Ф(ж), является дове- рительным интервалом для математического ожидания при неизвестной дисперсии с доверительной вероятностью при- близительно равной а. Пусть можно считать, что исходная случайная величина X, математическое ожидание которой мы оцениваем, рас- пределена по нормальному закону с неизвестной дисперси- ей. Тогда можно построить доверительный интервал для т с доверительной вероятностью, точно равной а. Кроме то- го, при таком предположении, если оно справедливо, чи- сло наблюдений может быть небольшим потому, что при построении доверительного интервала не будут использо- ваться асимптотические формулы.
162 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Для случайной выборки X, отвечающей нормально рас- пределенной случайной величине, положим = Р(^(Х„-т)<»), х € (—оо, оо). Распределение Sk(x) - так называемое распределение Стьюдента с к степенями свободы, для которого есть та- блицы. Плотность этого распределения задается выражени- ем Sfc(x) = r((fc + i)/2)/ ^2\-(fc+i)/2 х/5йЬГ(Л/2) V + k ) х G (—00,00). Поскольку $к(—х) = 1 — $к(х), то для любого Z > О Р(-г < -т)< z ' V — *Sn—1(г) ^n-i( г) — 25п_1(г) 1, и, следовательно, р(х„ _ г-£к < т < х„ + - 1. \ уП уй / Существуют таблицы, с помощью которых по значени- ям а и п — 1 можно определить такое число za>n_i, что 2Sn-i(*a,n-i) — 1 = а. Величина га>к является квантилью по- рядка (1 + а)/2 распределения Стьюдента с к степенями сво- боды, поскольку Sk(za>k) = (1 + а)/2. Таким образом, случайный интервал (21.3) является доверительным интервалом с доверительной веро- ятностью равной а для математического ожидания т нор- мально распределенной случайной величины при неизвест- ной дисперсии. 3. Доверительные интервалы для неизвест- ной дисперсии при неизвестных других пара- метрах.
21. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ 163 В силу свойства асимптотической нормальности выбо- рочной дисперсии имеем У Д4 - М2 Вместо неизвестных параметров и возьмем их оценки Тогда в силу состоятельности этих оценок выполняется при- ближенное равенство < х\ fts Аг(х). Отсюда, как и в пункте 1, получим, что Ф(га) = а, где za - квантиль порядка а функции Лапласа Ф(я). Следовательно, в качестве доверительного интервала для дисперсии сг2 можно использовать • (214) Задача 1. Пусть наблюдается следующая реализация вы- борки, состоящей из 40 компонент: —1.80 -2.01 -1.63 0.54 0.25 -0.16 0.03 0.07 -1.18 1.18 1.11 0.88 1.09 -0.20 0.15 -0.37 0.65 -1.14 1.15 -1.21 -0.92 0.42 0.29 -0.90 -0.43 0.35 -1.93 0.89 -0.22 0.60 0.87 -0.43 -1.39 -0.23 0.38 -0.64 -0.57 0.23 -0.28 0.51
164 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Вычислить выборочное среднее и выборочную диспе- рсию. Построить доверительный интервал для математиче- ского ожидания с доверительной вероятностью приблизи- тельно равной 0.9. Решение. Используя формулы х„ = 1£х„ sj = -lT£x’-(-iT)x’> 1=1 1=1 получим следующие численные значения выборочного сред- него и выборочной дисперсии: хм = • (—6.00) = —0.15; s’ = i • 31.1328 - • 0.0225 = ± • (31.1328 - 0.9) « 0.80 (для обозначения реализаций используются соответствую- щие строчные буквы). Так как дисперсия неизвестна, то мы используем следу- ющую формулу для доверительного интервала, основанную на реализации случайной выборки: ( — —— х -------гу= I , \ V п у/п / где za - квантиль порядка а = 0.9 функции Лапласа Ф(ж). Из таблиц для функции Лапласа можно найти, что ^о.э « 1.684. Тогда 57='/0^0.24, -0.15 ±0.24. Следовательно, доверительный интервал для математиче- ского ожидания имеет вид (—0.39,0.09). Таким образом, для данной выборки наблюдений с вероятностью приблизитель- но равной 0.9 математическое ожидание т удовлетворяет неравенству —0.39 < т < 0.09. Задачи Задача 21.1. По результатам измерений, приведенных в задаче 19.1, требуется: а) вычислить доверительный интер- вал для математического ожидания начальной скорости с доверительной вероятностью 0.9; б) вычислить доверитель- ный интервал для дисперсии с доверительной вероятностью 0.92.
22. НЕРАВЕНСТВО РАО-КРАМЕРА 165 Задача 21.2. Произведено пять независимых измере- ний для определения заряда электрона. Получены следу- ющие значения (в кулонах): 1.594 • 10-19,1.597 • 10-19,1.596 • 10-19,1.593 • 10“19,1.590 • 10~19. Предполагая, что ошибки из- мерения распределены по нормальному закону, оценить ве- личину заряда электрона и найти для нее доверительные границы при доверительной вероятности 0.99. §22. Неравенство Рао-Крамера Меру качества оценки можно выбирать по-разному. Наи- более часто используемой мерой качества служит средне- квадратичное отклонение оценки от оцениваемого параме- тра. Чем меньше величина среднеквадратичного отклонения Е(7п(Х) — 0)2, тем оценка 7П(Х) параметра 0 лучше. При определенных условиях существует нижняя граница для ве- личины среднеквадратичного отклонения, которую улуч- шить нельзя. Вычислим эту границу. Пусть случайная величина X имеет плотность распреде- ления Д(ж),а? G (—оо,оо), которая является дифференцируе- мой по 0. Поскольку величины Xi, Х2,... ,Хп независимы, то согласно формуле (И.З) совместная плотность распределе- ния случайного вектора X — (Xi, Х2,...,Хп) имеет вид Л(£) = Л(®1)Л(*г) • • Л(®п). (22.1) Предположим, что оценка 7п(Х) является несмещенной. По определению это означает, что оо оо Е(т„(Х))= [ ••• J = —оо —оо Продифференцировав это равенство по 0, получим оо оо оо оо 1 = ^ /'*/ J •• J yn(x)^fe(x)dx = —00 —00 —00 —00 00 00 = J J 7„(f)^(ln/,(x))/,(f)d£ = E(7„(X)^ln/,(X)). -OO -00 (22.2)
166 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В силу первого свойства совместной плотности распределе- ния (§ 11) со оо fe(x)dx=l. (22.3) -оо -оо Продифференцировав по $ это равенство, получим О = J ' J = У • • • J ^(ln fe(x))fo(x)dx = —оо —оо —оо -оо = Е(^1пЛ(Х)). (22.4) Ломножая это равенство на 0 и вычитая результат из (22.2), будем иметь Е((?.(^) -*)£ In MX)) = 1. Воспользуемся четвертым свойством математического ожи- дания и неравенством Гельдера (12.2). Тогда 1 = е((7„(Я) - е)^1пМ^)) < е|(7„(х) - «) Д in Л(*)| < =? (е(7"(^) - 9)2)1/2(е(Д 1п/,(Х))2)1/2. Возведя левую и правую части этого неравенства в квадрат, получим неравенство Рао-Крамера Е(7„(Х)-9)2^, (22.5) где оо оо /„(«) = E(^ln/,(X))2= j У (^ln/,(?))2/,(£)d£. —оо -оо Величина 1п(0) называется информационным количеством Фишера относительно параметра 0, содержащимся в п на- блюдениях Xi, X?,...,Хп.
22. НЕРАВЕНСТВО РАО-КРАМЕРА 167 Согласно неравенству Рао-Крамера среднеквадратичное отклонение оценки от оцениваемого параметра не может быть меньше величины, обратной к информационному ко- личеству Фишера. Определение 1. Оценка yn(X) параметра 0, для кото- рой выполняется равенство называется эффективной оценкой. Пусть функция Л (а?) дважды непрерывно дифференциру- ема по 0. В этом случае можно получить следующее выра- жение для информационного количества Фишера Ш = -Е(^1пЛ(Х)), (22.6) которое часто является более удобным для вычислений. Оно следует из цепочки равенств Е(^ In Л(Х)) = - e(®/^£2V _ оо оо = / • • / ^Л(г)^-Е(^1п/,(^))2 = — ОО —00 оо оо а2 г Г = J • • • / mw-=-inW, —оо —оо где для получения последнего равенства использовано соот- ношение (22.3). Величина 1п(&) возрастает с ростом п. Выразим инфор- мационное количество Фишера, содержащееся в п наблюде- ниях, через информационное количество Фишера, содержа- щееся в одном наблюдении, т. е. через величину оо /1(6)=Е(^1п/,(Х1))2= У (Д1пЛ(х))2/,(х)<&. -ОО
168 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Для функции (я) дважды непрерывно дифференцируемой по 0, используя (22.1), (22.6) и свойство, что логарифм от произведения величин равен сумме логарифмов, получим W) = -Е(^г !>/’(**)) = -ЕЕ(^1пЛ№)) = fc=l fc=l = -nE(^ln/,(X,)) = n/>(«). В случае, когда функция /$(а?) не имеет второй производной по 0, аналогичное равенство получается следующим обра- зом: 7пМ=е(^Ё1пЛ(Х4))2 = е(^ ^ln/,(Xt))’ = fc=l fc=l n n к — 1 =ZE(^ln/»№))2+2E£E((^lnA№))(^ln/»w)))- k=l k=l 1=1 Величины Xkik ~ 1,2,..., n независимы и одинаково распре- делены. Воспользуемся третьим свойством математического ожидания (§12) и равенством (22.4) для п = 1. В результате получим п к — 1 1„(0) = П/.ОТ + 2 £ Е(^1п /»№))в(й|п М» = n7> fc=l 1=1 Таким образом, информационное количество Фишера, со- держащееся в п наблюдениях, равно информационному ко- личеству Фишера, содержащемуся в одном наблюдении, до- множенному на число наблюдений п. С учетом этого неравенству Рао-Крамера можно придать следующий вид: E(7n(X)-»)2>^j. (22.7) Оценка уп(Х) будет эффективной, если
22. НЕРАВЕНСТВО РАО-КРАМЕРА 169 Эффективные оценки можно построить лишь в редких слу- чаях. Чаще бывает так, что оценка лишь с ростом п при- ближается к неулучшаемой. Определение 2. Оценка (X) называется асимпто- тически эффективной оценкой параметра 0, если (22.8) Замечание 1. В § 20 мы рассматривали асимптотически нормальные оценки с дисперсией Д2. Если Д2 = то асимптотически нормальная оценка будет и асимптотически эффективной. Действительно, согласно определению асимптотической нормальности, функция распределения величины у/п1\{0){уп{Х) — 0) сходится при п —♦ оо к функции распре- деления стандартного нормального закона, который имеет дисперсию 1. Если, например, у оценки существует абсо- лютный момент порядка больше, чем два, то сходимость распределений влечет и сходимость дисперсий, т. е. D(v^M«)(7„(X) - в)) 1. (22.9) Поскольку оценка 7п(Х) предполагается несмещенной, то О(./?Л(0)(7П(Х) - 9)) = nJi(9)E(7„(X) - в)2. С учетом этого равенства соотношение (22.9) эквивалентно (22.8). Пример 1. Пусть выборка Xi,X2t. . .,ХП отвечает нор- мальному распределению с плотностью ЛЮ = у2тгст где математическое ожидание 0 является неизвестным пара- метром, а дисперсия D(Xi) = а2 известна. Тогда Z,(9) = Е(А(Ы > _ MV = Е(<М) = ±. ' ' \d0\ л/2тш 2а2 // \ Ст4 / а2
170 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Среднеквадратичное отклонение выборочного среднего Хп от среднего 0 вычислялось при доказательстве закона боль- ших чисел. Согласно (16.5) Е(ХП - 0)2 = = n nZi(0) Таким образом, выборочное среднее для выборки, отвеча- ющей нормальному распределению с известной дисперсией, является эффективной оценкой для математического ожида- ния. Это один из тех редких примеров, когда можно явно ука- зать эффективную оценку параметра. Другой пример связан с показательным распределением. Пример 2. Пусть выборка . ,ХП отвечает пока- зательному распределению с параметром 0-1,0 > 0, т. е. распределенную с плотностью /•(«) = в ’ О, при х О, при х < 0. Тогда, принимая во внимание следующие выражения для математического ожидания и дисперсии (5 14, п. 2) E(Xi) = = 0, D(Xi) = 02, получим ад=-Е(йИ1пад*))=-е(^(Ч - т))= _ _2X1 \ __1_ . 2 у/у \ 1 \62 в3 ) 62 - 02 - D(X1)' В этом примере информационное количество Фишера зави- сит от параметра 0 и не является постоянным, как это было в примере 1, однако тоже является обратно пропорциональ- ным дисперсии. Отсюда, как показано в примере 1, следует, что выборочное среднее Хп является эффективной оценкой параметра 0.
23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 171 § 23. Проверка статистических гипотез Предположим, что функция распределения случайной ве- личины X нам неизвестна, но мы располагаем случайной выборкой X = (Xi, • • •, Х„). По наблюдениям выборки X мы хотим дать ответ на вопрос: совпадает функция распре- деления F(x) с некоторой наперед заданной функцией рас- пределения Fq(x) или нет. При такой постановке задачи го- ворят, что речь идет о проверке статистической гипотезы согласия. Используя наблюдения выборки X, нужно либо принять гипотезу о том, что функция распределения F(x) совпадает с заданной функцией распределения Fo(x), либо ее отверг- нуть. Правило принятия одного из этих двух решений назы- вается статистическим критерием или просто критерием. В качестве функции Fq(x) обычно выбирается одно из из- вестных распределений, например, нормальное, равномер- ное или показательное распределение с известными параме- трами. Рассмотрим две конкретные задачи. Методы реше- ния этих задач предложены А. Н. Колмогоровым и К. Пир- соном. 1. Критерий согласия Колмогорова. Рассматривается гипотеза о том, что функция распреде- ления F(x) совпадает с непрерывной функцией распределе- ния Fq(x). Обозначим эту гипотезу символом Hq. Симво- лом Hi обозначим противоположную гипотезу о том, что F(x) / Fq(x) хотя бы при одном значении х. Проверка гипо- тезы о распределении состоит в том, чтобы по наблюдениям выборки Xi,X2,...,Xn сделать вывод, что функция распре- деления F(x) совпадает с Fq(x), т. е. справедлива гипотеза Hq, или заключить, что F(x) не совпадает с Fq(x), т. е. спра- ведлива гипотеза Hi. Поскольку наблюдения случайны, то абсолютно достоверно такие утверждения сделать нельзя. При любом естественном подходе есть положительные ве- роятности того, что мы примем гипотезу Hq, когда она на самом деле не верна, или, что мы примем гипотезу Hi, когда она не является верной. Пусть а - некоторое наперед задан- ное малое положительное число. Мы хотим указать такое правило (критерий), которое бы по наблюдениям выборки Хх,Х2>.. • ,Хп отвергало гипотезу Hq при условии, что она
172 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА на самом деле верна, с вероятностью а или близкой к а для больших п. При этом правило следует выбирать таким, что- бы вероятность принять гипотезу Hq при условии, что верна гипотеза Hi, была бы как можно меньшей. Определение 1. Вероятность а отвергнуть гипотезу Hq при условии, что она верна, называется вероятностью ошибки первого рода. Вероятность ошибки первого рода также называют уров- нем значимости критерия. Определение 2. Вероятность принять гипотезу Hq, при условии, что верна гипотеза Hi, называется вероятно- стью ошибки второго рода. Вероятность ошибки второго рода будем обозначать /?. Посольку при фиксированном объеме выборки вероятно- сти этих ошибок одновременно сделать достаточно малыми нельзя, то а задают заранее, а /? при уже выбранном а ста- раются сделать как можно меньше. Пусть Fn(x) - эмпирическая функция распределения, по- строенная по выборке X, т. е. Fn(x) = - 1(-оо,т)(^|)- Положим Dn(X) - у/п max |Fn(z) - Fo(«)|• r€(—оо.оо ) Поскольку Fn(x) при больших п является хорошей оценкой F(x) - истинной функции распределения случайной величи- ны X, то функция Dn(X) является мерой различия между истинной функцией распределения F(x) и предполагаемой Fq(x). Функция Dn(X) называется статистикой Колмогоро- ва. Согласно теореме Колмогорова (§18), если F(x) = Fq(x), т. е. при условии, что верна гипотеза Hq, справедливо P(D„P?) < z) « ОД, где /С(г) - функция распределения Колмогорова. Для функ- ции /С(г) есть таблицы и по заданному малому числу а мож- но выбрать zi-a так, чтобы X{zi-a) = 1 — a (*i-a является квантилью порядка 1 — а функции распределения /С(г)). Определим следующее правило, которое называется кри- терием согласия Колмогорова: если Dn(X) < zi-a, то при- нимаем гипотезу Hq, т. е. считаем, что F = Fq, а если
23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 173 Dn(X) то принимаем гипотезу Я1, т. е. считаем, что F / Fq. При таком правиле вероятность отвергнуть гипоте- зу Но, при условии, что она верна, есть P(Z?n(X) 21 _а), и согласно теореме Колмогорова P(Pn(X) Z1.Q) = 1 - P(Pn(X) < Z1-a) « 1 - = а. Таким образом, первое требование выполнено: вероятность ошибки первого рода для данного правила при больших п приблизительно равна а. Предположим теперь, что F / Fq, т. е. верна гипотеза Н\. Тогда в силу того, что Fn(x) —* F(x) равномерно по х G (—оо,оо) (теорема 1 § 18), имеем max |Fn(z) - F0(s)l “♦ max ч lF(«) - ^о(«)| > 0. r€(-oo,oo) п—юо г£(-оо,оо) Поэтому Dn(X) —> оо, и, следовательно, для любой констан- ты с P(Dn(X) <c)-*Q. Возьмем в качестве с величину zi-a. Тогда имеем P=P(Dn(X)<Z1_a) -> 0. п—►оо При F / Fq, величина /? равна вероятности принять гипо- тезу Hq при условии, что верна гипотеза Hi, т. е. fl - ве- роятность ошибки второго рода. При больших п ’величиям fl становится все меньше и меньше. Тем самым выполнено и второе требование о том, что величина fl должна быть как можно меньшей при выбранном а. Перейдем к изложению другого подхода, при котором по- иному ставится и решается вопрос о равенстве функций рас- пределения. Пусть нас интересует не вся функция распреде- ления, а лишь ее приращения на некоторых выделенных ин- тервалах. При этом вопрос о совпадении функции распреде- ления с наперед заданной функцией заменяется, естествен- но, на вопрос о совпадении приращений функции распреде- ления с соответствующими приращениями заранее выделен- ной функции. Заметим, что для дискретных распределений в качестве выделенных интервалов можно взять интервалы по- стоянства функции распределения. Тогда приращения функ- ции распределения на них полностью характеризуют закон
174 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА распределения. В этом случае задача становится аналогич- ной предыдущей, однако метод решения будет принципиаль- но отличным. 2. Критерий согласия Пирсона(хи-квадрат критерий). Предположим, что вещественная прямая разбита на г не- пересекающихся интервалов Д/,/ = 1,2,...,г, т. е. |J/=i = = (—оо,оо), Д,- П Ду = 0. Нас интересует не вся функция распределения F(x) случайной величины X, а только набор вероятностей р/ = Р(Х G Д/), I = 1,2,...,г. Задача состо- ит в следующем. Пусть задан на-бор вероятностей р®,/ = 1,2,...,г, таких, что У^[=1р° = 1. Обычно р° = Р(Х° G Д|), где Х° - случайная величина с каким-нибудь известным рас- пределением. Мы хотим знать, совпадают ли вероятности р/, отвечающие наблюдениям выборки Xi,Хэ, • • •>Хп, с вероят- ностями р® или нет. Обозначим символом Hq гипотезу о том, что pi = р° при всех I = 1,2,...,г. Символом Hi обозначим противоположную гипотезу о том, что pi / р° хотя бы для одного I. Пусть Х1,Хз,...,Хп - выборка, отвечающая случайной величине X. Определим правило, по которому мы будем принимать или отвергать гипотезу Hq. Обозначим через ц = = 52”-! Iaf(Xy) число тех наблюдений Ху, которые принад- лежат интервалу Д/. Поскольку Е(1д,(Ху)) = Р(Ху € Д/) = = pi, то по закону больших чисел — —* pi по вероятности. п Поэтому является хорошей оценкой для р/. Положим 1=1 ‘ 1=1 1 Функцию ДП(Х) называют статистикой Пирсона или ста- тистикой х2 (хи-квадрат) с г — 1 степенью свободы. То, что мера различия между истинными вероятностями pi и предполагаемыми р° имеет именно такой вид, продик- товано желанием иметь хорошее предельное распределение для величины ДП(Х). Справедлив следующий результат, ко- торый приводится без доказательства.
23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 175 Теорема (Пирсона). Пусть pi = р° при всех I = 1,2,..., г, т. е. выполнена гипотеза Hq. Тогда справедливо следующее со- отношение sup |Р(Дп(Х)<х)-Рг_1(х)Н0 z£(0,oo) при п —> оо, где Pr-i(z) - так называемое распределение Пирсона с г— 1 степенью свободы. Для любого целого неотри- цательного k распределение Pk(x) определяется плотностью П(Х) = / ?T4W‘'2)/2e’*/2’ х > °- ( 0, при х < О, оо где Г(/) = f x*~*e~xdx - гамма-функция, о При целых п для гамма-функции выполняются равенства Г(п + 1) = п», Г(п + |) = 1 ♦ 3 • 5 • • • (2п - 3)(2п - 1)7*2-”. Для распределения Пирсона существуют таблицы. По за- данному значению а можно определить такое число z\_a (квантиль порядка 1 — а), что Pr_i(zx_a) = 1 — а. Определим следующее правило, которое называется кри- терием согласия Пирсона или критерием хи-квадрат: если ДП(Х) < zi-а, то принимаем гипотезу Hq, т. е. счи- таем, что pi = pi для всех I = 1,2,. . .,г, если ДП(Х) zi-a, то принимаем гипотезу Hi, т. е. считаем, что pi / pf при не- котором I. При таком правиле вероятность отвергнуть гипо- тезу Hq при условии, что она верна, равна Р(ДП(Х) zi-a), и согласно теореме Пирсона Р(Дп(Х) > Х1_„) = 1 - Р(Д„(Х) < ХХ_а) « 1 - Pr_l(z!_a) = О. Таким образом, вероятность ошибки первого рода прибли- зительно равна а. Предположим теперь, что pi / р° для какого-нибудь I, т. е. предположим, что верна гипотеза Hi. Тогда, поскольку в силу закона больших чисел — —+ pi, име- п ем
176 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА и, следовательно, n «<>\2 ' п 00. Тем самым, при выполнении гипотезы Hi имеет место соот- ношение ДП(Х) -+ оо. Поэтому Р(ДП(Х) < zi-a) -+ 0 при п —юо. Положим /3 — Р(ДП(Х) < zi-<x) - вероятность принять гипо- тезу Но при условии, что верна гипотеза Hi. Тогда с ростом п вероятность /? стремится к нулю. В результате оба требо- вания, предъявляемые к критериям согласия, выполнены. Задача 1. Через равные промежутки времени в препара- те регистрируется число микробов, попавших в поле зрения микроскопа. В результате наблюдений получены следующие данные: I О 1 2 3 4 5 6 7 112 168 130 68 32 5 1 1 В первой строке приведено число микробов, а во второй строке - число моментов времени, соответствующих наблю- дению ровно I микробов. Проверить, используя критерий хи-квадрат, что с веро- ятностью ошибки первого рода а = 0.05 число микробов, попадающих в поле зрения микроскопа в любой момент ре- гистрации, распределено по закону Пуассона с математиче- ским ожиданием А = 1.5. Решение. Пусть Xj - неотрицательная случайная вели- чина, равная числу микробов, регистрируемых за j-й про- межуток времени. Считаем величины Xj,j = 1,2,...,п, неза- висимыми и одинаково распределенными. Общий объем вы- борки равен п = Х2ыо ~ 517. Можно считать, что неотри- цательная полуось разбита на 8 интервалов Д/ = [Z, Z 4-1), I = 517 = 0,1,...,6 и Дт = [7,оо). Тогда vi — ~ число j=i моментов времени, когда регистрируется ровно I микробов.
23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 177 Значения р/ приведены в условии задачи. Пусть X9 - слу- чайная величина, распределенная по закону Пуассона с па- раметром Л = 1.5: ие-а Р(Х° =/) = “—, / = 0,1,2......... Используя эту формулу, найдем теоретические вероятности попадания числа микробов в поле зрения микроскопас pg = Р(Х° = 0) « 0.2231; р? = Р(Х° = 1) « 0.3347; р92 = Р(Х° = 2) « 0.2510; р93 = Р(Х° = 3) « 0.1255; р| = Р(Х° =4) «0.0471; р° = Р(Х°= 5) «0.0141; pg = Р(Х° = 6) « 0.0035; р°7 = Р(Х° 7) « 0.0010. Вероятность р° является вероятностью того, что наблюда- ется не менее семи микробов, так как теоретически в поле зрения микроскопа за выбранный промежуток времени мо- жет наблюдаться любое их количество. Значение Дп стати- стики Пирсона вычисляем по формуле д» = Е /=0 (pt - пр°)2 пр(° «4.3. По таблицам для квантилей распределения Пирсона Pr_i(z) с г = 8 найдем критическое значение zi-a при а — 0.05. Име- ем zq 95 « 14.07. Так как Дп < zi-a, то мы принимаем гипо- тезу о том, что число микробов, попадающих в поле зрения микроскопа, распределено по закону Пуассона с математи- ческим ожиданием А = 1.54. Задачи Задача 23.1. В городе 17036 семей имеют двоих детей. В 4529 семьях - два мальчика, в 4019 - две девочки, в 8488 се- мьях - мальчик и девочка. Можно ли с уровнем значимости 0.05 считать, что количество мальчиков в семьях с двумя детьми имеет биномиальное распределение с вероятностью рождения мальчика 0.515? Задача 23.2. Датчик случайных чисел выдает независи- мые значения случайной величины, которая должна иметь
178 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА равномерное распределение на [0,1]. Получены следующие 20 значений: 0.100, 0.253, 0.520, 0.863, 0.354, 0.809, 0.911, 0.292, 0.453, 0.204, 0.648, 0.429, 0.805, 0.372, 0.610, 0.008, 0.166, 0.422, 0.531, 0.509. С помощью критерия Колмого- рова с уровнем значимости 0.1 проверить гипотезу о том, что датчик действительно генерирует значения случайной величины с равномерным распределением на [0,1]. Задача 23.3. Результаты подсчета частот появления цифр 0,1,... ,9 в 10002 знаках десятичной записи числа тг —-3 приведены в таблице: 0 1 2 3 4 5 6 7 8 9 968 1026 1021 974 1014 1046 1021 970 948 1014 С помощью критерия Пирсона с вероятностью ошибки первого рода 0.2 проверить гипотезу о равновероятности появления в данной записи каждой из цифр 0,1,..., 9. § 24. Оценка параметров общей линейной модели (метод наименьших квадратов) Рассматривается следующая линейная модель. Имеется вектор неизвестных параметров, который нужно определить. Однако наблюдаеся не сам вектор параметров, а другой век- тор, который получается из искомого вектора применением линейного преобразования. Кроме того, наблюдения (изме- рения) осуществляются с некоторыми случайными ошибка- ми. Предполагается, что эти ошибки не являются система- тическими, т. е. среднее этих ошибок равно нулю. Математически эта модель описывается следующим обра- зом. Обозначим 0 = (01, #2,-..,0m) ~ вектор неизвестных па- раметров, подлежащих оценке. Пусть А = ма“ трица известных коэффициентов, а £1,^2, • • . ,£п — случайные величины с математическими ожиданиями Е(£,) = 0, с дис- персиями D(&) = ffj < оо и с ковариациями E(&£j) = 0 при i j. Наблюдаются величины Xf. т > = 1,2,(24.1) i=i
24. ОЦЕНКА ПАРАМЕТРОВ ОБЩЕЙ ЛИНЕЙНОЙ МОДЕЛИ 179 Если бы случайных ошибок измерения не было, то значения параметров 0, по известным и X,- определялись бы как решение системы п алгебраических линейных уравнений. В случае, когда есть случайные ошибки предлагается по- ступать следующим образом. Поскольку мы не знаем истин- ных значений параметров, выберем какие-нибудь значения параметров 01,02, • • • ,0п и рассмотрим сумму квадратичных отклонений п т 2 »=1 j=l Определим, при каких значениях 0j математическое ожи- дание Я(0х,02, • • •) От) будет минимальным. Имеем п т 2 ВДМз. • •, 9m)) = 52 Е(Х< - £ Ml) = п т 2 = ЕЕ(ЕМ9>-9П + ^) = 1=1 1=1 пт 2 т = + -^)Е(А) + Е(£?)} = »=i j=i i=i пт 9 п т 9 п = E{(E“v№ -91)) +-^ = Е(Е“‘>(91 -91))2 + 5Х i=l j = l 1=1 J=1 t=l Мы видим, что ©то математическое ожидание будет мини- мальным при У? 7-1 (У7^7-1 Oji(0j — 0j)) = 0, в частности, при 0j = 0j, т. е. при истинных значениях параметров. Поэто- му в качестве оценки для неизвестных параметров Oj разум- но взять такие значения параметров 0j, при которых функ- ция R(0i ,02, • • • ,0m) принимает минимальное значение. Такая оценка называется оценкой по методу наименьших ква- дратов. Функция Я(01,02, • • • 10т) ~ функция многих перемен- ных и минимума она достигает в той точке, в которой все частные производные этой функции по каждой из перемен- ных равны нулю. Частные производные имеют вид -R(011 02> • • ’ 1 0m) — 2 ^Xj — ®»7^7^( aik), к = 1, . .. , ТП. к i=l 7=1
180 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Найдем такие значения 01,02, ••• ,0m, которые обращают эти производные в ноль. Отсюда получим систему т линейных уравнений относительно неизвестных 01,02,..., 0т: = La-‘Xi' t=1-2......m- <24-2) j=l t=l i=l Матрица этой системы состоит из коэффициентов = п _» = 52 aijaiki а вектор свободных коэффициентов У состоит «=1 из компонент У*. = 5Х=1°»*^»* Если определитель матри- цы В = {6jfc}^nfc=i отличен от нуля, то эта система име- ет единственное решение 01,02, • • • ,0m- Решение это можно найти либо методом Гаусса, либо методом определителей, либо вычисляя обратную матрицу к В. Исходная линейная модель (24.1) и система уравнений (24.2) могут быть запи- саны в краткой форме с использованием матриц и векторов. Обозначим ап ai2 ... aim «21 «22 . . • «2т «п1 «п2 • • • «пт 0 = Тогда (24.1) переписывается в виде X = Л0 + £ Далее, полагая 612 622 6щ2
24. ОЦЕНКА ПАРАМЕТРОВ ОБЩЕЙ ЛИНЕЙНОЙ МОДЕЛИ 181 < Оц 021 • • • ОП1 \ т 012 022 ••• Оп2 I А = ; . I , ' Olrn 02m • • • Onm / где матрица Ат является транспонированной (отраженной) по отношению к матрице А, систему уравнений (24.2) пред- ставим в виде Вд = АТХ. Решение этой системы можно записать так: 0 = В-1АТХ, где В-1 - матрица, обратная к В. Таким образом, искомая оценка 0, которая является оценкой для вектора неизвест- ных параметров 0, равна произведению матрицы В-1 на век- тор АГХ. В силу определения коэффициентов bjk матрица В представима в виде произведения В = АТА, что позволя- ет выразить оценку 0, построенную по методу наименьших квадратов, в терминах исходной матрицы коэффициентов А и вектора наблюдений X: 6 = 0(X1,X2,.. .,Х„) = (АТА)-1АТ%. (24.3) Пример 1. Пусть есть полином р(у) = 9mym-1 +em-ivm-2+-+ степени тп — 1 с неизвестными коэффициентами. Предполо- жим, что у нас есть результаты измерений значений этого полинома в различных точках У1,У2,.. -,Уп- Но измерения в каждой точке yi производятся со случайной ошибкой т. е. мы в качестве измерений имеем лишь значения величин X,-, Xi = P(yi) + £i, i = l,2,...,n. (24.4) Как определить коэффициенты 0j? Оказывается, можно при- менить метод наименьших квадратов. Положим а,-; = у?-1, тогда m m J=1 J=1
182 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА и равенства (24.4) переходят в равенства (24.1). Но для та- кой линейной модели мы уже умеем строить оценку параме- тров 0i, 02, • • • , > и эта оценка определяется по коэффициен- там aij системой уравнений (24.2), которая в данном случае имеет вид m п п j=l »=1 i=l Решение этой системы не обязательно выписывыть форму- лой (24.3). Его можно получать различными известными ме- тодами. Задача 1. Затраты у на развитие производства и X ъетл- чина годовой прибыли фирмы в течение 5 лет представлены в условных единицах следующей таблицей у б 3 7 5 10 X 33 27 32 28 42 На величину прибыли влияют случайные факторы. Пред- полагается, что всегда имеет место линейная зависимость между затратами у и прибылью X вида Х = 02У + 01+£ (24.5) с неизменными параметрами 01, 02 и величиной случайного влияния £ со средним ноль и конечной дисперсией. Каждый год случайное влияние некоррелировано с предыдущими го- дами. Оценить параметры 0\ и 02. Решение. Зависимость (24.5), представленная по годам г = 1,2,3,4,5, имеет вид Xf = 02yi + 0i + £»• (24.6) Таким образом, она описывается моделью типа (24.1). Оце- ним параметры 01 и 02 по методу наименьших квадратов. Имеем п = 5, т = 2, ац = 1, ац = у{. Система уравнений (24.2) в этом случае следующая п01 + Е = 52 к = 1, п ,=1 n <=1 п (24.7) Е у& + Е = Е иХ-, к = 2. «=1 «=1 1=1
24. ОЦЕНКА ПАРАМЕТРОВ ОБЩЕЙ ЛИНЕЙНОЙ МОДЕЛИ 183 Вычисляя значение 02 методом определителей, получим п £ yiXi - 53 yiH Xi д «=1 «=1 »=1 ^2 =--------п--------п—:— «=1 «=1 уХ п - УпХп У2 п - Уп (24.8) где у2п =п^=1У1/п> УХп - E”=iZ/i^»7n> Уп = Е"=1У«7П» Хп = Y^=ixi/n- Теперь из первого уравнения системы (24.6) находим «1 = Xn - hy„ = (24.9) У п Уп Для имеющихся данных 0\ « 18.843, 02 ~ 2.187. Зависимость (24.6) является частным случаем следую- щей зависимости, в которой величины yi могут быть слу- чайными: X; =Mi+0i+£ » = 1,2,...,п. (24.10) Предполагается, что У7, i = 1,2,... ,п, являются одинако- во распределенными независимыми случайными величина- ми, независящими от величин которые интерпретиру- ются как ошибки измерения. В свою очередь величины £i, г = 1,2,..., п, тоже являются независимыми со средним ноль (E(£t) = 0) и конечной дисперсией (E(£f) < 00). По наблюде- ниям значений пар случайных величин Х,-,У, < = 1,2, ...,п, нужно определить параметры 01,#з* Такая модель называет- ся простой линейной регрессией. По тем же соображениям, которые приведены для вывода оценки наименьших квадратов, в качестве оценок 01, и 02 для параметров 0), и О2 естественно взять те значения, которые минимизируют функцию квадратичного отклонения п 2 1=1 Приравнивая к нулю частные производные этой функции по 01, и 02> получим систему уравнений (24.7) с величинами У,
184 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА вместо гц. Решения системы уравнений будут аналогичны (24.8), (24.9): п п п п Е у,х, - е у, £ х, i=i_________>=1 i=i n£v-(£y«)2 i=i •=! С„(Х,У) (24.11) п п Л = 1^Х<-^1^У< = ХВ-«2Г„. (24.12) 1=1 i=l Соответствие х — 02у + 0i, у G (—оо, оо), называется уравне- нием линейной регресии. Не удивительно, что для пара- метров 0i, и 02 получились именно такие оценки. Вычислим ковариацию величин X и У, связанных линейной зависимо- стью X = 02У+01+&- Поскольку величины £ и У независимы и Е(£) = 0 то Е(Х) = 02Е(У) + 01, cov(X, У) = Е((02У + £ - 02Е(У))(У - Е(У))) = = 02Е(У - Е(У))2 + Е(£)Е(У - Е(У)) = 02D(Y). Отсюда следует, что 02 = > 01 — Е(Х) - 02Е(У). Те- перь, если в этих выражениях вместо ковариации, дисперсии и математических ожиданий взять их выборочные характе- ристики из §19 (формулы (19.7), (19.3)), то для 0i, и 02 получим оценки (24.11) и (24.12). Задачи Задача 24.1. В книге “Основы химии” Д. И. Менделее- ва приводятся данные о растворимости азотнокислого на- трия NaNOz в зависимости от температуры воды. В 100 частях воды растворяется следующее число условных ча- стей NaNOz при соответствующих температурах: у 0 4 10 15 21 29 36 51 68 X 66.7 71.0 76.3 80.6 85.7 92.9 99.4 113.6 125.1 Через у и X обозначены соответственно температура рас- твора и количество NaNOz^ На количество растворившего- ся NaNOz влияют случайные факторы. Предполагается, что имеет место линейная зависимость между температурой у и
25. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 185 количеством растворившегося NaNOs вида X — 02J/ + 0i +£ с неизменными параметрами 01, 02 и величиной случайного влияния 8 со средним ноль и конечной дисперсией. Оценить параметры 0\ и 02 с помощью метода наименьших квадратов. Задача 24.2. Данные опыта приведены в таблице: у 0 2 4 6 8 10 X 5 -1 0.5 1.5 4.5 8.5 Полагая, что у и X связаны зависимостью X — 0зу2 + 02У 4- 01 + £, где величина случайного влияния £ имеет среднее ноль и конечную дисперсию, найти коэффициенты 0\, 02 и 0д методом наименьших квадратов. § 25. Метод максимального правдоподобия Пусть X = (Xi, Х2,.. .,Хп) - случайная выборка, отвеча- ющая случайной величине X с плотностью распределения /(ж,0), где 0 - неизвестный параметр. Предполагается, что вид плотности известен, а параметр 0 неизвестен. Например, /(ж,0) может быть плотностью нормального распределения с математическим ожиданием 0 и дисперсией 1, т. е. V М Задача состоит в том, чтобы зная вид плотности, оценить неизвестный параметр 0 по наблюдениям Xi,X2}.. .,ХП. Определение 1. Функцией правдоподобия для слу- чайных наблюдений Х^Х^... tXn с плотностью распреде- ления /(ж,0) называется функция Цх\, ж2,... ухпу0) = = /(xt,0)f(x2,e)...f(x„,ff). Оценкой параметра 0, построенной методом максималь- ного правдоподобия по наблюдениям Xi,X2,...,ХП) назы- вается оценка 0п(Х), определяемая равенством £(Xi,X2,...,Xn,0n(X)) = max£(Xi,X2,...,X„,0). (25.1) 9 Иными словами эта оценка определяется следующим образом. В качестве первых п координат функции правдо- подобия нужно взять случайные наблюдения Xi, Х2,..., Хп,
186 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА затем рассмотреть функцию L(Xi, Х2,..., Х„,0) как функцию одной переменной 0 и определить такое значение переменной 0 = 0п, при котором эта функция принимает максимальное значение. Ясно, что величина переменной 0п будет зависеть еще и от X. Формально все это задано равенством (25.1). Почему именно так выбирается оценка 0п? Дело в том, что в силу независимости наблюдений Xi, Х2, .., Хп их совмест- ная плотность равна произведению плотностей величин X/, которые имеют одинаковый вид и равны /(ж/, 0). Таким обра- зом, функция L(x, 0) и есть совместная плотность распреде- ления случайной выборки X. Для тех значений ж, для кото- рых плотность £(ж, 0) больше, вероятность появления значе- ний выборки X в малой окрестности х в ходе эксперимента тоже больше. Поэтому, если мы уже наблюдаем какие-то значения величин Xi,X2,...,Хп, то естественно предполо- жить, что и значение плотности в этих точках, т. е. значе- ние L(Xi,X2...Хп,0), должно быть велико. Поэтому мы и выбираем оценку 0П(Х) для истинного значения параметра 0 так, чтобы L(Xi)X2,..., Хп,0п(Х)) было наибольшим воз- можным значением. Если функция дифференцируема и до- стигает максимального значения в какой-нибудь точке, то производная в этой точке должна быть равна нулю. Таким образом, для нахождения оценки 0п(Х) имеем уравнение ^£(Х,«) = 0. (25.2) Считаем, что совместная плотность L нигде не обращается в нуль, тогда уравнение (25.2) можно записать у—Ь = 0. Пользуясь формулой для производной логарифма, перепи- шем его следующим образом: ~1п£(Х,0) = 0. Учитывая определение £(Х,0) и свойство логарифма 1п(а&) = 1па-Ь1п&, окончательно получим ^£1п/(Х,,») = 0. (25.3) 1=1 Это уравнение, в котором неизвестным является параметр 0, называется уравнением максимального правдоподобия.
25. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 187 Если у него существует единственное решение 0П(Х), то оно называется оценкой максимального правдоподобия для параметра 0. Замечание 1. Метод максимального правдоподобия мож- но применять, когда 0 = (01, - - .,0т) ~ многомерный пара- метр. Функция максимального правдоподобия будет дости- гать максимума в той точке 0, в которой все частные про- изводные по 0*, к = 1,2, ...,т, равны нулю. Поэтому для нахождения оценки 0п(Х) = (0^(Х), 0™(Х),..., ^т)(Х)) вме- сто (25.2) имеем систему уравнений Свойства оценки максимального правдоподобия. 1) Оценка максимального правдоподобия 0п(Х) является состоятельной оценкой параметра 0, т. е. 0п(Х) —♦ 0 по ве- роятности при п —* оо. 2) Оценка 0п(Х) является асимптотически нормальной оценкой параметра 0 с дисперсией Д2 = Zf1^), где со А(«)= J (^ln/(M))2 f(x,9)dx, —ОО - информационное количество Фишера относительно пара- метра 0, содержащееся в одном наблюдении. В силу замеча- ния 1 §22 оценка 0п(Х) будет асимптотически эффективной оценкой параметра 0. Свойства 1) и 2) справедливы при определенных услови- ях на плотность распределения f(x,0). Доказательство этих свойств выходит за рамки элементарного курса математи- ческой статистики. Пример 1. Пусть выборка Х1,Хг, • • • ,Хп отвечает плот- ности. распределения f(x,0) = -Д=ехр(— —). Найдем у2тг \ 2 / оценку для параметра 0 методом максимального правдопо- добия. Уравнение (25.3) в этом случае имеет вид де 2 1=1 +>"Ш) = о-
188 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Дифференцируя под знаком суммы, получим Ё(х<-*)=о. 1=1 л —► 1 П Решением этого уравнения является 0п(Х) = -£1=1 Xi- Та- ким образом, оценка максимального правдоподобия для 0, когда - f(x,0) плотность нормального распределения, есть выборочное среднее. Это естественно, поскольку 0 является математическим ожиданием для нормального закона. Пример 2. Пусть выборка Xi, Хг, ..., Хп отвечает пока- зательному распределению с параметром 0-1,0 > О, с плот- ностью /(х,0) = ( при О о, ( 0, при х < 0. Найдем оценку для параметра 0 методом максимального правдоподобия. Уравнение (25.3) в этом случае преобра- зуется к виду п /=1 Откуда находим решение 0п(Х) = -^2”=i которое как и в предыдущем примере есть выборочное среднее. Замечание 2. Метод максимального правдоподобия в полной мере применим и для случая, когда X = (Xi,..., Хп) - случайная выборка, отвечающая случайной величине X, принимающей дискретные значения x^k = 1,2,..., с ве- роятностями р(х*»0) = P(Xi = Xk\ Предполагается, что вид функции известен, а параметр 0 неизвестен. Функ- ция правдоподобия для дискретной величины имеет вид L(xi,«2, •. .,«n,0) = p(xi,0)p(a?2,0).. .р(жп,0). Как и в случае с плотностью, оценка, построенная методом максимально- го правдоподобия, определяется равенством (25.1). Это ра- венство, если функция р(х, 0) дифференцируема по 0, влечет уравнение максимального правдоподобия п А^1пр(Х,,9) = 0. (25.4) 1=1
25. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 189 Если существует единственное решение 0п(Х), то оно назы- вается оценкой максимального правдоподобия для пара- метра 0. Пример 3. Пусть выборка Xi,X2,.. .tXn отвечает рас- пределению Пуассона с параметром 0, т. е. р(т, 0) = P(Xi = т) = т = 0,1,2,... . Найдем оценку для параметра 0 методом максимального правдоподобия. Уравнение (25.4) в этом случае превраща- ется в следующее п £ 52 (-» + X, 1п0 - 1п(Х,!)) = 0. 1=1 После дифференцирования получим п -» + |У> = 0. 1=1 Отсюда для параметра 0 находим оценку максимального правдоподобия 0п(Х) = Xi, которая как и в преды- дущем примере есть выборочное среднее. Пример 4. Пусть выборка Xi,X2, •.. >Хп отвечает рав- номерному распределению, сосредоточенному на интервале единичной длины с неизвестным центром 0, т. е. распреде- лению с плотностью f(x,0) = Ip-p+jjCz), где 1л(®) “ индикатор множества Л, определенный в п.1 § 12. Равенство (25.1) принимает вид ПЧчЛч/Х') = т^П1(М.М1(*')- (25.5) 1=1 1=1 Хотя плотность /(ж, 0) не дифференцируема для всех 0, оцен- ку 0п, удовлетворяющую (25.5) найти можно. Ясно, что мак- симальное значение правой части в (25.5) равно единице, и
190 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА это происходит тогда, когда интервал [0 — |,0 + содержит все значения Xi, Х2,..., Хп. Пусть Хщ Х(2) Х(п) - вариационный ряд. Интервал [0 — |,0 + |] будет содержать все значения Хь, к = 1,2,... ,п, если 0— X(i) и Х(п) 0+^. Таких значений 0 целый интервал |Х(П) — и любое из них может служить оценкой максимального правдоподо- бия. В качестве одного из возможных возьмем 0П = = -(Х(п) + Оно лежит внутри интервала, посколь- ку равномерное распределение сосредоточено на интервале единичной длины, что влечет X(n) — X(i> 1, и - 1 = хт + 1(х<п) -хт) -1 хт, ft. +1 = *(») +1" !(%(„) - Х(1)) > х(„). Следовательно, 0П удовлетворяет (25.5) и ее можно считать оценкой, построенной методом максимального правдоподо- бия. Задачи Задача 25.1. Страховая компания за год произвела п вы- плат по портфелю однотипных договоров страхования, раз- мер выплат по которым имеет распределение с плотностью /(ж) = 0е-в®, х > 0. Найти оценку максимального правдопо- добия для 0. Задача 25.2. На заводе производят шарики для шари- коподшипников. Из продукции, произведенной за час, вы- брали 20 шариков. Измерение их диаметров дало следую- щие результаты: 5.05, 5.01, 5.25, 4.97, 4.99, 5.03, 4.97, 5.13, 5.02, 4.90, 5.01, 4.75, 4.95, 4.98, 5.05, 5.02, 4.88, 5.00, 5.04, 4.96 мм. При предположении, что диаметр имеет нормаль- ное распределение с неизвестным средним и дисперсией, по- строить оценку максимального правдоподобия для этих па- раметров. Задача 25.3. Пусть Х1,Хг,...,Хп независимы и равно- мерно распределены на интервале 0,0+1. Показать, что лю- бая точка интервала [maxi^nXi — 1, mini^,^n Х<] является оценкой максимального правдоподобия для параметра 0.
26. ПРОЦЕДУРА РЕКУРРЕНТНОГО ОЦЕНИВАНИЯ 191 § 26. Процедура рекуррентного оценивания Пусть как в предыдущем параграфе по случайной выбор- ке X = (Х1,Хг,..-,ХП), отвечающей случайной величине X с известным видом плотности распределения f(x,0), нужно оценить неизвестный параметр 0. В большинстве случаев точное решение уравнения макси- мального правдоподобия £^1п/(Х,,(») = 0 (26.1) 1=1 найти не удается. Поэтому для него ищут различные при- ближенные выражения. Опишем один интересный подход к решению этой проблемы. Рассмотрим решения уравнения (26.1) при п и при n-Ь 1, т. е. рассмотрим 0п и 0n+i, удовлетворяющие равенствам п п+1 Т £ 1пЛХ,Л) = 0, £ In/(X,.en+1) = 0. 1=1 1=1 Вычитая из правого равенства левое, получим /(%„+!, #„)+ п + 1 + ^W(XiA)) = 0. (26.2) 1=1 Поскольку оценка максимального правдоподобия является состоятельной оценкой параметра 0, т. е. 0П —при п —+ оо, то разность 0n_f.i — 0п стремится к нулю. Предположим, что у функции /(ж, 0) существует непрерывная вторая произ- водная по параметру 0. Тогда функция д(0) — ^1п(я,0) при любом фиксированном х обладает непрерывной произ- водной по 0, и, в силу определения производной, прира- щение этой функции можно выразить следующим образом tf(0n+i)-0(0n) « /(0n)(0n+i -0п)- Используя это, преобразу- ем (26.2) к виду п + 1 2 ^1п/(х„+1 А) + £ ^jin/(x, ,«„)(«„+! - ёл)*о, 1=1
192 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ИЛИ »„+!-»„ « ~„+1 д2-1------Д 1п/(Х„+1Л). (26.3) Величины X/, / = 1,2,...,п + 1, независимы и одинаково рас- пределены. Для любого фиксированного 0 по закону боль- ших чисел (§ 16) rh L ln «) «Е( JL In /(X,,«)) = -Л(9), (26.4) 1=1 где /1(0) - информационное количество Фишера. Равенство в правой части следует из (22.6). При некоторых дополнительных условиях можно дока- зать, что соотношение (26.4) выполняется равномерно по всем 0, достаточно близким к заданному значению, посколь- Э2 ку функция —/(ж,0) непрерывна по 0. С учетом этого, со- отношение (26.3) эквивалентно следующему Замена приближенного равенства в этом соотношении на строгое приводит к следующей процедуре рекуррентного оценивания неизвестного параметра 0: «»+1 =’» + 1п Л*»*1' 9* = с' (26-5) где с - произвольная постоянная. Эта процедура замечательна тем, что приближенное зна- чение для параметра 0 на п + 1 шаге выражается только через приближенное значение на n-м шаге и через наблю- дение Xn+i. Это и означает, что оценивание рекуррентное. При определенных условиях можно доказать, что оценка 0П ничем не хуже оценки максимального правдоподобия 0П, по- скольку она обладает теми же свойствами 1) и 2). Следова- тельно, она является асимптотически эффективной оценкой параметра 0.
26. ПРОЦЕДУРА РЕКУРРЕНТНОГО ОЦЕНИВАНИЯ 193 Пример 1. Пусть как и в примере 1 § 25 /(«•*) = Тогда |^f(*,0)//(«,0) — х —9. Из примера 1 §22 следует, что 11(0) — 1. Следовательно, процедура (26.5) для этого случая имеет вид Оп+1 = 9п + ^т(%п+1 ” 0Q = с- (26.6) Из этой процедуры легко вычислить явное выражение для 01=с + 1(Х1-с) = Х1, п П * *=1 Следовательно, в случае нормальной плотности распределе- ния рекуррентная оценка математического ожидания совпа- дает с оценкой максимального правдоподобия и совпадает с выборочным средним. Это и не удивительно, поскольку для этой плотности все вышеприведенные приближенные равен- ства превращаются в строгие равенства. Пример 2. Пусть выборка Х1,Хз, ...,ХП отвечает пока- зательному распределению с параметром 9~\9 > 0, т. е. распределенную с плотностью Л(®) = ie-/’, О, при х О, при х < 0. Тогда Л/(®,0)//(«)0) = Из примера 2 § 22 следует, 0v v что Ii(ff) — 1/02. Процедура (26.5) в этом случае имеет вид V» + 4qT Уп vn 00 = с, т. е. снова имеет вид (26.6), и снова 9п = 9п — Хп.
194 Ответы и решения к задачам Теория вероятностей 1.1. 5-4 = 20. 1.2. Cl - 2 = 26. 1.3. = 20. 1.4. 65 = 7776. 1.5. (п!)2. 1.6. Числа 1, 2, 3 можно разместить так, чтобы они сто- яли рядом п — 2 способами. Упорядочить остальные п — 3 мест можно (п — 3)! способами. Ответ (п —2)(п —3)! = (п —2)!. 1.7. 2 + 22 + 23 + 24 4-25 = 62. 1.8. З23 • 104 = 327680000. 1.9. Приведем два решения этой задачи. Число людей, у которых есть к белых зубов равно Сз2, поскольку поря- док зубов не имеет значения. Следовательно, всего людей с учетом свойства 1) для биномиальных коэффициентов будет £ С22 = 232 = 1024 • 1024 • 1024 • 4 = 4294967296. к=0 Другое решение. Сопоставим наличию белого зуба на той или иной позиции среди 32 возможных цифру 1, черному - цифру 0. Тогда возникает полное соответствие между зуба- ми и 32 разрядными двоичными числами. Следовательно, число людей будет совпадать с числом 32 разрядных дво- ичных чисел. Их очевидно равно 232. 1.10. Из слова КОЛОКОЛ машинные слова можно соста- влять следующим образом. Сначала, например, на 7 сво- бодных для букв позиций можно разместить буквы О. Та- ких возможностей С3, так как буквы О не различаются. На оставшиеся 4 позиции можно разместить 2 буквы К С% способами. Буквы Л займут два последних места. Таким образом, всего можно составить С3С2 = = 5-6-7 = 210 машинных слов. Из слова ВОДОРОД можно составить C^CfC2 = 7^7 = 2 • 5 • 6 • 7 = 420 машинных слов. 1.11. Места можно пронумеровать от 1 до 14. Можно на нечетные места посадить женщин, а на четные мужчин, и на- оборот. Женщин можно разместить 7! способами, и стольки-
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 195 ми же способами можно разместить мужчин. Всего способов 2(7!)2. 1.12. Конфеты расположим в ряд. Между конфетами бу- дет 8 промежутков, в которые Cg способами можно поме- стить 4 разделительных перегородки по одной в каждый промежуток. Эти перегородки разделяют все конфеты на 5 групп, которые соответствуют 5 различным пакетам. Следо- 4 8! вательно, на первый вопрос ответ следующий Cg = — = 70. В случае, когда пакеты могут быть пустыми, конфеты и перегородки могут располагаться в ряд в любом порядке, в частности несколько перегородок могут следовать друг за другом. Всего таких возможностей С^з, поскольку среди 9 + 4 = 13 позиций 4 можно выбрать для перегородок. Ответ 13’ на второй вопрос следующий С*3 = — = 715. 2.1. А — В = АВ ={число оканчивается цифрой 5}. 2.2. А ={ни одного бракованного изделия}, В ={либо од- но бракованное изделие, либо бракованных нет}. 2.3. а) А = 0, В = О; б) никогда; в) А = В. 2.4. Нет. 2.5. АВ ={на одной кости выпала 1, а на другой - 4}, АВ ={на одной кости выпала 2, а на другой - 3}. 2.6. а) 2.7. АВС ={оба спортсмена прыгнули дальше 7 метров, причем мужчина прыгнул дальше женщины}, А — АВ = {мужчина прыгнул дальше 7 метров, но не дальше женщи- ны}, АВС ={оба спортсмена прыгнули дальше 7 метров, но мужчина прыгнул не дальше женщины}. 2.8. а) АВ C-j_6)_АВС;_в) АВС± г) А + В + С; д) АВ + АС+ ВС\ е) АВС + АВС + АВС\ ж) АВС + АВС + АВС\ з) АВС\ и) АВС. 3.1. Р = 3.2. Р = 3.3. Р = 3.4. Р = ^20 ~ “ 19’ А5 = 0.3024. 105 С3 2 Ц35 “ 91 • ^18 _ _2_ С2% 38 •
196 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 3 5 Р — ~ — 3*5,Р~С-1оОо “IO’ 3.6. Р=1--^- = 1- — = —. Cf2 33 33 3.7. Р({1,1} + {1,2} + {2,1})= 1 = 1 . 8 р _ С1 _ « _ 2 3.8. Р - 3.9. Р = 1- 4'2'3! 3.10. Р = 3 11 — 3’1Ь 1212 3.12. Р = = 1-* = *. 5! 5 5 11 Al ~ 20' « 0.00005372. 10-6 _ 1 W»' 3.13. 1 О 3 14 ~ ~~ 3-15-Р = £ = ^- 14 7 3.16. Р = 1-^ = ^. 63 9 3.17. Вероятность того, что при п бросаниях хотя бы один раз выпала шестерка равна 1 минус вероятность того, что она ни разу не выпадет при п бросаниях, и очевидно равна 1-^. 6« 5П а) Нужно найти такое минимальное п, что 1 — — 0.5. Несложно подсчитать, что п = 3. 5П б) Минимальное п такое, что 1 — — 0.9 равно 13. 4.1. Р = (а — 2г)2/а2, где а — 4, г = 1, т. е. Р — 22/16 = 1/4. 4.2. Р= ^4 = -. 1ГГ£ 1Г 4.3. Р = 1/4. 4.4. Пусть х - длина отрезка [A, L], у - длина отрезка [А, М]. Тогда условие задачи запишется в виде \у — ж| < а?. Это влечет 0 < у < 2х, и, следовательно, искомая вероят- ность равна *2 - Т _ 3 Р 4
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 197 2 4.5. Две кривые х + у=1иху = - пересекаются в двух У точках. Координаты абсцисс у них следующие: a?i = -,а?2 = 9 1 ^/3 о J_ 1 9 = -. Ответ в задаче Р = - 4- / — = - + - 1в2. 1/з 4.6. Обозначим через х, у и I—г—у длины отрезков. Огра- ничение 0 х+у I следует из условия задачи. Следующие ограничения вытекают из свойства треугольника, что сум- ма двух любых сторон больше третей: 1 * * х + у В результате искомая вероятность равна л mes|x, у : 0 х |,0 у + у j mes{x, y:O^T,O^y,O^T-f-y^/} 4 ’ 4 7 P — 1 — t/1 I 4.7. Г - 1 я у 1 + 4|г2Я2 • 4.8. P = « 0.2113. e 5.1. События ABi и AB2 несовместны, так как ВХВ2 = 0- Тогда P(A(Bi + В2)) = P(ABl + ЛВ2) = Р(АВХ) + Р(ЛВ2) = = P(A)P(Bi) + Р(Л)Р(В2) = Р(Л)(Р(ВХ) + Р(В2)) = = P(A)P(Bx+B2). 5.2. Независимы. 1 17 5.3. Зависимы, поскольку Р(А) = -,Р(В) = 1 — — = а Р(ЛВ) = 1(1 - 5.4. Вынули сразу три шара или поочередно - одно и тоже. Поэтому Р(1-й б.,2-й б.,3-й б.) = = Р(1-й б.)Р(2-й б.|1-й б.)Р(3-й б.}1-й б., 2-й б.) = _ 9 8 7 _ 7 “ 10 ’ 9 ’ 8 ~ 10' 5.5. Р(ПОЛЕ) = Р(П)Р(О|П)Р(Л|ПО)Р(Е|ПОЛ) = _ 1 2 1 2 1 " 9'8 ’ 7 ’ 6 “ 756 ‘ 5.6. По формуле сложения вероятностей несовместных со- бытий Р(шары одного цвета) = = Р(белые) + Р(черные) + Р(красные) = = А.“ + Н.Л + £.± = ^й0.323. 24 24 24 24 24 24 578
198 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 5.7. Обозначим искомую вероятность Р. Положим А — {первый сделал больше выстрелов чем второй}, Aj ={первый стрелок попал при первом выстреле}, В\ ={второй стрелок попал при первом выстреле}. Поскольку после двух выстре- лов, если оба промахнулись, все начинается снова, то имеем А = Ai(Bi + В\А). Следовательно, Р(А) = PCAiXPCBi) + P(B!)P(A)), и Р = 0.8(0.3 + 0.7Р)), т. е. Р = £. 5.8. Событие А является произведением событий А* = {k-я деталь качественная}, k — 1,2,..., 5. Вычислим вероят- ность q события А — А1А2А3А4А5 - партия принята. Оче- видно P(Ai) = так как всего деталей 100, а качествен- ных 95. После осуществления события Ai деталей останется 99, среди которых качественных 94, поэтому P(A2[Aj) = —. Аналогично Р(Лз|АЛ2) = Ц, Р(Л4|ЛМ2Лз) = Р(Л6|ЛМ2ЛзА4) = 55. «70 v ( tzO По общей формуле умножения вероятностей находим _ 95 94 93 92 £1 ~ л 77 9 “ 100 ’ 99 ’ 98 ’ 97 ' 96 ~ ' Искомая вероятность равна р = 1 — q ~ 0.23. 6.1. Первый бросивший монету игрок выигрывает при первом броске с вероятностью При втором броске он вы- игрывает, если при первом броске у него и у второго игро- ка выпало по решетке (вероятность этого а на втором броске у него выпал герб. В силу независимости событий вероятность выиграть на втором броске равна • |. Лег- ко понять, что вероятность выиграть на fc-м броске равна (l\fc 1 -) • -. Складывая эти вероятности получим искомую ве- 4/ 2 роятность:
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 199 Первый бросивший монету игрок выигрывает с вероятно- 2 Ч 1 1 стью р = -, второй -д = 1—р=-. 6.2. Решение легко понять из ответа для вероятности на- дежности прибора: Р = (pi + (1 - pi)pp2)(p3 + (1 - Рз)рР4)- 6.3. Вероятность хотя бы одного попадания в мишень рав- на единице минус вероятность всех трех промахов. Пусть р - вероятность попадания, ад- вероятность промаха при од- ном выстреле. Тогда 0.875 = 1 —д3, и, следовательно, g = 0.5, р — 1 — g = 0.5. 6.4. Обозначим Ai ={попадание /-й бомбы}. Тогда Р(мост_разрушен) = Р(А1А2Аз + А1А2Лз+А1А2Аз + АМ2А3) = РСАОРСМРСЛз) + Р(А1)Р(Л2)Р(Аз)+ +Р(А1)Р(А2)Р(Аз) + Р(Л1)Р(А2)Р(Аз) = = 0.9 • 0.3 0.4+0.1-0.7-0.4+0.1 • 0.3 0.6+0.1 -0.3 0.4 = 0.166. 6.5. Р = Р1(р2 + РЗ - Р2Рз)?4(1 - Рэ) + Р5. 6.6. Р = (pip2 + РЗ - Р1Р2Рз)(Р4 + Р5 - Р4Рб)(1 - Рб) + Рб • 6.7. Р = 1 - 0.9 • 0.8 • 0.6 = 1 - 0.432 = 0.568. 6.8. Р=(3)31 = 4 = -^±. V6 ' 6 64 1296 10 6.9. Р= £ = £ ф2"* т—1 lp=?=l/2 m-i * ___1 4(1- 1 7.1. р=1.1 + 1(1+1.1) + 1.1.1 3 2 ЗкЗ 3 2' 3 2 2 5 - _ - - __ - _ _ 12’ 7.2. Обозначим Hi ={выбрали кубик}, Я2 ={выбрали пи- рамиду}, А ={выпала цифра 4}. По формуле Байеса РГ я 1/П = Р(Н1)Р(А\НА _ Ы _ 8_ 1 11 > + ы + ы и' 7.3. По формуле полной вероятности + 7.4. Обозначим Hv ={первый белый}, Нъ ={первый чер- ный}, А ={следующий за первым - белый}. По формуле Байеса РГЯ мч = Р(Я,)Р(Л|Я.) _ > Р(Я„)Р(А|Я.) + Р(Я|,)Р(Л|Я|,) 2 9 3 2 7 3 7.5. По формуле полной вероятности Р = — • - + — • - 10 У 10 9 3 7.6. Р(грузовая машина) = -. _ 3_ ~ 10’
200 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 7.7. Начало решения аналогично решению задачи 2 (§7). Обозначим А ={в кабане две пули}, Яцо ={попал первый, попал второй, не попал третий} и т. д. В силу независимо- сти Р(Яцо) = 0.8 0.4 0.8 = 0.256, Р(Яю1) = 0.8 0.6 0.2 = 0.096, Р(Яои) = 0.2 0.4 0.2 = 0.016. По формуле Байеса Р(Яцо|А) = 0.256 16 ... 0.096 6 ... 0.016 _ 1 ~ 0.368 ~ 23’ ' 101' ' ~ 0.368 ~ 23’ ' 011' ' — 0.368 ~~ 23' Таким образом, первому и второму вместе нужно отдать 16 долей из 23, первому и третьему вместе - 6 долей, а второ- му и третьему вместе - 1 долю. Между собой они должны делить пополам, поскольку, если оба попали, то независимо от вероятностей попадания их вклад одинаков. Окончатель- но имеем, что первому нужно отдать „ 16 1 , 1 1 доли добычи, второму - — • - 4- — • - А А& А 6 1 1 1 _ 7 23 2 + 23 ’ 2 ~ 46 16 1 6 1 _ 22 23 * 2 + 23 ’ 2 ~ 46 17 = —, а третьему — 46 8.1. а)Р = Р10(5) = С150^ = ^; б) Р = Ао(3,8) = 1 - ^(1 + С*о + Clo + С?„ + 1) = 8.2. Поскольку ^4(2,4) = = Ps(3,5), то вероятнее выиграть больше одной партии из четырех. 8.3. Р(хотя бы одна шестерка при 6 бросаниях) = =1 - ф" =1 - sS ~1 - °-3349=°в651- Р(не менее двух шестерок при 12 бросаниях) = = О'2 - 12 0.6187. Р(не менее трех шестерок при 18 бросаниях) = -1 /5\18 1й 1 /'5117 ikq 1 /5116 _ 1 516(25 + 90 + 153) -1 W 18‘e’W 1W’e2 'в' 1 618 ~ р» 1 — 0.4027 = 0.5973. Следовательно, шансы убывают. Я 4 п_ 8г3/1ч5 2 5,1х5_ 8-10+21 _ 41 ЬЛ-Г-16°5Ч' +Ю°^2, “ 10-2* “ 160- 8.5. Р = Cl- (А)3 = X (3 • 5 + 1) = Д = А. 8.6. Три лампы горят с вероятностью Р — Cf • (—) • — = — — 0.4096. Наивероятнейшее число лежит в пределах от 3.2 — 0.2 до 3.2 4-0.8. Следовательно, чисел два: 3 и 4. 8.7 Вероятность того, что изделие бракованное р = 0.01. Тогда Р(среди п хотя бы одно бракованное) =
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 201 = 1 — Р(среди п нет бракованных) = 1 — (1 — 0.01)” 0.95. Решая это неравенство получим п ~ 298.073. Сле- довательно, наименьший объем должен состоять из 299 из- делий. з 8.8. Вероятность равна Р = ~ к=0 = —-—(123 + 9 • 42 • 122 + 9 422 • 12 + 423) = 0.32076. 1000000' ' 9.1. Р « 1 - е"8 - 8е~8 - —е“8 = 1 - 41е“8 « 0.986. 2 9.2. Р к е“3(3 + у) = е“3у « 0.373. 9.3. Вероятность выпадения шестерки р = -. Воспользу- емся формулой 9.8. Имеем д=1—р=-, пр = —, y/npq = —. Естественно выбирать границы симметричные относитель- но среднего пр, т. е. = пр — т, m2 = пр + т, где т неизвестно и его нужно определить. Согласно формуле 9.8 0.9973 = Рп(пр-т,пр+т) « 1(ф(-^)-ф(--^)) = ф(^). Из таблицы для функции Лапласа получаем — = 3 или т — 10. Следовательно, ту — ^ — 10 — з| тпз = ~г+Ю = 2з|. 6 3 6 3 и значит при 80 бросаниях шестерка выпадает с вероятно- стью, близкой к 0.9973 в пределах от 4 до 23 раз. 9.4. Воспользуемся формулой 9.8. Имеем р = 3/4, q = 1/4, y/fipq = ф& = 12, пр = 768 • 2 = 576. Тогда 564 - 576 . , 600 - 576 п ап = --—— = — 1,оп = — — 2, и искомая вероятность Р « |(Ф(2) + Ф(1)) « |(0.9545 + 0.6827) = 0.8186. 9.5. По формуле 9.7 имеем Рзоо(75) « 0.053. 1 о 9.6. Р(не более трех разбитых) « е-1(1 -Ь 1 + - -f- -) = = -е-1 «0.981. з 9.7. Применим формулу 9.8. Имеем п = 22500, А ={ответ неискренний}, р = Р(Л) = 0.2, q = 1 — р = 0.8, т± = 4380. m2 = 4560. Тогда фщ = >/22500 0.2 • 0.8 = 60, ап = (0 - 22500
202 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 0.2)/60 = —75, Ьп = (4620—22500 0.2)/60 = 2. Теперь вычислим искомую вероятность Р225Оо(0,4620) « 1 (Ф(2) - Ф(—75)) « 1(Ф(2) + 1) « 0.9773. 10.1. Закон распределения имеет вид X 0 1 2 р 60 87 25 87 2 87 10.2. Закон распределения имеет вид X 0 1 2 3 р 8 1000 96 1000 384 1000 512 1000 10.3. а) Г(ат) = < 1, ^(1 - cos ат), 0, при х 0, при 0 < X 7Г, при 7Г < X. ») Р(0 < X < |) = F(i) - F(0) = 1(1 - cos I) « 0.146. 10.4. Закон распределения имеет вид У 0 0.5 1 Р 4 То 5 10 1 То 10.5. Величина Y = е х, поскольку X неотрицательна, принимает значения в интервале [0,1]. Для 0 у 1 оо FrW = Р < у) = Р(Х > - In у) = [ e~vdv = у. - In 2/ Следовательно, величина Y равномерно распределена на промежутке [0,1].
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 203 10.6. Поскольку У = X2, то Fy(y) = 0 при у 0, а при У > 0 имеем Гу (у) = Р^Х2 < у) - Р(-у/у < X < y/у) - — Fx(y/y) — Fx(—y/y)‘ Дифференцируя это равенство по у, получим Fy(y) = (y/у) + ^F'x(-y/y). Отсюда в силу второго свойства плотности распределения (§10) следует, что при у > О /и (У) = ^=(fx(~y/y) + fx(y/y))f и fy(y) = 0 при у 0. 10.7. Закон распределения имеет вид X 0 1 2 3 4 р 16 81 32 81 24 81 8 81 1 81 о 7 10.8. а = 2 Р(Х>1)=1. О о 10.9. о = i Р(3 $ X < 4) = 22 64 ' 64 10.10. Применяя формулу (10.6) для у(х) = у/х, получим 10.11. Применяя формулу (10.6), получим /у (У) = |(y-l)2, ls£y<3, О, у < 1, 3 < у. 11.1. Совместный закон распределения имеет вид (*,П (5,5) (5,2) (2,5) (2,2) р 28 91 24 91 24 91 15 91 11.2. f(x,y) — abe~ax~by.
204 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 11.3. Пусть Z — тах{Х, У}. Тогда = Fx(x)Fy(s). 11.4. Пусть Z — шт{Х,У}. Тогда = = 1-(1-Fx(*))(l-Fy(x)). 11.5. Пользуясь определением совместной плотности рас- пределения, вычислим совместную функцию распределения. При 0 х тг/2, тг/2 о о sin(u 4- v)dudv = |(sin х 4- sin у — sin(s 4- у)). При 0 х тг/2, тг/2 у г 1 F(x,y) = J J | sin(« + v)dudv = о о |(sin х 4- sin 1 — sin(x 4- 1)). При тг/2 х, 0 у тг/2 аналогично F(x, у) = i(sin^ + sin 1 - sin(t/ 4- 1)). При х 0 или у 0 имеем F(x, у) = 0. 12.1. Е(Х) = 1.5, D(X) = 0.15. 12.2. Е(Х) = 4,D(X) = 12.3. Пусть Xi - очки, выпавшие на жетоне, Х2 - на ку- бике. Тогда X = Xi 4- Х2 и закон распределения имеет вид X 1 2 3 4 5 р 1 6 1 6 1 3 1 6 1 6 Используя свойства математического ожидания и диспе- рсии, получим Е(Х) = E(Xi) 4- Е(Х2) = 14-2 = 3,D(X) = = D(Xi) + D(X,) = 11 + 11 + 1.1 +1-1 = |. 12.4. Пусть Xi - очки, выпавшие на одном жетоне, Хъ - на другом. Тогда X = Xi 4- Х2 и Е(Х) = E(Xi) 4- Е(Х2) = = 4 4- 3 = 7,D(X) = D(Xi) 4-D(X2) = 14-4 = 5. 12.5. Закон распределения имеет вид
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 205 X 0 1 2 3 р 8 27 12 27 6 27 1 27 Математическое ожидание и дисперсия равны Е(Х) = 1, В(Х) = 12.6. Используем решение задачи 11.1 и свойства вероят- ностей pij из § 11. Закон распределения величины X следу- ющий: Р(Х = 2) = у Р(Х = 5) = у. Закон распределения ве- личины Y такой же. Тогда Е(Х) = у, D(X) = Е(ХУ) = 1240 „ Е(ХУ)-Е2(Х) 1 = ур. В результате получим г(Л, Y) = ——~ ~1з' 12.7. Математическое ожидание случайной величины X равно w/2 я/2 ад=|// х sin(x 4- y)dxdy о о тг/2 J «(cos х — cos(x 4- ic/^yjdx = ~ 0.785 о Дисперсия случайной величины X равна эг/2 тг/2 D(X) = i У / £2sin(x 4- y)dxdy - = о о */2 2 2 = i [ ®2(cosx — cos(z 4- ir/2}}dx ~ 77 = 77 + 7 — 2« 0,188 2 f lo J.V A 0 Из симметрии плотности вероятности относительно х и у следует, что Е(У) = Е(Х), D(y) = D(X). Используя первое
206 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ свойство ковариации, получим тг/2 тг/2 cov(X, У) = | у У xysinfx + y)dxdy - = о о тг/2 / । / * т\- \j * к2 1 s(coss + (- - l)sma?)dz- — = - - — - 1. X АО £ АО о Таким образом, коэффициент корреляции равен г(Х,У) = cov(X, У) D(X) Я- _ Я2 _ 1 2 16 1 Я2 I я о 16 + 2 * 0.046 0.188 « 0.245. 13.1. 1) Поскольку |(1 — |z) 1 = i 4- iz + ±z2 4- • • •, то это соответствует дискретному распределению р(* = *) = ^-* = 0,1,2..... 2) Поскольку еЗЛ<г-1) — е~ЗА то к=0 к' Р(Х = к)=^^е~зх, к = 0,1,2,.... 3) Поскольку (^+ |z)n = C*Qk (±)п~кzk, то Р(Х = к) = = Ск= 0,1,..., п, и Р(Х = к) = 0 при к > п. 13.2. 1) Имеем cos2 t — ie’*(_2) 4- | 4- ^-ег*2, следовательно, 0, F(x) = < 1 4’ 3 4’ 1, х ~2; —2 < х 0; 0 < х 2; 2 < х. 2) Имеем ^(cosZ 4- cos 2/) = -е lt 4- -eu 4- -е 12* 4- -ei2t. Это - 2' 4 44 4 дискретное распределение со скачками - в точках ±1,±2. 4 2 1 2 1* 1 3) Имеем - 4- - cos3/ = - 4- ~е~г3* 4- -е13<, следовательно, 3 3 3 6 6 P(X = O)=J,P(X = ±3) = 1.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 207 13.3. Можно записать V’(z) = £ zkP(X + l = i + l)=lg г'Р(Х + 1 = 0- *=0 Z 1=1 Используя это равенство и тот факт, что X - неотрицатель- ная величина, получим ответ на первый вопрос fe+lW = Е *'Р(* + 1 = I) = Р(Х + 1 = 0) + z^(z) = Z<!>(z). 1=0 Ответ на второй вопрос с учетом неотрицательности и це- лочисленности X следующий: М) = Е ?Р(2Х = Z) = Е *2*Р(2Х = 2к) = 1=0 fc=0 13.4. <p(i) = ~(1 — cos -) при t £ 0, <p(t) = 1 при t = 0. 13.5. 1) 0, а2/3; 2) 0, 7/6; 3) 1, 7/6. 13.6. = + £)-£. {kl, при к четном, О, при к нечетном. 13.8. По определению характеристической функции оо со О у eitx-^dx = 1У e^-^dx+l У e^+1>dx = — оо 0 —оо 1 2 1 1-it —1 = — 1 + itJ 1 + t2 t z г- z </2Л \ 13.9. y(i) = 1 + e-<2/«2(^ -If /* . \ £ГЬ ГЬ q / 14.1. По формуле 14.3 = i(Ф(2) 4- Ф(|)) ~ |(0.9545 + 0.3829) = 0.6687. А А Л 14.2. Положим р — 1----- = — - вероятность появления 6^ 36 хотя бы одной шестерки. Шестерка впервые выпадет при к-ом бросании с вероятностью, задаваемой геометрическим D /52\fc—ill 11 • 52fc-2 , , o распределением P = (—) — = ——,fc= 1,2,....
208 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 14.3. 1, Р(У <!/) = { Уп, . 0. 1, Ю. P(Z<z) = l-(l-z)n, 0, z 0. 14.4. Поскольку Е(Х) = ~ = 4,D(X) = - 3, то а = 1 и b = 7. Следовательно, плотность имеет вид f(x) — 14.5. Используя независимость случайных величин Xi и Х2, получим P(Z = m) = P(Xi = m, Х2 < m)+ 4- P(X2 = tn, Xi < tn) 4- P(Xi = m, X2 = tn) = = 2P(Xi = tn)P(X2 < m) + P2(Xi = tn) = = 2Г(1 - «) E «*(! -«) + «’"X1 - «)2 = = «m(l - «)(2 - «m - «m+1)- 15.1. P({ 1,5) + {2,4} + {3,3} + {4,2} + {5,1}) = ~ 15.2. Производящие функции величин X и У имеют вид ^х(г) = (zp 4-1 — р)П1 и V’rCO — (ZP+ 1 — р)Пз- По свойству 3) для производящих функций ^х+у(г) = ^x(z)^Y(z) = (zp + 1 - p)ni+n2. Следовательно, Х4-У тоже распределена по биномиальному закону Р(Х 4- У = т) = С^1+п2рт(1 - ру^2-т> тп — Q, 1,2.П1 4-п2.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ 209 15.3. По формуле (15.4) Z fx+y(z) = J 4e“4<*"*)il[2)4](s)</® = о z 4 = 2I[2,4](^)e“4^ У e4xdx 4- 21[41ОО)(г)е_4г J e4xdx = 2 2 = 1(1 - е«-^)1[2,41(г) + |е8"4г(е2 - 1)1[4,«.)(*) 15.4. По формуле (15.3) о. при z —1, при — 1 < Z 1, при 1 < z 3, при z > 3. 15.5. По формуле (15.4) /х+г(г) - 4 О, 1(1-е—), |(е“6-1)е-"\ г ^0, 0 < z < Ь, b z. Величина —Y распределена равномерно на интервале [—6,0]. Тогда полагая X—Y — Х + (—У) и применяя формулу (15.3), получим fx-v(z) = < 0, 1(1-е-а(^+6))> |(1-е"“6)е-^ z С —Ь < z < 0, 0 z. 16.1. Пусть величина Х[ равна 1, если /-й элемент отказал за время f, и Xi = 0, если не отказал. Очевидно Е(Х/) = 0.05. 60 Применим лемму 1 (§ 16) для X = Хь Тогда получим /=1 60 60 60 *4) = 1 - р(5> > 5) > 1- НЕ» = I- 1=1 1=1 1=1
210 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ 16.2. Пусть величина X/ равна 1, если на /-ом броске выпал герб, и 0, если выпала решетка. Тогда Е(Х/) = D(X/) = Применим (16.4) при п — 1000 и 6 = 100. Полагая t'looo ~ частота появления герба, получим 1000 Р(kiooo- 1| < од) = р(| $2X, - 5001 < 1оо) > м 1=1 > 1 _ 1000 1 — — 10000 ’ 4 “ 40' 16.3. Обозначим Sn - число наступлений А в п испыта- ниях с вероятностью успеха р. Тогда E(Sn) = пр, D(S’n) = = npq. Следовательно, при р — 0.2 математическое ожидание E(Si5oo) = 1500-0.2 = 300 и дисперсия D(S'isoo) = 1500 0.2 0.8 = = 240. Неравенство Чебышева дает P(|Si5oo - 300| > 40) = 0.15. 16.4. Применим (16.2) для величины У = где Sn та же, что в решении задачи 16.3. Тогда D(K) = — и число п следует выбирать так, чтобы 1 — ~ 0.95. Решая это не- равенство относительно п, получаем п ?? . При р = 0.9, 0.О564 1 ЛП £ ПЛ1 0.9 0.1 0.09 q = 1 — 0.9 = 0.1, о = 0.01 имеем п > ——----гг = ——---- = 4 ' 0.05(0.01)2 0.000005 = 18000, т. е. наименьшее число изделий, которые следует проверить, равно 18000. 17.1. Пусть X/ - число очков при 1-ом выстреле, a Sn - суммарное число очков при п выстрелах, п = 100. Тогда Е(Х,) = 10 • 0.5 + 9 • 0.3 + 8 • 0.1 + 7 • 0.054- 6 • 0.05 = 9.15, D(X,) = = E(Xf2)-E2(XQ = 50 + 24.3+6.44-2.45 + 1.8-83.7225 = 1.2275, \/D(X/) « 1.1079. По формуле (17.6) Р(900 < Sioo < оо) « | (ф(оо) - Ф(2^)) * « 1(1 + Ф(1.35)) к |(1 + 0.823) = 0.9115. в
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 211 17.2. Пусть Sn - число вызовов в течение года, п = 365. Тогда Е(Х/) = А = 73, D(X,) = А = 73, и = = У365У73 = 73д/5, / = 1,2,..., 365, и по формуле (17.6) Р(26500 < S„ < 26800) « 1(ф(2“ ) + Ф(2^)) « « |(Ф(0.95) + Ф(0.89)) « ^(0.6579 + 0.6265) = 0.6422. Математическая статистика 19.1. Для вычисления оценки математического ожидания начальной скорости снаряда воспользуемся формулой (19.1) при с = 1235 : г16 = 1235 4- ^(16 - 8) = 1235.5 м/с. Оцен- ку дисперсии начальной скорости вычисляем по формуле (19.2): = ^(0.01 + 4 + 6.76 + 0.49 + 9 + 1.69 + 0.16 + 4.84+ +1 + 1.69 + 4.41 + 5.76 + 1.44 + 4 + 0.01 + 0.64) = 3.06 м2/с2. 19.2. Хбо = 2, s|0 = ± • 366 - • 22 « 2.1356. 19.3. Имеем ж10 = = 49.9; у10 = = 17.4; 10 10 10 £ х1У1 = 9228; £ = 27175; £ у? = 3182. Тогда j=i i=i 1=1 г10(£, у) = .............. - го.;Л^Ж^- .......« 0.92. у (£4=1 - ю • ^io) у? -10 • У?о) Это значение характеризует сильную линейную зависи- мость. 21.1. а) Воспользуемся доверительным интервалом для математического ожидания с доверительной вероятностью а при неизвестной дисперсии, определенном в п. 2 § 21. По результатам решения задачи 19.1 ®ie = 1235.5, ~ 1.75. Из таблицы для функции Лапласа по а = 0.9 определяем za « 16 « 0.72. Таким образом, интервал (1234.78, 1236.22) содержит математическое ожидание с ве- роятностью 0.9.
212 ОТВЕТЫ И РЕШЕНИЯ К ЗАДАЧАМ б) Построим доверительный интервал для дисперсии. Воспользуемся формулой (21.4). Из таблицы для функ- ции Лапласа по а = 0.92 определяем za « 1.75. Имеем 16 1 ^16 = 52(ж* — ^хб)4 = ’ 244.2102 « 15.2631. Следовательно, 1=1 ________16 ^=У«(1б - (®1б)2 * ^05.2631-9.3636 « 1.06. Поскольку «16 « 3.06, то интервал (2,4.12) содержит значе- ние дисперсии с вероятностью 0.92. 21.2. Воспользуемся формулой (21.3). Имеем х$ = 1.594- •10-19, 0| « 0.002739 • 10"19, £0.99,4 « 4.6. Следовательно, 0.005634-10“19, и доверительный интервал имеет вид (1.588-10“19,1.600-10“19). Заметим, что современное зна- чение заряда электрона приблизительно равно 1.602-10“19. Это означает, что приведенные в задаче данные измерений имели систематическую ошибку. 23.1. Пусть X - число мальчиков в семье с двумя деть- ми. Пусть Vi - количество семей с i мальчиками (* = = 0,1,2) среди семей с двумя детьми. Проверяется гипо- теза о том, что величина X имеет биномиальное распре- деление с параметром р — 0.515, т. е. распределение вида Р(Х = 0) = (1 - р)2, Р(Х = 1) = 2р(1 - р), Р(Х = 2) = р2. Имеем п = 17036, Дп(ж) = (4019 - 17036 • (0.485)2)2 (8488 - 17036 • 2 • 0.515 - 0.485)2 , 17036-(0.485)2 + 17036 - 2-0.515-0.485 + (4529 - 17036 • (0.515)2)2 17036 • (0.515)2 « 0.118. По таблице квантилей распределения Пирсона с двумя сте- пенями свободы имеем го.95 « 5.991. Следовательно, гипоте- за принимается. 23.2. Сначала нужно упорядочить значения, т. е. постро- ить вариационный ряд а?(1) а?(2) а?(20). Имеем 0.008 0.1 0.166 0.204 0.253 0.292 0.354 0.372 0.422 0.429 0.453 0.509 0.520 0.531 0.610 0.648 0.805 0.809 0.863 0.911. Используя определение эмпирической функции распределения, несложно понять, что в данном при- мере D20(£) = тах^азд - £|,|«(»)- ^|} =
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 213 = 720|х(14) “ |з| = \/20(0.7 - 0.531) « 0.7758. Из таблицы для распределения Колмогорова находим го.э & 1.23. Поскольку Рго(я) < го.э, то гипотеза принимается. 23.3. Поскольку все вероятности р° равны 0.1, получаем Л / _ (968 - 1000.2)2 (1026 - 1000.2)2 (1014 - 1000.2)2 ~ 1000.2 + 1000.2 г 1000.2 W « 9.3677. По таблице квантилей распределения Пирсона с девятью степенями свободы имеем zq.& = 12.24. Следователь- но, критерий Пирсона подтверждает гипотезу о равноверо- ятности появления цифр в записи числа тг — 3. 24.1. Формулы (24.8), (24.9) дают следующий ответ: 01 «67.5,02« 0.87. 24.2. 0! = 4,02 = -2,0з = 0.25. 25.1. Имеем L(x, 0) = 0n ехр(-0 £ X,), и = п п = - — У} X,. Следовательно, оценка максимального правдо- 0 i=1 - _ подобия имеет вид 0П = 1/Хп. 25.2. Пусть 0 = (0x,0г), где 01 - математическое ожида- ние, 02 - дисперсия распределения диаметров. Воспользу- емся замечанием 1. Тогда 1=1 Решая систему =0- находим оценку максимального правдоподобия 0n = (Xn, S^2)), где S™ определен в п. 3 § 19. Для имеющихся данных я20 = 4.998, «20 = 0.009056. 25.3. См. пример 4 § 25.
214 Таблицы Приближенные значения функции Колмогорова оо £(я) = 52 (~1)? ехр(—2/2ж2), домноженные на 105 —оо X 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.2 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 03 00001 00002 00005 00009 00017 00030 00051 00083 00129 00193 0.4 00281 00397 00548 00738 00973 01259 01600 02002 02468 03002 0.5 03605 04281 05031 05853 06750 07718 08758 09866 11040 12276 0.6 13573 14923 16323 17775 19268 20799 22364 23958 25578 27219 0.7 28877 30547 32227 33911 35598 37283 38964 40637 42300 43951 0.8 45586 47204 48803 50381 51937 53468 54974 56455 57907 59332 0.9 60727 62093 63429 64734 66008 67252 68464 69645 70794 71913 1.0 73000 74057 75083 76078 77043 77979 78886 79764 80613 81434 1.1 82228 82995 83736 84450 85139 85804 86444 87061 87655 88226 1.2 88775 89303 89810 90297 90765 91213 91643 92056 92451 92829 1.3 93191 93537 93868 94185 94487 94776 95051 95314 95565 95804 1.4 96032 96249 96455 96652 96838 97016 97185 97345 97479 97641 1.5 97778 97908 98031 98148 98258 98362 98461 98554 98643 98726 1.6 98805 98879 98949 99015 99078 99136 99192 99244 99293 99339 1.7 99383 99423 99461 99497 99531 99563 99592 99620 99646 99670 1.8 99693 99715 99735 99753 99771 99787 99802 99815 99830 99842 1.9 99854 99864 99874 99884 99892 99900 99908 99915 99921 99927 2.0 99933 99938 99943 99947 99952 99955 99959 99962 99965 99968 2.1 99971 99972 99975 99977 99979 99981 99982 99984 99985 99986 2.2 99987 99989 99990 99990 99991 99992 99993 99993 99994 99994 2.3 99995 99995 99996 99996 99997 99997 99997 99997 99998 99998 2.4 99998 99998 99998 99999 99999 99999 99999 99999 99999 99999 2.5 99999 99999 99999 99999 99999 105 105 105 105 105
ТАБЛИЦЫ 215 Приближенные значения стандартного нормального 1 х 3 распределения N(x) = -7= f е~* ^dt, домноженные на 105 V 2тг v —00 X 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 50000 50399 50798 51197 51595 51994 52392 52790 53188 53586 0.1 53983 54380 54776 55172 55567 55962 56356 56750 57142 57535 0.2 57926 58317 58706 59095 59484 59871 60257 60642 61026 61409 0.3 61791 62172 62552 62930 63307 63683 64058 64431 64803 65173 0.4 65542 65910 66276 66640 76003 67365 67724 68082 68439 68793 0.5 69146 69497 69847 70194 70540 70884 71226 71566 71904 72241 0.6 72575 72907 73237 73565 73891 74215 74537 74857 75175 75490 0.7 75804 76115 76424 76731 77035 77337 77637 77935 78231 78524 0.8 78815 79103 79389 79673 79955 80234 80511 80785 81057 81327 0.9 81594 81859 82121 82381 82639 82894 83147 83398 83646 83891 1.0 84135 84375 84614 84850 85083 85314 85543 85769 85993 86214 1.1 86433 86650 86864 87076 87286 87493 87698 87900 88100 88298 1.2 88493 88686 88877 89065 89251 89435 89617 89796 89973 90148 1.3 90320 90490 90658 90824 90988 91149 91309 91466 91621 91774 1.4 91924 92073 92220 92364 92507 92647 92786 92922 93056 93189 1.5 93319 93448 93575 93699 93822 93943 94062 94179 94295 94408 1.6 94520 94630 94738 94845 94950 95053 95154 95254 95352 95449 1.7 95544 95637 95728 95819 95907 95994 96080 96164 96246 96327 1.8 96407 96485 96562 96638 96712 96784 96856 96926 96995 97062 1.9 97128 97193 97257 97320 97381 97441 97500 97558 97615 97671 2.0 97725 97778 97831 97882 97933 97982 98030 98077 98124 98169 2.1 98214 98257 98300 98341 98382 98422 98461 98500 98537 98574 2.2 98610 98645 98679 98713 98746 98778 98809 98840 98870 98899 2.3 98928 98956 98983 99010 99036 99061 99086 99111 99134 99158 2.4 99180 99202 99224 99245 99266 99286 99305 99324 99343 99361 2.5 99379 99396 99413 99430 99446 99461 99477 99492 99506 99520 2.6 99534 99547 99560 99573 99586 99598 99609 99621 99632 99643 2.7 99653 99664 99674 99683 99693 99702 99711 99720 99728 99737 2.8 99745 99752 99760 99767 99774 99781 99788 99795 99801 99807 2.9 99813 99819 99825 99831 99836 99841 99846 99851 99856 99861 3.0 99865 99869 99874 99878 99882 99886 99889 99893 99897 99900 3.1 99903 99907 99910 99913 99916 99918 99921 99924 99926 99929 3.2 99931 99934 99936 99938 99940 99942 99944 99946 99948 99950 3.3 99952 99953 99955 99957 99958 99960 99961 99962 99964 99965 3.4 99966 99968 99969 99970 99971 99972 99973 99974 99975 99976 3.5 99977 99978 99978 99979 99980 99981 99982 99982 99983 99984 3.6 99984 99985 99985 99986 99986 99987 99987 99988 99988 99989 3.7 99989 99990 99990 99990 99991 99991 99992 99992 99992 99993 3.8 99993 99993 99993 99994 99994 99994 99994 99995 99995 99995 3.9 99995 99995 99996 99996 99996 99996 99996 99996 99997 99997
216 ТАБЛИЦЫ Приближенные значения функции Лапласа \^2 $ 2 I Ф(ж) = —= f е~г >2dt, домноженные на 105 X 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 00000 00798 01596 02393 03191 03988 04784 05581 06376 07171 0.1 07966 08759 09552 10348 11134 11924 12712 13499 14285 15069 0.2 15852 16633 17413 18191 18967 19741 20514 21284 22052 22818 0.3 23582 24344 25103 25860 26614 27366 28115 28862 29605 30346 0.4 31084 31819 32552 33280 34006 34729 35448 36164 36877 37587 0.5 38292 38995 39694 40387 41080 41768 42452 43132 43809 44481 .0.6 45149 45814 46474 47131 47783 48431 49075 49714 50350 50981 0.7 51607 52230 52848 53461 54070 54675 55275 55870 56461 57047 0.8 57629 58206 58778 59346 59909 60468 61021 61570 62114 62653 0.9 63188 63718 64243 64763 65278 65789 66294 66795 67291 67783 1.0 68269 68750 69227 69699 70166 70628 71086 71538 71986 72429 1.1 72867 73300 73729 74152 74571 74986 75395 75800 76200 76595 1.2 76986 77372 77754 78130 78502 78870 79233 79592 79945 80295 1.3 80640 80980 81316 8-1648 81975 82298 82617 82931 83241 85547 1.4 83849 84146 84439 84728 85013 85294 85571 85844 86113 86378 1.5 86639 86696 87149 87398 87644 87886 88124 88358 88589 88817 4.6 89040 89260 89477 89690 89899 90106 90309 90508 90704 90897 1.7 91087 91273 91457 91637 91814 91988 92159 92327 92492 92655 1.8 92814 92970 93124 93275 93423 93569 93711 93852 93989 94124 1.9 94257 94387 94514 94639 94762 94882 95000 95116 95230 95341 2.0 95450 95557 95662 95764 95865 95964 96060 96155 96247 96338 2.1 96427 96514 96599 96683 96765 96844 96923 96999 97074 97148 2.2 97219 97289 97358 97425 97491 97555 97618 97679 97739 97798 2.3 97855 97911 97966 98019 98072 98123 98172 98221 98269 98315 2.4 98360 98405 98448 98490 98531 98571 98611 98649 98686 98723 2.5 98758 98793 98826 98859 98891 98923 98953 98983 99012 99040 2.6 99068 99095 99121 99146 99171 99195 99219 99241 99263 99285 2.7 99307 99327 99347 99367 99386 99404 99422 99439 99456 99473 2.8 99489 99505 99520 99535 99549 99563 99576 99590 99602 99615 2.9 99627 99639 99650 99661 99672 99682 99692 99702 99712 99721 3.0 99730 99739 99747 99755 99763 99771 99779 99786 99793 99800 3.1 99806 99813 99819 99825 99831 99837 99842 .99848 99853 99858 3.2 99863 99867 99872 99876 99880 99885 99889 99892 99896 99900 3.3 99903 99907 99910 99913 99916 99919 99922 99925 99928 99930 3.4 99933 99935 99937 99940 99942 99944 99946 99948 99950 99952 3.5 99953 99955 99957 99958 99960 99961 99963 99964 99966 99967 3.6 99968 99969 99971 99972 99973 99974 99975 99976 99977 99978 3.7 99978 99979 99980 99981 99982 99982 99983 99984 99984 99985 3.8 99986 99986 99987 99987 99988 99988 99989 99989 99990 99990 3.9 99990 99991 99991 99992 99992 99992 99992 99993 99993 99993 4.0 99994 99994 99994 99994 99995 99995 99995 99995 99996 99996
ТАБЛИЦЫ 217 Приближенные значения функции Гаусса ф(х) — -±=е~х2 l2dx, домноженные на 105 X 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 39894 39892 39886 39876 39862 39844 39823 39797 39767 39733 0.1 39695 39654 39608 39559 39505 39448 39387 39322 39253 39181 0.2 39104 39024 38940 38853 38762 38667 38568 38466 38361 ,38252 0.3 38139 38023 37903 37780 37654 37524 37391 37255 37115 36973 0.4 36827 36678 36526 36371 36214 36053 35889 35723 35553 35381 0.5 35207 35029 34849 34667 34482 34294 34105 33912 33718 33521 0.6 33323 33122 32918 32713 32506 32297 32086 31874 31659 31443 0.7 31225 31006 30785 30563 30339 30114 29887 29660 29431 29200 0.8 28969 28737 28504 28269 28034 27799 27562 27324 27086 26848 0.9 26609 26369 26129 25888 25647 25406 25164 24923 24681 24439 1.0 24197 23955 23713 23471 23230 22988 22747 22506 22265 22025 1.1 21785 21546 21307 21069 20831 20594 20357 20121 19886 19652 1.2 19419 19186 18954 18723 18494 18265 18037 17810 17585 17360 1.3 17137 16915 16694 16474 16256 16038 15823 15608 15395 15183 1.4 14973 14764 14556 14351 14146 13943 13742 13542 13344 13147 1.5 12952 12758 12567 12376 12188 12001 11816 11632 11451 11270 1.6 11092 10916 10741 10568 10396 10227 10059 09893 09728 09566 1.7 09405 09246 09089 08933 08780 08628 08478 08329 08183 08038 1,8 07895 07754 07614 07477 07341 07206 07074 06943 06814 06687 1.9 06562 06438 06316 06195 06077 05959 05844 05730 05618 05508 2.0 05399 05292 05186 05082 04980 04879 04780 04682 04586 04491 2.1 04398 04307 04217 04128 04041 03955 03871 03788 03706 03626 2.2 03547 03470 03394 03319 03246 03174 03103 03034 02966 02898 2.3 02833 02768 02705 02643 02582 02522 02463 02406 02349 02294 2.4 02239 02186 02134 02083 02033 01984 01936 01888 01842 01797 2.5 01753 01709 01667 01625 01585 01545 01506 01468 01431 01394 2.6 01358 01323 01289 01256 01223 01191 01160 01130 01100 01071 2.7 01042 01014 00987 00961 00935 00909 00885 00861 00837 00814 2.8 00792 00770 00748 00727 00707 00687 00668 00649 00631 00613 2.9 00595 00578 00562 00545 00530 00514 00499 00485 00471 00467 3.0 00443 00430 00417 00405 00393 00381 00370 00358 00348 00337 3.1 00327 00317 00307 00298 00288 00279 00271 00262 00254 00246 3.2 00238 00231 00224 00217 00210 00203 00196 00190 00184 00178 3.3 00172 00167 00161 00156 00151 00146 00141 00136 00132 00128 3.4 00123 00119 00115 00111 00108 00104 00100 00097 00094 00090 3.5 00087 00084 00081 00079 00076 00073 00071 00068 00066 00063 3.6 00061 00059 00057 00055 00053 00051 00049 00047 00046 00044 3.7 00043 00041 00039 00038 00037 00035 00034 00033 00032 00030 3.8 00029 00028 00027 00026 00025 00024 00023 00022 00022 00021 3.9 00020 00019 00018 00018 00017 00016 00016 00015 00015 00014 4.0 00013 00013 00012 00012 00011 00011 00011 00010 00010 00009
218 ТАБЛИЦЫ Приближенные значения квантилей za^ порядка (1 + а)/2 для распределения Стьюдента с k степенями свободы: */ / Й 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.98 0.99 0.999 1 0.727 1.000 1.376 1.963 3.080 6.310 12.71 31.80 63.70 63.70 2 0.617 0.816 1.061 1.336 1.886 2.920 4.300 6.960 9.920 31.60 3 0.584 0.765 0.978 1.250 1.638 2.350 3.180 4.540 5.840 12.94 4 0.569 0.741 0.941 1.190 1.533 2.130 2.770 3.750 4.600 8.610 5 0.559 0.727 0.920 1.156 1.476 2.020 2.570 3.360 4.030 6.860 6 0.553 0.718 0.906 1.134 1.440 1.943 2.450 3.140 4.710 5.960 7 0.549 0.711 0.896 1.119 1.415 1.895 2.360 3.000 3.500 5.400 8 0.546 0.706 0.889 1.108 1.397 1.860 2.310 2.900 3.360 5.040 9 0.543 0.703 0.883 1.100 1.383 1.833 2.260 2.820 3.250 4.780 10 0.542 0.700 0.879 1.093 1.372 1.812 2.230 2.760 3.170 4.590 11 0.540 0.697 0.876 1.088 1.363 1.796 2.200 2.720 3.110 4.490 12 0.539 0.695 0.873 1.083 1.356 1.782 2.180 2.680 3.060 4.320 13 0.538 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.010 4.220 14 0.537 0.692 0.868 1.076 1.345 1.761 2.140 2.620 2.980 4.140 15 0.536 0.691 0.866 1.074 1.341 1.753 2.130 2.600 2.950 4.070 16 0.535 0.690 0.865 1.071 1.337 1.746 2.120 2.580 2.920 4.020 17 0.534 0.689 0.863 1.069 1.333 1.740 2.110 2.570 2.900 3.960 18 0.534 0.688 0.862 1.067 1.330 1.734 2.100 2.550 2.880 3.920 19 0.533 0.688 0.861 1.066 1.328 1.729 2.090 2.540 2.860 3.880 20 0.533 0.687 0.860 1.064 1.325 1.725 2.090 2.530 2.840 3.850 21 0.532 0.686 0.859 1.063 1.323 1.721 2.080 2.520 2.830 3.820 22 0.532 0.686 0.858 1.061 1.321 1.717 2.070 2.510 2.820 3.790 23 0.532 0.685 0.858 1.060 1.319 1.714 2.070 2.500 2.810 3.770 24 0.531 0.685 0.857 1.059 1.318 1.711 2.060 2.490 2.800 3.740 25 0.531 0.684 0.856 1.058 1.316 1.708 2.060 2.480 2.790 3.720 26 0.531 0.684 0.856 1.058 1.315 1.706 2.060 2.480 2.780 3.719 27 0.531 0.684 0.855 1.057 1.314 1.703 2.050 2.470 2.770 3.690 28 0.530 0.683 0.855 1.056 1.313 1.701 2.050 2.470 2.760 3.670 29 0.530 0.683 0.854 1.055 1.311 1.699 2.040 2.460 2.760 3.660 30 0.530 0.683 0.854 1.055 1.310 1.697 2.040 2.460 2.750 3.650 40 0.529 0.681 0.851 1.050 1.303 1.684 2.020 2.420 2.700 3.550 60 0.527 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660 3.460 120 0.526 0.677 0.845 1.041 1.289 1.658 1.980 2.360 2.620 3.370 оо 0.524 0.674 0.842 1.036 1.282 1.645 1.960 2.330 2.580 3.290
ТАБЛИЦЫ 219 Приближенные значения квантилей zi_a порядка 1 - а для распределения Пирсона с к степенями свободы: Z = / 2fcZ2rl(fc72jg(fc~2)/2e~ar/2(/a; \а * \ 0.5 0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 1 0.455 0.708 1.074 1.642 2.706 3.841 5.024 6.635 7.879 10.83 2 1.386 1.833 2.408 3.219 4.605 5.991 7.378 9.210 10.60 13.82 3 2.366 2.946 3.665 4.642 6.251 7.815 9.348 11.35 12.84 16.27 4 3.357 4.045 4.878 5.989 7.779 9.488 11.14 13.28 14.86 18.47 5 4.351 5.132 6.064 7.289 9.236 11.07 12.83 15.09 16.75 20.52 6 5.348 6.211 7.231 8.558 10.65 12.59 14.45 16.81 18.55 22.46 7 6.346 7.283 8.383 9.803 12.02 14.07 16.01 18.48 20.29 24.32 8 7.344 8.351 9.524 11.03 13.36 15.51 17.54 20.09 21.96 26.13 9 8.343 9.414 10.66 12.24 14.68 16.92 19.02 21.67 23.59 27.88 10 9.342 10.47 11.78 13.44 15.99 18.31 20.48 23.21 25.19 29.59 11 10.34 11.53 12.90 14.63 17.28 19.68 21.92 24.73 26.76 31.26 12 11.34 12.58 14.01 15.81 18.55 21.03 23.34 26.22 28.30 32.91 13 12.34 13.64 15.12 16.99 19.81 22.36 24.74 27.69 29.82 34.53 14 13.34 14.69 16.22 18.15 21.06 23.69 26.12 29.14 31.32 36.12 15 14.34 15.73 17.32 19.31 22.31 25.00 27.49 30.58 32.80 37.70 16 15.34 16.78 18.42 20.47 23.54 26.30 28.85 32.00 34.27 39.25 17 16.34 17.82 19.51 21.62 24.77 27.59 30.19 33.41 35.72 40.79 18 17.34 18.87 20.60 22.76 25.99 28.87 31.53 34.81 37.16 42.31 19 18.34 19.91 21.69 23.90 27.20 30.14 32.85 36.19 38.58 43.82 20 19.34 20.95 22.78 25.04 28.41 31.41 34.17 37.57 40.00 45.32 21 20.34 21.99 23.86 26.17 29.62 32.67 35.48 38.93 41.40 46.80 22 21.34 23.03 24.94 27.30 30.81 33.92 36.78 40.29 42.80 48.27 23 22.34 24.07 26.02 28.43 32.01 35.17 38.08 41.64 44.18 49.73 24 23.34 25.11 27.10 29.55 33.20 36.42 39.36 42.98 45.56 51.18 25 24.34 26.14 28.17 30.68 34.38 37.65 40.65 44.31 46.93 52.62 26 25.34 27.18 29.25 31.80 35.56 38.89 41.92 45.64 48.29 54.05 27 26.34 28.21 30.32 32.91 36.74 40.11 43.19 46.96 49.65 55.48 28 27.34 29.25 31.39 34.03 37.92 41.34 44.46 48.28 50.99 56.89 29 28.34 30.28 32.46 35.14 39.09 42.56 45.72 49.59 52.34 58.30 30 29.34 31.32 33.53 36.25 40.26 43.77 46.98 50.89 53.67 59.70 35 34.34 36.48 38.86 41.78 46.06 49.80 53.20 57.34 60.28 66.62 40 39.34 41.62 44.17 47.27 51.81 55.76 59.34 63.69 66.77 73.40 50 49.34 51.89 54.72 58.16 63.17 67.51 71.42 76.15 79.49 86.66 60 59.34 62.14 65.23 68.97 74.40 79.08 83.30 88.38 91.95 99.61 70 69.33 72.36 75.69 79.72 85.53 90.53 95.02 100.4 104.2 112.3 80 79.33 82.57 86.12 90.41 96.58 101.9 106.6 112.3 116.3 124.8 90 89.33 92.76 96.52 101.1 107.6 113.1 118.1 124.1 128.3 137.2 100 99.33 102.9 106.9 111.7 118.5 124.3 129.6 135.8 140.2 149.4
220 Литература 1. Агапов Г. И. Задачник по теории вероятностей. М., 1986. 2. Большее Л. Н., Смирнов Н.В. Таблицы математической статистики. М., 1983. 3. Боровков А. А. Теория вероятностей. М., 1984. 4. Ван дер Варден Б. Л. Математическая статистика. М., 1960. 5. Виленкин Н. Я. Комбинаторика. М., 1969. 6. Вентцель Е. С. Теория вероятностей. М., 1962. 7. Гихман И. И., Скороход А. В., Ядренко М. И. Теория вероятностей и математическая статистика. Киев, 1979. 8. Гнеденко Б. В. Курс теории вероятностей. М., 1961. 9. Гнеденко Б. В., Хинчин А. Я. Элементарное введение в теорию вероятностей, М., 1982. 10. Гордин М. И., Фролов А. Я. Теория вероятностей в за- дачах и решениях, Математическая статистика в задачах и решениях (учебно-методические пособия). СПбГУ, 1997. 11. Ивченко Г. И., Медведев Ю. И. Математическая ста- тистика. 2-е изд. М., 1992. 12. Крамер Г. Математические методы статистики. 2-е изд. М., 1975. 13. Колмогоров А. Я. Основные понятия теории вероятно- стей. М., 1974. 14. Мешалкин Л. Д. Сборник задач по теории вероятно- стей. М., 1963. 15. Нейман Ю. В. Вводный курс теории вероятностей и математической статистики. М., 1968. 16. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. М., 1973. 17. Свешников А. А. Сборник задач по теории вероятно- стей, математической статистике и теории случайных функ- ций. М., 1965. 18. Севастьянов Б. А. Курс теории вероятностей и мате- матической статистики, М., 1982. 19. Феллер В. Введение в теорию вероятностей и ее при- менения. Т.1, 2. М., 1967.
221 Предметный указатель абсолютный момент 85, 90 --порядка к 93 аксиомы теории вероятнос- тей 43 алгебра 40 сг-алгебра 42 бином Ньютона 11 биномиальные коэффициен- ты 11 вариационный ряд 137 вероятностное пространст- во 43 вероятность 42 - геометрическая 30 - ошибки первого рода 172 — второго рода 172 - события 23 - условная 32, 33, 46 выборочная дисперсия 148 - квантиль порядка р 145 - ковариация 152 - медиана 145 - характеристика 145 выборочное среднее 147 выборочный момент порядка А: 150 - коэффициент корреляции 152 - центральный момент по- рядка А: 150 гамма-функция 175 гистограмма 143 детерминированная величи- на 88 дисперсия 88, 90 доверительная вероятность 159 доверительный интервал 159 задача Банаха 60 закон больших чисел 126 - распределения 70, 72 — совместный 78 индикатор множества 86 информационное количество Фишера 166 исход случайного экспери- мента 15 кардинальное число мно- жества 23 квантиль порядка р 145 ковариация 93 корреляционный момент 93 коэффициент корреляции 93 классическая схема 23 критерий 171 критерий согласия Колмого- рова 172 --Пирсона (хи-квадрат) 175 математическое ожидание 84, 89 медиана 145 метод максимального прав- доподобия 185 множество занумерованное 7 - счетное 7 момент порядка Аг 93 набор 7 наивероятнейшее число нас- туплений события 58 наудачу 24 неравенство Коши-Буняковского 92 - Рао-Крамера 166
222 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ - Чебышева 123 несовместные события 18 независимые случайные ве- личины 79, 81 - события 36 - в совокупности события 36 - эксперименты 56 некоррелированные вели- чины 94 общая формула сложения вероятностей 44 --умножения вероятностей 34, 47 оценка асимптотически нор- мальная 156 --эффективная 169 - инвариантная относитель- но сдвига 146 - максимального правдопо- добия 187, 189 - несмещенная 146 - по методу наименьших квадратов 179 - состоятельная 146 - эффективная 167 перестановки 7 плотность распределения 74 --совместная 82 --эмпирическая 142 полная группа событий 52 попарно независимые собы- тия 36 порядковая статистика 136 правило “За”114 произведение двух событий 17 производящая функция 97 простая линейная регрессия 183 пространство элементарных событий 15 процедура рекуррентного оценивания 192 равномерно распределенная величина 92 размещения 8 разность двух событий 17 распределение 72 - биномиальное 107 - гауссовское 111 - геометрическое 109 - двумерное нормальное 115 - Коши 76 - нормальное 111 - отраженное нормальное 112 - показательное 110 - Пирсона 175 - Пуассона 107 - равномерное 109 - стандартное нормальное 111 - Стьюдента 162 - треугольное 106 реализация случайной величины 69 свертка распределений 116 - функций 119 симметрическая разность двух событий 17 случайная величина 69, 72 --дискретная 70 - выборка объема п 136, 152 случайный вектор 81 - эксперимент 15 случайным образом 24
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 223 событие 15 — дополнительное 17 - достоверное 18 - наступило 16 - невозможное 18 - независимое от другого события 35 - противоположное 17 - содержится 18 сочетания 10 среднее значение 85 статистический критерий 171 статистика 136 - Колмогорова 172 - Пирсона 174 - хи-квадрат 174 сумма двух событий 17 схема Бернулли 56 сходимость в среднем квад- ратичном 125 - по вероятности 125 - с вероятностью единица 125 теорема Гливенко 140 - интегральная Муавра- Лапласа 65 - Колмогорова 142 - локальная Муавра-Лап- ласа 63 - Пирсона 175 - Пуассона 62 треугольник Паскаля 12 уравнение максимального правдоподобия 186, 188 - линейной регрессии 184 уровень значимости крите- рия 172 формула Байеса 53 - Бернулли 56 - обращения 102 - полной вероятности 52 - Стирлинга 12 - сложения вероятностей 26, 44 -- условных вероятностей 34, 47 - умножения вероятностей 34, 47 - Эйлера 105 функция Гаусса 66 - Лапласа 66 - множеств 42 - правдоподобия 185, 188 - распределения 72 --Колмогорова 142 --случайного вектора 81 --совместная 80 --эмпирическая 138 характеристическая функ- ция 99 центральная предельная теорема 131 центральный момент порядка к 93 частота появлений события 22 число комбинаций 13 - перестановок 7 - размещений 9 - сочетаний 10
Андрей Николаевич Бородин ЭЛЕМЕНТАРНЫЙ КУРС ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ Генеральный директор А. Л. Кноп Директор издательства О. В. Смирнова Главный редактор Ю. А. Сандулов Оригинал-макет А. Н. Бородин ЛР № 065466 от 21.10.97 Гигиенический сертификат 78.10.07.952.Т.11666.01.99 от 19.01.99 выдан ЦГСЭН в СПб Издательство «ЛАНЬ»» Санкт-Петербург, пр. Обуховской обороны, 277» для писем: 193029, Санкт-Петербург, пр. Елизарова, 1. Тел. 265-0088, 567-5493,267-1368, 262-2495,267-2792, 262-1178. Факс 267-1368 e-mail: lan@lpbl.spb.ru, root@lanpbl.spb.ru pbl@lpbl.spb.ru (издательский отдел) trade@lpbl.spb.ru (торговый отдел) post@lpbl.spb.ru (книга почтой) Сдано в набор 20.12.08. Подписано в печать 16.02.09. Бумага офсетная. Формат 84X1081/8а. Гарнитура Школьная. Печать высокая. Печ. л. 3,0. Тираж 8000 экз. Заказ № 659. Отпечатано с фотоформ в ГПП «Печатный Двор» Государственного комитета РФ по печати. 197110» Санкт-Петербург, Чкаловский пр., 16.