Text
                    Теория вероятностей
и математическая
статистика
в задачах
3-е издание, исправленное
Допущено Министерством образования
Российской Федерации
в качестве учебного пособия
для студентов высших учебных заведений,
обучающихся по направлению
подготовки 657100 «Прикладная математика»
d ρ ο φ α
Москва 2005


УДК 519.2(075.8) ББК 22.17я73 ТЗЗ Авторы: В. А. Ватутин, Г. И. Ивченко, Ю. И. Медведев, В. П. Чистяков Рецензенты: кафедра прикладной математики Государственного университета управления им. Серго Орджоникидзе (ГУУ) (зав. кафедрой прикладной математики ГУУ д-р эконом, наук, проф. В. А. Колемаев); д-р физ.-мат. наук В. Г.Михайлов (Математический институт им. В. А. Стеклова РАН) Теория вероятностей и математическая статистика в за- ТЗЗ дачах : учеб. пособие для вузов / В. А. Ватутин, Г. И. Ивченко, Ю. И. Медведев и др. — 3-е изд., испр. — М. : Дрофа, 2005. — 315, [5] с. : ил. ISBN 5-7107-8917-8 Материал пособия соответствует программе курса по теории вероятностей и математической статистике для студентов высших учебных заведений и отвечает современному уровню этих дисциплин. Изложение ведется последовательно в соответствии с рядом основных вероятностных моделей, причем различные главы можно использовать практически изолированно. Такой подход позволяет задавать в данной модели вероятность в явном виде, не излагая аксиоматические основы теории вероятностей. Для каждой модели приведены краткие теоретические сведения, примеры решения задач и задачи для самостоятельного решения. Среди прикладных задач имеются задачи по теории страхования и экономике. Для студентов, преподавателей вузов и всех, кто хочет быстро научиться решать стандартные задачи по курсу теории вероятностей и математической статистике. УДК 519.2(075.8) ББК 22.17я73 © ООО «Дрофа», 2003 ISBN 5-7107-8917-8 © ООО «Дрофа», 2005, с изменениями
ПРЕДИСЛОВИЕ На сегодняшний день вузы, в которых теория вероятностей изучается систематически и рассматривается как строгая математическая дисциплина, достаточно хорошо обеспечены соответствующими учебными пособиями и учебниками. Однако для целого ряда институтов и университетов фундаментальное изучение теории вероятностей нецелесообразно, поскольку их выпускники по роду своей прикладной деятельности лишь изредка встречаются с ситуациями, требующими решения вероятностных задач. Более того, решение такого рода задач весьма часто сводится к применению простейших вероятностных утверждений. В этих вузах систематическое изучение теории вероятностей и математической статистики разумно заменить ознакомлением с основными понятиями этих дисциплин. Цель книги — помочь студентам и аспирантам технических и естественных специальностей овладеть приемами и методами теории вероятностей и математической статистики, необходимыми для решения различных современных практических задач, которые возникают не только у математиков, но и у инженеров, экономистов, биологов, специалистов в области финансовой деятельности, медицины. Авторы стремились изложить материал так, чтобы он был доступен читателям с минимальным объемом знаний по высшей математике. Из приведенных в списке литературы учебных пособий учебник [3] является в некотором смысле «предельным»: попытки дальнейшего существенного упрощения и сокращения материала приведут к потере структурной стройности теоретического курса теории вероятностей. И все же вряд ли можно рекомендовать эту книгу для ознакомления с теорией вероятностей, поскольку теоретические основы предложенного в ней курса требуют определенной математической подготовки. Перед преподавателем, ведущим занятия по теории вероятностей и математической статистике, возникает дилемма: с одной сто- 3
роны, необходимо ознакомить студента с основными идеями теории вероятностей, с другой — временные рамки не позволяют сделать это на строгом математическом уровне. Такая же ситуация возникала в период бурного количественного роста ЭВМ. Пользователей не интересовали тонкости используемых языков и трансляторов. Хотелось «сегодня», в крайнем случае «завтра», научиться программировать и решать свои простейшие задачи. Авторы пособий по программированию, идя навстречу велениям времени и желаниям массового читателя, решили эту проблему весьма успешно: многие пособия начинались сразу с объяснения работы простейших программ без каких-нибудь предварительных разъяснений. Аналогичные требования (сразу научиться решать задачи) предъявляют многие читатели («потребители») к книгам по теории вероятностей и математической статистике. Авторы данного учебного пособия надеются, что им удалось найти способ удовлетворить их интересы. Теория вероятностей излагается достаточно изолированно по основным простейшим вероятностным моделям. Этот способ имеет ряд преимуществ: явное задание вероятности в конкретной модели позволяет исключить общее аксиоматическое изложение; удобно обсуждать применимость рассматриваемой модели в реальных условиях; легко использовать многочисленные формулы в конкретных повторяющихся условиях. Пособие состоит из небольших глав, каждая из которых начинается с конспективного изложения теоретических сведений, необходимых при решении задач данного раздела; приводятся примеры решения задач; формулируются задачи для самостоятельного решения. При изложении теоретических сведений некоторые понятия не определяются. Однако близость вероятностной терминологии, повседневно используемой, не приведет к существенным затруднениям при применении конкретных формул в простейших случаях. Желающие уточнить те или иные понятия могут обратиться к учебным пособиям ([3 ], [5], [9]), которые хорошо согласованы с данным и содержат более полное изложение теории. Предлагаемое пособие может быть использовано: 1) в качестве задачника или методического пособия по решению задач для всех вузов; 2) как основа для построения ознакомительного курса по теории вероятностей и математической статистике; 3) для самостоятельного изучения теории вероятностей и математической статистики; 4) как базис (в сочетании с пособиями [3], [5], [9]) теоретического курса.
ВВЕДЕНИЕ До возникновения теории вероятностей объектом исследования науки были явления или опыты, при анализе которых неявно предполагалось, что внешние условия практически однозначно определяют результат наблюдения или эксперимента. Однако для широкого круга явлений наблюдается неоднозначность исхода опыта при сохранении основных условий его проведения. При подбрасывании монеты нельзя предсказать, какой стороной она упадет. Траектории полета снарядов при сохранении основных условий стрельбы не будут одинаковы из-за незначительных колебаний начальной скорости, веса снаряда, состояния атмосферы и т. д. Воздействие очень большого числа разнообразных причин, каждая из которых в отдельности не может заметно повлиять на исход эксперимента, приводит к тому, что этот исход не определяется однозначно. В этом случае говорят, что результат или исход опыта случаен. Случайность исходов испытаний или опытов приходится учитывать при исследованиях, относящихся к различным областям науки и техники (физика, биология, демография, здравоохранение, массовое производство и т. п.). В качестве величины, характеризующей возможность появления случайного события, используется его вероятность. Экспериментально установлено, что с ростом числа опытов п, проводимых в практически одинаковых условиях, частота появления случайного события А (отношение числа опытов пА, в которых появилось событие А, к общему числу опытов η) становится почти постоянной и сближается с некоторым числом, которое можно было бы принять за определение вероятности события А. Однако найденную таким способом частоту нельзя принять за математическое определение вероятности. Для теоретических исследований случайных явлений нужна их математическая модель. Многообразие и сложность задач, встречающихся в приложениях, требуют четкого определения понятий, связанных с явлениями, исходы которых случайны. 5
В математической модели случайных явлений вероятность рассматривается как функция случайного события. Свойства этой функции должны соответствовать свойствам частоты событий в соответствующих сериях испытаний. Общий аксиоматический подход к построению теории вероятностей был предложен А. Н. Колмогоровым в книге «Основные понятия теории вероятностей», которая впервые была издана на немецком языке в 1933 г. В данной книге не излагается общий аксиоматический подход по причинам, указанным в предисловии. Однако он сохранен в каждой отобранной вероятностной модели. Эти модели описывают достаточно широкий круг случайных явлений, часто возникающих в приложениях. Теория вероятностей является разделом математики, в котором по заданным вероятностям одних случайных событий находят вероятности других событий, связанных каким-либо образом с первыми. Первые работы, в которых зарождались основные понятия теории вероятностей, представляли собой попытки создания теории азартных игр (Д. Кардано, X. Гюйгенс, Б. Паскаль, П. Ферма и др. bXVI-XVIIbb.). Первая теорема, получившая название «закон больших чисел» и давшая начало целой серии «предельных теорем» теории вероятностей, была доказана Якобом Бернулли (1654—1705). Затем теория вероятностей развивалась в работах А. Муавра, П. Лапласа, К. Гаусса, С. Пуассона, а также в работах русских математиков П. Л. Чебышёва, А. А. Маркова, А. М. Ляпунова и С. Н. Бернштей- на и окончательно оформилась как математическая наука в работах российских математиков А. Н. Колмогорова, А. Я. Хинчина, Б. В. Гнеденко и их учеников.
КЛАССИЧЕСКАЯ ВЕРОЯТНОСТНАЯ МОДЕЛЬ Глава 1.1/ Определение вероятности. События Классическая вероятностная модель используется для описания опытов с конечным числом взаимно исключающих возможных исходов. При этом предполагается, что исходы опыта случайны и равновероятны по тем или иным соображениям (практический опыт, симметричность исходов, невозможность отдать предпочтение одним исходам перед другими и т.п.). Такие ситуации часто возникают в различных играх: домино, лото, карточные игры, бросание игральных костей и т. д. При организации лотерей, отборе контрольной выборки из партии изделий равновероятность организуется специально. Пусть результаты опыта описываются S взаимно исключающими исходами ω1? ω2, ..., <%. Эти исходы называют также элементарными событиями. Множество Ω = {ω1?..., ω^} всех таких исходов называют множеством элементарных событий. Любое случайное событие А, связанное с данным опытом, может быть задано перечислением всех элементарных событий, при которых оно происходит. Пусть, например, А — это выпадение четного числа очков при бросании игральной кости. Тогда А можно задать перечислением благоприятствующих ему элементарных событий: выпало либо 2 очка, либо 4 очка, либо 6 очков. Событие Ω, состоящее из всех возможных исходов, называют достоверным. В дальнейшем будем обозначать через \А | число элементарных событий, входящих в А. Если событию А благоприятствуют К элементарных исходов, то вероятность Ρ(ν4) события А в классической вероятностной модели определяется формулой р(Л) = ЙН· (1.1) При решении задач необходимо сначала описать множество элементарных событий Ω = {ω1? ..., со$); найти число S = |Ω|; найти число К = \А\ элементарных событий, благоприятствующих А, и воспользоваться формулой (1.1). 7
1.1. Брошены две одинаковые монеты. Найти вероятность того, что монеты выпали разными сторонами. РЕШЕНИЕ. Возможны четыре исхода: на первой и на второй монете выпал «герб» (обозначим этот элементарный исход ГГ); на первой монете — «герб», на второй — решетка (обозначим исход ГР); два других исхода обозначим соответственно Ρ Г и PP. Таким образом, множество элементарных событий Ω = {Г Г, ГР, Ρ Γ, ΡΡ] и S= |Ω| = 4. Событие А = {монеты выпали разными сторонами} происходит в двух случаях ГР или Ρ Г, т. е. А = {ГР, РГ} и К = \А \ = 2. По формуле (1.1) находим Ρ (А) = 2/4 = 1/2. 1.2. Брошены три монеты. Описать множество всех элементарных событий. Найти вероятности следующих событий: а) А = {не выпало ни одного «герба»}; б) В = {выпало четное число «гербов»}; в) С = {на третьей монете выпал «герб»}. Ответ: Р(А) = 1/8, Р(В) = Р(С) = 1/2. 1.3. Из двух претендентов £и1на ответственную должность три члена комиссии должны отобрать одного. Каждый член комиссии должен указать либо одного достойного, либо забраковать обоих. Претендент считается выбранным, если он был признан достойным хотя бы двумя членами комиссии. Найти вероятности событий: А = {рекомендован L}, В = {рекомендован Е). РЕШЕНИЕ. Каждый член комиссии принимает одно из трех решений: Ε — рекомендовать претендента Е, L — рекомендовать претендента L; О — никого не рекомендовать. Решение комиссии можно записать тройками, составленными из этих символов: ЕЕ Ε — все члены комиссии рекомендовали претендента Е; OLE — первый член комиссии никого не рекомендовал, второй рекомендовал L, а третий член комиссии рекомендовал £ит.д. Тогда множество элементарных событий состоит из всех возможных троек: Ω = {Ε ЕЕ, LEE, О ЕЕ,...}. Общее число элементарных событий |Ω| нетрудно найти. Первое место тройки заполняется тремя способами. Первые два места заполняются девятью способами, так как каждое из трех заполнений первого места можно продолжить тремя способами заполнения второго места. Наконец, любое из девяти заполнений первых двух мест продолжается любым из трех способов заполнения третьего места. Таким образом, |Ω| = 9 · 3 = 27. 8
Событие А происходит либо в случае, когда все члены комиссии рекомендовали L, либо когда ровно один член комиссии не рекомендовал L. Событие А выражается через элементарные события следующим образом: А = {LLL, LLE, LLO, LEL, LOL, ELL, OLL). Таким образом, \А\ = 7 и по формуле (1.1) Элементарные события, составляющие В, получатся, очевидно, если в элементарных событиях, составляющих А, заменить L на Е, аЕяаЕ. Тогда \В\ = 7 и по формуле (1.1) Р{В)~Щ~27' 1.4. Брошены две игральные кости. Описать множество элементарных событий. Найти вероятности следующих событий: А = {выпало две «шестерки»}, В = {сумма выпавших очков не меньше 11}, С = {не выпала ни одна «шестерка»}. Ответ: Р(А) = 1/36, Р(В ) = 3/36 = 1/12, Р(С) = 25/36. \1.2/ Вероятность суммы событий Событие А + В называют суммой событий А и В, если А + В происходит, когда происходит хотя бы одно из событий: А или В. Вероятность суммы А + В равна сумме вероятностей А и В: Р(А + В) = Р(А) + Р(В), (1.2) если события А и В несовместны, т. е. А и В не могут произойти одновременно. В общем случае Р(А+В)=Р(А) +Р(В)-Р(АВ). (1.3) Здесь произведение событий АВ — это событие, состоящее в том, что происходит и событие А, и событие В. Если А и В несовместны, то АВ— невозможное событие. Тогда Ρ {А В) = 0 и из (1.3) следует формула (1.2). Если использовать задание случайных событий посредством перечисления благоприятствующих элементарных событий, то суммой событий А + В нужно назвать событие, состоящее из элементарных событий, каждое из которых входит хотя бы в одно из собы- 9
тий А или В\ произведение А В состоит из элементарных событий, входящих и в А, и в В. Событие А, противоположное событию А; состоит в том, что А не произошло. Формула Р(А) = 1-Р(А) (1.4) полезна в тех случаях, когда вероятность события А вычислить проще, чем вероятность события А. Если среди событий Ах, А2, ..., Ап любые два события несовместны, то Р(АХ + ... + Ап) = Р(АХ) + ... + Р(Ап). (1.5) 1.5. Брошены две игральные кости. Найти вероятность события D = {выпала хотя бы одна «шестерка»}. РЕШЕНИЕ. Первый способ. Элементарным событием является пара чисел (i,j): i — число очков, выпавших на первой кости, j — число очков, выпавших на второй кости. Поскольку при любом значении / (/ = 1,..., 6) числоу может принять любое из шести возможных значений, то каждому фиксированному / соответствует шесть элементарных событий: (/, 1), (/, 2), ... , (/, 6). Таким обра- 30Μ,Ω = {(1,1), (1,2),...,(1,6); (2,1),...,(2, 6); (3,1),...,(6, 6)} и |Ω| = 6-6 = 36. Пусть Ех = {на первой кости выпала «шестерка»}, Ε2 = {на второй кости выпала «шестерка»}. Тогда D = Ех + Ε\. События Ех и Е2 не являются несовместными, так как Ех и Е2 могут произойти одновременно: ЕХЕ2 = {на обеих костях выпала «шестерка»} = (6, 6). Таким образом, ЕХЕ2 происходит при единственном элементарном событии (\ЕХЕ2\ = 1); Ех и Е2 происходят при шести элементарных событиях (|£Ί| = \Е2\ = 6). По формуле (1.1) имеем _\ΕιΕ2\ _ ι Используя эти значения, по формуле (1.3) найдем вероятность бытия D = Ех + Ег: P(Z>) = ¥{ЕХ) + ¥(Е2) - Ϋ(ΕΧΕ2) = 1/6 + 1/6 - 1/36 = 11/36. 10
Второй способ. Заметим, что событие D противоположно событию С: D = С = {не выпала ни одна «шестерка»}. Событие С состоит из всех элементарных событий (/, у), в которых / * 6 и j Φ 6: С = {(/J):/J =1,2, 3,4, 5}. Нетрудно проверить, что |С| = 25. По формуле (1.1) находим р(С) = 1^=25 Г(С) |Ω| 36* Отсюда, используя формулу (1.4), получаем P(D) = 1 - Р(5) = 1 - Р(С) = ι - § = 11. 1.6. В условиях задачи 1.3 найти вероятность события С = {выбор не состоялся}. Ответ: Р(С) = Ц. 1.7. В ящике 10 одинаковых карточек, на которых по одной написаны цифры 0, 1,..., 9. Два раза с возвращением вынимают по одной карточке. Найти вероятности событий: А = {на вынутых карточках появились цифры 0, 0}, В = {на второй карточке появилась цифра 9}, С = {ни на одной вынутой карточке не было цифры 5}, D = {появилась хотя бы одна 1}. Ответ: Р(А) = 0,01, Р(В) = 0,1, Р(С) = 0,81, Ρ(Ζ>) =0,19. 1.8. В телефонном номере три последние цифры стерлись. Считая, что все возможные значения стершихся цифр равновероятны, найти вероятности событий: А = {стерлись различные цифры}, В = {стерлись одинаковые цифры}, С = {среди стершихся цифр хотя бы две совпадают}, D = {среди стершихся цифр хотя бы две различны}. Ответ: Р(А) = 10-9- 8/103 = 0,72, Р(В) = 10/103 = 0,01, Р(С) = = Р(А)= 0,28, P(D)= 0,99. 11
Случайные величины Довольно часто с исходами опыта Ω = {ω1?..., ω5} связывают различные числовые характеристики: суммарное число очков при бросании нескольких игральных костей, число бракованных изделий в обследуемой выборке и т. д. Естественно эти числовые характеристики рассматривать как различные функции от элементарных событий. Принимаемые этими функциями значения зависят от исхода опыта. Если число элементарных событий конечно, то любую функцию от элементарного события, определенную для каждого элементарного события, называют случайной величиной. Обычно случайные величины обозначают заглавными буквами X = Χ(ω). Среди S чисел Χ(ω), со е Ω, могут быть одинаковые. Обозначим через х{9 х2, ..., хп все различные значения функции Χ(ω). Очевидно, η < S= |Ω|. Можно найти вероятность события {X = хк}, к = 1, ... , п. Событие {Х= хк) состоит из всех тех ω из Ω = {ω1? ... , со$), для которых Χ(ω) = хк. Это можно записать так: {Х = хк} = {а>:Х((*)=хк}. Набор вероятностей P{X = xk}=lX |Q|*J|, *=1,...,/! (1.6) называют законом распределения случайной величины X. 1.9. В лотерее имеется 10 билетов, из которых один выигрышный. Размер выигрыша 10 ден. ед.; стоимость билета 1 ден. ед. Найти закон распределения случайной величины X, равной чистому выигрышу участника лотереи, который вытаскивает билет первым. РЕШЕНИЕ. Будем для удобства считать, что билеты занумерованы и что билет с номером 1 — выигрышный. При вытаскивании одного билета может появиться любое из чисел 1, 2, ... , 10. Таким образом, Ω = {1, 2, ..., 10}. Если появляется билет с номером 1, то участник получает 10 ден. ед. и его чистый выигрыш равен 10 ден. ед. — — 1 ден. ед. = 9 ден. ед. В остальных случаях его чистый выигрыш «отрицательный»: 1 ден. ед. Следовательно, Х( 1) = 9 ден. ед.; X(i) = = -1 ден. ед., / = 2,..., 10, т. е. события {Х= 9} и {Х= -1} выражаются через элементарные события следующим образом: {*= 9} = {/:*(/)= 9} = {1}, {ЛГ=-1} = {/:ЛГ(/)=-1} = {2,3,..„ Ю}. 12
По формуле (1.6) находим ρ/κ-οι-!ί£ζϋ!-± ρ/κ- и_1{^=-1}1 _ 9 Г{Л - У} - |Q| - 10 , Г{Л - -1} - |Q| - 10 . 1.10. Из ящика с девятью одинаковыми карточками, на которых по одной написаны цифры 0, 1, ... , 9, два раза с возвращением вынимают по одной карточке. Введем случайные величины: Хх —цифра на первой карточке, Х2 — цифра на второй карточке; X — сумма цифр на вынутых карточках (т. е. X = Хх + Х2). Указать все возможные значения величин Х{9 Х2, X; найти вероятности, соответствующие этим значениям. Найти вероятность события {Х< 2}. РЕШЕНИЕ. Множество Ω = {(/,у): ij = 0, 1, ... ,9} и |Ω| = 100. Элементарное событие (i,j) означает, что на первой карточке появилась цифра / и на второй карточке — цифрау. Величины Х{, Х2, X являются функциями от элементарных событий: Xl=Xl(iJ)=i, X2=X2(iJ)=j, X = X(iJ)=i+j. Случайные величины Хх и Х2 принимают значения из множества 0, 1,..., 9, а множество значенийЛГесть {0, 1,..., 16, 17, 18}. Событие {Хх = /} через элементарные события выражается следующим образом: {^ = /} = {(/,0),(/, 1),...,(/,9)}. По формуле (1.6) находим |{*i = 01 ю ρ{χι = *}= |щ =Wo=0>l0> ' = <U,..·, 9. Рассуждая аналогично, получаем закон распределения Х2\ Р{Х2=/} = 0,10, у = 0, 1,...,9. Событие {X = 0} происходит в единственном случае {X = 0} = = {(0, 0)}, следовательно, Р{Х= 0} = 0,01. Событие {Х= 1} = {(0, 1), (1,0)}, поэтому Р{Х= 1} = 0,02. В общем случае {*=£} = {(0,£),(1,£-1),...,(£-1,1),(£,0)}, 0<£<9; {Х= 9 + /} = {(/, 9), (/ + 1, 8),..., (8, / + 1), (9, /)}, 1 < /< 9, следовательно, Р{ЛГ=£}=(Л:+1)/100, к = 0, 1,... ,9; (1.7) Р{Аг=9 + /} = (10-/)/100, /=1,...,9. 13
Событие {Х< 2} = {(О, 0), (0, 1), (1, 0), (0, 2), (2, 0), (1, 1)} и Р{Х< 2} = 0,06. Событие {Х< 2} можно также представить в виде {Х< 2} = {Х= 0} + {Х= 1} + {Х= 2}, а затем воспользоваться найденным законом распределения величины X (см. формулу (1.7)) и формулой (1.5): Р{Х< 2} = Р{Х = 0} + Р{Х = 1} + Р{Х= 2} = = 0,01 +0,02 + 0,03 = 0,06. 1.11. В опыте, описанном в задаче 1.10, введем случайную величину Z, равную числу четных цифр на вынутых карточках. Величины Zx и Ζ2 определим равенствами: Ζχ = 1, если на первой карточке четная цифра, и Ζχ = 0 — в противном случае; Ζ2 = 1, если на второй карточке четная цифра, и Ζ2 = 0 — в противном случае. Указать возможные значения случайных величин Ζ, Ζχ, Ζν Проверить, что Ζ — Ζχ+ Ζ\. Найти законы распределения Ζλ, Ζ2, Ζ. Ответ: Ρ{Ζ = 0} = 1/4, Ρ{Ζ = 1} = 1/2, Ρ{Ζ = 2} = \; Ρ{Ζ1 = 1} = Ρ{Ζ1 = 0} = Ρ{Ζ2=1} = Ρ{Ζ2 = 0} = ^. 1.12. Брошены две игральные кости. Найти закон распределения случайной величины X, равной сумме выпавших очков. Найти вероятности событий: {Х< 4}, {Х> 4}. Ответ: хк Р{Х = хк} 2 1 36 3 2 36 4 3 36 5 4 36 6 5 36 7 6 36 8 5 36 9 4 36 10 3 36 и 2 36 12 1 36 Р{Х<4}=\, Р{^Г>4) = ^. Математическое ожидание Закон распределения случайной величины позволяет найти вероятность любого события, определенного с помощью случайной величины. Но такая полная информация не всегда необходима. Иногда достаточно знать более простую и наглядную характеристику случайной величины — ее среднее значение или математическое ожидание. Математическое ожидание случайной величины X 14
обозначается символом MX и в классической схеме определяется формулой Если в этой формуле привести подобные члены, т. е. вынести за скобки хк в слагаемых с номерами /, для которых ΛΓ(ω,) = хк, то из формул (1.6) и (1.8) получится формула для вычисления MX: MX=ixkF{X = xk}. (1.9) Отметим, что для вычисления по формуле (1.8) не требуется знание закона распределения случайной величины. Если закон распределения известен, то вычисления по формуле (1.9) могут оказаться более простыми. Пусть теперь X и Υ — любые случайные величины. Из формулы (1.8) непосредственно следует равенство М(Х+ Υ) =ΜΧ+ΜΥ, (1.10) т. е. математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых. Формула (1.10) по индукции распространяется на любое число слагаемых. 1.13. Найти среднее значение выигрыша X, определенного в задаче 1.9. РЕШЕНИЕ. Используя формулу (1.8), находим МХ= 1 1х(1) = 1 (9 + (-1) + ... + (-1)) = 0. По формуле (1.9) вычисления в данном случае более простые МЛГ-9.1 +(-!)·£ =0. Таким образом, средний чистый выигрыш оказался равным нулю. Это естественный результат: 10 участников внесли Юден. ед. и эта сумма была полностью выплачена. Игры с нулевым средним выигрышем называют безобидными. 1.14. Найти математическое ожидание величин Хи Х2, X, определенных в задаче 1.10. 15
РЕШЕНИЕ. Воспользуемся обозначениями, введенными при решении задачи 1.10. По формуле (1.9) имеем ι99 ι99 = шо1о/(Д1) = 1^1./=4'5· Если воспользоваться полученным при решении задачи 1.10 распределением случайной величины Х{, то можно применить формулу (1.9) МЛГ,= Σ /Ρ{Χ = /}=11 Σ / = 4,5. 1 ι=ο ι 10 /=ο Аналогичные выкладки показывают, что МХ2 = 4,5. Для вычисления М^проще всего воспользоваться формулой (1.10) МХ= М(ХХ + Х2) = МХХ + МХ2 = 4,5 + 4,5 = 9. 1.15. Найти ΜΖ случайной величины Ζ, определенной в задаче 1.10 и задаче 1.11. Ответ: ΜΖ = 1. 1.16. Найти математическое ожидание суммы числа очков, выпавших при бросании двух игральных костей. Ответ: 7. 1.17. Найти математическое ожидание суммы числа очков, выпавших при бросании 100 игральных костей. УКАЗАНИЕ. Использовать представление X = Xу + Х2 4- ... + А1(Ю> где Хк — число очков, выпавших на А>й кости. Ответ: 350. 1.18. Продавец тортов оценивает, сколько тортов продается за день. Он знает, что это количество является случайной величиной с законом распределения X Ρ 0 1/16 1 2/16 2 3/16 3 4/16 4 3/16 5 2/16 6 1/16 16
Продавец получает 4,8 ден. ед. прибыли с каждого торта. Если торт не продан в течение дня, то (по санитарным нормам) он должен быть выброшен, при этом продавец теряет 3,20 ден. ед. Продавец желает максимизировать средний дневной доход. Сколько тортов он должен заказывать каждый день? РЕШЕНИЕ. Пусть X— количество тортов, заказанных продавцом в некоторый день, ЛГ е 1, 2, ..., 6; η — количество покупателей, захотевших купить торт. Вычислим ожидаемый средний размер дохода ξ (X) продавца за этот день. Имеем Μξ(Χ) = Σ (4,8/-3,2(ΛΓ-/))Ρ(η = /)+4,8ΑΤ{η>Α7. ι=0 Отсюда находим: Μξ(1) = 4,3 ден. ед., Μξ(2) = 7,6 ден. ед., Μξ(3) = = 18,4 ден. ед., Μξ(4) = 8,8 ден. ед., Μξ(5) = 7,5 ден. ед., Μξ(6) = = 4,8 ден. ед. Таким образом, Х= 3.
ПРОСТЕЙШИЕ ВЕРОЯТНОСТНЫЕ МОДЕЛИ Глава ч2.1у> Условные вероятности Условная вероятность Р{А\В) события А при условии, что произошло событие В, определяется формулой Р(А\В)=Р(АВ)/Р(В). (2.1) Для классической вероятностной модели K.).g,FWi).igi и по формуле (2.1) имеем Г(Л1т-\АВ\/\а\_\АВ\ Условие «событие В произошло» можно понимать как дополнительную информацию о множестве элементарных событий (множество исходов Ω заменяется на множество исходов В). Формула (2.1) приводит к замене равновероятных исходов Ω на равновероятные исходы В. 2.1. Из колоды (36 карт) вынимают последовательно без возвращения две карты. Найти вероятность того, что первой картой была шестерка, а второй — семерка. Найти условную вероятность того же события при условии, что обе карты бубновой масти. РЕШЕНИЕ. Воспользуемся классической схемой. Множество Ω состоит из всех упорядоченных пар различных карт. Поскольку любой из 36 вариантов первой карты может объединиться с любым из 35 вариантов второй карты, то число различных исходов |Ω| = 36 · 35. Определим события^ и В: А = {первая карта — шестерка, вторая — семерка}, В = {обе карты бубновой масти}. Тогда А В = {первая карта — бубновая шестерка, вторая карта — бубновая семерка}. 18
По аналогии с вычислением |Ω| находим \В\ = 9· 8. В событии А шестерка и семерка имеют любую масть, поэтому \А | = 4 · 4. Произведение А В состоит из единственного элементарного исхода, следовательно, \АВ\ = 1. По формуле (1.1) и формуле (2.1) получаем рмип- 1/(36;35) - 1 г^\п> 9-8/(36-35) 72* 2.2. Брошены две игральные кости. Найти условную вероятность того, что выпала хотя бы одна «1», если известно, что сумма очков равна четырем. Ответ: 2/3. Обычно равенство (2.1) используется в форме «теоремы умножения»: Р(АВ)=Р(В)Р(А\В). (2.2) Значение Ρ (А \В) в этом случае задают исходя из дополнительной информации о явлении, и формула (2.2) используется для задания вероятности произведения событий. Если в некотором опыте нас интересуют два события С и D, то возникают следующие четыре исхода: CD = {наступили оба события}, CD — {событие D наступило, а событие С — нет}, CD = {событие С наступило, а событие D — нет}, (2.3) CD — {ни одно событие не наступило}. По формуле (2.2) вероятности событий (2.3) можно записать в следующем виде: P(CD)=P(C)P(D\C), P(CD)=P(C)P(D\C) = (1 -P(C))P(Z>|C), P(CD) =P(C)P(D\C) =P(C)(1 -P(Z>|C)), (2.4) P(CD)=P(C)P(D\C) = (1-P(C))(1-P(Z>|C)). Таким образом, чтобы определить вероятности событий (2.3), достаточно знать вероятности Р(С), P(D\C), P(D\C). Четыре элементарных исхода (2.3) и равенства (2.4) определяют новую вероятностную модель, основанную на дополнительной информации: знание трех указанных вероятностей. Эти вероятности часто могут быть заданы естественным образом. 19
2.3. Изготовленное изделие поступает потребителю, если при проверке оно признано стандартным. Вероятность изготовления бракованного изделия равна 0,2; в результате проверки бракованное изделие ошибочно принимается за стандартное с вероятностью 0,05, а стандартное может быть принято за бракованное с вероятностью 0,01. Найти вероятности событий: А = {потребитель получил стандартное изделие}, В = {потребитель получил бракованное изделие}. РЕШЕНИЕ. Определим события С = {изготовлено стандартное изделие}, D = {при проверке изделие признано стандартным}. По условию Р(С)=0,2, P(Z>|C)=0,05, Р(Д|С)=0,01. События А и В можно представить в таком виде: А = CD, В = CD. По формулам (2.4) получаем Р(А) = P(C)P(D\C) = (1 - 0,2) (1 - 0,01) = 0,792, P(B) = P(C)P(D\C) =0,2-0,05 = 0,01. 2.4. Из урны, содержащей два белых и три черных шара, последовательно извлекают два шара; вынутые шары не возвращаются. Если первый шар оказался черным, то перед вторым извлечением в урну добавляют белый шар. В противном случае состав оставшихся шаров не меняют. Найти вероятности событий: А = {извлечены два белых шара}, В = {извлечены два черных шара}. УКАЗАНИЕ. Пусть событие Сх = {первый шар белый}, событие С2 = {второй шар белый}. Тогда А = С{С2> В = С {С2. Ответ: Р(А ) = 1/10, Р(В) = 6/25. 2.5. Если телефонный разговор длился время /, то вероятность его окончания в интервале (/, t + h) при h —► 0 равна ah + о(h). Найти вероятность того, что разговор продлится больше времени t. РЕШЕНИЕ. Определим следующие события: At = {разговор к моменту t не закончился}, Bt h = {разговор закончится в интервале времени (/, / + Л)}. 20
По условию P(Bt h\At) = ah + о(h). Событие At + h можно записать в виде At + h=AtBth (т. е. разговор не закончится к моменту / + h, если он не закончится к моменту / и не закончится в интервале (/, / + h)). Вероятность события At обозначим P(t): P{t) = P(At). Тогда P(A^h)=P(At)P(Btth\At)=P(At)(l-ah + o(h)) или P(t + h) = P(t) (1 - ah + о(h)). Отсюда ^-^ --«/>(/)+0(1). При Л -* 0 получаем Считая, что Р(0) = 1, находим P(t) = е~ш. Независимость событий Если условная вероятность Р(А\В) события А при условии, что событие В произошло, совпадает с безусловной вероятностью Ρ (А), то факт такого совпадения можно интерпретировать более наглядно: наступление события В не влияет на наступление события А; естественно считать, что в случае Р(А\В)=Р(А) (2.5) событие А не зависит от В. Если Р(В\А)=Р(В), (2.6) то В не зависит от А. Нетрудно проверить, что из (2.5) следует (2.6), а (2.6) следует из (2.5). Таким образом, понятие независимости взаимно. За определение независимости событий А и В принимается более симметричное условие: события А и В независимы, если Р{АВ) = Р{А)Р(В). (2.7) Из этого равенства следует любое из равенств: (2.5), (2.6). Если вероятностная модель уже задана, то (2.7) можно использовать для проверки независимости событий. Чаще формулу (2.7) используют при построении новой вероятностной модели, основанной на дополнительной информации о независимости соответствующих реальных событий. Если в некотором опыте нас интересуют события С и D, то естественно возникают четыре исхода, приведенные в §2.1 (см. форму- 21
лу (2.3)). Можно показать, что из независимости событий С и D следует независимость событий в любой из трех других пар: С, D; С, D; С, D. Тогда для этих четырех пар должны выполняться равенства P(CD) = P(C)P(D), P(CD) = Р(С)P(D), Р(СД) = P(C)P(D), Р(СЛ) = Р(С)Р(Л). Четыре элементарных исхода (2.3), равенства (2.8) « вероятности Р(С), P(Z>) определяют вероятностную модель, основанную на дополнительной информации о независимости событий. 2.6. Куплены два изделия, изготовленные на разных заводах. На первом заводе брак среди поступивших в продажу изделий составляет 2%, а на втором — 5%. Найти вероятности событий: А0 = {оба изделия бракованные}, А = {хотя бы одно изделие стандартное}, A j = {ровно одно изделие бракованное}. РЕШЕНИЕ. Определим события С = {купленное изделие первого завода бракованное}, D = {купленное изделие второго завода бракованное}. Естественно предположить, что события С и D независимы и что Р(С) = 0,02, P(D) = 0,05. Так как>40 = CD, то P(v40) = Р(С), P(Z>) = 0,02-0,05 = 0,001. Событие Ах происходит в двух случаях: 1) изделие первого завода бракованное, а второго завода — стандартное; 2) изделие первого завода стандартное, а второго завода — бракованное. Таким образом, А х = CD + CD. Отсюда Р(А х) = P(CD) + + Ρ (CD), так как события CD nCD несовместны. Используя независимость событий, находим P(CD) = Р(С)Р(D) = 0,02 · (1 - 0,05) = 0,02 · 0,95 = 0,0190, P(CD) = P(C)P(D) = (1 - 0,02) · 0,05 = 0,98 · 0,05 = 0,0490, следовательно, Ρ (А {) = 0,0190 + 0,0490 = 0,0680. Заметим теперь, что>4 = А0 и Ρ (А) = 1 — Р(>40) = 0,999. 2.7. Два стрелка делают по одному выстрелу, каждый по своей цели. Вероятность поражения цели первым стрелком равна 0,7, а вторым 0,9. Найти вероятности событий: А = {обе цели поражены}, В = {ни одна из целей не поражена}, С = {первая цель поражена, а вторая — нет}. Ответ: Р(А) = 0,63, Р(В) = 0,03, Р(С) = 0,07. 22
2.8. Электрическая цепь состоит из двух последовательно соединенных элементов. Вероятность отказа одного из элементов за год равна 0,2, а второго 0,7. При отказе элемента цепь в месте его включения разрывается. Найти вероятность того, что за год цепь не будет разорвана. Ответ: 0,24. 2.9. Решить задачу 2.8, если элементы включены в цепь параллельно. Ответ: 1 -0,2-0,7 = 0,86. 2.10. Вероятность аварии на первом объекте за рассматриваемый период равна/?!, а на втором — р2. Найти вероятность следующих событий: 1) ни на одном объекте аварии не было; 2) авария произошла ровно на одном объекте. Ответ: 1) (1 -рх){\ -р2)\ 2)рх{\-р2) +р2{\ -рх).
ВЕРОЯТНОСТНЫЕ МОДЕЛИ С УСРЕДНЕНИЕМ ВЕРОЯТНОСТЕЙ I л а в а \3.V> Формула полной вероятности Если события Вх, В2,..., Вп попарно несовместны {B;Bj = = 0 — невозможное событие при любых / Ф]) и их сумма является достоверным событием {Вх + ... + Вп = Ω), то Р{А) = Σ Ρ(^)Ρ(^|^). (3.1) Эту формулу называют формулой полной вероятности. Более наглядно эти условия означают, что среди событий В{, ..., Вп может наступить ровно одно и какое-нибудь из них обязательно наступит. Формулу (3.1) можно рассматривать как еще одну модель, определяющую вероятность: если β каждом из η случаев {или гипотез) известно, как вычислить вероятность любого события А {известны условные вероятности Р{А\Вк)), то, зная вероятности случаев {или гипотез) Вк, по формуле (3.1) можно вычислить вероятность события А. Таким образом, условные вероятности при различных гипотезах усредняются с весами, равными вероятностям этих гипотез. 3.1. Среди четырех неразличимых по внешнему виду урн три урны имеют одинаковый состав шаров — два белых и один черный, а в четвертой урне — один белый и один черный шар. Из случайно выбранной урны наудачу вынимают шар. Найти вероятность того, что этот шар — белый. РЕШЕНИЕ. В качестве гипотез можно выбрать состав шаров выбранной урны: Вх = {в выбранной урне два белых и один черный шар}, В2 = {в выбранной урне один белый и один черный шар}. Обозначим через А интересующее нас событие А = {вынут белый шар}. з 24
Условные вероятности события А при условии, что известен состав шаров выбранной урны, можно вычислить при каждом условии по своей классической схеме Р(А\В1)=2/3, Р(А\В2) = 1/2. Вероятности событий Вх и В2, связанных с выбором урны, можно также определить по соответствующей классической схеме Р(^)=3/4, Р(2?2) = 1/4. Вероятность события А теперь можно вычислить по формуле полной вероятности (3.1) Р(А) = PWPM \ВХ) + Р(В2)Р(А \В2) = = 3/4-2/3+1/4-1/2 = 5/8. Таким образом, в определении вероятности участвовали три разные классические схемы: две из них усреднялись по третьей. 3.2. В продажу поступила партия запасных деталей, произведенных на двух станках. Известно, что 70% продукции произведено на первом станке. Среди деталей, произведенных на первом станке, 4% бракованных, среди деталей, произведенных на втором станке, 1% бракованных. Найти вероятность того, что купленная деталь оказалась бракованной. Ответ: 0,031. 3.3. В ящике три билета, среди которых лишь один выигрышный. Найти вероятность того, что выбранный билет окажется выигрышным. Ответ: 1/3. 3.4. Решить задачу 3.3, если перед извлечением один билет (неизвестно какой) был утерян. УКАЗАНИЕ. Воспользоваться событиями: Вх = {утерян выигрышный билет}, В2 = {утерян невыигрышный билет}. Ответ: 1/3. 3.5. Безаварийная работа объекта обеспечивается тремя контролирующими его работу системами. Вероятности того, что первым отказом будет отказ первой, второй, третьей систем, равны соответственно 1/2, 1/3, 1/6. В каждом из этих случаев может произойти 25
авария с вероятностями, равными соответственно 0,04, 0,03, 0,012. Найти вероятность аварии при первом отказе какой-нибудь контролирующей системы. Ответ: 0,032. 3.2/ Формулы Байеса В предположениях, при которых была приведена в §3.1 формула полной вероятности, можно получить формулы Байеса: Р{Вк)Р{А\Вк) Р(Вк\А) = / к) К к , к =1,2, ...,л. (3.2) ΣΡ(2*,)ρμι*/) /= 1 Согласно распространенной интерпретации этой формулы вероятности Р(Вк) называют априорными (известными до результатов опыта, в котором может наступить событие А), г.Р{Вк\А) — апостериорными (переоцененными в результате наступления события А). Типичным примером использования этой формулы являются ее применения в задачах «распознавания образов». 3.6. В условиях задачи 3.1 найти вероятность того, что была выбрана урна с составом шаров «два белых, один черный», если известно, что вынутый шар оказался белым. РЕШЕНИЕ. Воспользуемся обозначениями, введенными в решении задачи 3.1. Нужно определить вероятность Р(В{\А). По формуле (3.2) находим Р(В \А) = P(*i)PH*i) = 3/4-2/3 = *4^iHU Р(ВХ)Р(А\ВХ) + Р(В2)Р(А\В2) 3/4-2/3 + 1/4· 1/2 VJ' 3.7. В некотором вузе 75% юношей и 25% девушек. Среди юношей курящих 20%, а среди девушек 10%. Наудачу выбранное лицо оказалось курящим. Какова вероятность того, что это юноша? УКАЗАНИЕ. Воспользоваться следующими обозначениями событий: А = {выбранное лицо оказалось курящим}, Вх = {выбранное лицо — юноша}, В2 = {выбранное лицо — девушка}. Ответ: Р(В1\А)=6/7. 26
3.8. По каналу связи может быть передана одна из трех последовательностей букв AAA, В В В, ССС с равными вероятностями. При передаче каждая буква независимо от остальных принимается правильно с вероятностью 0,8 и ошибочно за каждую из двух других с вероятностями 0,1. Найти вероятность того, что было передано AAA, если принято ВАА. УКАЗАНИЕ. Использовать формулы Байеса и воспользоваться тем, что для независимых событий (искажения или неискажения различных букв) вероятность произведения событий равна произведению вероятностей (см. формулу (2.7)). Проверить, что Р(ВАА \ААА ) = 0,1 · 0,8 · 0,8, Ρ (ВАЛ \ВВВ) = 0,8 · 0,1 · 0,1, Р{ВАА\ССС) =0,1-0,1-0,1. Ответ: 64/73. 3.9. Вероятность обнаружения дефекта в дефектном изделии равна 0,8. Вероятность принять стандартное изделие за дефектное равна 0,05. Известно, что доля дефектных изделий равна 0,05. Найти условную вероятность того, что изделие удовлетворяет стандарту, если оно было признано дефектным. УКАЗАНИЕ. Рассмотреть события: Вх = {изделие дефектное}, В2 = {изделие стандартное}, А = {изделие признано дефектным}. Ответ: 19/35. 3.10. Долговременная практика рекламирования новых видов товаров показала, что после проведения рекламной компании 5% мужчин и 10% женщин хотели бы приобрести новый вид зубной пасты, а остальные покупают прежние виды паст. Числа мужчин и женщин в городе Крепкие Зубы соотносятся как 4 : 6, и все они покупают зубную пасту. Какова вероятность того, что случайно выбранный покупатель, приобретший новый вид пасты, женщина? УКАЗАНИЕ. Применить формулу Байеса. Ответ: 3/4. 27
УРНОВЫЕ СХЕМЫ Глава Вероятность произведения событий Простым обобщением «теоремы умножения» (2.2) является следующая формула: Р(А}А2...Ап) = = Ρ(Αι)Ρ(Α2\Αι)Ρ(Α3\ΑιΑ2)...Ρ(Αη\ΑιΑ2..Λη_ι)· (4.1) Содержательные применения этой формулы связаны с заданием вероятностей элементарных исходов опыта, выраженных через произведения тех или иных событий. Это задание возможно, если условные вероятности в правой части формулы (4.1) могут быть определены из естественных дополнительных предположений. 4.1. В урне три белых и два черных шара. Последовательно без возвращения вынимают три шара. Определить вероятность появления следующей комбинации шаров: белый, белый, черный. РЕШЕНИЕ. Обозначим через Al9 A2, Аъ события, состоящие в появлении белого при первом, втором и третьем извлечениях шаров. Появление черных шаров в соответствующих испытаниях являются противоположными событиями: А{, А2, Ау Элементарный исход, вероятность которого требуется задать по условию, можно представить в виде произведения трех событий А \А2АЪ. По формуле (4.1) имеем P(v4^2^3)=PMl)P(^2Ml)P(^3HH2)· Используя классическое определение вероятности по отношению к первому извлечению шара, находим Ρ {А х) = 3/5. Условную вероятность Р(А2\А1) (второй шар белый, при условии, что первый — белый) можно найти по классическому определению, примененному к урне с измененным составом (первоначальное число шаров уменьшилось на один после удаления белого шара). Тогда Р{А2\Ах) = 2/4 = 1/2. Аналогично находим Р(А3\А1А2)=2/3. Φ 28
Перемножая эти три вероятности, получим окончательный результат Р(А ХА2АЪ) = 3/5 · 2/4 · 2/3 = 1/5. 4.2. Из урны, содержащей три билета (среди них один выигрышный), по одному без возвращения извлекают билеты. Определить вероятность того, что выигрышным будет последний билет. УКАЗАНИЕ. Представить нужное событие в виде произведения трех событий, относящихся к результатам различных извлечений. Ответ: 1/3. 4.3. Из урны, содержащей три черных и два белых шара, два игрока поочередно извлекают шары (без возвращения). Выигрывает игрок, первым вытащивший белый шар. Найти вероятность выигрыша игрока, начавшего игру. УКАЗАНИЕ. Воспользоваться следующим представлением события А = {выиграл игрок, начавший игру}: А = Вх + В \В2В3, где Bi = {ι'-й шар, извлеченный из урны, — белый}, т. е. первый игрок выигрывает в двух взаимно исключающих случаях: сразу извлекает белый шар (событие Вх) или в случае (В ХВ2В3), когда при первом извлечении появляется черный шар (В х), второй игрок тоже вытаскивает черный шар (В2), и при втором подходе первый игрок вытаскивает белый шар (В3). Ответ: 3/5. 4.4. Из первой урны, содержащей два белых и два черных шара, переложили наудачу один шар во вторую урну, в которой сначала было два черных и один белый шар. После этого из второй урны наудачу выбранный шар вернули в первую урну. Найти вероятность того, что состав шаров в первой урне после этих перекладываний не изменится. УКАЗАНИЕ. Определим события: Вх = {из первой урны переложен белый шар}, В2 = {из второй урны вернули белый шар}. Событие А = {состав шаров первой урны не изменится} представить в виде: А = ΒχΒ2 + Β χΒ 2, т. е. состав не меняется, если вынули белый и вернули белый или вынули черный и вернули черный шар. События ВХВ2 и В ХВ2 несовместны. Ответ: 5/8. 29
Две модели случайного выбора Дадим описание вероятностных моделей случайного выбора в терминах «шаров» и «урн». В реальных приложениях «шарами» могут быть детали контролируемой партии изделий, особи биологической популяции, численность которой оценивается, и т. п. Из урны, содержащей N шаров, среди которых Μ белых и N — Μ черных, извлекают по одному η шаров. Если каждый извлеченный шар сразу возвращается обратно, то такую схему выбора называют случайным выбором с возвращением', если ни один извлеченный шар не возвращается, то говорят о случайном выборе без возвращения. Элементарные исходы любого из этих опытов можно описать цепочками длины п, составленными из цветов извлекаемых шаров. Можно также эти исходы представить в виде произведений событий: Ai = {/-й шар белый}, At = {/-й шар черный}. Например, при η = 3 {белый, белый, белый} =А1А2Л3, {белый, черный, белый} =А1А2А3 и т. д. Вероятность любого исхода в каждой из рассматриваемых моделей определяется формулой (4.1), в которой условные вероятности вычисляют по классическому определению, примененному к данному извлечению одного шара из урны, состав которой определился предыдущими извлечениями. Например, в случае выбора без возвращения Р(А4\А1А2А3) = ]у_ з ' так как к четвертому извлечению в урне осталось N — 3 шара и из них Μ белых (извлекались только черные шары); P(A3\AxA2) = jj^-29 P(A5\AlA2A3A4) = ~N_~ ит.д. В случае выбора с возвращением состав шаров в урне не меняется и те же вероятности определяются следующими равенствами: ,-- _ \ ~ _ Μ - , - _ Ν— Μ РкА^А^А^А^ = Ρ(Α3\ΑιΑ2) = -j^, Ρ(Α5\ΑιΑ2Α3Α4) = ^ . Вероятности исходов не изменятся, если их вычислить непосредственно по классической схеме без привлечения формулы (4.1). При решении задач нужно использовать наиболее подходящее в данном случае определение. 30
Каждый исход опыта однозначно определяет число X белых шаров среди η выбранных. Таким образом (см. § 1.3), ЛГявляется случайной величиной. Случайную величину X можно представить в виде суммы более простых величин Χ=Υχ + Υ2 + ...+ Υη, (4.2) где случайная величина Yk (к = 1, ..., п) равна 1, если к-й извлеченный шар белый, и Yk = О — в противном случае. Это представление часто используется при решении задач. 4.5. Из урны, содержащей четыре белых и шесть черных шаров, по схеме выбора без возвращения извлекают три шара. Описать множество элементарных исходов, указать их вероятности. РЕШЕНИЕ. Возможны следующие восемь исходов: ω]=ΑιΑ2Α3 = {все три шара белые}, ω2 = А]А2А3 = {первый шар черный, остальные — белые}, СОо ут. ι /л. y/L о, (Ол ут. 1-/Т. л·^ 7j (0^ ут. ι А 2**. з? СО/: А у/х 2А -з, CU'7 **■ \ **■ γ*· ^ι Я 12 3* По формуле (4.1) находим Ρ(ω,) = P(Al)P(A2\A,)P(A3\AlA2) = 1 -\ · \ = 1, Ρ(ω2) = Р(Л,)Р(Л2|АХ)Р{АЪ\АХА2) = ^ . * . | = ^ и т. д. В результате получим к Ρ(ω^) 1 '/зо 2 3/зо 3 3/зо 4 3/зо 5 5/зо 6 5/зо 7 7зо 8 5/зо 4.6. В опыте, описанном в задаче 4.5, для случайных величин 1, если первый шар белый, Υ = ι 10, если первый шар черный; _ ί 1, если второй шар белый, 2 ~1о, если второй шар черный, найти вероятности: Ρ{Υ] = 1}, Ρ{ΥΧ = 1, Υ2 = 1}, Ρ{Υ{ = 0, Υχ = 1}. 31
УКАЗАНИЕ. Воспользоваться определением случайного выбора без возвращения и равенствами {Yx = \}=AxAYx = \,Y2=\}=AxAb {У, = 0, ¥2=\} = А]А2. Ответ: 4/10, 12/90,24/90. 4.7. В опыте, описанном в задаче 4.5, найти закон распределения случайной величины X, равной числу белых шаров среди выбранных. УКАЗАНИЕ. Воспользоваться решением задачи4.5. Для вычисления Р{Х = т) сложить вероятности исходов, в которых было т белых шаров. Например, для вычисления Р{Х= 1} нужно сложить вероятности следующих исходов: ω5 =А ХА2А3, ω6 = АХА2А3, со7 = АуА^Ау Ответ: т Р{Х=т} 0 5/30 1 15/30 2 9/30 3 1/30 4.8. Решить задачу 4.5 для схемы выбора с возвращением. УКАЗАНИЕ. Воспользоваться описанием исходов ωχ, ... , ω8, приведенных в задаче 4.5. Ответ: к Ρ(ω*) 1 43 2 42·6 3 42·6 4 42·6 5 4·62 6 4·62 7 4·62 8 63 4.9. Решить задачу 4.6 для схемы выбора с возвращением. Ответ: Ρ{^ = 1} = 4/10, Ρ{^ = 1, Υ2 = 1} = (4/10)2, Ρ{Υ{ = 0, У2= 1} = 4/10-6/10. 4.10. Решить задачу 4.7 для схемы выбора с возвращением. Ответ: т ?{Х=т) 0 (6/3)3 1 3-4-62/Ю2 2 3·42·6/103 3 (4/10)3 32
4.11. В общей схеме случайного выбора без возвращения определить закон распределения числа X белых шаров среди η выбранных. РЕШЕНИЕ. Из определения случайного выбора без возвращения следует, что вероятности любого элементарного исхода, содержащего т белых шаров, одинаковы и равны Μ {М- 1)... {М-т + \){Ν-Μ){Ν- М- 1) ... (Ν - η + т + 1) Ν(Ν- 1)... (Ν-η + Ι) Воспользовавшись обозначениями обобщенной степени к^т^=к(к-\)...(к-т + 1), вероятность исхода с т белыми шарами перепишем в следующем виде: Μί™}(Ν - Μ) ί" -т1/№п]. Для вычисления вероятности события {X = т) нужно сложить одинаковые вероятности всех исходов с т белыми шарами. Число таких исходов равно числу способов расположений т белых шаров среди η мест цепочек, описывающих элементарные исходы, а это — число сочетаний С™ из η элементов пот. Таким образом, в случае выбора без возвращения Р{Х=т}=С?М ^т^ . (4.3) Эту формулу можно также записать в следующем виде: /^п г^п — т Р{Х= т) = м"-м, т = О, 1,..., min (Μ, η). (4.4) 4.12. В общей схеме случайного выбора с возвращением определить закон распределения числа X белых шаров среди η выбранных. УКАЗАНИЕ. Решение аналогично решению задачи4.11. Воспользоваться тем, что вероятность любого исхода, содержащего т белых ша- 'M\m(N- М\п~т ров, равна (^ J [—χ- J Ответ: В случае выбора с возвращением М\т (N-M\n-m Р{ЛГ=т} = с;(£) (^V^)" >™=<U, ....л. (4.5) 2 - 1605 Ватутин 33
4.13. Из ящика, содержащего 20 теннисных мячей (12 новых и 8 старых), пятеро спортсменов взяли по одному мячу. Найти вероятности событий: 1) среди отобранных мячей нет новых; 2) среди отобранных ровно два новых; 3) все отобранные мячи новые. РЕШЕНИЕ. Воспользуемся формулой (4.4). Выбор без возвращения производится из общего числа N = 20 мячей; число новых мячей Μ = 12; отбирается η = 5 мячей. Все три события, вероятности которых надо найти, совпадают соответственно со следующими событиями: 1) {Х=0}; 2) {Х=2}; 3) {Х = 5}, где X— число новых мячей. Таким образом, 12 8 7 ^ 12 8 77 F{X= 0} = ~с|Г = i^' Р{Х= 2} = ~с|Г = ш' w-»-^-'-£- 4.14. В группе из 28 учащихся четверть родились летом. Наудачу отбирают четверых учащихся. Найти вероятности следующих событий: 1) среди отобранных двое родились летом; 2) среди отобранных хотя бы один родился летом. УКАЗАНИЕ. В п. 2) найти сначала вероятность противоположного события и воспользоваться формулой (1.4). Ответ: 1) 42/195; 2) 46/65. 4.15. Группу из 2п юношей и 2п девушек наудачу разделили на две части. Найти вероятность того, что в каждой части юношей и девушек поровну. Ответ: (СЦН)УСЦ[. 4.16. В общей схеме случайного выбора без возвращения для случайных величин _ [ 1, если к-й шар белый, * — 10, если к-й шар черный, определить вероятности P{Yk= 1} и P{Yt = 1, Yj= l}. РЕШЕНИЕ. Удобнее воспользоваться классическим определением. Пусть все шары занумерованы. Элементарным исходом является упорядоченный набор η различных номеров, выбираемых из 34
N номеров шаров, т. е. элементарные исходы — это размещения из N элементов по п, следовательно, их число |Ω| = Aft = N(N - 1)... ...(N-n + I) = N[nK Найдем число благоприятных исходов для события {Yk = 1} = {Аг-й шар белый}. В цепочке из η номеров, описывающих исход опыта, Аг-е место должно соответствовать белому шару, следовательно, его можно заполнить Μ способами (номер любого белого шара). При любом из этих заполнений остальные η — 1 мест можно произвольно заполнить N — 1 оставшимися номерами шаров. Это можно сделать (Ν - Ι)!"-1! способами. Общее число способов равно \{Yk=l}\ = M-(N-\)l»-ll По формуле (1.2) находим Ρ/ν -П-КГ*=1>1 _Μ{Ν-\)...{Ν-η+\) _М Г{1к ч |Ω| Ν(Ν-\)...(Ν-η+\) Ν' Аналогично вычисляется вероятность P{Yi = 1, Yj = 1}, / *j. Окончательно для схемы выбора без возвращения получаем Р{Г, = 1}= $, Р{¥(= 1, Yj= 1}= j$E§ = jm>i*J· (4·6> 4.17. Решить задачу 4.16 для схемы выбора с возвращением. Ответ: Для схемы выбора с возвращением Р{У*=1}=^; Р{у/=1,уу=1}=^,/^. (4.7) 4.18. При большом числе шаров N по отношению к η различие между схемами выбора с возвращением и без возвращения уменьшается. Найти пределы вероятностей (4.3) и (4.5), когда Μ, Ν—» оо так, что -τν —* ρ (0 < ρ < 1),алит остаются постоянными. Ответ: оба предела одинаковы и равны С™рт{\ — р)п~т. ч4.3/ Более общие модели случайного выбора В § 4.2 рассматривалась модель, в которой при каждом испытании было два возможных исхода: белый или черный шар. Будем теперь предполагать, что в урне N шаров, занумерованных числами 1, 2, ... , N. Извлекается η шаров. В результате η извлечений получим цепочку номеров извлеченных шаров: ω=(/1,/2,...,/ΙΙ). (4.8) 35
Если извлеченный шар обратно не возвращают, то в цепочке (4.8) все /j,..., in различны. Множество всех таких цепочек Ω = {(/Ί,..., /„): ik = 1, 2,..., Ν; ik* //При к */} содержит |Ω| = Ν {Ν — \)...(Ν — я + 1) цепочек. Это множество элементарных событий более общей схемы выбора без возвращения. В случае выбора с возвращением множество элементарных событий Ω состоит из цепочек, в которых числа /1? /2, ..., in могут повторяться Ω = {(/„ /2,..., /„): /* = 1, 2, ...,7V, к = 1,..., л}. (4.9) Тогда множество Ω имеет |Ω | = Νη цепочек. В двух рассмотренных схемах все элементарные события естественно считать равновероятными и вероятность определить по классической схеме. В случае, когда шары с номерами 1, 2, ..., Μ белые, а шары Μ + 1, ..., N — черные, события, выраженные в терминах черных и белых шаров имеют такие же вероятности, как вероятности соответствующих событий, вычисленные в моделях § 4.2. 4.19. Найти вероятность того, что в группе из шести человек ни у кого нет дня рождения в январе и декабре. УКАЗАНИЕ. Использовать схему случайного выбора с возвращением при л =6,Ν= 12. РЕШЕНИЕ. «Шарами» можно считать 12 месяцев года. День рождения соответствует результату извлечения шара в схеме с возвращением. Таким образом, множество Ω состоит из цепочек длины 6, составленных из чисел 1, 2,..., 12. Число таких цепочек |Ω| = 126. Событие А, состоящее в том, что нет дней рождения в январе и декабре, означает, что благоприятны цепочки длины 6, составленные только из 10 чисел 2, 3,..., 10, 11. Число таких цепочек \А \ = 106. Таким образом, по формуле (1.1) находим Ρ(ν4) = 106/126=(5/6)6. Ответ: 0,334897.... 4.20. В задаче 4.19 найти вероятность того, что хотя бы два человека родились в один месяц. УКАЗАНИЕ. Найти вероятность противоположного события, состоящего в том, что все дни рождения приходятся на разные месяцы. Благоприятные этому цепочки длины 6 должны составляться из разных чисел. Ответ: 1 - (12 · 11 · 10 · 9 · 8 · 7)/126 = 0,777199.... 36
4.21. Найти вероятность того, что в группе из 30 человек нет общих дней рождения. УКАЗАНИЕ. Воспользоваться схемой с возвращением в случае η = 30, N=365. Ответ: (1 - 1/365) (1 - 2/365)...(1 - 29/365) =0,29368.... 4.22. В схеме случайного выбора с возвращением обозначим через Хп случайную величину, равную числу появлений среди η шаров шара с номером 1. Найти Р{Хп > 0}. Ответ: 1- (1-1/Ν)".
ВЕРОЯТНОСТНЫЕ МОДЕЛИ С КОНЕЧНЫМ ЧИСЛОМ ИСХОДОВ Определение вероятности. Случайные величины Вероятностная модель с конечным числом исходов обобщает почти1 все рассмотренные в предыдущих главах схемы. Предлагаемое обобщение упрощает введение основных понятий и облегчает построение новых моделей с конечным числом исходов. Пусть множество элементарных событий Ω = {ω} — конечно', {/?(со): 0)еО} — конечный набор чисел {элементарных вероятностей), удовлетворяющих условиям ρ(ω) >0, сое Ω, Σ ρ(ω) = 1. (5.1) сое Ω Любое событие А определяется благоприятствующими ему элементарными исходами со {А подмножество Ω). Вероятность события А равна сумме тех элементарных вероятностей ρ (ω), у которых со входят в А: Ρ(Λ)= Σ »(<*>). (5.2) 0)€Ω Это определение совпадает с определением классической схемы гл. 1, если все элементарные вероятности/?(ω) одинаковы:/?(ω) = = 1/|Ω|. Вероятностная модель с четырьмя исходами из гл. 2 (см. формулы (2.3), (2.4)) также является частным случаем модели с конечным числом исходов. Здесь Ω = {CD, CD, CD, CD}, а вероятности исходов задаются соотнощениями (2.4). Случайной величиной для модели с конечным числом исходов называется любая функция от элементарного события, определенная на всех ω е Ω Очевидно, что число различных значений любой случайной величины не превосходит |Ω|. Пусть χχ, ..., χη (η < |Ω|) — 1 Исключением является гл. 3. Рассматривавшаяся в ней модель может быть получена усреднением вероятностей, определенных для моделей с бесконечным числом исходов. Φ 4Р 38
различные значения случайной величины X. Закон распределения случайной величины X— Х(а>) определяется формулой P{X=xk}= Σ ρ (ω). (5.3) ше {(й:Х((й)=хк} В правой части этого равенства суммируются элементарные вероятности тех исходов ω, при которых Х(со) = хк. Две случайные величины Xи F называются независимыми, если для любых значений (Х;,у(), /= 1,..., п, j= 1,..., т пары (Χ, Υ) выполняется равенство V{X=xl9 Y=yJ} = P{X = xi}P{Y=yJ}. (5.4) Если хотя бы для одной пары (χ., yj) равенство (5.4) не выполняется, то величины зависимы. Формула для вычисления вероятности в левой части (5.4) аналогична (5.3): \>{X=xi,Y=yJ} = Σ ρ(ω). (5.5) J сое {ω:*(ω)=χ,, Κ(ω)=^} Для любого конечного числа случайных величин Х{, Х2, ..., Хг вводят понятие взаимной независимости или просто независимости. Случайные величины Х{, ..., Хг независимы, если для любых значений {хи , ..., xri ) вектора (Х{, ...,ХГ) выполняется равенство Р{ЛГ1 = х1/1,...,ЛГг=хг/г} = Р{ЛГ1 = х1/1}...Р{ЛГг=хг/г}. (5.6) Отсюда следует, что для любой части этих величин выполняются аналогичные соотношения. 5.1. Из урны, содержащей четыре белых и шесть черных шаров, по схеме случайного выбора без возвращения выбирают три шара. Найти распределения вероятностей для каждой из случайных величин _ ί 1, если /-й шар белый, * — 10, если /-й шар черный, /=1,2,3. РЕШЕНИЕ. Воспользуемся решением задачи 4.5. Найдем, например, закон распределения Υ3. Величина Υ3 принимает два значения: О и 1. Событие {Υ3 = 1} происходит при следующих элементарных событиях: ω{ = А]А2А3, со2 = А^А^А^ со3 — АуА^А^ со7 = А^А^Ау Соответствующие элементарные вероятности определяются равенствами ρ(ω{) = 1/30, ρ(ω2) = 3/30, r(co3) = 3/30, r(co7) = 5/30. 39
По формуле (5.3) находим Р{Г3 = 1} =/>(ω,) + />(со2) + />(ω3) +/>(ω7) = 2/5. Отсюда P{F3 = 0} = 1 - 2/5 = 3/5, так как события Y3= I и Y3 = 0 противоположны. Аналогично находим: P{Y2 = U = Ρ{^ι = 1} = 2/5. Таким образом, для любой из трех рассматриваемых случайных величин имеем: Р{Ys=l} = 2/5, Р{Y. = 0} = 3/5, / = 1, 2, 3. 5.2. Являются ли случайные величины Υ]9 Υ2, Υ3, определенные в задаче 5.1, независимыми? УКАЗАНИЕ. Найти вероятность Ρ{ΥΧ = 1, У2 = 1, Уъ = 1}; воспользоваться определением (5.6). Ответ: Случайные величины Yl9 Y2, F33aBHCHMbI· 5.3. Решить задачу 5.1 для схемы выбора с возвращением. Ответ: Р{Г- = 1} = 2/5, P{Yi = 0} = 3/5, / = 1, 2, 3. 5.4. Решить задачу 5.2 для схемы выбора с возвращением. Ответ: Случайные величины Yx, Y2, Y3 независимы. 5.5. Установить, являются ли независимыми случайные величины Yl9 Y2,..., Υη, определенные в § 4.2 для общей схемы случайного выбора без возвращения. УКАЗАНИЕ. Использовать решение задачи 4.17. Ответ: Случайные величины Yx,..., F„ зависимы. 5.6. Решить задачу 5.5 для схемы случайного выбора с возвращением. Ответ: Случайные величины Yx,..., Υη независимы. 5.7. К трем болтам подобраны гайки. При сборке гайки выбирали наудачу. Найти распределение случайной величины X, равной числу гаек, попавших к «своим» болтам. УКАЗАНИЕ. Использовать классическую модель; выписать элементарные события; воспользоваться формулой (5.3). Ответ: к Р{Х=к} 0 2/6 1 3/6 2 0 3 1/6 40
Математическое ожидание Среднее значение, или математическое ожидание случайной величины, для классической схемы было определено формулой (1.8) как среднее арифметическое значений случайной величины, принимаемых при различных равновероятных исходах. В общем (неравновероятном) случае усреднение естественно проводить с различными весами. Математическим ожиданием MX случайной величины X в конечной схеме называется число МХ= Σ Χ(ω)ρ(ω), (5.7) сое Ω где/?(ω) — элементарные вероятности. Предположим, что различных значений х,, ..., хп случайной величины ЛГменьше |Ω|. В этом случае среди Х(а>) в (5.7) есть одинаковые. Если в (5.7) привести подобные члены, то получим следующую формулу: МХ= Σ xkP{X=xk}. (5.8) В случае η = |Ω| формула (5.7) очевидно совпадает с формулой (5.8). Свойства математического ожидания 1°. Математическое ожидание постоянной величины С равно этой величине: МС = С. (5.9) 2°. Постоянный множитель С можно выносить за знак математического ожидания: М(СХ)=СМХ. (5.10) 3°. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий: М(Х + Υ)=ΜΧ+ΜΥ (5.11) 4°. Математическое ожидание произведения независимых {условие независимости существенно) случайных величин X и Υ равно произведению их математических ожиданий: ΜΧΥ=ΜΧ-ΜΥ. (5.12) Свойства 3° и 4° переносятся на любое число случайных величин. 41
5.8. Закон распределения случайной величины X определен таблицей к хк Р{Х=хк} 1 -1 1/2 2 2 1/4 3 3 1/4 Найти MX. УКАЗАНИЕ. Использовать формулу (5.8). Ответ: 3/4. 5.9. Найти математическое ожидание случайной величины X, определенной в задаче 5.7. РЕШЕНИЕ. Занумеруем болты и соответствующие им гайки цифрами 1, 2, 3. Исходы опыта будем обозначать тройками цифр: 1-я цифра— это номер гайки, взятой для первого болта, 2-я цифра — номер гайки для второго болта и 3-я цифра — номер гайки для третьего болта; событие 123 означает, что для каждого болта отобрана своя гайка; 213 = {2-я гайка для первого болта, 1-я — для второго и 3-я — для третьего} и т. д. Таким образом, имеем шесть элементарных событий: Ω = {123, 132,213,231,312,321}. Составим таблицу, определяющую для каждого исхода ω соответствующую элементарную вероятность/?(ω) и значение случайной величины X (ω): ω Ρ(ω) *(ω) 123 1/6 3 132 1/6 1 213 1/6 1 231 1/6 0 312 1/6 0 321 1/6 1 По формуле (5.7) находим МХ = 3 · 1/6 + 1 · 1/6 + 1 · 1/6 + 0 · 1/6 + 0 · 1/6 + 1 · 1/6 = 1. Если воспользоваться законом распределения X, найденным в задаче 5.7, то MX можно найти по формуле (5.8): МХ= 3 · Р{Х= 3} + 1 · Р{Х= 1} + 0 · Р{Х= 0} = = 3-1/6+1-3/6=1. 42
5.10. Из урны, содержащей четыре белых и шесть черных шаров, по схеме случайного выбора без возвращения извлекают три шара. Случайные величины У1? У2, Υ3 определяются равенствами _ ί 1, если /-й шар белый, /— [0, если /-й шар черный. НайтиМУ^МУ^ МУ3. РЕШЕНИЕ. В задаче 5.1 получен закон распределения Yx: P{ Yi = = 1} = 2/5, Ρ{Υ; = 0} = 3/5. Отсюда по формуле (5.8) находим MY{ = 1 · Р{У, = 1} + 0 · Р{У, = 0} = 2/5. Произведение Yx Y2 — новая случайная величина, принимающая тоже два значения 0 и 1. По формуле (5.8) находим, что ΜΥΧΥ2 = = Р{ Υχ Υ2 = 1}. Событие {YxY2=l} происходит при ωι=ΑιΑ2Α3,ω4 = = АХА2А3, определенных в задаче 4.5. Там же подсчитаны элементарные вероятности р{ωχ) = 1/30, />(со4) = 3/30. Таким образом, Ρ{ΥΧΥ2 = 1} =Ρ(ωχ) +/>(ω4) = 2/15, следовательно, ΜΥΧΥ2 = 2/15. Аналогично находим ΜΥΧΥ2Υ3 = Ρ{ΥΧΥ2Υ3 = 1} =ρ(ωχ) = \/30. 5.11. Решить задачу 5.10 для схемы выбора с возвращением. УКАЗАНИЕ. Воспользоваться независимостью величин У,, У2, У3 (см. задачу 5.4) и свойством 4° математического ожидания (формула (5.12)). Ответ: М^ = 2/5, ΜΥ{Υ2 = 4/25, МУ,У2У3 = 8/125. 5.12. Найти математическое ожидание числа белых шаров среди η шаров, отобранных по схеме выбора без возвращения (см. § 4.2). УКАЗАНИЕ. Для числа белых шаровXиспользовать представление в виде суммы (4.2). Воспользоваться обобщением свойства математического ожидания (формула (5.11)). Ответ: ηΜ/Ν. 5.13. Решить задачу 5.12 для схемы выбора с возвращением. Ответ: ηΜ/Ν. 5.14. К η болтам подобраны гайки. При сборке гайки выбирали наудачу. Найти математическое ожидание случайной величины X, равной числу гаек, попавших к «своим» болтам. 43
УКАЗАНИЕ. Представить X в виде Χ=Υι+Υ2 + ...+ Υ„, где У, = 1, если к /-му болту попала своя гайка иУ, = 0-в противном случае. Воспользоваться свойством 3° математического ожидания (формула (5.11)). Ответ: МХ= 1. 5.15. Известно, что MX = 2, MY = 3 и случайные величины Хи Υ независимы. Найти: 1) Μ(3Χ); 2) МЛГГ; 3) М(ЛГ + Υ)\ 4)Μ(3Χ-2Υ). УКАЗАНИЕ. Воспользоваться свойствами2°—4° (формулы (5.10)— (5.12)). Ответ: 1) 6; 2) 6; 3) 5; 4) 0. 5.16. В схеме случайного выбора с возвращением (см. § 4.3) обозначим через \ι0(η, Ν) число непоявившихся номеров шаров. Найти Μμ0(η, Ν). Вычислить lim ^ Μμ0(η, Ν), если η = αΝ (α > 0 — некоторая постоянная). УКАЗАНИЕ. Воспользоваться представлением μ0 (η, Ν) в виде суммы μ0(η,Ν)=Ζ{ + ... + Ζη, где Zk = 1, если шар с к-м номером не появился, Zk = 0 — B противном случае. Использовать также свойство 3° математического ожидания. Ответ: n(\ - ^ 1 ; е~а. Дисперсия. Неравенство Чебышёва Мерой разброса случайной величины относительно своего среднего значения является дисперсия. Дисперсией случайной величины Χ = Χ(ω), ω ε Ω называется число ΌΧ=Μ(Χ-ΜΧ)2, (5.13) т. е. дисперсия равна математическому ожиданию квадрата отклонения случайной величины от своего математического ожидания. Определение (5.13) сохраняется для любой вероятностной модели. Среднеквадратичным отклонением называют JDX. Для вычисления дисперсии можно также использовать формулу ΌΧ= MX2 - (MX)2. (5.14) 44 φ
В конечной схеме, определенной в § 5.1, иногда полезны формулы ΌΧ= Σ (Χ(ω)-ΜΧ)2ρ(ω), Cue Ω или равенства МХ2 = Σ Χ2(ω)ρ(ω), ΌΧ = ^(xk-MX)2P{X = xk), MX>= ±х1Р{Х = хк). (5.15) (5.16) (5.17) (5.18) Все эти соотношения являются следствием формулы (5.7). Свойства дисперсии 1°. Дисперсия постоянной С равна нулю: DC = 0. (5.19) 2°. Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат: O(CX)=C2OX. (5.20) 3°. Дисперсия суммы независимых случайных величин равна сумме дисперсий ЩХ+ Υ)=ΏΧ+ΏΥ. (5.21) Если известна дисперсия, то можно оценить вероятность отклонения случайной величины от своего математического ожидания, воспользовавшись неравенством Чебышёва: при любом ε > 0. \>{\Х-МХ\>г}<^ (5.22) 5.17. Закон распределения случайной величины X определен следующей таблицей: к хк Р{Х = хк} 1 -1 1/8 2 0 3/8 3 1 3/8 4 2 1/8 Найти MX, MX2, ΌΧ. УКАЗАНИЕ. Воспользоваться формулами (5.8), (5.18) и (5.14) или формулами (5.8) и (5.17). Ответ: 1/2, 1,3/4. 45
5.18. Известно, что случайные величины X и Υ независимы, причем ΌΧ= 4, ΌΥ= 3. Найти: 1) Ό(3Χ)\ 2) Ό(-2Υ); 3) Ό(Χ+ Y)\ 4)Ό(Χ- Υ). УКАЗАНИЕ. Воспользоваться свойствами 2° и 3° (формулы (5.20), (5.21)). Обратить внимание на формулу (5.20) для отрицательных С: Б(-2Г) = (-2)2D^ D(JT- Y) = ΌΧ + DK Ответ: 1) 36; 2) 12; 3)7; 4) 7. 5.19. Из урны, содержащей четыре белых и шесть черных шаров по схеме случайного выбора без возвращения извлекают три шара. Найти дисперсию числа X белых шаров среди выбранных. УКАЗАНИЕ. Воспользоваться формулами (5.18) и (5.14) или (5.16) и (5.14), а также решениями задач 4.7 или 4.5. Ответ: 14/25. 5.20. Решить задачу 5.19 в случае выбора с возвращением. УКАЗАНИЕ. Воспользоваться формулами (5.18) и (5.14), а также решениями задачи 4.8. Ответ: 18/25. 5.21. Найти дисперсию числа белых шаров X в случае схемы выбора с возвращением, описанной в § 4.2. УКАЗАНИЕ. Использовать представление Xв виде суммы (4.2), решение задачи 5.6 и обобщение свойства дисперсии (5.21). Ответ: ШГ=л^1-^| 5.22. Найти математическое ожидание и дисперсию случайной величины Υ= {Χ- MX)/jOX. УКАЗАНИЕ. Любая случайная величина и постоянная независимы. Воспользоваться представлением Υ в виде Υ = (-=Х J + [— -= 1 и свойствами математического ожидания и дисперсии. Ответ: ΜΥ=0,ΌΥ=1. 5.23. Известно, что МХ= 10, ΌΧ= 0,4. Используя неравенство Чебышёва, оценить снизу вероятность того, что абсолютная величина отклонения^— 10 не превосходит 2.
УКАЗАНИЕ. ТаккжР{\Х-МХ\<г) = 1 - Р{|ЛГ- МХ\ > ε}, то из неравенства Чебышёва следует, что Ρ{\Χ-ΜΧ\}<ε>\-ψ. Ответ: Р{\Х- 10| < 2} >0,9. 5.24. Оценить снизу вероятность того, что величина |ЛГ— МХ\ не превосходит ^ среднеквадратичных отклонений. Найти числовое значение оценки при К = 3. УКАЗАНИЕ. Оценить по неравенству Чебышёва вероятность P{\X-MX\>KJOX}. Воспользоваться указанием к задаче 5.23. Ответ: Р{\Х- МХ\ < KjOX} > 1 - \/К2; при К= 3 интересующая нас вероятность не меньше 8/9. 5.25. Из урны с Μ белыми и N — Μ черными шарами по схеме случайного выбора с возвращением извлекают η шаров. Пусть X— число белых шаров среди выбранных. В качестве оценки (приближенного значения) неизвестной доли Μ/Ν белых шаров можно взять случайную величину Х/п. Оценить снизу вероятность того, что Х/п отличается от Μ/Ν не больше ε. УКАЗАНИЕ. ТаккакМ(ЛУл) = -ΜΧ,Ό(Χ/η) = -, ΌΧ, то согласно решению задач 5.12 и 5.21 имеем Воспользоваться неравенством Чебышёва. Ответ: Ρ X _ Μ η Ν <ε }>-ά*(·-*> ч5.4/ Ковариация. Коэффициент корреляции Ковариацией случайных величиной Υ называется число cov (X,Y)=M[(X- MX) (Y-MY)]. (5.24) Ковариацию можно также находить по формуле cov (Χ, Υ) = MXY- MXMY (5.25) Отметим, что cov (Χ, Υ) = cov (Υ, Χ). Если случайные величины X и Υ независимы, то cov (Χ, Υ) = 0. Отсюда следует, что в слу- 47
чае cov (Χ, Υ) Φ О величины ЛГ и F зависимы. В качестве меры зависимости используют следующую величину, получаемую нормированием cov (Χ, Υ): р ψΛ*β. (5.26) Величина (5.26) называется коэффициентом корреляции. Коэффициент корреляции иногда обозначают согг (Χ, Υ). Определения (5.24), (5.26) и формула (5.25) сохраняются в любой вероятностной модели. Если для любой пары Xi9 Xj величин Хи ..., Хп нам известна cov (Х-, Xj), то можно вычислить дисперсию суммы всех величин D(Ar, + ...+JTll)= Σ ШГ,+ Σ cav(Xi9Xf). (5.27) ι=1 i*j J Отсюда для независимых величин имеем ЩХ{ + ... + Хп) = ΌΧ{ + ... + ΌΧη. (5.28) 5.26. Известно, что МХ= 1, М7= 2, MX2 = 2, МГ2 = 8, MXY= = 1. Найти ΌΧ, ΌΥ, cov (Χ, Υ), рх γ. Являются ли величины Χ, Υ независимыми? УКАЗАНИЕ. Воспользоваться формулами (5.14), (5.25), (5.26). Ответ: ΌΧ= 1, DF=4, cov (X, Υ) =-1, ρχ у=-0,5; случайные величины зависимы. 5.27. Найти Ό(Χ + Υ), если X и Υ удовлетворяют условиям задачи 5.26. УКАЗАНИЕ. Использовать формулу (5.27) при η = 2 Ό(Χ+ Υ) = ΌΧ+ ΌΥ+ 2cov (X, У). Ответ: D(Jf+ Y) =4. 5.28. Из урны с Μ белыми πΝ— Μ черными шарами по схеме случайного выбора без возвращения извлекают η шаров. Положим Yi=l, если /-й шар белый, и Yt = О, если /*-й шар черный (/' = 1,..., п). Найти DF,., cov (У,·, Yj),i*i. УКАЗАНИЕ. Воспользоваться решением задачи 5.12, формулами (5.14) и (5.25) и равенствами Y} = Yr Ответ: D^=^l-^)cov(^^=-^b)(l-^}
5.29. Найти дисперсию числа X белых шаров среди η шаров, выбор которых описан в задаче 5.28. УКАЗАНИЕ. Воспользоваться формулой (5.27) и решением задачи 5.28. Ответ: М(л Μ\Ν-η ΌΧ = Μ(λ Μ\Ν-η ПТГ11-Т7)7Г=Т (5·29) 5.30. Решить задачу 5.25 для выбора без возвращения. УКАЗАНИЕ. Использовать указание к задаче 5.25 и формулу (5.29). Ответ: Р^ \\Х М\ , \^л 1 Μ (Λ Μ \Ν-η Заметим, что полученная здесь оценка снизу лучше оценки задачи 5.25, так как множитель (Ν — η)/(Ν — 1) меньше 1. Таким образом, случайный выбор без возвращения дает более точную оценку доли белых шаров. 5.31. Для схемы случайного выбора с возвращением (см. § 4.3) определим случайные величины Zk {к = 1,..., Ν): Zk = 1, если шар с к-м номером не появился и Zk = 0 — в противном случае. Найти cov (Zk, Zt),k*l; DZk. Ответ: cov (Zk, Ζ,) = (1 - 2/Ν)η - (1 - 2/Ν)2η\ DZk = = {\-\/Ν)η-{\-\/Ν)2η. 5.32. Найти дисперсию величины μ0, определенной в задаче 5.16. При η = αΝ (α > 0 — некоторая постоянная) найти lim Ζ)μ0. УКАЗАНИЕ. Воспользоваться указанием к задаче 5.16, формулой (5.27) и решением задачи 5.30. Ответ: Ζ>μ0 = N(1 - \/Ν)η + Ν{Ν - 1)(1 - 2/Ν)η - -N2(\-\/N)2n; lim ]>Ζ)μ0 = ε-α[1 - (1 + а)е~а]. yV-»oo TV
СХЕМА БЕРНУЛЛИ Глава Определение вероятности Схема Бернулли является вероятностной моделью последовательности независимых испытаний, в каждом из которых может наступить один из двух исходов, и испытания проводятся в неизмененных условиях. Как вероятностная модель схема Бернулли является частным случаем конечной схемы, рассмотренной в гл. 5. Традиционно два исхода в отдельных испытаниях схемы Бернулли называют «успехом» и «неудачей». Элементарными исходами η независимых испытаний схемы Бернулли являются цепочки длины η из «успехов» и «неудач». Для краткости «успехи» и «неудачи» будем обозначать буквами У и Н. Тогда, например, при п = 4 цепочка УУУУ означает, что каждое из четырех испытаний закончилось успехом; цепочка НУУН означает, что первое и последнее испытания закончились неудачей, а остальные — успехом и т. д. Вероятность успеха в любом отдельном испытании должна быть задана; эту вероятность обозначают/? (О <р < 1). Вероятность неудачи в отдельном испытании равна q — 1 — ρ, В схеме Бернулли любые события, относящиеся к различным испытаниям или различным (непересекающимся) группам испытаний, являются независимыми. Отсюда следует, что вероятность любой цепочки равна произведению η сомножителей/? и q, соответствующих У и Η в данной цепочке. Например, Р(УУУУ) = />·/>·/? ·ρ =ρ4, Р(НУУН) = = q*p*p *q = p2q2. Вероятность любого элементарного исхода, содержащего т успехов ип-т неудач,равна pmqn~m. Таким образом, описаны элементарные события и указаны их вероятности. Этого достаточно для полного задания конечной вероятностной схемы. Вероятность любого события вычисляется как сумма вероятностей элементарных событий, входящих в данное случайное событие (см. формулу (5.2)). Отметим, что вероятности цепочек, относящихся к меньшему числу испытаний, вычисляют по тому же правилу, что и для полных цепочек схемы. φ 50
6.1. Выписать все элементарные исходы схемы Бернулли с η = 3 испытаниями и найти их вероятности, если вероятность успеха равна /?. Найти вероятность событиям! = {успехи и неудачи чередуются}. УКАЗАНИЕ. Л = {УНУ,НУН}. Ответ: Р{А) = р2д + рд2 =рд. 6.2. В условиях задачи 6.1 найти распределение вероятностей случайной величины μ3, равной числу успехов в трех испытаниях. Ответ: т Р{\\? = т) 0 <73 1 3/><72 2 3/>2<7 3 Ръ 6.3. В условиях задачи 6.1 найти вероятность того, что произошло ровно два успеха, причем не в соседних испытаниях. Ответ: р2д. 6.4. В условиях задачи 6.1 найти вероятность того, что произошло четное число успехов. Ответ: дъ + Зр2д. 6.5. В схеме Бернулли с η испытаниями и вероятностью успеха ρ найти вероятности событий: А = {произошел хотя бы один успех}, В = {ни одного успеха не произошло}. УКАЗАНИЕ. Событие В противоположно А : В = А. Ответ: Р(А) = I-дп, Р(В) = дп. 6.6. В схеме Бернулли с η испытаниями и вероятностью успеха ρ найти вероятности событий: Ак = {успех впервые произойдет на к-м испытании}, В = {за η испытаний успех не произойдет}. УКАЗАНИЕ. Пусть С; = {успех в /-м испытании}. Тогда Ответ: Р(Ак) =дк~1р, к = 1,..., п\ Р(В)=дп. 51
ЗАМЕЧАНИЕ. Формально для конечной схемы Бернулли нельзя ввести величину ν, равную номеру испытания, в котором произошел первый успех, так как на элементарном событии НН ... Η = В величина ν не определена. Однако каждое конкретное значение ν = к определяется за конечное число испытаний, и это событие {ν = к) = Ак. Тогда P{v = k} = qk-ip. (6.1) Если определить вероятность для схемы с неограниченными последовательностями, то величина ν будет определена, а все конечные схемы при различных η будут согласованы между собой и бесконечной схемой. Вероятность окажется определенной формулой (6.1). Вероятность заданного числа успехов Во многих задачах, связанных со схемой Бернулли, возникает случайная величина μ„, равная числу успехов в η испытаниях. Закон распределения этой величины называется биномиальным и определяется формулой Р№п = т} = С*»ртд"-т9 q=l-p9m=09l9...,n. (6.2) 6.7. Брошены десять игральных костей. Найти вероятности событий: А = {выпало ровно две шестерки}, В = {выпала хотя бы одна шестерка}. УКАЗАНИЕ. Воспользоваться схемой Бернулли с η = 10, ρ = 1/6 (десять игральных костей — десять испытаний; выпадение шестерки — успех); А = {μ10 = 2}, В = {μ10 > 1}, В = {μ„ = 0}. Ответ: Р(Л) = С?0 (1/6)2(5/6)*, Р(Я) = 1 - (5/6)">. 6.8. Решить задачу 6.7, используя классическое определение вероятности. 6.9. Сколько нужно бросить игральных костей, чтобы вероятность выпадения хотя бы одной единицы была не меньше 0,9? УКАЗАНИЕ. Для произвольного η найти вероятность события {μη > 1}, где μη — число выпавших единиц, и разрешить соответствующее неравенство относительно п. Ответ: Ρ{μ„ > 1} = 1 — (5/6)"; нужно бросить 13 игральных костей. 6-10. По каналу связи передается 20 знаков. Вероятность искажения знака равна 0,01. Найти вероятность того, что будет искажено не более двух знаков. 52
УКАЗАНИЕ. Воспользоваться схемой Бернулли с η = 20, ρ = 0,01 и событие {μη < 2}, где μη — число искажений, представить в виде суммы трех несовместных событий {μη<2) = {μη = 0} + {μη=1} + {μη = 2}. Ответ: (0,99)20 + 20-0,01 · (0,99)19 + ^-^- (0,01)2(0,99)18 = = 0,9989.... 6.11. Найти вероятность того, что за шесть подбрасываний пары монет ровно два раза выпадет сочетание «герб-герб». Ответ: С\(1/4)2(3/4)4 = 0,2966308.... 6.12. Имеется N однотипных объектов; вероятность аварии на любом объекте в течение года равна/?. Найти вероятность Ρ(Τ\Ν\ρ) того, что за Τ лет хотя бы на одном из имеющихся N объектов произойдет авария. Предполагается, что аварии на разных объектах и аварии разных лет происходят независимо. Вычислить Р( 100; 20; 0,001). УКАЗАНИЕ. Воспользоваться схемой Бернулли с η = NT. Ответ: Р(Т; N\p) = 1 - (1 -p)NT\ P(100; 20; 0,001) =0,8647.... 6.13. Система, состоящая из 100 блоков, работает нормально, если за рассматриваемый период выйдет из строя не более трех блоков. Найти вероятность нормальной работы системы за рассматриваемый период, если отказы блоков независимы и вероятность отказа одного блока равна 0,02. Ответ: (0,98)100 + 100(0,02)(0,98)" + I^L^(0,02)2(0,98)98 + + 10° *^9 ' 98 (0,02)3(0,98)97 = 0,8617.... 6.14. Работа уличного агента по приглашению потенциальных покупателей считается удовлетворительной, если по его приглашению за день на презентацию придет более 10 покупателей. Считая, что вероятность того, что лицо, к которому агент обратится с предложением, с вероятностью 0,1 придет на презентацию, вычислить вероятность того, что работа агента будет признана удовлетворительной, если агент обратится с предложением к 40 прохожим. РЕШЕНИЕ. Пусть ξ — количество прохожих из 40 опрошенных, которые придут на презентацию. Вероятность того, что работа агента будет признана удовлетворительной, есть Ρ{ξ > 10}. Применяя схему Бернулли с 40 испытаниями и вероятностью успеха 0,1, имеем Ρ{ξ > 10} = 1 - Ρ{ξ < 10} = 1 - Ρ{ξ = 0} - ... - Ρ{ξ = 10} = = 1 - (0,1)°(0,9)40 - ... - Cjg (0,1)10(0,9)30 = 0,00146.... 53
Математическое ожидание и дисперсия В схеме Бернулли для вычисления математического ожидания и дисперсии можно использовать формулы (5.7), (5.8), (5.14), (5.15), (5.17), а также свойства математических ожиданий и дисперсий, применяя их к различным выражениям данных случайных величин через более простые случайные величины. 6.15. В схеме Бернулли с η = 3 и ρ = 1/3 вычислить Μμ3 и Όμ3 по формулам (5.8), (5.18) и (5.14). УКАЗАНИЕ. Воспользоваться найденным в задаче 6.2 распределением вероятностей μ3. Ответ: Μμ3 = 1,ϋμ3 = 2/3. 6.16. Решить задачу 6.15 по формулам (5.7), (5.14) и (5.16). УКАЗАНИЕ. Воспользоваться выписанными в задаче6.1 элементарными исходами с соответствующими вероятностями. 6.17. В схеме Бернулли с η = 3 и вероятностью успеха/? определим величины _ Г1, если в /-м испытании был успех, '— 10, если в /-м испытании была неудача, /=1,2,3. Найти МХ(, OXS. УКАЗАНИЕ. Воспользоваться формулами (5.7), (5.14) и (5.16). Ответ: ΜΧ^ρ,ΌΧ^ρς. 6.18. Доказать независимость случайных величин Хх, Х2, Х3, определенных в задаче 6.17. 6.19. Найти математическое ожидание числа успехов в η испытаниях схемы Бернулли с вероятностью успеха/?. УКАЗАНИЕ. Использовать представление μη в виде суммы μη=Χ}+Χ2 + ...+Χη, (6.3) где Xt= 1, если в i-u испытании был успех и Xt = О, если в /-м испытании была неудача. Ответ: Μμη = ηρ. 6.20. Найти дисперсию числа успехов μη в η испытаниях схемы Бернулли с вероятностью успеха/?. 54 ίρ
УКАЗАНИЕ. Использовать представление (6.3), независимость величин^, ...9Хп9 а также формулу (5.28). Ответ: Όμη = ηρς. 6.21. Два стрелка, для каждого из которых вероятность попадания в цель равна/?, производят η залпов по два выстрела. Найти математическое ожидание и дисперсию числа парных попаданий X и общего числа попаданий Υ. Ответ: МХ=пр2, ΌΧ=ηρ2(\ -ρ2), ΜΥ= 2пр, ΌΥ= 2npq. 6.22. В схеме Бернулли с η + 1 испытаниями и вероятностью успеха/? в отдельном испытании обозначим через Ζη число успехов, за которыми сразу следует успех. Найти Z„, DZ„. УКАЗАНИЕ. Представить Zn в виде zn=xx+x2 + ...+xn, где Х{ = 1, если в /-м и (/ + 1 )-м испытаниях был успех и X. = О — в остальных случаях. Случайные величины X. и Xj зависимы, если |/ —J | = 1, и независимы, если |/ — J \ > 2. Использовать формулу (5.27): D(^ + ...+ХЯ) = ΣΌΧ, + 2 Σ1 cov (Xi9Xi+l) + Σ cov (Xi9X). i = \ / = 1 |/-yl>2 J Ответ: MZn = np2, ΌΖη = np2(\-p2) + 2(n - \)p3(\-p). 6.4/ Закон больших чисел При увеличении числа испытаний в схеме Бернулли частота успеха μη/η «сближается» с вероятностью успеха/?. Дадим математическую формулировку этого экспериментального факта в вероятностной модели: для любого ε > 0 при η -* оо <ε ->1. (6.4) μ* -к-ρ Таким образом, частоту успехов при больших η можно использовать как оценку (приближенное значение) неизвестной вероятности успеха/?. Используя неравенство Чебышёва, можно оценить μ* снизу вероятность рассматриваемого отклонения η ~Р <ε. 55
6.23. НайтиMi^lnDi^ \ УКАЗАНИЕ. Использовать свойства математического ожидания и дисперсии, а также найденные в задачах 3.5 и 3.6 Μμ„ и Όμη. От..т:М(£)-Л »(£)-« 6.24. Используя неравенство Чебышёва (см. формулу (5.22)), оценить вероятность события Ответ: τ-ρ <ε. Ρ μ« τ-ρ J пг2 <ε >l_i^ (6.5) 6.25. Доказать утверждение (6.4). УКАЗАНИЕ. Воспользоваться решением задачи 6.24. 6.26. Оценить, используя неравенство (6.5), наименьшее число бросаний монеты, при котором частота появления герба отличается от 1/2 не более чем на 0,1 с вероятностью, не меньшей 0,9. УКАЗАНИЕ. Бросание монеты описывается схемой Бернулли с ρ = q = = 1/2. Найти наименьшее п, удовлетворяющее неравенству 1 - ^ < <0,9при/> = #= 1/2, ε = 0,1. Ответ: 250. ЗАМЕЧАНИЕ. В данной задаче неравенство Чебышёва приводит к завышенной оценке необходимого числа испытаний п. Эта оценка может быть значительно снижена (см. § 6.6). ч6.5/ Теорема Пуассона По формулам (6.2) даже при использовании компьютера не всегда легко получить числовые значения вероятности Ρ{μ„ = т). При больших η и малых/? (таких, что пр невелико) можно использовать приближенные формулы, основанные на следующей теореме. Теорема Пуассона. Если η -* оо ир-^-0 так, что я/? —► λ (0 < λ < < оо)? то при любом постоянном т (т =0, 1,...) limP^„ = /n} = £-e-\ (6.6) ηρ-+λ 56
В качестве приближенной формулы используют предельное значение вероятности: Щрп = т}~Ще-х*Лп = пр. (6.7) Эта формула дает удовлетворительное приближение при больших η (например, η > 100) и небольших пр (например, пр < 8 или пр < 10). 6.27. В ящике 100 карточек, занумерованных числами 1, 2,..., 100. Из ящика наудачу 200 раз вынимают карточку; после каждого извлечения карточку сразу возвращают в ящик. Найти приближенное значение вероятности того, что карточка с числом 1 появится ровно три раза. РЕШЕНИЕ. Описанная схема случайного выбора с возвращением эквивалентна схеме Бернулли с η = 200, ρ = 0,01; число успехов μη — это число появившихся карточек с числом 1. Точное значение вероятности найдем по формуле (6.2): Ρ{μ2οο = 3} = CJoo (0,01)3(0,99)199 = 0,181367.... В этой задаче η = 200 достаточно велико,/? мало, а величина пр = 2 небольшая. По приближенной формуле (6.7) находим 23 Из таблицы 3 приложений получаем Ρ{μ„ = т) « 0,18045. 6.28. Используя пуассоновское приближение (6.7), найти приближенное значение вероятности безотказной работы системы, описанной в задаче 6.13. Ответ: 0,8571. 6.29. В тысячу ящиков разложили изделия, среди которых двести бракованных. Оценить вероятность того, что в определенном ящике не менее трех бракованных изделий. УКАЗАНИЕ. Использовать схему Бернулли в качестве математической модели распределения бракованных изделий в ящике; положить η = 200,/? = 0,001. Ответ: 0,001. 6.30. Вероятность выпуска бракованного изделия равна 0,05. Куплены 100 изделий. Найти вероятность события: 1) среди купленных изделий нет бракованных; 2) число бракованных изделий не превосходит двух. Ответ: 1) 0,00674; 2) 0,12465. 57
6.31. В условиях задачи 6.30 оценить, сколько нужно купить изделий, чтобы среди них было не менее 100 стандартных изделий с вероятностью, не меньшей 0,9. УКАЗАНИЕ. Обозначить через μ10ο + 5 число бракованных изделий среди 100 + 5 купленных. Нужно подобрать s так, чтобы Ρ{μ100 + ,<*}>0,9. Ответ: 108. 6.32. Сколько в среднем должны содержать изюма булочки, чтобы вероятность того, что в булочке найдется хотя бы одна изюмина, была не меньше 0,99? УКАЗАНИЕ. Использовать схему Бернулли с η испытаниями и вероятностью успеха ρ для описания процесса попадания изюма в булочку. Число попавших изюмин обозначим μη. Среднее число изюмин в булочке Μμη = пр = λη. Если изюмины не раскладывают индивидуально по булочкам, то η очень велико, ар очень мало, и для подбора λη можно воспользоваться пуассоновским приближением (6.7). Ответ: 4,6. Теорема Муавра — Лапласа В схеме Бернулли точная вероятность события {т, < μη < т2} вычисляется по формуле Р{т,<ц„<ш2}= Σ Cypmq»-m. (6.8) При больших п и таких/?, что npq достаточно велико, можно использовать приближенную формулу для вычисления вероятности (6.8), основанную на следующей теореме. Теорема Муавра — Лапласа. Если ρ — постоянно (0<р< 1), то lim pf a < μ"~™μ" < ъ 1 = 4= ί e-*2/2 dx. (6.9) (Напомним, что Μμ„ = ηρ, Όμη = npq.) В качестве приближенного значения вероятности, стоящей в левой части равенства (6.8), используется следующее значение: {/я, — пр μη — ηρ γηΊ — ηρλ \ J . J npq Jnpq Jnpq J Jin a (6.10) где a = (ml — np)/Jnpq, b = (m2- np)/Jnpq. 58
Ч 1 -χ2/2 ι а Ъ X а) У к ι -xV2 а \ b X б) Рис. 1 У А I -*2/2 а Ь \ χ I в) Для конкретных а и Ъ числовое значение интеграла в (6.10) можно найти с помощью функции O0(x) = ^fe-«2/2dW) (6Л1) значения которой приведены в таблице 1 приложений. Отметим, что Ф0(°°) = 1/2. Нетрудно проверить (рис. 1, а—в), что ь [Ф0(/>) -Ф0(я), если Ь>а>0, -μ]^2ηάχ=1φ^) + Ф0(М), если b>0ya<Q, (6.12) 41%Q [ф0(|я|)-Ф0(|6|), если я</><0. 6.33. Стрелок попадает в цель при одном выстреле с вероятностью 3/4. Найти вероятности следующих событий: А = {число попаданий в цель при 1200 выстрелах лежит в пределах между 885 и 930}, В = {число попаданий в цель при 1200 выстрелах не меньше 870}. РЕШЕНИЕ. Число попаданий μη имеет биномиальное распределение с η = 1200, ρ = 3/4. События ΑπΝ можно записать в виде А = {885 <μη< 930}, В = {μΛ > 870} = {870 < μ„ < оо}. Так как пр = 900, npq = 225, Jnpq = 15, то для события А имеем а = (885 - 900)/15 - -1, Ь = (930 - 900)/15 = 2. Используя формулы (6.10), (6.12) и таблицу 1 приложений, получим Р(^) - J- J e~x2/2dx = Ф0(2) + Ф0(П = 0,4772 + 0,3413 = 0,8185. В случае события В имеем: а = (870 - 900)/15 = -2, b = оо и Р(Я) « -jL J e-*2/2dx = Ф0(2) + Ф0(оо) = 0,4772 + \ = 0,9772. Λ/2π _2 59
6.34. Полагая вероятность рождения мальчика равной 0,515, найти вероятность того, что среди 10 000 новорожденных мальчиков будет больше, чем девочек. УКАЗАНИЕ. Применить схему Бернулли с ρ = 0,515, η = 10 000; μη — число мальчиков среди 10 000 новорожденных; 10 000 — μη — число девочек. Применить нормальное приближение для оценки вероятности Ρ{μ/Ι>10 000-μ„} = Ρ{μ/Ι>5000}. Ответ: 0,9987 (Μμ„ = 5150, Αβμ'η = 50). 6.35. Вероятность того, что лампочка прослужит более 1000 ч, равна 1/3. Оценить вероятность того, что из 1800 лампочек срок службы хотя бы 580 лампочек превысит 1000 ч. Ответ: 0,8413. 6.36. (См. задачу 6.18.) Сколько раз нужно бросить монету, чтобы частота появления «герба» отличалась от 1/2 не более чем на 0,1 с вероятностью, не меньшей 0,95? УКАЗАНИЕ. Событие ι μ* _ ι Ι η 2 ба», можно записать в виде < 0,1, где μ„ — число выпаданий «гер- ίΐμ" Ч^пД ί ^^п-п/2 1 где zn = 0,2*/ii. Подобрать по таблице 1 приложений ζη (следовательно, и η) так, чтобы Р{|тГ - зН0·1}- vfe I e"*V2 d* = 2°o<*«) =0'95· Ответ: 97раз. 6.37. Вероятность отказа датчика в течение месяца равна 0,1. Раз в месяц осматривают 1000 датчиков. Сколько нужно иметь запасных датчиков, чтобы с вероятностью, не меньшей 0,99, можно было заменить отказавшие? УКАЗАНИЕ. Подобрать т так, чтобы Ρ{μ1()οο ^ т) = 0,99, где μ10οο — число отказавших датчиков. Ответ: 122. 6.38. Кабельная телевизионная компания Новая Вершина Телевидения (НВТ) города Борисовска, решая вопрос о целесообразности покупки прав телетрансляции по кабельному телевидению чемпионата города по мини-футболу, провела опрос среди болель- 60
щиков и выяснила, что каждые 20 из 100 болельщиков, не имеющих кабельного телевидения, захотят по этой причине стать абонентами Η ВТ. Считая, что в этом городе 10 000 болельщиков, не охваченных Η ВТ, а чистая прибыль НВТ от подключения одного абонента равна 50 ден. ед., выяснить: 1) какова вероятность того, что чистая прибыль компании от привлечения новых абонентов превысит 105 000 ден. ед.; 2) какова вероятность того, что чистая прибыль компании от привлечения новых абонентов будет менее 95 000 ден. ед.; 3) при условии, что стоимость прав на телетрансляции чемпионата равна 80 000 ден. ед., указать диапазон, симметричный относительно 20 000 ден. ед., в котором с вероятностью 0,9 будет находиться чистая прибыль компании за вычетом расходов на приобретение прав на телетрансляцию. РЕШЕНИЕ. Воспользуемся схемой Бернулли с η = 10 000 и ρ = 0,2. 1) Пусть μη — число болельщиков, ставших абонентами НВТ. Тогда чистая прибыль компании равна 50μ„ ден. ед. Нас интересует вероятность события {50μ„ > 105 000} = {μ„ > 2100}. Используя теорему Муавра — Лапласа, находим ξ1 + ξ2 + ... + ξ10000-0,2-10 000 > V0,2-0,8- 10000 > 2100-0,2-10 000 1ΐ_φ(ΗΧΜ = л/0,2-0,8- 10 000 J 2 Ч 40 J = \ - Ф0(2,5) = \ - 0,4938 = 0,0062. 2) Ответ: 0,0062. 3) Ответ: (16 700,23 300). 6.39. (См. задачу 6.38.) Компания кабельного телевидения НВТ анализирует возможность присоединения к своей сети пригородов Борисовска. Опросы показали, что в среднем каждые 3 из 10 семей жителей пригородов хотели бы стать абонентами сети. Стоимость работ, необходимых для организации сети в любом пригороде, оценивается 2 080 000 ден. ед. При подключении к сети каждого пригорода НВТ надеется получить 1 000 000 ден. ед. в год от рекламодателей. Планируемая чистая прибыль от оплаты за кабельное телевидение одной семьей в год равна 120 ден. ед. Каким должно быть минимальное количество семей в пригороде для того, чтобы с вероятностью 0,99 расходы на организацию сети в этом пригороде окупились за год? Ρ{μ„>2100} = Ρ 61
РЕШЕНИЕ. Пусть η — искомое количество семей и μη — число семей, ставших абонентами НВТ. Тогда чистая прибыль компании равна 120μ„ ден. ед. Нас интересует вероятность события {120μ„ +1 000 000 > 2 080 000} = {μ„ > 9000}. Используя центральную предельную теорему, находим Г μ„ - 0,3л 9000 - 0 3/2 1 Ρ{μ„ > 9000} = Ρ , > yUUU U?J" « r" [ V0,3-0,7« л/0,3-0,7/1 J и .9000-0,2„Л °v 7одБ2 У Отсюда 9000-0,3/2 . ^ _ , — ^* — Δ,όό. ТоДТ^ Следовательно, η > 30 623. Задачи из теории страхования Рассмотрим некоторые задачи, возникающие при расчете тарифных ставок по рисковым видам страхования, т. е. видам страхования, относящимся к страховой деятельности, которая не связана со страхованием жизни. При таких видах страхования страховая сумма (плата за страховой полис) вносится один раз перед заключением договора страхования, и после окончания действия договора страховая компания не возвращает страховой взнос и не выплачивает никакого вознаграждения. Будем оперировать следующими основными понятиями, используемыми в страховании. Страховая сумма — размер компенсации в случае наступления страхового события. Страховой тариф (брутто-ставка) — величина страхового взноса с единицы страховой суммы (или с объекта страхования). Страховой тариф состоит из нетто-ставки и нагрузки. Нетто-ставка страхового тарифа — часть страхового тарифа, предназначенная для обеспечения текущих страховых выплат по договорам страхования. Нагрузка — часть страхового тарифа, обеспечивающая прибыль от проведения страховых операций, а также предназначенная для покрытия затрат на проведение страхования и создания резервного фонда на случай экстремальных ситуаций. 6.40. Страховая компания заключила договор со спортсменом-теннисистом на 365 дней, предусматривающий выплату страхового возмещения клиенту в случае травмы специального вида. Из 62
предыдущей практики известно, что вероятность получения такой травмы теннисистом в любой фиксированный день равна 0,00037. Вычислить вероятность того, что в течение срока действия договора: а) не произойдет ни одного страхового случая; б) произойдет один страховой случай; в) произойдут два страховых случая. Вычислить указанные вероятности двумя разными способами, используя биномиальное распределение и распределение Пуассона. РЕШЕНИЕ. Пусть μη — количество травм, полученных спортсменом за время действия договора. Предположим сначала, что μη имеет биномиальное распределение с вероятностью «успеха» ρ = = 0,00037 и вероятностью «неудачи», равной 1 — 0,00037 = 0,99963. Тогда по формуле (6.2) Ρ{μ„ = 0} = С3°65 (0,00037)°(0,99963)365 « 0,87365; Ρ{μ„ = 1} = С]65 (0,00037)' (0,99963)364 ~ 0,11803; Ρ{μ„ = 2} = С3265 (0,00037)2(0,99963)363 « 0,00795, а по формуле (6.7) с параметром λ = 365 - 0,00037 = 0,13505 находим Ρ{μ„ = 0} « Q,QQ0Q!37° e-°'13505 « 0,87367; Ρ{μ„ = 1} « М°1°!371 е-0'13505-0,11799; Ρ{μ„ = 2} - 0?002°!372 е-0-13505 « 0,00797. 6.41. При расчете страхового тарифа по одному из видов страхования страховая компания предполагала, что страховые случаи происходят с вероятностью 0,005, а средний размер выплат 1000 ден. ед. В 1998 г. страховая компания заключила 2000 договоров по данному виду страхования, и за год произошло 15 страховых случаев со средним размером выплаты в 1010 ден. ед. Средний размер выплат вполне приемлем. Предполагая, что число ожидаемых страховых случаев имеет приближенно распределение Пуассона, обосновать, является ли факт наступления 15 страховых случаев за год (что на 50% больше ожидаемого среднего числа, равного 10) показателем того, что была допущена ошибка (в сторону занижения) вероятности наступления страхового случая или компания попала в полосу «невезения» по случайным причинам. 63
РЕШЕНИЕ. Пусть μη — количество страховых случаев за год при условии, что было заключено 2000 договоров. Поскольку 0,005 χ χ 2000 = 10, можно считать, что случайная величина μη имеет распределение Пуассона (см. (6.7)) с параметром λ = 10. Тогда Ρ{μ„>15} = 1-Ρ{μ„<14}>1/12. Таким образом, если предположение компании о вероятности наступления страхового случая верно, то ситуации, когда произойдет 15 и более страховых событий за год, случаются примерно раз в 12 лет. 6.42. Планируя свою деятельность по одному из видов рискового страхования с размером страховой суммы 1000 ден. ед., нетто-ставкой 0,02 и вероятностью наступления страхового события 0,01, страховая компания хотела бы получить прибыль не менее 100 000 ден. ед. Какое минимальное число договоров она должна заключить, чтобы получить указанный размер прибыли с вероятностью не менее 0,99, если размер страхового взноса равен 50 ден. ед. РЕШЕНИЕ. Пусть η — искомое число договоров. Тогда сумма страховых взносов равна 50л, а ожидаемый суммарный размер страховых выплат есть 1000μ„, где μη — число успехов в схеме Бернулли с η испытаниями и ρ = 0,01. Поскольку нетто-ставка равна 0,02, нас интересует такое количество договоров п, для которого Р{50 ■ 0,98л - 1000μ„ > 100 000} > 0,99, или Р{49л - 1000μ„ < 100 000} < 0,01. Используя теорему Муавра — Лапласа (npq окажется большим), находим Р{49я - 1000μ„ < 100 000} = Ρ{μ„ > 0,049л - 100} = = ρί μ,,-Ο,ΟΙβ > 0,049/2- 100-0,01/2, 1 ^ L л/0,01 -0,99л " V0,01-0,99/2 J 1 ^ [0,039/2- 100 1 ^Α Α1 1 , η „, Следовательно, °'039й - 10° > 2,33. 0,099V« Решая это неравенство, находим я > 2882. 64
6.43. (Ср. с задачей 6.42.) Планируя свою деятельность по одному из видов рискового страхования со средним размером страховой суммы 1000, вероятностью наступления страхового случая 0,05 и ожидаемым количеством договоров 1200, страховая компания хотела бы получить доход не менее 100 000. Какова должна быть минимальная величина страхового тарифа, чтобы компания могла получить указанный размер дохода с вероятностью не менее 0,99? РЕШЕНИЕ. Пусть χ — искомая величина страхового тарифа. Тогда сумма страховых взносов равна 1200.x, а ожидаемый суммарный размер страховых выплат есть 1000μ„, где μη — число успехов в схеме Бернулли с η = 1200,/? = 0,05. Нас интересует такая величина страхового тарифах, для которого Р{1200х - 1000μ„ > 100 000} > 0,99, или Ρ{μη> 1,2χ- 100} < 0,01. Используя аппроксимацию нормальным распределением, находим μ„ ~ 1200 -0,05 1,2х- 100 - 1200 л/0,05-0,95- 1200 л/0,05 ■ 0,95 ■ 1200 ■0,05 1 ЙЮ J 1 , Г 1,2jc— 40 2 ^°| 7,55 Отсюда следует, что 1 < 0,01 = i -Ф0(2,33). илих > 50ден. ед. 1,2х-40 7,55 ^Z'JJ' 6.44. Портфель страховой компании состоит из 1000 договоров, заключенных 1 января и действующих в течение текущего года. При наступлении страхового случая по каждому из договоров компания обязуется выплатить 2000 ден. ед. Вероятность наступления страхового события по каждому из договоров равна 0,05 и не зависит от наступления страховых событий по другим контрактам. Каков должен быть совокупный размер резерва страховой компании для того, чтобы с вероятностью 0,99 она могла бы удовлетворить требования, возникающие по указанным договорам? При вычислении числа страховых событий использовать нормальное распределение. РЕШЕНИЕ. Пусть S — искомый размер резерва. Тогда ожидаемый суммарный размер страховых выплат равен 2000μη, где μη — число успехов в схеме Бернулли с η = 1000,/? = 0,05. 65
Нас интересует такая величина резерва 5, для которой Ρ{2000μ„ < 5} > 0,99, или Ρ{μ„> 0,00055} < 0,01. Используя аппроксимацию нормальным распределением, находим Г μ„- 1000-0,05 > 0,00055- 1000-0,05 1 ^ { л/0,05-0,95- 1000 ^ 70,05-0,95- 1000 J 1 _ Г 0,00055- 50 1 ХЛЛ1 1 . ,„ _ч 2 " Ф°{ 6,892 } < °'01 = 2 " Фо(2'33)' Отсюда следует, что 0,00055-50 6,892 или 5 > 132 177 ден. ед. > 2,33,
ПОЛИНОМИАЛЬНАЯ СХЕМА Глава Определение вероятности Полиномиальная схема является обобщением схемы Бернулли и описывает последовательность независимых испытаний, в каждом из которых число возможных исходов может быть больше двух; вероятности исходов в отдельных испытаниях одинаковы для всех испытаний. Для определения вероятности любого события в полиномиальной схеме, как и в уже рассмотренных вероятностных моделях, нужно сначала задать элементарные исходы и их элементарные вероятности, после чего вероятность любого события вычисляется как сумма соответствующих элементарных вероятностей. Обозначим через 1, 2,..., Ν (Ν > 2) исходы, которые могут насту- N пить в каждом испытании. Пусть/?!, р2,..., ρΝ (ρ( >0, Σ Pi = 1) — ве- / = 1 роятности этих исходов. Элементарные исходы (или элементарные события), которые могут реализоваться в результате η испытаний, будем обозначать цепочками длины п. На каждом месте таких цепочек может стоять любое из чисел 1,..., Ν, означающее номер исхода соответствующего испытания. Вероятность любой цепочки, содержащей тх чисел 1, т2 чисел 2, ..., mN чисел N, полагаем равной ρ™1 Ρ22···Ρνν (тх + т2 + ... + mN = n). Это соответствует независимости событий, связанных с различными испытаниями. Вероятность любого события А определяем как сумму элементарных вероятностей, соответствующих исходам, которые благоприятствуют А (см. (5.2)). 7.1. Выписать все элементарные события и их вероятности для полиномиальной схемы c/?=2,7V = 3h вероятностями исходов отдельных испытанийрх,р2,р3 = 1 — Р\ — Р^ Найти вероятность события^ = {все исходы одинаковы}. φ 67
Ответ: Ρ (Α) = р\ + р\ + р\ , ω ρ(ω 11 Р\ 12 Р\Рг 13 />l/>3 21 />2/>1 22 />22 23 РгРъ 31 />3/>1 32 ^3/^2 33 Р] 7.2. В условиях задачи 7.1 найти вероятность следующего события: В = {в первом испытании появилась 3}. УКАЗАНИЕ. Использовать равенства В = {31, 32, 33}, рх +р2+Рз = 1- Ответ: Р(В) =р3. 7.3. В условиях задачи 7.1 найти вероятность следующего события: С = {ни в одном испытании не появилась 1}. УКАЗАНИЕ. 1) Воспользоваться равенством С = {22, 23, 32, 33}. 2) Поскольку нас интересует, появилась 1 или нет, исходы 2 и 3 можно не различать. Это позволяет применить схему Бернулли с ρ = рх ид=р2+р3. Ответ: Р(С) = (/>2+/>3)2. Вероятность заданного набора исходов В вычислениях, связанных с полиномиальной схемой, часто используются следующие величины: Хх — число исходов 1 в η испытаниях; Х2 — число исходов 2 в л испытаниях; ΧΝ— число исходов Νβ η испытаниях. Вероятность события {Хх = т2, Х2 = т2,..., XN = mN}y где целые числа т х,..., mN неотрицательны и т х + ... + mN = η, находится по формуле P{Xl = mu...yXN = mN)= щт^: т^ Р^...р^. (7.1) Величины Хх, ..., ΧΝ удобно представить в виде суммы более простых величин: Xi=Yn + ... + Yin,i=\,...,N, (7.2) 68 <Й>
где _ ί 1, если в к-м испытании наступил исход /, Yik~ 10—в противном случае. '',3) 7.4. В полиномиальной схеме cjV=3,/? = 5h вероятностями исходов рх,р2,р3 найти вероятность события {Хх = 2,Х2 = 1, Хъ = 2}. Ответ: ^,р\р2р\ = ^р\р2р\. 7.5. При встрече шахматистов Кх и К2 исходы одной партии «победа К{», «поражение Кх» и «ничья» имеют соответственно вероятности 0,1; 0,1; 0,8. Найти вероятность того, что матч из 10 партий закончится со следующим результатом: две победы Кх, одна победа АГ2, а остальные ничьи. УКАЗАНИЕ. Применить формулу (7.1) с η = 10, N = 3,рх = р2 = 0,1, /?3 = 0,8. Найти вероятность события {Хх = 2,Х2= \уХг = 1). Ответ: J^(0,1)2+ ^Ο,δ)7 = 360(0,1)3(0,8)7 = 0,075497.... 7.6. Найти вероятность того, что в компании из 12 человек все дни рождения приходятся на разные месяцы. УКАЗАНИЕ. Использовать полиномиальную схему с η = N = 12, рх = р2 = ... = рп = 1/2. Найти вероятность события {Хх = 1, Х2 = = 1,...,АГ12=1}. Ответ: 12!/1212. 7.7. Решить задачу 7.6, используя классическое определение вероятности. 7.8. В полиномиальной схеме сп = 2, Ν=3π вероятностями исходов/?!, р2, р3 найти законы распределения величин Yx/c, Y2k, Y3k, k = 1, 2, определенных равенствами (7.3). У К АЗАН И Ε. Использовать решение задачи 7.1. Ответ: ¥{Yik = 1} = рх, ¥{Y2k = 1} = р2, ¥{Y3k = 1} = р3, P{Ylk = 0} = l-Pl,P{Y2k = 0}=\-p2,P{Y3k=l} = l-p3,k = l,2. 7.9. Для полиномиальной схемы с произвольными η,Ννι вероятностями исходов/>,,...,/>Ν найти закон распределения случайных величин Yik, определенных равенствами (7.3). Ответ: P{Ylk=l}=pt,P{Ylk = 0}=l-Plti=l,...,N,k=\,...,n. 69
7.10. Брошены 10 игральных костей. Найти вероятность события А = {выпало ровно две шестерки и ровно три пятерки}. УКАЗАНИЕ. Рассмотреть полиномиальную схему с N = 3, η = 10; исход 1 соответствует шестерке, исход 2 — пятерке, а исход 3 — любое другое число очков. Тогда/?! =р2= 1/6,/?3 = 4/6. 0твет: 2!¥Τ!(δΪ(δΪ(δί· 7.11. В таблице 9 приложений приведена реализация испытаний, проведенных в соответствии со следующей полиномиальной схемой. В каждом испытании исходом является любая цифра 0, 1,2,... , 8, 9; вероятности исходов одинаковы: р0 = рх = ... = р9 = 1/10. Получить реализации испытаний по схеме Бернулли с η = 10,ρ = 1/5. УКАЗАНИЕ. Выбрать десять цифр, начиная с любого места таблицы; «успехом» считать, например, исход 0 или 1, а все остальные исходы считать «неудачей». 7.12. Используя таблицу 9 приложений, выписать реализации полиномиальной схемы с η = 10, N = 3,px = l/10,/?2 = 2/10,/?3 = 7/10. УКАЗАНИЕ. Считать, например, что цифра 0 соответствует исходу «1», цифры 1 или 2 — исходу «2», а остальные цифры исходу «3». 7.13. Используя таблицу 9, написать реализации испытаний схемы Бернулли с η = 10,ρ = 1/100. УКАЗАНИЕ. В таблице 9 сгруппировать цифры в пары; успехом считать пару «00». 7.14. Фирма по продаже одежды изучает причины, по которым покупатели, пришедшие в магазины фирмы с намерением что-то приобрести, ушли без покупки. Оказалось, что 40% потенциальных покупателей отпугнули цены, 30% не нашли подходящего фасона, 20% были неудовлетворены качеством, а 10% не нашли нужного. Какова вероятность того, что в группе из 10 посетителей, ушедших без покупки: а) ровно два покупателя, которых отпугнули цены; б) по крайней мере два покупателя, не нашедших нужного размера; в) ровно один покупатель, не нашедший подходящего фасона, два — не удовлетворенных качеством, пять — не удовлетворенных ценами и три — не нашедших нужного размера? Ответ: а) С?0(0,4)2(0,6)8; б) 1 - С?0(0,1)°(0,9)10 _ С}0(0,1)' χ χ (0,9)9- С?0 (0,1)2(0,9)*; B^jy^ (0,3)Ч0,2)2(0,4)5(0,1)2. 70
Математическое ожидание, дисперсия, ковариация При решении задач данного параграфа следует использовать соответствующие формулы гл. 5. 7.15. Для величин Yik, определенных равенствами (7.3), найти MYik9 OYik, cow(Yik, YJk),i*j9 cov(Yik, Гл),к*1. УКАЗАНИЕ. При любом / величины Fn,..., Yin независимы, поскольку связаны с разными испытаниями; независимы также любые наборы величин, у которых первые индексы (номера исходов) любые, а вторые индексы различные. Использовать формулы (5.8), (5.14), (5.18), (5.25) и решение задачи 7.9. Ответ: MYik=pi;OYik=pi(l-pi);cow (Yik, YJk)=-pipJ,i*j', cov(y/jk,:fy) = o,**/. 7.16. Найти математическое ожидание и дисперсию числа исходов / в общей полиномиальной схеме с η испытаниями. УКАЗАНИЕ. 1) Использовать представления (7.2), решение задачи 7.15, а также свойства математического ожидания и дисперсии; 2) число Х( исходов /вл испытаниях можно рассматривать как число успехов схемы Бернулли cp=piuq = 1 —pv Ответ: МХ( = ηρ^ΌΧ^ηρ^Ι-ρ^. 7.17. Найти ковариацию числа исходов / и числа исходов^ в общей полиномиальной схеме с η испытаниями. УКАЗАНИЕ. Воспользоваться формулой (5.25). Для вычисления MXjXj использовать равенство η XiXJ = ΛΣ Yik Yjk + ^ YikYJh являющееся следствием (7.2), и использовать независимость Yik, к = 1,..., η (см. указание кзадач е7.15). Ответ: cov (XhXj) =-npipj, i*j. 7.18. В общей полиномиальной схеме с η испытаниями для случайной величины Ζη = схХх + ... + cNXN, где с{9..., cN — постоянные, найти MZn и ΌΖη. УКАЗАНИЕ. Использовать результаты задач 7.16, 7.17 и формулу (5.27). Ответ: ΜΖη = па, ΌΖη = по2, а = cipl + ... + cNpN, η σ2 = Σ с} pt - a1. 71 4p
7.19. В N ячеек независимо друг от друга брошены η частиц. Вероятность попадания любой частицы в к-ю ячейку равно рк {к = 1,..., Ν). Обозначим через μ0 число пустых ячеек. Найти Λ/μ0. УКАЗАНИЕ. Использовать представление μ0 в виде суммы μ0 = Ζ, + ...+ΖΝ, (7.4) где Zk = 1, если к-я ячейка осталась пустой, и Zk = 0 — в противном случае. N Ответ: Σ (1 -рк)п. При/?! = р2 = ··· =Рм= 1/^ это выраже- к = \ ние имеет более простой вид: Ν( 1 — \/Ν)η. Последнее выражение совпадает с Μμ0, найденным в задаче 5.16. 7.20. Для величины μ0, определенной в задаче 7.19, найти lim т>Μμ0, если η = yN (γ > 0 — некоторая постоянная), k/N рк= J g(x)dx, k= 1 ЛГ, (к-0/Ν функцияg(x) = 0прил;£ [0, 1],на [0, 1] функцияg(x) дифференцируема и не равна тождественно 1. ι Ответ: j e~^(*) ах. о 7.21. Для величины μ0, определенной в задаче 7.29, найти Ζ>μ0. УКАЗАНИЕ. Использовать равенство μο= Σ Zk+ ΣΖ,Ζρ k=l ΐΦ} J получающееся из (7.4), так как Z\ = Zk, k = l,..., N. Ответ: Ζ>μ0= Σ (1-/>*)" + Σ (1 -ρ,-PjY -( Σ (1-/>,)"ΐ· k=\ i*j J \/=1 /
ЦЕПИ МАРКОВА Глава Определение Цепь Маркова является моделью зависимых испытаний, в которых исход в данном испытании зависит лишь от последнего известного предшествующего исхода и не зависит от далекого прошлого. Обычно исходы в марковских испытаниях называют состояниями цепи Маркова. Будем считать, что N состояний цепи Маркова занумерованы числами 1, 2, ... , N. Элементарным событием в η испытаниях цепи Маркова являются цепочки состояний, или исходов, длины η + 1, описывающие начальное состояние и результаты η испытаний: (/0, /,,..., in). Здесь исход /, при любом t (t = О, 1,..., η) может принимать любое из значений 1, 2, ... , N. Таким образом, множество элементарных событий Ω = {(/0, il9..., /„);/, = 1,... ,N;t = 0,l,... , η). (8.1) Если обозначить через At исход в испытании / цепи Маркова, то условие независимости от более далекого прошлого можно записать в виде P(At+l\A0Al...At)=P(At+l\At),t = Oy 1, 2,... ,/ι - 1. (8.2) Пусть событием At является наступление исхода / в t-u испытании, a At+ J — наступление исходау в (t + 1)-м испытании. Тогда правая часть (8.2) является функцией от ij и /. Иногда номер испытания называют моментом времени. Будем предполагать, что цепь Маркова однородна по времени. В этом случае правая часть (8.2) не зависит от времени (номера испытания) и является функцией от i,j: P(At+l\At) =Ру, / = 0, 1,... , η — 1. Вероятность/^является условной вероятностью того, что в испытании / + 1 состоянием цепи Маркова было у, если в момент / состоянием было /. Эти вероятности называются вероятностями перехода или переходными вероятностями. Если задать вероятности начальных состояний (состояний перед началом испытаний) цепи Маркова qx, ... , qNи переходные вероятностиptJ (i,J = 1, ... , Ν), то по Φ 73
формуле (4.1) с учетом (8.2) вероятность любого элементарного события (/0, ix,..., in) можно записать в виде ¥(i0,i\...in) = gioPiuiiPiii2...pin_]in. (8.3) Однородная по времени цепь Маркова с конечным множеством состояний является частным случаем конечной схемы, в которой элементарные события и соответствующие им вероятности определяются формулами (8.1) и (8.3). Для задания вероятности достаточно задать матрицу вероятностей перехода ( Р\\ Рп - P\n \ Ρι\ Ρύι - Pin Р = ,ри>0, ipu=U U=l,...,N (8.4) V Pn\ Ρνί ··· Pnn ) и вектор вероятностей начальных состояний (qx, ... , qN), qt > 0, Отметим, что вероятность любой более короткой, чем п, цепочки (/0, ix,..., /,), 1 < t< η, определяется формулой (8.1) с заменой η на t. 8.1. В цепи Маркова с двумя состояниями 1 и 2 начальным состоянием является 1. Найти вероятности цепочек состояний 111, 122, 121, если вероятности переходов/?^· (ij = 1, 2) задаются равенствами/?^ = 1/3, р2Х = 1/4. РЕШЕНИЕ. Из (8.4) при N = 2 следует, что Р\\ +Рп = Ь Ρι\ +Рп= !· Отсюда/?!, = 1 — 1/3 = 2/3, р22 = 1 — 1/4 = 3/4. Так как вектор вероятностей начальных состояний q = (qx, q2) по условию определяется равенством qx = 1, q2 = 0, то по формуле (8.3) находим Р(1П) =*!/>„/>„ = 2/3-2/3 = 4/9, Р(122)= qlPnp22= 1/3-3/4= 1/4, Р(\2\)=дхрпр2Х = 1/3. 1/4= 1/12. 8.2. В цепи Маркова с двумя состояниями 1 и 2 вектор распределения вероятностей по начальным состояниям и вероятности переходов определяются равенствами дх = 1/3, рхх = 6/7, р2Х = 4/5. Найти вероятности цепочек 121, 111, 222. УКАЗАНИЕ. Использовать равенства Я\ + #2 = *> Р\\ +Р\2 = Ь Ρ21 +Р22 = 1 и формулу (8.3). 74
Ответ: Р( 121) = 1/3· 1/7-4/5, Р(111) = 1/3-6/7-6/7, Р(222) = = 2/3 · 1/5 · 1/5. 8.3. Для цепи Маркова, определенной в задаче 8.1, найти вероятность того, что цепочка длины 3 начинается и кончается единицей. УКАЗАНИЕ. Событие, вероятность которого надо найти, состоит из двух элементарных событий 111, 121. Ответ: 19/36. 8.4. Для цепи Маркова, определенной в задаче 8.2, найти вероятности событий: А = {в цепочке длины 3 состояния чередуются}, В = {в цепочке длины 3 все состояния одинаковы}. УКАЗАНИЕ. А = {121, 212}, £={111,222}. Ответ: Р(А) = 4/35, Р(В) = 998/3675. 8.5. В цепи Маркова с тремя состояниями 1, 2 и 3 начальным состоянием является 1. Вероятности перехода за один шаг определяются равенствами рп = 1/5, рп = 2/5,/?21 = 1/3,/?22 = 2/3,/?3ι = 1/7, р32 = 2/7. Найти вероятность того, что в цепочке длины 3 не появится состояние 2. УКАЗАНИЕ. Событие, вероятность которого надо найти, состоит из следующих элементарных событий: 111, 131, 113, 133. Ответ: 71/175. 8.6. Найти матрицу вероятностей переходов цепи Маркова, дающей упрощенное описание работы телефона-автомата. Рассматриваются следующие четыре состояния: телефон свободен (состояние 1); телефон занят и нет очереди (состояние 2); телефон занят и в очереди стоит один человек (состояние 3) или два человека (состояние 4). Предполагается, что третьим в очередь никто не встает, предпочитая искать другой автомат. В каждую единицу времени с вероятностью 1/10 может подойти один человек; больше одного подойти не может. С вероятностью 1/3 независимо от длительности ведущегося разговора и независимо от длины очереди разговор в данную единицу времени заканчивается. РЕШЕНИЕ. Из состояния 1 (телефон свободен) можно перейти в состояние 1, если в данную единицу времени никто не придет. Следовательно,/? j! = 1 - 1/10 = 9/10. Из состояния 1 в состояние 2 переход происходит, если пришел один человек, т. е. рп = 1/10. В состояния 3 и 4 попасть за единицу 75
времени из состояния 1 нельзя, так как по условию задачи в каждую единицу времени может появиться не более одного человека. Из состояния 2 возможны переходы в состояние 1 (разговор окончился, и никто не пришел); в состояние 2 (разговор не кончился, и никто не пришел; разговор кончился и пришел один человек); в состояние 3 (разговор не кончился, и подошел один человек). Перемножая соответствующие вероятности, находим Ή = К1" То \ р» = {1" I X1 - То ) + Г То> Из состояния 3 в состояние 3 можно перейти двумя способами: 1) разговор кончился, и подошел один человек; 2) разговор не кончился, и никто не подошел. Аналогично рассматриваются остальные переходы из состояния 3 и переходы из состояния 4. Получим следующие выражения: /?31 = 0^32=з(1-То) ^33=1·ϊδ + (1-5Χ1-ά)^34 = (ΐ-§)·^ Ра\ = °> />42 = °> Раз = V3, Ρ и = 1 - 1/3. Таким образом, найдены все переходные вероятности: ри = 9/10, рп = 1/10, р]3 = 0, ρ и = 0, р2Х = 9/30, р22 = 19/30, р23 = 2/30, р2А = 0, Рз\ = °> Рз2 = 9/30, />33 = 19/30, р34 = 2/30, />41 = °> />42 = °> />43 = V3, />44 = 2Л Марковское свойство Обозначим через Xt (t = 0, 1, 2,...) состояние цепи Маркова в момент (или в испытании) /. В терминах случайных величин Xt марковское свойство может быть сформулировано следующим образом: равенство P{Xt + s=J\As;Xt=i} = ¥{Xt + s=j\Xt = i} выполняется при любом s > 1, / > 0 и любом событии As, которое может быть определено через случайные величины Х0,Х{9... , Xs. Цепи Маркова, определенные в § 8.1, удовлетворяют этому условию. 76
8.7. Проверить, что независимые случайные величины Х0, Хи ..., Хп, для которых Р{Хк = 1} =р19 Р{Хк = 2} =р29 Р{Хк = 3} =р3 (Р\ + Pi +р3 = Ь Л = 0, 1> ··· 9 ")·> являются цепью Маркова. Найти начальное распределение вероятностей и матрицу вероятностей перехода. РЕШЕНИЕ. Для независимых случайных величин вероятность значений данной величины не зависит ни от значений предыдущей величины, ни от более далекой, следовательно, марковское свойство выполняется. Покажем это формально. Из независимости случайных величин следует, что условные вероятности в равенстве, определяющем марковское свойство, равны при любых ins безусловным: Р{*,+„ =j \AS, Χ, = i) = P{Xt+s =j) =Pj, P{X( + s=J\Xt=i} = F{Xt+s=j) =Pr Отсюда следует, что марковское свойство выполняется. Из второго равенства при s = 1 получаем матрицу вероятностей переходов: Ρ η =P\>Pi2 —Рг>Рп =Рз при любом /. Таким образом, Р = Начальные распределения вероятностей находим непосредственно из условий задачи: gi = P{X0 = i}=pi, /=1,2,3. 8.8. Пусть случайная величинаXt = 1 (/= 1, 2,..., η), если в испытании / схемы Бернулли с вероятностью успеха/? в отдельном испытании произошло четное число успехов, и Xt = 2 — в противном случае. Показать, что XQ = l9Xl9..., Хп образуют цепь Маркова. Найти матрицу вероятностей переходов. УКАЗАНИЕ. Четность числа успехов, появившихся к данному испытанию, зависит только от четности числа успехов, появившихся к предыдущему испытанию. Ответ: рп = д, Р12=Р, Р2\ =Р> Рц = #> 9=1-Р· 77 Р\ Pi ?\ Рг Ръ Рг Ръ Рг Р\
8.9. Пусть Xl9 Х2, ... , Χη — независимые случайные величины, для которых при любом к Р{Хк=\}=р, Р{Хк = 0} = д, д=1-р. Показать, что последовательность пар (Х1Х2), (Х2Х3), ... ..., (Хп _{,Хп) является цепью Маркова. Найти матрицу вероятностей переходов. УКАЗАНИЕ. Обозначим возможные значения пар (0, 0), (0, 1), (1, 0), (1, 1) числами 1, 2, 3,4. Найти вероятности PiJ = P{(Xt+l,Xt + 2) =j\(XpXt+l) = ή, /,./=1,2,3,4. Часть из этих вероятностей равна нулю. Например, из состояния 1 = (0, 0) нельзя попасть в состояние 3 = (1,0). Это означало бы, что Хг = 0,Хг+1 = 0иХ(+1= 1, Xt + 2 = 0. Таким образом,/?13 = 0. Ответ: Р = q ρ 0 0 0 0 q p q ρ 0 0 L° о я ρ 8.10. Матрица Ρ вероятностей перехода цепи Маркова с тремя состояниями 1, 2, 3 определяется равенством [2/7 3/7 2/7" Р=\ЪР 2/7 2/7 L2/7 2/7 3/7_ По последовательности состояний этой цепи Маркова определяется новая последовательность по следующему правилу: в исходной последовательности состояние 2 заменяется состоянием 1, а состояние 3 — на состояние 2; состояние 1 не меняется. Показать, что новая последовательность является цепью Маркова. Найти ее матрицу вероятностей переходов. УКАЗАНИЕ. Новая последовательность получается объединением состояний 1 и 2 исходной последовательности. При проверке марковского свойства нужно, в частности, для новой последовательности вычислить вероятность перехода из состояния 1 в состояние 2. Состояние 1 новой последовательности не определяет однозначно состояние старой последовательности; новому состоянию 1 может соответствовать старое состояние 1 или старое состояние 2. Однако вероятность перехода в старое состояние 3 из этих состояний одинакова и равна 2/7. Ответ: 5/7 2/7 |_4/7 3/7. 78
8.11. Матрица Ρ вероятностей перехода цепи Маркова с тремя состояниями 1, 2, 3 определяется равенством Г1/7 3/7 3/7" Р= 3/2 1/7 3/7 |_2/7 2/7 3/7J По тому же правилу, что и в задаче 8.11, определяется новая последовательность. Показать, что новая последовательность является схемой Бернулли. Найти вероятность успеха в отдельном испытании. УКАЗАНИЕ. Воспользовавшись указанием к задаче 8.10, доказать, что новая последовательность является цепью Маркова, и найти ее матрицу вероятностей перехода. См. также задачу 8.7. Ответ: 4/7. 8.12. Показать, что для цепи Маркова с двумя состояниями и ' Р\\ Рп .Рг\ Рп_ переходов тоже является цепью Маркова. Найти ее матрицу вероятностей переходов. УКАЗАНИЕ. Состояниями новой цепи Маркова являются пары (1, 1), (1,2), (2, 1), (2, 2). Из состояний (1, 1) и (2, 1) можно перейти только в состояние (1,1) или в Π, 2), так как в исходной цепи (1, 1) означает, что цепь попала в состояние 1 и следующий переход должен начинаться с 1. Из состояний (1,2) и (2, 2) можно перейти только в (2, 1) и (2, 2). матрицей вероятностей перехода Ρ = последовательность Ответ: Р = Р\\ Рп 0 0 " 0 ° Рп Рп Р\\ Рп ° ° 0 0 р2х р22. ч8.3/ Уравнения Колмогорова Вероятности перехода P{Xt + s =j \XS = /} за / шагов из состояния / в состояние^ для однородной цепи Маркова не зависят от s. Положим Pu(t)=P{Xt=j\X, = i). Из основного марковского свойства нетрудно получить (см., например: [6]; § 8.2) систему уравнений Колмогорова Pu(t + s)= iPik(s)PkJ(t) (iJ=l9...,N). (8.5) 79
Отсюда, в частности, имеем следующие две системы уравнений. При s = 1 /у/+1)= iplkPkJ(t) VJ=l,...,N). (8.6) J k=\ J Полагая в (8.5) t = 1 и заменяя в получившемся равенстве s на /, приходим к другой системе PtJ(t+ 1) = Σχ Pkj{t)pkj (U= 1,... ,Ν). (8.7) Обозначим через P(t) матрицу вероятностей перехода Ρ^(ί): гри(0 pl2(t) ... л*(»' ^(0= ^21(0 ^22(0 - P2N«) L^i(0 ^2(0 - Ρνν(0] Равенства (8.5) теперь можно переписать в матричном виде P(/ + s)=P(s)P(0· (8.8) Отсюда при s = 1 получим P(f + l) = P-P(t), (8.9) где Ρ = \\рц\\ — матрица вероятностей перехода за один шаг Ри(\) = = Pij' Вычисление вероятностей перехода за / шагов сводится к вычислению t-й степени матрицы Р. Из (8.9) следует, что P(t)=P*. (8.10) 8.13. Найти вероятности переходов за два шага для цепи Маркова, определенной в задаче 8.1. УКАЗАНИЕ. Использовать формулу (8.10). Ответ: Рп(2) = 19/36, Рп{2) = 17/36, Р21(2) = 17/48, Р22(2) = = 31/48. 8.14. В условиях задачи 8.6 найти вероятность того, что телефон-автомат через 2 ед. времени будет сво§оден, если он был свободен в начальный момент. УКАЗАНИЕ. Найти вероятность />11(2) для цепи Маркова, определенной в задаче 8.6. Воспользоваться формулой (8.10). Ответ: 21/25. 8.15. Найти вероятности переходов за два шага в цепи Маркова, определенной в задаче 8.7. УКАЗАНИЕ. Воспользоваться решением задачи 8.7 и формулой (8.10). Ответ: рк1(2)=Ри рк2{2) = Р2, рк3(2) =Р3, к=1, 2,3. 80
8.16. Найти вероятности переходов за t шагов в цепи Маркова, определенной в задаче 8.7. Ответ: Pkl(t) = />7, /= 1,2, 3, к= 1,2,3. 8.17. Найти вероятности переходов за t шагов в цепи Маркова с двумя состояниями, если Ри = 1 - а, Рп = а, Р21 = β, Р22 = 1 - β; 0<а< 1, 0 < β < 1. Ответ: Λι(0 Л2(0" />2l(0 ^22(0. 1 а+ β "β α" β α ι (1-α-β)' α+β а -а -β β УКАЗАНИЕ. Доказать по индукции, что приведенное в ответе выражение является /-й степенью матрицы Р. <Έ.4> Предельные вероятности Для важного класса цепей Маркова поведение их через большой промежуток времени не зависит от начального состояния. Теорема 8.1. Если при некотором /0 > О все элементы матрицы Р*° положительны, то существуют положительные пределы ton Ρ Μ) = π,, j=l,....,N; i=l,...,N, (8.11) и не зависят от начального состояния. Предельные вероятности удовлетворяют системе уравнений nJ= L nkPkp j=U...,N. (8.12) Систему (8.12) можно получить переходом к пределу при / -* оо в равенстве (8.7). Вероятность Р{Х} =j} определяется по формуле Р{^ =j} = Σ Ρ{Χ0 = i)Y{Xx =j \X0 = /}. (8.13) ι = 1 Если в качестве начального распределения Р{Х0 = /} = qi (/ = 1,... ...,Ν) взять предельные вероятности π; (/ = 1,..., Ν), то из (8.13) и (8.12) следует, что через один шаг распределение вероятностей не изменится: Р{Х{ =j} = Kj,j = 1,... , TV. Таким образом, распределение щ, ... , π^ не меняется во времени. Эти вероятности называют стационарным распределением. Уравнения (8.12) всегда линейно зависимы. К этим уравнениям нужно еще добавить уравнение ку + π2 + ... + κΝ = 1. 81
8.18. Найти стационарное распределение вероятностей цепи Маркова, определенной в задаче 8.1. РЕШЕНИЕ. При решении задачи 8.1 были найдены следующие вероятности перехода: Рп = 2/3, Рп = 1/3, Р21 = 1/4, Р22 = 3/4. Уравнения (8.12) в данном случае при N=2 имеют вид 7^ = К\Р\\ + ^2^21' π2 = πΐ^12 ~*~ π2^22* Подставив в эти уравнения числовые значения, находим -2 м 1 - 1 м 3 πι~3πι 4π2; π2~3πι 4π или 1 _ 1 1 _ 1 3πι 4π2' 4π2 3πι* Уравнения одинаковы. Добавив уравнение πλ + π2 = 1, находим решение: π! = 3/7, π2 = 4/7. 8.19. Найти стационарное распределение вероятностей цепи Маркова, определенной в задаче 8.2. Ответ: п{ = 28/33, π2 = 5/33. 8.20. Найти стационарное распределение вероятностей цепи Маркова, использованной в задаче 8.6. Ответ: п{ = 45/64, π2 = 15/64, π3 = 5/96, π4 = 1/96. 8.21. Используя цепь Маркова, определенную в задаче 8.6, найти приближенное значение вероятности того, что через большой промежуток времени телефон-автомат будет свободен. УКАЗАНИЕ. Найти lim Рх, (t). Для вычисления предела можно при- менить теорему 8.1, так как для этой цепи Маркова Р2 > 0. Воспользоваться решением задачи 8.20. Условие Р' > 0 означает, что через t шагов из любого состояния можно попасть с положительной вероятностью в любое состояние. В данной задаче нетрудно без перемножения матриц убедиться, что через 2 ед. времени с положительной вероятностью можно из любого состояния попасть в любое другое. Ответ: 45/64. 8.22. Показать, что цепь Маркова с двумя состояниями и мат- 0 ί] рицей вероятностей перехода Ρ = пределения. 1 0 не имеет предельного рас- 82
РЕШЕНИЕ. Нетрудно проверить, что Ρ2 = Р3=р2.р=ру р4 = р2? рЬ=р р6 = р2ит д ; , следовательно, аким образом, P2t = 1 О О 1 , />*+! = 0 1 1 О Отсюда, например, для Pn(t) имеем .«Hi·; 1, если/четное, , если/нечетное. Следовательно, при / —► оо последовательность Pn(t) не имеет предела. Заметим, что для данной цепи Маркова условия теоремы 8.1 не выполняются. 8.23. Найти стационарное распределение вероятностей для цепи Маркова с тремя состояниями и матрицей вероятностей переходов Р = 1/2 1/4 1/4 О 3/4 1/4 О 1/4 3/4_ РЕШЕНИЕ. Уравнения (8.12) имеют вид 1 1 1 1 1 πι~ 2πΐ' π2~ 4πι + 4π2+ 4π3' π3~ 4πι + 4π2+ 4Кз' Из первого уравнения следует, что π! = 0, а два других уравнения преобразуются к одному и тому же уравнению 1 1 4π2~ 4π3· Отсюда, учитывая, что π! + π2 + π3 = 1, находим π2 = 1/2 и π3 = 1/2. Таким образом, получили следующее стационарное распределение вероятностей: π1 = 0, π2 = 1/2, π3 = 1/2. В этом случае условия теоремы 8.1 не выполняются, так как в состояние 1 нельзя попасть ни из состояния 2, ни из состояния 3. Пределы вероятностей перехода при / —► оо существуют, но не все они положительны (п{ = 0). 8.24. Найти стационарное распределение для цепи Маркова, образованной последовательностью переходов в цепи Маркова с двумя состояниями (см. задачу 8.12). 83
РЕШЕНИЕ. В задаче 8.12 найдена матрица цепи Маркова, образованной последовательностью переходов. Состояниями этой цепи Маркова являются пары: (1, 1), (1, 2), (2, 1), (2,2). Уравнения (8.12) принимают вид πΐ1 =Р\\(К\\ + π2ΐ)> π21 =/?2ΐ(πΐ2 + π22)' П\2=Рп(К\\ +π2ΐ)> π22=/?22(πΐ2 + π22)' где вероятности переходов/?^· относятся к исходной цепи Маркова с двумя состояниями. Отсюда с учетом условия нормировки πΠ + π12 + + π21 + π22 = 1 получаем стационарное распределение вероятностей РпРи = РмРи _ РпРп 8.25. По целым точкам отрезка [0, п] движется частица. Из любой точки к (О < к < п) частица независимо от прошлого движения переходит с вероятностью/? в точку к + 1 и с вероятностью q = 1 — ρ — в точку к — 1. В точках 0 и η частица остается навсегда (поглощающие состояния). Составить системы уравнений для вероятностей Pk0(t) (к = 0, 1,... ,п) для вероятностей Pkn(t) (к = 0, 1,... ,п). УКАЗАНИЕ. Для составления уравнений, которым удовлетворяют вероятности Pk0(t) (к = 0, 1, ... , я), воспользоваться формулой полной вероятности (см. формулу (3.1)): Р(А) = PiB^PiAlB,) + Р(В2)Р(А \В2), где А = {частица, вышедшая из состояния к, на t + 1 шаге находится в состоянии 0}, Вх = {частица, вышедшая из состояния к, на первом шаге перешла в состояние к + 1}, В2 = {частица, вышедшая из состояния к, на первом шаге перешла в состояние к - 1}. Ответ: 1) PM(t+ 1) =pPk + U0(t) + qPk_^(t),k = 1,..., л - 1; 2)Pkn(t+\)=pPk+ln(t)+qPk_ln(t),k=U...,n-L 8.26. Для цепи Маркова, определенной в задаче 8.25, составить уравнения для вероятностей поглощения пк0 = lim Pk0(t), nkn = t—»оо = lim Pkn(t). УКАЗАНИЕ. Перейти к пределу при t -* <*> в системах уравнений, приведенных в ответе к задаче 8.25. 84
Ответ: I) пк0=рпк+10 +qnk_l0, λ:= 1,... ,л - 1; 2) пкп =рпк + 1п + qnk_ln, к = 1,..., η - 1. 8.27. Найти вероятности поглощения пк0, пкп, введенные в задаче 8.26, в случае, когда/? =д= 1/2. УКАЗАНИЕ. При/? = q = 1/2 вероятность π^ο =//t, рассматриваемая как функция от &, удовлетворяет равенствам Л= 2(Α-ι+Λ + ι>» Л=1,2,...,я-1 и очевидным граничным условиям/0 = 1,/я = 0, так как частица, находившаяся в точке 0 в начальный момент, не выйдет из этой точки, а при начале движения из точки η частица никогда не попадет в точку 0. Функция/^. = Сх + С2к удовлетворяет приведенным выше равенствам. Используя граничные условия, подобрать С, и С2. Для вероятности пкп =/к граничные условия имеют следующий вид:/0 = 0,/Л = 1. Ответ: пк0= 1 - к/п,пкп = к/п. Математическое ожидание и дисперсия. Закон больших чисел Обозначим через Zt(t) время пребывания (число попаданий) в состоянии / цепи Маркова за время /. Будем говорить, что частота Z((t)/t попадания в состояние / удовлетворяет закону больших чисел, если для любого ε > 0 при t-+ оо р{|£*>-„|<.}~,, где π,·, / = 1,..., Ν, — стационарные вероятности. При изучении величины Zt(t) часто оказывается полезным следующее ее представление в виде суммы: Z,(/) = УД1) + ГД2) + ... + ГДО, (8.14) где Υt{s) = 1 (s = 1,..., t), если в моментs состоянием цепи Маркова было /, и Υ ι (s) = 0 в противном случае. 8.28. Выразить через вероятности перехода Pki(s) математическое ожидание числа Zt(t) попаданий в состояние / за время /, если начальным состоянием цепи Маркова было к. 85 <$
РЕШЕНИЕ. Из (8.14) и свойств математического ожидания находим MZ,(/) = МГД1) + ... + МУД/). (8.15) Случайная величина Y((s) = 1 в том случае, когда в момент s цепь Маркова находилась в состоянии /, т. е. в случае, когда за время s произошел переход из состояния к в состояние /. Отсюда имеем Р{УД£) = 1} = Pki(s), следовательно, MYt(s) = Pki{s). Подставив это выражение в (8.15), получим искомое выражение MZ,(/)= itPki(s). (8.16) 5 = 1 8.29. Найти выражение для дисперсии числа появлений Zz(/) состояния / в цепи Маркова за время /, если в начальный момент времени t = 0 состоянием цепи Маркова было к. РЕШЕНИЕ. Найдем сначала MZf (t). Используя (8.14), получим Z}{t)= Σ Г,{*Х)ГМ. s{,s2 = \ Величины Y;(s) принимают только значения 0 или 1, следовательно, Y} (s) = Y;(s). Принимая во внимание это замечание, преобразуем Z} (t) к следующему виду: Z}(t)= 1ВД+2 Σ YiisJYfa). S = \ 1<5|<52</ Отсюда MZf (t) = ΜΖ,.(ί) + 2 Σ MY,.(Sl) y,(j2). Ki|<i2</ Произведение Yi(sl)Yi(s2) равно единице в том случае, когда за время sl произошел переход из А: в ι, а за оставшееся время s2 — s, переход из / в /, следовательно, P{Y^)Y,(s2) = \} = Pki(s1)Pa(s2-sl). Подставляя это выражение в формулу для MZf (ί), получим MZf (/) = MZ,.(t) + 2Σ Σ Рк1^)Ри{82 -s,). Отсюда и из формулы OZi(t)=MZ}(t)-(MZf(t)y находим окончательное выражение DZ,(/) =MZ,(f) +2 Σ* 'Σ Pki{v)Ptt(u) - (ΜΖ,.(Ο)2. v=5=l u = \ 86
8.30. Для цепи Маркова X(t) с двумя состояниями (см. задачу 8.17) найти математическое ожидание числа попаданий Zx{t) в первое состояние за время /, если Х(0) = 1. УКАЗАНИЕ. Воспользоваться решением задач 8.28 и 8.17. Ответ: Μ(Ζ,(/)|ΛΓ(0) = 1) = Щ + (1 - π,)1^^! - (1 - -а-р)0,гдея1 = ^-р. а + (3 8.31. Для цепи Маркова с двумя состояниями (см. задачу 8.17) найти lim \ Μ(Ζ,(/)|Χ(0) = 1). УКАЗАНИЕ. Воспользоваться решением задачи 8.30. Ответ: β/(α + β). 8.32. Для цепи Маркова с двумя состояниями (см. задачу 8.17) найти \im\b(ZAt)\X{0) = 1). УКАЗАНИЕ. Воспользоваться решениями задач 8.17, 8.29 и 8.30. αβ(2-α-β) Ответ: (α+β)3 8.33. Доказать, что в цепи Маркова с двумя состояниями (см. задачу 8.17) число попаданий Zx(t) в первое состояние за время / удовлетворяет закону больших чисел: для любого ε > 0 limpi Ιίζ,ίΟ-π,Ι <εί = 1, /_>οο Μ / I ΓΛβπ! = β/(α + β). РЕШЕНИЕ. Согласно неравенству Чебышёва р||1^(0 -1м^(о| >ε| < -^0^,(0. Из решения задачи 8.32 следует, что правая часть этого неравенства стремится к нулю при / —► оо. Отсюда, воспользовавшись тем, что (см. задачу 8.30) -MZx(t) = щ + о(1) при / -► оо? получаем для любого ε > 0 при / —► оо Отсюда следует приведенное в задаче утверждение. 87
8.34. Для цепи Маркова, удовлетворяющей условиям теоремы 8.1, найти lim - MZAt), где Ζ At) — число попаданий в со- /_>оо ΐ стояние / за время t. УКАЗАНИЕ. Воспользоваться теоремой 8.1, решением задачи 8.28 и следующим утверждением: если последовательность хп (п = 1, 2, ...) имеет предел а = lim χ , то последовательность у = (х, + ... + χ )/η Л->оо имеет тот же предел lim yn = а. л->оо Ответ: lim -MZAt) =π,, где π.· = lim PkAt). Г->оо / /_>oo 8.35. В цепи Маркова с двумя состояниями (см. задачу 8.17) найти lim - MZ]7(t), где Z]7(t) — число переходов из состояния 1 в состояние 2 за время /. УКАЗАНИЕ. Рассмотреть цепь Маркова, образованную переходами исходной цепи Маркова. Воспользоваться также решениями задач 8.24 и 8.34. Ответ: αβ/(α + β). Предельные теоремы для времени пребывания в состоянии Приведем теорему о числе попаданий Zf(t) в /-е состояние за время /, обобщающую теорему Муавра — Лапласа. Теорема 8.2. Пусть цепь Маркова удовлетворяет условиям теоремы 8.1. Тогда при / —► оо существуют пределы at= lim^MZ,(0, σ? = Κηι-,ΌΖΛί), 0<я,<оо, 0< σ? < οο, и при любом χ > О *^°° [ Gi>Jt \ «J2n -°° 8.36. Получить теорему Муавра — Лапласа как следствие теоремы 8.2. УКАЗАНИЕ. Рассмотреть цепь Маркова с двумя состояниями (N = 2) и сРи =Ρι\ ~Ρ·> Р\2 =Ρι\ = * ~Р = Q (а = #> β = г)· Воспользоваться решением задач 8.31 и 8.32. 88
8.37. Для цепи Маркова с двумя состояниями (N = 2) и срхх = = 1/4, р22 = 1/3 найти приближенное значение вероятности того, что время Zx{t) пребывания в состоянии 1 за время / = 10 000 не превосходит 4 738. РЕШЕНИЕ. Воспользуемся решениями задач 8.31, 8.32 и теоремой 8.2. Параметры α и β определим из равенств 1/4=1- а, 1/3 = = 1 - β: а = 3/4, β = 2/3. Тогда ах=ш\мгх«) = ^=*, =0,47058..., и сх = 0,320288.... По теореме 8.2 г^(0-Т7в 1000° Ρ{Ζι(/)<4 738}-Ρ ^ < 4738-4705 Н-ж!«-"","-!+*(1>· 32,0288 По таблице 1 приложений находим, что Ф0( 1) = 0,3413, следовательно, P{Zx(t) < 4 738} «0,8413. 8.38. Для цепи Маркова, определенной в задаче 8.37, найти приближенное число испытаний / такое, что доля времени, проведенного в первом состоянии Zx(t)/t, отличается от предельной вероятности π! = 8/17 не больше чем на 0,01 с вероятностью, не меньшей 0,99. УКАЗАНИЕ. Воспользоваться теоремой 8.2 и равенством \Ζχ(ί)-πχί\ Ρ Ответ: 6828. ||1^(о-^|<а|=р| а,// < δ// σι
ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ Глава 9.1/ Определение вероятности Геометрические вероятности являются вероятностной моделью с бесконечным числом исходов, аналогичной классическому определению вероятности для опытов с конечным числом исходов. Элементарными исходами в схеме геометрических вероятностей являются, например, множества точек прямой либо какие-нибудь точки областей плоскости или трехмерного пространства; в качестве элементарных событий могут рассматриваться точки в пространствах любой размерности. Ограничимся для определенности рассмотрением в качестве элементарных событий точек (w„v) некоторой области Ω в плоскости с заданной системой декартовых координат. Множество точек области Ω бесконечно. События являются подмножествами области Ω. При бесконечном числе исходов формула (5.2) уже не может быть использована. Однако сам принцип определения вероятности события суммированием элементарных вероятностей сохраняется. Будем «суммировать» элементарные площади аи dv по точкам («, ν), составляющим событие А Вероятностью события А в модели геометрических вероятностей называется число площадь Л v ; площадь Ω ν ' Эту формулу можно записать в виде Р(А) = —^iidwdv. (9.2) v ' пл. Ω α ν ' Элементарным вероятностям/?(ω) в формуле (5.2) в формуле (9.2) dw.dv соответствуют элементарные площади ^, а суммирование заменяется интегрированием. Уже эта простая модель приводит к некоторым осложнениям по сравнению с конечной схемой. 90
В конечной схеме любое подмножество мы называли событием. Здесь этого сделать нельзя, так как не для всех подмножеств определена площадь; есть неквадрируемые фигуры. Мы не будем рассматривать эти особенности схем с бесконечным числом исходов, так как для достаточно широкого круга задач эти трудности не возникают. 9.1. Пассажир может ехать на любом из автобусов двух маршрутов. Временное интервалы между моментами появления автобусов этих маршрутов равны соответственно 5 мин и 12 мин. Найти вероятность события А — {пассажир будет ждать не более 3 мин}. РЕШЕНИЕ. Элементарным событием будем считать точку (w, v): и — время до появления автобуса с 12-минутным интервалом (0 < и< 12), a v — время до появления другого автобуса (0 < ν < < 5). Элементарные события образуют прямоугольник Ω = {(и, ν): О < w < 12, 0 < ν < 5} (рис. 2). Событие А определяется следующим условием: наименьшая из координат не превосходит 3, т. е. А = {(«, v): min (и, ν) < 3}. На рисунке 2 область прямоугольника Ц соответствующая А, заштрихована. Нетрудно проверить, что пл. Ω « 60, а пл. А = 42. Таким образом, по формуле (9.1) находим Ρ (А) = 42/60 = 0,7. 9.2. На квадрат Ω = {(w, ν): 0 < w < 1, 0 < ν < 1} брошена точка. Найти вероятность того, что точка будет удалена от центра квадрата не больше чем на 1/2. Ответ: π/4. 9.3. Двое договорились встретиться между 12 и 13 ч. Пришедший первым ждет второго 10 мин. Найти вероятность того, что встреча произойдет. 91
УКАЗАНИЕ. Элементарный исход (#, ν): и — момент прихода первого из договаривающихся в минутах; ν — момент прихода второго в минутах. Множество Ω = {(«,ν):0<# < 60, 0 < ν < 60} — квадрат. Определить точки квадрата, соответствующие событию А = {встреча произошла}. Воспользоваться формулой (9.1). Ответ: 11/36. 9.4. К преподавателю для сдачи зачета с 9 до 10 ч должны прийти два студента: Николай и Егор. Николаю для сдачи зачета потребуется 20 мин, а Егору — 10 мин. Найти вероятность того, что ни одному из них не придется ждать. УКАЗАНИЕ. Элементарным событием считать точку (w, v): и — число минут, прошедших после 9 ч до прихода Егора, a v — число минут до прихода Николая. Ответ: 41/72. 9.5. К причалу между 8 и 18 ч должны подойти две баржи. Одна должна разгружаться 2 ч, а другая — 3 ч. Какова вероятность того, что ни одна из них не попадет во время разгрузки другой? Ответ: 113/200. 9.6. В интервале времени [0, Т] в случайный момент появляется сигнал длительности Δ. Приемник включается в случайный момент на время /. Найти вероятность обнаружения сигнала. Δ + t t2 + Δ2 Ответ: IT2 9.7. По объективным причинам интервалы движения автобусов возросли до 40 мин. Расстояние между остановками С и D автобус проходит за 4 мин, а пешеход за 24 мин. Пассажир приходит на остановку С в случайный момент времени. Найти вероятность того, что автобус не обгонит пассажира, если пассажир сразу пойдет пешком из С в D. УКАЗАНИЕ. Принять за элементарное событие момент и прихода пассажира в интервале (0,40). В этом случае множество Ω = {и: 0 < и < < 40}. Вероятность любого события А определяется вместо формулы (9.1) формулой ддинаЛ v ' длина Ω Автобус не обгонит пассажира, если и + 24 < 40 + 4. Ответ: 1/2. 92
9.8. Монета упала на дощатый пол. Ширина доски 2Н, радиус монеты г (2г < 2Н). Какова вероятность того, что монета попадет в щель? УКАЗАНИЕ. Положить Ω = {и: 0 < и < Н}\ и — расстояние от центра монеты до ближайшего края доски. Ответ: 2/Н. 9.9. В задаче 9.8 рассмотреть случай более узкой доски, когда Η < г < 2Н. Найти вероятность того, что монета накроет к щелей (£=1,2). Ответ: 1) (1 -r/Η), к = 1; 2) г/Н- 1, к = 2. 9.10. Монета радиуса г упала на пол, выложенный квадратными плитками со стороной 2а (г < а). Какова вероятность того, что край монеты будет пересекать границы квадратов в четырех точках? Какова вероятность того, что монета будет лежать внутри одного квадрата? УКАЗАНИЕ. В качестве множества Ω выбрать квадрат: Ω = {(и, ν): |ι/| < α, |ν| < α}. Здесь (и, ν) — координаты центра монеты. Начало координат — общая вершина четырех квадратов. Край монеты пересечет границы квадратов в четырех точках, если центр монеты удален от начала координат меньше чем на радиус монеты. Ответ: пг2/(4а2), (1 -г/а)2. 9.11- (Задана Бюффона.) На дощатый пол упала игла. Ширина доски 2L, длина иглы 2/ (/ < L). Найти вероятность того, что игла пересечет щель. УКАЗАНИЕ. В качестве элементарного события можно взять точки (φ, и): и — расстояние середины иглы до ближайшей щели; φ — угол наклона иглы. Тогда Ω = {(φ, «):0<φ<π, 0< и < L}. Ответ: 21/(Ln). Случайные величины Случайные величины являются функциями от элементарных событий. Если X = Х(и, ν) — случайная величина, то событие {а < X < Ь) является множеством тех (w, v), для которых эти неравенства выполняются: {а <Х< Ь) = {(и, v):a< X(u, v) < b}. 9.12. В задаче9.1 обозначим через X время до прихода автобуса. НайтиР{ЛГ>2}. 93
РЕШЕНИЕ. Случайная величина X определяется равенством Х(и, v) = min (и, ν). Событие {Х> 2} означает, что обе координаты больше 2: имеем {Х> 2} = {(и, ν): и > 2, ν > 2}. Этому множеству соответствует прямоугольник со сторонами 3 и 10, расположенный в правом верхнем углу прямоугольника Q = {(w,v):0<w<12, 0 < ν < 5}. По формуле (9.1) Р{Х> 2} = 30/60 = 1/2. 9.13. В задаче 9.1 определим У расходы пассажира на проезд: если приходит автобус, имеющий интервал 5 мин, то пассажир ничего не платит (у него проездной), а если приходит другой автобус (загородный), то пассажир платит 10 к. Определить Υ как функцию от элементарного события. Найти закон распределения Υ Ответ: {Υ = 0} = {(и, ν): ν < и], {Υ = 1} = {(и, ν): ν > и}; Ρ{Υ=0} = 19/24, Ρ{Υ= 10} = 5/24. 9.14. На квадрат Ω = {(w, v): \u\ < 1, |v| < 1} брошена точка. Определим случайные величины Χ, Υ, Ζ: ν vt \ ν w ч i *' если ^и 2 + v 2 < V2, 1о,если7*/2 + У2>1/2, Ζ = Ζ (и, ν) = 4 и2 + ν2 — расстояние между точкой и центром квадрата. Найти вероятности событий: Р{Х> 0}, Р{У= 1}, Ρ{Ζ> 1}. Ответ: Р{ЛГ>0} = 1/2; Р{Г=1} = тс/16; Р{Г> 1} = 1-π/4. Δ Функция распределения и плотность \/ распределения вероятностей Функцией распределения случайной величины X называется функция Fx(x) = Р{Х < х}, —оо < χ < оо. Зная функцию распределения, можно найти вероятности любых событий, связанных со случайной величиной. Например, Р{Х> Ь) = 1 — Fx(b)> P{a<X<b} = Fx{b)-Fx{a). (9.3) Если случайная величина принимает только конечное или счетное число значений, т. е. существуют такие ху, х29..., хп,..., для которых ΣΡ{Χ=χ„} = \, п= 1 то случайная величина называется дискретной. Функция распределения дискретной величины ступенчатая. 94
Если функция распределения Fx{x) представляется при любом χ в виде *х(х)= ] Px(")du, (9.4) — оо то функция рх(и) называется плотностью распределения случайной величины X. В этом случае функция распределения непрерывна. Поскольку функция распределения дискретных случайных величин ступенчатая, такие величины не имеют плотности распределения. Случайные величины, имеющие плотность распределения, иногда называют непрерывными. Через плотность распределения просто выражается вероятность события {а < Х< Ь}\ Р{а <Х< Ь) = jpx(u) dw. (9.5) а В точках непрерывности плотность распределения рх{х) = = F'x (χ) . Функция распределения определяет закон распределения любой случайной величины. Однако для дискретных случайных величин закон распределения удобно задавать перечислением их значений х{9 х2, ... , хп, ... и указанием соответствующих вероятностей оо Р{Х=хп) = рп (рп >0, Σ рп = 1). Для непрерывных случайных ве- личин закон распределения часто удобнее задавать плотностью распределения. 9.15. Найти функцию распределения и плотность распределения случайной величины X (времени ожидания автобуса), определенной в задачах 9.1 и 9.2. РЕШЕНИЕ. Очевидно, что Fx(x) = Р{Х < х) = 0 при χ < О (отрицательным Xне может быть) и Fx(x) = 1 прил: > 5 (ЛГнаверняка не превосходит 5); при любом исходе (и, ν) значения X = = Х(и, ν) удовлетворяют неравенствам 0<X(u,v) < 5. Если 0 < χ < 5, то вероятность события Ах = {(и, v):min (и, ν) <χ} находится так же, как в задаче 9.1 вероятность А* пл.^4х = 60- (5-х)(12-х),пл. Ω = 60, пл. Ах \7х — х2 Fx(x) = P(Ax) = -^ = l-^yL,0<x<5. При тех же значениях χ находим 17 — 2х px(x) = Fx(x) = —m—.
Таким образом, ί 0, если χ < О, Fx(x) = i (17χ-χ2)/60, если 0<х<5, [ 1, если х> 5; Г (17 — 2jc)/60, если 0<х<5, Ρ χ \χ) 10 — в остальных случаях. 9.16. Найти функцию распределения и плотность распределения случайной величины X, определенной в задаче 9.14. Ответ: Fx(x) = *-jl (-1 < χ < 1); рх{х) = \ (-1<х<1). 9.17. Указать значения и их вероятности дискретной случайной величины Υ, определенной в задаче 9.14. Ответ: Ρ{Γ=1} = π/16, Р{Г= 0} = 1 - π/16. ч9.4/ Математическое ожидание. Дисперсия Формула, аналогичная формуле (5.7), имеет вид МХ= jjj^j tf Л^и, v) au dv. (9.6) Здесь, как в (5.7), значение случайной величины Х(и, ν) при исходе («, ν) умножается на элементарную вероятность dw dv/пл. Ω и «суммируется» по всем (и, ν) из области Ω. При вычислении дисперсии можно либо использовать равенство ШГ = ^ Я (Х(и, ν) - MX)2 du dv, (9.7) либо применить формулу (5.14), в которой MX2 определяется из равенства Μχ1 = 5Γω Μχ2("> ν> du dv· <9·8> Если величина X дискретная, то можно использовать формулы (5.8), (5.17) и (5.18). Аналогичные соотношения для непрерывных величин будут приведены в гл. 10 и 12. 9.18. Используя равенства (9.6) и (9.8), найти математическое ожидание времени ожидания первого пришедшего автобуса, определенного в задачах 9.1 и 9.2. 96
VI 0 "ι у Х=и/ ι 5 X=v Ω2 12 и Рис.3 РЕШЕНИЕ. Случайная величина X = min («, v). По формуле (9.6) имеем ΜΛΓ= ттч Я min («, v) du dv. Область Ω разобьем на две области (рис. 3): Ω, = {(и, ν): ν > и; 0 < и < 12; 0 < ν < 5}, Ω2 = {(«,ν):ν< w; 0< w< 12; 0<v<5}. Тогда X— и в области Ω! и ЛГ = ν в области Ω2, следовательно, МЛГ = 77^ ]\и du dv + 77; Я vdw dv. 60 Так как 60 125 II и du dv = J dv J и du = J у dv = -g- , 5 ν 12 5 £5Q Я vdw dv = J dwj vdv = J dwj vdv= -τ- , Ω2 0 0 5 0 то MX= 155/72 = 2,15277.... Аналогично находим MJT2 = 7^J dv/ w2dw + ~J dw J v2dv+7^J dw J v2 dv = 6,59722... 00 00 и ΌΧ= MX2 - (MX)2 = 1,9627.... 9.19. В задаче 9.1 о двух автобусах обозначим через Х5 время до прихода автобуса с пятиминутным интервалом и через Хп — время до прихода автобуса с интервалом 12 мин. Найти МХ5, ΌΧ5, МХп, D^f12. УКАЗАНИЕ. X5(u, v) =v, Хп(и, v) =u. Ответ: МХ5 = 5/2, ШГ5 = 25/12, MJT12 = 6, ШГ12=12. 97
9.20. Интервалы движения автобусов маршрутов № 1 и № 2 одинаковы и равны Т. Обозначим через X время ожидания автобуса любого маршрута, Хх — время ожидания автобуса маршрута № 1. Найти ШХ,ШХХ. УКАЗАНИЕ. В качестве множества элементарных исходов выбрать квадрат Ω = {(и, v):Q<u< Τ, 0 < ν < Τ}, где и — время ожидания автобуса маршрута № 1, а ν — маршрута № 2. ТогдаХ{и, v) = min (w, v), Xx{u,v) = u. Ответ: МХ= Τβ,ΜΧλ = Τ/2. 9.21. В условиях задачи 9.20 пассажир пропускает первый пришедший автобус и ждет автобус другого маршрута. Пусть X— время ожидания желаемого автобуса этим пассажиром. Найти MX. УКАЗАНИЕ. Х(и, v) =max (и, ν). Ответ: МХ=2/ЗТ. 9.22. Найти математическое ожидание и дисперсию случайных величин Хи У, определенных в задаче 9.14. УКАЗАНИЕ. Для вычисления MF и ΏΥ использовать решение задачи 9.17. Ответ: МЛГ=0, ΌΧ= 1/3; МЛГ=7с/16, ΌΧ= (π/16)(1 - (π/16)). 9.23. (Продолжение задачи 9.4.) Определим случайные величины через Хн, ХЕ, Х^. Хн — время ожидания начала зачета Николаем, ХЕ — Егором, Хп — время ожидания преподавателем прихода студентов. Найти математическое ожидание и дисперсию этих величин. УКАЗАНИЕ. γ _ J 0, если ν < и или ν > и τ 10, н " 110 4- и - ν, если и < ν < и + 10; _ J 0, если и < ν или и > ν + 20, Ае " 120 4- ν - w, если ν < и < ν -Ι- 20; А^ = min {и, ν}. Воспользоваться формулами (9.6) и (9.8); in ι 60 и + 10 MJTH=fl 3000~Vd"dv=J d" J dO + «-v)dv, (7 θα где (7 = {(w, ν): 0 < и < 60, 0 < ν < 60, и < ν < и + 10}. 98
Ответ: МХН = 5/6, ΌΧΗ = 175/36, МХЕ = 10/3, ΌΧΕ = 100/3, MJfn = 20, ШГП = 200. 9.24. Интервалы движения автобусов равны Т. Расстояние между остановками С и D автобус проходит за Δ1? пешеход — за Δ0 (Τ + Δλ.— Δ0 > 0). Пусть Χλ и Х2 — соответственно время, которое затрачивает пассажир на дорогу в случае, если он сразу после прихода на остановку С идет пешком, а догнавший автобус подвозит его оставшуюся часть пути, и в случае, если он ждет автобус. Найти мхх, мх2. УКАЗАНИЕ. Обозначим через и время, прошедшее от ухода автобуса до прихода пассажира. ТогдаХ2 = Т— и + Δχ, Хх = Δ0, если Δ0 < Т-и + + АХ;ХХ= Т-и + Ау,еслиА0> Т-и + Ах. Ответ: Μ^ = Δ0[ΐ+ '" ° ) + ^(Ag - Δ?),Μ^2 = Δ1 + \т. Ковариация. Независимость случайных величин Для вычисления ковариации случайных величин Χ κ Υ ъ схеме геометрических вероятностей можно использовать формулу cov (Χ, Υ) = -Цг JJ (Х(и, v) - MX) (Y(u, v) - MY) du dv, (9.9) либо формулу (5.25), в которой ΜΧΥнаходится из равенства MXY= jj^j \\Х{и, ν) Y(u, ν) du dv. (9.10) Случайные величины X и Υ называются независимыми, если для любых интервалов (ах, bx), (а2, b2) выполняется равенство Р{ах<Х<Ьх, а2< Υ< Ь2) = Р{ах < X< Ьх}Р{а2< Y<b2). (9.11) Для дискретных величин это определение равносильно определению (5.4). Для случайных величин с непрерывной функцией распределения определение (5.4) непригодно, так как в этом случае вероятность любого события {X = a, Y= b), {Х= а}, {Y— Ь} равна нулю. Случайные величины Хх,..., Хп называются независимыми, если для любых интервалов (ai9 bt), i= 1,..., η, выполняется равенство Ρ{αχ <ΧΧ< bx, a2<X2< b2,... ,αη<Χη< bn) = = Ρ{αχ <ΧΧ< Ьх}Р{а2 <Х2< Ь2)...Р{ап <Хп< Ьп). (9.12) 99 4h
-1 v\ 1 αι -i i h a) v+ 1 *l 1 и -1 el Η 1 I ! I i | ff i ί 1 -Ί 6) Рис.4 и -1 VJ 1 ^2 -i \ e) 1 U 9.25. В квадрат Ω = {(и, ν); |w| < I, |v| < 1} брошена точка. Ее координаты Х(и<> v) = w, Y(u,v) = v являются случайными величинами. Найти вероятности событий {ах<Х < bua2<X< b2}9 {a] < Χ < b}}9 {a2< Y< b2) и cov (X, Y). Зависимы ли случайные величины? УКАЗАНИЕ. См. рисунок4, а—в. Ответ: Г{а] <Х<Ь{;а2< Y< b2}= (A, -ax)(b2-a2)/4; V{a{ < <Х< Ь2) = {Ьх - αλ)β\ ¥{а2 < Υ< b2} = (b2 -а2)/2. Случайные величины независимы; cov {Χ, Υ) = 0. 9.26. В квадрат Ω (рис. 5), ограниченный прямыми ν = и + 1, ν = -w + Ι, ν = -и — 1, ν = м — 1, брошена точка. Ее координаты Х(и, ν) = и, Y(u, ν) = ν являются случайными величинами. Найти: 1 1) MX; 2) МГ; 3) cov (X. У); 4) Р^ < Х< 1 «'{ί 1 2 <^<1,5 <^<1 } |2 <AT<li;5)pjJ <Γ<ΐ|; РЕШЕНИЕ. Пл. Ω = 2. По определению, Mr=2ii"d"dv==3/ d" 7' vdv + \\ du Ύ vdv = 0. Ω -1 -«-I 0 и-1 Аналогично находим М*= 0, ΜΧΥ= 0, следовательно, cov {Χ, Υ) = 0. Событию {1/2 < Х< 1,1/2 < Υ< 1} на рисунке 5 соответствует заштрихованный квадрат, лежащий вне квадрата Ω. Следовательно, это невозможное событие, и < r<ll=0. λ\ <x<u\ < y<i} = 100
\ / v = -a-l\/ !/2 v = 1/2 ;«+l 1 ν=κ-1 Рис. 5 Событию {1/2 < Χ < 1} соответствует треугольник, отсеченный от Ω вертикальной прямой w - 1/2. Вычислив площадь этого треугольника (пл. {1/2 < Х< 1} = 1/4), по формуле (9.1) найдем Р{1/2 < < Х< 1} = 1/8. Аналогично находим Р{1/2 < Y< 1} = 1/8. Таким образом, о = р| ^ <*<1, 5 <Г<1 }^p{i<x<ij.p{i<y<i} = l. Следовательно, величины X и У зависимы. Равенство нулю ковари- адии не является достаточным условием независимости. 9.27- В квадрат Ω = {(и, v):0<w<l,0<v<l} брошена точка. Найти математические ожидания и ковариацию случайных величин: X(u,v) = и + v, Y(u,v) = и — v. указание. Использовать формулы (9.6) и (9.10). Ответ: МХ= 1, МУ=0, cov (X, Υ) = 0. 9.28. Решить задачу 9.27, введя вспомогательные случайные величины Ζχ(ί/, ν) = и, Z2(u, ν) = v. УКАЗАНИЕ. Использовать равенства X = Ζχ + ΖΐΛ Υ=ΖΧ— Ζ2. Найти необходимые числовые характеристики Ζ, и ,Ζ2 и воспользоваться свойствами математического ожидания.
ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Глава ч10.1/ Закон распределения Определение дискретной случайной величины, данное в § 9.2, сохраняется для любой вероятностной модели. Нередки ситуации, когда вся необходимая от изучаемого случайного опыта информация содержится в значениях одной случайной величины X. В этом случае нет необходимости знать полностью все элементарные исходы (более подробно описывающие опыт) и их вероятности. Достаточно знать закон распределения случайной величины. Для дискретных величин наиболее удобная форма задания закона распределения — указание любым подходящим способом числовых значений х19х2, ...,*„,... (ЮЛ) случайной величины X и соответствующих им вероятностей рп = = Р{Х=хп}, η = 1,2,.... Очевидно, что числа/>„ должны удовлетворять условиям рп>0, /7 = 1,2,...; !/>„=!. (Ю.2) п = \ К значениям (10.1) молено относиться как к элементарным исходам опыта с заданными вероятностями {рп}™=1, удовлетворяющими условиям (10.2). Для любого числового множества В вероятность события {X е В} = = {значение X попало в В) определяется формулой Р{ХеВ}= Σ Р„, (Ю.З) п:х„еВ где суммирование проводится по тем п> для которых хп принадлежит В. Рассмотренное правило вычисления определяет еще одну вероятностную модель. Приведем часто встречающиеся законы распределения дискретных случайных величин. Во всех этих примерах случайные величины будем обозначать X. 102
1°. Биномиальное распределение Р{Х=т}=С%рт(1-р)"-т, 0<р< 1, m = О, 1,... ,п. (10.4) Случайная величина, равная числу успехов в η испытаниях схемы Бернулли с вероятностью успеха/?, имеет закон распределения (10.4) (см. (6.2)). 2°. Гипергеометрическое распределение Р{Х=т} = м/~М, /и=0, l,...,min(/i,A/). (10.5) Такое распределение имеет число X белых шаров среди η шаров, выбранных по схеме случайного выбора без возвращения (см. (4.4)). 3°. Пуассоновское распределение F{X=m}=^e-\ λ > 0, m=0, 1,.... (10.6) Это распределение возникает при предельном переходе в условиях теоремы Пуассона из биномиального распределения (см. (6.6)). 4°. Геометрическое распределение Р{Х=т}=(1-р)т~1р, т = 1,2,... ,0</>< 1. (10.7) Такое распределение имеет число испытаний в схеме Бернулли, прошедших до первого успеха включительно (см. (6.1)). Иногда геометрическим распределением называют распределение, получающееся из (10.7) заменой левой части равенствам на Р{Х=т-Ц. Законы распределения, определяемые равенствами (10.4) и (10.6), часто обозначают символами Bi(n, p) и Π(λ) соответственно. 10.1. Случайная величина X имеет геометрическое распределение вероятностей (см. (10.7)). Найти вероятность события {Х> к). РЕШЕНИЕ. В этом случае в формуле (10.3) имеем В = {к, к + 1,...}, поэтому Р{Х>к} = Р{ХеВ} = Σ {\-р)т-хр={\-р)к-\ т=к оо | так как Σ ат = -. (-1 < а < 1). Таким образом, P{X>k}=(l-p)^-K к =1,2,.... 103
10.2. Для случайной величины X, имеющей пуассоновское распределение (см. (10.6)), найти Р{Х> 0}. УКАЗАНИЕ. Найти вероятность противоположного события. Ответ: Р{ЛГ>0}= 1-е"\ 10.3. Найти вероятность события {2 < X < 4}, если Xимеет биномиальное распределение с η = 5, ρ = 1/3. УКАЗАНИЕ. В формуле (10.3) £ = {2,3,4}. Ответ: Р{2 < X < 4} = С] (1/3)2(2/3)3 + С53 (1/3)3(2/3)2 + + С^(1/3)4(2/3)1 = 130/243. 10.4. Возможные значения хп случайной величины X определяются равенствамихп = η, η = 1, 2,.... Известно, что/>„ = F{X= η} = = С/п(п + 1). Найти С. РЕШЕНИЕ. Воспользуемся условием (10.2). Имеем оо оо Г] Так как у_£_=ст ΓΙ-^_Ϊ = п%п{п + \) „М« п + \) -*-j)+(i-n+a-i)+-]-c· то С = 1, следовательно, ρ =Р{Х=п}= , * . ^п 1 } п(п + 1) 10.5. Возможными значениями jc„ случайной величины Xявляются значения хх = — 1, х2 = 0, х3 = 1; их вероятности равны С, 2С, ЗС. Найти С. Ответ: С= 1/6. 10.6. Найти закон распределения случайной величины X, если Р{Х = л} = С/я(л + 1)(л + 2), л = 1, 2,.... УКАЗАНИЕ. См. решение задачи 10.4. Для суммирования использовать равенства л(и+1)(л + 2) 2^»(я+1) (л + 1)(л + 2)/ Ответ: Р{Х=п} = 4/п(п + \){п + 2). 104
ЧЮ.2> Математическое ожидание и дисперсия Будем считать, что известен закон распределения случайной величины X: Р{Х = хк} = рк, к = 1, 2,.... Математическое ожидание MX вычисляется по формуле МХ= Σ xkP{X = xk}, (10.8) k=\ если ряд абсолютно сходится. В противном случае математическое ожидание не существует. Если множество значений ЛГ конечно, то ряд (10.8) становится конечной суммой (см. (5.8)). Дисперсия ΌΧ находится по формуле оо МГ= Σ (xk-MX)2P{X=xk) (10.9) к = \ или по формулам ΌΧ=ΜΧ2-(ΜΧ)2 (10.10) и МХ1 = Σ х%Р{Х=хк}, (10.11) к = \ если ряды в (10.9) и (10.11) сходятся. В противном случае ШГне существует. 10.7. Найти MX и ΌΧ случайной величины X, имеющей биномиальное распределение. РЕШЕНИЕ. Первый способ. Используя формулу (10.8), находим МХ= Σ тР{Х=т}= Σ тС%рт(\-р)п~т. т=0 т = \ Отсюда, учитывая, что т С% = nC^Z\ , имеем Σ С%-{рт-х(\-р)п-т = т = \ = "l C^_lpm(l-p)"-m = {p+(l-p))"-i = l, далее получаем МХ=п tc™SilPm(l-p)n-m = np Ъс%1?рт-х{\-р)п-т = пр. т = \ т = \ Для вычисления дисперсии найдем сначала MX2, представив X2 в виде X2 = Х(Х - 1) + X. Тогда MX2 = МХ(Х - 1) + MX Принимая во внимание формулы (10.10) и (10.11), получаем еще одну формулу для вычисления дисперсии случайных величин: ΌΧ= МХ(Х- 1) + MX- (MX)2. (10.12) 105
Эта формула особенно удобна в случае целочисленных случайных величин. Ясно, что МЯХЛГ-1)= Σ т(т-1)Р{Х=т} = /я=0 = Σ т(т- \)С™рт{\-р)п-т. Отсюда, используя равенство т(т-1)С%=п(п-1)С%^22, находим МХ(Х- \)=п(п-\) Σ C%zipm(\-p)n-m=n{n-\)p2. т=2 Учитывая равенство MX = пр, имеем (см. (10.12)) ΌΧ= п(п - \)р2 + пр — п2р2 = пр{\ —р). Второй способ. Число успехов μη в η испытаниях по схеме Бернулли имеет биномиальное распределение, поэтому математическое ожидание и дисперсия μη совпадут с математическим ожиданием и дисперсией биномиально распределенной случайной величины Jf любого происхождения. Таким образом, можно вычислить Μμη и Βμ„, воспользовавшись ее представлением (6.3) (см. задачи 6.19 и 6.20). Этот способ значительно проще первого. 10.8. Найти МХи ΌΧ, если Химеет пуассоновское распределение (10.6). УКАЗАНИЕ. Использовать формулу (10.12). Ответ: ΜΧ=ΌΧ=λ. 10.9. Найти ΜΛΓ и ΌΧ, если X имеет гипергеометрическое распределение. УКАЗАНИЕ. См. второй способ решения задачи 10.7. Рассмотреть закон распределения числа белых шаров в схеме выбора без возвращения. η mv M ΐΛν М(л Μ\Ν-Π Ответ: МХ= η^,ΌΧ= п^{1 - ^ j-^^. 10.10. Найти MX случайной величины с законом распределения Р{Х=п} = \/п(п + 1), п = 1,2,.... Ответ: Математическое ожвдание не существует. 10.11. Найти MX случайной величины Хс законом распределения Р{Х= п) = А/п(п + 1) (п + 2), η = 1, 2,.... 106
УКАЗАНИЕ. Использовать формулу (10.8) и равенство 1 = _J 1_ (л + 1)(л + 2) л+1 п + 2' Ответ: МЛГ=2. 10.12. Найти MXyl ΌΧслучайной величины X, закон распределения которой определен в задаче 10.5. Ответ: МХ= 1/3, ΌΧ= 5/9. Закон распределения функции от случайной величины Зная закон распределения Р{Х= хк) = рк, к = 1, 2,..., случайной величины X, можно найти закон распределения случайной величины Υ = φ(Χ), являющейся функцией от X по следующей формуле: Р{У=Ут}=, Σ Р{Х=хк), /и = 1,2,..., (10.13) кМхк) =ут т. е. нужно просуммировать вероятности тех значений случайной величины X, функция от которых дает заданное значение ут. 10.13. Закон распределения Xзадан следующей таблицей: к хк ?{Х = Хк) 1 -4 1/8 2 -1 1/8 3 0 1/2 4 1 1/8 5 2 1/8 Найти закон распределения случайной величины Υ = X2. РЕШЕНИЕ. Значения случайной величины Υ определяются по значениям случайной величины X: по значению х3 = 0 находим значение ух = 0; у2 = 1 находим по значению х2 = — 1 и хА = 1; у3 = = 4 — по значению х5 = 2; у4 = 16 — по значению хх = -4. Сумма (10.13) во всех случаях, кроме Y=y2=l, сводится к одному слагаемому; при Y= у2 = 1 — к двум слагаемым: Р{Х = — 1} + Р{Х = 1} = = 1/8 + 1/8 = 1/4. Окончательно получаем: т Ут *{У=Ут) 1 0 1/2 2 1 1/4 3 4 1/8 4 16 1/8 107
10.14. Найти закон распределения случайной величины Y= —Хъ, если закон распределения допределен в задаче 10.13. Ответ: т Ут W=ym) 1 -8 1/8 2 -1 1/8 3 0 1/2 4 1 1/8 5 64 1/8 10.15. Найти закон распределения Υ = sgnJf, если закон распределения допределен в задаче 10.13. УКАЗАНИЕ. Функция sgnJf = 1, если X > 0, sgn^f = 0, если Х= 0, HsgnA^ -1, еслиАг< 0. Ответ: Р{Г= 1} = Р{Г= -1} = 1/4, Р{Г= 0} = 1/2. 10.16. Случайная величина X имеет пуассоновское распределение (10.6). Найти закон распределения Y= sgn X. Ответ: P{F=0} = e~\ P{Y= 1} = 1 - е~\ Математическое ожидание и дисперсия функции от случайной величины Пусть хи х2, ... , хпУ ... — значения дискретной случайной величины X. Если случайная величина Υ = φ(Χ), то для вычисления MFh DFmoxho не находить закон распределения Y, а воспользоваться формулами ΜΥ=Μφ(Χ)= Σ <f>(xk)F{X=xk}, (10.14) к = \ ΌΥ=Ό<?(Χ)= Σ (<?(xk)-MY)2P{X=xk) (10.15) к = \ или формулой ΏΥ=ΜΥ2 — (МУ)2,в которой ΜΥ2= Σ (?Цхк)Р{Х=хк\. (10.16) к = \ Математические ожидания некоторых функций от случайной величины имеют специальные названия: МХт — момент по- рядка т случайной величины X; М(Х— МХ)т — центральный момент порядка т; М\Х — МХ\т — абсолютный центральный момент порядка т и т. д. 108
10.17. Закон распределения Jf задан следующей таблицей: к хк Р{Х=Хк] 1 -4 1/8 2 -1 1/8 3 0 1/2 4 1 1/8 5 2 1/8 Найти МУи ΌΥ, если Υ= X2. РЕШЕНИЕ. По формулам (10.14) и (10.16) находим ΜΥ=ΜΧ2=16·\ +l.'+0-j+l-J+4-g=ip MF2 = M^T4 = 256-g +l.J+0«2+l*g+16«g=·^. Отсюда ΌΥ=ΜΥ2-(ΜΥ)2 = 137 121 IF 427 Τδ"· 10.18. Закон распределения допределен в задаче 10.17. Найти MY,meY=-X\ Ответ: МГ=7. 10.19. Закон распределения допределен в задаче 10.17. Найти MY,OY,meY=sgnX. Ответ: ΜΥ=0,ΌΥ=1/2. 10.20. Случайная величина А" имеет пуассоновское распределение (10.6). Найти MY, ΌΥ, где Y= sgnX. Ответ: MY= 1 - е~\ ΌΥ=ε-χ(\ -е~х). Производящая функция Целочисленной случайной величиной обычно называют случайную величину, значениями которой могут быть только числа 0, 1, 2, .... Пусть X— целочисленная случайная величина. Рассмотрим функцию Υ = ζχ, где 0 < ζ < 1. Производящей функцией ψχ(ζ) целочисленной случайной величины Xназывают функцию φχ(ζ)=Μζχ. (10.17) Отсюда по формуле (10.14) находим φχ(ζ)= Σ ζ"Ρ{Χ=η}. л=0 (10.18) 109
Дифференцируя (10.18) по ζ и полагая ζ — 1, можно проверить, что МХ= φ£(1), М^*- 1) = φ£(1). (10.19) Отсюда и из (10.12) находим ΌΧ = φ^(1) + φΚΐ) - (ФИО)2· (10.20) Если найдена производящая функция, то вычисление MX и ΌΧ при помощи суммирования (по формулам (10.8) —(10.11)) можно заменить вычислением при помощи дифференцирования (по формулам (10.19), (10.20)). 10.21. Найти производящую функцию случайной величины X, имеющей биномиальное распределение. РЕШЕНИЕ. Поформулам (10.18) и (10.4) находим <?x(z)= Σ zmP{X=m}= t zmC%pm{\-p)n-m = m=0 m =0 = Σ C%(zp)m(l-p)"-m. m =0 Отсюда 4>x(z) = (pz+l-p)n. (10.21) 10.22. Используя производящую функцию (10.21), найти математическое ожидание и дисперсию случайной величины, распределенной по биномиальному закону. РЕШЕНИЕ. Производные φ'χ (ζ) и φχ (ζ) соответственно равны φ'χ(ζ)=ηρ(ρζ+\-ρ)η-\ ψχ(ζ) = = n(n-\)p2(pz+ l-p)"-2. Отсюда при ζ = 1 имеем ФИП =/!/>, ^{\)=п{п-\)р\ Поформулам (10.19) и (10.20) находим ΜΧ=φ'χ(\)=ηρ, МГ=ф?(1) + фИ1)-(фИО)2 = = п(п — 1)р2 + пр — п2р2 = пр{\ —р). 10.23. Найти производящую функцию случайной величины X, имеющей пуассоновское распределение (10.6). Ответ: φχ(ζ) =tx(z~l). 110
10.24. Найти математическое ожидание и дисперсию случайной величины X, имеющей пуассоновское распределение. Ответ: ΜΧ=ΌΧ=λ. 10.25. Найти производящую функцию случайной величины X, имеющей геометрическое распределение (10.7). Ответ: φ^) = 1 _ (f_^. 10.26. Найти математическое ожидание и дисперсию случайной величины X, имеющей геометрическое распределение. Ответ: МХ=\/р, DX=(l-p)/p2.
АБСОЛЮТНО НЕПРЕРЫВНЫЕ <Л\ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ ' Глава /гу\\ Функция распределения \у и плотность распределения вероятностей Случайные величины X, у которых функция распределения Fx(x)=P{X<x}, -оо<х<оо? (ИЛ) представляется в виде Ъ(х)= \ Рх(и)аи, (11.2) — ОО называют абсолютно непрерывными (иногда просто непрерывными), а подынтегральную функцию рх{х) в (11.2) — плот- ностью распределения вероятностей случайной величины X или просто плотностью. Вероятность любого события {а < Х< Ь}, —оо < а < b < +оо? легко выразить через Fx(x) ирх(х): P{a<X<b} = Fx(b)-Fx(a); (11.3) P{a<X<b} = j px(x)dx. (ПА) a Для случайных величин с непрерывной функцией распределения Р{Х = с} = О при любом с. Поэтому вероятности любых событий вида {а <Х< &}, {a<X<b}, {a<X<b}, {a <X< b) равны правым частям (11.3) и (11.4). Если рассматривать значения случайной величины как элементарные события, а вероятность любого события {а < X < Ь) определять формулой (11.4) с функцией рх(х), удовлетворяющей условиям Рх(х)>0, J px(x)dx=\, (11.5) —оо то получится еще одна вероятностная модель. 112
Ук 1 b-a а b Χ Рис.6 Приведем часто встречающиеся законы распределения, определенные плотностью распределения. 1°. Равномерное распределение на [а, Ь]: 1О — в остальных случаях. График плотности у =рх(х) равномерного распределения приведен на рисунке 6. Равномерный закон распределения (11.6) часто обозначают символом R(a, b). 2°. Показательное распределение с параметром λ > 0: „ (γ\ = J λε_λχ' если х>0> ΡχΚΧ) 1 0, если х<0. (Π.7) Графику =рх(х) приведен на рисунке 7. 3°. Нормальное, или гауссовское, распределение с параметрами а и с2 (—со < а < °°, σ2 > 0): рх{х) = —j= е-<* - °>2/2σ2, -оо < χ < cj2n (11.8) Рис.7 113
1 6-(*-*)2/(πσ2) Рис. 8 Графику = рх(х) приведен на рисунке 8. Нормальный закон распределения (11.8) часто обозначают символом Ν(α, с2). Нормальное распределение с а = 0, σ = 1 называют стандарт- ным нормальным распределением, а соответствующую ему функцию распределения обозначают Ф(х). С функцией Ф0(х) (см. (6.11)) Ф(х) связана следующим образом: Φϊνϊ=|0'5+Φ°(*)ΠΡΗ*>0' К } 10,5-Ф0(;с)при;с<0. (П.9) 11.1. Случайная величина X равномерно распределена на отрезке [2,4] (см. (11.6)). Найти Р{2,5<Х< 3,5}. РЕШЕНИЕ. По формулам (11.4) и (11.6) находим Р{2,5 <Х< 3,5} = \ рх{х) Ах=\\ άχ=\. 2,5 2,5 11.2. Плотность распределения случайной величины X имеет следующий ъ\щ\рх{х) = С/х4 прил: > 1 ирх(х) = 0 при χ < 1. Найти: а) постоянную С; б) Р{Х< 3}; в) Р{Х> 7}. РЕШЕНИЕ. По формуле (11.5) имеем ОО ОО « y-i _оо 1 Л Отсюда С = 3. По формуле (11.4) находим 3 3 j ν Р{Х< 3} = Р{-оо < Х< 3} = | ρχ{χ) ах = 3J ψ, = ψ , 00 °° Hr 1 Ρ{Χ > 7} = Ρ{7 < Χ< οο} = jPx(x) dx = 3 J Ρ = рз · 114
11.3. Случайная величинаXимеет показательное распределение (см. (11.7)). Найти: а) функцию распределения Fx(x)\ б) Ρ{λ_1 <Х< < 2λ-!}. Ответ: а) 1 -е-** при χ > 0; б) е_1(1 -е-1). 11.4. Плотность распределения случайной величины X имеет видрх(х) = С sinx при 0 < χ < π ирх(х) = 0 — в остальных случаях. Найти: а) постоянную С; б) Р{Х>п/4}. Ответ: а) С= 1/2; б) (1 + 72/2)/2. 11.2/ Математическое ожидание и дисперсия Математическое оЗкидание и дисперсия абсолютно непрерывной случайной величины ЛГ находятся по формулам оо МХ= J xpx(x)dx, (11.10) ΌΧ= J (x-MX)2px(x)dx. (11.11) —oo Дисперсию можно также найти по формуле ΌΧ= MX2 - (MX)2, в которой МХ2= J x2px(x)dx. (11.12) _оо 11.5. Найти математическое ожидание и дисперсию случайной величины X, имеющей нормальное распределение (11.8). РЕШЕНИЕ. По формуле (11.10) оо (*-а)2 МХ= —j= J xe 2σ2 άχ. Заменой переменных j/ = (χ — а)/с находим МХ= -±= J {а +су)е~У2/2 dy + -JL J уе~У2'2 dy J2n _oo J2n _oo Отсюда MX= а, так как ι оо оо -jL j е-У2/2 dy = l, j уе~У2П ay = 0. 115
По формуле (11.11), используя ту же замену переменной, находим ι оо (х-а)2 2 ос ШГ=-4= ί (х-а)2е 2°2 dx=4= j y2t~y2/2dy = = --|= J jd(e-^/2)= ° J e-'2/2d>; = a2. ν^π _<„ л/ζπ _<„ Таким образом, для нормально распределенной величины X МХ=а, ΌΧ=σ2. 11.6. Найти МХи ΌΧ, еслирх(х) определено в задаче 11.2. Ответ: MJ=3/2,DI=3/4. 11.7. Найти МЛГи ΌΧслучайной величины X, имеющей показательное распределение (11.7). Ответ: МХ= \/λ,ΌΧ= \/λ2. 11.8. Плотность распределения рх(х) имеет следующий вид: рх(х) = С (χ2 + χ + 1), если 0 < χ < 1, ирх(х) = 0 в остальных случаях. Найти MX и ΌΧ. УКАЗАНИЕ. Найти С из условия (11.5). Ответ: МХ= 13/22, ΌΧ= 189/2420. 11.9. Найти MX и ΌΧ случайной величины X, равномерно распределенной на отрезке [а, Ь] (см. (11.6)). Ответ: МХ= (а + Ь)/2, ΌΧ= (b -a)2/\2. Закон распределения функции от случайной величины Если случайная величина Υ— φ(Χ), где X — случайная величина с плотностью распределения рх{х)> то функцию распределения Υ находят по формуле FY(x)=P{Y<x} = P{Xe Вх}= j px(u)du, (11.13) где в числовое множество Вх = {и: φ(«) < χ} входят все решения и неравенства φ (и) < х. Случайная величина У может иметь любой тип распределения. 116 <$>
11.10. Найти плотность распределения случайной величины Υ = АХ + В, А * О, где X — случайная величина, распределенная нормально (см. (11.8)), с параметрами (а, с2). РЕШЕНИЕ. Пусть сначала А > 0. Тогда Fr(x) = Р{АХ+ В <х} = р1х<Х^\ = Fx(*-^y следовательно, (х-В)/А FY{x) = —1— } е-(«-*)2/2а2 dw. Производная этой функции существует при любом х. Дифференцируя по χ равенство 'х-В FY(x)=Fx(x-J?y получим Отсюда, используя формулу (11.8), найдем Ργ(χ) = —^ t-(x-Aa - ΒΫΙΙΑ^ β Еслиу4 < 0, то FrW - р{*> Ц* } - , - Р{*< ϊ^ί } = , - F^ ) следовательно, ρ (χ) = х t-ix-Aa-B)*/2A*c*u Таким образом, случайная величина Y, являющаяся линейной функцией от нормально распределенной величины Υ = АХ + В, А*0, также распределена нормально; параметры нормального распределения преобразуются по формулам: ах = Аа + В, ъ\ = А2с2. Эти параметры легко найти, используя свойства математического ожидания и дисперсии: αχ = ΜΥ=ΑΜΧ + Β=Αα+Β, σ2 = пу=ЩАХ) +ΌΒ=Α2ΌΧ=Α2ο2. 117
11.11. Случайная величина X распределена нормально с параметрами а = 1, σ2 = 4. Найти Р{1,5 < Х< 3,0}. РЕШЕНИЕ. Событие {1,5 < X < 3,0} = | 1>5~а < ^р < < — I. Согласно задаче 11.10, случайная величина Y= (X—a)/c как линейная функция от ^распределена нормально. Параметры ее нормального распределения α} = ΜΥ=-Μ(Χ-α)=0, ο1=-,ΌΧ=1. Таким образом, Р{1,5<^<3,0} = р|^2=-1 <^ <h^T1} = ι 1 = Р{0,25 < Υ< 1} = -j= J e-*2/2 dx. ν2π ο,25 Последний интеграл выражается через функцию Ф0(х) (см. (6.12)), значения которой приведены в таблице 1 приложений: Р{1,5 <Х< 3,0} = Ф0( 1) - Ф0(0,25) = 0,3413 - 0,0987 = 0,2426. 11.12. Случайная величина X распределена нормально с параметрами а = -1, σ2 = 25. Найти: а) Р{-6 < Х< 6}; б) Р{-6 < Х< -1}; Β)ρμτ>-ΐ}. Ответ: а) 0,7605; б) 0,3413; в) 0,5000. 11.13. Случайная величина X распределена равномерно на отрезке [0, 1]. Найти плотность распределения случайной величины Υ =2Χ+ 1. УКАЗАНИЕ. Выразить FY{x) через Fx(x) и продифференцировать полученное равенство. См. решение задачи 11.10. Ответ: ру(х) = 1/2, если 1 < χ < 3, ир¥(х) = 0 в остальных случаях. 11.14. Случайная величина X равномерно распределена на отрезке [—1, 1]. Найти плотность распределения случайной величины Υ=Χ2. УКАЗАНИЕ. Событие {Υ < х} при 0 < χ < 1 представляется в виде {Y<x} = {-Jx<X<<fx}. Ответ: ру(х) = l/2*Jx, 0<х< 1; ру(х) =0в остальных случаях. 118
11.15. Случайная величина X имеет показательное распределение с параметром λ = 1. Найти закон распределения дискретной величины Υ, определенной равенствами: Υ= 1, еслиХ> 1; Υ=— 1, если^Г< 1. УКАЗАНИЕ. Использовать соотношения Ρ{Υ= 1} = Р{Х> 1} = Р{1< Х< оо}, р{Г= -1} = р{0 < Х< 1}. Ответ: Ρ{Υ= 1} = е~\ Ρ{Υ= -1} = 1 -е"1. 11.16. Случайная величина X равномерно распределена на отрезке [0, 1]. Найти плотность распределения случайной величины Y=-^ln(l-X). Ответ: ργ{χ) = Хе_Ъсприл: > 0 иру(х) = Оприх < 0. 11.17. Случайная величина X имеет непрерывную строго монотонную функцию распределения Fx(x). Найти закон распределения случайной величины Y= Fxl (X), где Fxl — функция, обратная Fx(x): Fxl (Fx(x)) =x. Ответ: рх(х) = 1, если0<х< 1. Математическое ожидание и дисперсия функции от случайной величины Если Υ = φ(Χ) ирх(х) — плотность распределения случайной величины X, то MY и ΌΥ можно найти (не вычисляя плотность распределения/? у(х)) по формулам оо МГ=М(р(ЛГ) = J φ(χ)ρχ(χ) dx; (U.14) —оо оо ΌΥ=Όφ(Χ) = J (φ(χ) -ΜΥ)2ρχ(χ) dx (11.15) —оо или по формуле ΌΥ= MY2 — (MY)2, в которой МУ2 = J φ2(χ)ρχ(χ) dx. (11.16) —оо Моменты МХт и центральные моменты М(Х — МХ)т находят по формулам МХт = Jxmpx(x)dx; (11.17) —оо оо М(Х-МХ)т= J (x-MX)mpx(x)dx. (11.18) —оо 119 <П4>
11.18. Случайная величина X равномерно распределена на отрезке [0, 1]. Найти МЛ УКАЗАНИЕ. Воспользоваться формулой (11.4) при φ(χ) = х3 или формулой (11.17) прит = 3. Ответ: 1/4. 11.19. Плотность распределения случайной величины Xопределяется равенствами: рх{х) = 2х, если 0 < χ < 1, ирх(х) = О в остальных случаях. Найти MX5 и ΌΧ5. Ответ: MJf5 = 2/7; ΌΧ5 = 1/6 - (2/7)2 = 25/294. 11.20. Случайная величина X распределена нормально с параметрами а = 0, σ2 = 1. Найти М|ЛГ|. УКАЗАНИЕ. Воспользоваться равенством ^L J \x}Q-x2/2dx=J_ Jjce-x^djc. J2n _от ν2π 0 Ответ: Jl/π. 11.21. Случайная величина X распределена нормально с параметрами а = О, σ2 = 1. Найти MX3, MX4. Ответ: МЛГ3 = 0, МХ* = Ъ.
ДВУМЕРНЫЕ ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Глава Закон распределения двумерной ^12.1)> дискретной случайной величины. Независимость Пусть случайная величина Сможет принимать лишь значения х19х29 ···, хп, а случайная величина Y— только значенияу{, у2,..., ут. Законом распределения случайного вектора (Χ, Υ) называет- п т ся набор чисел/?,.· > О, / = 1, 2,... , п\ j = 1, 2, ..., т; Σ Σ/>/,·= 1, J i=\ j=\ J TRtPij — P{X = Xj, Y=yj}. Закон распределения случайного вектора (Χ, Υ) удобно задавать следующей таблицей: jT~^-- Υ Х2 Хп У\ Рп Рг\ Уг Р\г Ргг Рт Ут Р\т Plm Рпт Зная двумерный закон распределения случайного вектора (Χ, Υ), можно найти одномерные законы распределения случайных величин X и Fno формулам т Р{Х=х,}=р,.= ΣΡη, /=1,2,... ,л; j=\ ?{У=Уу} =Ρ.ι= Σ Ρ0, J = 1, 2, ..., m. (12.1) (12.2) Случайные величины Хи ^независимы, если для всех / = 1, 2,..., η; j= l,2,...,m Р{Х=х„ Y=yJ} = P{X = xi}P{Y=yJ} (12.3) или, в терминах введенных величин, Pu=Pi.-p.i. (12.4) Если равенство (12.3) нарушено хотя бы для одной пары (i,j), то случайные величины X и ΥНазывают зависимыми. 121
Приведенные выше определения естественным образом переносятся на А:-мерные случайные величины. Определение независимости, например, совпадает с определением независимости в вероятностных моделях с конечным числом исходов (см. (5.6)). 12.1. Закон распределения двумерного вектора (Χ, Υ) задан следующей таблицей: ^г^-^ -2 2 -1 1/8 1/12 0 1/4 1/3 1 1/8 1/12 Найти закон распределениями Ρ{Υ> 0}. РЕШЕНИЕ. Используя исходные данные, находим Р{Х= -2} = Р{Х= -2, Υ= -1} + Р{Х= = -2, Υ= 0} + Р{Х= -2, Υ= 1} = 1/8 + 1/4 + 1/8 = 1/2, Р{Х= 2} = Р{Х= 2, Υ= -1} + Р{Х= 2, Υ= 0} + Р{Х= 2, Г= 1} = = 1/12+1/3+1/12=1/2. Таким образом, закон распределения Xимеет вид хк Р{Х = хк} -2 1/2 2 1/2 Для получения решения второй половины задачи заметим, что Р{Г>0} = Р{Г=0} + Р{Г=1}. Аналогично вычислениям, проведенным для случайной величины X, получаем Ρ{Υ= 0} = Р{Х= -2, Υ= 0} + Р{Х= 2, Υ= 0} = 1/4 + 1/3 = 7/12, Р{ Υ= 1} = Р{Х= -2, Υ= 1} + Р{Х= 2, Υ= 1} = 1/8 + 1/12 = 5/24. Следовательно, Р{ Υ > 0} = 7/12 + 5/24 = 19/24. 12.2. Закон распределения двумерного вектора (Χ, Υ) задан таблицей ^-iL -1 2 0 1/6 0 1 0 1/12 2 1/4 3/8 3 1/8 0 122
Найти закон распределения Xи Р{ Υ< 1}. Ответ: к Р{Х= к} -1 13/24 2 11/24 ,Р{Г<1}=1/4. 12.3. В условиях задачи 12.1 найти закон распределения случайной величины Ζ = X + Υ РЕШЕНИЕ. Случайная величина может принимать с положительной вероятностью лишь значения —3, —2, — 1, 1,2,3. Для любого целого к P{Z=k} = Σ P{Z=k,Y=j} = Σ Ρ{Χ+ Υ= k, Y=j} = = Σ P{X=k-j, Y=j). Последовательно подставляя к = —3, -2, -1, 1, 2, 3, получаем Ρ{Ζ=-3}= Σ P{X=-3-j, Y=j} = P{X=-2, Г=-1} + + P{X= -3, Y= 0} + P{X = -4, Y= 1} = P{X= -2, Y= -1} = 1/8, P{Z= -2} = P{X= -1, Y= -1} + P{X= -2, Y= 0} + + P{X= -3, Y= 1} = P{X= -2, Г= 0} = 1/4 и т. д. Окончательные результаты вычислений приведены в таблице к P{Z=k} -3 1/8 -2 1/4 -1 1/8 1 1/12 2 1/3 3 1/12 12.4. Закон распределения двумерного вектора (Χ, Υ) задан равенствами λ·/ '7! р{х=к, y=j}=pH\ -ρ)τ, β-λ> * = ο. ι.2. ···; ./ = 0> ι. 2> -. где 0 </> < 1, а λ >0. Найти законы распределения случайных величиной К РЕШЕНИЕ. Для любого к = 0, 1,2, ...имеем Р{Х=к}= Σ P{X=k,Y=j}= Σ ρ4ΐ-ρ)τι*-λ = j=o J-o υ =/»*(!-/»)β-λ Σ 7Τ =Ρ*(1-/»), 123
поскольку Σ — = ελ· Аналогично получаем P{Y=J}= Σρ4ΐ-ρ)τι*-λ=Τι*-λ(1-ρ) lpk=%e~x. k=0 J- J- k=0 J- 12.5. В условиях задачи 12.2 найти закон распределения случайной величины Ζ = X + Υ. Ответ: к Ρ{Ζ = к) -1 1/6 1 1/4 2 1/8 3 1/12 4 3/8 12.6. В условиях задачи 12.1 найти закон распределения случайной величины Ζ = min {Χ, Υ]. РЕШЕНИЕ. Случайная величина Ζ с положительной вероятностью может принимать лишь значения —2, —1,0, 1. При этом Ρ{Ζ = -2} = P{min {Χ, Υ) = -2} = Ρ{Χ = -2} = 1/2, Ρ{Ζ = -1} = P{min {Χ, Υ) = -1} = = Ρ{Υ= -\, Χ> -1} = Ρ{Υ= -\, Χ= 2} = \/\2, Ρ{Ζ= 0} = Ρ{Υ= 0, Χ> 0} = Ρ{Υ= 0, Χ= 2} = 1/3, Ρ{Ζ=\} = Ρ{Υ=\,Χ>1} = Ρ{Υ=1,Χ=2} = \/\2. 12.7. В условиях задачи 12.1 найти закон распределения случайной величины Ζ = max {X, У}. Ответ: к P{Z=k} -1 1/8 0 1/4 1 1/8 2 1/2 12.8. Закон распределения случайных величин Хи Fзадан таблицей -1 0 1/6 1/6 1/3 1/6 о 1/6 Найти законы распределения случайных величин Z{ = max nZ2 = max{l,X+ Y). 124 {X, У)
Ответ: к Ρ{Ζ,=Λ} -1 1/6 0 1/3 2 1/2 /fc P{Z2 = A> 1 2/3 2 1/6 4 1/6 12.9. В условиях задачи 12.1 найти законы распределения случайных величин Ζλ = Υ2, Ζ2 = Χ2 + Υ Ответ: к Ρ{Ζ,=Α:} 0 7/12 1 5/12 к P{Z2 = k) 3 5/24 4 7/12 5 5/24 12.10. Произведены 2п независимых подбрасываний правильной монеты. Пусть Х2п — количество испытаний, в которых выпал «герб»; Y2n — количество испытаний с четным номером, в которых выпал «герб». Найти совместный закон распределения случайных величин Х2п и Υ2η. РЕШЕНИЕ. Ясно, что 0 < Υ2η < Х2п < 2п. Поэтому вероятность ptj = Р{Х2п = i, Y2n =j) равна нулю, если либо / <у, либо max {ij} > In. Пусть теперь 0 <j < i < 2п. Представим случайную величину Х2п в виде суммы Х2п = Y2n + Ζ2η, где Ζ2η — количество выпадений «герба» в испытаниях с нечетными номерами. Очевидно, что Ри = Р< Y2n + Zm = U Yin =J) = P{Z2n = i -J, Угп =J )■ Подбрасывания монеты независимы, поэтому величины Z2n и Y2n независимы и, кроме того, законы распределения случайных величин Υ2η и Ζ2η совпадают с законом распределения случайной величины, равной числу успехов в η испытаниях по схеме Бернулли с вероятностью успеха/? = 1/2. Отсюда, учитывая формулу (6.2), получаем Pij = P{Z2n = / -j} · Р{ Y2n =J} = P{X„ = ι -j} · P{Xn =j} = = C'n-JTnCJnTn = C!,-JCJn2rn> 0<J<n,j<i<2n. 125
12.11. В условиях задачи 12.10 найти совместный закон распределения случайных величин Х2п и Т2п, где Т2п — количество испытаний с четным номером, в которых выпала «решетка». УКАЗАНИЕ: Воспользоваться равенством Т2п = η — Υ2η. Ответ: Р{Х2п = /, Т2п =j} = С\г{п'лЧ ^, если η < /+/, j <n. 12.12. Одновременно подбрасывают две игральные кости. Пусть Х( — количество очков, выпавших на /-й кости, Y= Хх+ Х2. Найти P{F> 9} и совместный закон распределения вектора (Хх, Υ). Ответ: Р{Г> 9} = 1/6; Р{ХХ =j, Y= i} = 1/36, если 1 < i -j< 6, / =2,3,..., 11; j = 1,2,... ,6. 12.13. В условиях задачи 12.12 найти закон распределения случайного вектора (Υ, Ζ), где Ζ = Хх — Х2. Зависимы или нет случайные величины Υπ Ζ? Ответ: P{Y=y,Z=j} = 1/36, если 2 </< 12,-5 <у< 5 и величины (ι +у )/2 и (/ -j )/2 принадлежат множеству {1, 2, 3, 4, 5, 6}. Случайные величины Υπ Ζ зависимы, поскольку 1/36 = Р{У= 12, Ζ = 0} * Р{Г= \2}Ρ{Ζ = 0} = 1/36 · 1/6. 12.14. В условиях задачи 12.12 вычислить Р{ХХ > 2, Υ> 9}. Первое решение. Для любых событий АиВ справедливо соотношение Р{АВ) = Р{1Т1?} = 1 - Р{А + В} = = 1 - Р{А) - Р{В) + Ρ{ν4£} = Р{В) - Р{А) + Р{АВ). Пусть>4 = {^ < 2}, а 5 = {Г< 9}. Тогда Р{ХХ > 2, Г> 9} = Р{Г> 9} - Р{ХХ < 2} + Р{^ < 2, Y< 9}. Принимая во внимание результат задачи 12.14 и учитывая, что Р{ХХ < 2, Υ< 9} = Р{ХХ = 1, Υ< 9} = = Р{*1 = 1,ЛГ2<8} = Р{ЛГ1 = 1}=Р{2Г1<2}, получаем Р{^ > 2, Г> 9} = P{Y> 9} - Р{ХХ < 2} + Р{^ < 2} = Р{Г> 9} = 1/6. Второе решение. По формуле полной вероятности l/6 = P{Y>9} = P{Xx>2, Υ>9) + Ρ{Χλ<2, Υ > 9} = = Р{ХХ > 2, Υ> 9} + Р{ХХ = 1, Υ> 9} = = Р{ХХ > 2, Υ> 9} + Р{ХХ = 1, Х2 > 8} = PfJif, > 2, Г> 9}. 126
12.15. В условиях задачи 12.12 вычислить P{F< 4}. Ответ: 1/6. 12.16. Игральную кость, грани которой занумерованы цифрами 1, 2, 3,4, 5 и 6, подбрасывают пять раз. ПустьXi — количество испытаний, в которых грань с номером / оказалась верхней. Найти совместный закон распределения случайных величин Хх и Х2. РЕШЕНИЕ. Пусть/^ = Р{Х{ = i,X2=j}, ij = 0, 1, 2,..., 5. Было произведено пять опытов, поэтому/^ = 0, если / +j > 5. Положим Y= Хъ + ХА + Х5 + Х6. Воспользовавшись при i +j < 5 формулой (7.1), получаем Pij = Р{Х, = /, Х2 =У, Υ = 5 - / -j} = 5! \_ l /4 >?-J-J _ 5! V-J-J nj\(5-i-j)\ 'б'" ' 6J UJ /!Д5-/-у)!' б5 * 12.17. В условиях задачи 12.16 найти закон распределения случайного вектора (Yl9 Y2), где Yl=Xl+ X2, aY2=X3 + XA + X5. Ответ: Р{ Υλ = /, Y2 =J} = ^ .,Д5 5J. _.у , 0 < / +J < 5. 12.18. В условиях задачи 12.16 найти закон распределения случайного вектора (Yl Υ3), где Υ{=Χλ + Х2, aY3 = X3 + XA + X5 + X6. Ответ: P{Y{ = i, Y3=j} = C5 (1/3)''(2/3У, если/ +j = 5. 12.19. В условиях задачи 12.16 найти закон распределения случайного вектора (У,, YA), где Yx = Хх + Х2, ΥΑ = Х2 + Х3 + ХА + +х5+х6. РЕШЕНИЕ. Имеем Υχ + Г4 = ^Г1 + 2Х2 + Х3 + ^4 + ^5 + ^б = 5+^2· Поэтому (см. формулу (7.1)) при 5 < / +j < 10, / < 5,j < 5 Р{Г, = /, F4 =j} = Р{Г, = ι, Г4 =j, 5 + X2 = i+j} = = ¥{Xx+X2 = i,X2+X3 + XA + X5 + X6=j,X2 = i+j-5} = = P{X{ = 5 -j,X3 + XA + X5 + X6 = 5-i,X2 = i +7-5} = = 5! (\ \5~j(4 \5-'' r\_ γ;-$ = (5-y)!(5-/)!(/+,-5)! U J UJ UJ = 5! fjj (5-y)!(5-»)!(/+/-5)! 65 ·
12.20. В условиях задачи 12.16 найти закон распределения случайного вектора {Z1? Z2, Z3, Z4, Z5, Z6}, где Ζ, = Xi + X6, /=1,2, 3,4,5. Ответ: P{Z, =./„/= 1, 2, 3, 4, 5;X6=j) = = u^m-jLus-nui" έ'еслиУ1 +Λ + - +7'5 = 5 + 5J 12.21. Из урны, содержащей пять красных, два белых и один черный шар, наудачу (с возвращением) вынимают шары. Пусть Z— количество испытаний до появления черного шара, а X— количество испытаний среди первых испытаний Z, в которых появлялся красный шар. Найти закон распределения случайного вектора (Z, X). РЕШЕНИЕ. Пусть Y— количество испытаний (до появления черного шара), в которых появлялся белый шар. Ясно, что Y+ Х = = Z. При т < η получаем P{Z = n,X=m} = P{Y=n-m,X=m,Z=n} = = P{Y=n-m,X=m} = C%(5/8)m(2/8)n-m\/8. 12.22. При проведении соревнований по парашютному спорту на точность приземления парашютист совершает η прыжков и с вероятностью/? при каждом прыжке попадает в зачетную зону (круг). Если парашютист попал в зачетную зону, то с вероятностью г расстояние от точки приземления до центра круга не превышает 1 м. Пусть Ζ — количество попаданий в зачетную зону после η прыжков, а X — количество приземлений, в которых расстояние от центра круга до точки приземления не превышает 1 м. Найти закон распределения случайного вектора (Ζ,Χ). РЕШЕНИЕ. При0 < ι <у < η имеем Ρ{Ζ = /, Х= /} = Ρ{Ζ =j }Р{Х= i\Z = /} = = C{pJ{\ -p)n-J- Cjriil-ry-t. Закон распределения функции от случайной величины Если случайные величины Хх и Х2 дискретные и Υ = = φ(Χχ, Х2), где φ(χ{,χ2) — некоторая функция, то P{Y = y)= Σ Ρ{Χι=χ],Χ2=χ2}, (12.5) (χ„χ2):φ(.χ„χ2) -у 128 4>
т. е. суммирование проводится по всем парам (хх, х2), для которых φ(χ{,χ2) = у. В частности, если φ (χ х,х2) =х1+х2'то P{Y=y} = Σ Р{ХХ =χνΧ2=χ2} = (х],х2):хх+х2=у = ΣΡ{Χι=χι,Χ2=γ-χι), (12.6) где вторая сумма берется по всем возможным значениям хх, для которых Р{ХХ = хх} >0. Для независимых случайных величин формула (12.6) принимает вид Ρ{Υ=γ} = ΣΡ{Χχ=χχ}Ρ{Χ2=γ-χχ} = = ΣΡ{Χχ=γ-χ2}Ρ{Χ2=χ2}, (12.7) где суммирование ведется по всем хх (или х2), для которых Р{ХХ = хх} > О (Р{Х2 =х2) > 0). 12.23. Имеется набор из четырех карточек, на которых написаны числа — 1, 0, 1, 2. Игрок вытаскивает наудачу одну карточку, записывает число, которым помечена эта карточка, и возвращает карточку обратно. Затем повторяет эту операцию еще раз. Пусть Xi — число, записанное при /-м опыте (/=1,2). Найти законы распределения случайных величин Y— ХХХ2 и Ζ = Хх + Х2. РЕШЕНИЕ. В силу формулы (12.5) И независимости Хх и Х2, имеем ¥{Y=y} = P{XlX2=y}= Σ ¥{Χ,= (хх,х2):х^,х2=у = хьХ7=х7} = Σ Ρ{ΧΧ = хЛР{Х7=х7} = 12 λ (хх,х2):х„х2=у А ^ λ Σ \Л=1? Σ 1 = Хл(у), (12.8) (x,tx2):x„x2=y4 4 16 (x„x2):xx,x2=y 16 V^ где A (y) — число пар (Xj, x2) > ·*/E {-1 > 0, 1,2}, для которых ххх2 = у. Ясно, что А (у) Φ 0 лишь для у = -2, —1,0, 1, 2,4. Кроме того, А (-2) = = 2,А(-\)=2,А(0)=7,А(\)=2,А(2) =2,А(4) = 1.Отсюда получаем закон распределения случайной величины Υ: У P{Y=y} -2 1/8 -1 1/8 0 7/16 1 1/8 2 1/8 4 1/16 Для нахождения закона распределения случайной величины Ζ воспользуемся формулой (12.6). Тогда Ρ{Ζ = ζ}= Σ P{Xx=xx}P{X2 = z-xl}. (12.9) χχ+χ2=ζ 129
Ясно, что Ρ{Ζ = ζ} > 0 лишь для ζ = -2, -1, 0, 1, 2, 3, 4 и для этих значений где B(z) — количество пар (х,, х2), xt е {-1, 0, 1, 2}, для которых χι + х2 = Z- Проводя вычисления, получаем таблицу ζ F{Z=z} -2 1/16 -1 2/16 0 3/16 1 4/16 2 3/16 3 2/16 4 1/16 12.24. Решить задачу 12.23, предполагая, что взятые карточки обратно не возвращаются. Ответ: У Р{У=у) -2 1/6 -1 1/6 0 3/6 2 1/6 ζ Ρ{Ζ = ζ} -1 1/6 0 1/6 1 2/6 2 1/6 3 1/6 12.25. Кости домино (28 штук) занумерованы упорядоченными парами чисел (i,j), i <y, /, J e {0, 1, 2, 3, 4, 5, 6}. Из этого множества костей наудачу выбирают одну. Пусть Хх < Х2 — пара чисел, соответствующая этой кости. Найти закон распределения случайных величин Υι=Χι+Χ2π Υ2=Χ2-Χν Ответ: У P{Y}=y} 0 1/28 1 1/28 2 1/14 3 1/14 4 3/28 5 3/28 6 1/7 7 3/28 8 3/28 9 1/14 10 1/14 11 1/28 12 1/28 У P{Y2 = y} 0 1/4 1 3/14 2 5/28 3 1/7 4 3/28 5 1/14 6 1/28 12.26. Игральную кость подбрасывают к раз. Пусть Х(, i = = 1, 2, ...,&, — число, появившееся на верхней грани кости при /-м подбрасывании. Найти закон распределения случайной величины Ук = тях{Х19...,Хк}. 130
РЕШЕНИЕ. Ясно, что для/ = 1,2,..., 6 P{Yk = l} = P{Yk<l}-P{Yk<l-l}. Очевидно также, что {Yk = 1} = {Xi < / при всех / = 1,2,..., к}. Поэтому Р{ Yk < /} = Р{Х{ </, ЛГ2 </,..., ЛГ* < /} или, с учетом независимости и одинаковой распределенности случайных величин Х{, Х2,..., Хк, ?{Ук<1}= f[v{Xi<n = (V{Xl<i))k=(t )*. Следовательно, P{Yk = l}=(t)k -('-^)\/=l,2,...,6. 12.27. В условиях задачи 12.26 найти закон распределения случайной величины Zk = min {Х{, Х2, ..., Хк}. УКАЗАНИЕ. ВЫЧИСЛИТЬ P{Zk > /}. Ответ: P{Zk< 1} = 1 - (l - J ) , /=1,2,... ,6. 12.28. В условиях задачи 12.26 найти закон распределения случайной величины Т= max {4, ^}. РЕШЕНИЕ. Ясно, что Τ может принимать лишь значения 4, 5, 6. Кроме того, {Т = 4} = {Хх < 4}, в то время как {Т = 5} = {Хх = 5}, {Τ = 6} = {Хх = 6}. Поэтому Р{Т= 4} = Р{^ < 4} = 4/6 = 2/3, Р{Г= 5} = Р{^ = 5} = 1/6, Р{Т= 6} = Р{^ = 6} = 1/6. 12.29. В условиях задачи 12.26 найти закон распределения случайной величины R = min {4, Х{}. Ответ: к P{R = к} 1 1/6 2 1/6 3 1/6 4 1/2 131
12.30. В условиях задачи 12.26 найти закон распределения случайной величины Τ = max {9, Хх + Х2}. Ответ: к Р{Т=к) 9 5/6 10 1/12 11 1/18 12 1/36 12.31. В условиях задачи 12.26 найти закон распределения случайной величины R = min {-2, Хх — Х2}. Ответ: к P{R = к} -5 1/36 -4 1/18 -3 1/12 -2 5/6 12.32. Законы распределения независимых случайных величин Хи F заданы следующими таблицами к Р{Х=к} 1 0,5 2 0,2 3 0,3 к P{Y=k} 0 0,2 1 0,3 2 0,5 Найти закон распределения случайной величины Ζ = max {Xy Y}. РЕШЕНИЕ. Очевидно, что Ρ{Ζ < к] = Р{Х< к, Υ< к} = Р{Х< k}P{Y< к}. В силу условий задачи случайная величина Ζ может принимать лишь значения 1, 2, 3. Ясно также, что Ρ{Ζ < 3} = 1 и Ρ{Ζ < 0} = 0, в то время как Ρ{Ζ < 1} = Р{Х< 1}Р{ Υ < 1} = 0,5 · 0,5 = 0,25, Ρ{Ζ< 2} = Р{Х< 2}Ρ{Υ< 2} = 0,7 · 1 = 0,7. Используя равенство Ρ{Ζ = к} = Ρ{Ζ <к} - Ρ{Ζ < к - 1}, 132
находим P{Z = 1} = 0,25, P{Z = 2} = P{Z < 2} - P{Z < 1} = 0,7 - 0,25 = 0,45, P{Z = 3} = P{Z < 3} - P{Z < 2} = 1 - 0,7 = 0,3. Ответ: Ζ V{Z = z} 1 0,25 2 0,45 3 0,3 12.33. В условиях задачи 12.32 найти закон распределения случайной величины Т= min {X, У}. УКАЗАНИЕ. Воспользоваться равенствами P{T>k} = P{X>k}P{Y>k}, Р{Т=к) = Р{Т>к}-Р{Т>к+\). Ответ: к Р{Т=к} 0 0,2 1 0,55 2 0,25 12.34. В условиях задачи 12.32 найти закон распределения случайной величины W = X+ Υ РЕШЕНИЕ. Ясно, что случайная величина W может принимать лишь значения 1, 2, 3, 4, 5. Используя (12.6) и независимость Xи Υ, находим P{W=w}= Σ P{X = x)P{Y=w-x). х:Р{Х=х}>0 Поэтому P{W= 1} = Р{Х= 1}F{Y= 0} + Р{Х= 2}P{Y= -1} + + Р{Х= 3}Ρ{Υ= -2} = Р{Х= 1}Ρ{Υ= 0} = 0,5 ■ 0,2 = 0,1. Производя подсчеты для оставшихся значений, находим к P{lV=k} 1 0,1 2 0,19 3 0,37 4 0,19 5 0,15 12.35. В условиях задачи 12.32 найти закон распределения случайной величины V=X— Υ. Ответ: к P{V=k} -1 0,25 0 0,25 1 0,31 2 0,13 3 0,06 133
12.36. Случайные величины Хх и Х2 независимы и имеют распределение Пуассона с параметрами λ} и λ2 соответственно. Найти закон распределения случайной величины Χ— Χλ + Χν УКАЗАНИЕ. Воспользоваться соотношениями (12.7) и равенством т Ц λ?-* _ 1 Хт Ответ: Р{Х=т) = — е~\ где λ = λι + λ2. х\ Математическое ожидание и дисперсия <Q2.5> функции от случайной величины. \/ Ковариация Пусть JSfj и Х2— дискретные случайные величины и Υ = = φ(Χχ,Χ2). Тогда МГ= Σ φ(χι,χ2)Ρ{Χι=χι,Χ2 = χ2}, (12.10) X„Xj где суммирование ведется по всем возможным наборам хх, х2. Для вычисления дисперсии случайной величины Υ используются соотношения DF= Σ (φ(χχ,χ2) -ΜΥ)2Ρ{Χχ=χχ,Χ2 = χ2} ИЛИ Dr= l92(x1,x2)p№=jci^2 = ^- (МГ)2. (12.11) xvx2 Ковариацию cov (Xx, X2) случайных величин Хх и Х2 вычисляют по формулам cov{XXyX2)= Σ (χιχ2-ΜΧι·ΜΧ2)2Ρ{Χι=χχ,Χ2=χ2}, Χ],χ2 cov (Χ{9 Χ2) = ΜΧΧΧ2 - ΜΧΧ · ΜΧ2, (12.12) где ΜΧΧΧ2 = SJC1Jc2P{Ar1=x1,JT2=jc2}. Отметим, что для математического ожидания и дисперсии сохраняются свойства, сформулированные в гл. 5 (см. § 5.2 и 5.3). Ковариация является линейной функцией по каждому из своих аргументов: cov (Х{ + Х2, Хъ) =cov (X{,X3) +cov (А^, Jr3), cov(Xl,X2+X3)=cov(Xl,X2) + co\(X1,X3). (12.13) Кроме того, cov (Хх, Х2) = cov (ЛГ2, Хх). 134
В случае, когда Υ=ΧΧ+ Х2, выполняется равенство ΌΥ= Ό(Χ{ + Х2) = ΌΧ{ + ΌΧ2 + 2 cov (X{, X2). (12.14) 12.37. Закон распределения случайных величин Х{ и Х2 задан таблицей ~*ΐ^^^ -2 1 -1 0,2 0,1 0 0,1 0,2 1 0,2 0,2 Найти МХ,Х2, cov (Х„ Х2), D(X, + Х2). РЕШЕНИЕ. По формуле (12.10) находим МХ,Х2 = (-2) (-1) · Р{Х, = -2, Х2 = -1} + (-2) · 0 · Р{Х, = -2, Х2 = 0} + (-2) · 1 ·Р{Х, = -2,Х2 = 1} + 1 · (-1) · Р{Х, = 1, Х2 = -1} + + 1·0·Ρ{ΑΓι = 1,^ = 0} + 1-1-Р{Х,= 1,Х2 = 1} = 2-0,2 + 0-0,1 - -2-0,2-1-0,1 + 0-0,2+ 1-0,2 = 0,1. Для вычисления cov (X,, Х2) необходимо, прежде всего, определить значения величин MX, и МХ2. Из таблицы находим законы распределения случайных величин X, и Х2 (см. формулы (12.1) и (12.2)): к \>{Хх = к) -2 0,5 1 0,5 к Р{Х2 = к} -1 0,3 0 0,3 1 0,4 Отсюда MX, = (-2)Р{Х, = -2} + 1 · Р{Х, = 1} = -0,5; MX, = (-1) · Р{Х2 = -1} + 0 · Р{Х2 = 0} + 1 · Р{Х2 = 1} = ОД. Учитывая предыдущие вычисления, получаем cov (Х„ Х2) = МХ,Х2 - MX, · МХ2 = 0,1 - (-0,5) · 0,1 = 0,15. Для нахождения D(X, + Х2) обратимся к формуле (12.14), в которой пока неизвестными остаются величины DX, = МХ\ - (MX,)2, DX2 = MX2 - (МХ2)2. 135
Используя законы распределения случайных величин Хх и Х2, находим Μ Х\ = (-2)2Р{ХХ = -2} + 12Р{ХХ = 1} = 2,5; М122 = (-1 )2Р{Х2 = -1} + О2 · Р{Х2 = 0} + I2 · Р{Х2 = 1} = 0,7. Таким образом, Ш^ = 2,5 - (-0,5)2 = 2,25; ΌΧ2 = 0,7 - (ОД)2 = 0,69. Теперь воспользуемся формулой (12.14). Имеем Ό(ΧΧ +Х2) = ΌΧΧ + 2 cov (Л^, Jr2) + ШГ2 = 2,25 + 2 · 0,15 + 0,69 = 3,24. 12.38. Закон распределения случайных величин Хх и Х2 задан таблицей. J¥~~ —~——3 0 2 -1 1/3 1/4 3 1/6 1/4 Найти МХХХ2, cov (А^, Χ2),Ό(ΧΧ+Х2). Ответ: 1, 1/3,50/9. 12.39. Правильную шестигранную кость подбрасывают 10 раз. Пусть Xt — количество опытов, в которых на верхней грани кости появилось число /. Найти МХХХ2. РЕШЕНИЕ. Воспользуемся методом индикаторов и представим случайные величины Хх и Х2 в виде суммы случайных величин Х\ = Χι + Х2 + - + %ю> ^2 = Тх + Т2 + ... + Г10, где случайная величина Xj(Tj) равна единице, если ву'-м испытании выпала грань с цифрой 1 (2), и равна нулю в остальных случаях. Тогда / Ю w 10 \ Ю 10 10 10 МВД = М( Σ хД Σ 7, ) = Μ Σ Σ χ^ = Д Σ, MXjTk. Еслиу * А;, то случайные величины χ. и 7^ независимы. Поэтому Μχ,Γ* = Μχ, · МТк = 1/6 · 1/6 = 1/36. Если же у = к, то случайная величина %jTk всегда равна нулю, так как одновременно 1 и 2 выпасть не могут. Следовательно, M%jTk = 0. Таким образом, 10 10 МХХХ2= Σ Μχ,7ν= Σ Σ 1/36 = 90-1/36 = 2,5. j*k J j=\ k=\ k*J 136
12.40. В условиях задачи 12.39 обозначим через Yx количество опытов, в которых на верхней грани появилось нечетное число, аУ2- количество опытов, в которых на верхней грани появилась либо цифра 2, либо цифра 4. Найти cov (Y{, Υ2). УКАЗАНИЕ. Представить величины У{и У2в виде суммы индикаторов и воспользоваться тем фактом, что cov (Х + Z, Т) = cov (Χ, Τ) + + cov(Z, Г). Ответ: 15. 12.41. Совместный закон распределения случайных величин Х}и Х2 задан таблицей ^^—-JiL 0 3 1 1/8 1/4 2 3/8 1/4 Найти математическое ожидание и дисперсию случайной величины Υ = min {Х{, Х2}. РЕШЕНИЕ. По формуле (12.10) находим Μ Υ = min {0,1}· Р{Х{ = 0, Х2 = 1} + min {0, 2} · Р{^ = 0, Х2 = 2} + + min {3, 1} · Р{^ = 3, Х2 = 1} + min {3, 2} · Р{^ = 3, Х2 = 2} = = 0 · 1/8 + 0 · 3/8 + 1 · 1/4 + 2 · 1/4 = 3/4. Аналогично получаем Μ Υ2 = О2 · 1/8 + О2 · 3/8 + I2 · 1/4 + 22 · 1/4 = 1 \. Отсюда ΌΥ= 5/4 - (3/4)2= 11/16. 12.42. В условиях задачи 12.38 найти математическое ожидание и дисперсию случайной величины Y= max {Хх, Х2}. Ответ: МУ=1|,ОУ=1^. 12.43. В условиях задачи 12.41 найти математическое ожидание и дисперсию случайной величины Ζ = max {XUX2}. Ответ: MZ=2g, ΌΖ= ρ. 12.44. В условиях задачи 12.41 найти МХ\ (2 + Х2). 3 Ответ: 15^. 137
12.45. В условиях задачи 12.41 найти cov (Хх — Х2, Хх + Х2). УКАЗАНИЕ. Воспользоваться равенством cov (Хх - Х2, Хх + Х2) = ΌΧ{ - ΌΧ2. Ответ: 2^. 12.46. Случайные величины Хх и Х2 независимы и распределены по закону Пуассона с параметрами ХхиХ1 соответственно. Найти производящую функцию φχ(ζ) = Μζχслучайной величины Х=ХХ+ Х2. УКАЗАНИЕ. Воспользоваться независимостью случайных величин ζχ\ и ζχι^ а также решением задачи 10.21. Ответ: φχ(ζ) = е(Х« + λ*)(<" ° . 12.47. Найти закон распределения случайной величины X, для которой найдена производящая функция в задаче 12.46. Задачи 12.46 и 12.47 дают другой способ решения задачи 12.36. УКАЗАНИЕ. Вероятности Р{Х = п) являются коэффициентами разложения φχ(ζ) в ряд Тейлора в окрестности точки ζ = 0 (см. формулу (10.18)). Ответ: Р{Х=п} = — е~\ где λ = λχ + λ2. уч Условные распределения <j2.4> случайной величины. \Х Условное математическое ожидание Пусть X и Υ— две дискретные случайные величины. Условная вероятность события {Υ = γβ при условии, что произошло событие Х=х,, задается соотношением F{Y=yhX=Xi} Р{¥=уу\Х = Х;}= Р{д4Х/} · (12.15) Вероятность (12.15) определяется лишь в случае Р{Х = xt) > 0. Условное математическое ожидание случайной величины Упри условии X = Xi задается формулой Р{У=у,,Х=хЛ M[Y\X=Xi] = Ъу?{Г=У]\Х = х1)= Σ yj \{Х=Х.} .(12.16) 138
Наряду с (12.15) и (12.16), можно рассматривать более общие величины: условную вероятность события {Υ = γβ при условии Хе В, где В — некоторое подмножество возможных значений Х(Р(В) >0): P{Y=y„XeB} P{Y=yj\XeB}= ρ{χ'ΕΒ} , и условное математическое ожидание ^при условии Х<= В В этом случае „ P{Y=V:,X&B} Р{ХеВ}= Σ Ρ{Χ=χ,} х,<-В (12.17) (12.18) (12.19) Р{¥=урХеВ}= Σ P{Y=yj,X=Xi}, (12.20) где суммирование проводится по всем xi9 которые лежат в В. 12.48. Совместное распределение случайных величиной Уза- дано таблицей ^Г—^JL 1 2 -1 1/6 1/8 0 1/4 1/6 1 1/6 1/8 Найти P{Y=l\X=l},M[Y\X=l],M[X\Y<0],P{X=l\Y<0}. РЕШЕНИЕ. Таккак Р{Х= 1} = Р{Х= 1, Y= -1} + Р{Х= 1, Υ= 0} + Р{Х = 1, Υ= 1} = = 1/6 + 1/4 + 1/6 = 7/12 и Р{Х=\, Y=l}= 1/6, то (см. формулу (12.15)) р{г=цх=ц=^=^:1}=ш,=2/7. Р{Х=1} 7/12 Далее находим M[Y\X=l] = 1 [(-l)P{Y=-l,X=l} + P{JT=1} + 0·Ρ{Υ=0,Χ=1} + 1·Ρ{Υ=1,Χ=1}] = 1 7/12 [(-1)· 1/6 +0-1/4+1-1/6] =0. 139
Вновь обращаясь к исходным данным задачи, получаем закон распределения Y: к P{Y=k] -1 7/24 0 5/12 1 7/24 Поэтому P{Y< 0} = Р{Г= -1} + P{Y= 0} = 7/24 + 5/12 = 17/24. Отсюда и из (12.17) (с точностью до обозначений) имеем [Р{Х = 1, Y= -1} + Р{Х= 1, Υ= 0} 1 1 Ρ{Υ< 0} 17/24 [1/6+1/4] = 10/17. Для нахождения Μ [^УХ 0] заметим, что Р{Х= 2, Υ< 0} = Р{Х= 2, Υ= -1} + Р{Х= 2, Υ= 0} = 1/8 + 1/6 = 7/24. По формуле (12.18) (вновь с точностью до замены Xна У), находим М[ \Y\Y-M-\-F{X=UY<0} +2^{Х=2УУ<0] _ Р{У< 0} = 1 · 10/17 + 2 · ' = 1 —· ι iu/i/-rz 17/24 11?. 12.49. Совместный закон распределения случайных величин X и Υ задан таблицей ^--^ -1 1 0 1/3 1/4 1 0 1/6 2 1/8 1/8 НайгиР{ЛГ=-1|Г=2}; P{X=-l\Y> 1}; М[ЛГ|Г=1]; М[Х|Г>1]. Ответ: Р{ЛГ=-1|Г=2} = 1/2; P{X=-l\Y> 1} = 3/10; М[Х|Г= = 1] = l;M[X\Y>l]=2/5. 12.50. Случайные величины Хи F независимы, причем Р{Х= 1} = Р{У= 1} =р, Р{Х= 0} = Ρ[Υ= 0} = 1 -р. НайтиМ[ЛГУ|Х=1]; М[Х+ ГрГ= 0]; М[Х|Х+Г= 1]. Ответ: />; p; 1/2. 140
12.51. Случайные величины X и Υ независимы и одинаково распределены. Найти М[Х\Х + Υ= ζ], если Р{Х+ Υ= ζ} > 0. РЕШЕНИЕ. В силу симметрии, Μ[Χ\Χ+Υ=ζ]=Μ[Υ\Χ+Υ=ζ]. (12.21) В то же время P{X=x„Y = y,,X + Y=z} M[X+Y\X+Y=z]=I,j(xi + yJ)- ν{Χ+γ=ζ} - = и.£у.\-х1+УЛ P{X+Y=z} = P{X+ZY = z}uA=<P{X = X"V=y;) = = z' P{X+ Y=z} = Z' (12'22) P{X=x„Y = y„X+Y=z} M[X+ Y\X+ Υ=ζ]=Σχ.-± p{X + J=z} + P{X = x„Y = yj,X+Y-z} _^ P{X=x„X+Y=z} ^ tjyJ P{X+Y=z} ι' P{X+Y=z} Р{Х = у,,Х + Y=z] + fo \{/+Y=z} =M[X\X+Y=z]+M[Y\X+Y=z]. (12.23) Объединяя формулы (12.21)—(12.23), получаем M[X\X+Y=z] =z/2. 12.52. Пусть случайные величины Xи У независимы, одинаково распределены, причем P{X=k} = P{Y=k} = ^e-\ λ>0, к = 0, 1,.... НайтиP{X=J\X+ Y=n}, М[Х\Х+ Υ=η]. УКАЗАНИЕ. Воспользоваться равенством Р{Х + Υ = η] = (2 λ)"6-2λ (см. задачи 12.46 и 12.47). Ответ: С{ · γη, J = 0, 1,..., и; η/2. 12.53. Пусть случайные величины Хи У независимы, причем Р{Х=к} = ^е~^, Р{Г=*} = ^,е-Ч НайтиP{X=j\X+ Y=n}; М[Х\Х+ Υ=η]. 141
УКАЗАНИЕ. Воспользоваться следующим равенством: Р{Х + У = п} = _(λ. + λ2)" λι_λ, и! Ответ: с^^-^Д^-^J , J = 0, 1,...,«; j^p^if. 12.54. Случайные величины X и Υ независимы, причем P{X=k} = P{Y=k}=pqk~\ 0 <р < 1, q = 1 -ρ, Λ =1,2,.... Найти P{Ar=y|Ar+ Υ=η}, P{X=j\X= Y). Ответ: 1/(/ι-1); (1 - q2W{j~x), J = 1, 2,.... 12.55. Из урны, содержащей два черных, четыре красных и два белых шара вытаскивают (с возвращением) по одному η раз шары. Пусть X— количество черных, a Y — количество красных шаров, появившихся в этих опытах. Найти Р{Х = к \Х+ Υ= ζ}. Ответ: С*(1/3)*(2/3)*-*, £ = 0, 1,..., ζ.
ДВУМЕРНЫЕ АБСОЛЮТНО НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Двумерные плотности распределения. Независимость Функция/?^ у(х, у) называется двумерной плотностью (или совместной плотностью) распределения вероятностей случайных величин X и Y, если Р{(Х, Y)eB}=j pXY(x,y)dxdy, (13.1) в где В— любое подмножество на плоскости, для которого левая часть (13.1) определена. Двумерная плотность распределения удовлетворяет условию + оо Ч-оо J J Px,Y(x,y)dxdy=l. (13.2) —оо —оо Таким образом, зная совместную плотность, по формуле (13.1) можно для любого множества В на плоскости вычислить вероятность того, что случайная точка (Χ, Υ) попадет в это множество. В частности, если В = {(х,у): ах<х < bv а2<у < Ь2}, то Р{(Х, Y)e В} = Р{ах <Х< Ь{, а2 < Y< Ь2) = ь,ь2 = jjpx,r(x,y)dxdy. (13.3) α{α2 Двумерная величина, имеющая плотность распределения, называется абсолютно непрерывной, а соответствующее ей распределение — абсолютно непрерывным распределением. Если вектор (Χ, Υ) имеет абсолютно непрерывное распределение, то P{al<X<b{,a2< Y<b2} = P{al<X<bl,a2< Y<b2) (13.4) и значение как левой, так и правой частей этого равенства совпадает со значением правой части (13.3). 143 13 <$>
Если известна плотность распределениярх у(х, у), то, используя следующие соотношения, можно найтирх{х) иру(у): Ч-оо Ч-оо Ρχ(χ) = J Рх, у(х>У) &У, Ру(х) = J Рх, у(х,У) <Ьс. (13.5) —ОО —ОО Многие прикладные задачи формулируются в терминах случайных величин. В этом случае для ответа на поставленные вопросы, как правило, достаточно знать вероятности любых событий, выражающихся через упомянутые случайные величины. Эти вероятности удобно задавать с помощью (13.1), особенно тогда, когда плотность, входящая в эту формулу, либо простая по виду, либо хорошо изучена. Приведем два часто встречающихся распределения, задаваемых плотностью совместного распределения. 1°. Равномерное распределение на множестве В: рх,ах,у)- \т-если (х'у)& в> (ад 10, если (х, у) £ В. Здесь \В\ — площадь множества В. 2°. Двумерное нормальное распределение: Рх,г(х>У) 2nG}C2J\ — Ρ2 "2(1-ρ2) 1 г{х-аху 2ρ , w (y-a2) XQxpi-47r^\-^-^x-aO(y-a2) + —^ (13.7) Случайные величины X и Υ называются независимыми, если для любых подмножеств В{, В2 с (—°°, +°°) Р{Хе В{, Ye B2} = F{Xe Βχ}Ρ{Υε Β2). (13.8) Аналогично определяется независимость л-мерных случайных величин (см. определение (9.12), сохраняющееся и в общем случае). Если случайные величины Χ, Υ независимы, имеют плотности рх{х) иру(у) и совместную плотность/?^ Y(xyy), то определение (13.8) эквивалентно следующему: Рх,у(х,У)=Рх(х)Ру(У) (13.9) в каждой точке, являющейся точкой непрерывности всех участвующих в (13.9) функций. 144
13.1. Случайная точка (Χ, Υ) равномерно распределена в квадрате В = {0 < χ < 4, 0 < у < 4}. Найтирх у(х, у), Fx(x), Р{-2 < X< 2, 1<У<3}. РЕШЕНИЕ. Площадь квадрата В равна 16, поэтому „ ίν ч _ J1/16. если (χ, у) <= В, Рх, уКХ,У) "[о, если (х, у) е В. Далее имеем Р{-2 < Х< 2, 1 < Υ< 3} = ]] рх у(х,у) dx ay = -2 1 2 3 2 3 j = ί J />jrf Y(x,y)dxdy= J J yr dxdj/ 0 1 0 1 (в предпоследнем переходе использовано равенство/?^ у(х, у) = 0, χ < 0). Отсюда Ρ{-2<*<2, 1<Г<3} = 1| ах] dy=\. 0 1 Для вычисления Fx{x) заметим, что Fx{x) = Ρ{^< χ) = 0, если χ < 0. Если же χ > 0, то i^(x) = P{Jf <χ} = Р{Х< χ, -оо < γ< +оо} = Jt +oo χ + 00 = J J Px, y(u> v) dwdv= J di/ J p^r(w,v)dv = — oo —oo —oo —oo χ 4 χ 4 = J dw J /?jf y(w, v) dv = J dw J /^ Y(u, v) dv = -oo о 0 0 хл4 4 = j du j px Y(u,v) dv, о о где χ л 4 = min {χ, 4}. Но в области {0 < и < χ л 4, 0 < ν < 4}, /jjr y(w, v) = 1/16. Отсюда . *л4 4 . ^Х) = Т^ J =du$ =dv= д(хл4),х>0. ιυ о о ч 13.2. Из квадрата размером 6x6с центром в начале координат и со сторонами, параллельными координатным осям хиу, вырезан квадрат размером 2 χ 2 с центром в начале координат и со сторонами, параллельными координатным осям. В указанную область наудачу брошена точка. Пусть (Χ, Υ) — координаты этой точки. Найти Лг, Их> У)>Рх(х)>Ру(У)- Зависимы или нет случайные величины Хи ΥΊ 145
РЕШЕНИЕ. Очевидно, что площадь рассматриваемой фигуры (рис, 9) равна б2 - 22 = 32. Поэтому Рх,Ах>У) = _ J 1/32,если (χ, у) е В, [Оу если (х, у) € В. Так же, как и при решении задачи 13.1, получаем Рх(х)= \ Рх,у(х*У)&У = —со 3 = J Рх,у{х*У)&У- Если χ е [-3, 3], то подынтегральная функция/*^ у(х,у) равна нулю, следовательно, в этом случаерх(х) = 0. Рассмотрим теперь отдельно случаи -3 < jc < -1, —1 < jc < 1, 1 < χ < 3. В первом и третьем случаях при — 3 < у < 3 плотность Рх, у(х*У) = 1/32. Значит, ρχ(χ) = ίτ> dyszn ^Тб' хе [-з>-П и [ЬЗ]. -з Если же — 1 < χ < 1, торх у(х9 у) = 1/32 лишь при — 3 < у < -1 и 1 < у < 3, в остальных случаях совместная плотность равна нулю. Поэтому 3 ~1 -1 Ρχ(χ) = J Рх9 у(*>У) &У - J />*, к(х, У) dy + J ρ χ Y(x,y) dy + -3 -3 -I В силу симметрии ГО, если уе [-3,3], РАУ) - 1 3/16, если >>ε [-3,-1] и [1,31, 11/8, если .у€ (-1,1). Покажем, что случайные величины X и Υ зависимы. В самом деле, пустьΒλ — {—1 <х < I}, В2 = {—1 <у < 1}. Тогда вероятность ¥{Х € Вх, Υ ε 2ϊ2} есть вероятность попадания случайной точки внутрь квадрата — 1 < χ < 1, — 1 < у < 1. Из рисунка 9 ясно, что так 146
как в этом квадрате плотнрсть/?^ у(х, у) равна нулю, то указанная вероятность равна нулю. С другой стороны, ?{XeBl}= \ px(x)dx= Цах=\, -1 -1 и в силу симметрии Р{ Ye В2} = 1/4. Таким образом, Р{Хе Вх, Ye В2} = 0*F{Xe Bx}V{Ye B2) = 1/4-1/4. В силу определения (13.8) случайные величины ΛΓи F зависимы. 13.3. Случайная точка (Х9 Y) равномерно распределена внутри круга радиуса R с центром в точке (0, 0). Найтирх(х) прх у(х, у). ^ / ч J -F!> если χ2 + У2 < R2> Ответ:/>г Y(x,y)= л nRv [θ, еслих2 + ^2>Л2; 10, если |х| > R. 13.4. Из круга радиуса Я с центром в начале координат вырезан круг радиуса г (центры кругов совпадают). В полученную область наудачу брошена точка. Пусть (Χ, Υ) — ее координаты. Найти рх{х). Зависимы или нет случайные величины Xи Y? { 2(jR2-x2 - Jr2-x2) , , , МКГ^ТЦ >если \*\<r, K{R2_r2y еСЛИ r<\X\<R, [ 0, если |х| > R. Случайные величины Х и F зависимы. УКАЗАНИЕ. Использовать идеи решения задачи 13.2. 13.5. Совместная плотность распределения случайных величина и Υ имеет вид [с(х + >>), если0<х<6, 0<у<6, Ρχ, γ\χ·> У) | о в остальных случаях. Найти с,рх(х), Р{Х> 2}. РЕШЕНИЕ. В силу формулы (13.2) + 00 + CXI 6 6 ι= ί ί РхМх>У) ахаУ = J'J Px,Y(x,y)dxdy = -CXI -CXI 0 0 6 6 6 6 6 6 = с J J (x + y) dxdy = c $ xdx \ dy + с J dx \ ydy = 0 0 0 0 0 0 = c-18-6 + c-6-18 = 216c. 147 Ответ: рх(х) = л
Отсюда находим с = 1/216. Далее находим + оо 6 Рх(х)= \ Рх,у(х,У)йу = J PXty(x,y)dy. -оо О Ясно, чторх(х) = 0, если χ £ [0, 6]. Если же χ е [0,6], то б />*(*) =ci (x+y)dy = c(6x+ 18) = (6х + 18)/216=(х + 3)/36. о Отсюда Р{Х> 2} = J />^(х) dx = J px{x) dx = 2 2 1 f / _L<34 A l Гб2~42 , , А\ 11 = Зб{ ^ + 3>dx=36[-2— +3-4J=T8· Ответ: с = 1/126; Р{ЛГ> 2} = 11/18; ί(χ + 3)/36, еслиxg [0,6], /Мх/ [о в остальных случаях. 13.6. Совместная плотность распределения случайных величин Хи Υ имеет вид (х )= к(х2+^),если0<х<2,0<>><2, Ρχ, γ\ >У) [о в остальных случаях. Наитие, ру(у), Р{Г> 1}. Ответ: с = 3/32; Р{Г> 1} = 11/16; 10, если>>е [0,2]. 13.7. Совместная плотность распределения случайных величин Хи Υ имеет вид Рх,г(х,у) = \ЗЛПГ^>есл110<х + У<2>х>0>У>0' [ 0 в остальных случаях. Наитиях), Р{1/2<Х< 1, Υ< 1}. РЕШЕНИЕ. На рисунке 10 заштриховано множество, в котором/?^ у(х, у) > 0. Ясно, чторх{х) = 0, если χ е [0, 2]. Если же χ е [0, 2], то + оо 2-х Ρχ(χ)= J Рх, Ах>у) аУ = ί /ч Их> у) d^ = -оо 0 2-х -5 *¥*«>-fa+ytf--fc*-*>. о Ю 148
Для вычисления вероятности Р{1/2 < X < 1, У< 1} воспользуемся равенством (13.3), согласно которому Р{1/2<ЛГ< 1, Г<1} = = Р{1/2 < Х< 1, -«>< Г< 1} = 1 1 1/2 -оо 1 ] 1/2 О г a f 3(x + у) . 1/2 О ι 0| 1/21 \ ΐι ~" Рис. 10 .'\L = 4J ((x+l)2-x2)dx-^((x+lp-x3) 1/2 1 1/2 15 64' 13.8. Совместная плотность распределения случайных величин Хи У имеет вид = ί2λ»-4 если0 < х< \,у > 0, Рх, γ(χ> У) \о в остальных случаях. Зависимы или нет случайные величины X и У? РЕШЕНИЕ. Найдем сначала рх(х) и />r(j>)» Так как подынтегральная функция равна нулю при у < 0 для всех*, имеем + 00 00 Ρχ(χ) = J Ρ χ, г(х,У) &У = \ Рх, ЛХ>У) аУ- —оо О Если χ е [О, 1 ], то, очевидно, рх(х) = 0. Если же χ е [0, 1 ], то рх(х) = J 2Ue-^ ay = be. (13Л0) о Аналогично предыдущему получаем, чтору(у) = О, если,у < 0. Если же у >0, то Рг(у) = J bckt-^ay = λβ-Ч (13.11) о Заметим, наконец, чторх г(хуу) = рх(х)ру(у) при всех χ и у. В самом деле, если либо хг [0, 1], либо у < О, то как левая, так и правая части последнего равенства равны нулю. Если же 0 < χ < 1 и у > О, то в силу формул (13.10) и (13.11) упомянутое равенство также справедливо. Таим образом, случайные величины X и Υ независимы. 149
13.9. Совместная плотность распределения случайных величин Хи Υ имеет вид ч J -4= е~*2/2 е-У, если у > О, ΙΟ, если^<0. Зависимы или нет случайные величины X и ΥΊ УКАЗАНИЕ. Воспользоваться формулой (13.9) и тем, что функция φ(χ) = -=е-*2/2 является плотностью стандартного нормального л/2 π + оо распределения. Следовательно, J φ(χ) άχ= \. —ОО Ответ: независимы. 13.10. Совместная плотность распределения случайных величин X и У имеет вид Найти рх(х). Зависимы или нет случайные величины X и У? УКАЗАНИЕ. Воспользоваться указанием к задаче 13.9. Ответ: рх{х) = -т= е~*2/2; независимы. л/2 π 13.11. Совместная плотность распределения случайных величин Хи Υ имеет вид Найти />jr(x). Зависимы или нет случайные величины X и ΥΊ УКАЗАНИЕ. При вычислении интеграла использовать замену ζ = у/<з2 и указание к задаче 13.9. Ответ: ργ(χ) = —т= е~* /(2σι); независимы. 13.12. Совместная плотность случайных величин Хи У имеет вид Найти рх(х), Ру(у). Зависимы или нет случайные величины ΧπΥ? 150
УКАЗАНИЕ. Воспользоваться равенством χ2 — 2рху+у2 = (l-p2)x2 + + (у — рх)2, заменой ζ = у - рх и указанием к задаче 13.9, а также симметрией/?^ у(х, у) относительно аргументов. Ответ: рх{х) = -т= е-*2/2, ру(у) = -т= е~у2/2; независимы, J2n *J2n если ρ = 0, и зависимы, если 0 < |р| < 1. 13.13. Совместная плотность распределения случайных величин Хи Уимеетвид ν Ι 2<ι-Ρ2) Рх, АХ>У) = : тг=1 е 2πσ1σ2νΐ - ρ2 Найти рх(х). УКАЗАНИЕ. Воспользоваться равенством Α 9η ν2 . г2 2р .У -J—xv + - ху σ2 <Ί*27 <Ί χ1 2Ρ л. У2 /ι 2ч*2 л. W σ2 V ^5 — XV + ^ = (1 — О2) —ч + -3 У-Р —* <*2 и заменои£ = >> - ρ — χ. Ответ: /^(χ) = —L= e^2/(2^. /V Закон распределения \Γ/ функции от случайных величин Пусть рх у(х, у) — совместная плотность распределения случайных величин X и }^aZ = φ(Χ, Υ), где φ(χ, у) — «хорошая» функция, т. е. такая, что Ζ также является случайной величиной (более подробно см. [9]). Функция распределения случайной величины Ζ находится по формуле Fz(z) = Ρ{Ζ < ζ) = Ρ{φ(*. Υ) < ζ) = = Ρ{φ(Χ, Y)sBz} = ]]pXtr(x,y) dxdy, (13.12) где Bz = {(x,y): <p(x,y) <z}.Bcny4aeZ = <p(X, Y) = X + Уформу- ла (13.12) принимает вид Fz(z) = Р{Х+ Υ< ζ} = Τ άχ Τ Ρ χ, г(х> У) dy = —οο — οο = +f uyj pXY{x,y)ax. (13.13) —οο — οο 151
Плотность случайной величины Ζ = X + Υ вычисляется по формуле + оо +оо Pz(z)= J pXY(x,z-x)dx'= J pXty(z-y,y)dy. (13.14) — ОО —ОО Если случайные величины X и Υ независимы и имеют плотности рх{х) иру(у),то + оо +оо Px+y(z)= j px(x)py(z-x)dx= J px(z-y)pY(y)dy. (13.15) —oo —oo 13.14. Совместная плотность распределения случайных величин Хи F имеет вид Jx + .y, еслиО<х< 1, 0 <у< 1, Ρχ, Их> У> ~ 10 в остальных случаях. Найти функцию распределения случайной величины Ζ = = max {Χ, Υ). РЕШЕНИЕ. В данном случае φ(χ,у) = max {x, у}. Следовательно, Βζ = {(χ,у): max {χ, у} < ζ} = {(х, у): х < ζ, у < г}. Отсюда, используя формулу (13.12), находим Fz(z)=P{Z<z}= J J pXfY(x,y)dxdy. (13.16) -oo —oo Из определения случайной величины Ζ и условия задачи следует, что Fz(z) = 0, если ζ < 0, и Fz{z) = 1, если ζ > 1. Рассмотрим значения ζ е (0, 1]. Преобразуя (13.16), получаем ζ ζ ζ ζ Fz(z) = J ί РхМх>У) ахаУ = J J (*+:v) dxdy = 0 0 0 0 = й [(x + Ζ)2 -X2] dx= 1[(X + ζ)2 -Χ3]** о =z3. υ ί 0, если г < 0, Ответ: Fz(z) = 1 ζ3, если^е (0, 1], ί 1, если г > 1. 13.15. Совместная плотность случайных величин X и Υ имеет вид Рх>г(х,у) = \г1(х + у)'если0<х<3'0<у<6' 10 в остальных случаях. Найти функцию распределения случайной величины Ζ = = min {Χ, Υ}. 152
О, если ζ < О, Ответ: Fz(z) = < 1 - j^(3 -z)(6-z)(9 + 2^),если^е (0, 3], I 1, если£> 3. 13.16. В условиях задачи 13.14 найти функцию распределения случайной величины Ζ = min {Χ, Υ). РЕШЕНИЕ. Имеем Fz{z) = Ρ{Ζ< ζ} = P{miYL{X, Y}<z} = = 1 - P{min {Χ, Υ) > ζ} = 1 - Ρ{Χ> ζ, Υ>ζ). Следовательно, для нахождения Fz{z) необходимо вычислить вероятность Р{Х> ζ, Υ> ζ}- По формуле (13.3) оо оо P(Z) =P{X>Z, Y>Z}=] J Px,y(x,y) dxdy. Ζ Ζ Ясно, что Ρ{ζ) = 0, если ζ > 1, поскольку рх у(х, у) = 0, если max {χ, у} > 1. По тем же соображениям Ρ(ζ) = 1, если ζ < 0, так как в этом случае оо оо +оо +оо ί J Рх, г(х>У) dxdy= \ J Ρχ, у(х,y)dxdy=l. Ζ ζ —оо —оо Рассмотрим, наконец, случайге [0,1]. Имеем 11 11 Ρ{ζ) = \ \ Рх,у(х,у) dxdy = J J (χ + .у) dxdy = 1 = JJ [(x+l)2-(x + z)2]dx = = z[(*+l)3-(x + £)3] = (l-*)2(l+z). 6 Отсюда окончательно получаем ГО, если г< 0, ^zU)=1 1-(1-*)20+*),если*е (0,1], [ 1, если£> 1. 13.17. Совместная плотность распределения случайных величин X и У имеет вид Рху{ху) = |^ап(х + у),еслиО<х<я,0<у<Я-х, (13Л7) I 0 в остальных случаях. Найти />;r+rU). 153
РЕШЕНИЕ. По формуле (13.14), учитывая условия задачи, находим +оо π Ρχ+ γ(ζ) = ί Ρ χ, γ(χ> Ζ - χ) dx = J ρχ γ(χ, ζ-x) dx. -οο 0 В силу формулы (13.17) плотность/*^ y(x, z — x) > 0 лишь в случае, когда χ >0π0<ζ — χ<π—χ, или, что одно и то же, 0 < χ < ζ < π. Таким образом, если ζ <£ [0, π],τορχ+γ(ζ) =0. Если же ζ е [0, π], то ζ к Ρχ+γ(ζ) = ί Ρχ,γ(χ,Ζ-χ) dx + J /ry>y(x,z-x)dx = 0 г г ι г ι г ι = \ Ру v(x,Z — x) djc = — f sin (x + z — x) dx= - f sinzdx= -zsin^. ο ' πο πο π 13.18. Случайные величины X и Υ имеют совместную плотность Ι η sin (jc + у), если 0 < χ < π/2, 0 < у < π/2; [ 0 в остальных случаях. Нштирх+Уи). ί (г sin z)/2, если г е [0, π/2 ], Ответ: ρχ+γ(ζ) = \ ϊ(π-ζ) sinz)/2, если ze (π/2, π), ίθ, если ζ£ [0, π]. 13.19. Случайные величины X и Υ независимы, причем . [е"*прил;>0, ie-^приу >0, ^w 10 прих<0; рУ(у) 10 приу<0. Найти/?^+у(г). РЕШЕНИЕ. Воспользуемся формулой (13.15). Учитывая условия задачи, находим + оо оо Px+r(z) = J ^(x)/Jr(^-x)dx= J px(x)pY(z-x) dx. (13.18) -οο 0 Заметим, что py(z — х)>0 лишь тогда, когда 0 < ζ — х, т. е. при χ < ζ. С учетом формулы (13.8) это означает, что/?х+ γ{ζ) = 0, если ζ < 0. Если же ζ > 0, то в силу формулы (13.8) г г г /Ά-+ у<^) = I Px(x)Pyiz-x) dx = J e~* · ет(*-*) <Ьс = er* J dx = да-*. Ответ: Px+YU) = \^ еслиг<0. [ге-*, если ζ > 0, uiuei ; Px+yKZ) = <j 154
13.20. Случайные величины Хтл ^независимы, причем „ . . _ 1 е-*, если χ > 0, . . _ J 2е-2', если j> > О, ****' 10, еслих<0; рУ{у) 10, если^<0. Найти ρχ+γ{ζ). , . ]2(е-г-е-2г),еслиг>0, 13.21. Случайные величины X и Υ независимы и равномерно распределены на отрезке [0, 1 ]. Найтирх+ γ(ζ). РЕШЕНИЕ. Случайные величины X и Υ равномерно распределены на [0, 1],поэтому „ /νΛ = Л>если*е [<UL п , л = J 1,еетиу€ [0,1], р^х) 10,если*е [0,1]; р*у) 10,еслиуе [0,1]. По формуле (13.15) находим Ρχ+ ν(ζ) = ί Px(x)Py(z - х) dx = —oo ι ι ζ = 1 px(x)pr(z-x)dx = jl*pY(z-x)dx= J pr(y)dy 0 0 *-l (при переходе от предпоследнего равенства к последнему сделана замена у = ζ — х)> Длина интервала [ζ — hz] равна единице. График pY(y) и возможные расположения интервала [ζ - 1, ζ] в зависимости от ζ изображены на рисунке 11. Случаи I и IV соответствуют значениям ζ < 0 и ζ > 2. При та* ких значениях ζ плотность рг(у) = 0 для у € [ζ — 1, ζ]* Следовательно, Ρχ+γ(ζ) — 0. Если ζ е [0, 1], то, как следует из рисунка 11, ζ Рх+ y(z) = J Ру(У) аУ = У А 2! ι ι о I Если же ζ - 1 е (0, 1], т. е. J ze (1,2] (случай III), то ι ι Px+Y(z)= j py(y)dy = z-\ = j bdy = 2-z. График функции рх + r(s) изображен на рисунке 12. Рис. 11 155 0| 1/21 ' lj
Рис. 12 13.22. Случайные величины X и Υ независимы и равномерно распределены на отрезке [0, 1]. Найтирх_ γ(ζ). РЕШЕНИЕ. Случайные величины X и Υ независимы, поэтому независимы и случайные величины X и (—Υ). Найдем плотность распределения случайной величины (-Υ). Так как F_Y(y) = P{-Y< <y}=l-P{Y<-y},TO Ρ y(y)=Py(-y) = \l· 'сяи-Уе^1^ r-y\s / г γ\ s / [о в остальных случаях. Следовательно, r-y\s / у q B остальных случаях. Таким образом, + оо Ρχ-γ{ζ)=ρχ+(_γ)(ζ)= $ ρχ(χ)ρ_γ(ζ-χ)άχ = —оо 1 1 Ζ = \ ρχ{χ)ρ_γ(ζ-χ)άχ = \ p_Y(z-x)dx= J p_Y(y)dy о о z-\ Отсюда, как и при решении задач и13.21, получаем С 0, если г ё [-1, 1], Ρχ-γ(ζ) = }ζ+ Ь если^е [-ЬО), 11 -ζ, если ζ е (0, 1]. 13.23. В условиях задачи 13 Л9 найти ρχ_γ(ζ). Ответ: рх_ Y(z) = 2 e~W . 13.24. Случайная величина X равномерно распределена на отрезке [0, 1 ], а плотность случайной величины Уимеет вид ( \ — \ е~^ если у >0, Ру(у) 10, если>><0. 156
Предполагая, что случайные величины X и Υ независимы, вычислить рх+ y(z). [ 0, если ζ < О, Ответ: Ρχ+Υ(ζ) = \ 1 - е-*, еслиге [0,1], ί е~(*-1) — е~*, если ζ > 1. 13.25. Пусть X и У— независимые случайные величины с функциями распределения Fx(x) и FY(y) соответственно. Найти функцию распределения случайной величины Ζ = max {Χ, Υ). РЕШЕНИЕ. Имеем Fz(z) = P{Z<z} = P{max {X, Y}<z} = P{X< z, Y< z]. В силу независимости случайных величин Хи Υ Ρ{Χ<ζ, Υ<ζ} = Ρ.{Χ<ζ}Ρ{Υ<ζ}. Таким образом, Fz(z)=Fx(z)FY(z). 13.26. В условиях задачи 13.25 найти функцию распределения случайной величины Т— min {Χ, Υ}. Ответ: FT(x) = 1 - (1 - Fx{x)){\ - FY{x)). 13.27. Случайные величины X и Υ независимы и имеют соответственно нормальные распределения ЗУ(а{, σ^) и 3\ί(α2, cj). Найти закон распределения случайной величины Z = X+ Υ РЕШЕНИЕ. По формуле (13.14) можно записать выражение для плотностиρζ(ζ) случайной величины Ζ: (Z-y-ax)2 (У~а2)2 Pz(z) = J —w= e ' w= e 2 аУ- Отсюда заменой переменной интегрирования и — {у — а2)/с2 находим ϊ2 Л , ν IT Щ τ - где а = а{ + а2. Это равенство, используя тождество , , α2 ί ζ- α λ2 . (г- а)2 ? -> . ·, 157
можно преобразовать к следующему виду: Pz(z) = -а)2 +оо о* ( Ζ-α γ L J2n <*i -oo J σ72π Множитель в квадратных скобках равен 1, так как является интегралом по всей прямой от плотности нормального распределения g7V( —2Γσ2, -\ 1. Таким образом, плотность распределения случайной величины Ζ равна Pz{z) = -L=Q-iZ-aY,^)i σνζπ где а = ах + а2, σ2 = σ? + σ^, т. е. случайная величина Ζ'имеет нормальное распределение 3\Г(а9 σ2). Параметры нормального распределения Ζ могут быть вычислены непосредственно с помощью свойств математического ожидания и дисперсии: а = ΜΖ= МХ + ΜΥ= αχ + а2% ο2 = ΌΖ=ΌΧ+ΌΥ=αΐ + σ|. 13.28. Случайные величины X и Υ независимы и имеют нормальные распределения g7V(2, 9), g7V(1, 4). Вычислить вероятность Ρ{Χ-2Υ>5}. РЕШЕНИЕ. Случайная величина —2 Υ, как линейная функция от нормально распределенной величины Υ, имеет, согласно задаче 10.13, нормальное распределение. Случайная величина^— 2Υ — = Х+ (—2 У) является суммой нормально распределенных величин и, согласно задаче 13.27, тоже распределена нормально по закону 3V(a, σ2). Так как по условию МХ= 2, МГ= 1, ΌΧ= 9, ΌΥ= 4, то параметры а и σ3 нетрудно найти, используя свойства математического ожидания и дисперсии. Имеем а = М(Х- 2Υ) = MX- 2MY= 0, σ2 = Ό(Χ- 2Υ) = ШГ+ (-2)2ΟΓ= 25. Далее, нормируя и центрируя случайную величину X — 2 Υ и используя таблицу 1 приложений, получаем Р^-2Г>5} = Р|^^>^} = Р|^-У>1} = оо = -р= I e-*2/2 dx = 1/2-Ф0(1)= 0,5000-0,3413 = 0,1587. 158
13.29. Случайные величины X и Υ независимы и имеют нормальные распределения ЗЧ{ — 1, 1), <S7V( 1, 1). Найти: а) Р{-9 < ЗХ + AY< 5}; б) Р{4Х- ЗГ > 12}; в) Р{Х+ Υ< 0}. УКАЗАНИЕ. См. решение задачи 13.27. Ответ: а) 0,8185; б) 0,1587; в) 0,5000. /ч Математическое ожидание и дисперсия <Ί3.3)> функции от случайных величин. \у Ковариация и корреляция Пустьрх γ(χ, у) — совместная плотность случайных величин Хи Υ,ζΖ=φ(Χ, Υ). Тогда + оо +оо ΜΖ=Μφ(Χ, Y)= J J 9(x,y)pXY(x,y)dxdy (13.19) —oo —oo и + oo + oo DZ= I J (q>(x,y)-M<?(X,Y))2pXY(x,y)dxdy = —oo —oo + 00 +00 = MZ2-(MZ)2= J J <?2(x,y)px y(x,y) dxdy - (MZ)2. (13.20) —00 —00 В частности, если Ζ =φ(Χ, Υ) = (Χ- ΜΧ)(Υ- MY), τοΜΖ = = cov (Χ, Υ). Учитывая равенство cov (X, Υ) = ΜΧΥ- MX* MY и формулу (13.19), имеем + оо Ч-оо cov(X,Y) = J J xypXY(x,y)dxdy-MX-MY. (13.21) —00 —00 Коэффициентом корреляции случайных величин Хи Υ называется величина Коэффициент корреляции величин Χ, Υ иногда обозначают согт(Х, У). 13.30. В круг радиуса R с центром в начале координат наудачу брошена точка. Пусть (Χ, Υ) — координата этой точки, aZ- расстояние от этой точки до начала координат. Найти MZ и ΌΖ. РЕШЕНИЕ. Слово «наудачу» означает, что точка (Χ, Υ) в круге х2 + у2 < R2 распределена равномерно. Площадь данного круга равна π/?2, поэтому в соответствии с формулой (13.7) ч J -^1,еслих2 + }>2<Л2, Рх,у(х>У) = ) *R1 { 0 в остальных случаях. 159
Пусть^=ф(Аг, Υ) = JX2 + Υ2 — расстояние от случайной точки (Χ, Υ) до начала координат. В силу формулы (13.19) MZ= J J Jx2 + y2px Y(x,y) dxdy = -OO —OO 1 -и J V*2 + >>2dxdj/. Сделав замену л: = ρ cos φ, у = ρ sin φ, 0< φ< 2π, 0< ρ< Λ, (13.23) и учитывая, что J χ2 + .у2 = Vp2cos29 + p2sin2(p = p, получим MZ=eHP2d9dp=^2-T=3*. о о Для нахождения D Υ воспользуемся последним из соотношений в (13.20). Имеем + оо +оо MZ2= J J (x2+y2)^Y(x,y)dxdy = — OO —OO = i J (x2+y2)dxdy = x2 + y2<R2 Отсюда 1 Ч л ( 3, 1 ,, Λ4 Λ2 13.31. В плоском кольце с внутренним радиусом г и внешним радиусом R наудачу выбрана точка. Пусть Ζ — расстояние от этой точки до центра кольца. Найти ΜΖ, ΌΖ. ,,„ 2Л3-г3 __ 1Д4-/·4 4/Λ3-/·3γ Ответ: ΜΖ= 3 -T—i, ΌΖ= 2 ^-^ - 5(^7371 J · 13.32. В условиях задачи 13.30 найти cov (Χ, Υ). Зависимы или нет случайные величины X и У? РЕЩЕНИЕ. В силу формулы (13.21) для вычисления cov (Χ, Υ) необходимо найти значения MXY, MX, Μ К По формуле (13.19) + 00 + 00 л MXY= J J xypXY(x,y)dxdy=^l J xydxdy. 160
Сделав замену(13.23), имеем MXY= Ι 2π Λ = —дз | dq> J ρ cos φ · ρ sin φ ρ dp = π ο ο = ^u?2 J cosq>sin<pd<p· J p3dp = = πΑ*ί sin φ d(sin φ)--^ = У* ι/ / \i -л1 m χ w ι \ Д2 2π = 0. Снова используя формулу (13.19) и выполняя замену (13.23), находим \-R Рис. 13 + 00 +О0 1 МХ= | J яр^ г(декадеd^--^ J xdjcd^ = —со —оо х* + у2< R1 γ 2π R ] 2π R = ^li d(Pj PC0sp-pdp = ^2 J cos(pd<pJ p2dp- if. |2π \ P3 = 0. Ясно, что ЫХ = MY = 0 в силу симметрии случайных величин Χ κΥ Таким образом, cov (Χ, Υ) = 0. Для выяснения вопроса о независимости или зависимости случайных величин X и У воспользуемся результатом задачи 13.3, где установлено, что J —Б А -( "Б 1 » если Μ < Λ, [ 0, если |х| > Д. Из рисунка 13 ясно, чторх г(х, у) = 0, если точка (лс, у) лежит вне заштрихованного круга радиуса /?, в то время кякрх(х)р у(х) = О для всех точек, лежащих внутри незаштрихованной области квадрата со стороной if. Таким образом, рх(х)ру(х) *pXt у(х, у) для всех точек указанной области. Случайные величины X и У зависимы. 13.33. Совместная плотность распределения случайных величин X и Υ имеет вид (х V4 = J4^ec™0<x<1> 0<у<1; Pxt rv >У) [ q Bостальных случаях. Найти математическое ожидание случайной величины Ζ—Χ2Υ9 а также ковариацию случайных величин X и Υ 6-1605 Ватутин 161
РЕШЕНИЕ. Имеем + оо +оо MZ=MX2Y= J J x2ypx Y(x,y)dxdy = —oo —oo 11 11 11 = { J х2УРх, Лх> y)axdy = J J *2.y · 4xy dx ay = 4 J x3 dx J >>2 dj/ = 1/3. о о oo oo Далее находим 11 11 MXY= J J xy/J;r y(x,.y) dxdy = jj xy Axy dx dy = 4/9 0 0 0 0 и MX=j J x-4xj/dxd>> = 2/3. о о В силу симметрии М7=2/3. Отсюда и из формулы (13.21) следует, что cov (Χ, Υ) = MXY- MX* MY= 4/9 - 2/3 · 2/3 = 0. 13.34. Совместная плотность распределения случайных величин X и У имеет вид р (x>J,) = io/(l-x)/j>, если0<*<1, 0<j<l-x, Ху Υ 'θ в остальных случаях. НайтиМГ(1-;Г). Ответ: 1/6. 13.35. Совместная плотность распределения случайных величиной Уимеетвид ^,АУ)вйг(х2+;2)/2· Найти MjX2+ Y2. УКАЗАНИЕ. Воспользоваться заменой (13.23) и равенствами J p2 e-P2/2 dp = J e-P3/2 dp = J +J°° e"P2/2 dp = \ J2i = J . 0 0 -oo Ответ: 7π72. 13.36. Случайные величины X и Υ имеют совместную плотность распределения вероятностей sin (χ + у), если 0 < χ + у < π/2, χ > 0, у > 0, Ρ χ, ν \χ> У) ~ I о в остальных случаях. (х,У) = j 162
Найти М (cos X + cos Υ). Ответ: π/2. 13.37. Случайные величины X и Υ имеют совместную плотность распределения вероятностей ч _ ί с\х — у\,если0 < л; < 2, 0<у<2, Ρχ, γ\ ' У) (о в остальных случаях. Найти с и М^* Г2). 4- V2\ = Ί _ Ответ: с = 3/8; М(Х2 + Y2) = г\. 13.38. Случайные величины X и Υ имеют совместную плотность распределения вероятностей _ \х + у, если 0 < л; < 1, 0 <у < 1, Ρχ, γ νχ' У) ~ 10 в остальных случаях. Найти ковариацию и корреляцию случайных величин X и Υ РЕШЕНИЕ. Имеем MXY= J J xypXY(x,y) dxdy= j j xy(x+y) dxdy = -oo _oo 0 0 11 11 11 11 = j j x2y dx dy + J J xy2 dx dy = J x2 dx J у dy + J χ dx J j/2 dy = 1/3. oo oo oo oo Находим +oo +oo MX= J J x/?^ y(x,y) dxdy = —oo —oo = \ j x(x + y)dxdy= J x(x + 1/2) dx = 7/12 0 0 0 и, аналогично, М7= 7/12. Таким образом, cov (JT, Y) = MXY- MX* MY= 1/3 - 7/12 · 7/12 = -1/144. Далее, MX2 = J x2(x + 1/2) dx = 5/12 = MY2. Таким образом, ΌΧ= ΌΥ= 5/12 - (7/12)2 = 11/144 и, окончательно, срХ^ _ -1/14 =_ к jDXjOY 711/144 711/144 163
13.39. Совместная плотность случайных величина и Уимеетвид ^у(^^) = |2(х2 + ,;2)'еСЛи0<Х<1'0<3;<1' [ О в остальных случаях. Найти ковариацию и коэффициент корреляции случайных величин X и Υ Ответ: cov (Χ, Υ) = -1/64; ρ (Χ, Υ) = -15/73. 13.40. Совместная плотность распределения случайных величин X и Υ имеет вид Найти MX, MY, cov (Χ, Υ). РЕШЕНИЕ. Прежде всего заметим, что х2 — 2рху + у2 = (1 - р2)х2+ (у - рх)2. Поэтому МХ= \ \ хрх Y(x,y)dxdy = —оо —оо =—?L= J xe-*2/2djc J e Ш^Г dy. (13.23) 2nJ\ — p2 _oo -oo Вычислим в этой формуле внутренний интеграл, сделав замену ζ = (у - рх)л/1 - р2. Тогда + °° tt(V-DX)2 ι +0° j e W^)(y p dy= JTZTpi J e-z3/2dz = —OO —OO = Vl-P2 72π, (13.24) так как ι +oo -^ Г e-^3/2d^=L (13.25) ν2π Λο Учитывая (13.24), равенство (13.23) можно преобразовать к виду ι +оо л ι +О0 л MX jL= f хе 2 dxЛя 71-Ρ2 = -т= f xe 2 dx = О, поскольку подынтегральная функция нечетная, а интеграл берется по промежутку, симметричному относительно оси ординат. Рассуждая аналогично, находим, что МУ= 0. 164
Далее находим ι +оо +оо _ χ2 (у _ οχ\2 MXY= / J f xyt 2 2(i-PVy p) dxd = —oo —oo 1 J xe 2 dx J j;e 2(!-p2) dj/. (13.26) 2tw 1 - ρ2 -oo -oo Пу-ρχ)2 1 —0—ϊ 9— Заметим теперь, что функцию . . = е (1 ~ ρ ) при фиксиро- 72πνΐ -ρ2 ванном χ можно рассматривать как плотность нормально распределенной случайной величины с математическим ожиданием рх и дисперсией 1 - р2. Поэтому 1 72тгл/1 -р2 +оо Ну-рх)2 j ус 2 !-р2 dy = px, поскольку левая часть этого равенства и есть математическое ожидание упоминавшейся выше случайной величины. Подставляя последнее равенство в (13.26) и учитывая (13.25), находим ι +оо ι +оо MXY= -^ j рх2е-*2/2 djc = p-i= J x2e-*V2 dx = = p^L J χ d (e-2/2) = Ρ +f е-2/2 dx = p. Таким образом, cov (Χ, Υ) = ρ — 0 · 0 = ρ. 13.41. Совместная плотность распределения случайных величин X и Υ имеет вид j [χΙ_2 2Ρ „,л.У ^2 1 2(1-ρ2)[σ2 <*\<*2ХУ + Ц 2πσ1σ2ν1 - ρ^ Найти Μ ,Τ, Μ У; ШГ, OY,cov(X, Y),p(X, Υ). УКАЗАНИЕ. При вычислении интегралов использовать представление σ2 σ,σ2 ' σ22 σ?ν к' σ22 ^ Ησ, J и замены ζ = (у -ρ —χ yo2Jl - ρ2 иу = лг/а,. Ответ: МХ= МГ=0, ΌΧ= σ2, ΌΥ= σ22, cov (Χ, У) = ρσ,σ2, ρ(ΛΓ, У) = ρ. 165
13.42. Случайные величины Х1У ... , Хп независимы, и каждая из них имеет нормальное распределение g7V(0, 1). Случайная величина χ\ = Х\ + Х\ + ... + XI имеет по определению %2-распреде- ление с η степенями свободы. Найти Μ χ 2 и Οχ 2 . УКАЗАНИЕ. Использовать свойства математического ожидания и дисперсии; воспользоваться решением задач 10.7, 10.20. Ответ: Μχ2 = η, ϋχ2 =2η. угэ\ Условные плотности распределения. \у Условные математические ожидания Если задана совместная плотность случайных величин X и Yy ίο условной плотностью ρ X\Y{x\y) называется величина Рх γ(χ> У) px]y(x\Y=y) =pxlY(x\y) = р {у) , ру(у) >0. (13.27) Аналогично, Ρχ γ(χ> У) PY\xiy\X = x) =pYlx(y\x) = ' м , рх(х) >0. (13.28) По определению будем считать, чгорХ\Г(х\у) = 0, если ρ у(у) = 0. Условным математическим ожиданием случайной величины Упри условии Х= χ называется величина M[Y\X = x] = +fyPrlx(y\x) ay = ТуРХрГх%У)dy. (13.29) 13.43. Совместная плотность распределения случайных величин X и Υ задается формулой Г 1/(tlR2), если*2 +у2 < R2, Найти ру\х(у\х). РЕШЕНИЕ. Как показано в задаче 13.3, ^(х) = |о|-й2'еСЛиМ<Л' [ 0, если |х| > R. Поэтому при x2+y2<R2 (см. (13.28)) 'w^-^pPZT-TRTTT*' (1330) В остальных случаяхpY\x(y \x) =0. 166
13.44. Совместная плотность распределения случайных величиной Υ имеет вид , |(х + ^)/216,если0<х<6, 0<у<6; Ρχ, γ\ ' У) \ о в остальных случаях. Найти pY\x(y\x). УКАЗАНИЕ. Воспользоваться результатом задачи 13.5. Ответ: pY{x(y\x) = | 5 JT3' если0 <х< 6' ° КУК 6' I 0 в остальных случаях. 13.45. В условиях задачи 13.43 найти Μ[ Y\X = Rjb/2\. РЕШЕНИЕ. Используя (13.30) и результат задачи 13.43, получаем Отсюда M[Y\X=Rj~3/2] = +fypYlx(y\Rj3/2)dy = —оо = J ypY\x(y\Rfi/2)= f yldy = 0. 13.46. В условиях задачи 13.44 найти М[ Y\X = 3]. Ответ: 7/2. 'х2 2р ν2' 13.47. Совместная плотность распределения случайных вели чин^Ги Υ имеет вид ι , ч 1 2(1-Р2) Рх, γ(χ> У) = 7г—2 е НайтиpY\x(y\x) πΜ[Υ\Χ = χ\. УКАЗАНИЕ. Воспользоваться результатом и указанием к задаче 13.13. ι Г <М2 ъ / ι ч 1 2σ|(1 -р2)1У Ответ: ру]х(у\х) = - т=== е 2' >у 2πσ2Λ/1 - ρ1 Μ[Υ\Χ = χ] =ρ-χ.
СЛУЧАЙНЫЕ <*1Г ПОСЛЕДОВАТЕЛЬНОСТИ ч У Глава J4.T> Закон больших чисел Пусть Хх> Х2у ... , Хп — независимые одинаково распределенные случайные величины, причем MXf = a, OXi = σ2 < °°. Тогда для любого ε > О χλ + х2 +. η .+хп — а lim Р^ — - -а\<г\ = \. (14.1) Соотношение (14.1) называется законом больших чисел. Закон больших чисел часто (хотя и не всегда осознанно) используют на практике. Так, например, если проводится η независимых опытов в одинаковых условиях, а величина Xi равна единице, если опыт закончился успехом, и равна нулю, если опыт закончился неудачей, то а = MXt есть вероятность успешного завершения опыта, а {Χλ + Х2 + ... + Хп)/п — относительная частота успехов. Таким образом, соотношение (14.1), грубо говоря, означает, что при увеличении количества испытаний относительная частота успешных испытаний будет стремиться к вероятности успеха. Аналогичная интерпретация может быть дана и в случае, когда величины Xi — независимые измерения неизвестного расстояния а до некоторого предмета. 14.1. Пусть Хх, ... , Хп — последовательность независимых одинаково распределенных случайных величин, причем п , ν [3/х4прих>1, ΡχΛχ) |ο прих<1. Применим ли к этой последовательности закон больших чисел? РЕШЕНИЕ. Имеем MXt = j хрх. (х) dx = 3/ х-, dx = 3 J -3 = 168
и МХ} = j xipXj(x)dx = 3f™=3. —oo 1 Следовательно, ΌΧ, = MX} - (MX;)2 = 3 - (3/2)2 = 3/4 < oo. Поэтому закон больших чисел применим в виде (14.1) при а = MX; = 3/2. 14.2. Пусть Хи Х2, ... , Хп — последовательность независимых одинаково распределенных величин, имеющих плотность ι 1 РХ'{Х) (1+^)2- Удовлетворяет ли эта последовательность закону больших чисел? Ответ: удовлетворяет. 14.3. Справедлив ли для последовательности независимых случайных величин Х{9 Х2,..., Хп закон больших чисел, если Р{Х(= \} = Р{Х{ = -\} = \/2? РЕШЕНИЕ. Имеем М^=(-1).Р{^ = -1}+1.Р{^.= 1} = 0, МХ\ =(-1)2·Ρ{Χ|. = -1}+12·Ρ{^.= 1}=1. Таким образом, ШГ, = MX} - (МХ()2 = 1 < °°. Закон больших чисел справедлив. 14.4. Пусть Хи Х2, ... , Хп — последовательность независимых одинаково распределенных случайных величин с общей функцией распределения F(x). Для каждого χ е (—°°, +°о) определим слу- А чайную величину Fn(x) соотношением АД*) = ^„(х), где vn(x) — количество значенийХк, к = 1, 2,... , п, удовлетворяющих неравенству Хк < х. Доказать, что для любого ε > О \imP{\Fn(x)-F(x)\>e} = 0. УКАЗАНИЕ. Представить величину vn(x) в виде суммы индикаторов независимых событий Ак(х) = {Хк < х} и воспользоваться равенствами Μχ^ (х) = F(x), ΌχΑ (jc) = F{x) (1 - F(x)) и законом больших чисел. 169
\14.2> Центральная предельная теорема Если Х{9 Х2,..., Хп — при любом η независимые одинаково распределенные случайные величины, МХк = я, О < OXk = σ2 < <оо5А:=1, ... ,А2, то справедлива центральная предельная теорема: для любого χ е (-°°, + °°) Г Хх + Х2 + ... + Хп - па 1 lim Р\ -! 2 ρ—2 <х = "->°° [ Ojn J = ^= J e-"2/2 dw = 0(x). (14.2) ν2π _οο Соотношение (14.2) может быть записано в эквивалентном виде: для любых —°° < хх < х2 < +°° lim Р\ хх < — т—- < х2 \ = л->°° [ Cjn J 1 *2 = -f= J e-«2/2 dw. (14.3) ν2π Xj Естественно сравнить центральную предельную теорему с законом больших чисел. Для этого вновь воспользуемся примером, рассмотренным в начале § 14.1. Предположим, что величины Х( = 1, если /-й опыт (из серии η однородных и независимых опытов) закончился успехом, и Хгг = 0 в ином случае. Согласно закону больших чисел Хх + ... + Хп « па (точное утверждение — формула (14.1)), в то время как центральная предельная теорема уточняет это соотношение: Хх + ...+Xn-na = 0(Jn) (точное утверждение — равенство (14.2)). В статистических исследованиях часто используется многомерная центральная предельная теорема (см. [9],с. 164,134). Если случайные векторы Хд. = (ХкХ9... , Х^г), к = 1, 2,... , независимы, одинаково распределены и величины aj = MXxp Ьм=со\(Хи,Хи), у,/=1,2,..., конечны, то законы распределения случайных векторов (УпХ, ... ..·, Уяг),где Ynl-jn{Xx^^Xni-nai). сходятся при η —* °° к r-мерному нормальному распределению с нулевым вектором математических ожиданий и матрицей ковари- аций \\ЪЯ\\\. 170
14.5. Складывают п = 12 · 104 чисел, каждое из которых округлено с точностью до 10-т. Предполагая, что погрешности округления независимы и равномерно распределены в интервале (—0,5 · 10~т, 0,5· 10_т), найти, опираясь на центральную предельную теорему, пределы, в которых с вероятностью, не меньшей 0,98, лежит суммарная погрешность. РЕШЕНИЕ. Пусть Хк — погрешность округления k-το числа, к= 1, 2,..., я. Из условия задачи следует, что [Ю"1, если χ е [-0,5-ΙΟ^, 0,5· Ю""1], Рхк(х>- 1о, если χ g [-0,5-10-^, 0,5-Ю^]. Отсюда (см. задачу 10.11) имеем а = МХк = 0, σ2 = OXk = ^ · \0~2m. Учитывая равенство JnOXk = J12 · ΙΟ4 · 1/12 · Ю-2"1 = \0~m+2 и применяя центральную предельную теорему, получаем ρ{Χι<—^—<Х2г Найдем теперь л^ и х2, для которых -^ J e-"2/2 dw = 0,98. (14.4) л/2я Χι Естественно выбирать эти значения таким образом, чтобы длина интервала [х{9 х2] была наименьшей. Оказывается, что такое условие выполнено при*! = -х2, что вместе с формулой (14.4) дает -f= j e-«2/2 du = 2Ф0(х2) = 0,98. Используя таблицу 1 приложений, приходим к соотношению х2 ~ 2,33. Искомый интервал имеет вид [—2,33 · 10~т + 2, 2,33 · 10~т + 2]. 14.6. Случайная величина χ2 задается равенством χ2 = Х\ + + JTJ + ... + Х\, где величины Xi независимы и нормально распределены с параметрами а = 0 и σ2 = 1. Доказать, что для любого* е (-оо? +оо) Х2п~п 171 ИтР|^<х[ = Ф(х).
УКАЗАНИЕ. Воспользуйтесь равенствами (см. задачи 10.7, 10.20) МХ\ = 1, МХ\ = 3 и центральной предельной теоремой. 14.7. Случайная величина Yn имеет распределение Пуассона с параметром η. Доказать, что для любого хе (-оо 9 +оо) lim p|-V^ <х\ = Ф(х). п^°° [ Jn J УКАЗАНИЕ. Воспользоваться (см. задачу 12.36) равенством Υη=Χχ+Χ2 + ... + Χη, где случайные величины Xi независимы и имеют распределение Пуассона с параметром 1, а затем примените центральную предельную теорему. 14.8. Пусть Х{, ... , Хп — независимые случайные величины, равномерно распределенные на отрезке [0, 1 ], и Sn = Хх + ... + Хп. Убедитесь в том, что с вероятностью приблизительно 0,98 значение 6*1200 будет лежать в пределах (600 + 23,3). УКАЗАНИЕ. См. задачу 10.11. 14.9. Используя центральную предельную теорему, найти приближенное значение вероятности Ρ{χ?οο > 127,6}, где χ j*00 — случайная величина, имеющая %2-распределение с η = 100 степенями свободы. УКАЗАНИЕ. Использовать решение задачи 13.42. Ответ: 0,025.
ПЕРВИЧНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ г _ Г л а Задачи математической статистики На практике редко доступна полная информация о модели изучаемого явления, описываемого в терминах некоторой случайной величины ξ. Чаще о законе распределения ξ имеется лишь частичная информация; например, априори может быть известно, что F^(x) = Ρ{ξ < χ} — нормальное распределение 3V(a, σ2) с некоторыми неизвестными параметрами а = Μξ и σ2 = Βξ. В ряде же случаев никакой априорной информации о распределении ξ вообще нет. В таких ситуациях возникают задачи восстановления неизвестного закона распределения F* (или отдельных его характеристик) по результатам наблюдений над ξ (по исходным статистическим данным). Круг подобных задач и составляет содержание математической статистики. Таким образом, если теория вероятностей позволяет при заданной вероятностной модели вычислять вероятности тех или иных случайных событий, то математическая статистика по результатам проводимых наблюдений (по исходам эксперимента) уточняет структуру вероятностной модели изучаемого явления. 15.1. В урне Μ белых и N — Μ черных шаров, при этом числа Μ и N неизвестны. Чтобы оценить неизвестную долю/? = Μ/Ν белых шаров в урне, проводится опыт, заключающийся в извлечении с возвращением из урны η шаров. Обозначим через X случайную величину, равную числу белых шаров среди извлеченных, и будем в качестве приближенного значения (оценки) неизвестного параметра ρ использовать величину рп = Х/п — относительное число наблюдавшихся в опыте белых шаров. Вычислить Мрп и 1Урп. Доказать, что при любом ε > О ПтР{\рп-р\<г}=\. Л->оо 15 173
УКАЗАНИЕ. См. задачи 5.13, 5.21 и 5.25. Ответ: Мрп =р, Όρ„ = *L=£>. Таким образом, среднее значение рп совпадает с неизвестной долей/?. Случайную величину рп можно рассматривать в качестве «разумной оценки» для р. При большом числе извлечений η дисперсия этой оценки мала, что обеспечивает близость оценки к неизвестному значению/?. 15.2. Получить реализации χ случайной величины X, определенной в задаче 15.1, посредством реального извлечения η = 10, 20, 30, 40, 50 шаров, билетиков и т. п. при следующих значениях параметров: Μ = 3, N = 10. Для каждого указанного значения η найти отношение х/п, являющееся приближенным значением/? = Μ*/Ν= 0,3. 15.3. Вместо реального эксперимента, описанного в задаче 15.2, получить значения χ с помощью таблиц случайных чисел. Для этого из таблицы 9 приложений, начиная с любого места, выбрать η цифр, по полученной выборке подсчитать х, считая, например, цифры 0, 1, 2 «белыми шарами», и найти х/п. 15.4. Пусть общее число шаров в урне N известно, а неизвестным является число Μ белых шаров. Опыт заключается в извлечении без возвращения η шаров (η < Ν). Пусть X— число белых шаров в выборке и рп = Х/п. Найти Мрп и Όρη и обосновать (как в задаче 15.1) использование случайной величины ρ η в качестве приближенного значения неизвестной доли ρ = Μ/Ν белых шаров в урне. Доказать, что lim ?{\рп -/?| < ε} = 1 при любом ε > 0. Л->со У КАЗАНИ Ε. См. задачи 5.12, 5.29 и 5.30. η-τοΩτ- м£ -« п£ _/?(! -ρ)(Ν-η) Ответ. Μρη-ρ,Όρ„ „(#-1)—* 15.5. Пусть эксперимент состоит в многократном измерении некоторой физической величины а, точное значение которой неизвестно и в процессе измерений не меняется. На результаты измерений влияют многие случайные факторы (точность настройки измерительного прибора, погрешность округления при считывании данных и т. д.), поэтому результат ί-го измерения Xi можно представить в виде Хг. = а + ε;·, где ε,. — случайная погрешность измерения. В теории погрешности измерений обычно считается, что 174
случайные величины ε1? ε2, ... независимы и имеют одно и то же нормальное распределение с параметрами Με1 = 0 (отсутствие систематической ошибки измерения) и DEj = σ2 (равноточность измерений) при некотором неизвестном σ > 0. В качестве приближенного значения для величины а по результатам η измерений используется их среднее арифметическое α„=1-(Χχ + ... + Χη)=α+1-(ε} + ... + εη). Найти Мап и Όαη и обосновать (как в задаче 15.1) такой способ оценивания. Доказать, что при любом ε > 0 ПтР{\ап-а\<г} = 1. УКАЗАН И Е. Воспользоваться неравенством Чебышёва (5.22). Ответ: Мап = я, Όαη = а2/п. Выборка Далее предполагается, что для получения исходных статистических данных осуществляется эксперимент, в котором проводится η повторных независимых наблюдений (испытаний) над некоторой случайной величиной ξ, закон распределения которой полностью или частично неизвестен. ПустьXi — результат /-го испытания, / = 1,..., л. ТогдаХ{, ..., Хп можно рассматривать как η независимых копий или «экземпляров» величины ξ: Р{Х( < х) = Ρ{ξ < χ) = FA χ), ι = 1,..., п. Таким образом, результат полного эксперимента описывается в этом случае «-мерным случайным вектором X = (Х{,... , Хп), который называют выбор/сой, а число наблюдений η — ее объемом. Часто используемое выражение «выборка Х= (Xl9..., Хп) объема η из генеральной совокупности с функцией распределения F^(x)» (или «выборка из распределения i^») означает, что Хх, ... , Хп — независимые случайные величины, каждая из которых распределена так же, как ξ. В дальнейшем индекс ξ у F* обычно опускается. Реализации выборки X = (Хи ... , Хп) обозначают строчными буквами χ = (хи ... , хп), множество всех возможных реализаций X = {х} называется выборочным пространством. 15.6. Используя таблицу 10 приложений, выписать реализацию выборки объема η = 10 из нормального распределения o7V(<z, σ2) с а = 0, σ2 = 1. 175
15.7. Получить реализацию выборки объема η = 10 из нормального распределения 34{а, σ2) с а = 2, σ2 = 4. УКАЗАНИЕ. Если случайная величина ξ распределена нормально с параметрами Μξ = 0, ϋξ = 1, то случайная величина η = σξ + а имеет нормальное распределение с параметрами Μη = σΜξ + а = а, Ό\] = σ2ϋξ = σ2. Воспользоваться решением задачи 15.6. 15.8. Получить с помощью компьютера реализацию выборки объема η = 100 из стандартного нормального распределения 67V(0, 1). УКАЗАНИЕ. Обычно в программном обеспечении есть датчик случайных чисел, который генерирует реализации последовательности независимых случайных величин, равномерно распределенных на отрезке [0, 1 ]; воспользоваться преобразованием η1 = 7-21ηξ2ΰθ5(2πξ1), η2= Λ/-21ηξ2 sin (2πξ,), где ξ,, ξ2 — независимые равномерно распределенные на [0, 1] случайные величины. Тогда η1? η2 — независимые случайные величины, имеющие распределение o7V(0, 1). 15.9. {Приближенно нормальные случайные числа.) Используя независимые равномерно распределенные на [0, 1 ] случайные числа {Щ (см. указание к задаче 15.8) и применяя центральную предельную теорему теории вероятностей, обосновать следующий алгоритм получения независимых приближенно нормальных случайных чисел: *Nk= (U{k_x)N+x + ... + UkN- N/2)/jNjU, *=1,2,.... ЗАМЕЧАНИЕ. Практически удовлетворительное приближение к нормальному распределению оАГ(0, 1) получается уже при N = 12. Это значение параметра N в указанном алгоритме обычно и рекомендуется использовать для конкретных вычислений. 15.10. Получить с помощью компьютера три реализации (при N = 2, 4, 12) выборок объема λι = 100 приближенно нормальных случайных чисел {XNk) (см. задачу 15.9). 15.11. Пусть F(x) — непрерывная и строго монотонная функция распределения, F~l (у) — обратная к ней функция и {Щ — независимые равномерно распределенные на [0, 1 ] случайные числа. Обосновать следующий алгоритм получения выборки из распределения i7: Xi = F-l(Ui), /=1,... ,п. УКАЗАНИЕ. Убедиться в том, что функция распределения случайной величины X. равна F(x). 176
15.12. (Продолжение задачи 15.11.) Показать, что Xi = = —a In Ui9 i = I,..., η (a > 0) — выборка из показательного распределения: F(x) = 1 — е~*/а, jc > 0. 15.13. Пусть X = (Х{9 ... , Хп) — выборка из непрерывного распределения F(x). Как из нее получить выборку из распределения Ответ: искомая выборка имеет вид (bXi + a, i = 1,..., η). 15.14. Исходя из последовательности {£/,·} равномерных на [0, 1] случайных чисел, получить последовательность случайных чисел, равномерно распределенных на отрезке [а, Ь], а < Ь. УКАЗАНИЕ. Воспользоваться задачей 15.13. Ответ: {(b-a)Ut + a}. 15.15. Пусть {£/,·} f° — независимые равномерные на [0, 1] случайные числа и Xi = 1, если Ui < /?, Х{ = 0, если Ui > ρ, где ре (0, 1). Убедиться в том, что независимые случайные величины {Х^}™ есть последовательность Бернулли с Р^· = 1} = 1 — Р^· = 0} =р. 15.16. Используя последовательность Бернулли {X;}, полученную в задаче 15.15, построить выборку из биномиального распределения Bi {k, p). УКАЗАНИЕ. Воспользоваться следующим свойством: если ξΐ5..., %к — независимые бернуллневские случайные величины с параметром р, то их сумма η = ξ} + ... + %к имеет распределение Bi(k,p). Ответ: искомая выборка имеет вид (Х^_])к + 1 + ... + Xik, i = 1,... ,η). 15.17. Пусть {X;} 5ю — последовательность Бернулли с P{Xf = 1} =р (см. задачу 15.15). Тогда случайная величина ξ = min {/ > 0: Xi+ , = = 0} — число единиц, предшествующих первому нулю, имеет геометрическое распределение: Ρ{ξ = k}=pkq, q = 1 —ρ, k = 0, 1, 2, .... Исходя из этого, построить выборку из геометрического распределения. Ответ: искомая выборка (Yv ..., Υη) имеет вид Yt = min {J > 0: XYl_l+J+i =0}, /=1,...,/!(У0 = 0). 177
15.18. Пусть случайная величина U имеет равномерное распределение на отрезке [0, 1] и для заданных чисел рх, р2, ... , pN, где 0<ру< I, j = 1,... ,Ν, рх + ... +ρΝ= 1, интервалы Δ, = [0,рх], Δ2 = (Ρχ,Ρι + Ρ2]> - > δλγ= (Ρ\ + - + /V-i> !] образуют разбиение отрезка [0, 1]. Положим ξ = /, если Uе Δ/? / = 1, ... , TV. Тогда Ρ{ξ= 1} = P{U е Δ/} = /?/? т. е. случайная величина ξ принимает значения 1, 2, ... , N с вероятностями соответственнорх,р2, ··· ,Ρχ· Исходя из этого и используя независимые равномерно распределенные на [0, 1] случайные числа {С/,·}, построить η независимых копий случайной величины ξ. Ответ: положитьXt — /, если Ute Δ;, /= 1,... ,Ν, i= 1,..., п. Эмпирическая функция распределения Одним из стандартных способов представления выборки Х= (Хх, ... , Хп) является ее вариационный ряд Х^ < Х^2) < ... ... <Х(П), получаемый упорадочением наблюдений Хх, ... , Хп по возрастанию их значений, так что Хп, = min X,·, Хпл— второе по величине наблюдение ит.д.,Хг, = max Xf. Величина Х(кл назы- вается А>й порядковой статистикой, ЛГ(]) и Х^п) — экстре- мольными (соответственно минимальным и максимальным) значениями выборки, а их разность Х{п) — Х{1) — ее размахом. Важной характеристикой вариационного ряда выборки является его медиана (или середина), которая равна Х^т + \у при η = 2т + 1 и (Х(т) + Х(т +1))/2 при я = 2т. В дальнейшем под термином «основные характеристики выборки» будем понимать совокупность ее экстремальных значений, размаха и медианы. Другой сводной характеристикой выборки является эмпирическая функция распределения, которая определяется формулой F„(x)=vn(x)/n, -оо<х<оо, (15.1) где vn(x) — случайная величина, равная числу тех наблюдений Хх,..., Хп, значения которых не превосходятх. Таким образом, эмпирическая функция распределения определена на всей числовой прямой, монотонно не убывает, является ступенчатой со скачками в А А точках Х(к), при этом Fn(x) = О при χ < Х^Х) и Fn(x) = 1, если А х>Х(п) (рис. 14). Функция Fn(x) при большом числе наблюдений η близка в каждой точке χ к теоретической функции распреде- 178 <#
Рис. 14 ления F{x) наблюдаемой случайной величины ξ (см. задачу 16.3). Поэтому для больших выборок график эмпирической функции рас- А пределения Fn(x) дает хорошее приближение к (неизвестной) теоретической функции распределения F(x). В этом смысле о функ- А ции Fn(x) говорят как о статистическом аналоге для F(x). 15.19. Реализацией выборки X = (Xv ..., Хп) являются следующие данные: -1,5; 2,6; 1,2; -2,1; 0,1; 0,9. Найти ее основные характеристики и построить эмпирическую функцию распределения. РЕШЕНИЕ. Прежде всего строим вариационный ряд: —2,1; —1,5; 0,1; 0,9; 1,2; 2,6. Отсюда видно, что минимальное (максимальное) значение выборки равно —2,1 (2,6), размах равен 2,6 — (—2,1) = = 4,7, а медиана равна (х(3) + л:(4) )/2 = (0,1 + 0,9)/2 = 0,5. А Эмпирическая функция распределения F6(x) является ступенчатой, возрастает скачками величиной 1/6 в точках вариационного А А ряда, при этом F6(x) прилс <х(1) = —2,1 и F6(x) = 1 прих ^Х(б) = = 2,6. Таким образом, [0 при х<—2,1, Л(*) = 1 !/6 ПРИ -2,1 <х< -1,5, [l/З при -1/5 <х< 0,1; График этой функции изображен на рисунке 14 1/2 при 0,1<х<0,9, 2/3 при 0,9<х<1,2, 5/6 при 1,2 <х< 2,6, 1 при χ > 2,6. 179
15.20. Наблюдавшиеся значения случайной величины ξ в пяти опытах оказались равными соответственно 0,9; ОД; 0,6; 0,7; 0,4. Вычислить основные характеристики выборки и построить эмпириче- А скую функцию распределения F5(x). 15.21. В эксперименте наблюдалась целочисленная случайная величина ξ. Соответствующие выборочные значения оказались равными (3, 0, 4, 3, 6, 0, 3, 1). Вычислить основные характеристики выборки, построить эмпирическую функцию распределения и проверить, что /8(1) = 3/8, /8(3) = 3/4, F8(5) = 7/8. 15.22. Пусть Х= (Xl9..., Хп) — выборка из распределения Бер- нулли Bi(l,p) (см. задачу 15.15). Как выглядит график эмпирической функции распределения в данном случае? Ответ: если vn — число единиц в выборке, то [ 0 при χ < 0, Fn(x) = < l-v> при0<х<1, [ 1 при χ > 1. 15.23. В каком случае функция F п{х) будет иметь лишь скачки размера \/п (или, что эквивалентно, ровно η скачков)? Ответ: тогда и только тогда, когда все порядковые статистики выборки будут различны. 15.24. Пусть хх < х2. Чему равна вероятность F{Fn(xY) = =^„(*2)}? Ответ: Ρ»{ξί (х„х2}} = (1 - F(x2) + F(Xl))". 15.25. Пусть Ρ{ξ = /} =р„ I = 0, 1, ... , Ν, и X = (X,, ..., Хп) - выборка из этого распределения. Найти вероятность P{Fn(l)-F„(l-l) = k/n}. Ответ: Скпр\{\-р1)п~к. 15.26. Показать, что распределение эмпирической функции А распределения Fn(x) в любой точке х, для которой 0 < F{x) < 1, имеет следующий вид: p\FJx) = -\=CknF4x)(l-F(x))n-k, к = 0,1,...,п, при этом MFn(x) = F(x)y OFn(x) = F(x)(l - F(x))/n. 180
УКАЗАНИЕ. Использовать то, что величина vn(x) в (15.1) распределена по биномиальному закону Bi(n,p) с ρ = F(x). 15.27. {Продолжение задачи 15.26.) Воспользовавшись неравенством Чебышёва, установить оценки для любого / > О p\\Fn(x) - F(x)\> j=\< F(x)(\ - F(x))/t>< ±. 15.28. {Продолжение задачи 15.26.) Воспользовавшись теоремой Муавра — Лапласа, доказать, что при η -* оо A Jn \F„(x) - F(x) I < Л - 1 - 2Ф[- jF(x)(\ - F{x)) Г где Φ (χ) — функция распределения нормального закона o7V( 0, 1). ЗАМЕЧАНИЕ. Этот результат (также, как и результат задачи 15.27) дает представление о характере сближения эмпирической функции рас- А пределения Fп{х) с теоретической функцией распределения F(x) при больших объемах выборки п. 15.29. Пусть хх < х2 — заданные точки такие, что 0 < F(xx) < < F(x2) < 1. Доказать формулу cow (Fn(xx), F„(x2)) = F(xx)(l - F(x2))/n. УКАЗАНИЕ. Учесть,чтоcov (^„(j^), Fn(x2) - Fn(xx)) = cov (vn(xx), vn (χι) ~ vn(xi) )A*2> использовать представления ν„(χ,) = ±Ι(Χι<χχ), v/I(x2)-v/I(x1)= tl(xl<Xi<x2)9 / = 1 /=1 где I (A) — индикатор события А, т. е. I (A) = 1, если событие А произошло, и 1{А) = 0 в противном случае. 15.30. Получить следующее представление для функции распределения к-й порядковой статистики Х^у Fx (х)=Р{Х(к)<х}= ic„^W(l-FW)^ = = $(F(x);k,n-k+ 1), где Э(г;о,г>) = г((д)д*)) !ta-l(l-t)b-ldt, ze [0,1], a, b > 0, оо — неполная бета-функция\ Т(а) = J t°~]е~* at, а > 0, — гам- о ма-функция (при целых а > 0 Г (а + 1) = а\). В частности, если 181
существует плотность/(χ) = Ft(x), то для плотности распределения величины Х^к) справедливо представление gk{x) = F'Xik){x)=nC*z\Fk-*(x)(\-F(x)r-knx). УКАЗАНИЕ. Использовать эквивалентность событий {Х/к\ < х} и {vn(x) > к} и указание к задаче 15.26. 15.31. Пусть X = (Xv ..., Хп) — выборка из равномерного на отрезке [0, 1] распределения i?(0, 1). Убедиться в том, что Х{к) имеет функцию распределения β(χ; к, η — к + 1) (см. задачу 15.30). Вывести формулы 15.32. Получить для моментов экстремальных значений выборки из равномерного на [а, Ь] распределения Я (а, Ь) следующие формулы: ш(1) л + 1 ' мл(«> п+ 1 ' <я> (л+1)2(и + 2)' С0У^Л(1)'Л(«)^ (Л+1)2(л+2)· ШГ(1)=ШГ, УКАЗАНИЕ. Учесть, что случайная величина ξ' = (ξ — a)/{b - а) имеет распределение/?(0, 1), следовательно,Х^к) = (Ь — а)Х{к) + а, где Х{к) — порядковая статистика выборки объема η из распределения R (0, 1); использовать задачу 15.31. 15.33. Пусть X = (Χν ... , ^Гл) — выборка из двухпараметри- неского экспоненциального распределения Fa b, функция распределения которого имеет вид Fa ь{х) = 1-е-(х-а^ьприх>а (6 >0), Fa b{x) = 0прих<я. Доказать, что случайная величина Х^{) = п(Х^{) — а)/Ь имеет распределение F0 ,, называемое стандартным экспоненциальным (или показательным) распределением. Получить отсюда формулы MX0)=a + b/ny OX(l)=b2/n2. УКАЗАНИЕ. Вычислить вероятность Р{Х^ > > х) при χ > 0. 182
s15.4> Полигон частот, гистограмма Если наблюдаемая в эксперименте случайная величина ξ дискретна и принимает значения al9 a2, ... , то более наглядное представление о ее законе распределения дадут относительные частоты v* = vr/n, где νΓ — число элементов соответствующей выборки X = (Xl9 ... , Хп), принявших значение аг (г = 1, 2, ...). В этом случае согласно закону больших чисел ν * сближается при η —► оо с вероятностью Ρ{ξ = аг}, т. е. относительные частоты ν* можно рассматривать (по крайней мере при больших объемах выборки) в качестве приближенных значений (оценок) для неизвестных вероятностей Ρ{ξ = *Γ}. Исходные данные для таких случаев обычно записывают в виде последовательности пар {(ar, vr)}, где vr > 0, или в виде таблицы «1 Vi а2 v2 называемой статистическим рядом (отметим, что в этом случае ΣνΓ = η). Г Наглядным представлением таких данных является полигон частот, который представляет собой ломаную с вершинами в точках (flr,vr), г=1,2,... (рис. 15). Рис. 15 183
Можно рассматривать также статистический рад {(ar, ν*)} (здесь Σ ν* = 1) и соответствующий полигон относительных частот. г 15.34. Наблюдавшиеся значения целочисленной величины ξ для 12 опытов оказались равными 5, 1, 4, 0, 1, 4, 3, 5, 0, 5, 5, 2. Построить статистические ряды этих данных и полигон частот. Ответ: «г νΓ 0 2 1 2 2 1 3 1 4 2 5 4 Σ 12 «г ν/ 0 1/6 1 1/6 2 1/12 3 1/12 4 1/6 5 1/3 Σ 1 Соответствующий полигон частот изображен на рисунк el5. 15.35. Построить статистические ряды и полигоны частот для следующих данных: а) 1, 2, 5, 3, 0, 1, 2, 7, 5, 4, 9, 2, 3, 6, 4; 6)5,1,0,2,1,4,3,0,3,1,0,4. 15.36. Из таблицы 9 приложений, начиная с любого места, выбрать 20 цифр и построить по полученной выборке статистические ряды и соответствующие полигоны частот (в данном случае речь идет о наблюдениях над случайной величиной, принимающей с равными вероятностями значения 0, 1,..., 9). 15.37. Выписать из таблицы 9 приложений произвольные 100 цифр. Далее в полученной последовательности заменить цифры по следующему правилу: {0, 1} -> 1, {2, 3} —► 2, {4, 5} —> 3, {6, 7} -> 4, {8, 9} —► 5. По полученной таким образом выборке, представляющей собой η = 100 наблюдений над случайной величиной, которая принимает с равными вероятностями значения 1, 2, 3, 4, 5, построить статистический ряд {(г, ν*), г = 1, ... , 5} и полигон относительных частот. 15.38. Используя те же исходные данные, что и в задаче 15.37, преобразовать по правилу: {0, 1, 2, 3, 4} —► 1, {5, 6} -* 2, {7, 8, 9} —► 3 (тем самым будет получен результат η = 100 наблюдений над случайной величиной ξ, принимающей значения 1, 2, 3 с вероятностями соответственно 1/2, 1/5, 3/10). Построить статистический ряд 184
{(r, ν*), r = 1, 2, 3} полученной выборки и соответствующий полигон относительных частот. Сравнить относительные частоты с теоретическими вероятностями. 15.39. Используя компьютер, смоделировать η = 100 наблюдений над случайной величиной ξ, принимающей значения 1, 2, 3, 4 с вероятностями соответственно 1/2, 1/4, 1/8, 1/8. По полученным данным построить статистический ряд {(г, ν*), г = 1, 2, 3, 4} и полигон относительных частот. Сравнить относительные частоты с теоретическими вероятностями. УКАЗАНИЕ. Использовать задачу 15.18. 15.40. Смоделировать выборку X = (Хх,..., Хп) из распределения Бернулли Bi(l, ρ) с параметром ρ = 0,5 и η = 1000 (см. задачу 15.15). Вычислить частоты vk/k, где \к = Хх + ... + Хк, при к = 100, 200, ... , 1000 и построить график, соединив прямыми соседние точки (k,vk/k). 15.41. Пусть vn — число успехов в η испытаниях Бернулли с вероятностью успеха ρ (0 < ρ < 1). При больших η вычислить границу δγ IV, | 1 < δγ > « γ. Укладываются ли в эти границы такую, чтобы Ρ при γ = 0,98 результаты следующего эксперимента (Бюффон): при η = 4040 бросаниях монеты наблюдалось 2048 выпадений «герба»? УКАЗАНИЕ. Воспользоваться теоремой Муавра— Лапласа, монету считать симметричной. Ответ: δ = cyJpq/n, q = 1 — ρ; су определяется уравнением Ф(су) = (1 + γ)/2; δ098 = 0,0183 и соответствие данных теории хорошее. 15.42. Используя такой же подход, как и в задаче 15.41, проверить соответствие теории следующих данных: среди η = 10 000 «случайных чисел» 0, 1,..., 9 — числа, не превосходящие 4, встретились 5089 раз. Ответ: 5098 = 0,0116и соответствие данных теории хорошее. 15.43. Смоделировать выборку объема η = 1000 из распределения Бернулли Bi(l, 3/5) и аналогично задаче 15.41 проверить соответствие экспериментальных данных предсказанию теории. Построить (аналогично задаче 15.40) соответствующий график частот. 185
15.44. Смоделировать выборку объема η = 100 из биномиального распределения 5/(5, 1/2) (см. задачу 15.16). Построить статистический ряд и полигон частот для полученных данных, определить выборочную медиану. 15.45. Проводились опыты с бросанием одновременно 12 игральных костей, при этом наблюдалось число ξ костей с числом очков 4, 5 или 6. Данные для η = 4096 опытов приведены в следующей таблице, где vr — число опытов, в которых наблюдалось значение ξ = /·(Γ = 0,1,...,12): г Vr 0 0 1 7 2 60 3 198 4 430 5 731 6 948 7 847 8 536 9 257 10 71 11 11 12 0 Σ 4096 Построить полигон относительных частот этих данных. Вычислить максимальное отклонение частоты ν* от вероятности Ρ{ξ = г), считая, что величина ξ имеет биномиальное распределение 5/(12,1/2). 15.46. Смоделировать выборку объема η = 100 из геометрического распределения с параметром/? = 1/2 (см. задачу 15.17). Построить статистический ряд и полигон частот для полученных данных, определить основные характеристики выборки. 15.47. Смоделировать выборку объема η = 100 из распределения Пуассона П( 1). Построить статистический ряд и полигон частот для полученных данных, определить основные характеристики выборки. УКАЗАНИЕ В основе алгоритма моделирования выборки из распределения Пуассона Π (λ) лежит следующий факт: если {£/",.} — независимые равномерно распределенные на [0, 1 ] случайные величины, то к величина ξ = max {к: Π Ui > е~я} (ξ = 0, если Ux < ε~λ) имеет распре- i = \ деление Π (λ). 15.48. Наблюдались показания 500 наугад выбранных часов, выставленных в витринах магазинов. Пусть г — номер промежутка между (г- 1)-миг-мчасом, г = 1,..., 12, avr —число часов, показания которых были в r-м промежутке. Результаты наблюдений приведены в таблице: г vr 1 41 2 34 3 54 4 39 5 49 6 45 7 41 8 33 9 37 10 41 11 47 12 39 Σ 500 186
Построить полигон относительных частот этих данных и сравнить его с графиком функции/(л;) = с, 0 < χ < 12. Для непрерывной случайной величины ξ, обладающей непрерывной плотностью распределения/(л:), помимо эмпирической А функции распределения Fn(x), можно построить по соответствую- А щей выборке X = (Xl9 ... , Хп) статистический аналог /п(х) и для плотности/(х), который называется гистограммой. Для этого используется метод группировки, в соответствии с которым область Δ возможных значений ξ разбивают на некоторое число N не- N пересекающихся интервалов Δ1? ... , Δ^ (так что Δ = U ΔΓ), Полечила тывают числа ν1? ... , νΝ наблюдений Х{9 ... , ΧΝ, попавших в соответ- N ствующие интервалы (так что Σ vr = η), и строят кусочно-постоян- л=1 ную функцию /и(х) = щпридс€ ΔΓ, r=l,...,N (15.2) (здесь |ΔΓ| — длина интервала ΔΓ). То, что построенная по такому А правилу гистограмма f п(х) действительно дает некоторое представление о виде теоретической плотности/(х), следует из закона больших чисел, согласно которому при η —► оо относительная частота \г/п сближается с вероятностью Ρ{ξ е ΔΓ} = J f(x) dx. Но этот ин- теграл по теореме о среднем равен f(ar)\Ar\, где аг— некоторая внутренняя точка ΔΓ (при малом ΔΓ в качестве аг можно взять, например, середину интервала). Таким образом, при больших η и до- А статочно «мелком» разбиении {ΔΓ} /п{х) ~f{ar) при χ е ΔΓ, τ. е. А гистограмма f п(х) будет достаточно хорошо приближать график плотности/ (х). Наряду с гистограммой в качестве приближения для неизвестной теоретической плотности f{x) можно использовать кусочно-линейный график, называемый полигоном частот, который А строится так: если построена гистограмма fn(x), то ординаты, соответствующие средним точкам интервалов, последовательно соединяют отрезками прямых (рис. 16). Группированные данные удобно представлять в виде соответствующего статистического ряда {(ar, vr)}, где аг — серединаr-го интервала группировки. 187
4><*>* 10 10 10 10 10 10 10 10 10 Рис. 16 Метод группировки применяют и для дискретных данных, когда, например, множество возможных значений наблюдаемой случайной величины счетно. Относительные частоты vr/n в любом случае являются статистическими аналогами (оценками) для вероятностей Ρ{ξ е Аг}. 15.49. Наблюдения над непрерывной случайной величиной ξ, округленные с точностью Ю-2, оказались равными 0,59; 0,16; 0,44; 0,48; 0,90; 0,19; 0,65; 0,42; 0,35; 0,84; 0,28; 0,63; 0,54; 0,12; 0,18; 0,67; 0,94; 0,63; 0,33; 0,03. Построить гистограмму и полигон частот этих данных, взяв в качестве интервалов группировки Аг = ( —гтг-, т~ , г — 1, 2,..., 10. РЕШЕНИЕ. Частоты интервалов равны г ν, 1 1 2 4 3 1 4 2 5 3 6 2 7 4 8 0 9 2 10 1 Σ 20 Имеем |ΔΓ| = 1/10, λι|Δγ| = 2, поэтому по формуле (15.2) значе- А ние гистограммы /2оС*) в интервале г равно vr/2. Вид гистограммы и полигона частот приведен на рисунке 16. 15.50. Получить на компьютере выборки, объемы которых η = 50, 80, 100 случайных Л(0, 1) чисел и, группируя данные по ин- л (Г- 1 Г тервалам Δ,. = ^-Tjjp ^ , г = 1, 2, ... ,10, построить соответствующие гистограммы и полигоны частот. 188
15.51. Смоделировать выборку объема η = 500 из равномерного распределения Л(0, 12) (см. задачу 15.14). Группируя данные по интервалам Аг = (г - 1, г], г = 1, 2,... , 12, построить гистограмму и полигон частот. 15.52. Используя таблицу случайных чисел, смоделировать η = 50 значений случайной величины ξ, имеющей показательное распределение с параметром 1 (см. задачу 15.12), и построить гистограмму и полигон частот полученных данных, взяв в качестве интервалов группировки Аг = (г — 1, г], г = 1, 2, ... . Определить основные характеристики выборки. 15.53. В опытах наблюдалась неотрицательная непрерывная случайная величина. Вариационный ряд выборки объема η = 50 оказался следующим (вычисления производились с точностью Ю-2): 0,01 0,29 0,70 1,01 1,50 2,46 0,01 0,42 0,72 1,01 1,52 2,50 0,04 0,46 0,76 1,02 1,54 3,73 0,17 0,47 0,78 1,03 1,59 4,07 0,18 0,47 0,83 1,05 1,71 6,03 0,22 0,56 0,85 1,32 1,90 0,22 0,59 0,87 1,34 2,10 0,25 0,67 0,93 1,37 2,35 0,25 0,68 1,00 1,47 2,46 Построить эмпирическую функцию распределения, гистограмму и полигон частот для этих данных с интервалами группировки ΔΓ = (г — 1, г], г = 1, 2, ...; определить выборочную медиану. 15.54. Получена следующая выборка объема η = 100: 0,926 -1,851 -0,258 0,161 -1,501 0,756 0,378 -1,229 -0,256 0,415 1,096 -2,574 1,375 0,194 0,412 1,179 -0,488 -1,618 0,761 -0,486 -0,212 -0,169 0,181 0,785 1,192 0,906 -1,055 -0,162 -0,345 0,181 0,856 0,219 0,313 1,393 -0,963 1,394 -0,513 0,007 -0,136 -0,511 -0,736 -0,491 0,779 -0,005 -1,163 1,022 -0,555 -0,525 0,769 1,033 -2,051 0,960 -1,983 -1,010 -0,899 -0,911 -0,472 0,046 0,595 0,971 0,303 -0,457 -1,530 -1,376 0,598 0,012 1,231 1,279 0,321 0,881 0,712 0,448 -0,218 -0,482 -0,150 -0,918 -0,725 -0,199 3,521 2,945 -0,934 1,090 0,748 1,372 1,678 1,356 1,598 0,147 -0,246 0,571 1,974 1,579 -0,631 -0,690 0,225 -0,057 -0,561 1,065 -0,121 1,239 Определить ее основные характеристики; построить эмпирическую функцию распределения, гистограмму и полигон частот (точку χ = 0 взять в качестве границы интервалов, ширину которых положить равной 0,5), сравнить полигон частот с плотностью закона ЗЧ( 0, 1). 189
15.55. Для каждой из выборок, полученных в задаче 15.10, построить эмпирическую функцию распределения и гистограмму (как в задаче 15.54), а также определить их основные характеристики. 15.56. Используя данные, полученные в задаче 15.8, и проведя их группировку с интервалами ΔΓ= (г-0,5; г + 0,5], г = 0, ±1, ±2,..., построить соответствующие гистограмму и полигон частот; определить основные характеристики выборки. Выборочные моменты и квантили Наиболее важными характеристиками случайной величины ξ являются ее моменты ак = Μξ^, а также центральные момен- ты \ik = Μ (ξ - ocj)* (когда они существуют). Их статистическими аналогами, которые вычисляются по соответствующей выборке X = (Х{,... ,Хп), являются выборочные моменты bk=l±Xf, А* = Ц (*,-*,)*· (15.3) Величину ά ι называют выборочным средним и обозначают через X: а величину μ2 — выборочной дисперсией и обозначают через S2: ^2=μ2=ΐΣ (Xt-Xy=]-ixf-X\ (15.4) Если выборочные данные представлены в виде статистического ряда {(ar, vr)} (когда наблюдаемая величина ξ дискретная или когда применяется метод группировки), то выборочные моменты вычисляют по формулам αΛ=-Σβ?νΓ, μΛ = ^Σ(ΛΓ-α1)ΛνΓ; в частности, «. = δ = \ Σ arvr, {i2 = Si=l-l{ar- ά)\= \ Σα}νΓ- α\ (15.5) η r η r η r В этом случае для простоты вычислений исходные данные часто удобно преобразовать, положив br = (аг — а)/с, где сдвиг а есть значение аг с максимальной частотой vr и единица масштаба с > 0 — произвольная. Средние а, Ъ и дисперсии S2(a), S2(b) co- 190 i>
ответственно исходных и преобразованных данных связаны соотношениями a=cb + a, S2(a)=c2S2(b). (15.6) При достаточно общих предположениях выборочные моменты при больших объемах выборки близки к соответствующим теоретическим моментам и потому могут служить оценками последних, когда они неизвестны. 15.57. Вычислить выборочные среднее и дисперсию по исходным и группированным данным, приведенным в задаче 15.49. РЕШЕНИЕ. По формулам (15.3) и (15.4) имеем ^ = ^=0,468, S2~0,067. Середины интервалов Аг равны аг — 0,1г — 0,05, при этом а — — αΊ — 0,65; кроме того, здесь удобно выбрать в качестве единицы масштаба с — 0,1. Таким образом, статистический ряд преобразованных по формуле br— {аг— а)/с = (0,1г —0,7)10 — г— 7 данных имеет вид К νΓ -6 1 -5 4 -4 1 -3 2 -2 3 -1 2 0 4 1 0 2 2 3 1 Σ 20 Теперь вычисляем (см. формулы (15.5) и (15.6)): ЪЬ^Г — —37, г Ъ = -37/20 = -1,85, следовательно, a = cb + a = 0,65 - 0,185 = 0,465. Аналогично находим ЪЬ2уг = 201, S2(b) = - ЪЬ2уг - Ъ2 = -^- - - 1,852 ~6,628, следовательно, S2(a) = c2S2(b) ~0,066. 15.58. Вычислить выборочные среднее и дисперсию для данных задачи 15.45 и сравнить их с теоретическими значениями. РЕШЕНИЕ. Здесь имеет место статистический ряд {(г, vr)}, поэтому вычисления производим по формулам (15.5) и (15.6), предварительно преобразовав данные, положив br = r—6 (поскольку а = = 6). Итак, статистический ряд преобразованных данных имеет вид Ьх Vr -5 7 -4 60 -3 198 -2 430 -1 731 0 948 1 847 2 536 3 257 4 71 5 11 Σ 4096 Здесь Σ brvr = 569, b = 569/4096 -0,14, следовательно, ά χ = a + b ~ «6,14, теоретическое среднее ах = Μξ = 12/2 = 6. Аналогично имеем 191
Σζ>2ν,.= 12 083 и μ2 = S2(b) = - Σb2vr - b2 « 2,93; теоретическая дисперсия μ2 = ϋξ = 12/4 = 3. 15.59. Убедиться в справедливости соотношений (15.6). 15.60. Вычислить выборочные среднее и дисперсию для данных, полученных в задаче 15.46, и сравнить их с теоретическими значениями α, = Μξ =1, μ2 = Όξ = 2. 15.61. Вычислить выборочные среднее и дисперсию для данных, полученных в задаче 15.47, и сравнить их с теоретическими значениями а{ = μ2 = 1. 15.62. Рассматривая приведенные в задаче 15.48 данные как независимые наблюдения над дискретной случайной величиной ξ, принимающей значения, которые совпадают с серединами соответствующих интервалов (т.е. значения 0,5; 1,5; ...; 11,5), вычислить выборочные среднее и дисперсию и сравнить их с соответствующими моментами равномерного распределения Л (0, 12). 15.63. Для данных, полученных в задаче 15.51, вычислить основные характеристики выборки, а также выборочные средние и дисперсии по исходным и группированным данным и сравнить их с соответствующими теоретическими значениями а{ = 6, μ2 = 12. Для произвольного распределения Fn произвольного числа/? е е (0, 1) уравнение F(x) =р определяет ρ-квантиль ζρ9 т. е. Γ(ζ) = =р (чтобы решение было однозначно, график F(x) в точках разрыва (когда они есть) дополняют вертикальными отрезками, а в случаях, когда этому уравнению удовлетворяет много значений х, в качестве ζρ выбирают минимальное из них (рис. 17)). Выборочный ρ-квантиль ζρ определяется как/?-квантиль эмпирической функ- Fix). 1 ^3 ^gS I ^-^Г 1 ζ, ζ, 0 к 1 рг Ц X Рис. 17 192
А А л ции распределения Fn(x), т. е. Fn(^p) = ρ, и является статистическим аналогом соответствующей теоретической/?-квантили ζ . 15.64. Убедиться втом, что выборочная/?-квантиль ζρ выражается через порядковые статистикиХ^к) выборки X (Х{,..., Хп) (см. § 15.3) следующим образом: ζ =ίΧ([ηρ} + \) ПРИ "Ρ Дробном, ρ \ Х{пр) при пр целом, где [а] — целая часть числа а. ЗАМЕЧАНИЕ. Несколько отличается определение выборочной медианы А ζ 1/2, данное в § 15.3 (при/? = 1/2 соответствующая квантиль ζ1/2 называется медианой распределения F). 15.65. Вычислить первый и второй выборочные моменты ά^, к = 1, 2 (см. (15.3)), а также выборочные /?-квантили ζρ при /? = 0,25; 0,5; 0,75 для данных, полученных в задаче 15.52, и сравнить их с соответствующими теоретическими характеристиками ак = к\, ς/, = -ΐη(ΐ-/7). 15.66. Вычислить выборочные среднее, дисперсию и/?-кванти- ли при ρ = 0,25; 0,5; 0,75 для данных задачи 15.53. При исследовании свойств графика плотности распределения часто рассматривают такие характеристики, как коэффициенты асимметрии у{ и эксцесса γ2, определяемые формулами Υι = μ3/μ23/2> Υ2 = μ4/μ2 -3· Если график плотности симметричен, то ух = 0, и по значению ух судят о степени отклонения от симметрии. Аналогично, для нормального распределения γ2 = 0, и о кривых с γ2 = 0 говорят, что они имеют нормальный эксцесс, если же γ2 > 0 (γ2 < 0), то считают, что эксцесс кривой положителен (отрицателен). Если наблюдаемая случайная величина ξ абсолютно непрерывна и X = (Xl9..., Хп) — выборка из ее распределения, то выборочные коэффициенты асимметрии и эксцесса определяются соответственно формулами γ, = μ3Λ?3, %=μ^-3. (15.7) Если μ2 > 0 и существует четвертый момент μ4, то для больших выборок уу. близки к yj. 7-1605 Ватутин 193
15.67. Вычислить выборочные среднее, дисперсию, а также выборочные коэффициенты асимметрии и эксцесса (см. (15.7)) для данных задачи 15.54. 15.68. Выполнить такое же задание, как в задаче 15.67, используя данные, полученные в задаче 15.10; сравнить выборочные характеристики с соответствующими значениями теоретических характеристик. 15.69. Для данных, полученных в задаче 15.8, вычислить выборочные среднее, дисперсию, коэффициенты асимметрии и эксцесса, а также квантили ζρ при/? = 0,25; 0,5; 0,75 (см. задачу 15.64) и сравнить их с теоретическими значениями. 15.70. Убедиться, что для величин μ^ (см. (15.3)) при к > 2 справедливо представление μ*= *Σ ЫУС1Х'ак_г+ (-l)*"1^- l)Xk. r=0 15.71. Доказать формулы M«* = ak> D«* = («2* - α* )/я. cov (α*, as) = (ak + s - akas)/n (предположить, что моменты а2к иа^5 конечные). УКАЗАНИЕ. Воспользоваться независимостью и одинаковой (с величиной ξ) распределенностью элементов выборки X = (Х19... 9Хп). 15.72. Воспользовавшись неравенством Чебышёва, доказать, что Р^ад. - ак\ > ε} -* 0 при η -* оо и любом ε > 0. ЗАМЕЧАНИЕ. Этот результат говорит о том, что при больших объемах выборки выборочные моменты близки к соответствующим теоретическим моментам. 15.73. Вычислить математическое ожидание и дисперсию выборочной дисперсии (см. (15.4)). УКАЗАНИЕ. Перейти к центрированным величинам Yi = Xi - аг и записать S2в виде S2=-n Σ (γ.-γ)2=1 t Υ} -Ύ2. Ответ: MS2 = —μ^ OS2 = ^-^(μ4 - —[^ } 194
15.74. Воспользовавшись центральной предельной теоремой и задачей 15.71, доказать, что при η -* оо выборочный момент ά^ ( α2*-αΚ асимптотически нормален с параметрами ак, , т. е. р{£^(^-^)<хЬф(х)- 15.75. Пусть наблюдаемая случайная величина ξ имеет нормальное распределение 3\ί(αΐ9 μ2). Найти распределение выборочного среднего X для выборки объема η и сравнить его с соответствующим результатом предыдущей задачи. Ответ: для любого η величина X имеет следующее распределение: ό/ν(αΐ5 μ2//?). 15.76. Используя многомерную форму центральной предельной теоремы, показать, что при η —* оо совместное распределение любого конечного числа выборочных моментов Ап = (ά1? ά2,... , OLk) асимптотически нормально с вектором средних значений α = (α1? ο^,..., α^) и матрицей вторых моментов - Σ = - Цо^-Ц f, где σ^ = α, +. — α,-α. (см. задачу 15.71). УКАЗАНИЕ. Положить ξ,- = (Xi9 Χ}, ... , Xf), i = 1, ... , η, тогда пкп = ξ,{ + ... + ξ„ — сумма независимых одинаково распределенных векторов. 15.77. При изучении асимптотических (при η —► оо) распределений функций от выборочных моментов используется следующий общий результат: если φ (х), х= (х{9... ,хк), —любая дифференцируемая функция, то (в обозначениях задачи 15.76) случайная величина т\п = <р(Ая) асимптотически нормальна с параметрами (φ(α), с2/η), если σ2 = Σ σ,-,φ,-φ· > О, ij = 1 ,/= 1,... ,/t. χ = α где φ, = ЭФ(Х) Доказать, что при η —► оо выборочная дисперсия S2 асимптотически нормальна с параметрами (μ2, (μ4 - μ \ )/η). УКАЗАНИЕ. Воспользоваться представлением S2 = (р(а{, 6с2), где (р уХ ι, Xj ) Х^ — Χ ι . 195
Выборочный коэффициент корреляции В ряде случаев результат эксперимента описывается в терминах двумерной случайной величины ξ = (ξ,, ξ2). Если проведено η независимых наблюдений над ξ, то соответствующие данные представляются выборкой ((Хп, Хц), /= 1, ...,«). В этом случае совокупность (XU9 ... , ХпХ) можно рассматривать как выборочные данные для координаты ξ1? а (Хп, ··. , ХП2) — как выборку для ξ2. Таким образом, величины являются выборочными средним и дисперсией для координаты tj (J = 1, 2). В этом случае статистическим аналогом для теоретической ковариации οον(ξ„ξ2)=Μ(ξ1-Μξι)(ξ2-Μξ2)=Μξιξ2-ΜξΙΜξ2 является выборочная ковариация \ η — _ Ι η _ _ ^12 = й ,?! (^/1 ~ *О^Я ~ Χΐ) = η .Σ ^71^72 ~ ^1^2> ( 15'8) а статистическим аналогом для коэффициента корреляции Р = СОГГ (ξ^ ξ2) = COV (ξ1? ξ2)/7ϋξ1ϋξ2 — выборочный коэффициент корреляции p„ = Sn/S{S2. (15.9) Если Μξ^ ξ| < οο и Οξ7· > 0,у = 1, 2, то для больших выборок (при η —* οο) ρη является хорошим приближением (оценкой) для теоретической корреляции р. Для простоты вычислений величины рп часто удобно предварительно преобразовать исходные данные с помощью линейного преобразования: Υη = (Хп - а{)/Ь19 Υα = (Хп - а2)/Ь29 i = 1, ... , я, (15.10) где а}9 а2 — действительные, a b{, b2— положительные числа. В этом случае при любом выборе av а2, Ъх> Ъ2 рл(Х) = рл(У). (15.11) 15.78. Доказать свойство (15.11). 196 <>
15.79. Вычислить выборочный коэффициент корреляции для следующих данных η = 26 наблюдений над величиной ξ = ξΐ5 ξ2, записанных в виде статистического ряда: ξι ξ2 Vr 23,0 0,48 2 24,0 0,50 4 24,5 0,49 3 24,5 0,50 2 25,0 0,51 1 25,5 0,52 1 26,0 0,49 2 26,0 0,51 1 26,0 0,53 2 26,5 0,50 1 26,5 0,52 1 27,0 0,54 2 27,0 0,52 1 28,0 0,53 з· УКАЗАНИЕ. Выполнить линейное преобразование (15.10), выбрав ах = = 26,0, Ьх = 0,5, а2 = 0,50, Ь2 = 0,01. Ответ: р26 = 0,793. 15.80. Используя независимые равномерно распределенные на [0, 1 ] случайные числа {Е/,·}, построить последовательность пар случайных чисел (Хп = J-2lnU2i cos {2nU2i_x), Xi2=J-2lnU2i sin (2nU2i_,)), i = 1, ... , 50, вычислить для этих данных выборочный коэффициент корреляции и сравнить его с теоретическим значением ρ = 0 (см. задачу 15.8). 15.81. Используя данные, приведенные в задаче 15.54, образовать η = 50 пар последовательных чисел и, рассматривая их как реализацию выборки ((Хп, Хц)-> i = 1, ... , 50), вычислить выборочный коэффициент корреляции р50.
ТЕОРИЯ ОЦЕНОК Глава Оценки, их состоятельность и несмещенность Одна из основных задач математической статистики — разработка рациональных методов оценивания неизвестных истинных значений тех или иных характеристик наблюдаемой в эксперименте случайной величины ξ (или ее закона распределения F) по исходам эксперимента. Оценить истинное значение #0 некоторой характеристики g случайной величины ξ по соответствующей выборке Х= (Х{, ... , Хп) означает построить такую функцию Тп = Тп(Х), значение которой / при наблюдавшейся в эксперименте реализации выборки можно было бы считать разумным (в каком-то смысле) приближением для g0: t ~ g0. В этом случае говорят, что статистика Тп оценивает g или что Тп есть оценка g (для g), и часто подчеркивают это обозначением g = Тп(Х). Это понятие уже встречалось в гл. 15. Так, говорилось, что зна- -Л чение эмпирической функции распределения Fп(х) (см. формулу (15.1)) в каждой точке можно рассматривать в качестве приближения (оценки) для теоретической функции распределения F(x), а различные выборочные характеристики (моменты ак и μ^. (см. формулу (15.3), квантили ζρ и т. д.) — как оценки соответствующих теоретических характеристик. При этом в термин «оценка» вкладывался определенный асимптотический смысл. Именно, на основании закона больших чисел (или неравенства Чебышёва) в ряде случаев можно было утверждать, что при росте числа наблюдений (при η —► оо) значение оценки сближается со значением соответствующей теоретической характеристики (см., например, задачи 15.27 и 15.72). Выражением этого «разумного» свойства оценки является понятие состоятельности. Ъ 198
^.Статистика Тп = Тп(Хи ... , Хп) является состоятельной оценкой для характеристики g наблюдаемой случайной величины ξ, если при η —► оо для любого ε > 0 выполняется условие Р{|Г„-£|>£}-0. (16.1) Таким образом, свойство состоятельности означает, что для выборок большого объема значительная разница между значениями оценки и оцениваемой характеристики маловероятна, и поэтому разумно (по крайней мере для больших выборок) принять статистику Тп за приближенное значение неизвестной характеристики g. 2°. Оценка Тп для g называется несмещенной, если MTn=g. (16.2) Для оценок, не удовлетворяющих условию (16.2), вводят величину b = MT„-g, называемую смещением оценки Тп. Таким образом, для несмещенных оценок их смещение равно нулю. Свойство несмещенности интуитивно «привлекательно»: оно означает, что по крайней мере «в среднем» используемая оценка приводит к желаемому результату. Поэтому часто ограничиваются рассмотрением класса несмещенных оценок. В то же время надо иметь в виду, что это свойство не всегда может быть обеспечено и не всегда «разумно» (см. далее задачу 16.15). Отметим, что для проверки состоятельности некоторой несмещенной оценки Тп обычно достаточно вычислить ее дисперсию Т>Тп\ если ΌΤη —► 0 при η —► °°, то (16.1) следует из неравенства Чебышёва. 16.1. Убедиться в том, что оценка рп для доли/? белых шаров в урне (см. задачу 15.1) является несмещенной и состоятельной. 16.2. Проверить аналогичное утверждение в условиях задачи 15.4 при η, Ν—► оо. 16.3. Доказать, что значение эмпирической функции распреде- А ления Fп (х) в каждой точке χ является несмещенной и состоятельной оценкой для теоретической функции распределения F(x). УКАЗАНИЕ. Воспользоваться задачей 15.26. 199
16.4. Пусть случайная величина ξ принимает значения 1, 2,..., N с некоторыми вероятностямиpl9... ,ρΝ, соответственно. Над ξ проведено η независимых наблюдений, и пусть vr — число тех из них, в которых наблюдался исход г (г = 1,..., Ν, ν{ + ... + ν^ = η). Доказать, что относительная частота v* = vr/n является несмещенной и состоятельной оценкой для вероятности/?,, (см. § 15.4). УКАЗАНИЕ. Воспользоваться тем, что случайная величина vr имеет биномиальное распределение Bi(n,pr); применить неравенство Че- бышёва. 16.5. По η независимым наблюдениям Xl9 ... , Хп над случайной величиной ξ требуется оценить неизвестную вероятность ρ = η = Ρ{ξ е Δ}, где интервал Δ задан. Пусть ν = Σ I{Xt e Δ) — число попаданий в интервал Δ. Доказать, что статистика Тп = ν J η — несмещенная и состоятельная оценка/?. При каком значении/? дисперсия D Тп максимальна? УКАЗАНИЕ. Величина νη имеет распределение Bi(n,p). Ответ: р= 1/2. 16.6. Убедиться в том, что выборочный момент ά^ при любом к = 1, 2,... является несмещенной и состоятельной оценкой теоретического момента ак = Μξ*. УКАЗАНИЕ. Воспользоваться задачами 15.71 и 15.72. 16.7. Пусть g — несмещенная оценка g с конечной положительной дисперсией Og. Является ли статистика g2 несмещенной оценкой дляg2? РЕШЕНИЕ. Так как Og = Mg2- (Mg)2 = М£2 -g2 > О, то условие (16.2) не выполняется, и смещение равно Og. 16.8. По η независимым наблюдениям^,... , Хп над ξ требуется оценить неизвестную дисперсию μ2 = ϋξ, когда среднее а{ = Μξ известно. Убедиться в том, что несмещенной и состоятельной оценкой для μ2 в данном случае является статистика 200
УКАЗАНИЕ. Здесь МТп = - Σ DA; = μ2, ΌΤη = -0(ξ - α{)2 = _μ4-μ22 /ι 16.9. (Продолжение задачи 16.8.) Для оценивания неизвестной дисперсии μ2 = ϋξ при неизвестном среднем ах = Μξ используется выборочная дисперсия S2 (см. формулу (15.4)). Является ли эта оценка несмещенной и состоятельной? Построить несмещенную оценку вида XS2. УКАЗАНИЕ. Воспользоваться результатом задачи 15.73. Ответ: смещение оценки S2 есть b = —μ2/η, несмещенная оценка имеет вид обе оценки состоятельны. 16.10. Пусть МТп = g + Ьп, ΌΤη = δ„, где Ъп, δ„ -> 0 при η —* оо. Доказать, что Тп — состоятельная оценка #. РЕШЕНИЕ. Таккак^-МГ^ \Тп -g\- | Μ Τη -g\, то событие (17^ -g| > ε} влечет событие {\Тп - МТп\ > ε - \bn\). Отсюда согласно неравенству Чебышёва при η —* оо имеем P{|r„-g|>e}<P{|r„-Mrj>e-|^|}<^-^-0. ЗАМЕЧАНИЯ. 1) Оценка Тп, для которой смещение Ьп -► 0 при л -► °о, называется асимптотически несмещенной', примером такой оценки является выборочная дисперсия S2 (см. задачу 16.9). 2) При установлении свойства состоятельности важную роль играет также следующий простой критерий: если Тп — состоятельная оценка g, то для любой непрерывной функции φ статистика φ( Τη) является состоятельной оценкой φ(#). 16.11. Пусть над биномиальной Βί(η, θ) случайной величиной произведено одно наблюдение X (параметр θ неизвестен). Показать, что статистика Т = Х(п — Х)/(п(п — 1)) является несмещенной оценкой функцииg(Q) = θ(1 — θ). 16.12. Пусть Χ = (Χν ..., Χη) — выборка из распределения Бер- нулли Bi(l, θ) с неизвестным параметром θ е (0, 1). Оценить функцию^(б) = θ(1 - θ). УКАЗАНИЕ. Принять во внимание, что статистика Τ = Хх + ... + Хп имеет распределение i?/ (л, θ), и применить задачу 16.11. 201
16.13. Пусть произведено одно наблюдение X над случайной величиной с распределением Пуассона Π(θ) (параметр θ неизвестен). Показать, что статистика Т = Х(Х— 1)...(Х— к+ 1) является несмещенной оценкой для функции #(θ) =Qk (k= 1, 2,...). 16.14. Над случайной величиной с распределением Π(θ) произведено η независимых наблюдений. Является ли выборочное среднее несмещенной и состоятельной оценкой параметра Θ? У КАЗАН И Е. Воспользоваться решением задачи 16.6. 16.15. Пусть в схеме Бернулли с неизвестной вероятностью «успеха» ве (0, 1) испытания проводятся до первого «неуспеха» и ΛΓ—наблюдавшееся число «успехов». Убедиться в том, что статистика [О приХ=0, 1 1 1 при Х> 1 — единственная несмещенная оценка параметра Θ. УКАЗАНИЕ. Учесть, что X имеет геометрическое распределение с параметром θ (см. задачу 15.17), и решить уравнение несмещенности МТ(Х)=в, θ б (0,1). ЗАМЕЧАНИЕ. В данном случае оценка Τ принимает значения, не принадлежащие множеству допустимых значений неизвестного параметра θ (т. е. интервалу (0, 1)), поэтому требование несмещенности приводит к бесполезной оценке. 16.16. Пусть X = (Х{, ... , Хп) — выборка из нормального распределения q7V(6, σ2) с неизвестным средним θ и известной дисперсией σ2. Доказать, что несмещенной оценкой функции #(θ) = θ2 является статистика Т= X - с2/п. УКАЗАНИЕ. Учесть, что величина X имеет распределение ο7ν(θ, σ2/η) (см. задачу 15.75). 16.17. Пусть X = (Х{, ... , Хп) — выборка из нормального распределения o7V(tf, σ2) с известным средним а и неизвестной дисперсией Θ2. Доказать, что несмещенной и состоятельной оценкой параметра θ является статистика УКАЗАНИЕ. Вычислить Μ|ξ - а\ = 3θ, ϋ|ς - а | = ^Ζ_? θ2. 202
16.18. Пусть Χ = (Хх,..., Χη) — выборка из показательного распределения F{x) = 1 - е-*/0,χ > 0 (параметр θ > 0 неизвестен). Является ли выборочное среднее X несмещенной и состоятельной оценкой Θ? УКАЗАНИЕ. Вычислить Μξ = θ и воспользоваться задачей 16.6. 16.19. Пусть X = (Xl9 ... , Хп) — выборка из равномерного на отрезке [θ1? θ2] распределения /?(θΐ5 θ2). Воспользовавшись задачей 15.32, убедиться в том, что статистики Т\ = 2 ^(п) +^(1)) и ^2= ^ΊΓ7 (^(л) ~^(1)) являются несмещенными и состоятельными оценками соответственно для^ = (0j + в2)/2и£2 = θ2 — 0j. 16.20. Основываясь на результатах задачи 15.33, построить несмещенную и состоятельную оценку неизвестного параметра сдвига а экспоненциального распределения Fab {параметр масштаба Ъ считается известным). Ответ: Тп=Х{Х)-Ь/п. 16.21. В условиях задачи 16.20 оценить параметр Ь, считая известным а. Ответ: Тп = X - а — несмещенная и состоятельная оценка b. 16.22. (Продолжение задачи 16.20.) Пусть оба параметра а и b неизвестны. Доказать, что их несмещенные оценки имеют соответственно вид Тх=Х^-Т2/п, Т2=^(Х-Х(1)). 16.23. Пусть (Хп, Xii)·» i = 1,..., л — независимые наблюдения над двумерной случайной величиной ξ = (ξ1? ξ2). Доказать, что несмещенной оценкой для ко вариации cov (ξ1? ξ2) является статисти- ка Τ = _ « Sn, где *S12 — выборочная ковариация (см. формулу (15.8))/ У К АЗА НИ Е. Рассмотреть случайную величину η = ζ{ + ξ2, выборочными данными для которой являются Yt = Хп + Ха, i = 1,..., η, и построить несмещенную оценку для ее дисперсии Ε)η = Ό^ + ϋξ2 + + 2 cov (ξ,, ξ2), применив задачу 16.9. 203
16.24. Пусть Χ = (Χν ... , Χη) — выборка из распределения Коши Α^(θ), задаваемого плотностью/(χ; θ) = —γ , —οο < χ < οο? θ е (—°°, °°). Основываясь на том, что статистика X также имеет распределение K(Q), показать, что X не является состоятельной оценкой параметра Θ. Является ли в данном случае состоятельной оценкой θ выборочная квантиль ζι/2 (см. задачу 15.64), относительно которой известно, что она асимптотически нормальна ЗЧ{ζ1/2, π2/An)? УКАЗАНИЕ. В данном случае вероятность Р{ | X - θ | > ε} не зависит от η 16.25. Имеется урна с N занумерованными числами 1, 2, ... , N шарами. Число N шаров неизвестно, и чтобы его оценить, из урны наугад извлекают с возвращением η шаров. Пусть X = (Хх,..., Хп) — номера извлеченных шаров и Х(пЛ = max X, — максимальный на- кп) \<i<n 1 блюдавшийся номер. Проверить, что несмещенной оценкой N является статистика Т= Т(Х(Н)) = [Xtf ι - {Х{п) - l)" + ']/[Xf„) - {Х(п) - 1)"] = = ЛГ(я)[1-(1-^)- + Ч/[1-(1-^)-]-^^(я) (приближенное равенство справедливо при больших значениях^). следовательно, распределение Х(п\ имеет вид Р{Х{п) =m}= [m» -(m- \)»}/N\ m = 1,..., N. 16.26. {Продолжение задачи 16.25.) Доказать, что если шары извлекают без возвращения, то несмещенная оценка N имеет видГ=— Х(п)-1- УКАЗАНИЕ. Здесь распределение статистики Х^ „ * имеет вид Р{Х[Я> = m) = Cnm~_\ /C"N, m = η, η + 1,..., ΛΓ. 204
Среднеквадратическая ошибка и эффективность оценки Для оценивания заданной характеристики g наблюдаемой случайной величины ξ можно использовать, вообще говоря, различные оценки, поэтому, чтобы выбрать лучшую из них, надо использовать какой-нибудь критерий сравнения качества {точности) оценок. Обычно в качестве меры точности оценки Т(Х) используется ее среднеквадратическая ошибка М(Т(Х) — g)2, и из двух оценок £ более точной (иногда говорят более эффективной) считается оценка с меньшей среднеквадратической ошибкой. Для несмещенных оценок (см. формулу (16.2)) Μ(Γ(Χ)-*)2 = Ό7ΧΧ), т. е. их мерой точности является дисперсия. В ряде случаев удается построить несмещенную оценку (для g), дисперсия которой не больше дисперсии любой другой несмещенной оценки. Такая оценка Т* называется оптимальной (в классе несмещенных оценок g), и она единственна. 16.27. Пусть X = (Хх,..., Хп) — выборка из распределения Бер- нулли Bi(\, р) с неизвестным параметром/? е (0, 1). Требуется оценить параметр р. РЕШЕНИЕ. Рассмотрим класс статистик вида 1 = \ где а, + ... + ап = 1 и а \ + ... + а 2 —► 0 при η -► оо. Здесь МТп= Σ aiP=p, ΌΤη= Σ α}ρ(1-ρ)-+0, η - οο, /=1 /=1 поэтому любая статистика из этого класса является несмещенной и состоятельной оценкой р. Но минимальную дисперсию среди них имеет статистика Тп при ах = ... = ап = \/п (доказать!), тем самым оптимальной в данном классе оценкой является выборочное среднее X = (Х{ + ... +Хп)/п. 16.28. Пусть Τ = Т(Х) — оценкаgn b = MT-g— ее смещение. Доказать формулу М( Τ — g)2 = ΌΤ+ b2. 16.29. По выборке X = (Х{,... , Хп) из равномерного распределения R(О, Θ) с неизвестным параметром θ > 0 требуется оценить Θ. Убедиться в том, что следующие оценки: Тх = 2Х, Т2= Х^п) 205
и Т3 = (η + l)^(i) — несмещенные, но наиболее точная из них Т2, а состоятельными являются оценки Тх и Г2. УКАЗАНИЕ. Воспользоваться задачей 15.32. 16.30. В задаче 16.20 можно предложить также несмещенную и состоятельную оценку Т'п = X — Ь. Показать, что более эффективной является оценка Тп=Х(1)- Ь/п. 16.31. Пусть X = (Хи ... , Хп) — выборка из нормального распределения оЛ/"(я, θ2) с известным средним а и неизвестной дисперсией Θ2. Требуется оценить g = θ2. Рассмотрим три оценки: выбороч- 1 η ную дисперсию S2, Si = (η/(η - l))S2 и g = - Σ {Xf - а)2 (две последние из них являются несмещенными (см. задачи 16.8 и 16.9)). Доказать, что по критерию среднеквадратической ошибки оценка S2 — наиболее точная из этих трех оценок, но в классе несмещенных оценок g точнее, чем S$. УКАЗАНИЕ. Учесть, что в данном случае второй и четвертый центральные моменты равны μ2 = θ2, μ4 = 3Θ4, и использовать задачи 15.73 и 16.8. 16.32. Рассматривается задача оценивания дисперсии θ| нормального распределения сЛ/^, θ|) (оба параметра неизвестны) по соответствующей выборке X = (Xl9 ... , Хп). Рассмотрим класс оценок вида Τλ = XSfi, где S$ — несмещенная оценка θ| (см. задачу 16.9). а) Доказать, что среднеквадратическая ошибка оценки Τλ имеет вид М( Τλ - Q\ )2 = φ(λ) θ\, где φ(λ) = -^-χ λ2 + (λ - 1 )2; б) убедиться в том, что при + . < λ < 1 оценка Τλ точнее, чем оценка S%; в) оптимальной в классе {Ту} является оценка 7^», где λ* = = . . (Воспользоваться указанием к задаче 16.31.) 16.33. {Объединение статистической информации.) Имеются две независимые выборки объемом η, и п2 из одной и той же совокупности с неизвестными средним а, и дисперсией μ2. Пусть Хр Sj,j= 1, 2, — соответствующие выборочные средние и дисперсии. Убедиться в том, что статистики 206
являются несмещенными и состоятельными оценками соответственно для otj и μ2. Являются ли они более эффективными, чем соответствующие оценки, вычисленные по отдельным выборкам? Результат обобщить на случай произвольного числа выборок. УКАЗАНИЕ. Воспользоваться независимостью выборок, а также задачами 15.71 и 15.73. Ответ: да. Пусть наблюдаемая случайная величина ξ имеет распределение F(x; θ), зависящее от неизвестного параметра Θ, значения которого принадлежат некоторому множеству Θ. Пусть/(χ; Θ) — плотность распределения для непрерывной случайной величины: /(χ; θ) = г) Fix' й\ = —\ ' и в дискретном случае вероятность /(χ; θ) = Ρ{ξ = χ). Определим функцию /(9,.м(У!1^)!=-мэ-1!!^1>, (16.з) называемую информацией Фишера (предполагается, что операции дифференцирования и взятия математического ожидания корректны). Если Тп = Тп(Хи ..., Хп) — произвольная несмещенная оценка дифференцируемой функции g(Q), то для многих моделей имеет место неравенство Рао — Крамера для ее дисперсии: »Т»>[Шт- (16·4) 3°. Оценка Тп, для которой в неравенстве (16.4) имеет место равенство {при всех θ е Θ), называется эффективной. Таким образом, эффективная оценка (если она существует) является оптимальной (т. е. с минимальной дисперсией) среди всех несмещенных оценок параметрической функции g{Q). При установлении свойства эффективности полезен следующий простой критерий: статистика Тп является эффективной оценкой g(Q) тогда и только тогда, когда имеет место представление Tn-g{Q)=a{Q) Σ L , (16.5) /·=ι где α (θ) — некоторая функция от Θ; в этом случае ΌΤη = α (Q)g'(Q). 16.34. Пусть в схеме Бернулли 2?/(1, θ), (Θ е (0, 1)— неизвестно) проведено η испытаний, результаты которых представлены выборкой X = (Хх,..., Хп). Оценить по этим данным параметр Θ. 207
РЕШЕНИЕ. Здесь/(х;6) =θ*(1 - θ)1"*, jc = 0,1, и Э1п/(х;9) =х _ 1 -χ = χ-θ 3θ θ 1-θ θ(1 - θ) · Отсюда по формуле (16.3) находим информацию Фишера 1 /(θ) = [θ(1-θ)]-2Μ(ξ-θ)2= [θ(1-θ)]-2ϋξ = θ(1-θ)· Следовательно, для любой несмещенной оценки θ имеет место неравенство (см. формулу (16.4)) Т)Тп > θ( 1 — θ)/п. Так как θ(1-θ) Σ—^— = ΣΧι·-ηθ = η(Χ -θ), то согласно критерию (16.5) статистика Тп = Χ в данном случае является эффективной оценкой θ и DA" = θ(1 - θ)/« = 1/(ш(Э)). Таким образом, для модели Бернулли среднее арифметическое наблюдений является оптимальной оценкой неизвестного параметра в классе всех несмещенных оценок θ (ср. с задачей 16.27). 16.35. Пусть X = (Xl9 ... , Хп) — выборка из биномиального распределения Bi(k, θ), и требуется оценить неизвестный параметр Θ. Показать, что эффективной оценкой θ является статистика Тп = Х/к. к УКАЗАНИЕ. Вычислить /(θ) = α-η—^т и проверить неравенство (16.4). Щ1 — и; 16.36. Над пуассоновской случайной величиной с неизвестным параметром θ произведено η независимых наблюдений Хи ... , Хп. Показать, что статистика Тп = X является эффективной оценкой Θ. УКАЗАНИЕ. ВЫЧИСЛИТЬ/(Э) = 1/Θ. 16.37. Доказать, что для геометрического распределения с неизвестным параметром θ = ρ (см. задачу 15.17) информация Фишера /(Θ) = [θ(1 - θ)2]-1, а эффективной оценкой функции g(Q) = θ/( 1 - θ) является статистика Тп = X. Вычислить дисперсию оценки Тп. Ответ: ХУТп = θ/[η(1 - θ)2]. 16.38. В условиях задачи 16.18 доказать, что X — эффективная оценка Θ. Ответ: /(Θ) = θ~2. 208
16.39. Вычислить информацию Фишера для нормальной модели o/V(9, σ2) (дисперсия σ2 известна) и убедиться в том, что выборочное среднее X является эффективной оценкой теоретического среднего Θ. Ответ: /(Θ) =с~2. 16.40. Пусть X = (Хи ... , Хп) — выборка из нормального распределения 67V(a, θ2) с известным средним а. Требуется оценить функциюg{θ) = θ2. Доказать, что эффективной оценкой^(θ) является статистика (ср. с задачей 16.8). УКАЗАНИЕ. Вычислить i (θ) = 2/θ2, воспользоваться критерием (16.5). <Ί63> Метод максимального правдоподобия Одним из универсальных методов оценивания неизвестных параметров распределений является метод максимального А правдоподобия, в соответствии с которым в качестве оценки θ„ = А = §η{Χν ... ,Х„) параметра θ по выборке X = (Х{,..., Хп) из распределения F(x; θ) выбирают значение параметра, максимизирующее функцию правдоподобия Σ(Χ]θ)=/(Χι;θ).../(Χ„;β) (функция/(х; Θ) определена в (16.3)). Таким образом, L{\\ θ„) >Σ(Χ]Θ),Θε ©,или/,(Х; θ„) = sup X(Χ; θ). (16.6) θ€Θ Α Α Статистика θ„ = θ„( Χ), удовлетворяющая условию (16.6), называется оценкой максимального правдоподобия параметра Θ. Если максимум L(X; θ) достигается во внутренней точке θ А и функция /(χ; θ) дифференцируема по Θ, то θ„ удовлетворяет уравнению правдоподобия Э1п1э<,Х:е)=0. (16.7) Для случая векторного параметра θ = (θ1? ... , ΘΓ) это уравнение заменяется системой уравнений ЙЦ«!>-в.у-1,...,г. (16.8) 209
Практически оценку максимального правдоподобия θ„ обычно находят, решая уравнения (16.7) (или (16.8)). Если требуется оценить некоторую функцию g(Q) от параметра Θ, то ее оценкой максимального правдоподобия является g п = g{ θ„) — свойство инвариантности оценок максимального правдоподобия. 16.41. Пусть Тп = Тп(Х) — эффективная оценка Θ. Тогда ΘΛ = = Тп. Действительно, в этом случае Тп удовлетворяет соотношению (16.5) при#(0) = Θ, следовательно, является решением уравнения правдоподобия (16.7). 16.42. Убедиться в том, что построенные в задачах 16.35, 16.36, 16.38 и 16.39 эффективные оценки являются одновременно оценка- А ми максимального правдоподобия ΘΛ. УКАЗАНИЕ. Воспользоваться задачей 16.41. 16.43. Оценить методом максимального правдоподобия теоретическую дисперсию #(6) = θ(1 — θ) распределения Бернулли Λ'(Ι,Θ). УКАЗАНИЕ. Воспользоваться задачами 16.34, 16.41 и свойством инвариантности. Ответ: gn = X(\-X). 16.44. В условиях задачи 16.37 найти оценку максимального правдоподобия θ„. РЕШЕНИЕ. В силу задачи 16.41 выборочное среднее X, будучи эффективной оценкой для g = θ/( 1 - θ), одновременно является оценкой максимального правдоподобия gn. Но θ = g/(l + g), поэтому согласно свойству инвариантности Qn = gn/{\ + gn) — = X/(l+X). 16.45. Оценить функциюg(θ) = 1/θ в условиях задачи 16.18. УКАЗАНИЕ. Использовать задачи 16.38 и 16.42. Ответ: gn = l/X. 210
16.46. Оценить функцию g(Q) = Ρ{ξ < с} по выборке X = = (Х{9 ... , Хп) из нормального распределения o/V(0, σ2) при известном σ2. УКАЗАНИЕ. Использовать задачи 16.39 и 16.42. с-Х О твет: £я = ф(1_). 16.47. В условиях задачи 16.40 найти оценку максимального правдоподобия для функции g(θ) = Ρ{ξ < с}. Ответ: θ„ = JTn, gn = Ф((с- a))/JTn ). 16.48. Построить оценку максимального правдоподобия θ„ для параметра θ равномерного распределения Я(0, Θ), вычислить ее А смещение и дисперсию. Является ли здесь θ„ решением уравнения правдоподобия? УКАЗАНИЕ. Записать функцию правдоподобия в виде L(X; θ) = = Ι(Χ(η^ < Θ)/ΘΛ, воспользоваться задачей 15.32. Ответ: θ„ = Х{п)9 смещение Ьп = -jprrr, DB„ = /2θ2 а = + . 2 + 2 ; в точке θ„ функция L (Χ; Θ) разрывна. 16.49. Пусть X = (Х{,... , Хп) — выборка из равномерного распределения R(θ, θ + 1) (параметр θ неизвестен). Показать, что любое θ € [Х(П) — 1> ^(ΐ)] максимизирует функцию правдоподобия, но несмещенная оценка максимального правдоподобия единственна и имеет вид θ„ = (Х(\) +^(«) ~ 1)/2. УКАЗАНИЕ. Здесь/,(Х; θ) =/(θ< ЛГ(1) < Х{п) < θ + 1), использовать задачу 15.32. 16.50. Доказать, что оценка максимального правдоподобия θη параметра сдвига θ экспоненциального распределения FQ ъ (см. задачу 15.33) совпадает с Х({). Является ли она несмещенной и состоятельной? УКАЗАНИЕ. Использовать задачи 16.20 и 16.10. Ответ: смещение Ьп = b/η; состоятельна. 211
16.51. Оценить методом максимального правдоподобия неизвестные параметры θ = (θ1? θ2) нормальной модели 3V(QX, θ \ ). РЕШЕНИЕ. Здесь плотность *JZKo2 поэтому функция правдоподобия £ЖΘ)-Шbe'φ^4-^<Λ''-Θ^,2}- где X и S2 — выборочные среднее и дисперсия. Легко заметить, что здесь максимизация L(X; θ) по θ эквивалентна минимизации по θ функции (слагаемое —1/2 — InS добавлено для удобства дальнейших преобразований). Воспользуемся элементарным неравенством In я < < а — 1 при а > О, откуда следует также, что 1η α < (α2 — 1 )/2; равенство достигается лишь при а = 1. С учетом этого имеем ψ(Χ; θ) > О, равенство имеет место в точке θ = (X, S). Следователь- Α Α Λ но, оценка максимального правдоподобия θ„ = (θΐΛ, θ2/1) в данном случае существует, единственна и при этом θ„ = (X, S). 16.52. {Продолжение задачи 16.51.) Убедиться, что в дан- А ном случае оценка максимального правдоподобия θ„ удовлетворяет уравнениям правдоподобия (16.8). Оценить теоретическую дисперсию θ| и функцию#(0) = Ρ{ξ < с}. X Ответ: Цп = S\ gn = ф(^Д } 16.53. Случайная величина ξ, характеризующая срок службы элементов электронной аппаратуры, имеет распределение Релея: F{x\ θ) = 1 — е~*2/е, χ > 0. Показать, что оценка максимального A J Π правдоподобия θ равна θ = - Σ Xf. 212
16.54. Пусть Χ = (Хх, ... , Χη) — выборка из двухпараметриче- ского экспоненциального распределения FQ Q с неизвестными параметрами θ = (θ1? θ2) (см. задачу 15.33). Убедиться в том, что А оценки максимального правдоподобия θχ и θ2 равны Θ1λ = Х(\), А θ2„ = X — Х( χ), и вычислить их смещения. УКАЗАНИЕ. Записать функцию правдоподобия в виде Ζ(Χ;Θ) = 1 ехр \-1[(Х-Х{1)) + (Х(1) -в,)] \ΐ(Χ(1) >θ,); воспользоваться результатом задачи 16.22. Ответ: Μθ1η-θι = θ2/η, Μθ2η - θ2 = -θ2/η. 16.55. Пусть в эксперименте наблюдается случайная величина ξ, принимающая значения 1, 2, ... , N с неизвестными вероятностями />„... ^соответственно (0<ру< l,j= Ι,..., Ν, ρχ +... +ΡΝ = 1). Если произведено η независимых наблюдений над ξ и vy. — число реализации исходау, то случайный вектор ν = (ν1?..., ν^) имеет полиномиальное распределениеМ(я;ρ х,... ,ρΝ): P{v= (h,,..., hN)} = FT^7r^ ,... ,ph/, h, + ... + hN = n. Доказать, что оценки максимального правдоподобия рЛ = (р 1я,... ..., рд^) параметров ρ = (рх, ... ,/?^), максимизирующие вероятность Ρ{ν = h}, имеют вид рЛ = ν/η = {νχ/η,..., νΝ/η), т. е. являются относительными частотами реализаций соответствующих исходов. Являются ли эти оценки несмещенными и состоятельными? УКАЗАНИЕ. Решить задачу на условный экстремум функции Σ hf In/?.·при условии J/?,= l; воспользоваться задачей 16.4. У=1 J J 7-1 16.56. Пусть X = (Jfj, ... , Χη) — выборка из нормального распределения d7V(9, 2Θ), параметр θ неизвестен. Убедиться в том, что Α , оценка максимального правдоподобия Qn = Jl + Тп — 1, где Тп = = - Σ X}, и обосновать ее состоятельность. УКАЗАНИЕ. Применить к Тп закон больших чисел. 213
16.57. По выборке (Хп, Хп), / = 1, ... , я, из двумерного нормального распределения оЛм (0, 0), σ2 ρσ2 ρσ2 σ2 с неизвестными а2>0ирЕ(-1, 1) построить оценки максимального правдоподобия σ2 и р„. УКАЗАНИЕ. Перейти к двум новым параметрам а, = —. ~,л г-, 1 ζσζ(1 — ρ-') #2 = 2(\ —2\ и найти их оценки максимального правдоподобия #1л> #2л· Так как σ = ~~ й—2 2> Ρ = — ι— ' то далее воспользоваться свойством инвариантности. Ответ: θ2 = ^Σ (Х}х +Х}2), Р„ = 2Σ; ВД2/ Σ (*,?i + *,?2)· 16.58. Пусть Χ = (Л^, ... , ЛГ„) — выборка из логнормалъного γ распределения, т. е. Xi = е ', где Yt имеют нормальное распределение о7У(615 θ|) (оба параметра неизвестны). Вычислить оценки максимального правдоподобия для функций 8\ (Q)=MXl = ee^*i/2 и g2(Q) =OXl = Q2e^eU^ -Ι)· УКАЗАНИЕ. Воспользоваться задачей 16.51 и оценить д} и θ \ по данным (У,, ... , У„) = (1пЛГр ... , ΙηΛ^), далее использовать свойство инвариантности. 16.59. Для оценки неизвестного числа N рыб в озере проводят (по схеме выбора без возвращения) контрольный отлов т х рыб, которые метят и выпускают обратно в озеро. Затем снова вылавливают т 2 рыб и подсчитывают число μ оказавшихся среди них меченых рыб. Показать, что оценка максимального правдоподобия N = гт]т 1"'2 L μ , где [ · ] — целая часть. УКАЗАНИЕ. В этой задаче функция правдоподобия Ρ{μ = к} = = С^ Cftsjf/Ctf2, которую нужно максимизировать по N. 214
16.60. Имеется партия из N изделий, содержащая неизвестное число D дефектных изделий. Чтобы оценить параметр D, случайным образом без возвращения из всей партии извлекают η < Ν изделий и подсчитывают число d оказавшихся среди них дефектных. Показать, что оценка максимального правдоподобия D п = - — QкQn- к УКАЗАНИЕ. Здесь функция правдоподобия P{d = к} = D rN~D, ко- торую следует максимизировать по D. 16.61. Если модель зависит от многомерного параметра θ = = (θ1?... , ΘΓ), то аналогом информации Фишера (16.3) является информационная матрица Υ(θ) = ||^(θ)||[, элементы которой вычисляют по формулам 31η/(ξ;θ) 31η/(ξ;θ) Λ _ ^1η/(ξ;θ) s„(e> = Mpfi°b~>)--M ~5ёЖ~ j Доказать, что для нормальной модели οΛ/"(θΐ5 θ|) информационен О ная матрица имеет вид Υ(θ) = О 2Θ^2 16.62. Убедиться в том, что информационная матрица полиномиальной модели М{п\рх, ... ,ρΝ) (см. задачу 16.55) имеет вид Υ(θ) = = Н^у(в)||^-1?гдее= О^ ... ,^λγ-!) η^ι7(Θ) =/?г1 + /?^1,^(θ) = = Pn1> i*j\ при этом Υ-ΗΘ) = ||σ(/||ρ-1, где σ,7 =/>Д1-/>,), аи = = -PiPP **j· УКАЗАНИЕ. Учесть, что pN = 1 - рх - ... - pN_v и использовать N представление /(ξ; θ) = Y[pj^=j) (здесь ξ—случайная величина, описывающая исход отдельного испытания, т. е. принимающая значения 1,2,..., N с вероятностями соответственнорг,р2, ··· ,Ρχ)· При некоторых достаточно общих условиях оценки максималь- А А ного правдоподобия θ„ = θη(Χγ,..., Хп) при большом числе наблюдений η имеют приблизительно нормальное распределение с параметрами (θ5—vm Ь где '(Θ) — информация Фишера (см. формулу (16.3)), т. е. для любого χ Р{7^7(ё](0„-0)<х} -> Ф(х) = -±= \ t~t2/2dt. л->°° ν2π -оо 215
В частности, они являются при этом состоятельными, а поскольку их асимптотическая дисперсия Yfl, совпадает с границей Рао — Крамера (см. формулу (16.4)), они являются и асимптотически эффективными. Если оценивается непрерывно дифференцируемая функция #(θ), то ее оценка максимального правдоподобия gn = g(Qn) при η —► °о асимптотически нормальна с параметрами (g(6), с* (g)), где c^ig) = [#'(6)]2/(я/(6)), и асимптотически эффективна. 16.63. Доказать, что оценка максимального правдоподобия θη в схеме Бернулли Bi(\, θ) асимптотически нормальна <iV(9, θ(1 — — θ)/η). Для какой функции g(Q) асимптотическая дисперсия On (s) ее опенки максимального правдоподобия gn не зависит от неизвестного параметра Θ? РЕШЕНИЕ. Согласно задачам 16.41 и 16.34, здесь θ„ = X. Но случайная величина пХ = Х1 + ... + Хп имеет биномиальное распределение Bi(n, θ), поэтому при η —► °° по теореме Муавра — Лапласа Р{(/|вя-/|9)/л/лв(1 -Θ) <х}-Ф(х), откуда и следует утверждение об асимптотической нормальности. Далее, асимптотическая дисперсия оценки максимального правдоподобия gn в данном случае равна [^-'(θ) ]2Θ( 1 — θ)/η, поэтому .для нахождения функции #(6) имеем дифференциальное уравнение <?/(Θ)λ/Θ(1 -θ) ξ const, которому удовлетворяет функцияg(θ) = arc sin л/θ. Для этой функции с2п (g) = 1/(4л). 16.64. Доказать, что оценка максимального правдоподобия вп неизвестного параметра закона Пуассона Π(θ) асимптотически нормальна o/V(9, Q/n). Для какой функции g(Q) асимптотическая дисперсия ее оценки максимального правдоподобия gn не зависит от Θ? УКАЗАНИЕ. Использовать задачи 16.42 и 16.36 и применить центральную предельную теорему (или задачу 15.74). Ответ: *(θ) = Л, о2„ (g) = 1/(4«). 216
16.65. Убедиться в том, что оценка максимального правдопо- Л добия θ„ параметра θ показательного распределения с F(x; θ) = = 1 - е-*/9, χ > О, асимптотически нормальна g/V(0, θ2/η), а для функции g{Q) = In θ асимптотическая дисперсия σ2 (g) ее оценки максимального правдоподобия g n не зависит от Θ. УКАЗАНИЕ. Использовать задачи 16.42, 16.38 и 15.74. 16.66. Воспользовавшись центральной предельной теоремой, доказать, что указанная в задаче 16.40 оценка максимального правдоподобия Тп для неизвестной дисперсии Θ2 нормального распределения (Ν(α, θ2) асимптотически нормальна o7V(92, 2θ4/η). Определить функцию g(Q), для которой асимптотическая дисперсия σ« (g) ee оценки максимального правдоподобия gn не зависит от Θ. УКАЗАН И Ε. Учесть, что здесь M(Xi -a)4 = 3Θ4. Ответ: £(θ)=1ηθ, σ2 (g) = \/(2п). 16.67. Убедиться в асимптотической нормальности оценки А максимального правдоподобия θ„, указанной в задаче 16.53. УКАЗАНИЕ. Применить задачу 15.74. Ответ: 3V(Q, в2/п). 16.68. По выборке X = (Хи ... , Хп) из распределения Коши Α^(θ) (см. задачу 16.24) составить уравнение правдоподобия для А отыскания оценки максимального правдоподобия θ„ и вычислить ее асимптотическую дисперсию 1/(ш(0)). Какая из двух оценок А Θ— оценка максимального правдоподобия θ„ или выборочная квантиль ζ 1/2 — является более эффективной при больших п! А Ответ: /(Θ) = 1/2; более эффективна оценка θ„. Метод моментов Суть этого метода оценивания неизвестных параметров θ = (θ1?..., ΘΓ) распределения F(x; θ) по соответствующей выборке X = (Хг, ... , Хп) заключается в приравнивании некоторых г теоре- 217
тических моментов ак = ак(в) = Μξ* и соответствующих выборочных моментов ак (см. формулу (15.3)) с последующим решением полученной системы уравнений ак(в) = ак9 к =j\,... J„ относительно неизвестных θΐ5..., ΘΓ. В результате получаются искомые оценки θ/ = 6Дау ,... , ау ), / = 1, ... , г. Если получаемые решения являются непрерывными функциями своих аргументов, то оценки Θ,- состоятельны. 16.69. Найти методом моментов оценку параметра θ равномерного распределения R (О, Θ) и исследовать ее на несмещенность, состоятельность и эффективность. РЕШЕНИЕ. Здесь α, (Θ) = Μξ = θ/2, поэтому уравнение ах (Θ) = = ах = X определяет единственное решение θ = 2Х. Свойства этой оценки исследованы в задаче 16.29: она является несмещенной и со- п + 1 стоятельной, но оценка Т2 = Х^ более эффективна. 16.70. В схеме Бернулли с неизвестной вероятностью «успеха» θ произведено η испытаний, в которых «успех» наблюдался νη раз. Найти оценку θ методом моментов и исследовать ее свойства (как в задаче 16.69). УКАЗАНИЕ. Использовать задачу 16.34. Ответ: θ = νη/η. 16.71. Найти методом моментов оценку параметра θ распределения Пуассона Π(θ) по соответствующей выборке и исследовать ее свойства. УКАЗАНИЕ. См. задачу 16.36. Ответ: θ = X. 16.72. Убедиться в том, что оценки по методу моментов параметров θ = (0j, θ2) нормального распределения 3V(Ql9 Q\ ) совпадают с оценками максимального правдоподобия θ„ = (θ,„, θ2λ|) = = {X, S), полученными в задаче 16.51. 218
16.73. Число ξ столкновений с молекулами газа в камере Вильсона частиц, получающихся при распаде ядра урана в результате бомбардировки его нейтронами, имеет распределение РЙ=*} = 5(е"в17! +е~927!) * = (U,2,..., 0<θ1<θ2 {«двойное» распределение Пуассона). Найти методом моментов оценки параметров 0j, θ2. Вычислить значения этих оценок для следующих данных, полученных при η = 327 наблюдениях над случайной величиной ξ: X ν* 0 28 1 47 2 81 3 67 4 53 5 24 6 13 7 8 8 3 9 2 10 1 Σ 327 Ответ: в12 = Х + Js2 - X . 16.74. Наблюдаемая случайная величина ξ имеет гамма-распределение Γ(θ,, θ2), плотность которого /<*; θ>= i^rri е_*/в1. х > о. θ = (θι- θ2>. θ/> о, / = ι, 2. 1 (b2)O{2 Доказать, что оценки по методу моментов параметров θχ и θ2 имеют в данном случае вид θ х = S2/X, θ2 = Х2/^. УКАЗАНИЕ. Здесь ο^(θ) = efe2(e2+ 1)...(θ2 + &- l), k = 1,2,.... 16.75. Найти методом моментов оценку параметра θ равномерного распределения R(-Θ, θ), θ > 0. УКАЗАНИЕ. Рассмотреть уравнение α2 (θ) = ά2. Ответ: θ= βΚ2. 16.76. Пусть Χ = (Хх, ... , Χη) — выборка из распределения с плотностью/(χ; Θ) = ~ е-6·*·, θ > 0 — неизвестно. Оценить θ методом моментов, решив уравнение α2(θ) = ά2. Ответ: θ= j2/¥2. 219
Доверительные интервалы Точечные оценки дают приближенные значения оцениваемых параметров, поэтому желательно знать и возможную погрешность, возникающую при использовании предлагаемой оценки. Наглядное представление о точности оценок дают доверительные интервалы. Пусть наблюдаемая в эксперименте случайная величина ξ имеет распределение F(x; θ), зависящее от неизвестного параметра θ е Θ, и X = (Χν ... 9Хп) — выборка из этого распределения. При интервальном оценивании ищут две такие статистики Ti = ГДХ), /=1,2, что Тх < Т2 и при заданном γ е (0, 1) выполняется условие Р{ТХ(Х) <θ< Г2(Х)}>удлявсех9Е Θ. (16.9) В этом случае интервал (Т'ДХ), Т2(Х)) называют у-довери- тельным интервалом (для θ), число γ — доверительным уровнем или доверительной вероятностью, ТХ(Х) и Т^Х) — соответственно нижней и верхней доверительными границами. Таким образом, γ-до верительный интервал — это случайный интервал в параметрическом множестве Θ, зависящий от выборки X, который с вероятностью, не меньшей γ, накрывает истинное значение параметра θ. При заданном γ длина Т2 — Тх этого интервала характеризует точность, с которой локализовано значение параметра, а доверительный уровень γ— его «надежность»: вероятность ошибиться, утверждая, что θ ε (Τν Т2), не превосходит 1 - γ. Поэтому величину γ выбирают близкой к 1 (обычно полагают γ= 0,9; 0,95; 0,99) и при заданном устремятся построить доверительный интервал кратчайшей длины. Иногда рассматривают односторонние доверительные интервалы, соответственно верхний (при Тх = —оо) и нижний (при Т2 = оо). Аналогично определяют доверительные интервалы для параметрических функцийg(θ). Общий прием, с помощью которого в ряде случаев можно построить доверительный интервал, состоит в следующем. Пусть случайная величина ξ имеет плотность распределения, и существует такая функция G(X; θ) от выборки X и параметра θ, что: 1) ее распределение не зависит от θ и 2) G(X; θ) непрерывна и строго монотонна по θ. Такую случайную величину G(X; θ) называют центральной статистикой (для θ). Пусть fG{t) — плотность распределения G(X; θ). Тогда для любого γ е (0,1) можно выбрать два числа gx < g2 такие, чтобы выполнялось условие P{g{<G(X;Q)<g2} = 8jfG(t)dt = y. (16.10) 220
Для того чтобы эта процедура была однозначной, часто^ и g2 выбирают, исходя из требования Ρ{(7(Χ;θ)<^} = Ρ{(?(Χ;θ)>^2} = (1-γ)/2. (16.11) Решая теперь относительно θ неравенстваgx < G(X; θ) <g2, получаем искомый γ-доверительный интервал Тх (X) < θ < Т2(Х); если при этом выполняется условие (16.11), то интервал (Ти Т2) называют центральным. Доверительные интервалы для параметров нормальных моделей 16.77. {Оценивание среднего нормального распределения при известной дисперсии.) По выборке X = (Xl9 ... ,Хп) из распределения o7V(9, σ2) (σ2 известно) построить доверительный интервал для неизвестного среднего Θ. РЕШЕНИЕ. На основании задачи 15.75 заключаем, что в данном случае центральной статистикой является (7(Х; Θ) = Jn(X — θ)/σ, так как она имеет распределение g7V(0,1). Неравенстваgx < (7(Х; Θ) < g2 эквивалентны здесь неравенствам Tl = x-^g2<e<x-^g^r2, поэтому γ-доверительным интервалом для θ является любой интервал Δγ(Χ) = (Т]9 Т2), где g\<g2— любые числа, удовлетворяющие, в силу (16.10), условию Φ(g2) — 0(gx) =γ. Центральным же, в силу формулы (16.11), является интервал Δ* (X) = (X + ъсу/ Jn ), где су определяется равенством Ф(су) = (1 + γ)/2!. Подчеркнем, что интервал Δ* (X) симметричен относительно случайной точки X и имеет фиксированную длину / = 2ccy/Jn. В частности, с099 = = 2,5758, с0 998 = 3,0902. Подробные таблицы квантилей ир приведены в таблице 5 приложений. 16.78. (Продолжение задачи 16.77.) 1) Доказать, что интервал Δ* (X) имеет наименьшую длину среди всех γ-доверительных интервалов Δγ(Χ). 1 Если ир есть ρ -квантиль распределения g7V(0, 1), т.е. решение уравнения Ф(х) =/?, то су = и(1+у}/2. 221
2) Сколько нужно произвести испытаний η = η{1\ γ), чтобы точность локализации параметра θ при доверительном уровне γ была меньше или равна заданной величине /? Считая σ = 1, вычислить л(0,5;0,99)ил(0,1;0,99). УКАЗАН И Ε. Минимизировать функцию l(g{, g2) = g2- gx при условии Φ(^2)-Φ(^)= γ. Ответ: η > (2асу//)2. 16.79. В условиях задачи 16.77 построить верхний и нижний γ-доверительные интервалы для Θ. Ответ: (-°°, X +ouy/Jn ) и (X -cu^Jn, oo). 16.80. Смоделировать выборку объема η = 50 из распределения g7V(0, 1), положив при моделировании θ = — 1, и рассчитать по ней 0,99-доверительные двусторонний и односторонние интервалы дляб. 16.81. Взять из таблицы 10 приложений η = 20 произвольных чисел и рассчитать по этой выборке 0,998-доверительный интервал для среднего. Расчеты доверительных интервалов часто основываются на использовании ряда стандартных распределений математической статистики, к числу которых, помимо нормального распределения g7V(0, 1), относятся распределения ли-квадрат χ2(η) = Γ(2, п/2) (см. задачу 16.74), Стъюдента S(n) и Снедекора S(nly п2). Определим два последние распределения. Символом χ% будем обозначать случайную величину с распределением χ2(η). Тогда распределение Стъюдента с η степенями свободы S{n) имеет случайная величина где случайная величина ξ имеет распределение <JV(0, 1) и ξ и χ2 независимы (это распределение называют часто также ^распределением). Распределение Снедекора с т и η степенями свободы S(m, η) (его часто называют также распределением Фишера или F-распределением) имеет случайная величина χ 2 γ 2 222
где случайные величины χ2, и χ2 независимы. Для/?-квантилей распределений g7V(0, 1), χ2(η), S(n) и S{m, η) используют стандартные обозначения ир, χ2)Λ, tp n и Fp m n соответственно. Приведем следующие простые и полезные соотношения: их _р = -ир9 tx _р п = = -tp „, Fx _р т п = \/Fp n m\ используется также обозначение су = = и (ι + γ)/2· Таблицы перечисленных квантилей приведены в приложениях, более подробные таблицы имеются в [ 1 ]. В задачах, связанных с анализом нормальных моделей, используются следующие важные утверждения. 1. Пусть ξρ ... , ξ„ — независимые нормальные g7V(0, 1) случайные величины. Тогда сумма их квадратов имеет распределение «хи-квадрат» с η степенями свободы χ2(л); будем записывать это в виде ξ^ + ... + ξ2 = χ2. Если две случайные величины независимы и имеют распределения χ2(η) и %2(т), то их сумма имеет распределение χ2 (л + т). 2. Теорема Фишера. ЕслиX = (Хх,..., Хп) — выборка из нормального распределения 34{а, σ2), то выборочные среднее X = 1 п 1 п — = - ΣX; и дисперсия S2 = - Σ (X,- — X)2 независимы и при этом Χ имеет распределение (Ν{α, с2/п) (см. задачу 15.75), a nS2/c2 — распределение χ2(η — 1). 16.82. (Оценивание дисперсии нормального распределения.) Пусть X = (Xl9 ... , Хп) — выборка из нормального распределения^ а, Θ2) {а известно). 1) Убедиться в том, что центральной статистикой для оценивания дисперсии g = θ2 является G(X;g) = ±± (Х,-а)2=Т2^ и при этом G(X;g) = χ2. 2) Основываясь на этом, показать, что γ-доверительным интервалом для g является любой интервал вида Δγ(Χ) = ( T2/g2, T2/gx), где gx < g2 находятся из условия (16.10), в котором fG — плотность распределения χ2(η). Центральный доверительный интервал имеет вид Δ*(Χ) = (Τ2/χ2χ+Ί)/2η, T2/x2x_y)/2i„). В частности, при γ = 0,95 и л = 5 имеем χ^.^,, =0,83, χ(21 + γ)/2,Λ =12,83. 223
3) Является ли интервал Δ* (X) кратчайшим среди всех интервалов Δγ(Χ)? УКАЗАНИЯ. 1) Воспользоваться тем, что случайные величины (Xj- #)/θ, / = 1,... ,лг, независимый нормальны Щ О, 1). 3) Решить задачу на условный минимум функции /(#,, g2) = g2/g\ при условии (16.10). Ответ: нет. 16.83. {Продолжение задачи 16.82.) Построить γ-доверительный интервал для среднеквадратического отклонения Θ, основываясь на центральной статистике (7(Х; Θ) = T/Q. Ответ: (T/Jxfr + γ)/2>ΙΙ , ТЦ%\Х _γ)/2)„ ). 16.84. {Продолжение задачи 16.82.) Показать, что центральный γ-доверительный интервал для дисперсии g = θ| общей нормальной модели 3V{QU Q2) (оба параметра неизвестны) по выборке объема η имеет вид Δγ (X) = (nS /χ(1 +y)/2tn- 1 > Λλ^ /Χ(1 -γ)/2,«- 1 )· УКАЗАНИЕ. Здесь центральная статистика (7(Χ; θ) ξ nS2/g = χΙ_χ и решение следует проводить по схеме задачи 16.82. 16.85. {Оценивание среднего нормального распределения при неизвестной дисперсии.) Рассматривается задача доверительного оценивания среднего θ2 общей нормальной модели q/V(0j, θ J ) по соответствующей выборке X = (Х15..., Хп). 1) Убедиться в том, что центральной статистикой в данном случае является G(X; θ,) ξξ (χ - θ,)^-!)/^2 и при этом G(X; 0!) = /„ _ ρ 2) Основываясь на этом, получить вид центрального γ-доверительного интервала: Δ*(Χ) = \Х + -j==t(l + y)/2)n_1j. В частности, при γ= 0,95 и η = 10 имеем Δ* (X) = {X + 0,754,5). 224
3) Доказать, что интервал Δ* (X) имеет кратчайшую длину среди всех γ-доверительных интервалов вида (X — axS, X + a2S). УКАЗАНИЯ. 1) Воспользоваться задачей 15.75, определением распределения Стьюдента и теоремой Фишера. 2) См. задачу 16.77. 3) Решение аналогично задаче 16.78. 16.86. Смоделировать выборку из распределения 3V(-\, 1) объема η = 20 и рассчитать по ней 0,95-доверительные интервалы для теоретических среднего и дисперсии в различных ситуациях (второй параметр считается либо известным, либо также неизвестным). 16.87. Наблюдавшиеся значения нормальной случайной величины в 16 опытах оказались следующими: 13,8; 11,9; 11,5; 10,6; 13,9; 12,8; 12,5; 13,1; 12,0; 13,5; 11,7; 12,4; 11,9; 12,4; 13,7; 13,5. Убедиться в том, что 0,95-доверительные интервалы для среднего и дисперсии, вычисленные по этим данным, равны соответственно (12,1; 13,1) и (0,5; 2,2). 16.88. (Задана сравнения двух средних) Пусть X = (Х{, ... ... , Хп) и Υ= (Υ{, ... , Ym) — две независимые выборки, причем первая— из распределения g7V(0(1), σ^), а вторая— из распределения g7V(9(2), σ|) (дисперсии σ^ и σ| известны). Построить доверительный интервал для разности τ = θ(1) — θ(2) неизвестных средних. 1) Показать, что разность выборочных средних X — Υ имеет распределение g7V(t, σ2), где σ2 = <з\/п + cj/m, следовательно, центральная статистика для τ имеет вид G(X, Υ; τ) = = (Х -Ϋ-τ)/ο. 2) Основываясь на этом, получить вид центрального γ-довери- тельного интервала для τ: Δ* (Χ, Υ) = (Χ — Υ + ссу). УКАЗАНИЯ. 1) Воспользоваться задачей 15.75. 2) См. задачу 16.77. 16.89. (Продолжение задачи 16.88.) Пусть дисперсии совокупностей одинаковы, но также неизвестны, т. е. X — выборка из распределения oJV(Q(l), Qj ), a Y— из (?V(6f2), θ|). По-прежнему оценивается τ = θ/1* — θ/2). 225
1) Убедиться в том, что в данном случае центральной статистикой является а(\ ν·τϊ= \тп{т + п-~Т) Χ-Υ-τ 1ПЛ, ϊ, τ) - j m + n [nS2(X) + mS2{Y)]\/2 и при этом G(X, Υ; τ) = tm + n _ 2. 2) Основываясь на этом, получить вид центрального γ-довери- тельного интервала для τ: Δγ(Χ> Υ) = \Х - У + ^(1+7)/2,/и + ^-2Х УКАЗАНИЯ. 1) При решении учесть, что случайная величина (X — Υ — τ)/ щ[ - + - 1 имеет стандартное нормальное распределение 07V(0, l),a (nS2(X) + mS2(Y))/e% = %2т + „_2, и эти две величины независимы; далее воспользоваться определением распределения Стьюдента. 2) Решение аналогично задаче 16.85. 16.90. В условиях задачи 16.89 для выборок объема η = 16 и т = 9 получены следующие значения выборочных средних и дисперсий: X = 12,57, S2(X) 0,85; Ρ = 11,87, 52(Y) = 0,84. 1) Убедиться в том, что 0,95-доверительный интервал для разности средних равен (-0,12; 1,53). 2) Считая, что эти данные — для выборок из одной и той же совокупности, вычислить оценки для среднего и дисперсии по объединенным данным (см. задачу 16.33) и построить соответствующие 0,95-доверительные интервалы. Ответ: (11,92; 12,72) — доверительный интервал для среднего, а (0,56; 1,82) —длядисперсии. 16.91. Смоделировать 20 стандартных нормальных случайных чисел и, образовав из них две выборки объема η = т = 10, выполнить для этих данных задание, аналогичное задаче 16.90. 16.92. {Задана сравнения дисперсий.) Предполагается, что выборки X = (Xl9... , Хп) и Υ = ( Υχ,... , Ym) извлечены из совокупностей 3V(Qn, Q\\ ) и οΑ/"(θ12, θ|2 )> соответственно (все параметры неизвестны). В этой ситуации построить доверительный интервал для отношения дисперсий τ = θ^ /Q\2 · 226
1) Убедиться в том, что центральная статистика здесь имеет вид G{X^X)- m(n-\)S\Y)/Z и при этом (?(Х, Υ; τ) =Fn_l>m_v 2) Основываясь на этом, получить вид центрального γ-довери- тельного интервала для τ: n{m-\)SHX) /г < (n-\)S2{Y) /Г(У+ ^2>"- 1>т ~ 1 т ( 1 т(п - 1)52(Υ) '*« + W>m- l>«- 1 У В ЧаСТНОСТИ, ^о5;9,9 = ^0,95; 9,9 = 3,18. УКАЗАНИЯ. 1) Учесть, что nS2(X)/Q\x = χ*.,, mS2(Y)/ej2 = = Хт - ι > и воспользоваться определением распределения Снедекора. 2) Решение аналогично задаче 16.82. 16.93. Используя таблицу 10 приложений, образовать две выборки объема η = т = 10 и рассчитать по этим данным 0,9-довери- тельный интервал для отношения теоретических дисперсий. 16.94. В двух лабораториях определялась концентрация серы (в %) в стандартном образце дизельного топлива. Шесть независимых равноточных измерений в первой лаборатории дали следующие результаты: 0,869, 0,874, 0,867, 0,875, 0,870, 0,869. В результате пяти аналогичных равноточных измерений во второй лаборатории были получены такие значения: 0,865, 0,870, 0,866, 0,871, 0,868. Предполагая справедливым нормальный закон ошибок измерений, построить 0,9-доверительный интервал для отношения дисперсий измерений в первой и второй лабораториях. Если есть основания считать эти дисперсии одинаковыми, то рассчитать аналогичный интервал для разности систематических ошибок, допускаемых в обеих лабораториях. 16.95. Убедиться в том, что γ-доверительный интервал для параметра θ модели g7V(6, θ2) (θ > 0 — неизвестно) по выборке X = = (Хх, ... , Хп) имеет вид (Х/(\ + cy/Jn ), X/(\ - cy/Jn )). Получить аналогичное решение для случая θ < 0. УКАЗАНИЕ. Воспользоваться задачей 15.75. Для удобства результаты по доверительному оцениванию параметров нормальных моделей сведены в итоговую таблицу. 227
Центральная статистика и ее распределение эЯ льны сх 4 w Центральный γ интервал Что енивается о J3 Мод( /-—ч *~* о ф4 | 1^ Г ф4 U ^ ё Ι ζ ι 4 ι II φ δ " 1+ О, 1* II Е-Г κ Ι* II φ φ- Ι δ 1* и и ί"4 (-ir) φ" (Ν (Ν φ II (Ν φ >< δ' ГЧ Ι ϊ S г & Ι "Ρ -Η :■ ^ II ίΝ Εν" φ 05 5 & ω с ο 5 (Ν Φ q ^ ι <"4fN φ ^0 Д Φ Ι -Η rs3 <Ν II (Ν Φ 1 <ΝίΝ Φ ^ ο4 Τ»4 Ι 1^ ι 'is II 'Ρ χ ΰ Ί£Ίδ ΊδΓ4« II b if 1+ lis I ι* II (Ν ё Я ST ι» Й φ <Ν χ Ι /-ν ^* fN I s: + + + со II " ^ lis U >3 + >3 _S£ χ η \ χ — > 1 Ι <Ν^ ς CO + ε ΐ * с со lis I II + ι 1 + _£ X s — It 8 ®~ i!. 0. Си φ g, φ" S "if со 1 1 ^7 ^ Со tt ι ι s: -Η «Ν "^ >< to I II со 1 δ (Ν κ ι )S s ^ 0) g ей s φ s φ iH φ φ I αΓ <N φ" ? I II Ιί>Ν 1^ I — is: II s CO — is: II 1^ II II X -С и го τ s о. -Ιδ 228
Разные задачи Для нахождения доверительных границ Тх < Т2 для параметра θ в схеме Бернулли Bi( 1, θ) по η наблюдениям Х{,..., Хп используют таблицы неполной бета-функции β(ζ; а, Ь) в [ 1] (см. задачу 15.30). При этом центральный γ-доверительный интервал (Т{, Т2) определяется соотношениями Γι=ζ("Τ^;ν"'"~ν"+1) Γ2=1-^-^;"-ν„,ν„ +l), где z(p,a,b) — ρ -квантиль функции β (ζ\ a, b), т. е. решение уравнения β(ζ; а, Ь) = р, a vw = Хх + ... + Хп — наблюдавшееся число «успехов». В частности, z(0,025; 5,10) = 0,13, z(0,025; 9,6) = 0,35. Таблица некоторых значений 0,95-доверительных границ (Тх, Т2) приведена в таблице 8 приложений. 16.96. (Оценивание параметра схемы Бернулли.) Из урны, содержащей черные и белые шары в неизвестной пропорции, по схеме случайного выбора с возвращением извлечено η = 14 шаров, среди которых оказалось νη = 5 черных. Убедиться в том, что 0,95-доверительный интервал для доли черных шаров по этим данным имеет вид (0,13; 0,65). Определить аналогичный интервал для данных η = 20,νη = 9. Ответ: (0,23; 0,69). 16.97. (Оценивание параметра распределения Пуассона) ПустьХ= (Хх,..., Хп) — выборка из распределения Пуассона Π(θ); тогда центральный γ-доверительный интервал (Тх, Т2) для θ определяется соотношениями 1 ~ 2Й fyl -у)/2,2пХ ' 2_ 2Й ^(1 +у)/2,2пХ + 2 ' 1) Для двух компьютеров число сбоев за сутки оказалось равным соответственно 2 и 3. Считая, что число ξ сбоев за сутки в работе компьютера имеет некоторое распределение Пуассона Π(θ), получить, что 0,95-доверительный интервал для θ по этим данным имеет вид (0,81; 5,83). 2) При стендовых испытаниях пяти приборов зафиксированы следующие количества неисправностей: (0, 2, 1,0, 1). Считая количество неисправностей для каждого прибора в течение испытаний распределенным по закону Π(θ), получить, что 0,9-доверительный интервал для θ в данном случае имеет вид (0,27; 1,83). 229
16.98. Пусть Χ = (Х}9..., Χη) — выборка из экспоненциального распределения с плотностью f{x\ θ) = е9_ЛГ, χ > θ. Показать, что γ-доверительным интервалом для неизвестного параметра θ является интервал ( Х^Х) + - In (1 — γ), Χ^Χ) 1. Какой вид имеет здесь центральный γ-доверительный интервал? РЕШЕНИЕ. Согласно задаче 15.33, случайная величина С?(Х; Θ) = = η (^f(i) — θ) имеет стандартное показательное распределение F0i l9 т. е. является центральной статистикой в данной задаче. Отсюда получаем, что при / = -In (1 - γ) Р{0 < п(Х(1) - θ) < t) = 1 - е-' = γ. Решая неравенства под знаком вероятности относительно Θ, приходим к указанному результату. Чтобы получить вид центрального γ-доверительного интервала, исходим из соотношения P{gl<n(X{l)-Q)<g2)=y, где, в силу (16.11), 1 — е"^1 = (1 — γ)/2, t~gl = (1 — γ)/2. Отсюда следует, что искомый интервал имеет вид (*(1) + ±1η^,ΛΓ(1)+£ΐη^). 16.99. Имеется выборка X = (Х{, ... , Хп) из показательного распределения Γ(θ, 1) (см. задачу 16.74). 1) Учитывая, что 2Xt/Q = χ\ и, следовательно, 2nX/Q = %jn, построить центральный γ-доверительный интервал (Т}, Т2) для Θ. 2) Смоделировать выборку объема η = 10 при θ = 1 (см. задачу 15.12) и рассчитать по полученным данным 0,95-доверитель- ный интервал для Θ. Ответ: Tu2 = 2nX/xfi±y)/2)2n. 16.100. Пусть X = (Х{,... , Хп) и Υ = (Yl9 ... ,Ym)— две независимые выборки из показательных распределений Γ(θ1? 1) и Γ(θ2, 1) соответственно. 1) Доказать, что центральный γ-доверительный интервал для отношения τ = θ2/θ, имеет вцд (F(l_yy2f2nt2m?/X уГ{]+у)/22пЛт?/Х). 230
2) Смоделировать выборки X и Υ при η = т = 5, θχ = 1, θ2 = 2 и рассчитать по полученным данным 0,9-доверительный интервал длят. УКАЗАНИЕ. Воспользоваться задачей 16.99 и определением распределения Снедекора; решение аналогично задаче 16.92. 16.101. Убедиться, что (Х{п), Х{п)/(1 — γ)1/ΛΙ) есть γ-довери- тельный интервал для параметра θ равномерного распределения R(О, Θ) по выборке объема п. Какой вид имеет здесь центральный γ-доверительный интервал? Смоделировать выборку объема η = 10 при θ = 2 (см. задачу 15.14) и рассчитать по полученным данным 0,95-доверительный интервал для Θ. УКАЗАНИЕ. Так как АуЭ имеет распределение R (0,1), то при t е [0,1 ] p{xin)fi<t} = p»(xl/e<t} = t», т. е. ^(/ι)/θ является здесь центральной статистикой. Ответ: центральный интервал (^„Д—^ ) п ,Χ(η)ί^-^ ] п ]. 16.102. {Прогнозирование будущих наблюдений.) Пусть п, X, S2 — соответственно объем, выборочные среднее и дисперсия выборки из нормального распределения 3\ί(θΐ9 θ|) (оба параметра неизвестны). Доказать, что с вероятностью γ результат следующего, (п + 1)-го испытания Хп + 1 попадет в следующий интервал: [Χ Τ f(1 + 7)/2j„_ {Sj(n+l)/(n-l) у УКАЗАНИЕ. Установить сначала, что случайная величина X — Хп + ] распределена по закону όΛ/Ί0, Θ^ ]; воспользоваться теоремой Фишера и определением распределения Стьюдента. 16.103. (Продолжение задачи 16.102.) В результате пяти независимых взвешиваний одного и того же тела получены следующие результаты (в граммах): 4,12; 3,92; 4,55; 4,04; 4,35. Считая погрешности измерений нормальными случайными величинами, показать, что 0,95-доверительный интервал для результата шестого взвешивания имеет вид (3,43; 4,96). 231
16.104. {Оценивание квантилей.) ПустьХ= (Хх, ... ,Хп) — выборка из некоторого непрерывного распределения F(x). Построить доверительный интервал для/? -квантили ζρ при заданном ре (О, 1). Основываясь на задаче 15.30, убедиться в том, что: 1) порядковая статистика Х^к) является нижней γι-доверительной границей, гдеух = β(/?; к,п — к + 1); 2) порядковая статистика Х^ является верхней γ2-доверительной границей, где γ2 = 1 - β(/>; Ι, η - I + 1); 3) интервал {Х(к), ^(/)К к < I, является двусторонним γ-доверительным интервалом для ζρ при γ = ух + γ2 — 1. УКАЗАНИЕ. Использовать соотношение Ρ{Χ(,)<ζρ<Χ(ί)}=1-Ρ{ζρ<Χ(βζ)}-Ρ{Χυ)<ζρΙ Приближенные доверительные интервалы для больших выборок В ряде случаев, когда имеется состоятельная и асимптотически нормальная оценка Тп = ^(Х) для параметра θ (например, оценка Л максимального правдоподобия θ„), можно построить приближенный (при больших объемах выборки п) доверительный интервал. Асимптотически эффективные оценки порождают при этом асимптотически кратчайшие интервалы. Если оценка Тп асимптотически нормальна с параметрами (θ, σ2(θ)/«), причем функция σ(θ) непрерывна, то асимптотическим γ-доверительным интервалом для параметра θ является интервал (Тп + cyc(Tn)/Jn). В частности, если Тп = ΘΛ, то (см. § 16.3) получим асимптотически кратчайший γ-доверительный интервал (θ„ + cy/Jni(Qn)), порождаемый оценкой максимального правдоподобия. Более того, если^(б) — непрерывно дифференцируемая функция иg'(Q) *0, то {gn +cyg'(Qn)/A]ni(Qn)) — аналогичный интервал для#(6). 16.105. Пусть X = (Х}, ... , Хп) — выборка из нормального распределения 3V(a,Q2) (а известно). Построить при больших η приближенные доверительные интервалы для параметра θ и параметрической функции g(θ) = In θ. 232
РЕШЕНИЕ. Оценка максимального правдоподобия θ„ = JYn и функция информации /(θ) = 2/Θ2 (см. задачу 16.40). Отсюда находим, что асимптотический γ-доверительный интервал для θ имеет вид JT~n (1 + cy/*fln ), а аналогичный интервал для g(Q) = In θ — вид [ у In Tn + су/ Jin J. Из последнего интервала можно получить новый доверительный интервал для Θ. Именно, решая относительно θ неравенства }inr.-£<in.<'l»7-. + £. находим, что они эквивалентны неравенствам jTn exp {-cy/j2n } < θ < Jfn exp {cy/JTn }, т. е. получаем другую форму приближенного доверительного интервала для Θ. Однако, так как при η -* оо ехр{с/72М=1 + -^= +0(1//ι), то, пренебрегая членами порядка \/п, приходим к первоначальному интервалу JTn (1 + су/ Дп ). 16.106. {Оценивание параметра схемы Бернулли.) Построить асимптотический γ-доверительный интервал для параметра θ в схеме Бернулли 2?/(1, θ). Применить этот результат к оцениванию теоретической функции распределения F(x) в заданной точке х0, в которой 0 < F(x0) < 1. РЕШЕНИЕ. Используя задачи 16.41 и 16.34 имеем, что в данном А — J случае Qn = X и/(θ) = ft . _ ft , поэтому искомый интервал имеет вид (X +cyJX(\ — Х)/п ). Далее, если Х= (Х{9..., Хп) — выборка из распределения F(x), то индикаторы I(Xt<x^ ),/ = 1, ...,/?, имеют распре- А деление Bi{ 1, F(x0)), а их среднее арифметическое есть Fп (х0) — значение эмпирической функции распределения в точке х0. Поэтому асимптотический γ-доверительный интервал для F(xQ) имеет вид (Ря{х0) Тсу Jf„(x0)(1 - Fn(xQ))/n "J. 233
ЗАМЕЧАНИЕ. Имеет место гораздо более сильный результат: есль F(x) непрерывна, то при η —* °° и любом γ е (0, 1) P{Fn (х) - ty/Jn < F(x) < Fn (χ) + tjjn для всех χ) — γ, где ty определяется соотношением K(L) = у9в котором K(t)= Σ (-1Уе-2>2/2. При этом предельную функцию распределения Колмогорове K{t) можно использовать для практических расчетов уже при η > 20 тогда, например, t09 = 1,23, /0 95 = 1,36, tQ99 = 1,63. Таким образом, при больших η график теоретической функцщ распределения F{x) с вероятностью, близкой к γ, заключен пределам max (0, Fn(x) - ty/Jn) < F(x) < min (1, Fn(x) + ty/Jn), которьк образуют асимптотическую у-доверительную зону для F(x). 16.107. {Продолжение задачи 16.106.) 1) Показать, что и: теоремы Муавра — Лапласа следует другая форма асимптотического γ-доверительного интервала для θ: (r1)r2) = ^ + | + ^f(i-J) + fi)/(i + ^) который сводится к предыдущему результату, если пренебречь членами порядка 1/п. УКАЗАНИЕ. Установить равенство P{J~n\X ~ θ|/νθ(1-θ) < су) = ?{Т{ < θ < Г2}. 2) Используя задачу 16.63, установить вид асимптотического γ-дове- рительного интервала для функции ^(θ) = arcsinVO: (g(X) 4 + cy/{ljn)). Получить отсюда вид приближенного γ-доверительногс интервала для параметра θ и сравнить это решение с предыдущими. 16.108. Рассчитать асимптотические 0,99-доверительные интервалы (различные варианты, указанные в задачах 16.106 и 16.101 для неизвестных вероятностей «успеха» по данным, приведенным ι задачах 15.41 и 15.42). 16.109. При 540 испытаниях в схеме Бернулли положительны? результат наблюдался 216 раз. Рассчитать 0,99-доверительный интервал для дисперсии числа положительных исходов. У КАЗАН И Ε Использовать задачу 16.106 и асимптотическую теорию. 234
16.110. {Оценивание параметра распределения Пуассона.] Пусть X = (Х{у..., Хп) — выборка из распределения Пуассона Π(θ). Для быстрого расчета приближенных значений границ Тх и Т> при больших объемах выборки η можно воспользоваться асимптотической теорией оценок максимального правдоподобия (здесь ι А силу задачи 16.42 θ„ = X). Убедиться в том, что асимптотические γ-доверительный интервал для θ имеет в данном случае следующие вид: (Х+с^Х/п). УКАЗАНИЕ. Использовать задачу 16.64. 16.111. (Продолжение задачи 16.110.) Установить, что асимптотический γ-доверительный интервал для функции g(Q) = 7θ имеет вид [ Jx + —η= J. Получить отсюда приближенный γ-дове- рительный интервал для θ и сравнить его с указанным в предыдущей задаче. 16.112. По данным, полученным в задаче 15.47, рассчитат! асимптотический 0,95-доверительный интервал для параметра распределения Пуассона. 16.113. Основываясь на результатах задачи 16.44, показать, чтс асимптотический γ-доверительный интервал для параметра θ гео- ( Χ - \ ϊ Λ метрического распределения имеет вид = + cv =-* . VI +Х Цп{\+Х)Ч 16.114. Построить асимптотический γ-доверительный интервал для неизвестного параметра масштаба θ гамма-распределения Γ(θ, λ; (см. задачу 16.74). УКАЗАНИЕ. Сначала установить, что здесь оценка максимального А правдоподобия θ„ = Χ/λ и /(θ) = λ/θ2. Ответ: λ~ιΧ(1 + cy/JXn ). 16.115. (Продолжение задачи 16.114.) Построить асимптотический γ-доверительный интервал для функции^(θ) = In θ, получить отсюда другой вариант приближенного доверительного интервала для Θ: (X-lXt~cy/jrn, X-lXtcy/jr" ) и сравнить это решение с предыдущим. 235
16.116. {Оценивание коэффициента корреляции.) Если (Хп, Xi2)> / = 1, ...,/?, — независимые наблюдения над двумерной нормальной случайной величиной ξ = (ξ1? ξ2) ирл- выборочный коэффициент корреляции (см. § 15.6), то уже для небольших значений числа наблюдений η статистика Zn = ~ In ((1 + р„)/(1 — рп)) распределена приблизительно нормально со следующими параметрами: ζ = 2 1ηχ((1 + ρ)/(1 -ρ)) и (п - З)-1, где ρ = согг (ξ„ ξ2). Получить отсюда вид приближенного γ-доверительного интервала для ζ: (Ζη + с7/л/« — 3 ), а из него — для самого коэффициента корреляции р. Рассчитать приближенный 0,99-доверительный интервал для ρ по данным, полученным в задачах 15.80 и 15.81. 16.117. (Доверительные интервалы для теоретических моментов.) Пусть X = (Х{, ... , Хп) — независимые наблюдения над случайной величиной ξ с неизвестным распределением, дисперсия которой конечна. Основываясь на задаче 15.77, доказать, что при больших η статистика Тп = Jn —-^— , где а = Μξ, асимптотически нормальна g7V(0, 1), и получить отсюда вид асимптотического γ-доверительного интервала для неизвестного среднего а: (X + CyS/Jn). Обобщить этот результат на случай оценивания момента ak = Μξ*. УКАЗАНИЕ. Применить приведенный в задаче 15.77 результат к функции φ (xvx2) = (xx-a)/Jx2-x}. Ответ: если Μξ2* < °°, то асимптотический g-доверительный интервал для ак имеет вид (α^. + cyJ(a2k - Щ)/п ).
СТАТИСТИЧЕСКАЯ <4j\ ПРОВЕРКА ГИПОТЕЗ \у Глава Постановка задачи В практических задачах часто требуется по эмпирическим данным проверить то или иное предположение относительно каких-нибудь свойств закона распределения наблюдаемых случайных величин. Например: 1) проверить, что выборочные данные получены из генеральной совокупности с функцией распределения F(x); 2) установить по выборке, имеет ли некоторый параметр распределения θ определенное значение или множество значений; 3) по двум полученным при различных условиях выборкам установить, соответствуют они одному и тому же распределению или нет. Все эти предположения о виде или свойствах распределения наблюдаемых случайных величин называют статистическими гипотезами, или просто гипотезами, которые обозначаются Н, Н0, Нх,.... 1. Если предположение однозначно фиксирует закон распределения случайной величины, то соответствующая гипотеза называется простой, в противном случае гипотеза называется сложной. Пусть, например, случайная величина ξ распределена по нормальному закону oJ\f(a,G2). Предположим, что дисперсия σ2 известна, а математическое ожидание а неизвестно. Тогда: 1) гипотеза Н0: {а = а0} — простая; 2) гипотеза Н0: {а > а0} (или Н0: {а < а0}) — сложная односторонняя гипотеза; 3) гипотеза Н0: {а0< а < ах) — сложная двусторонняя гипотеза. Предположим, что математическое ожидание и дисперсия неизвестны. В этом случае гипотеза Н0: {а = а0} — сложная, поскольку дисперсия неизвестна и, следовательно, закон распределения случайной величины не фиксирован однозначно. Если закон распределения известен с точностью до некоторого параметра θ (θ может быть и вектором), то всякое предположение о значении параметра называется параметрической гипотезой. В приведенных выше примерах все гипотезы Н0 — параметрические. 237
2. Рассмотрим случайную величину ξ и случайную выборку Х= (Х]9 ... , Хп), полученную в результате η независимых испытаний над ней. Требуется проверить некоторую гипотезу Н0 о законе распределения ξ. Будем говорить, что задан некоторый статистический критерий для проверки гипотезы Н0, если сформулировано правило, согласно которому принимается решение: согласуются ли наблюдаемые значения с гипотезой {обычно ее называют основной, или нулевой гипотезой) или она должна быть отвергнута, как противоречащая статистическим данным. Для построения критерия выборочное пространство % обычно разбивают на два непересекающихся множества R и S таких, что все значения выборки X, принадлежащие множеству R, считаются характерными для гипотезы Н0, а принадлежащие множеству S — нехарактерными. В соответствии с этим гипотеза HQ принимается, если конкретная реализация выборки принадлежит R, и отвергается, если она принадлежит S. Таким образом, критерий можно определить с помощью множества S (множество R однозначно определяется как дополнительное к S множество в выборочном пространстве X). Множество S называется критическим множеством, а статистический критерий, получаемый с помощью этого множества, — S-критерием. 3. Для каждого критерия возможны ошибки первого и второго рода. 1) Гипотеза Щ справедлива, но она отвергнута (реализация выборки X принадлежит множеству S); такая ошибка называется ошибкой первого рода. Вероятность ошибки первого рода обозначают а. (Говорят: ошибка первого рода равна а.) По определению а = = Ря {X е S}. Ошибку первого рода выбирают обычно равной 0,01; 0,05; 0,1 и т. д. 2) Гипотеза Н0 ложная, но она принята (реализация выборки X принадлежит множеству R). Такая ошибка называется ошибкой второго рода. Вероятность ошибки второго рода обозначают β. (Говорят: ошибка второго рода равна β.) Ошибку второго рода можно вычислить, если известно, какое распределение выборки в этом случае истинно. Критическое множество S критерия, обеспечивающее заданное значение ошибки первого рода а, можно выбрать многими способами. Эффективный ее выбор имеет место в том случае, когда задана конкурирующая или альтернативная гипотеза Нх. Будем называть любое допустимое распределение Fx = F выборки X, отличающееся от гипоте- 238
тического (т. е. от распределения при гипотезе Н0), альтернативным распределением или альтернативой. Совокупность всех альтернатив называется альтернативной гипотезой Нх. Таким образом, Нх также может быть простой или сложной гипотезой. Пусть F е Нх — некоторая альтернативная функция распределения. Мощностью критерия при альтернативе F называется вероятность попадания выборочной точки X в критическую область S, когда истинным распределением является распределение F: JV(F)=F{Xe S\F]. Эта величина характеризует вероятность принятия правильного решения (отклонение HQ) в ситуациях, когда Н0 ложна. Из двух критериев с одной и той же ошибкой первого рода α лучшим считается тот, мощность которого при альтернативах больше. В случае, когда альтернативная гипотеза Нх простая, функция мощности и ошибка второго рода β связаны следующим очевидным соотношением: И^= 1 — β и можно говорить об одной характеристике критерия: Wvum β. Обычно «последствия» рассмотренных ошибок неравнозначны. Что «опаснее» — зависит от конкретной постановки задачи и содержания основной гипотезы. Например, на предприятии необходимо оценить качество продукции по результатам выборочного контроля (т. е. по данным сравнительно небольшой выборки). Если выборочная доля брака не превышает некоторой нормативной величины р0, то вся партия принимается. В этом случае на основе выборки проверяется основная гипотеза Н0 о том, что доля брака в продукции не превосходит р0, и ошибка первого рода α означает, что будет забракована качественная продукция. Альтернативная гипотеза Нх состоит в том, что доля брака продукции составляет величину, большую р0, и ошибка второго рода β означает приемку негодной продукции. Что хуже или лучше и какие в этом случае возможно допускать ошибки α и β, — следует решать специалисту. Поскольку исключить ошибки α и β невозможно, следует стремиться минимизировать потери от этих ошибок. Конечно, желательно уменьшить α и β одновременно, но, как будет показано далее, уменьшение одной из них, как правило, влечет увеличение другой. В большинстве случаев одновременное уменьшение α и β заключается в увеличении объема выборки п. В том случае, когда HQ — сложная гипотеза, вероятность ошибки первого рода, вообще говоря, не определяется. Однако если рас- 239
сматривать Н0 как множество простых гипотез /г, то для каждой из них можно вычислить вероятность попадания выборки X в критическое множество S. В этом случае величина α = sup РЛ{Х е S} играет Ле//0 ту же роль, что и вероятность ошибки первого рода в случае простой гипотезы. Ее называют уровнем значимости или размером критерия. 17.1. Пусть абсолютно-непрерывная случайная величина ξ имеет плотность распределения, сосредоточенную при гипотезе Н0 на отрезке [0, 1], а при гипотезе Нх — на отрезке [1, 2]. Очевидный критерий при одном испытании (п = 1) с критическим множеством S = [1,2] имеет ошибки α и β, равные нулю. 17.2. Пусть случайная величина ξ при гипотезе Н0 имеет распределение [ ), а при гипотезе Нх — распределение | |, \р0р{ ) \д{ д2 J Ро>Р\> 4\> Яг > 0; Ро +РХ = q] + q2=\. 1) Зададим критерий (критическую область S для проверки основной гипотезы Н0 против альтернативы Нх) следующим образом: S = {X: BceJf, > 1, / = 1,... , η}. Тогда a=PHo{XeS}=(l-p0)» = p>{, β = Ря {X е R} = FH {хотя бы одно из Xi равно 0} = 0. 2) Зададим критерий по-другому: S = {X: хотя бы одно из Xi равно 2}. Тогда а=РЯо{Х€^} = 0, β=Ρ//ι{ΧΕ R}=PH[ {все;Г;<2,/=1,...,«} = ??. Наиболее мощный критерий Рассмотрим построение наиболее мощного критерия для различения двух простых гипотез. Пусть X = (ХХ9 ... уХп) — выборка, произведенная над случайной величиной ξ, χ = (xl9 ... , χη) — ее конкретная реализация при испытаниях. Требуется различить две простые гипотезы Н0 и Нх, согласно которым ξ абсолютно непрерывно распределена и имеет соответственно плотности распределения/^ (х) и/, (х). 240
В условиях гипотезы Н0 Ч(Х)= П/о(Х/)· (17-1) Для гипотезы Нх имеем Ря, (Х)= П/1(Ху)· (17.2) Рассмотрим отношение двух я -мерных плотностей Ря,(х> £w /(Х) = РЛХ)= а * (17'3) 0 П/о(Ху) Это отношение позволяет разбивать выборочное пространство % на два подмножества R и S. Если величина /(X) «велика», то следует отнести X к множеству S— множеству отвержения гипотезы Н0 (и принятия Нх), если же эта величина «мала», то нужно X отнести к множеству R — множеству принятия Н0 (и отвержения Нх). Теорема Неймана — Пирсона. Наиболее мощный критерий для проверки простой гипотезы Щ при простой альтернативе Н] с вероятностью ошибки первого рода а существует и задается критической областью г n/i(Xy) , S= Х:/(Х) = С-1 >с\, (17.4) 1 П/о(Х;) J где критическая граница с определяется из условия Рщ(1(Х)>с)=а. Статистика /(X) называется статистикой отношения правдоподобия, а построенный критерий — критерием Неймана — Пирсона. Критерий Неймана — Пирсона можно построить и для дискретных распределений. В этом случае отношение правдоподобия определяется отношением вероятностей Ря (X) и Ря (X) при гипотезах/^ и Нх\ /(Х) = У=1 ПРя.СХу) ПВД) 241
Критерий имеет вид, определяемый критическим множеством (17.4), и с по-прежнему определяется из условия (17.5), но в отличие от абсолютно-непрерывного случая уравнение (17.5) может не иметь решения. В этом случае часто добиваются решения этого уравнения за счет несущественного с практической точки зрения изменения величины а. Наиболее мощный критерий для проверки гипотез о параметрах нормального и биномиального распределений 17.3. Пусть X = (Xv ..., Хп) — выборка из нормальной совокупности, дисперсия которой известна и равна σ2, а математическое ожидание θ неизвестно. Относительно θ выдвигаются две простые гипотезы: Н0: Q = %nHl:Q = Qv Для определенности предполагаем, что 0J > θ0. Требуется: а) построить наиболее мощный критерий с ошибкой первого рода α и найти ошибку второго рода β; б) при заданных значениях α и β найти минимальный объем необходимого материала η* = я (α, β) для того, чтобы ошибочные заключения могли быть сделаны с вероятностями, не большими, чем α и β; в) вычислить ошибку второго рода β по выборке объема η = 25 при значениях σ2 = 25, θ0 = 0, при альтернативах 9j = 1, 9j = 5. Ошибку первого рода α взять равной 0,05; г) пусть σ2 = 1, 90 = 0, 9t = 1, α = 0,05. Сколько необходимо произвести наблюдений, чтобы ошибка второго рода β не превосходила 0,1? РЕШЕНИЕ: а) Критическая область критерия (17.4) имеет вид ( 1 Υ ί £(*;-θ,)21 /(Χ) = > с или /(X)=exp{W-£i^_^(e?-eo2)}>c, где Χ — выборочное среднее. 242
Логарифмируя обе части неравенства, перенося в правую часть все ее элементы, кроме X, и учитывая при этом, что 9j > θ0, приходим к следующему эквивалентному неравенству: Х>с19 гДес, = 2(е0 + е1) + ^—^. Таким образом, критерий Неймана — Пирсона в данном случае свелся к подсчету значений статистики X, называемой статистикой критерия, и проверке одностороннего неравенства X > с{9 где сх — критическая граница, определяемая через ошибку первого рода а. Найдем теперь с j и β по заданной ошибке а. Как известно, среднее X распределено нормально с параметрами (θ0, с2/η) при гипотезе Н0. Поэтому <х = Ря (X >сх) = Ря =- > ■=- = 1 -Ф . яо * Μ c/Jn с/Л ) V σ ) Если, как обычно, обозначить через иа корень уравнения Ф(иа) = а, то Wi_ = с1 ~ θ0 Γ Μ-а Отсюда находим критическую границу сх через значение а: Cl = %+-^-. (17.6) Заметим, что сх зависит от θ0, но не зависит от θ^ Учитывая, что случайная величина X в предположении справедливости гипотезы Нх распределена по нормальному закону с параметрами (θρ с2/η), для вероятности ошибки второго рода β получаем P(«.(,).p»i(J<c1).p,l(^!<^!). б) Из (17.7) видно, что с ростом η ошибка второго рода монотонно убывает, поскольку θ0 < Qy. Очевидно, что минимальное число 243
η* = η (α, β) необходимых испытаний для того, чтобы ошибки первого и второго рода могли не превышать фиксированных значений α и β, есть наименьшее из тех п, для которых β (α, η) < β. Таким образом, для нахождения п* по α и β имеем два уравнения /θ0-θι г- \ Отсюда θο_ θι г , или, поскольку «j _ a = —wa, = σ2(ι/α + wp) Я (θο-θ,)2 · Так как я — целое, то искомое решение имеет вид -σ2(ι/α + κρ) л = (θ0-θ,)2 + 1. (17.8) Здесь [х] — целая частьх. в) При Θ^Ι, β = θί725^ί + 1,6451 = 0,741. ΠρΗθ, = 5, β = φΓ725^^ +1,6451 = 0,001. Из приведенных данных видно, насколько существенно разнятся ошибки β при удалении 0j от θ0. г) л* = 9. 17.4. Пусть выборка X = (Х{,... ,Хп) производится из распределения 3\ί(α, θ2), где математическое ожидание а известно, а дисперсия Θ2 — неизвестный параметр. Проверить простую гипотезу Н0: Θ2 = θ^ против альтернативной простой гипотезы Нх\ θ2 = θ^, при этом Θ? > Ц. РЕШЕНИЕ. Критическое множество критерия Неймана — Пирсона имеет вид Н-Д-isri 244
что эквивалентно η rXj — a \2 Известно, что если гипотеза Н0 верна, то Σ I -^ъ— распределена по закону %2(я)-хи-квадрат с η степенями свободы. Поэтому сх определяется из уравнения а=Ч(,|(^)2>с1) = 1-^(с1), (17.9) где Кп{х) — функция распределения %2(п). Отсюда получаем Ci = X?-«;„, (17-10) т. е. с, равна (1 - а) — квантили распределения χ2(η). Вероятность ошибки второго рода β равна ",-'».(Д№)'<с0-р'.и(тг/< <сщ ]=^4-θγ гм—вг" > (17л[) 17.5. Рассмотрим схему Бернулли с числом испытаний л и неизвестной вероятностью успеха Θ, о значении которой имеются две простые гипотезы: Н0: θ = θ0 и Ηλ\ θ = θρ где Gj > θ0. Здесь для любой выборки X = (Xl9..., Хп) (Xj — число успехов в /*-м испытании, /=1,...,л) Ря.(Х) = 6/М1-0/)"-^ / = 0,1, где Λ = Λ (Χ) = ΣΧ- общее число успехов, а ПХ) Θί(1-Θ0)»-Α Ιθοίΐ-Θ,) J U-θο J " Функция φ(0) = θ/( 1 - θ) на интервале (0, 1) возрастает, поэтому при 0! > θ0 φ(&ι)/φ(%) > 1 и неравенство /(X) > с эквивалентно неравенству h > с', где 1-θ0 1ПС + wln-j 5- [ ~U1 6ι(1-θ0) · θο(Ι-θ,) 245 с =
Постоянная с' определяется из условия Pffo(h>c')=Oi, которое можно представить в следующем виде: Σ с/вД(1-в0)"-; = а. (17.12) Как уже отмечалось, нахождение границы с' из уравнения (17.12), являющейся по смыслу задачи целой величиной, как правило, невозможно. В этом случае, как уже отмечалось, или несколько «подправляют» а, увеличивая или уменьшая ее значение, или же прибегают к процедуре рандомизации, если значение h попадает на границу критической области. Если предположить гипотезу Н0 истинной, а п достаточно большой величиной, то случайная величина ft, согласно теореме Муавра — Лапласа, приближенно распределена по нормальному закону и, следовательно, уравнение для с' можно записать в следующем виде: / h - rid* с'- я9п \ а=Ря (h>c') = PH | , э > ° U Я° ΜΑ/«θη(1-θ„) JnMl-%)) Отсюда получаем с'- /ιθ0 Μ,(1-θ0) \JnQn(l-Qn) ) c' = n% + uJn%(\-Q0). (17.13) Ошибка второго рода β в этом случае равна β= Σ CiejrU-Gj)*-?. (17.14) 17.6. По выборке Χ = (Χν... , Хп) из пуассоновского распределения Π(θ) построить критерий Неймана — Пирсона для проверки гипотезы Н0: θ = θ0 против альтернативы Н{. θ = Qx (0 < θ0 < θ,). Ответ: /(Χ) = ί ^ J e"(9°~ei) критическая граница с = с(а) находится из уравнения Σ e_weo K—*f- = α, β = Σ e-"6» -^j-. m=[cj-\ m\ K m=Q ml 17.7. (Продолжение задачи 17.6.) Исследовать асимптотическое поведение характеристик критерия при больших объемах вы- 246
борки {η —► оо) и при «близких» гипотезах: θ{ = θ0 + a/Jn, a > 0 — константа. УКАЗАНИЕ. Использовать нормальную аппроксимацию для пуас- соновского распределения: если величина ξ имеет распределение Пуассона с Μξ = λ, то lim р]Ц^<х1 = Ф(х), -οο<χ<οο. λ->°ο [ л/λ J Таким образом, можно считать, что при больших λ величина ξ имеет приближенно нормальное распределение с Μξ = λ и Ώξ = λ. Ответ: S = {X: Χ >с}, гдес = θ0 + u{_aJ%/ii, limP(«)=o(Wl_a--^} 17.8. По результатам одного наблюдения Хх(п = 1) построить наиболее мощный критерий для проверки гипотезы Н0:/(х) = 1 на отрезке [0, 1] против альтернативы Hx\f{x) =e*/(e— 1) на этом же отрезке [0, 1]. Ответ: а= РЯо (Х{ > са), са=1-а, β = (е1""- 1)/(е- 1). 17.9. В последовательности независимых испытаний вероятности положительных исходов одинаковы и равны р. Построить критерий проверки гипотезы/? = 0 против альтернативы/? > 0 и определить наименьший объем выборки, при котором вероятность ошибок первого и второго рода не превышает 0,01. Ответ: S = {Тп > 0}, Тп— число положительных исходов в η испытаниях; a = 0, β = (0,99)", η > 454. 17.10. Пусть для распределения Коши Α^(θ) (см. задачу 16.24) проверяется гипотеза Н0: θ = 0 против альтернативы Нх\ θ = 1. Построить по одному наблюдению (п = 1) критерий отношения правдоподобия: S = {X: /(X) > с}. Найти в явном виде критическую область S и ошибки α и β в случае: а) с = 1; б) с = 2. Ответ: а) S = \хх > j L a = ^ - - arctg ^, β = -^ - 1 , 1 --arctg- 6)5=(1<^,<3}, α=^ (arctg3-arctgl), β=1-^ arctg2. 247
Сложные гипотезы Случай, когда основная и альтернативная гипотезы простые, встречается сравнительно редко. Чаще обе гипотезы (или одна из них). сложные. Рассмотрим наиболее часто встречающуюся ситуацию, когда обе гипотезы параметрические, при этом основная гипотеза Н0 — простая: θ = θ0, а альтернатива Нх — сложная: Н{:ве Θ у где Θχ — некоторое множество возможных значений θ, не содержащее точку θ0. В соответствии с леммой Неймана — Пирсона, для каждой пары точек (θ0, θ{), 9j e 0l5 можно построить наиболее мощный критерий для проверки гипотезы θ = θ0 против альтернативы θ = θι при ι фиксированной вероятности ошибки первого рода а. Если все эти ι наиболее мощные критерии будут обладать одним и тем же критическим множеством S, то это означает, что критерий S максимизирует мощность при любой допустимой альтернативе из множества Θι? поэтому этот критерий можно назвать равномерно наиболее мощным (р. н. м.) критерием проверки гипотезы Н0\ θ = θ0 против альтернативы Ну Θε Θ, при заданной вероятности ошибки первого рода а. Если же S зависит от альтернативы θ^ то это означает, что не существует критической области, которая была бы наилучшей для всех θ{ ε 0j. Другими словами, в данной задаче не существует равномерно наиболее мощного критерия. Рассмотрим несколько задач на построение равномерно наибо-1 лее мощного критерия. 17.11. Пусть выборка X = (Ху ..., Хп) получена из нормального распределения с параметрами (θ, σ2), причем σ2 известно. Требуется проверить гипотезу Н0: θ = θ0 против односторонней сложной конкурирующей гипотезы Ну θ > θ0. РЕШЕНИЕ. Применяя критерий Неймана — Пирсона для проверки двух простых гипотез Н0: θ = θ0 и Ну θ = θ1? где θ1 > θ0, как это было сделано в § 17.2, получаем, что критическая область S име- — ex ет вид X > с{, сх = θ0 + ua-j=, т. е. не зависит от альтернативы ΘΓ Это ι Л/Л и означает, что критерий S является равномерно наиболее мощным критерием для проверки простой гипотезы Н0: θ = θ0 против сложной альтернативы Ну θ > θ0. Функция мощности этого критерия Ж(0; S) равна W{Q) = *Κ(Θ; S) = 1 - Ф(^-^ л/й ) = 1 — Ф(^^ Л + "«} (17.15) 248
^(Θ)Α Рис. 18 Так как θ0 — θ < 0, то мощность W(Q, S) с ростом η стремится к единице при любом θ > θ0. Критерий, обладающий таким свойством, т. е. у которого мощность стремится к единице при безгранично растущем числе η испытаний, называется состоятельным критерием. График функции мощности критерия (17.5) приведен на рисунке 18. При θ —► θ0 мощность уменьшается до величины а: Ж(0) — 1 - Ф(иа) = 1 - (1 - а) = а, и ошибка второго рода β = 1 — W(Q) стремится к 1 — α. Проверьте самостоятельно, что равномерно наиболее мощным критерием для проверки простой гипотезы Н0: θ = θ0 против сложной односторонней альтернативы Н{. θ < Gj является критерий, основанный на критическом множестве X < с', где с' = θ0 — ua-j= (по-прежнему предполагается, что выборка производится из нормального распределения с известным значением σ2 и неизвестным математическим ожиданием Θ). 17.12. Пусть выборка получена из нормального распределения с параметрами (θ, σ2) и σ2 известно. Требуется проверить гипотезу Н0: θ = θ0 при конкурирующей гипотезе Ηλ: θ*θ0. РЕШЕНИЕ. Конкурирующая гипотеза является двусторонней. В этом случае для значений θ < θ0 и θ > θ0 теорема Неймана — Пирсона дает разные критерии: X < с' и X > с, т. е. не существует такого критерия с уровнем значимости а, который максимизировал бы функцию мощности W{Q) во всех точках θ Φ θ0. Естественно здесь 249
W{Q) Рис. 19 использовать двусторонний критерий, а именно скую область в виде σ \Х-а\>иа/2- задать критиче- (17.16) Задание квантили иа/2 обеспечивает значение ошибки первого рода, равное а. Функция мощности этого критерия равна Ж(9) = 1-ф(^^+«а/2) + ф(^^-«а/2). (17.17) График этой функции приведен на рисунке 19. Критерий (17.16), очевидно, состоятелен. 17.13. В процессе производства изделия подвергают выборочному контролю. Пусть каждое изделие независимо от других может оказаться дефектным с некоторой одной и той же, но неизвестной вероятностью θ (0 < θ < 1). Пусть для контроля взяты η изделий и результат описывается вектором X = (Xl9 ... , Хп), где Xt= 1, если /-е изделие дефектно, и Xt = О в противном случае. Проверяется гипотеза о том, что число дефектных изделий не превышает некоторой критической доли θ0, т. е. Н0: θ = θ0; конкурирующая гипотеза, очевидно, задается следующим образом: Η{:θ> θ0. РЕШЕНИЕ. При указанных предположениях критическая об- ласть задается неравенством г(Х) = Σ Х( > га, т. е. число дефектных изделий в выборке превышает некоторое критическое число га. Поскольку г(Х) подчиняется биномиальному закону, граница га определяется по заданному уровню значимости α из уравнения Ря0ИХ) >''«)< t_i+iC*e$(l-e0)«-*«a. 250
или Используя теорему Муавра — Лапласа, получаем / г(Х)-п% . га-п% ч Ι>θ0(ι-θ0) >θ0(ι-θ0) ) ' Г« — «θπ \ Г„ — /2θπ _ "l-or ^>θ0(1-θ0) ) >θ0(1-θ0) Таким образом, граница критической области равна га = п% -их_ α7«θ0(1-θ0). 17.14. Убедиться в том, что построенный в задаче 17.6 критерий Неймана— Пирсона (для пуассоновской модели Π(θ)) является одновременно р. н. м. критерием для проверки гипотезы Н0: θ = θ0 против альтернативы Н^.вУ θ0. УКАЗАНИЕ. См. решение задачи 17.13. 17.15. Для биномиальной модели Bi{k\ θ) построить р. н. м. критерий по выборке объема η для проверки гипотезы Н0: θ = θ0 против альтернативы Н^.вУ θ0. 17.16. Показать, что построенный в задаче 17.3 критерий является р. н. м. критерием в задачах проверки сложных односторонних гипотез соответственно Н0: θ = θ0 против Нх\ θ > θ0 и Н0: θ = θ0 против^: θ <θ0. '17 4Ν пРовеРка гипотез и доверительное оценивание Между задачей проверки простой гипотезы Н0, состоящей в том, что некоторый параметр θ принимает заданное значение θ0, и построением доверительной области (в частности, доверительного интервала) для этого параметра имеется тесная связь. Пусть, например, (θ(χ1? ... , χη), θ(χρ ... , хп)) — доверительный интервал для параметра Θ, накрывающий его истинное значение θ0 с вероятностью 1 — α (см. § 16.5). Определим критическое множество S как множество всех тех и только тех точек выборочного пространства, для которых θ0 лежит вне указанного доверительного интервала. Тогда очевидно, что критерий HQ с критическим множеством S имеет вероятность ошибки первого рода, равную а. При этом односторон- 251
нему критерию значимости будет соответствовать односторонний доверительный интервал, а двустороннему критерию значимости — двусторонний доверительный интервал. 17.17. Рассмотрим ситуацию, когда выборка получена из нормального распределения, в которой дисперсия σ2 известна, а математическое ожидание θ неизвестно. Построить критерий проверки простой гипотезы Н0: θ = θ0 против сложной альтернативы Нх\Ъф θ0. РЕШЕНИЕ. В задаче 16.77 был построен доверительный интервал ( X + -= иа/2, X - -= иа/2 I, накрывающий истинное значение математического ожидания θ с вероятностью 1 — а. Относя к критическому множеству .Уте и только те точки выборочного пространства, для которых θ0 не принадлежит указанному доверительному интервалу, получим критерий для проверки гипотезы Н0, обеспечивающий вероятность ошибки первого рода а. 17.18. Рассмотрим теперь ситуацию, когда выборка получена из нормального закона, в котором оба параметра — математическое ожидание μ и дисперсия σ2 — неизвестны. Пусть Н0 — сложная гипотеза, состоящая в том, что μ = θ0, 0 < σ2 < °° (т. е. дисперсия σ2 предполагается неизвестной). Построить критерий с уровнем значимости α для проверки этой гипотезы. РЕШЕНИЕ. Как следует из задачи 16.85, интервал fv_jm, X + ^-t ] { 7^10+TD/2.»-!· Λ + J—i O+7)A«-.J накрывает истинное значение математического ожидания μ с вероятностью γ = 1 — α. Относя к критическому множеству S точки выборочного пространства, не входящие в указанный интервал, получаем критерий для проверки гипотезы Нф который обеспечивает заданный уровень значимости а. Этот критерий иногда называют критерием Стьюдента. 17.19. {Гипотеза о равенстве средних двух нормальных распределений.) Пусть имеются две независимые выборки X = = (Хи ... , Хп) и Υ= (Γ,, ... , Ym) из нормальных распределений с одинаковыми (но неизвестными) дисперсиями и неизвестными средними μλ и μ2. Проверить основную гипотезу Н0: μχ = μ2 против конкурирующей гипотезы Нх\ μ, * μ2. 252
РЕШЕНИЕ. В задаче 16.89 был построен доверительный интервал для оценки разности τ = μ1 — μ2. Из этого результата получаем, что критическая область критерия уровня значимости α для проверки гипотезы Н0 есть множество точек (Χ, Υ), лежащих вне указанного интервала, т. е. S=Ux,Y):\X-f\>tx a/2n + m J™ + n)(n?4X) + mS4D)\ v ' ' ι-α/ι,η+m-i^ тп(т + η - 2) 17.20. (Гипотеза о равенстве дисперсий двух нормальных распределений.) Пусть снова имеются две выборки X = (Х]9 ... ...,Хп) и Υ= (Υ}9 ... , Ym) из нормальных распределений, но уже с одинаковыми и неизвестными средними и неизвестными дисперсиями σ^ ио22. Проверить основную гипотезу Н0: <з\ = <з\ против альтернативы Нх: о] Φ σ|. РЕШЕНИЕ. Снова обращаемся к доверительным интервалам, а именно к задаче 16.92, где был построен γ-доверительный интервал для отношения aj /о] при указанных в данной задаче условиях. Таким образом, критическая область критерия S с уровнем значимости α — совокупность точек (Χ, Υ), не входящая в указанный интервал при γ = 1 - α. /£\ Статистические критерии согласия. \у Критерий «хи-квадрат» Пирсона На практике часто требуется проверить гипотезу Н0 о том, что выборка X = (Х{,..., Хп) получена из генеральной совокупности с функцией распределения F(x). Относительно конкурирующей гипотезы каких-нибудь предположений не делается. В этом случае применяют критерии согласия, которые строят на основе выбора некоторой статистики Τ = Т(Х; F), характеризующей отклонение эмпирических данных от соответствующих гипотезе Н0 гипотетических значений. Обычно эта статистика положительна, и при любой конкурирующей гипотезе ее значение возрастает. Она зависит от F, и распределение ее при гипотезе Н0 должно быть известно точно или хотя бы асимптотически при η -* °о. Далее выбирают такую границу ta, чтобы событие {7"(Х; F) > tj при основной гипотезе выполнялось с вероятностью ошибки первого рода а. Гипотеза Н0 принимается, если Т(Х; F) < ta, и отвергается, если Т(Х; F) > ta. Таким 253
образом, множество значений X, при которых Т(Х; F) > ta, составляет критическое множество S критерия. Одним из наиболее известных таких критериев является ^-критерий К. Пирсона. Критерий строят следующим образом. Разобьем прямую на s интервалов: z0 = -°° < Z\ < ·· < zs _ ι < zs = °°. По известной функции F(x) вычисляем вероятности р. = F(Zi) — F{Zi_\), / = 1,... , s. Пусть hh i = 1,... , s, — число тех Xj из выборки X (J= 1,..., η), которые удовлетворяют условию z^\ < Xjг < zt- Тогда при справедливости основной гипотезы случайные величины h{, ... , hs имеют (см. § 7.2) полиномиальное распределение с числом испытаний η и вероятностями исходов ρ = (р{,... ,ps). Имеем P{hl = nx,...9hs = ns} = -р-^--,/^! ...ρ;., ηχ + ... + η5 = η. Тем самым первоначальная задача сведена к проверке гипотезы о том, что частоты h = (Л15 ... , hs) имеют полиномиальное распределение. В этом случае частоты hi должны быть близки к среднему значению MA, = npi, i = 1,... , s. Общее отклонение всех hi можно измерять разными способами. Чаще всего в качестве меры отклонения используют величину, введенную К. Пирсоном, л - 5 (hf-nPi)2 s h2f XI = XUh) = Σ-^ -±- = Σ-± -η. Величина Х\ случайная и обладает следующим важным свойством: при справедливости принятой гипотезы распределение этой величины в пределе при η —► оо не зависит от вектора ρ и имеет известное распределение хи-квадрат с s — 1 степенями свободы, т. е. при η —► оо для любого χ и постоянных/^ > О, J = 1,..., s, ν{Χ><χ}^Ρ{χ}-1<χ}. С помощью этого результата введем следующий критерий для проверки гипотезы Н0: F^(x) = F(x). Зададим уровень значимости α > О, выберем величины s, z{, ··· , zs и найдем по ним значения вектора вероятностей ρ = (/?1?... ,/?5) и вектора частот h = {hx,..., hs). Считая, что XI распределено согласно закону χ2(s — 1), по таблице 6 приложений находим такое число ta (границу критической области критерия), что 254
Таким образом, ta = χ \ _ α.s _ x - (1 - α) — квантиль распределения χ2(s - 1). Следовательно, границей критерия χ2 с уровнем значимости α является величина χ \ _ а; s _ λ . Выбор точек разбиения прямой Ζ\, ··· , ζ5_ ι должен быть таким, чтобы: 1) вероятности р{9 ... , ps в какой-то мере отражали вид функции распределения F(x); 2) Ay и я/зу были достаточно большими (чтобы можно было использовать предельную теорему Пирсона). Практика показывает, что для этого требуется η > 50 и hj > 5 для всеху. Таким образом, критерий согласия у} имеет следующий вид. Пусть заданы уровень значимости а, объем выборки η и наблюдавшееся значение h = (hl9 ... , hs) вектора частот {при этом η > 50, hj > 5,у = 1, ... , s)\ тогда если наблюдавшееся значение Х\ (h)удовлетворяет неравенству X\(h)> > X\-a;s-\ , то гипотезу Н0 отвергают; в противном случае гипотезу Н0 принимают. 17.21. При η = 4040 бросаниях монеты Бюффон получил Л, = = 1992 выпадения «решетки» и h2 = 2048 выпадений «герба». Требуется проверить совместимость этих данных с гипотезой Н0 о том, что монета была симметричной, т. е. что вероятности выпадений «решетки» и «герба» равны соответственно/?! = ρ = 1/2, р2 = q = = Ι-ρ = 1/2. РЕШЕНИЕ. Здесь число исходов s = 2, xi (h) - (Az*_! + fhz^ll _ <ίιζί«! - 0,776. п v ' np nq npq Выберем уровень значимости α равным 0,05. Число степеней свободы равно s — 1 = 1. По таблицам распределения χ2( 1) находим Χο,95;ΐ = 3,84. Сравниваем полученное значение Х% (h) с табличной величиной χο,95; ι · Так как Х^ (h) < χ0,95; ι > то Делаем вывод, что данные опыта Бюффона не противоречат гипотезе. 17.22. В десятичной записи числа π среди 10 000 первых десятичных знаков после запятой цифры 0, 1,..., 9 встречаются соответственно h= (968, 1026,1021,574, 1014, 1046,1021,970, 948, 1014) раз [см. [2] ]. Можно ли при уровне значимости 0,05 считать эти цифры случайными? 255
РЕШЕНИЕ. Здесь число исходов s = 10, при уровне значимости α = 0,05 критическая граница Хо,95;9 = 16,9 (находим по таблице распределения χ2). Подсчитываем значение статистики Х% (h) при/?1 = ... =/>10 = = 1/10. Неравенство Х\ (h) = 9,37 < 16,7 = χ0,95;9 свидетельствует, что данные согласуются с гипотезой Н0 о случайности цифр. 17.23. При η = 4000 независимых испытаний события А{, А2, А3, составляющие полную группу событий, осуществились 1905, 1015 и 1080 раз соответственно. Проверить, согласуются ли эти данные при уровне значимости 0,05 с гипотезой Ηϋ: ρχ = 1/2, р2 = = />3= 1/4, где/>,· = />(ν4,), /=1,2,3. Ответ: Х\ = 11,13 > %о,95;2 = 5,99. ГипотезаН0отвергается. 17.24. Согласуются ли данные задачи 15.48 при уровне значимости α = 0,1 с гипотезой Н0 о том, что показания часов равномерно распределены на интервале (0, 12)? Ответ: Х„ = 10,00 < Хо,9 и = 17,3. Гипотеза//0 принимается. 17.25. Группируя данные задачи 15.53 по s = 4 равновероятным (при гипотезе Н0) интервалам, проверить гипотезу Н0: F^{x) = = 1 — е-*, χ > 0. Уровень значимости принять равным 0,1. Ответ: гипотеза Н0 не отвергается, поскольку Х% = 4,108 < <Хо,9;3 =6,25. (Здесь^ = 0,288, z2 = 0,693, z3 = 1,386.) 17.26. В экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, полученных при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Эти данные и значения теоретических вероятностей по теории наследственности приведены в следующей таблице [5, пример 3.7]: Семена Круглые и желтые Морщинистые и желтые Круглые и зеленые Морщинистые и зеленые Частота hi 315 101 108 32 Вероятность/?, 9/16 3/16 3/16 1/16 256
Проверить гипотезу Н0 о согласии опытных данных с теорией (на уровне значимости α = 0,05). Ответ: согласие хорошее, поскольку Х\ = 0,47 < Хо,95;з = = 7,82; гипотеза не отвергается. 17.27. Наблюдается число разладок станков на одном из производственных участков за смену. За каждый час смены наблюдалось следующее число разладок: 16, 17, 19, 16, 24, 19, 17, 16 (всего 144 разладки). Проверить гипотезу Н0 о том, что разладки следуют равномерному закону распределения (на уровне значимости α = 0,05). Ответ: Х\ =2,90 < χ^ 95;7 = 14,1. Таким образом, гипотеза Н0 не отвергается. 17.28. Семь монет подбрасывали одновременно 1536 раз, причем каждый раз отмечалось число ξ выпавших «гербов». Число hi случаев, когда число выпавших «гербов» равно /, приведено в таблице: i hi 0 12 1 78 2 270 3 456 4 386 5 252 6 69 7 13 Проверить гипотезу Н0 о согласии опытных данных с биномиальным распределением; учесть, что вероятность выпадания «герба» при бросании каждой из монет равна 1/2 (а = 0,1). Ответ: Х„ = 10,32 < 12 = Хо,9;7» следовательно, гипотеза HQ не отвергается. Критерий согласия «хи-квадрат» при неизвестных параметрах распределения Изложенные ранее критерии согласия применимы лишь в случае, когда проверяемый закон распределения F(x) полностью определен. Однако чаще встречаются случаи, когда известен лишь тип распределения (например, нормальное), но неизвестны некоторые параметры распределения θ = (θ,, ... , ΘΓ), и гипотеза Н0 состоит в проверке того, что FJx) = F(x; θ). Пусть исходные данные сгруппированы (см. § 17.5) и h = = (/*!, ... , hs) — вектор частот наблюдений, попавших в интервалы 9-1605 Ватутин 257
группировки. Вероятности попадания в эти интервалы при гипотезе HQ равны Рассмотрим статистику S (И:-ПрЛв))2 п п v ; fix npj(d) Она зависит от неизвестного параметра Θ, поэтому вычислить ее по выборке X невозможно. В этом случае неизвестный параметр θ заменяют некоторой оценкой θ„ = ΘΛ(Χ), и тогда статистику Х\ = = XI (θ) уже можно однозначно вычислить по выборке. Распределение этой случайной величины зависит от выбора оценки §„. Оказывается, что в качестве такой оценки целесообраз- А но использовать оценку максимального правдоподобия θ„, основанную на частотах h = {hv ... , hs) (см.§ 16.3). В этом случае предельное распределение статистики Х$ (θ„) при η -* oo и при выполнении некоторых достаточно общих условий имеет простой вид, а именно является распределением «хи-квадрат» с s - 1 - г степенями свободы, где г — число оцениваемых параметров. 17.29. (Радиоактивный распад.) В эксперименте проведены η = 2608 опытов, в которых наблюдалось случайное число ξ« α-частиц, излучаемых за один и тот же период времени (7,5 с). Числа /^опытов, в которых наблюдалось ровно i частиц (/ = 0,1,...), сведены (см. [7]) в следующую таблицу: / А/ 0 57 1 203 2 383 3 525 4 532 5 408 6 273 7 139 8 45 9 27 10 10 11 4 12 2 Всего η = 2608 Проверить гипотезу Η о том, что случайная величина ξ распределена по закону Пуассона. Уровень значимости α = 0,05. РЕШЕНИЕ. Здесь значения случайной величины ξ уже сгруппированы, поскольку величина ξ дискретная. Единственное, что следует сделать — это сгруппировать значения hi при / > 11 в один интервал с тем, чтобы все hi были не меньше 5. Тогда число групп равно 12. Оценкой максимального правдоподобия единственного в данном случае неизвестного параметра θ в этом случае является еи = х = - ΣΧ=- Iy"A, = 3,87. 258
A Значения вероятностейpj( θ„) подсчитываем по формулам А . Pj(Qn) = ^"4,j = o,...,\o, />η(θ„) = ι- Ь/е„)· J' У=0 _ А Далее вычисляем статистику Х\ (θ„): А А2 _ 2 а _ и (hj- npj(Qn))2 *„=χ„(θ„) = д и/).(6л) , при этом в качестве Ап берем сгруппированное значение частоты А 4+2 = 6. Здесь Jf2 (0^) = 12,855. Сравниваем это число с кван- тилью χ^95;ΐο = 18>3· Получаем, что Х\ (θ„) < χ^95;ΐο > τ· е· согласие с проверяемой гипотезой хорошее. 17.30. Пусть имеется выборка из 200 изделий, сделанных на некотором станке. Проверить гипотезу о нормальности закона распределения разброса размеров этих изделий. Уровень значимости а = 0,1. РЕШЕНИЕ. Разобьем множество значений размеров изделий на 10 интервалов. В таблице приведены границы этих интервалов и количество ht выборочных изделий, попавших в эти интервалы. Номер интервала (/) 1 1 2 3 4 5 6 7 8 9 10 Сумма Граница интервала U,) 2 -20 -15 -15 -10 -10 -5 -5 0 0 5 5 10 10 15 15 20 20 25 25 30 Число попаданий (к() в интервалы 3 7 11 15 24 49 41 26 17 > 200 Pt=P&,*2) 4 0,023 0,048 0,098 0,162 0,198 0,194 0,142 0,083 0,052 1,000 259
Имеем два неизвестных параметра — математическое ожидание и дисперсия. Их оценками максимального правдоподобия являются величины G,=Jr = - Σ hixi и θ2 = ^=- Σ h.xf-X2, где χ( — средние значения интервалов (χλ = -17,5, χ2 = —12,5, ... ..., ϊ8 = +17,5, χ9 = +25). Получаем: Χ = 4,30; 52 = 94,26. Далее находим вероятности попадания размера детали в интервалы: если гипотеза о нормальности справедлива, то ^ = Ф(^) = 0)023,^2 = Ф(^)-Ф(1^) = 0,048,...ит.д. Числовые значения ρ i помещаем в четвертом столбце таблицы. Вычисляем значение статистики хи-квадрат: 9 (h:-npAX,S2))2 У 2 = ν _ = 7 1Q и сравниваем ее со значением Хо,9;б = Ю>6. (Число степеней свободы равно 5— 1—г = 9—1 — 2 = 6.) Поскольку 7,19 < 10,6, гипотеза Н0 о нормальности разброса размеров деталей не отвергается. 17.31. Через равные промежутки времени в тонком слое раствора золота регистрировалось число ξ частиц золота, попавших в поле зрения микроскопа. По данным наблюдений, приведенных в следующей таблице: Число частиц А/ 0 112 1 168 2 130 3 68 4 32 5 5 6 1 7 1 Итого Σ/ι, = 518 проверить гипотезу Н0 о пуассоновском распределении случайной величины ξ. Ответ: θ„ = 1,54, Х*(Ъп) = 7,95 < 10,6 = χ029;6 - согласие имеет место. 17.32. В генетической модели Фишера [2] принимается, что вероятности появления потомства, классифицируемого по четырем типам, имеют вид />, (Θ) = (2 + θ)/4, />2(θ) =/>3(θ) = (1 - θ)/4, />4(θ) = θ/4, 260
где θ е (О, 1) — неизвестный параметр. Как выглядит критическая область критерия для проверки соответствия этой модели реальным данным? h\ h\ + h\ h\ ι , /2(2 +ΘΛ) /2(1 -θ„) /2θ„ Ц число потомков /-го типа из общего числа η потомков (/ = 1,..., 4), θ„ — корень уравнения η θ2 + (Л4 + 2h2 + 2h3-hl) -2/ι4 = 0. 17.33. При 8002 независимых испытаний события^, В и С, составляющие полную группу, осуществились 2014, 5008 и 980 раз соответственно. Верна ли при уровне значимости 0,05 гипотеза р(А) = 0,5 - 2Θ, р(В) = 0,5 + Θ, р(С) = θ (0 < θ < 0,25)? Ответ: θ„ = 0,12, Χ2η (θ„) = 1,09 < 5,99 = χ02)95;2. 17.34. В таблице приведены числа hi участков равной площади 0,25 км2 южной части Лондона, на каждый из которых приходилось по / попаданий самолетов-снарядов во время Второй мировой войны. Проверить согласие опытных данных с законом распределения Пуассона, приняв за уровень значимости α = 0,05 [ 10]. / hi 0 229 1 211 2 93 3 35 4 7 5 и более 1 Итого !/*,· = 576 Ответ: θ = 0,928, Х2п (θ„) = 2,172 < 9,49 = χ02,95;4· Согласие хорошее. 17.35. Среди 2020 семей, имеющих двух детей, 527 семей, в которых два мальчика, и 476 — две девочки (в остальных 1017 семьях дети разного пола). Можно ли с уровнем значимости 0,05 считать, что количество мальчиков в семье с двумя детьми — биномиальная случайная величина? Ответ: θ„ = ρ = Χ/2 = 0,513; р0 = (1 - ρ)2 = 0,237; рх = 2р(1-р)=0,5;р2 = ρ2 = 0,363; Ц = Ο,Κ 2,7 = χ2)95;1. Согласие хорошее. 17.36. Во время эпидемии гриппа среди 2000 контролируемых индивидуумов одно заболевание наблюдалось у 181 человека, дважды болели гриппом лишь 9 человек. У остальных 1810 человек забо- 261
левания не было. Согласуются ли при уровне значимости 0,1 эти данные с гипотезой, согласно которой число заболеваний отдельного индивидуума в течение эпидемии — биномиальная случайная величина? Ответ: ρ = 0,05; р0 = 0,903; рх = 0,094, р2 = 0,025; Х\ (р) = = 3,66 > 2,71 = χ^9;!; гипотеза не подтверждается. Критерий согласия Колмогорова Другим критерием согласия выборки Х= (Х{,..., Хп) с гипотезой Н0 о том, что она получена из распределения с заданной функцией распределения F(x), является критерий Колмогорова. Его применяют, когда F(x) непрерывна. Статистикой критерия является величина D = D (X) = sup \F (x) — F(x)\ — макси- -οο<χ <оо А мальное отклонение эмпирической функции распределения Fn(x) от гипотетической F(x). Величину Dn легко определить непосредственным вычислением для каждого χ (достаточно найти разность А А Fn{x) - F(x) в точках Х(к) — скачках функции Fn(x). При каж- А дом χ величина Fп (х) является оптимальной оценкой для F(x) и с А ростом η имеем Fn{x) —► F(x). Поэтому, по крайней мере при больших п, в тех случаях, когда гипотеза Н0 истинна, значение Dn не должно существенно отклоняться от нуля. Отсюда следует, что критическую область критерия, основанного на статистике Dn, следует задавать в виде {Dn > с}. Точное распределение P(*fnDn < t) независимо от вида непрерывной функции F(x) уже при η > 20 хорошо приближается предельным распределением Колмогорова K{t)= Σ (-1Уехр{-2у2/2), для которого составлены таблицы. Это означает, что при п>20 критическую область критерия можно задавать в виде {JTiDn > λα}, а значение критической границы λα находить из таблиц Κ(λα) по заданному уровню значимости а: ^(λα)-1-α. В этом случае действительно Рн (Jn Dn « λα) > 1 - ^(λα) = α. Так, при α = 0,01 имеем λα = 1,628 и λα = 1,358 при α = 0,05. 262 <$>
17.37. Из таблицы случайных чисел выбраны η = 150 двузначных чисел. Частоты ht чисел, попавших в интервал [10/, 10/ + 9], (/ = 0, 1, ... , 9), равны: 16, 15, 19, 13, 14, 19, 14, 11, 13, 16. Проверить, используя критерий Колмогорова, гипотезу Н0 о согласии выборки с законом равномерного распределения. Уровень значимости α равен 0,01. Ответ: Dn = 0,041; JnDn = 0,502 < 1,628 = λα. Так как JnDn< < λα, то согласие с гипотезой имеет место. 17.38. Измерения длины Ху η = 1000 деталей дали следующие результаты (округленныедо 0,5 мм): i Хг hi 1 98,0 21 2 98,5 47 3 99 87 4 99,5 158 5 100 181 6 100,5 201 7 101 142 8 101,5 97 9 102 41 10 102,5 25 Здесь ht — число деталей, имеющих размер хг Проверить с помощью критерия Колмогорова гипотезу Н0 о согласии полученной выборки с нормальным законом распределения g7V( 100,25; 1). Уровень значимости α = 0,05. Ответ: JnDn = 0,281 < 1,358 = λα, т. е. согласие с гипотезой хорошее. Критерий независимости «хи-квадрат» Пусть наблюдается двумерная случайная величина ξ = = (ξ,, ξ2) с неизвестной функцией распределения F^(x, у), и есть основания предполагать, что ее компоненты независимы. Таким образом, требуется проверить гипотезу независимости Н0: Л (х, у) = = Ρξ (χ) · F^ (у), где Fξ (χ) и F^ (у) — некоторые неизвестные одномерные функции распределения. Построим критерий согласия, основываясь на методике χ2. Будем считать, что с самого начала (или после группировки, как это делалось в предыдущих задачах) случайная величина ζ{ принимает конечное число s некоторых значений (обозначим их через а{9 ... , as), а случайная величина ξ2 принимает t значений (обозначим их через 6j, ... , bt). Таким образом, множество значений ξ разбивается на si значений. 263
Иногда вместо независимости компонент двумерной случайной величины говорят о независимости двух наблюдаемых признаков (например, цвета волос и бровей у группы индивидуумов). Обозначим через h^ число наблюдений пары (яг, bj). Результаты наблюдений удобно расположить в виде таблицы, которую называют таблицей сопряженности двух признаков размера s χ /: ξ, ^\^ %hu = h-j bx Л2, л., ь2 Л 22 Кг h.2 ... ь, К К, h.t У-1 К К- « = Σ/,. = Σλ . Пусть/?^. = Ρ(ξ! = ai9 ξ2 = oy). Тогда гипотеза независимости эквивалентна гипотезе о существовании s + / постоянных pt и <7у таких, что ри=рдр ZPi= Σ^/=1. В соответствии с гипотезой совместное распределение двух величин содержите + / — 2 неизвестных параметров/?,· и qjb так как два из них можно выразить через остальные параметры. Известно, что статистика χ2η= ς ς ij /:з / = 1 j=\ np^j имеет при η -* °° распределение χ2 с st— 1 — (s + t — 2) = (s— l)(t— 1) степенями свободы, если гипотеза 7/0 справедлива и если /? ,· и qj являются оценками максимального правдоподобия неизвестных параметров/^· и qy При этом Р; = Н;./п, qj = h.j/ny i= l,...,s,j= 1,...,/. Таким образом, статистика критерия принимает вид Х2п=п Σ Σ /=1 j=\ s t {кц-hi.h.j/nY hi.b.j = n Σ Σ hh -ny ;=i y=i A/.A.y и гипотезу Hq отвергают тогда и только тогда, когда вычисленное по А фактическим данным значение статистики Х\ окажется больше χ?_α,(5_ 1)(/_ d , где χ?_α,(,_ 1}(,_ ,) - (1 - а) - квантильраспре- 264
деления χ2((s — \)(t — 1)),α — уровень значимости критерия. При А s = t = 2 статистику Х\ можно привести к виду a _n(hnh22-hnh2l)2 п hx.h2.h.xh.2 ' 17.39. Из 300 абитуриентов, поступивших в институт, 97 человек имели балл 5 в школе и 48 получили этот же балл на вступительных экзаменах по тому же предмету, причем только 18 человек имели балл 5 и в школе, и на экзамене. С уровнем значимости 0,1 проверить гипотезу о независимости этих оценок в школе и на экзамене. А Ответ: Х\ — 2,32 < 2,71 = Xo,9;i · Гипотеза Н0 не отвергается. 17.40. Проверить гипотезу независимости для следующей таблицы сопряженности двух признаков (уровень значимости принять равным 0,05): 1>^1 а2 аъ Л.у=?Л// b\ 3009 3047 2974 9030 b2 2832 3051 3038 8921 *з 3008 2997 3018 9023 Σ/*,·,· = /*,, 8849 9095 9030 26974 А Ответ: Х\ — 8,09 < 9,49 = Хо,95;4 · Гипотеза не отвергается. 17.41. Имеются две группы данных о приеме в вуз, классифицированные по двум признакам: «принято А — не принято А» и пол: «мужчины В — женщины 5». А А Σ В 97 263 360 В 40 42 82 Σ 137 305 η =442 Проверить гипотезу Н0 о независимости признаков А и В (а = = 0,0001). А Ответ: Х\ = 14,89 > 10,8 = Хо,9999;ι· ГипотезаН0отвергается. 265
17.42. В следующей таблице приведены 818 случаев, классифицированных по двум признакам: наличию прививки против холеры (признак А) и отсутствию заболевания (признак В): А А Σ В 276 473 749 В 3 66 69 Σ 279 539 818 Построить критерий проверки гипотезы Н0 о независимости признаков А иВ,а = 0,0001. А Ответ: Х\ = 29,7 > 10,8 = %о,9999;1 · ГипотезаН0отклоняется. 17.43. В эксперименте каждый индивидуум классифицировался по двум признакам: цвету глаз ^ и цвету волос ξ2, при этом по признаку ξ! индивидуум относился к одной из трех категорий аи а2, а3, а по признаку ξ2 — к одной из четырех категорий bl9 b2, b3,64. Соответствующие данные для η = 6800 индивидуумов приведены в таблице: "^^.^1Двет волос Цвет глаз -—^^_ а2 Σ *\ 1768 946 115 2829 Ьг 807 1387 438 2632 *з 189 746 288 1223 *4 47 53 16 116 Σ 2811 3132 857 6800 Проверить гипотезу Н0 о независимости двух признаков (а = = 0,001). А Ответ: Х\ = 1075 > 22,5 = Хо,999;б >т·е· гипотеза Н0 отклоняется. Критерий однородности данных Важной является задача проверки однородности статистических данных. Пусть имеются две независимые выборки Х= (Χν ..., Хп) и Y= (Yu ..., Ym), описывающие одно и то же явление или процесс, но полученные в разных условиях; требуется определить, являются они выборками из одного и того же распределения или нет. 266
Задача, естественно, обобщается на случай произвольного числа t > 2 независимых выборок. Пусть осуществлено t серий независимых наблюдений объема п{, ... , пг Пусть множество возможных значений рассматриваемых величин разбито на s множеств без общих точек (или в каждом опыте наблюдается некоторый переменный признак, принимающий одно из s значений). Пусть h(J — количество наблюдаемых значений, принадлежащих множеству с но- 5 мером / ву'-й выборке, так что Σ hu = nf, j = 1, ... , /. Помещая / = 1 J J числа htj в таблицу — в /-ю строку иу-й столбец, получим таблицу формально такого же вида, что и таблица сопряженности признаков (см. §17.8). Требуется проверить гипотезу Н0 о том, что все наблюдения производились над одной и той же случайной величиной, т. е. если Pij— неизвестная вероятность /-го исхода в испытанияху-й серии (ι = 1, ... , s\ j = 1, ... , 0, то гипотеза Н0 означает следующее утверждение: {рхр ... ,psJ) = (pl9... ,ps), где/?,·, /= 1,... ,5, — некото- s рые неизвестные вероятности, Σ Р.-= 1, j = 1,..., t. ί = 1 t Положим Л, = Σ Λ/.·. Если гипотеза Н* справедлива, то оценка- j=\ J ми максимального правдоподобия pt параметров pi являются р( = = hh/n, п= Σ л,·, и статистика типа Х\ (р) имеет вид / = 1 л a st (hu- п.И;./п)2 ( s γ t h}} \ Χ2η(ρ)=ηΣ Σ " ' ' =η( Σ^ Σ-^-1). /=ι у=1 ЛуЛу. ν/=ιΛ/. 7=ι w7 ' Для нахождения критической границы ta критерия с уровнем значимости α применяют следующий результат: при η —► оо ρ*0<χ„2(£)<*)-Ρ(χ&-,)(,-ΐ)<*). В силу этого соотношения можно полагать /α = χ^ _ а. (5 _ 1)(/ _ 1}. Гипотезу Н0 отвергают тогда и только тогда, когда вычисленная по данным эксперимента статистика Х\ (р) не меньше %\ _ а; (5 _ 1)(/ _ 1}. Для случая двух выборок (/ = 2) статистика Х% (р) принимает следующий вид: 1 (hi\ ha пКУ ι 2 i=\hn +hi2 \ηχ n2 J 267
17.44. Поступающие в институт абитуриенты разбиты на два потока по 300 человек в каждом. Итоги экзамена по одному и тому же предмету на каждом потоке оказались следующими: на первом потоке баллы 2, 3, 4 и 5 получили соответственно 33, 43, 80 и 144 человека; соответствующие данные для второго потока таковы: 39, 35, 72 и 154. Можно ли при уровне значимости 0,1 считать оба потока однородными? Ответ: можно,таккакХ\ (ρ) = 2,18<6,25 = χ$ 9;3 (5 = 4,7 = 2). 17.45. В таблице содержатся данные о смертности среди матерей, родивших первого ребенка, в четыре различных периода времени nJ hu 1072 22 1133 23 2455 49 1995 33 Здесь rij — число матерей, h ly. — число смертных случаев. Проверить гипотезу Н0 о том, что в уровнях смертности между этими периодами не существует различия (а = 0,05). Ответ: / = 4, s = 2, h2j = rij - hxp h}. = 127, h2. = 6528, X\ (p) = 0,89 < χ^95 = 7,82 — различия нет. 17.46. Утверждается, что результат действия лекарства зависит от способа его применения. Проверить это утверждение при α = = 0,05 по следующим данным: " —__Отособ применения Результат *—■—1______^ Положительный Отрицательный I 15 26 II 19 25 III 18 22 Ответ: 5 = 2, t=3, X\ =0,66 < 5,99= χ^95;2 —независит.
РАНГОВЫЕ КРИТЕРИИ Глава Критерий знаков Проводятся η независимых испытаний, каждое из которых может завершиться лишь двумя исходами: успехом (этот факт отмечают знаком + ) и неудачей (в этом случае ставят знак —). Пусть/? — вероятность успеха в одном испытании. Требуется построить критерий с заданной ошибкой первого рода а, с помощью которого можно было бы отличить гипотезу Щ: ρ = 0,5 от одной из следующих гипотез: Н{\ ρ > 0,5; Н2: ρ < 0,5; Нг\ ρ Φ 0,5. Напомним, что α — это вероятность отвергнуть гипотезу Н0 по результатам эксперимента, если она верна. Одним из критериев, используемых при решении таких задач, является критерий знаков, схема построения которого такова. 1. Рассмотреть серию из η испытаний и подсчитать величину μ — количество успешных испытаний (количество знаков + )· 2. Вычислить W{n,k) = ^niOn, W{n,n) = \. Для простоты вычислений при 2μ > η воспользоваться равенством ΐν(η,μ) = 1- W{n,n-\i+ l). 3. Правила принятия (или отклонения) гипотезы Н0 при альтернативах //,·, / = 1, 2, 3, приведены в следующей таблице: i 1 2 3 Принимаем Н0 ΐν(η,μ) < 1-α ΐν(η,μ) >α α/2< ΐν(η,μ) < 1-α/2 Принимаем Ht ΐν(η,μ) >\-α W{n, μ) < α ΐν(η,μ)* (α/2; 1-α/2) # 269
В каждом из упомянутых случаев гипотеза Н0 принимается с уровнем значимости (т. е. вероятностью отвергнуть Н0, если она верна), не превосходящим а. 4. Если η велико (п > 20), то можно воспользоваться нормальной аппроксимацией величины TV(n, μ). В частности, если истинное значение W{n, μ) принадлежит одному из промежутков (0,005; 0,05) или (0,93; 0,995), то »Ч/!,ц)«Ф(л/2ц+1,5 - 72(«-μ)-0,5)Ξφ(Χι), (18.1) если же 0,05 < W(n, μ) < 0,93, то ΡΚ(«,μ)«Φ(72μ+ 1,25 - J2(n - μ) - 0,75 ) = Φ(χ2), (18.2) где Φ(χ) = -^L J e-"2/2 dw ν2π _те — функция распределения стандартного нормального закона. При этом аппроксимацию (18.2) используют в случае, когда значение переменнойх2 = */2μ + 1,25 - J2(n - μ) - 0,75 принадлежит промежутку (-1,64, 1,47), а аппроксимацию (18.1) — если значение переменной х} = J2\i + 1,5 — 42{п — μ) — 0,5 находится в одном из промежутков (-2,58, -1,64) или (1,47, 2,58). 18.1. Леди Гамильтон, сидя за чашкой чая с молоком в кругу друзей, утверждала, что она почти всегда на вкус может определить, что было налито в чашку раньше: чай или молоко. Были поставлены 10 экспериментов, результаты которых таковы: + + + - + - + + + -, где знак + ставился, если леди Гамильтон давала правильный ответ, и знак -, если леди Гамильтон ошибалась. Проверить при помощи критерия знаков с уровнем значимости α = 0,05 гипотезу Н0: вероятность/? правильного ответа равна 0,5 против альтернативы Ηλ\ ρ > 0,5. РЕШЕНИЕ. Здесь η = 10, μ = 7. Так как 2μ = 14 > η = 10, то используем равенство W(n, к) = 1 — W{n, η — к — 1). В этом случае Ж(10, 7) = 1 - Ж(10, 2) = 1 - i-0 ХоС(0 . Вычисления дают: И^(10, 2) = 0,055 и Ж(10, 7) = 1 - 0,055 = = 0,945. Так как 1 - α = 1 - 0,05 = 0,95, то W{ 10, 7) = 0,945 < 0,95; значит, нет оснований отвергать (при уровне значимости α = 0,05) гипотезу Н0. 270
18.2. Решить задачу 18.1 при η = 10, μ = 8 иа = 0,1. Ответ: W{ 10, 8) = 0,989 > 0,9 = 1 - а. Гипотеза Н0 отвергается. 18.3. Для сравнения качества датчиков типов А и В проведено 20 однородных испытаний, в ходе каждого из которых использовались два датчика — типа А и типа В. Эксперимент прекращали, как только отказывал один из них. В результате испытаний в шести случаях первым отказывал датчик типа А, а в оставшихся 14 Случаях — датчик типа В. Можно ли утверждать, что датчика значительно надежнее датчика В? Для обоснования ответа проверить гипотезу Н0: F{X> Υ) = F{X< Υ] = 0,5, где Χи Υ— случайные длительности безотказной работы датчиков типа А и В соответственно против альтернативы Н2: Р{Х < Υ) < 0,5 с уровнем значимости α = 0,01. Предполагается, что Т*{Х = Υ) = 0. РЕШЕНИЕ. Пусть __ ]+,еслиХ>Г, ^" 1-,еслиХ<У. В этих терминах гипотезы Н0 и Н2 принимают соответственно вид Н0: ρ = Ρ{Ζ= +} = 0,5; Н2\ ρ = Ρ{Ζ= -} < 0,5. Имеем η = 20, μ20 = 6. Далее находим ^(20,6) = ^ ioCJo= 0,058. Поскольку альтернативной является гипотеза Н2, нужно сравнивать W(20, 6) с α = 0,01. Так как Ж(20, 6) = 0,058 > 0,01, нет оснований отвергать гипотезу HQ. 18.4. Решить задачу 18.3 при α = 0,1. Ответ: W{20,6) < 0,1. Гипотеза Н0 отвергается. 18.5. Решить задачу 18.3, используя нормальную аппроксимацию функции 1V(n, к) и таблицу значений функции Ф0(х). РЕШЕНИЕ. Вычислим при η = 20, μ = 6 значения jcj = 72μ +1,5 - J2(n - μ) - 0,5, χ2= 72μ+ 1,25 -λ/2(/ι -μ)-0,75. Имеем χχ = λ/2-6+ 1,5 - V2-(20-6)-0,5 = -1,57, χ2 = V2-6 + 1,25 - V2· (20 -6) -0,75 = -1,58. 271
Таккакх,е [-2,58; -1,64] и χ, ё [1,47; 2,58], ах2 е [-1,64; 1,47], следует воспользоваться формулой (18.2). Тогда Ж(20,6)-Ф(-1,58). Поскольку Ф(-1,58)=0,5-Ф0(1,58), по таблице 1 приложений находим Ф(-1,58) - 0,5 - 0,443 = 0,057. Так как W(20, 6) > α = 0,05, то гипотезу Н0 следует принять. 18.6. Для сравнения качества электрических чайников типов А и В одинаковой мощности проведены 50 экспериментов. Качество чайников сравнивалось по скорости доведения до кипения определенного количества воды. При этом оказалось, что ровно в 30 случаях вода в чайнике типа А закипала быстрее, чем в чайнике типа В. Используя нормальную аппроксимацию, проверить с уровнем значимости α = 0,1 гипотезу Н0: качество чайников не зависит от типа, против альтернативы Нъ\ качество чайника зависит от его типа. РЕШЕНИЕ. Будем считать эксперимент успешным, если вода в чайнике типа>4 закипела быстрее, чем в чайнике типа В. В данном случае η = 50, μ = 30. Для того чтобы воспользоваться нормальным приближением, вычислим при этих значениях хх и х2 (см. (18.1), (18.2)). Имеем х, = 72-30 + 1,5 - 72-20-0,5 = Лй5 - 739^5 « 1,557, х2 = 72-30+ 1,25 - 72-20-0,5 = 76^25 - 739^5 - 1,561, причемх^ [1,47; 2,58], ах2ё [—1,64; 1,47]. Следовательно, нужно воспользоваться приближенной формулой (18.1). Таким образом, *К(50, 30) - Ф( 1,557) = 0,5 + Ф0(1,557) = 0,5 + 0,442 = 0,942. Альтернативой является гипотеза Н3, поэтому нужно сравнить И^(50, 30) с 1 - а/2 = 1 - 0,05 = 0,95 и а/2 = 0,05. Поскольку 0,05 < < И^(50, 30) < 0,95, гипотезу Н0 нужно принять. 18.7. В условиях задачи 18,6 проверить гипотезу Н0: качество чайников не зависит от типа, против альтернативы Нх\ вода в чайнике типа>4 закипает быстрее, чем в чайнике типа В. Ответ: W(50, 30) = 0,942 > 1 - α = 0,9. Гипотезу Н0 нужно отвергнуть. 272
18.8. Решить при α = 0,01 задачу 18.7 в случае, когда количество экспериментов равно 40, причем в 25 из них вода в чайнике типа А закипала быстрее, чем в чайнике типа В. При решении воспользоваться нормальной аппроксимацией. Ответ: гипотезу Н0 следует принять. 18.9. Будем считать прогноз погоды на следующий день (относительно предсказываемой температуры) удачным, если истинная температура отличалась от предсказанной не более чем на 5 °С. За 100 дней было 60 удачных и 40 неудачных прогнозов. Проверить гипотезу Н0: вероятность удачного предсказания ρ = 0,5, против альтернативы Н2. ρ * 0,5 с уровнем значимости α = 0,1. РЕШЕНИЕ. Воспользуемся нормальной аппроксимацией. При η = 100, μ = 60 хх = Vl2U5 - V7975 =2,11е [1,47; 2,58]. Отсюда Ж(100, 60) «Ф(2,11) =0,9825. Поскольку Ж(100, 60) £ (а/2, 1 - а/2) = (0,05; 0,95), гипотезу #0 следует отвергнуть. 18.10. В условиях задачи 18.9 проверить гипотезу Н0: ρ = 0,5, против альтернативы Ηλ\ ρ > 0,5 с уровнем значимости α = 0,01. Ответ: гипотеза Н0 принимается. Критерий Вилкоксона для проверки однородности двух выборок Критерий Вилкоксона используют при решении следующего класса задач. Имеется две выборки: выборка Xl9 Х2, ... , Хп с неизвестной функцией распределения Fx(x) и выборка У,5 Y2, ... ..., Ymc неизвестной функцией распределения FY(x), причем т < п. Требуется указать правило, с помощью которого можно с вероятностью ошибки первого рода, не превосходящей заданного значения а, отличать гипотезу HQ: Fx(x) = FY(x) при всехх е (-°°, +°°) от одной из следующих гипотез: Hx\Fx(x) > FY(x) при всеххе (-оо?+оо); Н2\ Fx(x) < FY(x) привсеххе ί-00^00); H3:Fx(x)*FY(x). 273
В качестве критерия при решении указанных задач используют критерий Вилкоксона. Схема применения критерия Вилкоксона в предположении, что Xt Φ Yj при всех i,j, такова: 1. Убедиться, что т < п, и, в случае альтернатив Нх и Н3, вычислить значение 2МЖ= т (т + η + 1). 2. Записать данные Χν Х2,... ,Хп и У,, Υ2,..., Ym в сводную таблицу в порядке возрастания (18.3) 3. Выписать все значения rh записанные в этой таблице под буквами Y, и найти сумму TV=rx + r2 + ... + rm. 4. По таблице 12 приложений для критерия Вилкоксона вычислить для заданных «,^иа значение W^ = WKp(m, η, α) в случае альтернатив Ηλ и Н2, и W^{m, я, а/2) в случае альтернативы Ну 5. Принять или отклонить гипотезу Н0 по следующим правилам: Значение Выборка Ранг «1 X 1 а2 Υ 2 «3 Υ 3 α4 Υ 4 «5 Χ 5 ... ... ... ат +п Χ т + η i 1 2 3 Принимаем /f0 W< 2MW- fVK?(m, η, α) ИОЖкр(т,л,сс) W (m,n,a/2)<lV< <2MW- W^{m, η, α/2) Принимаем Ht W>2MW-WK!>(m,n,a) W<W^m,n,a) Wi \WKp(m,n, a/2) WKp(m,n, a/2] 6. Если η > 20, то при α < 0,5 следует воспользоваться приближенной формулой 1VKp(m,n,*)~mim + "2+l)-l-v(\-a)J»m(»>;2»+» = = Μ^-|-ψ(1-α)^, (18.4) где ψ(χ) — функция, обратная к функции распределения Ф(х) стандартного нормального закона (см. таблицу 4 приложений; \\f(x) = ux). Если Xt = Yj для некоторых i,j (или для групп значений / иу), то всем этим элементам присваивается ранг, равный среднему арифме- 274
тическому тех мест, которые они делят. Например, для выборок X: 3, 4, 6, 7 и Y: 3, 3, 3, 4, 7 получаем следующую таблицу: Значение Выборка Ранг 3 X 2,5 3 Υ 2,5 3 Υ 2,5 3 Υ 2,5 4 Χ 5,5 4 Υ 5,5 6 Χ 7 7 Χ 8,5 7 Υ 8,5 Если в группу совпавших элементов входят элементы только одной выборки, то пересчет производить не надо. Например, для выборок X: 3, 4, 4, 5; Υ: 3, 5 имеем таблицу Значение Выборка Ранг 3 X 1,5 3 Υ 1,5 4 X 3 4 X 4 5 X 5,5 5 Υ 5,5 Если количество совпадений мало (число элементов, «вовлеченных» в группы с совпадениями не превосходит 25% от суммы Ν = η + т), то можно использовать критерии и формулы, применявшиеся при отсутствии совпадений. Если же количество совпадений в разных группах велико, то при α < 0,5 и η > 20 можно использовать приближенную формулу иг < ч^/И(/И + /2+1)-1 JVKp(m, η, α) > -1 ^— -ψ(1-α) \mn(n + m + 1) 12 1 - P(n, m) Σ t.(t]-1)1 (18.5) /= ι где к — общее количество групп, состоящих из совпавших величин, t; — количество совпавших величин в группе с номером /, 1 р(л,/и) = (п + т + \)(п + т)(п + т — 1). 18.11. В ателье по ремонту телевизоров имеются данные о времени (в неделях) безотказной (до первого ремонта) работы девяти телевизоров марки А и восьми телевизоров марки В. При этом для телевизоров марки А указанное время составило (в порядке возрастания) 5, 12, 26, 50, 57, 110, 200, 230, 270 недель, а для телевизоров марки В — 1, 25, 31, 42, 54, 70, 250, 260 недель. Пусть FA (χ) — функция распределения длительности безотказной работы телевизоров марки A, a FB{x) — функция распределения длительности 275
безотказной работы телевизоров марки В. Используя критерий Вилкоксона, проверить с вероятностью ошибки первого рода, не превосходящей α = 0,1, гипотезу Н0: FA{x) = FB(x), против альтернативы Нх\ FA(x) >FB(x). РЕШЕНИЕ. Имеем: η = 9, т = 8. Поскольку альтернативой является гипотеза Hl9 вычисляем: 2M^=m(w + m + 1) =8· 18 = 144. 2. Записываем данные в сводную таблицу вида (18.3) в порядке возрастания: 1 в 1 5 А 2 12 А 3 25 В 4 26 А 5 31 В 6 42 В 7 50 А 8 54 В 9 57 А 10 70 В 11 по А 12 200 А 13 230 А 14 250 В 15 260 В 16 270 А 17 3. Суммируем все числа последней строки, стоящие под буквами В: W= 1+4 + 6 + 7 + 9+11 + 15+16 = 69. 4. По таблице 12 приложений находим И^кр(8, 9, 0,1) = 58. 5. Вычисляем разность 2MW- *Ккр(8, 9, 0,1) = 144 - 58 = 86. 6. Поскольку W=69< 86, нет оснований отвергать гипотезу Н0. 18.12. Испытания электронных ламп типов А и В на долговечность дали следующие значения длительности их работы (в сотнях часов). Для семи ламп типа А: 57, 58, 60, 63, 64, 100, 110; для 10 ламп типа В: 50, 52, 56, 59, 61, 65, 66, 67, 71, 76. Пусть FA(x) — функция распределения длительности безотказной работы ламп типа А\ FB(x) — функция распределения длительности безотказной работы ламп типа В. Проверить, используя критерий Вилкоксона с α = 0,05, гипотезу Н0: FA(x) = FB(x) против альтернативы FA(χ) > FB(x). РЕШЕНИЕ. 1. В данном случае т = 7, η = 10. Ясно, что альтернативной является гипотеза Н2. 2. Составляем общий вариационный ряд: 50 В 1 52 В 2 56 В 3 57 А 4 58 А 5 59 В 6 60 А 7 61 В 8 63 А 9 64 А 10 65 В 11 66 в 12 67 В 13 71 В 14 76 В 15 100 А 16 ПО В 17 276
3. Вычисляем W, выписывая все числа последней строки, стоящие под буквами А: W=A + 5 + 7 + 9 + 10 + 16 + 17 = 68. 4. По таблице 12 приложений находим ^кр(7, 10, 0,05) = 45. 5. Поскольку W=68> 45, нет оснований отвергать гипотезу Н0. 18.13. В результате пяти измерений гравитационной постоянной способом А получены следующие значения: 6,675, 6,676, 6,681, 6,683, 6,673, а четыре измерения способом В дали значения: 6,674, 6,682, 6,664, 6,661. Используя критерий Вилкоксона, проверить с α = 0,05 гипотезу Н0: FA{x) = FB{x) против альтернативы FA{x) < <FB{x). Ответ: W= 15, WK?(A, 5, 0,05) = 12. Гипотеза//0 принимается. 18.14. При исследовании концентрации некоторого элемента в сплавах А и В получены следующие результаты (в %). Для сплавав: 1.0, 2,0, 1,6, 2,1, 2,8, 3,5, 3,9, 3,5, 2,5; для сплава В: 2,5, 4,2, 1,2, 4,1, 1.1, 3,8, 1,0, 4,0, 1,5. Проверить, используя критерий Вилкоксона с α = 0,05, гипотезу Н0: концентрация элемента в сплавах А и В одинакова, против альтернативы Нъ\ концентрация элемента в сплавах разная. РЕШЕНИЕ. 1. В данном случает =л=9и2МЖ=9· (9+ 9+1) = = 171. 2. Составляем вариационный ряд и записываем ранги с учетом осреднения их значений при совпадении: 1,0 А 1,5 1,0 В 1,5 1,1 В 3 1,2 В 4 1,5 В 5 1,6 А 6 2,0 А 1 2,1 А 8 2,5 А 9,5 2,5 В 9,5 2,8 А 11 3,5 А 12 3,5 А 13 3,8 В 14 3,9 А 15 4,0 В 16 4,1 В 17 4,2 В 18 Заметим, что одинаковым значениям 3,5 и 3,5 были приписаны различные ранги только потому, что оба эти значения получены для сплавов типау4, следовательно, приписывание рангов 12 и 13 эквивалентно (с точки зрения вклада в окончательную сумму рангов) приписыванию рангов 12,5 и 12,5. Количество совпадений мало и можно использовать формулы, применявшиеся при отсутствии таковых. 3. Вычисляем сумму рангов концентраций сплава типа В: W= 1,5 + 3 + 4 + 5 + 9,5 + 14 + 16 + 17 + 18 = 88. 277
4. Имеем *Ккр(9,9,а/2) = Жкр(9,9, 0,025) = 62, 2МЖ- *Ккр(9, 9, 0,025) = 171 - 62 = 109. 5. Так как W= 99 е (62, 109), то гипотеза i/0 принимается. 18.15. При сравнении технологий АиВ добычи некоторого металла из каждой тонны однородной партии руды получено следующее количество продукта (в граммах). При применении технологии у4:4,0, 4,0, 4,1,4,5, 4,8, 5,1, 5,1, 6,0, 6,2; при применении технологии В: 3,9, 4,1, 4,1, 4,4, 4,7, 5,0, 5,2, 5,9, 6,1. Проверить, используя критерий Вилкоксона с α = 0,1, гипотезу Н0: технологии АиВ дают одинаковый выход металла против альтернативы Н2: технология А предпочтительнее технологии В (FA(x) < FB(x)). Ответ: ^VKp(9, 9,0,1) = 70 < WB. Нет оснований отвергать гипотезу Н0. 18.16. При сравнении скорости реакции двух пациентов на звуковой сигнал в различных условиях были получены следующие данные (в тысячных долях секунды): Номер опыта 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 А 140 163 171 182 190 209 217 218 223 241 265 270 274 275 287 В 142 159 173 185 186 213 220 208 205 244 259 279 288 281 289 Ранг Я 2 3 6 8 9 14 17 12 11 20 21 26 30 27 31 Номер опыта Ϊ* 17 18 19 20 21 22 23 24 25 26 27 28 29 А 290 302 321 329 330 331 338 341 344 345 350 355 361 372 В 285 300 317 334 336 333 340 343 342 357 343 358 390 383 РангЯ 28 33 35 41 42 40 44 47 46 53 48 54 58 57 С помощью критерия Вилкоксона проверить для α = 0,05 гипотезу Н0, согласно которой скорости реакций пациентов одинаковы, против альтернативы Hl9 согласно которой пациента реагирует на звуковой сигнал быстрее, чем пациент В. Использовать приближенную формулу (18.4). 278
РЕШЕНИЕ. 1. В данном случае η = т = 29, 2ΜίΚ = 29-59 = = 1711. 2 и 3. Выписываем ранги пациента В (см. столбец Ранг В из условия задачи) и вычисляем сумму W= 863. 4. Имеем РКкр(29, 29, 0,05) = 855,5 - 0,5 - ψ(0,95) V29 · 29 · 59/12 = 855 - -1,645-64,3=149,8. 5. Поскольку IV = 863 > Жкр(29, 29, 0,05) = 749,8, гипотезу Н0 следует отвергнуть. 18.17. Решить задачу 18.16, используя критерий знаков с ошибкой первого рода α = 0,05 ( см. § 18.1). РЕШЕНИЕ. Обозначим знаком + результаты опытов, в которых пациент А среагировал на звук быстрее пациента В. Из условия задачи 18.16 вытекает, что величина μ (количество знаков +) равна 19. Используя таблицу вида (18.3) и формулу (18.4), находим χ, = «/2μ + 1,5 - 72(«-μ)-0,5 = 739^5 - Jl%5 = 1,869, х2= л/39^5 - λ/Ϊ9^5 = 1,877. Поскольку хх е [1,47; 2,58], воспользуемся формулой (18.1) W{29, 19) - Ф( 72μ+ 1,5 - 72(Λ-μ)-0,5 ) = Ф( 1,869) - 0,969. Так как Ж(29, 19) = 0,969 > 1 - α = 0,95, гипотезу Н0 следует отвергнуть. 18.18. При сравнении двух методов производства азотной кислоты путем окисления амина кислородом воздуха было получено (с точностью до десятых долей грамма) следующее количество продукта: при использовании метода Л (22 опыта): 89,2, 89,3, 89,8, 89,8, 90,5, 90,5, 91,0, 91,0, 92,0, 93,0, 93,0, 94,0, 94,5, 94,5, 95,0, 96,0, 97,0, 97,5,97,5,98,0, 100,0, 101,0; при использовании метода В (18 опытов): 88,0, 89,3, 89,3, 89,3, 89,9, 90,5, 91,0, 91,5, 93,0, 93,5, 94,0, 94,5, 94,5, 95,0, 97,0, 97,5, 99,0, 99,0. Применяя метод Вилкоксона с α = 0,05, сравнить гипотезу HQ: выход продукта не зависит от выбранного метода, с гипотезой Н2: выход продукта при использовании метода А больше, чем при использовании метода В. РЕШЕНИЕ. 1.В рассматриваемом случае η = 22, т = 18. 279
2. Объединяя результаты полученных измерений, строим таблицу: Результат 88,0 89,2 89,3 89,3 89,3 89,3 89,8 89,8 89,9 90,5 90,5 90,5 91,0 91,0 91,0 91,5 92,0 93,0 93,0 93,0 Метод В А А В В В А А В А А В А А В В А А А В Ранг Ϊ 2 4,5 4,5 4,5 4,5 7 8 9 11 И 11 14 14 14 16 17 19 19 19 Результат 93^ 94,0 94,0 94,5 94,5 94,5 94,5 95,0 95,0 96,0 97,0 97,0 97,5 97,5 97,5 98,0 99,0 99,0 100,0 101,0 Метод В А В А А В В А В А А В А А В А В В А А Ранг 21 22,5 22,5 25,5 25,5 25,5 25,5 28,5 28,5 30 31,5 31,5 34 34 34 36 37 38 39 40 Если обозначить через Xколичество продукта, получаемого методом^, а через Y— методом В, то задача принимает вид Щ. Fx{x) = FY(x), H2: Fx(x) < Fy(x). 3. Вычисляя величину TV, исходя из построенной таблицы, получаем W— 342,5. 4. Поскольку количество совпадений велико, для вычисления 1VKp(m, n, α) используем приближенную формулу (18.5). Имеем: к = 9, /, = 4, t2 = t3 = t4 = 3, t5 = 2, t6 = 4, t7 = ts = 2, ц = 3. Далее получаем Σ /Д/2 _ΐ) = 3·2(22-1) + 3·3(32-1)+3·4(42-1)=270, ι=1 * 18 =(22 + 18 + 1)(22 + 18)(22+18- 1)= 63 960. Таким образом, ллг /ίο от лла 18-41-1 ,л ... Ιΐ8·22·4ΐΛ 270 \ ^(18,22,0,05) = 3 Ψ(0,95)^ п ^i_gJ^j = = 368,5 - 1,645 · 36,705 = 308,12.
Сравниваются гипотезы Н0 и Н2, и W— 342,5 > Жкр( 18, 22,0,05) = = 308,12, поэтому, в соответствии с рекомендациями, приведенными в начале § 18.2, гипотезу Н0 следует принять. Ранговая корреляция по Спирмену Методы исследования зависимости тех или иных свойств или характеристик объектов или индивидуумов, опирающиеся на ранговую корреляцию, применяются в следующей ситуации. Имеется η объектов или индивидуумов, каждому из которых присущи два качественных признака (быть может, не выраженных количественно). Совокупность индивидуумов может быть упорядочена как в порядке возрастания «качества» первого признака, так и в порядке возрастания «качества» второго признака. Требуется выяснить, коррелированы или нет (зависимы или нет) указанные признаки. Для проверки такого рода предположений применяют критерий, в котором используются коэффициенты ранговой корреляции Спирмена τ5. Схема вычислений этих коэффициентов такова. 1. Занумеровать исследуемые объекты (индивидуумы) числами от 1 дол. 2. Упорядочить (ранжировать) индивидуумы в соответствии с убыванием «качества» первого признака, приписав им последовательно числа 1, 2, ... , п. В случае совпадения «качества» признака у двух или более индивидуумов приписать каждому индивидууму однородной группы ранг (число), равный среднему арифметическому значений тех мест, которые они делят. 3. Выполнить п. 2 для второго признака. 4. Записать данные в таблицу: Порядковый номер индивидуума Ранг первого признака Ранг второго признака 1 *1 2 х2 Уг 3 х3 Уз ... ... η Хп Уп 5. Пусть тх — количество различных рангов первого признака (количество различных чисел среди jcl5 х2, ... ,х„), а т2 — количество различных рангов второго признака (количество различных чисел средиУ\,у2,... ,Уп)· Если т, = т2 = η,τ. е. нет индивидуумов с совпадающими рангами хотя бы по одному признаку, то х'=1-ЦГГ-пк{Х1~У,)2' (18,6) 281
В противном случае необходимо сначала вычислить величины ι т\ ι т2 Γι = ϊ2 ,5 (пи~пи)> Тг=п £ {nb~n2t)> (18.7) где niv /=1,2; / = 1, 2, ... , mi — количество элементов, входящих в t-ю группу, неразличимых относительно /-го признака индивидуумов, а затем положить \{Ш-п)- ±{Xi-yi)2-Tx-T2 TS= , = 1 · (18.8) ^(я'-я)-2Г1^(Я3-Л)-2Г2 Опишем теперь критерий, в котором используется величина τ^. В его основе лежит следующая идея: если рассматриваемые признаки независимы, то величина р^ = Μτ^ должна быть равна нулю. Поэтому проверка с ошибкой первого рода α гипотезы Н0 о некоррелированности исследуемых признаков против альтернатив Hl9 Н2, Нъ соответственно о положительной, отрицательной коррелированное™ признаков и о наличии корреляции сводится к проверке гипотез ^,:р,>0; #2:р,<0; #3:р,*0. принятие или отклонение которых производится в соответствии с таблицей i 1 2 3 Принимаем Н0 К\ < "α/2,s Принимаем Ht K\ > "α/2,., Здесь величина иа находится с помощью таблицы 11 приложений. При η > 10 распределение величины tsJn — 1 практически не отличается от стандартного нормального распределения, и в этом случае для вычисления иа s можно воспользоваться соотношением ua,s = va/V« — 1, где va = и{ _а — квантиль уровня 1 — α для стандартного нормального распределения. 18.19. В таблице приведена относительная оценка знаний по математике и литературе восьми учеников, занумерованных чис- 282
лами от 1 до 8, причем лучшим знаниям соответствует меньший ранг: Ученик Ранг знаний по математике Ранг знаний по литературе 1 5 4 2 2 3 3 1 2 4 7 1 5 8 7 6 4 6 7 6 5 8 3 8 Проверить, используя коэффициент ранговой корреляции Спирмена, гипотезу Н0: между успехами по математике и литературе нет корреляции против альтернативы Нх\ успехи по математике и литературе положительно коррелированы. Принять α = 0,1. РЕШЕНИЕ. В данном случае η = 8, повторений рангов нет, вычисления проводим по формуле (18.6). Составляем таблицу квадратов разностей соответствующих рангов: Ученик (xt-Уд2 1 I2 2 (-D2 3 (-D2 4 б2 5 I2 6 (-2)2 7 I2 8 (-5)2 Σ 70 Таким образом, τ. = ! - 8^8 * 70 = 1 - | = 0,1667. Поскольку альтернативной является гипотеза Н{9 в таблице 11 приложений находим «0 j = 0,4762. В силу неравенства τ5 = 0,1667 < < ио, ι, s= 0,4762, нет оснований отвергать гипотезу Н0. 18.20. Относительная оценка знаний математики и физики в группе из семи учеников дала следующие результаты: Ученик Ранг знаний по математике Ранг знаний по физике 1 5 4 2 7 6 3 1 3 4 4 5 5 2 1 6 3 2 7 6 7 Проверить с уровнем значимости α = 0,05 гипотезу Н0: корреляция между успехами на уроках физики и математики равна нулю против альтернативы Н3: успехи по математике и физике имеют ненулевую корреляцию. 283
РЕШЕНИЕ. Так как ранги не повторяются, то используем формулу (18.6). Таблица квадратов разностей рангов имеет следующий вид: Ученик &,-у,)2 1 I2 2 I2 3 (-2)2 4 (-D2 5 I2 6 I2 7 (-D2 Σ 10 Отсюда при η = 7 находим Т*=1-Я~7#10=1"2§ =0>8214· Поскольку иа/2 = «0,05, ^ = 0,7450 при η = 7 и |tJ = 0,8214 > и0, гипотеза 7/0 отвергается. 18.21. В конкурсе красоты участвовали 10 девушек. Разыгрывались призы жюри и зрителей. Места, присужденные девушкам жюри и зрителями, записаны в таблицу в соответствии с номерами участниц: Участница Место, присужденное зрителями Место, присужденное жюри 1 10 8 2 7 2 3 8 9 4 2 6 5 5 4 6 1 5 7 6 3 8 3 7 9 9 10 10 4 1 Проверить с уровнем значимости α = 0,1, используя коэффициент ранговой корреляции по Спирмену, гипотезу Н0: мнения членов жюри и зрителей независимы против альтернативы Ηλ. мнения членов жюри и зрителей положительно коррелированы. Ответ: xs = 0,4061; иоох = 0,4424. ГипотезаН0 принимается. 18.22. При дегустации девяти видов напитков два дегустатора выставили анализируемым напиткам (в порядке дегустации) по де- сятибальной шкале следующие оценки: Напиток Оценка первого дегустатора Оценка второго дегустатора 1 6 5 2 5 8 3 2 3 4 8 7 5 9 8 6 5 6 7 6 6 8 7 6 9 7 7 284
Проверить, используя коэффициент ранговой корреляции Спир- мена, гипотезу Н0: оценки дегустаторов независимы, против альтернативы Нх\ оценки дегустаторов положительно коррелированы. Взять уровень значимости α = 0,05. РЕШЕНИЕ. Исходные данные необходимо проранжировать, учитывая совпадения некоторых оценок. Первый дегустатор выставил т j = 6 различных оценок. Ранжируя напитки по убыванию оценок с учетом совпадений, получаем таблицу: Напиток Ранг 1 5,5 2 7,5 3 9 4 2 5 1 6 7,5 7 5,5 8 3,5 9 3,5 Второй дегустатор выставил т2 = 5 различных оценок, ранжировка в соответствии с которыми приводит к следующей таблице: Напиток Ранг 1 8 2 1,5 3 9 4 3,5 5 1,5 6 6 7 6 8 6 9 3,5 Окончательно получаем Напиток Ранг у первого дегустатора Ранг у второго дегустатора 1 5,5 8 2 7,5 1,5 3 9 9 4 2 3,5 5 1 1,5 6 7,5 6 7 5,5 6 8 3,5 6 9 3,5 3,5 Поскольку имеются совпадения рангов, значение τ5 нужно вычислять по формуле (18.8), учитывая при этом формулу (18.7). Так как nft - nit = 0, если nit = 1, то при нахождении Тх и Т2 по формуле (18.7) нужно принимать во внимание лишь те слагаемые, для которых nit > 2. В силу того, что ранги 3,5, 5,5 и 7,5 встречаются у первого дегустатора по два раза, а ранги 1,5, 3,5 и 6 встречаются у второго дегустатора соответственно по два, два и три раза, имеем Γ1 = 1.3·(23-2) = 1,5, Г2=1(2.(23-2) + (33-3))=3, Σ (Х/-У/)2= (-2,5)2 + 62 + 02+ (-1,5)2+ (-0,5)2+ (1,5)2 + + (-0,5)2+(-2,5)2 +О2 = 53,5. 285 9 Σ ι=1
По формуле к (18.8) находим V- 9) -53,5 -1,5-3 Л, τ. = -,—= = —, ■ = ° ,— - 0,5368. J{(„.9)_2.u.^(9.-9)-2.3 ^^ По таблице 11 приложений находим, что для η = 9 и α = 0,05 величина и = «о,05,5 = 0,5833. Поскольку xs = 0,5368 < и0,05, j = 0,5833, гипотеза i/0 принимается. 18.23. Проверка готовности семи школьных кабинетов к учебному году проводилась комиссией в составе двух человек. Каждый член комиссии оценивал готовность кабинета по десятибальной системе. Результаты их работы приведены в таблице: Номер кабинета Оценка первого члена комиссии Оценка второго члена комиссии 1 8 6 2 7 6 3 10 9 4 7 7 5 3 4 6 8 8 7 9 10 Проверить, используя коэффициент ранговой корреляции Спирмена, гипотезу Н0: оценки членов комиссии независимы, против альтернативы Нх\ оценки членов комиссии положительно кор- релированы. Взять уровень значимости α = 0,05. Ответ: τ5 = 0,8441, uQQ5= 0,6786. Гипотеза Н0отвергается. 18.24. Двенадцать однородных предприятий были проранжи- рованы сначала по степени оснащенности их вычислительной техникой, а затем по степени эффективности их функционирования за рассматриваемый период. Результаты приведены в таблице: Предприятие Оснащенность Эффективность I 1 2 2 2 4 3 3,5 1 4 3,5 6 5 6 3 6 6 6 7 6 9,5 8 8,5 9,5 9 8,5 12 10 10 8 11 11 11 12 12 6 Проверить, используя коэффициент ранговой корреляции Спирмена и нормальное приближение, гипотезу Н0: оснащенность предприятий вычислительной техникой не влияет на эффектив- 286
ность работы предприятий против альтернативы Ну между оснащенностью предприятий вычислительной техникой и эффективностью их функционирования имеется положительная корреляция. Взять α = 0,05. РЕШЕНИЕ. Используя формулу (18.8), учитывая при этом формулу (18.7), при η = 12 получаем Г, = 1(2-(23-2) + (33-3))=3, Г2=1((23-2) + (33-3))=2,5, |, (*/-У/)2 = (-D2 + (~2)2 + (2,5)2 + (_2)5)2 + 32 + ' + О2 + (-3,5)2 + (-Ι)2 + (-3,5)2 + 22 + О2 + б2 = 92, 7(123-12)-92-3-2,5 τ,= =0,6720. ^(123-12)-2.3^(123-12)-2.3,5 Как отмечалось в начале данного параграфа, при η > 10, вычисляя и0,05, j' можно воспользоваться нормальной аппроксимацией, согласно которой иа ~ va/Jn — 1, где να находится по таблице 2 приложений. В данном случае «0,05,5^405/^^1 = 1,645/ЛТ =0,4960. Поскольку τ5 = 0,6720 > и005 = 0,4960, гипотеза Н0 отвергается. 18.25. В одном из разделов выставки кошек представлены одиннадцать животных, которым по жребию присвоены номера от 1 до 11. Их экстерьер оценивался двумя экспертами по десятибальной системе. Результаты работы экспертов приведены в таблице: Номер животного Оценка первого эксперта Оценка второго эксперта 1 7 8 2 5 8 3 9 9 4 10 7 5 3 6 6 6 4 7 8 7 8 5 7 9 2 5 10 7 3 11 7 5 Проверить с уровнем значимости α = 0,05 гипотезу Н0: оценки экспертов статистически независимы против альтернативы Нх\ 287
оценки экспертов отрицательно коррелированы. При вычислении иа использовать нормальную аппроксимацию. Ответ: 7^ = 2,5, Г2 = 3, Σ (χ7-^)2= 148, τ, = 0,3100, waj = ι = 1 ' = 0,5201. Гипотеза Н0 не отвергается. 18.26. В условиях задачи 18.25 проверить с уровнем значимости a = 0,1 гипотезу Н0: оценки экспертов статистически независимы, против альтернативы Нъ\ оценки экспертов имеют ненулевую корреляцию. При вычислении и использовать нормальную аппроксимацию. Ответ: гипотеза /У0 не отвергается.
МЕТОД НАИМЕНЬШИХ <^0> КВАДРАТОВ И РЕГРЕССИЯ \У Глава К кругу задач, решаемых методом наименьших квадратов, относятся задачи следующего типа. Переменная у связана с переменной χ функциональной зависимостью^ =/(х). Однако эта зависимость известна с точностью до коэффициентов. Так, например, функция f(x) может иметь вид а0 + ахх, aQ + ахх + а2х2 и т. д., при этом конкретные значения а0, ах, а2 неизвестны. Для определения явного вида зависимости в каждой из заданных точек xi9 i = 1, ... , η измеряется значение yi =/(x/), но не точно, а с ошибкой δ;. В результате наблюдатель имеет в своем распоряжении величины η/=^/ + δ,=/(χ,)+δ/, 1 = 1,..., л, используя которые необходимо построить оценки неизвестных коэффициентов. Методом наименьших квадратов в качестве оценок неизвестных коэффициентов выбираются такие числа, которые минимизируют величину Σ (η,·—/(χ·))2. / = 1 Метод наименьших квадратов для простой линейной регрессии Построение оценки простой линейной регрессии Простая линейная регрессия соответствует случаю f(x) = = а0 + ахх. Предполагается, что в представлении т\; = а0 + ахХ; + Ь(, /=1,... ,л, (19.1) случайные ошибки δ,- независимы, Μδ, = 0, ϋδ; = σ2. Иными словами, систематическая ошибка в измерениях отсутствует, а разброс (дисперсия) ошибки измерения не зависит от точки, в которой проводятся измерения. 10-1605 Ватутин 289
В качестве оценок параметров а0 и ах используют величины а0 и А П ах, минимизирующие сумму Σ (η, — а0 — а{х)2. Такими значения - ι = 1 ми являются величины η Σ(*/-*)η/ А / = 1 1 " а, = , χ = - Σ χ/, Σ(*,·-*)2 /= 1 A 1 " A _ _ A _ aQ=- Ση,-ύ,χ^-β,χ. Вместо представления (19.1) чаще используют запись регрессии η/ = Λ+^ι(^/-^)+δ/ (19.2) с очевидной связью а1=А1иа0=А0 — А1х. Оценками параметров А0иАх являются величины η Σ (*/-*)η,- Л = Цг > 4) = η· (19.3) Σ(*,·-*)2 i= 1 Причина перехода от представления (19.1) к представлению (19.2) кроется в том, что если ошибки δ, имеют нормальное распределение с параметрами 0 и σ2, то случайные величины А0 и Ах независимы и нормально распределены, причем η η Σ (xi - *)Уг Σ (*ί - *)(4) + Ax{Xt - Χ)) ΜΑΧ = ^ = ^ Αν Σίχΐ-χ? Σ {*ι-*)2 / = 1 i = Ι D^-й—^ (19.4) Σ(χ>-χ)2 ί= ι и ΜΑ0 = Α0, ΌΑ0 = σ2/η. (19.5) 19.1. В книге «Основы химии» Д. И. Менделеев приводит следующие экспериментальные данные о количестве η азотно-натрие- вой соли, которое можно растворить в 100 г воды в зависимости от температуры х: 290
xi Л/ 0 66,7 4 71,0 10 76,3 15 80,6 21 85,7 29 92,9 36 99,4 51 113,6 68 125,1 Предполагая, что зависимость между рассматриваемыми величинами имеет вид у = а0 + агх, оценить параметры а0иа{. РЕШЕНИЕ. В данном случае η = 9, χ = 26. Запишем интересующую нас регрессию в виде у=А0 + А1(х-26). (19.6) Воспользовавшись данными, приведенными в условии задачи, по формулам (19.3) находим η = Ι Σ ^ = 90,15 = 4,, Σ (χ,- χ)2 = 4060, У ι=1 /=1 Σ (χ, - χ )η,= 3534,8, Λ, = 0,87. i=\ Таким образом, у (χ) = 90,15 + 0,87(х - 26) = 67,53 + 0,87х. 19.2. При изучении характера влияния количества ингибитора (замедлителя реакции) на длительность процесса химической реакции получены следующие данные (в условных единицах): Количество ингибитора Время (с) до завершения реакции (η,.) 11 11,55 15 15,50 17 17,95 19 18,30 22. 23,00 25 23,90 29 28,00 30 29,70 Предполагая, что зависимость длительности реакции у от количества ингибиторах имеет виду = а0 + а{х, оценить параметры а0 и av Ответ: у(х) = 1,64 + 0,92*. Построение доверительных интервалов для параметров простой линейной регрессии Если ошибки измерений δ,- в (19.2) распределены нормально с параметрами 0 и σ2, то А{ и А0 распределены соответственно по за- fc2 λ конам о№(А19 Dy4j) и cN(A0, I — J, где \УАХ вычисляется по формуле 291
(19.4). Следовательно, доверительные интервалы для Ах и А0 с уровнем доверия 1 — 2а при известном σ2 имеют вид (см. задачу 16.77) V"i-a , С <^1<Л + "|-« , σ ; (19.7) Σ(*,·-*)2 ί(*,·-*)2 Λ-".-αΤ<^0<Λ + ".-αΤ' (19·8) где ир — квантиль стандартного нормального распределения уровня/?. Пусть у(х)=А0 + А1х и S2=—^ .Σ (η.-д>(*.))2. Если величина σ2 неизвестна, то = Ρ{τη_2<χ}, (19.9) где, как и прежде, τη _2 — случайная величина, имеющая распределение Стьюдента с η — 2 степенями свободы. Поэтому (см. задачу 16.85) с вероятностью 1 — 2а интервал (A -t S A +/ S Σ(*/-*)2 Σ(*,·-*)2 содержит параметр А и и с той же вероятностью 1 — 2а интервал {A°~tl-a-"-27n'Ao + tl-a'"-2Tn) накрывает неизвестный параметр А0. 19.3. Предполагая, что величины η;. из задачи 19.1 имеют вид η,- = А0 + Ах{х — 26) + δ;., где ошибки измерений δ;· распределены нормально с параметрами 0 и σ2, построить доверительные интервалы для параметров А, и А0 с уровнем доверия 1 — 2а = 0,9, если известно, что σ2 = 4. 292
РЕШЕНИЕ. В данном случае α = 0,05. Отсюда и из таблицы4 приложений находим: «1-α = «095 ~ 1,65. Используя результаты задачи 19.1, имеем Σ (х/-3с)2 = 4060, у?! = 0,87, А0 = 90,15, *'-«!* σ =1-65'До=0-06-^-^ = и65"-з=1Д· Σ(*/-*)2 Учитывая формулы (19.7) и (19.8), находим искомые доверительные интервалы: 0,87 - 0,06 = 0,81 < Ах < 0,87 + 0,06 = 0,93, 90,15 - 1,1 = 89,5 <А0 < 90,15 + 1,1 = 91,25. 19.4. Решить задачу 19.3 в предположении, что дисперсия ошибок σ2 неизвестна. РЕШЕНИЕ. Используем соотношение (19.9). В данном случае η = 9. Вычислим значения функции у(х) =А0 + Ах(х-26)= 90,15 + 0,87(х - 26) в точках хг Тогда */ y(xt) (TW(*/))2 0 57,58 83,17 4 71,10 ю-4 10 76,23 5-ΙΟ"4 15 80,58 4-ΙΟ"4 21 85,80 ю-2 29 92,76 2-ΙΟ"2 36 98,85 3-Ю"1 51 111,90 2,89 68 126,69 2,53 Отсюда S2 = ^2 |, <^ " У <х<>>2 = 7 '88'93 = 12'7· Пусть tx _ а п — квантиль уровня 1 — α для распределения Стью- дента с η степенями свободы. В силу формулы (19.9), P{J~n\A0-A0\<St]_an_2} = l-2a, р{ /Д(хг-х)2Й,-^11<Л1-а,„-2}=1-2а. 293
По таблице 6 приложений находим, что при η = 9 и α = 0,05 величина tx_a п_2 = ^о,95,7 = 1>895. Таким образом, искомые доверительные интервалы с учетом результатов задачи 19.2 имеют вид AQ- 1,895· f <Л0 + 1,895· |* Ах - 1,895 · -^= < Ах < Ах -г 1,895 · -Д= 1 74060 l 1 V4060 или 87,90 <Л0< 92,40; 0,76 <АХ < 0,98. 19.5. Предполагая, что величины η, из задачи 19.2 имеют вид η,. = = А0 + Ах (х — 26) + δ,·, где δ, распределены нормально с параметрами 0 и σ2, построить доверительные интервалы для Ах и у40 с уровнем доверия 0,95, если σ2 = 9. Ответ: 0,59 <АХ < 1,25; 18,92 <А0< 23,64. Совместная доверительная область для параметров простой линейной регрессии Сумма σ2 σ2 имеет распределение χ2 с двумя степенями свободы, а величина lJn(A0-A0Y+ £(х>-х)2(Ах-Ах)1 S2 — распределение Снедекора с 2 и я - 2 степенями свободы (см. § 16.5). Совместная доверительная область Ю для параметров Ах и А0 с уровнем доверия/? имеет следующий вид: а) если величина σ2 известна, то D= 1(А,,АХ): (Ах- АХУ Σ (х^ х)2 ^ п(А0- А0)2<а2%12 1; (19.10) б) если величина σ2 неизвестна, то Ό=\(Α0,Αι):(Αι-Α])ΐΣ (χ,-χ)2 +n(A0-A0)2<2S?Fp^„_2\. (19.11) 294
19.6. В условиях задачи 19.1 построить совместную доверительную область для параметров А0 и Ах с уровнем доверия 0,95. Считать, что σ2 = 4. РЕШЕНИЕ. В данном случае/? = 0,95, η = 9 и (см. таблицу5 приложений) Хо,95;2 = 5,99. Отсюда, учитывая результаты задачи 19.1 и соотношения (19.10), получаем © = {(А0, Ах)\ (Ах - 0,87)2 · 4060 + (А0 - 90Д5)2 · 9 < 23,96}. 19.7. Решить задачу 19.6 при неизвестном значении σ2. РЕШЕНИЕ. Имеем/? = 0,95, η = 9. По таблицам для распределения Снедекора (таблица 7 приложений) находим Т7^ 95; 2 7 = 4,74. Отсюда, учитывая (19.11), получаем Ό = {(Α^ΑΧ)\ (Ах -0587)2·4060 + (ν40-90,15)2·9< 60,198}. 19.8. В условиях задачи 19.2 построить совместную доверительную область для параметров А0 и А х с уровнем доверия 0,9. Величина σ2= 0,5. Ответ: Ю = {(А0,АХ): (Ах - 0,92)2·318 + (А0- 21)2·8 < 2,91}. 19.9. В условиях задачи 19.2 построить совместную доверительную область для параметров А0 и Ах с уровнем доверия 0,9. Величина σ2 неизвестна. Ответ: Ю={(А09АХ): (Ах - 0,92)2·318 + (А0- 21)2· 8 < 3,78}. Проверка статистических гипотез о параметрах простой линейной регрессии Если нас интересует, принимают или нет параметры АхиА0 какие-нибудь конкретные значения Вх и В0, то критерий (правило) принятия или отклонения гипотез Н0: Ах = Вх, Н$ : А0 = В0 соответственно против альтернатив Нх\ Ах * Вх, Hq = А0 * В0 с ошибкой первого рода α имеет следующий вид. 1) Если величина σ2 известна, то гипотеза Н0 принимается при l^i -Ax\ ji (χ,·-χ)2 <aw1_a/2 и отвергается, если это неравенство не выполняется (как и прежде, ир — квантиль уровня ρ для стандартного нормального распреде- 295
ления). В тех же условиях (σ2 известно) гипотеза Н$ принимается, если \BQ-A0\Jn <σί/1_α/2, и отвергается, если это неравенство не выполняется. 2) Если величина σ2 неизвестна, то гипотеза HQ принимается при 1*1 "ΛιΙ [ί (*/-*)2 <^1-α/2,«-2' (19.12) а гипотеза Н$ принимается, если |^0-Λ|^<Λ1_α/2>/Ι_2, (19.13) где t п — квантиль уровня ρ для распределения Стьюдента с η степенями свободы. Невыполнение неравенства (19.12) влечет принятие гипотезы Нь а неравенства (19.13) — принятие гипотезы Я*. 19.10. В условиях задачи 19.1 проверить гипотезу Н0: Ах = 0,9 против альтернатив Н{. Αλ Φ 0,9 с ошибкой первого рода α = 0,2. Положить σ2 = 4. РЕШЕНИЕ. Поскольку |0,9 - Ах\74060 = 0,02 · 74060 = 1,27 < и09с = 1,28 · 2 = 2,58, гипотеза Н0 принимается. 19.11. В условиях задачи 19.1 проверить гипотезу Н$\ А0 = 91, против альтернативы Н\: А0 Φ 91 с ошибкой первого рода α = 0,1. Положить σ2 = 1. РЕШЕНИЕ. В данном случае η = 9 и |91 -AQ\Jn = 2,55 > и095 · σ = 1,65 · 1 = 1,65. Гипотеза Hq отвергается. 19.12. Решить задачу 19.10, считая, что значение σ2 неизвестно. РЕШЕНИЕ. Как показано в задаче 19.4, S2 = 12,7, кроме того, /09;7 = 1,415. Поскольку |0,9-^74060 = 1,27 </0 9 7-^ = 5,04, гипотеза Н0 принимается. 296
19.13. Решить задачу 19.11, считая, что значение σ2 неизвестно. РЕШЕНИЕ. |91 - А0\л/9 =2,55 < /095;7 · S = 1,895 · 3,56 = 5,75. Гипотеза Hq принимается. 19.14. В условиях задачи 19.2 проверить гипотезу Н0: А = 1 против альтернативы Нг: Аф1с ошибкой первого рода α = 0,02. Ответ: гипотеза Н0 отвергается. 19.15. В условиях задачи 19.2 проверить гипотезу Hq\ А0 = 20 против альтернативы Н\: А0 * 20 с ошибкой первого рода α = 0,02. Ответ: гипотеза Hq принимается. 19.16. Решить задачу 19.14, считая значение величины σ2 неизвестным. Ответ: гипотеза Н0 отвергается. 19.17. Решить задачу 19.15, считая значение величины σ2 неизвестным. Ответ: гипотеза Hq принимается.
ПРИЛОЖЕНИЯ Ί. Квантили tpn распределения Стьюдента S(n) >^^ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,900 здш 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 0,950 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 0,975 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 0,990 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,639 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 0,995 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 Примечания: 1) Для малых значений ρ квантили tp n находят по формуле tpn = -tx_pn. 2) При η > 30 можно использовать приближенное соотношение t п ~ ир. Φ
5 ■о ι Φ *«—»ο e S S υ ζ > ■9- Κ S Ζ φ τ α ζ ГМ Сотые доли ON 00 t^ чо »n ч- СП CN - о Η 0,0359 0,0753 0,1141 0,0319 0,0714 0,1103 0,0279 0,0675 0,1064 0,0239 0,0636 0,1026 0,0200 0,0596 0,0987 0,0160 0,0557 0,0948 0,0120 0,0517 0,0910 0,0080 0,0478 0,0871 0,0040 0,0438 0,0832 0,0000 0,0398 0,0793 о" о' о" 0,1517 0,1879 0,2224 0,1480 0,1844 0,2190 0,1443 0,1808 0,2157 0,1406 0,1772 0,2123 00 ЧО ОО ЧО СП ОО СП t^ О Ч Ч °1 о" о' о" 0,1331 0,1700 0,2054 0,1293 0,1664 0,2019 1П ОО 1П in <N ОО (Ν ЧО ON о" о' о" 0,1217 0,1591 0,1950 0,1179 0,1554 0,1915 СП^ ^ 1П^ о" о" о" 0,2549 0,2852 0,3133 0,2517 0,2823 0,3106 0,2486 0,2794 0,3078 0,2454 0,2764 0,3051 0,2422 0,2734 0,3023 ON СП 1П ОО О ON СП Г* ON <Ν^ (Ν <Ν^ о" о' о" t^ СП t^ in t^ чо СП ЧО ON ο" ο' ο" 0,2324 0,2642 0,2939 0,2291 0,2611 0,2910 0,2257 0,2580 0,2881 ЧО^ Г^ ΟΟ^ ο" ο' ο" 0,3389 0,3621 0,3365 0,3599 0,3340 0,3557 0,3315 0,3554 0,3289 0,3531 0,3264 0,3508 0,3238 0,3485 0,3212 0,3461 0,3186 0,3437 0,3159 0,3413 ON Ο^ ο"—~ 0,3830 0,4015 0,4177 0,3810 0,3997 0,4162 0,3790 0,3980 0,4147 0,3770 0,3962 0,4131 0,3749 0,3944 0,4115 0,3729 0,3925 0,4099 0,3708 0,3907 0,4082 0,3686 0,3888 0,4066 0,3665 0,3869 0,4049 0,3643 0,3849 0,4032 4 °Ι *Ί> 0,4319 0,4441 0,4545 0,4306 0,4429 0,4535 0,4292 0,4418 0,4525 0,4279 0,4406 0,4515 0,4265 0,4394 0,4505 0,4251 0,4382 0,4495 0,4236 0,4370 0,4484 0,4222 0,4357 0,4474 0,4207 0,4345 0,4463 0,4192 0,4332 0,4452 ^ ιη чол 0,4633 0,4706 0,4767 0,4625 0,4699 0,4761 0,4616 0,4693 0,4756 0,4608 0,4686 0,4750 0,4599 0,4678 0,4744 0,4591 0,4671 0,4738 0,4582 0,4664 0,4732 0,4573 0,4656 0,4726 0,4564 0,4649 0,4719 0,4554 0,4641 0,4713 t^OO^ON^ 299
S I Я § η <υ 3 Сот ON oo f-^ ЧО *n 4- CO CN ^^ о у t^ t^ о ^н in ON 00 00 OO 4,4,4, о"о"о" CN ^" t^ ~- in oo oo oo oo ^ ^ ^ ooo MO^t О 1П 00 oo oo oo ^ ^ ^ ooo nvo^ О ^- oo 00 OO OO ^ ^ ^ ooo OO CN OO ON^ t^ t> oo oo 444 o"o"o" m oo in ON СП t^ t^ oo oo ^ ^ ^ ooo ocrt ~* oo со t^ t^ oo oo 444 o"o"o" со о oo OO CO ЧО t^ oo oo 444 о'о'о" OO ЧО ^t t^ <N40 t^ oooo ^t ^ ^ ooo CN — ^н t^(N\D t^ oo oo 444 o"o"o" Ο ~- CN CNCN CN ЧО ЧО CN —«со in ON ON ON ^ ^ ^ ooo CO *t ^ ^н CO 1П ON ON ON ^ ^ ^ ooo —'CN ON —«со -rt ON ON ON ^ ^ ^ ooo о ^ ^ ON ON ON ^ 44 °dor SO ON40 OCN «fr ON O^ ON 444 o"o"o" ^- t^ in Ο (Ν ^· ON ON ON ^t ^ 4fr ooo -^ 1П CO 0(N^t ON ON ON 444 о'о'о" OO CN ~- ONCN Tt OO ON ON ^ ^ 4fr ooo ЧО О О ONCN ^> OOON ON ^ ^ ^ ooo en oo oo on ^ со OO ON ON ^ ^ тг ooo со 4fr «П CNCN CN ^ ^ —« ЧО t^ OO ON ON ON 444 o"o"o" m m о ЧО t^ OO ON ON ON ^ ^ ^ ooo CN CN ON ЧО t^ t^ ON ON ON ^ ^ ^ ooo — ^н ON ЧО t^ t^ ON ON ON ^ ^ ^ ooo О OOO ЧО t^ t^ ON ON ON 444 o"o"o" ON ON t^ in\Ot^ ON ON ON ^ ^ ^ ooo t^ 00 t^ irj^O^ ON ON ON 444 o"o"o" ЧО t^ ЧО 1П ЧО t> ON ON ON ^ Tj- «fr o о о in ЧО in 1ПЧО Г* ON ON ON ^ ^ Tj- ooo rn<n^t 1П ЧО t> ON ON ON ^ ^ ^ ooo ЧО t^ OO CN CN CN ЧО О OO ON ON ON ^ Ti- о"о" in О OO ON ONON 44 o"o" 1П ON oo oo ON ON 44 o~o~ 1П ON oo oo ONON ^ ^ OO ^t ON OO OO ONON 44 o"o" ^- oo oo oo ONON ^ ^ OO m oo oo oo ONON 44 o"o" CN t^ 00 OO ONON T:1"4 o"o" CN t^ OO OO ONON ^ Tj- o о — t^ OO OO ONON ^ ^ OO ΟΝΟ cn m Η "О -1Й О GO d ζ φ CD fO α к φ S 9 Q. С О s IT ζ >ι e =r ζ ОС s ζ φ У η no 0,050 0,045 0,040 0,035 0,030 0,025 0,020 0,015 0,010 0,005 0,001 s 1,6449 1,6954 1,7507 1,8119 1,8808 1,9600 2,0537 2,1701 2,3263 2,5758 3,0902 s >. 300
4fr ON CN t^ ЧО CN ЧО СП Tf О СП 00 оо о ^ г- t^ СП 4fr ^· Ο in in ^- t^ t^ n(Nt^ ЧО 1П ^н ooo о oo o^ о CN <N40 en СП <N in oo сн чо oo—■ t^ t^ ON СП СП CN in in ЧО ON ON in ON ^" C^- 4fr ON ON О 1П CN —" О О СП ON СП <N <N ON СП in ^н —" OO OOO TfOVO CN ЧО CN О О OOO О ooo о OOO О OOO OOO OOO OOO OOO 0N40 4fr Г* СП О ON ON ^> ^ ^ CN О ^ CN ^- СП CN oox ^■ooo CN40 О CN-^ —' —" О О S4D —" *-ч ОО in CN О OOO О —" CN t^ 00 CN CN OO 888 ЧО —ι OO oo 88 OOO OOO OOO OOO OO ^-1^ t^ СНЧО ЧО 1ПО О —«CN CN in CN ON ^ CN О ООЧО OO ON СП —«oo OOO OOO ^чо СП ^ 00 О en О ooo" 2SS 00 00 4fr 00 00 ON t^ t^ СП ЧОЧО OO CHCH —· СП СП О ^н 1П СП чо*-<о OOO in О О OOO OOO OOO OOO OOO OOO ON o" 1П 0N40 ЧО 1П 4fr ОЧОЧО ^- СП ^ О CN О ^ —<0 ON—· CN SS8 o"o"o" О "t en О О О о о о^ол о" о" оо о" СП ЧО ON СП ^" Г^ ON ON СП ^ in ^· Tf" СП ^ ^- Г^ СП СНЧО CN 00 Г* ^ сП О О ооо ЧО CN ^н О 88 о о ооо ооо оо о" ON—· ЧО 1ПЧО ЧО ЧО Г* —ι ON^- CN ^- СП ~н ON t^ О СП ON t^ оо ^- О CN О О ооо ооо ооо оо чо^ о" — ON ON 00 CN t^ 00 ON 00 ЧО ЧО ЧО t^ ON СП ONCN О ^T CN ON ^н О О in СП О ООО о" о" о" о" о" о" о" СП ^ CN in CN 00 чо en in оо г* ЧО СП О Si ' 00 ЧО _) 1П —ι CN ~-Ό —' О О ооо ооо ооо о" CN СП СП СП ~нЧО О 00 СП г^ чо in чо^с^о^ о" о" о" о" о" о" СП о" CN 1П т1" 00 CN СП OCN СП Tj- CNCH t^CN^O^ о" о" о" о~ о~ о~ о" СП 1П 00 ON4D ^ t^ СП ОО 00 СП ЧО ^ О —'ЧО —< ОО оо^о^ о^о^ о" о" о" о" о" Tj- OO CN ОО Tj- in OONO ΟΝΟ О о о" О ^н ГЧ СП ^" 1П ЧО Г* ОО ON О ^ CN СП ^" 1П ЧО Г*
ON ON ON ON О in ON ON ON О ON ON ON О in ON ON О о ON ON О in CX) ON О о 00 ON о in r^ ON О о г** ON о in чо ON О о чо ON о in in ON О in ON О £ о СП ON о CN ON О ч—1 ON О ON О Ci, о CN Г^ СП 1-Н ON CN СП О ON О СП чо г^ in CN чо CN СП CN О Г^ CN ^ in о CN О чо ON ^~ ^ 00 00 ^ CN OO ^ ^ 1П C^ ^ in ON ЧО ^ in 3 ^H in in in ^ ЧО ^ ^ *~* in s ^H ^ 1 ^ en ^ CN OO CN ^H ^ a | I о II a* S Я <υ Э о я Η 5 DC Λ CQ О Я о О СЗ Я hQ Si я ё е ν го 3 я 1 i»> о з с? s > α г- О ί -θ1 JT О =5 К " fc ^s ч о Й Й я 2 я я ϊ -J^ S 3 ^ S а 1 К н S Ε Ε S £ S я *■ ГО 3S ,-~Ч JS ~н Я « Я Я χ л 3 "■ i « 1 £•5 С CN ^-> С (Ν я s ζ φ ς & φ α. с υ α с (NCI 5*ί S с: s Η <Ό 0,995 0,990 0,975 0,95 0,05 0,025 0,010 0,005 И oo oo чо^оо on c^ СП ^ ЧО^С^СП^СП-^ 4o"oC-^cn"in" CN OO 1П О СП СП ^ ОО in't^ON^CN" ^ ON — ON OO^ON^OO^^'—^ cn"in"r^ON —" Tj- ГП CN ^н О О in — in o^—^cn^r^—^ сГсГсГсГ—<~ —"^ ЧО Tj" wm oin^oom сГсГсГсГсГ СП CN -^ ON 1П qor^(N<n сГсГсГсГсГ OOO^iN^ сГсГсГсГсГ _„ 1ПлГП^ОлЧОлГ| Oo"o"cN"cn"in" -^ CN CN CNCN OOin ^r^CN^ ^н^н CN CN CN ^чсГг^оС© Ч0^1ПлО^СЛл гч^^чсГосГ ^- Г^ СП СП 4fr ЧО ^f^^ON ^CN^CN'cn'cn" Tj- ONOO 0»П <N40 ^t^CN^ CN t^ Tl" in ON40 OO^CN^O^ o'^^cn'cn" 40 0N l> oo ^- rn чо 40^0NCn^t^^ sO t^ 00 ON 2 OO СП OO СП OO CN CN CN СП СП t^CN Г^^ЧО^ т^чо'г^оСо" CN CN CN CN СП ON^cn^r^-^in^ ^ен^чо'г^ CN CN CNCN CN oC^-rcN"cn"in" r* en on r^ чо V^CN^OO^in^CN^ т}-"1п"1п"чо"г^ CN О ^^ СП ЧО OO T^O^CN^ m r^ -^чо en ο ^^^^ ι сп" сп" т^ τ}-" in" о t^ t^ r^ о чо^о^о^чоJ cvfen'en"^^ -^ CN СП ^" UO
СП ^CN^O^ о^лоо^чол сч'сн'^чо'г^ СП СП СП СП СП CN СП СП СП СП СП ЧО ON ^ ^1" чсГг^схГсГ^ CN fN CN СП СП ЧО Г* ON О^ЧО^СП^^О^ г-ГсхГоСсГсГ ^н ЧО СП -^ ON ON iT^CN^ONir^ чо'г^осГсхГ on ^_ ^ ^-СПЧО СХ^Т^ОЧО^С^ 1гГчо"г^г^схГ т1- ОЧО ^" СП 1гГ1гГчо"чо"г^ ЧО t^ 00 ON О —" —" ~- —CN ^ОО^ЧО^ ^сч'^т'чо" ^ ^ 3- ^ ^ ON СП ЧО О СП СП ^" ^" Tf ^· ιη^οο^-^^чо^ СП СП СП СП ^ t^ONCN ^- ^ CN~CH~in~4D~r^ СП СП СП СП СП чо^сп ^оо^чо^ ^Г^Гсп'сп'т}·" сп^о^г^^^ сГ~-<~—<~CN~CH~ ON^i/^eN^ONi/^ СП ΤΙ" ЧО ON о^чо^счоо^ cxTcxToCono" -ч CN СП ^* 1П CN CN CN CN CN СП ЧО О СП Г- afoC^cN~cn~ ^- ^- in in in чо^о^сп^чо^о^ ιη"^(χΓθΝθ" ^ τΐ- ^ ^ m ON^CNin ^O^ ^cn^'in'r^ ON ^СП^ЧО 00 oo~cT^cn~ch" en Tj- Tj- Tj- τ^- Tj-^ON r^in^ 1гГчо"чо"г^схГ оо^чо^сн^О^оо^ en" ^ in" чо~ чо~ CN^ON^cn^O^ CN~ CN~ cn" ^ in" CN^CX^in^^CX^ ^-^СЧ~СЛ~СЛ~ ЧО t^ OO ΟΝΟ CN CN CN CN СП О о <υ О DC DC * 5 Χ о* с OQ О § с о S о DC 8 2 EQ 303
m cs о on oo t^ ЧО Ю ^ CO cs - N O^ ^ЧО^ОО^ CN ^ CO ОЧО CN *n θΝ"οο"ιη"τ}-" CN ON^ f- ON40 CN ^ О ON40 4fr -r ON"oo"in"^" CN 00 ^н О Г-» cTonoo"^"^" CN л t^ 1П Tf CN on^co oo^o oc oo oCocf чсГт^ CO ^-ц CN _ 1П ONON 00 OO^cO^oO^O^OO ЧО О\0С\О<^г CO ~M CN O^C^ON^ON CO ^н CN fNrno^(NOr О ON On" чо" in" 1П (N ON ON ^оСоСчо"^" CN ^ ЧО OOON -^ t^^CNin ^ u"> on" on" чо" in" л О in Tj- ON ^O ^ON Г^ on on on" чо" in" ON —η __ —.CO —' — ^ in ^ Г-« чО rz оо"о"г^"чо" ЧО *—« ^н ^Mni-ir» t^ т^- т -rt t^ CX^^^ON^r-^ co"co"co"cn"cn" ^- ^ ΓΝ —'in ON^in^CN^O^C» rn со" со" en cn" O^in CN^O^ON T}-"co"co"co"cn" чо ^- in τι- oo О ЧО СО -м ON tJ-"co"co"co"cn" О OOON OO CN ^н ЧО СО ^н О τ}-" со" со" со" со" 1П СО ^- СО Г-« ^" СО СО СО СО ~-ΌΝ ΟΟΝ Tf CN Г-in CN —-^ т}-" со" со" со" со" ОО Г- ОС t^ CN CNOOin CO^ т}-" со" со" со" со" ON Г^ ON ОС СО СО ON4D Т1" СО ^■" СО" СО" СО" СО" СО CN ^" СО ОО 1П ^ОО^ЧО ^ ^ ^ СО СО СО ЧО «П ^ чО -^ Т}""т}-"тг"со"со" Tf Tfr ЧОчО О ^-н t^T}-CN ^ т"тг"^"тг"т}-" ON ON ΓΝ CN40 O^UO^CO^^ON^ in" in" in" in" τ}-" ЧО t^ OO ΟΝΟ in ^-ЧО ON CO 40^in^^CO^CO^ cn" cn" cn" cn" cn" CN CN CO ЧО О t-^40^in^^ cn"cn"cn"cn"cn" ON ON О CO OO Г^чОч01П ^ cn"cn"cn"cn"cn" in in Г^ О Tl" 00^ t^40^40^in^ cn" cn" cn" cn" cn" О О ^h in ON ON OO Г^ЧО 1П cn"cn"cn"cn"cn" in in t^O ^· о^оо^г-^чо^ cn"cn"cn"cn"cn" O^ON^OO^r^t^ со" cn" cn" cn" cn" ON О CN in ON со" со" cn" cn" cn" О — СОЧО О CN^—^O^ON^ON со" со" со" cn" cn" чО чО 00 —«ЧО СО CN^—^^О^ СО СО СО СО СО ON ON ~- ^" ON in^^T^CO^CN^ СО СО СО СО СО 00 ON ^н Tt ОО О^ОС^ОО^Г^ЧО^ со" со" со" со" со" тГ WO ^ О ^t 00 Г^ЧО^чО 1П ^- CN СО ^- »П OO CO ON40 CN CNCN ^—н ^ cn"cn"cn"cn"cn" in —· t^CO О cn"cn"cn"cn"cn" ^- со со со CN cn" cn"cn"cn"cn" ON 1П ^h OO in cn"cn"cn"cn"cn" ^- ON40 CNON in ^" Tf 43- со cn"cn"cn"cn"cn" ON in ^h 00 1П 1П 1П1П ^^ cn"cn"cn"cn"cn" ЧО ^ 00 Tj" ^h чО ЧО in in in cn" cn"cn"cn"cn" t1- ОчО со О Г-» r-« чО чО ЧО cn" cn" cn" cn" cn" in — Г-» ^" — 0000 ^ ^ r^ cn" cn" cn" cn" cn" — ЧО CO О t^ O^ONON^O^OO^ со" cn" cn" cn" cn" tT ОЧО CO ^ r|CN^^2 CO CO CO CO py-T CO ON«n CN ON 4θ^ιη^ιηιη ^ CO CO CO CO CO ON in ^н 00 in "3- ^1" "* со со ЧО t^ 00 ΟΝΟ О Г- 1П CO ^h cn" cn" cn" cn" cn" 00 1П CO ^- ON cn"cn"cn"cn"cn" in со 0 00 40 CNCNCN^—^ cn" cn"cn"cn"cn" CN О t^ in ^· cn" cn"cn"cn"cn" Г-- ^" CN О 00 CO CO CO CO CN cn"cn"cn"cn"cn" CN О Г- ЧО 4fr ^ ^ CO CO CO cn"cn"cn"cn"cn" ON ЧО ^" CN О cn"cn"cn"cn"cn" Г- 1П CO ^h ON 1ПЩ 1П1П ^ cn" cn"cn"cn"cn" 00 ЧО Tl" CN О ЧО чО чО чО чО cn" cn" cn" cn" cn" tT CN О 00 ЧО 00 00 00 r-- r-« cn"cn"cn"cn"cn" Г- 1П CO ^h ON CO" CO" CO" CO" CN" l> ^-(NOON Ч^'Ч^СО^ СО СО СО СО СО CN О 00 ЧО Tf '^■"τ}Γτί"'^Γτ}Γ ^н ΓΝ СО ^" in CN CN CN CNCN
on r* чо τι- т ON ON ON ON ON t^ чо ^- en —ι o^oo^ in СП (Ν Ο ON (NOONOOVO <N(N ^-^-н ^ cnWcnWcn4 t^ in Tj- <N -^ <N ^н ONOO t^ on t^ чо in ch en en en en en cnWcnWcn4 t^ ЧО <ЛП <N ON t^ ЧО in ГП in in in in in Tj- CH ^-O ON OO ЧО 1П CH <N ON ON ON ON ON t^ in Tj- m <N en сн ей en m m m m m m <N <N <N ^н ^ ЧО t^ CX) ON О <Ν(Ν(Ν(ΝΠ ε ir- II ^ ε l ^ 5 DC <υ a о DC Η О о о 3 Ε Λ ВЯЗ о I ^н s ^ DC CQ О α >. s ч s Η DC m σ> о II <-ή κΝ ν φ ν hT ^н α. s ς ς > ζ Ω. φ 1£ 2 Σ φ ж <j φ (0 ο. 1- φ Σ to Ω. to к I ^•-s (^ « hT ч^ .о d" s ζ to Q. L. Φ a .0 ζ л ц, φ л τ ω 2 s α С Ω. Φ 03 ο ΕΙ Ι m σ> ο 00 <Ν - Ο ON CO г» чо in ^ СО <N - О И г- о (N О о" о" ON О (Ν,Ο, о" о" —■ О ^η,ο, о" о" т1- О СП О о" о" г- о СП О о" о" — о 4°„ о" о" чо О 4° о" о" (Ν О о" о" о о чо^о^ о" о" — о о" о" ^ я о" о" 00 О ON О о" о" 0,00 о 0,36 0,00 ON О о" о" —■ О 4°„ о" о" 0,45 0,00 00 О 4,о, о" о" СП О 1Л О о" о" 00 О 1П О о" о" ^ о ЧО^О^ о" о" (Ν —ι r-,,ο, о" о" ОО^О^ о" о" ON О о" о" ON —ι ON О о" о" О СП - СП (N Tj- О о" о" in <N 4°. сГсГ 00 (Ν 4 °„ о" о" (Ν (Ν 1П О о" о" чо гп in О^ сГсГ О гп чо^ о^ о" о" 1П СП чо О о" о" о" о" 00 Tj- о" о" in in ОО^О^ о" о" ON О^ о" о" ON ON ON О о" о" О чо °„4 —"о" гч 0,48 0,04 ~- 1П ιη^ О^ о" о" ^- 1П о" о" ^ чо in О о" о" —■ ЧО ЧО^О^ о" о" in t^ ЧО^О^ о" о" 0,70 0,08 ЧО ON о" о" (N О °Я, 4, о" о" 00 (N °Я, 4, о" о" in in ON —ι о" о" ON ON ON ^ сГсГ О ON о гч ГП in О о" о" in 00 >лог о" о" 00 00 о" о" —· ON чо О о" о" in О чо,4, о" о" ON —ι о" о" 0,74 0,12 ON 4fr о" о" ^- чо °Я, 4, о" о" О 00 ON ~ о" о" ЧО (N ON <Νλ о" о" О ON О (N о о Я, 4 ^· чо О 1П ^н о" о" ON ^ in ^ о" о" (Ν (Ν чо^ ^ о" о" 1П СП ЧО ~н о" о" 00 4fr о" о" (N 1П ^4 о" о" ^4 о" о" —ι ON °о,4 о" о" ЧО —ι о" о" 0,92 0,25 ЧО ON ON <N о" о" о чо О СП О 00 о ^ —н"0" 1П ON СП in ^н о" о" 1П^ ~* сГсГ in in чо^ -^ о" о" 00 ЧО ЧО —ι о" о" ~- 00 о" о" 1П ON о" о" ON —ι o"o" СП СП 00 Г| o"o" 00 ЧО ОС^<N^ о" о" СП О ON СП о" о" Г* 1П ON^ СЛ^ о"о" О (N о ^ —Го" О 4fr О in —н"0" чо 305
cs π о ON СО t^ чо m ^ СП CN *-Н о N <N40^-0N40(NCX)Tl-0Nt^-^0N ЧО^ —^ ЧО^ ^ ЧО^ CN^ ЧО^ CN^ ЧО^ CN^ Г^ CN^ о" о" о" о" о" о" о" о" о" о" о" о" ЧО^ —^ ЧО^ CN^ ЧО^ CN^ Г^ CN^ Г^ CN^ Г^ СИ^ о" о" о" о" о" о" о" о" о" о" о" о" t^OOONtN^^C^t^Ti-OVOCN ЧО^ ~ ЧО^ CN^ Г». CN Г^ CN^ Г^ СИ^ Г^ СИ^ о" о" о" о" о" о" о" о" о" о" о" о" OOCNCHTJ-404D0N^CN00TJ- Г^ CN^ Г^ CN^ Г^ CN^ Г^ CN^ Г^ СИ^ Г^ СИ^ о" о" о" о" о" о" о" о" о" о" о" о" г^ гч^ t^ (N ^ гч ^ гп оо си оо^ си о" о" о" о" о" о" о" о" о" о" о" о" г^ cn^ r^ <N^ оо^ сн^ оо^ сн^ оо^ т оо^ т о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" in0040CNt^in00000N-^OTf oocnoochoochoochoo^ontj- сГ о" о" о" о" о" о" о" о" о" о" о" ON—< О 1П —' 0\ (Ν (Ν (Ν «Л ГП Χ 00 СИ ON СИ ON CO ON ^" ON ^" ON ^" о" о" о" о" о" о" о" о" о" о" о" о" cnin^-0Ntncnin40iO0N40fN ON СП ON СП ON ^ ON ^ ON ^ ON ΙΟ о" о" о" о" о" о" о" сГ о" о" о" о" t^OOO^XOOOO(NOOh<Mt^ ON^-ON^-ON^-ONinONinONin о" о" о" о" о" о" о" о" о" о" о" о" Ot^OCNO40O0NO<NOTJ- о^ ^ о^ *п о^ »п о^ «о о^ чо^ о sol ~S о" ~ о" ~ о" —Г о" ~£ о" ~ о" O0NOcHO40O0NOCNOTf О^ *Г^ О^ ЧО^ О^ ЧО^ О^ ЧО^ О^ С^ ©^ Г^ ^-Г о" ~ о" —~ о4 —<~ о" —Г о" —~ сГ ^ ©о on 2 ζ: 2 s χ го 2 5 S τ φ Λ ζ >s to τ 5 φ 2 ζ ζ φ ι φ Ω. С υ (Ζ α ο ζ Ω. Φ Σ ο ζ ffl ω CL МП 1П ON t^ СП ON СП CN CN t^ KO(NObSO Г* CN О OO in t^ OO ЧО ЧО t^ l·^- ^ СП СП (Ν О СП CN ON^- oo in сп чо чо in ^" ^" СП ^· О in ΤΙ" ΟΟ ^· 1П —« ^ Tfr ^н ONOCN ^н 1П О OO Г* ON OO 1П О t^CN ЧО 00 t^ ΓΝ CN 1П ЧО (NO 1П <N Tj- t^ ^" CN CN Г- t^ t^ ЧО 4fr ~^ — t^ ЧО ^ tJ- in Г-« СП 1П ЧО ЧО OO OO 1П t^ >n ON4D О ~н СП ONCN CN '^H Tj-ОЧО СП OO CN 1П -^ ON Tl" ^- СП ON OO m o^- on on ЧО OO t^4D О ЧО CN ON in ЧО in oo oo t^ t^ OO СП ^" Ο ^· OO ^" CN Г* СП on t^ in oo о СП О 00 CNCN СП ON СП OO in ^н ОМП ЧО СП OO t^ О ^ ON «ПЧО СП OO О ЧО 00 t^ CN ЧО О ^- OO OO CN ^ ^н ^ Tfr 00 ^- ЧО OO «П CN ЧО CN ^" t^ ^> СП tJ- t^ in СП t^ СП in СП OO ON О ЧО in О ЧО СП чО in OO ЧО in OO О in СП СП ЧО ON СП О ЧО CN 00 OO in О ON ^" t^ OOtJ-ЧО О Г** i ЧО CN in t^ ^· t^ OO ЧО ТГ ЧО CN *— — «η ON Г* t^ «ncN CN о in о cn in Tt unCN 1ПЧО СП ^" OO О 306
m oo oncn on oo ~- t^ <n m ON00 ООО-н 1^40 t^ ^ m О 1П ^н ONOO mm чо <n <n ^- CN ЧО ^ m ONCN 4fr 1^ЧО ON ^ ^ m Г* οσνοοοη ЧО CN ^- ON ON 00 00 00 ^ 00 in (Ν Ο ON ON О 00 О Г* 00 on тчочо чо Ο (Ν ^f-ЧО (Ν ^ Г* Г* Г* 00 Monvo^H CN m ^ СП ON m in on r* m ГПО ^- ONCN ONCn 00 4fr О on m ο σ\^ ooo τι- — m^- о ^- m r^ ^нчо чочо ^ СП t^ ЧО СП ON in 1П ON Tfr ^- in in Г* 1П m m t^ ON40 m ^н т чо in OO СП CN t^ in CN t^ ONOON ЧО ON t^ ЧО ^ ЧО О CN CN О ^- t^ en ^~"^- ЧО 00 ^" О 4fr OO in in 43- 00 ЧО 00 ON O^·· t^4D t^ CN ^T CN rn Tf Ο en ΟΝΟ r* 0 m t^^- m 00 ^- on^h ^- m оочо in ^нчо ЧО CN 00 ^н ^н t^ CN t^ ON СП 0 m^- 0 m чо t^ 0 in m t^ епчо чо in 00 0 in ^- чо Tj- Tj- <N ~н ЧО m CN О СП m m in on ^н <n ЧО 00 CN СП О СП CN CN СП ЧО чочо m in r* in <n m t^ ^н m 43- on 0 чо 0 ^- тчо t^ <N ON^- t^ 1П in оочо т ^н ЧО ^" ON ΟΝΟ t^40 ^ О 00 m in rn ΟΝΟ m 0 »n <n t^ 1П 00 ON 1П ON CN ^" 00 CN ON m όνο ο on ON^- CN ~-Ό О 1П ^" О 00 О Г* 00 ONCN ^ mo on^h ЧО fN ON 1П ЧО in 00 00 t^ t^ t^ in CN in СП -^ О О ГП 1П t^ 00 ЧО ^ t^ ^- 0 t^ cn m in 0 ONm чо ЧО ЧОЧО t^ ON О О fN in t^ чо ^ in m m ЧО СП 00 ЧО t^ in in чо on m ^- чо о in m ON40 ЧО ЧО 00 t^ on m cn t^ CN CN ОЧО ^ ON CN 00 СП t^ ΟΝΟ m ^- cn m 0 rn 0 ^ t^ CN ^" t^ t^ ^- ОЧО ON t^ ^ ^" t^ ГП 00 ΟΝΟ 4fr 4fr ЧО ON40 тчо ^ in m in t^ in ON40 ON40 ON О О 1П 00 00 00 CN ^ 00 ON m X ' О о χ ι Χ 3 S ' . SOS s 2 * a: a: ~ S ° — Э a«" Й « 5 « -θ* й os ϋ 5 3 α 8 * л а -Q Η §р = о η p.04 s s : s ^ S 3 Ο Τ С S S c jo η α •&S « s 3" Й К Я ϋ g § i s 11 Й 5 ϋ Η CX О " c & з 5 с S τ g * s ■ S S 3 8;з s й ч α 3 vo С as S С4 л 5S * й л X S 3 л к 8 <υ Со ^ Й CN О. О
^н t^ t^ 1ПЧО ЧО 1ПГЧ CO in CN^CO^OO^in^O^ 00^0(N II 1 t^ 1П ON ^н ON 000 CO ^" t^ Г^^- ПО CN^ ^o — ~© Ml CO ON CO ^ 4tf" ON^r^CO^^in^ ^-•O О ©~CN 1 1 ^н ONON40 ON ON ^нчО ON CO ©"©'©"—"-^ 1 1 ЧО CNin ^нчО ОО CN Т}- ^н CN^ ©'©'©'©'©" III ЧО ЧО in Г- ON ОО «ПЧО Tl" ON сГо^сГ^о4 I 1 1 CN CN CN © ON ON СОЧО ^ OO CO^OO^CO^©©^ 0(NO-hO 1 1 1 чо 00 — 0 t^ 4fr ON^ CN ^ ^ЧО© ЧО ©^ θ"—н"—Г—Г^н" 1 1 1 -1,630 -0,116 -1,141 -1,330 -1,396 ОО CN ON СОЧО О ON40 ОО ON ιη^ο^οΝ©^ 1 1 1 ЧО О "^ Г^ со TJ-ЧО CN ^ ^ О^СО^СО^ОО^ 1 t^ ^- ON ^ Г^ СО ОО WO СО »-н fN^CO ON^r^t^ 1 1 чОГЧ in CN t^ чО О CN О СО ^ΓΝ^4θ^ ОО ООО 1 1 1ПЧО CN CN Г* CNCN ON^CNm^ 0 ноо о 1 1 1 CN CN О *ч ON ^f- ОО — ON^f- in ОО CN ОО ЧО ©"©"-J©*©*4 1 1 -1,633 1,114 1,151 -1,939 0,385 оо © -^ оо © © ОО Tj" in CO О^^СО^ ri—~—"о*4©*4 1 1 1 1ПЧОО0 ON ON © ООШ СО ON ОО ^ чО tJ- CO -^—Г©"©л^ II II ON^- t^ © in ^-OO ^" ON^- CN © ^ t^ ^ ©'©"©'©'©" 1 1 CO CO ЧО ^ ^-н OO ^ © CN CN O^CO ЧО^— ON^ ~S ©'©'©'©" 1 1 OO CN ЧО Г* OO ©t^ © © ON CN^CN^CO©^ ©"©"©"©VT 1 1 ON ON CO ^ CN ON 1П t^ ^" CO ©"©"cN©"*-'" 1 ON40 CN t^ CO t^ t^ © CO — © CO ON 43- 1П 1 1 1 CN ^ © CO ON CO 1П ONt^ OO ©^^CN^OO^CN^ ©"©'©"©'©" 1 ON40 ^ ^© t^ 1П Tl" CN ON ©^40^CO^in^ON^ ©"—«'©'©~CN~ 1 1 1 OO 1П CO ГЧЧО ЧО t^ — ONCN t^COin CN ©^ ©'©'©'©" —~ 1 43- «n со чо со © t^ ON OO чО © CN t^ ON CO сТ-Г-н*©"—Г 1 1 1 1 ONCN CO Tl" in ^ ON40 OO Tj" ~ t^© ^© ^-Г©~©'©л^-Г 1 CN CO ON^f" ЧО ^н Tf CN^»n ЧО 1 1 -^ 00 r* ^- чо ON CN^f" OO *^· CN OO CN^in ^ ©"cN©"©"©" 1 1 1 -1,473 -0,851 -0,880 -0,158 0,084 -0,086 0,665 0,340 -2,127 -0,656 0,034 0,234
232- -0,831 -0,813 -1,345 Г* 00 СП <N см сн сГ о" — I I 0,008 0,110 1,297 1,041 -0,899 -1,114 чо чо ^ СП О ON Г^ CN^ ^ о" —Г о" 1 1 1 ЧО — 00 СП ч^- чо оо — ^- оо in — in OO in о — о" о о I I 1 1П ^ О 1П ОО ^- 1П — ^" t^ 1П^^- ^О СП о о -* — ~ I I 1 ON 4fr ON ^ О О ^ О ON — ^н in in ^00 о о о о ~ I 1 00 ^" ^ CN 00 ЧО 1П (Ν Ο 00 *Ί °1 °^ °1 °1 о" о" о" —Г о" I I I I 1 00 ^" ЧО СП ON t^ ^" 00 ON ON °i "1 °^ ^ ^ ~ сГ сГ cT cT 1 1 1 сн оо чо ^- in f^ CN ^-« CH CN ^-T cT cT —~ —~ 1 1 1 О — ЧО (Ν ^ ЧО ON 00 ЧО ^· Ο ^" ^ t^ in о о ~ о — I I I 1 оо ^- ^ сн ~ Г^ CN^ Г^ ^ ^ о о ~ о о I 1 t^ ^ ON СП ~ СП -rt 00 ^" СП 1П ON^^- (N 1Пл о ^ сГо о I I 1 О in О ^ ON η^(Ν<ηθ dd^do 1 1 1 О 00 <N in СП *Ί ^ 4 °. ^ сГсГсГ —"cT 1 1 nO(N(NVO ON^ ^ ^ ON <Νλ Csf ~-T cT cT ^ 1 ^- 00 1П 00 <N ^- in 00 CN Ο ^чо^оо^чо^^ о" о" о" о" о" I I 1 ^" СП CN in СП CN ON ЧО СП 1П ^ in 00 <N^ 00^ о" о" о о" о" 1 ^- оо чо in чо ЧО ON О 00 ON 1 in in ЧО О ^ О ^" ЧО — CN I I 1 ^- in <N ON О СП Ci Ci Tf ^" сГсГсГ—«~cn~ I I 1 ON in ^" 00 ЧО ON ЧО in ON in Чч ^°L ^ °i 4 cT cT cT cT —Г CN CN ^- t^ О t^ чо оо о оо CN CN CN t^ in 1 1 00 1П CN СП ON ч ч °. *\ ° о —Г о" о" ~ 1 1 ЧО ЧО ^ ^- ON — ^н 00 ON ^· — ЧО СП СП СП о-Г-Голо I I 1 ЧО ON CN ON О О ^ СП О ^ ^ιη^ιη 00^^ сГ—ГсГсГсГ I I 1 СП Г-« "^ СП СП ON О О ЧО СП ON ^" 1П^ ^ 00^ о"—Г о" о" о" I I 1 СП t^ CN СП t^ ON CN ^f- CN t^ in^ ^ ^ O^ Г^ d-^o'dd 1 1 1 00 ON ЧО Г* ЧО СП ЧО CN ^ 1П 1 1 1 О СП чО ^ 00 СП in ~- ON in OO^ON 0^40^1^ cn'cT^^on 1 III ^- CN СП in О Г* О t^ ЧО CN cn^t^ON ^^- сГсГсГсГсГ 1 1 1 in in СП t^ О OO in CN 1ПЧО OO^ CN ^ OO CN^ III 1 Г-« in in СП in 1П CN ЧО Г* СП ON^in^OO^CN^O^ cTcT —"cTcT 1 III ^ CN СП ~-ΌΝ ^" CN in О СП CNO 001П ^ сГсГсГсГсГ 1 1 309
Ь (Ν Ь ^t (N 1П ЧО ЧО CN 00 т г* чо *\ Чч Чч о" о" о" о" о" 55 О CN CN CN О CN СП СП II ζ φ Σ α s с и о с и к с; α α о * >s о 03 ε ζ to α о" ЧО CN СП in СП oo in m -* r^ t^ ON OO 1П CN ЧО 1П «П 1П 1П о о" сГ о" о4 о К S PQ о CN о О «Л П ^ и in О ОП ЧО ON ^ ON 00 СП О г* чо^ чо чол чо^ о" о" о" о" о" ζ о о с; S 03 к S α S α S S Η и S Ευ о S 5 к я CQ о 1П о ON О ^- CN OO ON CN CN «η CN о о4 чо г^ CN CN ζ φ ■9- ■9- о 3 к s ζ φ τ (Ό ζ Γ0 ο ο" *-* in Г^ СП О r-« on чо on о in о чо сп о 00 ОО Г^ Г^ Г^ о" о' о" о' о" S ζ φ τ fD ζ φ S U φ τ S S α ГМ 310
^- ^- ЧО ON ^ 4fr ^ ^ in 00 О "Л >Л VO О сн о о s s τ a X О ON ^ сн «П «-η ^- so m ^" ^" ^" >Л 1Л in ЧО ON ЧО ЧО PQ О m о о" ЧО 00 Ο (Ν ON ^ СП CN in ^" in in ЧО ЧО 311
ЛИТЕРАТУРА 1. Большее Л. Η., Смирнов Η. В. Таблицы математической статистики. М., 1983. 2. Бикел П.,Доксам К. Математическая статистика. Т. 2. М., 1983. 3. Захаров В. К, Севастьянов Б. А, Чистяков В. П. Теория вероятностей. М., 1983. 4. Зубков А. М, Севастьянов Б. Α., Чистяков В. 77. Сборник задач по теории вероятностей. М., 1989. 5. Ивченко Г. #., Медведев Ю. И. Теория вероятностей и математическая статистика. Ч. II. Математическая статистика. М., 2005. 6. Ивченко Г. И., Медведев Ю. /7., Чистяков А. В. Сборник задач по математической статистике. М., 1989. 7. Крамер Г. Математические методы статистики. М., 1975. 8. Кендалл М. Дж., СтьюартА. Статистические выводы и связи. М., 1973. 9. Чистяков В. 77. Курс теории вероятностей. М., 2003. 10. Феллер В. Введение в теорию вероятностей и ее применения. Т. I. M., 1984.
ОГЛАВЛЕНИЕ Предисловие 3 Введение 5 Глава 1. Классическая вероятностная модель 1.1. Определение вероятности. События 7 1.2. Вероятность суммы событий 9 1.3. Случайные величины 12 1.4. Математическое ожидание 14 Глава 2. Простейшие вероятностные модели 2.1. Условные вероятности 18 2.2. Независимость событий 21 Глава 3. Вероятностные модели с усреднением вероятностей 3.1. Формула полной вероятности 24 3.2. Формулы Байеса 26 Глава 4. Урновые схемы 4.1. Вероятность произведения событий 28 4.2. Две модели случайного выбора 30 4.3. Более общие модели случайного выбора 35 Глава 5. Вероятностные модели с конечным числом исходов 5.1. Определение вероятности. Случайные величины 38 5.2. Математическое ожидание 41 5.3. Дисперсия. Неравенство Чебышёва 44 5.4. Ковариация. Коэффициент корреляции 47 Глава 6. Схема Бернулли 6.1. Определение вероятности 50 6.2. Вероятность заданного числа успехов 52 313
6.3. Математическое ожидание и дисперсия 54 6.4. Закон больших чисел 55 6.5. Теорема Пуассона 56 6.6. Теорема Муавра — Лапласа 58 6.7. Задачи из теории страхования 62 Глава 7. Полиномиальная схема 7.1. Определение вероятности 67 7.2. Вероятность заданного набора исходов 68 7.3. Математическое ожидание, дисперсия, ковариация 71 Глава 8. Цепи Маркова 8.1. Определение 73 8.2. Марковское свойство 76 8.3. Уравнения Колмогорова 79 8.4. Предельные вероятности 81 8.5. Математическое ожидание и дисперсия. Закон больших чисел 85 8.6. Предельные теоремы для времени пребывания в состоянии 88 Глава 9. Геометрические вероятности 9.1. Определение вероятности 90 9.2. Случайные величины 93 9.3. Функция распределения и плотность распределения вероятностей 94 9.4. Математическое ожидание. Дисперсия 96 9.5. Ковариация. Независимость случайных величин 99 Глава 10. Дискретные случайные величины 10.1. Закон распределения 102 10.2. Математическое ожидание и дисперсия 105 10.3. Закон распределения функции от случайной величины 107 10.4. Математическое ожидание и дисперсия функции от случайной величины 108 10.5. Производящая функция 109 Глава 11. Абсолютно непрерывные случайные величины 11.1. Функция распределения и плотность распределения вероятностей 112 11.2. Математическое ожидание и дисперсия 115 314
11.3. Закон распределения функции от случайной величины 116 11.4. Математическое ожидание и дисперсия функции от случайной величины 119 Глава 12. Двумерные дискретные случайные величины 12.1. Закон распределения двумерной дискретной случайной величины. Независимость 121 12.2. Закон распределения функции от случайной величины 128 12.3. Математическое ожидание и дисперсия функции от случайной величины. Ковариация 134 12.4. Условные распределения случайной величины. Условное математическое ожидание 138 Глава 13. Двумерные абсолютно непрерывные случайные величины 13.1. Двумерные плотности распределения. Независимость 143 13.2. Закон распределения функции от случайных величин 151 13.3. Математическое ожидание и дисперсия функции от случайных величин. Ковариация и корреляция 159 13.4. Условные плотности распределения. Условные математические ожидания 166 Глава 14. Случайные последовательности 14.1. Закон больших чисел 168 14.2. Центральная предельная теорема 170 Глава 15. Первичная обработка экспериментальных данных 15.1. Задачи математической статистики 173 15.2. Выборка 175 15.3. Эмпирическая функция распределения 178 15.4. Полигон частот, гистограмма 183 15.5. Выборочные моменты и квантили 190 15.6. Выборочный коэффициент корреляции 196 Глава 16. Теория оценок 16.1. Оценки, их состоятельность и несмещенность 198 16.2. Среднеквадратическая ошибка и эффективность оценки 205 16.3. Метод максимального правдоподобия 209' 16.4. Метод моментов 217 16.5. Доверительные интервалы 220 315
Глава 17. Статистическая проверка гипотез 17.1. Постановка задачи 237 17.2. Наиболее мощный критерий 240 17.3. Сложные гипотезы 248 17.4. Проверка гипотез и доверительное оценивание 251 17.5. Статистические критерии согласия. Критерий «хи-квадрат» Пирсона 253 17.6. Критерий согласия «хи-квадрат» при неизвестных параметрах распределения 257 17.7. Критерий согласия Колмогорова 262 17.8. Критерий независимости «хи-квадрат» 263 17.9. Критерий однородности данных 266 Глава 18. Ранговые критерии 18.1. Критерий знаков 269 18.2. Критерий Вилкоксона для проверки однородности двух выборок 273 18.3. Ранговая корреляция по Спирмену 281 Глава 19. Метод наименьших квадратов и регрессия 19.1. Метод наименьших квадратов для простой линейной регрессии 289 19.2. Проверка статистических гипотез о параметрах простой линейной регрессии 295 Приложения 298 Литература 312
Учебное издание Ватутин Владимир Алексеевич Ивченко Григорий Иванович Медведев Юрий Иванович Чистяков Владимир Павлович ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ЗАДАЧАХ Учебное пособие для вузов Зав. редакцией Б. В. Понкратов Ответственный редактор Ж. И. Яковлева Художественное оформление О. В. Матоянц Технический редактор Н. И. Герасимова Компьютерная верстка А. В. Маркин Корректор М.А.Алексеева Санитарно-эпидемиологическое заключение №77.99.02.953.Д.006315.08.03 от 28.08.2003. Подписано к печати 28.06.05. Формат 60x90 Vi6· Бумага типографская. Гарнитура «Тайме». Печать офсетная. Усл. печ. л. 20,0. Тираж 3000 экз. Заказ № 1605. ООО «Дрофа». 127018, Москва, Сущевский вал, 49. По вопросам приобретения продукции издательства «Дрофа» обращаться по адресу: 127018, Москва, Сущевский вал, 49. Тел.: (095) 795-05-50, 795-05-51. Факс: (095) 795-05-52. Торговый дом «Школьник». 109172, Москва, ул. Малые Каменщики, д. 6, стр. 1А. Тел.: (095) 911-70-24, 912-15-16, 912-45-76. Магазин «Переплетные птицы». 127018, Москва, ул. Октябрьская, д. 89, стр. 1. Тел.: (095) 912-45-76. Московская обл., г. Коломна, Голутвин, ул. Октябрьской революции, 366/2. Тел.: (095) 741-59-76. Отпечатано в полном соответствии с качеством предоставленных диапозитивов в ОАО «Тульская типография». 300600, г. Тула, пр. Ленина, 109.
I
Пособие может быть игпол. овано ?шения того или иного класса за/: гоятельного изучения теории *ей и математической статистики' ι ознакомительного курса по теор -ей и математической статистики; задачника и методического посо ю задач для всех вузов ISBN5-7107-8917-8