Text
                    В. А. КОЛЕМАЕВ, О. В. СТАРОВЕРОВ, В, Б.ТУРУНДАЕВСКИЙ
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Под ред. В. А. КОЛЕМАЕВА
^01
Допущено Государственным комитетом СССР по народному образованию в качестве учебного пособия для студентов экономических специальностей вузов
а
'91 8 2
Элемтр**е«» и -е - к-в. статута
ЬКОСУЯК «ВЫСШАЯ ШКОЛА» 1991
ББК 22.172 К 60
УДК 519
Рецензенты: кафедра высшей математики Новосибирского института народного хозяйства (зав. кафедрой — канд. физ.-мат. наук Л. А. Хасин) и проф. М. М. Юзбашев
Колемаев В. А. и др.
К 60 Теория вероятностей и математическая статистика: Учеб, пособие для экон. спец, вузов /В. А. Колемаев, О. В. Староверов, В. Б. Турун-даевский; Под ред. В. А. Колемаева.— М.: Высш, шк., 1991.— 400 с.: ил.
ISBN 5-06-001545 9 ’
В книге излагаются ocffofita теории вероятностей и математической статистики в соответствии с программой этого курса для экономических специальностей вузов. Изложение ведется в строгой, ио доступной пониманиях ф©р|ге. Основные понятия иллюстрируются различными примерами экономического содержания. Имеются задачи для самостоятельного решения.
„ 1602090000(4309000000)—076 „„ „„	ББК 22172
К	001(01)—91	89~9°	517.8
ISBN 5-06-001545-9	© в. А. Колемаев, О. В. Староверов,
В. Б. Турунт,аевский, 1991
ПРЕДИСЛОВИЕ
Настоящее пособие достаточно полно освещает основные положения теории вероятностей и математической статистики в соответствии с программой, утвержденной Государственным комитетом СССР по народному образованию. Оно предназначено для студентов экономических специальностей вузов (специальности 06 и 07). Поэтому примеры и упражнения взяты из социально-экономической сферы.. С этой же цепью в пособии излагается материал, показывающий связь теории вероятностей и математической статистики с конкретными экономическими приложениями.
Изложение ведется от частного к общему, причем начальные параграфы изложены более просто, в то время как последущие — более сложно с использованием современного математического аппарата. Все это создает возможности для ведения индивидуального преподавания, а также позволяет использовать основной материал для разных экономических специальностей, а более сложный — для подготовки дипломников и аспирантов. Глава 14 «Элементы многомерного статистического анализа» относится только к специальности 06.09 «Экономическая кибернетика». В конечном счете каждый преподаватель, основываясь на программе конкретной экономической специальности, определяет, какой материал следует давать более подробно, а какой — менее подробно или вообще опустить.
Пособие состоит из двух частей. Первая часть включает основы теории вероятностей: случайные события и их вероятности; случайные величины, их распределения и числовые характеристики; важнейшие предельные теоремы теории вероятностей; введение в теорию случайных процессов. Вторая часть посвящена математической статистике и некоторым ее применениям в экономике и в социально-экономических исследованиях. В ней изложены основы выборочного метода, теории оценивания вероятностных параметров, проверки статистических гипотез, pei рессиониого анализа, дисперсионного анализа, анализа временных рядов, современного многомерного статистического анализа.
3
История развития теории вероятностей от схемы с равио-возможными исходами до аксиоматического построения теории вероятностей, на основе которого и ведется изложение, представлена в гл. 1. Среди методов математической статистики главное место отведено тем, которые имеют широкие области применения в экономике.
Предисловие, введение, гл. 1,2, 11, 12, 13, а также введение к ч. 2, § 7.1, приложения 2 и 3 написаны В А. Колемае-вым, гл. 6—9, 10, 14 и приложение 1 — О. В. Староверовым, гл. 3—5 — В. Б. Турундаевским. Научное редактирование рукописи выполнено В. А. Колемаевым.
На протяжении всего изложения принята следующая система нумерации глав, параграфов, формул, примеров, таблиц и рисунков. Главы имеют сплошную нумерацию; параграфы, примеры, таблицы и рисунки имеют двухступенчатую нумерацию: первая цифра означает номер главы, вторая — номер параграфа, примера, таблицы или рисунка в главе. Формулы имеют трехступенчатую нумерацию: номер главы, номер параграфа, иомер формулы в параграфе
Авторы благодарны рецензентам: д-ру экон, наук, проф. М. М. Юзбашеву; зав. кафедрой высшей математики Новосибирского института народного хозяйства канд. физ. мат. наук, доц. Л С. Хасину; зав. кафедрой экономико-математических методов НИНХ, д-ру техн, наук проф. А. Е. Бахтину; зав. кафедрой статистики НИНХ, канд. экон, наук., доц. Л П. Харченко за сделанные замечания, которые существенно способствовали улучшению пособия.
Авторы также будут весьма признательны всем преподавателям и научным работникам, специализирующимся в области применения теории вероятностей и математической статистики в экономике, за возможные предложения и замечания, направленные на усовершенствование пособия.
Авторы
ВВЕДЕНИЕ
По форме проявления причинных связей законы природы и общества делятся на два класса: детерминированные и статистические.
Например, на основании законов небесной механики по известному в настоящем положению планет Солнечной системы может быть практически однозначно предсказано их положение в любой наперед заданный момент времени, в том числе очень точно могут быть предсказаны солнечные и лунные затмения. Это пример детерминированных законов.
Вместе с тем не все явления макромира поддаются точному предсказанию, несмотря на то что наши знания о нем непрерывно углубляются и уточняются. Так, долговременные изменения климата, кратковременные изменения погоды не являются объектами для успешного прогнозирования. Еще менее вписываются в детерминированные рамки многие законы и закономерности микромира. Например, с точки зрения теоретической физики нельзя говорить о точном положении электрона в определенный момент времени, но можно говорить о его распределенном положении в пространстве («электронное облако»). Такого рода законы называются статистическими. Согласно этим законам, будущее состояние системы определяется не однозначно, а лишь с некоторой вероятностью, являющейся объективной мерой возможности реализации заложенных в прошлом тенденций изменения.
Теория вероятностей изучает свойства массовых случайных событий, способных многократно повторяться при воспроизведении определенного комплекса условий. Основное свойство любого случайного события, независимо от его природы,— мера, или вероятность его осуществления.
Теория вероятностей — математическая наука. Из первоначально заданной системы аксиом вытекают другие ее положения и теоремы. Впервые законченную систему аксиом сформулировал в 1936 г. советский математик академик А. Н. Колмогоров в своей книге «Основные понятия теории вероятностей».
Теория вероятностей вначале развивалась как прикладная дисциплина. В связи с этим ее понятия и выводы имели
5
окраску тех областей знаний, в которых они были получены. Лишь постепенно выкристаллизовалось то общее, что присуще вероятностным схемам, независимо от области их приложения: массовые случайные события, действия над ними и их вероятности, случайные величины и их числовые характеристики. Большой вклад в развитие теории вероятностей внесли русские и советские ученые.
Приложения способствовали зарождению теории вероятностей, они же питают ее развитие как науки, приводя к появлению все новых ее ветвей и разделов. На теорию вероятностей опирается математическая статистика, задача которой состоит в том, чтобы по ограниченным данным (выборке) восстановить с определенной степенью достоверности характеристики, присущие генеральной совокупности, т. е. всему мыслимому набору данных, описывающему изучаемое явление. За несколько последних десятилетий от теории вероятностей «отпочковались» такие отрасли науки, как теория случайных процессов, теория массового обслуживания, т ;ория информации, эконометрическое моделирование и др. Этот процесс продолжается и теперь.
Одной из важнейших сфер приложения теории вероятностей является экономика. В настоящее время трудно себе представить исследование и прогнозирование экономических явлений без использования эконометрического моделирования, регрессионного анализа, трендовых и сглаживающей моделей и других методов, опирающихся иа теорию вероятностей.
Вместе с тем вполне уместен вопрос: следует ли отыскивать статистические закономерности в плановой социалистической экономике? Или, быть может, все ее законы и закономерности являются детерминированными и, следовательно, нет сферы применения для теории вероятностей? Однако наличие таких твердо устоявшихся в экономике понятий, как страховой запас, резервные мощности, государственные резервы и др., свидетельствует об обратном. Необходимо также заметить, что без элементов случайности вообще невозможно развитие. Без случайности были бы невозможны возникновение жизни и совершенствование биологических видов, немыслимы история человечества, творческая деятельность людей, развитие социально-экономических систем. Таким образом, проявление случайности в экономике следует рассматривать как отклонение от сложившегося русла событий как в положительную сторону (появление новых научных открытий, технологий, способов ведения и организации произведет ва и т. п.), так и в отрицательную (стихийные бедствия.
6
поломки оборудования, болезни работников и т. п.), что впоследствии приводит к существенному изменению самого течения событий. С развитием общества народное хозяйство все более усложняется; следовательно, по законам развития динамических систем должен усиливаться статистический характер законов, описывающих социально-экономические явления.
Все это предопределяет необходимость овладения методами теории вероятностей и математической статистики как инструментом статистического анализа и прогнозирования экономических явлений и процессов.
Часть 1
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
Глава I
ВЕРОЯТНОСТНЫЕ ПРОСТРАНСТВА
В настоящей главе в сжатом виде представлена эволюция теории вероятностей от классической схемы с конечным числом равно-возможных исходив до аксиоматического построения. Вводятся важнейшие понятия теории вероятностей: пространство элементарных событий, случайные события и действия над ними, поле событий, вероятность, вероятностное пространство.
§ 1.1. Классическое определение вероятности
Достоверным называют событие, которое обязательно произойдет при осуществлении определенного комплекса условий Так, например, вода при нормальных атмосферных условиях и О °C замерзает. Соответственно невозможным является событие, которое при заданном комплексе условий никогда ие произойдет. Случайным естественно назвать такое событие, которое при заданном комплексе условий может как произойти, так и не произойти. Мера возможности осуществления такого события и есть его вероятность. Достоверное и невозможное события могут рассматриваться как крайние частные случаи случайных событий.
Далее случайные события будем обозначать большими латинскими буквами А, В, С, .... Достоверное событие обоз начим буквой й, невозможное— 0. Введем теперь некоторые отношения между событиями.
Два события А и В несовместны, если наступление одного из них исключает наступление другого. Сумма событий А, В — это такое третье событие С=А-{-В, которое происходит тогда, когда наступает либо событие А, либо событие В, либо они оба одновременно. П роизведенае событий А, В — это такое событие С=АВ, которое наступает тогда, когда
происходят и событие А, и событие В. Событие А противоположно событию А, если оно несовместно с событи
ем Л и вместе с ним образует достоверное событие А +Л = й
8
Покажем, как могут быть построены математические модели явлений с конечным числом исходов. Одной из таких моделей является модель, известная под названием «классическая вероятностная схема». В этой схеме определение вероятности основывается иа равновозможиости любого из конечного числа исходов. Такое определение возникло на основе первых попыток исчисления шансов в азартных играх.
Так, в случае с игральной костью при однократном бросании равновозможно выпадение любой из шести граней, на которые нанесены цифры 1, 2, 3, 4, 5, 6. Обозначим эти равновозможные исходы или элементарные события через <t»i, <02, <03, <04, <05, we. Естественно, что шанс осуществиться не одному исходу, а одному из двух, например или <0|, или <02, в два раза больше. Рассуждая таким -образом, можно определить шансы осуществления любого составного события, состоящего из нескольких элементарных.
В общем случае, когда имеется п равновозможных элементарных событий .....<оп, вероятность любого составно-
го события А, состоящего из m элементарных событий <0^, ..., ы>1 , опредепяется как отношение числа элементарных событий, благоприятствующих событию А, к общему числу элементарных событий, т. е.
Р(Л)=—.	(11.1)
п
Например, в случае с игральной костью вероятность события А, состоящего в выпадении четного числа очков (т. е. Л=|<о2, <о4, <о6}), равна Р (Л) = 3/6= 1/2, так как в событие А входят три элементарных события, а общее число элементарных событий равно 6.
Из классического определения вероятности, в частности, вытекает, что вероятность полного события S2, включающего все п элементарных событий, равна единице:
Р(й)=2'_= 1. п
Но ведь тогда полное событие Q, состоящее в появлении любого из всего набора элементарных событий <0|, <02, ..., <о„, и является достоверным событием, так как оно обязательно происходит. Поэтому вероятность достоверного события равна единице.
Если события рассматривать как подмножества множества элементарных событий, то отношения между событиями, введенные выше, можно интерпретировать как соотношения между множествами. Несовместные события — это такие со-
9
бытия, которые не содержат общих элементов. Сумма (Л-|-В) и произведение событий АВ — это соответственно их объединение Лив и пересечение Л()В, противоположное событие А — дополнение А. Запись А сВ означает, что в В содержатся все элементарные события из А и могут содержаться элементарные события, не входящие в А Если Лег В и Вс ссЛ, то Л =В.
В случае классического определения вероятности справедлива следующая теорема сложения вероятностей.
Теорема 1.1 (сложения вероятностей). Если два составных события А ={<о,- , ... , <0, } U В = {<0- , ... , (О; } являются
1	m	11
несовместными, то вероятность объединенного события С — =ЛиВ равна сумме вероятностей этих двух событий.
□ Действительно, вероятности событий Л и В рав-
ны и — соответственно, а событие С=ЛиВ = {<ог, ..., п п	
, <of- ..., <0у} содержит m-f-fe элементарных событий, так как по условию теоремы среди элементарных событий {<о , ..., ш, } нет ни одного, которое бы входило в набор {со-,..., <о,}, по-этому, согласно классическому определению, его вероятность равна
Р(С)= m + fe =—+—=Р(Л) + Р(В).  п п п
Событие Л называется противоположным по отношению к Л, если в него входят все элементарные события, не входящие в А. Иными словами, Л и Л — это такие несовместные события, которые вместе образуют достоверное событие, т. е. Л]_)Л = Й.
Из теоремы сложения вытекает, что
Р (А} + Р {А}= 1,
поэтому
Р(Л)=1 —Р(Л).	(1.1.2)
Отсюда, в частности, следует, что вероятность невозможного события 0, являющегося противоположным по отношению к достоверному событию Q равна нулю.
Урновая схема
Классическая схема, несмотря на всю свою ограниченность, пригодна для решения ряда сугубо практических задач. Рассмотрим, например, некоторую совокупность элемен
10
тов объема N. Это могут быть изделия, каждое из которых является годным или бракованным, или семена, каждое из которых может быть всхожим или нет. Подобного рода ситуации описываются урновой схемой: в урне имеется W шаров, из них М белых, (N — M) черных.
Представим себе, что имеются только разрушающие средства контроля каждого изделия на годность. Например, электролампа считается годной, если до перегорания нити накаливания пройдет не менее чем определенное число часов, а это можно определить только непосредственным испытанием. В таком случае нельзя обследовать всю партию изделий, а только часть ее.
Итак, из урны, содержащей N шаров, в которой находится неизвестное число М белых шаров, извлекается выборка объема п. Требуется определить вероятность того, что в выборке будет обнаружено т белых шаров. В частности, опре-tri	М
делить вероятность того, что — близко к —т. е. достоверно п	N
ли представление о генеральной совокупности, полученное по выборке. Последняя из этих двух сформулированных задач, как будет показано далее, является задачей математической статистики.
Первая же задача — на применение классического определения вероятности. В самом деле, в описанной ситуации каждая выборка не имеет предпочтения по отношению к любой другой, т. е. все они равновозможны. Подсчитаем число всех возможных выборок объема п из N элементов. Как нзаестно из комбинаторики, число способоа, с помощью которых можно выбрать п элементов из общего их числа N,
N\
равно числу сочетаний из N по п, т. е. С7,=— --—, где
п\ (N — n)\
АП = 1-2...N. Таким образом, общее число исходов равно C"N. Выясним, сколько исходов из общего числа элементарных исходов благоприятствуют событию А, т. е. наличию в выборке объема п белых шаров в количестве т. Число способов, которыми можно из М белых шаров извлечь т штук, равно C^J, а число способов выбрать из (N—М) черных шаров п—т штук равно Поэтому число исходов, благоприятных событию А, равно	н. следователь-
но, его вероятность, равная отношению числа благоприятных исходов к их общему числу, такова:
pmpn — т
P(A)=^J^L^pMN{rn,n),	(11.3)
11
О Пример 1.1. Пусть имеется партия, состоящая из 500 изделий, в которой два бракованных. Какова вероятность в выборке из 5 изделий не обнаружить нн одного бракованного?
Воспользуемся формулой (1 1.3). Имеем 498!	2!
493! 5Г 0! 2! 500! 495! 5!
р	_ «ЬС2
* 498.500	----Гg-----
''500
= 0,98. •
Какой вывод можно сделать о генеральной совокупности, не обнаружив в выборке ни одного бракованного изделия? Кажется естественным перенести этот вывод на всю генеральную совокупность. Таким образом, по выборке, составляющей 1 % от генеральной совокупности, мы получили с вероятностью 0,98 абсолютно неправильный ответ: в генеральной совокупности нет бракованных изделий. Этот вывод из очень простой задачи должен не обескуражить, а, напротив, помочь правильно построить статистические выводы по выборочным данным. В данном случае, очевидно, не следует
Л	. N — M
пытаться оценивать долю бракованных изделии —---по их
N
, п — т
доле в выборке-----, а, по-видимому, целесообразно указы-
п
вать интервал, который с определенной надежностью должен
Л	„ N-M
покрыть неизвестную долю бракованных изделии --------.
N
„	п — тЬ
Этот интервал естественно построить в виде---±—, где
п 2
ширина интервала f> = f>(n,q) является функцией от объема выборки и уровня надежности q. Причем естественно ожидать (в чем мы и убедимся в дальнейшем), что ширина интервала при прочих равных условиях уменьшается с ростом объема выборки и увеличивается при уменьшении требуемого уровня надежности.
Как отмечалось выше, говорить о вероятности Р (А) как о мере возможности осуществления случайного события А имеет смысл только при осуществлении определенного комплекса условий. При изменении условий изменится и вероятность. Так, если к комплексу условий, при котором изучалась вероятность Р (А), добавить новое условие, состоящее в появлении события В, то получим другое значение вероятности Р (А/В) — условную вероятность события А — при условии, что произошло событие В. Вероятность Р (А) в отличие от условной будем называть безусловной.
Выведем теперь формулу условной вероятности. Пусть
12
событиям А и В благоприятствуют т и k элементарных исходов из п; тогда, согласно (1.1 1), их безусловные вероятности равны и — соответственно Пусть событию А при п п
условии, что событие В произошло, благоприятствуют г элементарных исходов, тогда, согласно (1.1.1), условная вероятность события А равна
Р(Л/В)=у.
Разделив и числитель и знаменатель на п, получим формулу условной вероятности
поскольку событию Af]B соответствуют г исходов и, следова-г
тельно,----его безусловная вероятность.
п
Событие А называется независимым от В, если его условная вероятность равна безусловной, т е Р (А/В)=Р (Л), при этом из формулы (1 1.4) получаем
Р(ЛПВ)=Р(Л)-Р(В),	(1.1.5)
т. е. свойство независимости взаимно и для независимых событий вероятность их одновременного осуществления равна произведению их вероятностей. Формула (1.1.4), записанная в виде
Р(Л("|В)=Р(Л)-Р (В/Л),	(1.1.6)
называется формулой умножения для зависимых событий, а формула (1.1.5) —теоремой умножения для независимых событий.
Например, в опыте с игральной костью пусть событие Л состоит в выпадении числа очков, делящегося на три, т. е. Л = (ь>з, Юб), а событие В— в выпадении четного числа очков, т. е. В = {<1)2, W4, toe}; тогда Л(]В = Шб и по формуле условной вероятности (1.1.4) получаем
г (Н) З/о о
но Р (Л) = 2/6= 1/3, поэтому Р(Л/В) = Р(Л), т. е. события Л и В независимы.
§ 1.2. Конечная схема с неравиовозможными исходами
Ограниченность классического определения вероятности, в частности, заложена в равновозможности исходов. Действительно, даже небольшое усложнение практической ситуации немедленно войдет в противоречие с равновозможностью, которая может рассматриваться скорее как частный случай более общей ситуации.
Рассмотрим, например, стрельбу по круговой мишени. Элементарными исходами здесь являются попадания в то или иное кольцо круговой мишени. Попадение в малый внутренний круг оценивается в 10 очков, ь окружающее его кольцо — 9 очков, в следующее — 8 и т. д., в самое внешнее кольцо — одно очко, непопадание в круговую мишень— нуль очков. Итак, имеется одиннадцать элементарных событий шю, о>9, ... , о)о. Для каждого стрелка определенного класса имеются свои определенные устойчивые шансы (вероятности) выбить за один выстрел то или иное число очков рю, рэ> ..., ро. Эти события, вообще говоря, неравновозможны. Например, для мастеров спорта, по-видимому, исключено событие wo, поэтому ро = О, т. е. сразу исключается равновозможность.
Конечная схема с неравновозможными исходами определяется так. Имеется конечный набор элементарных событий й={(1)|, ..., (ол}, н для каждого элементарного события a>i п
задана его вероятность pi, 0^р,^1, причем р, = 1. Be-<«== 1
роятнесть любого составного события Л = {(о;,..., и. } опреде-1	т
ляется как сумма вероятностей входящих в него элементарных событий:
т
P(A)=^Pl.	(1.2.1)
i=i
Эта схема является обобщением классической схемы. В самом деле, если вериу гься к случаю равновозможности и приписать каждому элементарному событию вероятность —, то формула (1.2.1) приводит к классическому определению вероятности.
В случае конечной схемы также имеет место теорема сложения.
Для двух несовместных событий А и В, являющихся подмножествами Q,
Р(ЛиВ)=Р(Я)+Р(В).
14
□ в самом деле, пусть	Д = {<0(). WjJ, В=
=|(»	, о>;} Согласно (1.2.1),
1 I] *k
т	k
'’(Л)-»,. P(B)-£p,..
1=1	х=I
Поскольку А, В несовместны, они не имеют общих элементарных событий и, следовательно, C=X|JB={4. — > и<т> (о(- .... Wj} На основании (1.2.1) имеем
т	k
P(Q= £ Pii+ £ Р,=Р(А) + Р(В).  1=1	Х=1
Точно так же как конечная схема с неравновозможными исходами является обобщением классической конечной схемы с равновозможными исходами, дискретная схема с бесконечным числом неравновозможных событий, в свою очередь, является обобщением конечной схемы.
В дискретной схеме множество й = ((0ь ..., ыя, ...}, вообще говоря, содержит счетное число элементарных событий. Для каждого элементарного события задана его вероятность сю
р; = Р((О(), OCpiC 1> причем У р,= 1. Вероятность любого 1— 1
конечного либо счетного подмножества AcQ множества элементарных событий й равна сумме вероятностей состав-сю
ляющих его элементарных событий, т. е. если Л= (J <о;, то
оо
1= 1	'
(1.2.2)
т
если же А= (J со-, то имеет место (1.2.1). 1= 1 '
В конечной схеме, как и в классической, можно вывести формулу условной вероятности. Рассмотрим события А = = ((0,,..., и ), Д = ((о	to,...., (0,-} такие, что w, = (о..,..,,
I	m	Ч	'1 Щ	'1 ч
Иными словами, XnB = {(0f), .... ы^}. Тогда
п	k	I
Р(А)=	Р^= I Р{А(}В)= I Pi
Н=1	х=1	ц=1
Пусть событие В произошло, поэтому имеет место новая конечная схема с k исходами, kt^n, следовательно, сумма
15
вероятностей полного набора этих новых исходов должна быть равна единице, а она, согласно первоначальной схеме, k
равна Р(В) = £ р1ь-
I
Чтобы обеспечить равенство суммы вероятностей элементарных событий единице, введем новые вероятности исходов
k
Г)	k	^х
р.	У р. =—________= 1.
Р(В)’	Р(В)
В рамках новой схемы (т е. при условии, что произошло событие В) определяем вероятность события А:
, Z Р.
( 7 } Л/'- Р(В) Р(В) 
Таким образом, мы снова пришли к той же формуле условной вероятности, что и в классической схеме. Независимость событий определяется аналогично классической схеме.
В качестве применения конечной схемы в следующей главе будет исследована схема последовательных испытаний. Рассмотрим простейшие примеры схемы последовательных испытаний как иллюстрацию конечной схемы с неравновозможными исходами.
О Пример 1.2. Система контроля изделий состоит из двух независимых проверок, выполняемых одновременно. Изделие принимается, если оно прошло обе проверки. В результате каждой проверки бракованное изделие принимается с вероятностями си, аг соответственно. Найти вероятность принять бракованное изделие.
Если на вход системы контроля поступило бракованное изделие, то возможны следующие четыре элементарных исхода: со, =(0,0), шг = (0, 1}; шз=(1,0[, ы4=(1, 1}, где 0 означает, что изделие признано бракованным, I — годным. Испытания независимы, поэтому получаем следующие значения вероятностей элементарных исходов со = = [6, «г):
P1=p(w1) = P(i1=0,<2 = 0)=P(i1=0)-P(i2 = 0)=(l-«|)(l-a2),
р2=р (ш2)=Р ₽, =0, «2= 1}=Р {i, =0)-Р (i2= 1|=(1 -а,) а2,
Рз=Р ^=Р ₽! = 1. «2=0)=Р {ij = 1|-Р (Z2 = 0|=a, (1 -а2),
р4 = р (<о4) = Р f, = 1, «2 = 1)=Р #, = 1 )• Р (г2= 1|=а,а2.
Сумма вероятностей элементарных событий должна быть равна
16	**•«*' Л
единице. Действительно,
Р(й)= £ р(и>/)=(1—“2) + (1
— а,)а2 + а1 (*—“2) +
+ “1а2=1-
Согласно условиям задачи и сформированной схеме вероятность принять бракованное изделие есть элементарное событие <о4, состоящее в том, что первая проверка покажет бракованное изделие годным н вторая также, поэтому искомая вероятность равна р, = И|-аг. ф
О Пример 1.3. В условиях примера 1.2 заданы вероятности рь рг отбраковать годное изделие в результате первой н второй проверок соответственно. Найти вероятность отбраковать годное изделие.
Если на вход системы контроля поступило годное изделие, то возможны те же самые четыре элементарных исхода, однако их вероятности будут другими. Снова воспользуемся независимостью испытаний, тогда получим следующие вероятности элементарных исходов:
р, =р (<о,) = Р {i, =0, i2=0)=P {i, =0)-Р (i2 = 0bp, -р2, р2=р(ш2)=Р (1, =0, «2=1|=Р (i, = 0|-Р f2= 1}= р, (1 -р2),
Р3=Р (и>з> = Р ₽1 =l- '2 = 0)=Р (*, =	{'2=°}=(1 — P|) Р2>
Р4=Р (“4>=р <4 = 1, *2=	{4 = Ч-Р ₽2= 1|=(1 — Р,) (1 -Р2).
Событие, состоящее в том, что отбраковано годное изделие, включает в себя элементарные события u*i, o>s, в>3, поэтому искомая вероятность равна р, +р2 + рз = Р1Р:> + Р1 (1 — Рг) + р2 (1 — Pi)=Pi + + ₽2—'РФг- 0
вЧ
§ 1.3. Исчисление событий
Как следует из § 1.1 и 1.2, одним из основных понятий теории вероятностей являются пространство элементарных событий й и события как некоторые подмножества этого пространства. В этих параграфах были приведены примеры пространств й (конечного нли счетного типа). В общем случае пространство й может быть любой природы, как -'J конечным, так и бесконечным, как дискретным, так и непрерывным. Рассмотрим, например, стрельбу по мишени. Если цас интересует только сам факт попадания в мишень, то элементарными исходами служат <0|= 1 (попадание в мишень), ыо = О (непопадание в мишень). Если важно попадание в отдельные области мишени (области различаются с точки зрения уязвимости реальной цели), то элементарными событиями могут быть <0(0= 10, <09=9, .... <oi= 1 (соответ
ствуют числу очков, приписанных попаданию в ппре.п.е пенную Б !БЛИ<»1ЕКА	J?
Но ФСШЛврсиогэ злежтрвтсжкн «еск. •sag—
область) н о)о=0 (непогадание в мишень). Наконец, если существенно важным является знание, в какую именно точку щита, на котором изображена мишень, произошло попадание, то произвольный элементарный исход w = {x, у} представляет собой координаты точки попадания, а пространство эле ментарных событий — это множество точек щита.
Итак, пусть имеется пространство элементарных событий й любой природы. Будем рассматривать в качестве событий подмножества А, В, С этого пространства. В таком случае действия над событиями становятся действиями над подмножествами.
Событие А происходит тогда и только тогда, когда происходит одно из элементарных событий <о, из которых состоит А. Напомним некоторые отношения событий, введенные ранее. События А нВ несовместны, если наступление одного из них исключает наступление другого. Но ведь это означает, что А и В не имеют нн одного общего элементарного события, т. е. не пересекаются. Аналогично, событие Л-|-В эквивалентно объединению Л^В, т. е. такому множеству элементарных событий, которые входят или в Л, или в В, а событие АВ — пересечению Л[")В, т е. множеству элементарных событий, которые являются общими для А и В. Операции объединения и пересечения множеств симметричны, т. е.
Л11В = В1М, ЛПВ = ВПЛ.
Событие, которое включает все элементарные события, т. е. совпадает с пространством элементарных событий й, называется достоверным. Отсюда можно сделать вывод, что для любого события Л|")Й = Л. Пустым называется событие, которое не содержит ни одного элемента. Отсюда два события А и В несовместны, если А(]В=0. Очевидно, Ли U0=A.
Напомним, что теоретико-множественной разностью двух событий А и В называется такое событие Л\В, которое содержит те элементарные события, принадлежащие А, которые не входят в В. Отсюда событие Л, противоположное событию А, есть Й\Л. В самом деле, Л(")(й\Л)=0 и Л1) J(Q\A)=Q, т. е. действительно Л = Й\Л. В частности, й= 0, 0=й.
Иногда используется симметрическая разность событий С = ЛдВ, представляющая собой такое событие, в которое входят те элементарные события, которые входят в Л или В, но не входят в их пересечение Л(")В Таким образом, эта операция может быть представлена с помощью уже введен-18
них операций следующим образом:
С=ЛдВ = (Л\В)и(В\Л).
Для лучшего понимания операций над событиями — подмножествами — обычно используют условные графические изображения, представляя достоверное событие й как
прямоугольник, а другие события — как круги. Тогда введенные выше операции над событиями могут быть представлены в виде диаграмм Вьенна (рис. 1.1 — 1.5), где результаты операций изображены в виде заштрихован ных фигур. Операция объединения изображена на рис. 1.1, пересечения— на рнс. 1.2, разности— на рис. 1.3, дополнения — на рис. 1.4, симметрической разности — на рис. 1.5.
Рис. 1.1
Рис. 1.3
Рис. 1.5
19
Действия над сооытнямл, в частности операции объединения (сложения) и пересечения (умножения), аналогичны сложению и умножению чисел. Так, выше отмечалось, что эти операции симметричны; они также ассоциативны, т. е.
(лив)ис=ли(дис),
(ЛПВ)ПС=ЛП(ВПС)
Кроме того, эти операции, так же как и операции над числами,
обладают свойством дистрибутивности:
(ЛиВ)ПС=(ЛПС)и(ВПС).	(1.3.1)
□ Множество Т)=(ЛиВ)АС изображено в виде диаграммы Вьенна на рис. 1.6. Как видно из этой диаграммы, пересечение С с объединением Л(_|В состоит, вообще говоря, нз трех непересекающихся частей:
Д=КЛ\В)ПС]и(В\Л)ПС]и[ИПВ)ПС].
Так как А=АЦА при любом А, то
D = [(Л \В) л С]и 1(В\Л) Л С]и [(Л Л В) Л С]и[(Л Л В) Л С].
Используя теперь свойство симметричности операций объединения, объединим первый и третий операнды, второй и четвертый
[(Л/В)ЛС]Л[ЛЛВ)ПС]=ЛПС,
КВ\Л)Л С]и [(Л л в) г С]= В л с, откуда окончательно получаем D = (A ЛС)1)(ВЛС). т. е. свойство дистрибутивности действительно выполняется. 
Другое сходство с действиями над числами заключается в том, что для операции пересечения роль, аналогичную роли единицы и нуля при умножении чисел, выполняют множества Q и 0, так как й ПЛ = Л, Л Л й = Л и 0ЛЛ=ЛЛ0 = 0. Вместе с тем теоретико-множественные равенства Л1)Л=Л, Л Л Л = Л и нм подобные показывают, что полной аналогии нет.
Действия над событиями важны не сами по себе, а как средство определения вероятностей одних событий через вероятности других событий. Так, например, если верна теорема сложения вероятностей, то вероятность события С, являющегося объединением несовместных событий А и В, равна сумме
20
вероятностей последних событий Р (С)=Р (Л)+Р (В), что позволяет найти зероятность одного из трех событий через известные вероятности двух других. Точно так же, если для событий А и В, C=Af~]B справедлива теорема умножения, можно выразить вероятность одного события через вероятности двух других:
Р(С)=РС4)-Р(В).
В случае конечной или счетной теоретико-вероятностной схемы, рассмотренной в предыдущем параграфе, в качестве события рассматривало^ любое подмножество конечного или счетного пространства элементарных событий О и вероятность события определялась как сумма вероятностей входя щих в него элементарных событий. Если же пространство О непрерывно, то имеет место континуум элементарных исходов. Попытка считать событием любое подмножество непрерывного пространства О сопряжена с большими трудностями.
Поэтому в общем случае приходится иметь дело не со всеми подмножествами пространства О, а лишь с определенным классом, замкнутым относительно операций объединения и пересечения. Класс подмножеств пространства О, замкнутый относительно операций объединения, дополнения и пересечения, а также содержащий множества 0, О, называется полем. Будем обозначать поле буквой S. Минимальное поле So состоит из полного и пустого множества So={0, О}. В самом деле, 0 ий входят в этот класс, а результатами операций объединения, дополнения и пересечения над этими множествами снова служат данные множества: OU0=O, Of] П0 = 0, 0=0, 0=0.
Другим, более содержательным примером поля событий служит класс из четырех событий S = {0, А, А, 0} Действительно,
01И=Л, 0ЦА=А, 0'JO = O, 0f]A—0, 0ПА = 0,
0ПО=0, лил=о, лио=о, ЛГ)Л=0, лпо=л, лио = й, ЛГ)О=Л, 0=0, Л=Л, 0=0.
§ 1.4. Аксиоматическое построение теории вероятностей
При аксиоматическом построении теории вероятностей исходным «материалом» служат пространство элементарных событий О и выделенный в нем класс подмножеств, образую
21
щий поле событий S. Строение пространства Q и класса S определяется конкретной областью приложения.
Определение 11. Вероятностью называется числовая функция, определенная на поле событий S и обливающая следующими свойствами:
Аксиома 1 Для любого события A eS
Р(А)^0.
Аксиома 2. Вероятность достоверного события равна единице
Р(й) = I.
Аксиома 3. Вероятность объединения двух несовместных событий равна сумме вероятностей этих событий:
AeS, BzeS, А(]В=0,
Р (A(JB)=P (А)+Р (В).
Проверим, например, что конечная схема удовлетворяет условиям этих аксиом. Напомним, что конечная схема задается конечным множеством элементарных событий П=; = {o»i, ... , шл) и вероятностями каждого из них	1,
п
причем	pL = 1. Вероятность любого события А, являюще-
;= 1
гося подмножеством Q, т. е. А ={<0^,...,	|, определяется
по формуле
m
Р(А)=£р,.	(1.4.1)
1=1
Класс S всех подмножеств S2 образует поле. В самом деле, S2 и 0 являются подмножествами, поэтому принадлежат S; очевидно также, что для любых AeS’, B^S их объединение и пересечение также являются подмножествами Q.
Теперь проверим, что конечная схема удовлетворяет требованию аксиомы 1. Для этого выберем произвольное событие А, которое является подмножеством S2; так как А =
• •••» Ч- }• т0- согласно конечной схеме,
поэтому
Р(Л)^0,
т. е. условие аксиомы 1 выполняется.
Условие аксиомы 2 выполняется, поскольку S2 = {coi, ..., со„} п
И на основании (1.4.1) P(fi)=£ р,= 1.
1=1
Условие аксиомы 3 также выполняется, так как оно представляет собой содержание теоремы сложения для конечной схемы. Эта теорема была доказана в § 1.2. Итак, конечная схема является примером объекта, для которого выполняется система аксиом теории вероятностей.
Простейшим частным случаем конечной схемы служит вероятностное описание испытания, которое может закончиться успехом или неудачей. В этом случае S2 = {a0, coi} состоит из двух элементарных событий: <оо = 0 — неуспех в испытании, <oi= 1 — успех в испытании, P(coi) = p, Р (<оо) = = 1 — p = q. Поле в данной ситуации состоит из четырех событий: 0, Л = {(й1}, Л={соо), 52 = {<оо, coi)
В качестве примера вероятностей схемы с непрерывным пространством элементарных событий рассмотрим схему с геометрическими вероятностями. Пусть пространством элементарных событий служит множество точек некоторой области G, имеющей площадь на плоскости. В качестве событий будем рассматривать имеющие площадь подмножества Л, В, С, ... этой области. Самостоятельно докажите, что класс таких подмножеств образует поле. При этом вероятность любого события Л (подмножества, имеющего площадь mes (Л)), можно задать следующим образом:
Р(Л)
_ mes (Л) mes (G)'
Докажите (по аналогии с конечной схемой), что описанная схема удовлетворяет аксиомам теории вероятностей. Аналогично можно построить геометрические вероятности в любом конечномерном пространстве.
Из аксиом теории вероятностей вытекает ряд следствий, которые могут быть доказаны так же, как это было сделано для классической схемы. Предлагаем самостоятельно доказать утверждения, содержащиеся в задачах к настоящей главе.
Во многих случаях выполнение аксиомы 3 требуется в расширенном варианте. А именно, как показывает задача 2 к главе 1, аксиома 3 постулирует сложение вероятио-
23
стей для конечного числа несовместных событий, в то время как в расширенном варианте речь идет о счетном числе несовместных событий.
Аксиома 3'. Если
As=S, 1=1,2,..., AipAj=0, i^j,
то
Аксиомы теории вероятностей лишь постулируют существование вероятностей для всех событий, образующих поле S, и задают определенные правила действия с вероятностями. Экспериментальное же определение вероятности любого события ЛеХ может быть осуществлено в результате испытаний, выполняемых при определенном одном и том же комплексе условий. Как будет показано ниже, выборочная т	-	.
частость —- появления события А при большом числе испы-п
таний п является достаточно хорошей оценкой теоретической вероятности р = Р(А), что означает сходимость в некотором т
смысле —=>р при п
Например, если событие А представляет собой выпадение «гербах- при однократном бросании симметричной монеты, то, согласно классическому определению вероятности, Р (А)= 1/2, поэтому есть основание считать, что при многих испытаниях частость выпадения «герба» близка к 1/2. Действительно, в XVII в. Бюффон провел такие эксперименты. В результате оказалось: при 4040 бросаниях монеты частота выпадения «герба» составила 2048 что дает частость, равную 0,507. Английский статистик К. Пирсон провел 24 000 таких опытов, частость оказалась равной 0,5005.
Из настоящего и предыдущих параграфов следует, что определенная теоретико-вероятностная схема задается тройкой {£2, S, Р), т. е. конкретным пространством элементарных событий, конкретным набором подмножеств £2, образующих поле, а также конкретным заданием вероятностей на множествах поля. Набор этих трех компонент далее в« зде будем называть вероятностным пространством. Вероятность Р на {£2, S} называется распределением вероятностей на £2.
Задачи
1.1.	Опираясь на аксиомы теории вероятностей, докажите следующие утверждения: a) Р(А)= 1—Р(А); б) "Р(0)=О; в! Р(А)>Р(В) при А > В, г) Р(А)<1.
24
1.2.	Покажите, что из аксиомы 3 вытекает следующее след
ствие: Р( U^,)= £ ПрИ Л'ПЛ'=0 для 1=#;-
1.3.	Докажите, что для любых событий А, В имеет место следующая формула сложения:
Р(ЛиВ) = ₽И) + ₽(В)-Р(ЛпВ).
1.4.	At, As,	, А„ — случайные события. Доказать для п =
= 3, 4 формулу
р(ил)=£р(Л)~ X ₽и,п^,)+
£	Р(Л1.ПЛ/.ПЛА)--+(-1)я+1Р( П Л,)-
1.5.	Партия изделий состоит из т изделий 1-го сорта и п изделий 2-го сорта. Проверка первых k изделий, выбранных из партии наудачу, показала, что все они 2-го сорта (k<n). Чему равна вероятность того, что среди следующих двух наудачу выбранных из оставшихся изделий по меньшей мере одно окажется 2-го сорта?
1.6.	Двое договорились о встрече в течение определенного часа. Пришедший первым ждет 20 мин и уходит. Какова вероятность встречи?
Указание. Рассмотреть вероятность как отношение площадей множества точек (исходов), благоприятствующих встрече, н множества возможных исходов.
Глава 2
УСЛОВНЫЕ ВЕРОЯТНОСТИ.
ПОСЛЕДОВАТЕЛЬНОСТИ ИСПЫТАНИЙ
Настоящая и все последующие главы опираются на аксиомы теории вероятностей, из которых выводятся все теоремы и формулы теории вероятностей и математической статистики. В этой главе дается определение условной вероятности, доказываются наиболее часто используемые теоремы и формулы, основанные на условных вероятностях. Вводился понятие независимости событий, которое затем используется в схеме последовательных испытаний.
§ 2.1. Условные вероятности
В § 1.1 формула условной вероятности была выведена в случае классической схемы. В общем случае эта формула служит определением условной вероятности события А при условии, что произошло событие В, Р(В)>0.
Определение 2.1. Условная вероятность события А при условии В равна
Р(Л/В)=—Р(В)>0.
Определение 2.2. Событие А не зависит от события В, если Р(А/В)=Р(А).
Независимость событий взаимна, т. е. если событие А не зависит от В, то и событие В не зависит от А. В самом деле, используя определения 2.1 и 2.2, при Р(Л)>0 имеем
р (R/Ax_ Р{А[\В)_Р (А/В)-Р (В) _ р(в/А)- р{А}- --------------
Р(А)-Р(В) Р(А)
Р(В).
Из определения 2.1 вытекает следующая формула умно-
26
жения вероятностей:
Р(ЛПВ)=Р(Л)-Р(В/Л).	(2.1.1)
Для независимых событий вероятность произведения событий равна произведению их вероятностей:
Р(ЛПВ)=Р(Л)-Р(В).	(2.1.2)
Определение 2.3. События At, А2, Ап образуют полную группу событий, если они попарно несовместны и вместе образуют достоверное событие, т. е.
Л.ПЛ^О, 1^=/;
U Л,. = й. i= 1
Имеет место следующая теорема о формуле полной вероятности.
Теорема 2.1. Если события Л1, .... А„, Р (Л,)>0 образуют полную группу событий, то вероятность события В может быть представлена как сумма произведений безусловных вероятностей событий полной группы на условные вероятности события В'.
Р(В)=^Р (ЛJ• Р [В/А?).	(2.1.3)
i= I
□ События полной группы Л1, ..., Л„ попарно несовместны, поэтому попарно несовместны и их произведения (пересечения) с событием В, т. е. события В ПЛ., ВрЛ, при несовместны. Так как событие В, используя свойство дистрибутивности, приведенное в 2 1 3, можно представить в виде
В= и (Впл,), 1= 1
то, применив к этому разложению события В аксиому сложения вероятностей, имеем
р(в)=р U (ВПЛ,.) =£Р(ВПЛ(). 1=1	4=1
Используя формулу умножения вероятностей (2.1.1) для каждого слагаемого, окончательно получаем
п	п
»(в)=£ Р(впл,)= £ Р(л,.)-Р(в/л;) .
1= 1	!= 1
27
Требование, состоящее в том, что события А. образуют полную группу событий, может быть заменено более слабым: п
события Ai попарно не пересекаются, В<= U Кроме того, i= 1
на основе аксиомы счетной аддитивности теорему полной вероятности можно распространить и на счетное множество ос попарно непересекающихся событий Ait Р (Л)>0, Ba U
i— 1
Р(В) = £ P(Ai)-P(B/Al).	(2.1.4)
i= 1
Из формулы полной вероятности (2.1.3) легко получить формулу Байеса: для события В с Р\В)>0 и для системы п попарно несовместных событий А, Р(Л,)>0, Вег (J А, .= 1
₽№)•/>№)
Р (Ак/В)= -п ------.	(2.1.5)
£ р(Д).Р(в/л,) i= 1
В самом деле, применив формулы условной вероятности и умножения вероятностей, имеем
P(Ak(]B) Р (Ak)-P (B/Ak)
р^=-рХвГ- -Р(в)	
теперь, заменив вероятность события В по формуле полной вероятности, получаем формулу (2.1.5)
Вероятности Р (Л,) событий Л,- называют априорными вероятностями, т. е. вероятностями событий до выполнения опыта, а условные вероятности этих событий Р (At/B) — апостериорными, т. е уточненными в результате опыта, исходом которого послужило появление события В.
О Пример 2.1. На предприятии изготовляются изделия определенного вида на трех поточных линиях. На первой линии производит ся 20 % изделий от всего объема их производства, на второй — 30 %, на третьей — 50 %. Каждая нз линий характеризуется соответственно следующими процентами годности изделий: 95, 98 и 97 %. Требуется определить вероятность того, что наугад азятое изделие, выпущен ное предприятием, окажется бракованным, а также вероятности тот, что это бракованное изделие сделано на первой, второй и третьей линиях.
Решение. Обозначим через Л|, Аг, Аз события, состоящие в гом, что наугад взятое изделие произведено на первой, второй и третьей линиях. Согласно устовиям задачи, Р(Л|)=0,2; Р(Д2) = = 0,3; Р(Л3) = 0,5 и эти события образуют полную группу событий.
28
поскольку они попарно несов,лестны и Р (Л i) + ₽ (Аг)+Р (А3)= = 1 Обозначим через В событие, состоящее в том, что наугад взятое изделие, оказалось бракованным. Согласно условиям задачи, рф/А^О.ОЬ; Р (В/Л2) = 0.02; Р (В/Л3) = О,ОЗ.
Используя формулу полной вероятности, получаем Р (В) = = р(в/Л1).Р(Л1) + Р(В/Л2)-Р(Л2) + Р(В/Л3)-1>(Л3) = 0,05-0,2 + -J-0,02-0,3+ 0,03-0,5 = 0,031, т. е. вероятность того, что наугад взятое изделие окажется бракованным, равна 3,1 %.
Априорные вероятности того, что наугад взятое изделие изготовлено соответственно на первой, второй и третьей линиях, равны 0.2, 0,3 и 0,5.
Затем был выполнен опыт, в результате которого наугад взятое изделие оказалось бракованным; определим теперь ai остериорные вероятности того, что это изделие изготовлено на первой, второй и третьей линиях. По формуле Байеса имеем
₽(В/Л1)-₽И1)	0,05-0,2	10
Р (А ,/6)=----------------
£ Р(А)-Р(В/А?)
Р(В/А2)-Р(А2)	0,02-0,3	6
Р(А2/в}=-----------------
£ Р(А')-РЩА?) i= 1
_ Л ,т Р(В/А3)-Р(А3)	0,03-0,5	15
Р (А3/В)=—^--------------
£ РЩ Р'В/А) i= 1
Таким образом, вероятности того, что наугад взятое оказавшееся бракованным изделие изготовлено на первой, второй и третьей линиях, равны соответственно 0,322' 0.194: 0.484. 
Формула умножения вероятностей (2.1.1) может быть распространена на случай произвольного конечного числа событий
Р (Л ,ПЛ2 ...пл,) =
= Р(Л1)-Р(Л1/Л2).,.Р(Ля/Л1ПЛ2П,..ПЛл_1),	(2.1.6)
Определение 2.4. События Ль Л21 ..., Ап независимы в совокупности, если для любого их подмножества
Р ^11Пл,,п...ил,.)=|> (А„у О (Л.)-
Если это условие выполнено только для fe = 2, то события попарно независимы. Из независимости в совокупности вы
29
текает попарная независимость, а из попарной независимости не следует независимость в совокупности.
§ 2.2. Последовательности испытаний
Пусть проводится конечное число п последовательных независимых испытаний, в каждом из которых может произойти определенное событие — успех — или наступит противоположное событие — неудача. Такая последовательность испытаний называется схемой Бернулли.
В качестве таких испытаний можно рассматривать, например, производство изделий на определенном оборудовании при постоянстве технологических и организационных условий, в этом случае изготовление годного изделия — успех, бракованного — неудача. Эта ситуация соответствует схеме Бернулли, если считать, что процесс изготовления одного изделия не зависит от того, были годными или бракованными предыдущие изделия. Другим примером является стрельба по мишени. Здесь попадание — успех, промах — неудача. Если же речь идет о выборичном контроле качества конечной партии изделий объема N по выборке объема п, о выборочной проверке всхожести семян, то даже при независимости и случайности отбора единиц совокупности отдельный акт отбора зависит от того, сколько на предшествующих этапах было извлечено годных изделий (всхожих семян) и бракованных изделий (невсхожих семян). Ниже будет показано, что при Af-*oo эта гипергеометрическая (урновая) схема, рассмотренная в § 1.1, переходит в схему Бернулли.
В схеме Бернулли одному испытанию соответствует множество элементарных исходов, состоящее из двух элементарных событий: |«>о, <oi), coo (неудача) и сщ (успех), при этом А={<01), ”Л={<оо}- Множество элементарных исходов для п испытаний состоит уже из 2" элементарных событий ...j =&’• каждое из которых соответствует конкретному исходу испытаний, при этом набор индексов Л, ..., i„ представляет собой конкретную последовательность нулей и единиц, соответствующую результатам испытаний на каждом шаге.
Если заданы вероятности успеха и неудачи в отдельном испытании pi=p; ро= 1 — р — Я, то можно определить вероятность любого элементарного исхода в п испытаниях. Действительно, рассмотрим любой элементарный исход со- ,, Г л при этом (Л, 12,.... »п) — конкретная последовательность нулей и единиц, соответствующая последовательности .неудач или
30
vcnexoB в каждом из п индивидуальных испытаний, например /Д. Л-,. Д-Тогда из независимости друг от друга результатов отдельных испытаний получаем
Зр{Ч * •„}=р(“«.)р(<%)р (ы‘п)=р^ -р^=рр р-
Таким образом, если общий элементарный исход включает т успехов и п — т неудач, то его вероятность равна
Р(<о, „.Q = pV-m	(2.2.1)
и, следовательно, по аксиоме сложения вероятностей может быть определена вероятность любого события, состоящего из нескольких элементарных событий. В частности, если нас интересует вероятность Рп (tri) того, что в п испытаниях произошло т успехов, то ее определяем как сумму вероятностей элементарных событий, характеризующихся т успехами. Вероятность такого элементарного исхода, согласно формуле (2.2.1), равна pm-qn~m. Следовательно, для нахождения вероятности Рп (т) надо определить число элементарных событий, характеризующихся т успехами, т. е. установить, сколькими способами могут быть на п мест расставлены т единиц (остальные п — т мест занимаются нулями). Но ведь это аналогично тому, что из п элементов надо выбрать (пометить) т элементов. Число таких выборок, как известно, равно числу сочетаний из п по т, т. е. С„. Окончательно получаем
Pn(m) = C” рт qn~m.	(2.2.2)
Сумма получившихся биномиальных вероятностей равна единице:
п	п
£ рп(щ)= £ С-рт<7—'" = (р + <7)-=1"=1. т=0	т~О
В ряде задач представляет интерес наивероятнейшее число успехов, т. е. такое число т* успехов, вероятность которого самая большая среди всех вероятностей (2.2.2). Чтобы определить это число, рассмотрим отношение
Р„ (m+l)_ С:+ *pm+ V"-1 _ (n — m) р РДт) C”pmqn~m (m+l)q'
Если последующая биноминальная вероятность Рл(и’+1) превышает предыдущую Pn (tn}, то это отношение не меньше единицы; если же Рп(т-\- l)^Pn(m), то не больше единицы.
31
Для нахождения т* надо уловить тот момент, когда отношение, бывшее больше единицы, станет меньше единиць Отношение
Р„(т*+1)
Рп(/п*)
(n —т*> р (т* + 1)р
имеет место при т*^пр — q, а отношение
Р„(т*-1)
(п —т*-Ц)р < [ m*q ""
— при т*^пр + р; следовательно, окончательно получаем, что т* лежит в интервале единичной длины
np — q^.m*^np + p.
(2.2.3)
Вернемся еще раз к урновой схеме, чтобы сравнить ее со схемой Бернулли. В случае урновой схемы можно представить себе, что мы осуществляем выборку объема п из урны не сразу, а последовательно шар за шаром. В результате приходим к схеме поспедовательных испытаний, однако в отличие от схемы Бернулли здесь результаты последующих испытаний уже зависят от результатов предыдущих. Так, если веро-й .	М
ятность на первом шаге извлечь белый шар равна —-, то N
условная вероятность извлечь белый шар на втором шаге
равна
М
К- 1
М-1
N— 1
если на первом шаге извлечен белый шар,
, если на первом шаге извлечен черный шар.
и
Однако в том случае, когда генеральная совокупность велика (т. е. N-»-oo), урновую схему можно заменить схемой Бернулли. В самом депе, пусть N, М—гоо таким образом, что М
——>-р = const. Тогда формулу урновой схемы (1.1.3) можно преобразовать следующим образом:
РМ. N
(т, п) =
Ст	—т
М	— M
п
N
М !__________(N-My.________
т! (М— т)! (п — m)\(N — М — п + т)!
п1 (W — п)'
32
п !
т ! (и — т)
М ... (М-т+ 1) (N-M)... (N-M-n + m+ 1) _ X
N... (N — n+ 1)
r,m М ... (Af — m+ 1) (N — М)... (N~М— п + т+ 1)
= С"	/V ... (N —«+ 1)	’
Используя тс, что в получившейся дроби и в числителе и в знаменателе по п сомножителей, разделим и числитель и знаменатель на N", так что каждый сомножитель при этом ,, _ М ,	N — М	.
разделится на N. Заменив — на (p + Oi) и ——— на (q + 4-62). придем к следующему выражению (61, 6s-»-0 при N, М-^оо)-
Переходя к пределу при N, М-+<х>, получаем
lim PMN(m, n)=C^pmqn~m = Pn(m), N-*OO
т. e. при бесконечном объеме генеральной совокупности урно-вая схема эквивалентна схеме Бернулли. На практике это означает, что при объеме выборки, существенно меиьшем объема генеральной совокупности, можно вместо вероятностей урновой схемы приближенно использовать соответствующие вероятности схемы Бернулли, т. е. при n<g.N
?М. N (т’
(2.2.4)
От схемы независимых последовательных испытаний с двумя исходами (схема Бернулли или биномиальная схема) можно перейти к полиномиальной схеме, т. е. к схеме последовательных независимых испытаний, в каждом из которых возможны k исходов, k^2, с вероятностями pi, рг,.... Pk. k
I, £ Pi= 1. В этом случае пространство элементар-/= 1
2 В. А. Колемаев и др.
33
ных событий	содержит	kn таких	событий, а	вероятность того,
что из	п	испытаний	mi	закончатся	первым	исходом,	—
, It	х
вторым исходом,..../и* — Л-м исходом, равна | т^п 1
\ ь=\	J
„ I
Рп («1- т2....ть)=т , т ,--------~T=Pi Р - t 	(2 2 5)
*	' /пр т/. ... тк1
Однако на практике, как бы по показано на примере урновой схемы, далеко не всегда имеют место схемы с последовательными независимыми испытаниями Рассмотрим схему с зависимыми испытаниями, в каждом из которых возможны k исходов. Элементарное событие, как и в случае полиномиальной схемы с независимыми испытаниями, тогда таково:	t ={«[, *2»	'Д- где каждый индекс может при-
нимать k значений, ij= I, 2, .... k.
Вероятности элементарных событий такой схемы задаются следующим образом:
Р (“)=Р ('i)-P (ЧЛ) - Р («п/‘р ‘2.1).	(2.2.6)
k
Р (4/‘1. Ь-1)>°.	£ Р ('s/'i. •••. is-i)= Ь
*,=•
Сумма определенных таким образом вероятностей элементарных событий по всему их множеству должна быть равна единице. Докажем это:
k
£ Р (« l) Р (»2/»1) ••• Р (‘«/‘1.*п — 1) =
: _1
У р(<о)=
Г k
-Г z
Р (h) Р (<2/'i) - Р ft.- i/‘i..‘п-г) X
1
k
X £ P(in/it,.... /„_,)= '„=•
k
=	£	Р («|) Р («2/‘ 1) - Р («П -1/«  .«„ - г)-
‘г *2’ - ‘п- 1= 1
В последнем равенстве было использовано условие (2.2.6) при s = n. Еще и еще раз повторяя эту процедуру, мы наконец
34
1ридем к следующему равенству:
k
£ ₽(“)= £ р(‘1)= !;
«ей	fj— 1
юследнее равенство также следует из (2.2.6).
Последовательности испытаний, в которых условные веро-ггности зависят только от исхода последнего из предшеству-ощих испытаний
Р (V»P »s- l) = P (‘s/'s- 1).
взываются цепями Маркова. Достаточно подробно цепи Ма жова рассматриваются в гл. 6.
Задачи
2.1.	События Д|, Дь —, Д* независимы, P(Ai)=p,, i= 1, ..., k. Найти вероятность:
а)	появления хотя бы одного из этих событий;
б)	непоявления всех этих событий;
в)	появления точного одного (безразлично какого) события.
2.2.	Ь партии N изделий, занумерованных в порядке изготовления от I до N, изделия извлекаются наудачу по одному (без возвращения). Чему равна вероятность того, что хотя бы при одном извлечении номер вынутого изделия совпадет с номером испытания?
2.3.	Рабочий обслуживает 12 однотипных станков. Вероятность того, что станок потребует к себе внимания рабочего в течение промежутка времени Т, равна 1/3. Чему равна вероятность того, что
а)	4 станка за время Т потребуют к себе внимания рабочего;
б)	число потребовавших внимания станков находится в интервале между 3-м и 6-м (включая границы).
2.4.	В семье 10 детей. Считая вероятности рождений мальчика и девочки равными 1/2, найти вероятность того, что в семье:
а)	5 мальчиков и 5 девочек;
б)	число мальчиков от 3 до 8
2.5.	В вузе обучаются 730 студентов. Вероятность того, что день рождения наугад взятого студента приходится иа определенный день года, равна 1/365 для каждого из 365 дней. Найти:
а)	наиболее вероятное число студентов, родившихся I января;
б)	вероятность того, что найдутся три студента, имеющих один и тот же день рождения.
2*
Глава 3
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Понятие случайной величины — одно из осноиных в теории вероятностей. Случайная величина является числовой характеристикой результата эксперимента, т. е. числовой функцией (или вектором), определенной на пространстве элементарных событий Q. В настоящей главе вводится понятие случайной величины функции распределения, изучаются дискретные и непрерывные случайные величины и аналогичные типы многомерных случайных величин.
О Пример 3.1. Будем фиксировать число выпавших гербов при подбрасывании двух монет *\ В зависимости от исхода опыта это число может оказаться равным О, I н 2. Построим математическую модель данного опыта. Выберем в качестве элементарных следующие события: Ш| = ГГ = {на первой монете выпал «герб», на второй — также «герб»}; <02 = РГ = (на первой монете выпала «решка», на второй — «герб»), <0з = ГР = {на первой монете выпал «герб», на вто рой — «решка»), ш4 = РР = (на обеих монетах выпала «решка»). Число выпавших «гербов» X является функцией от элементарного события
Х(Ш1) = Х(ГГ)=2, Х(ш2)=Х(РГ)= I,
Х(ю3)=Х (ГР)= I, X (<о4) = Х (РР) = О
Исход опыта является случайным, поэтому значение X является случайным. Функция Х — Х (ш,) — случайная величина, определенная на множестве элементарных событий Q,
Й = [<0|, ш2, ш3, ш4).
Если монеты симметричны, то элементарные события <0|,..., <1)4 равиовозможны и поэтому естественно в математической модели опыта считать вероятности Р (<о,) равными 1/4, i= I, 2, 3, 4. Зная вероятности P(ioi), можно найти вероятность того, что случайная величина X примет то или иное значение. Рассмотрим, например, событие 4={<i>:X (<о)= 1), состоящее в том, что X примет значение I.
Событие А наступит, если реализуется одно из элементарных событий <02=РГ или шз=ГР, т. е. 4=(РГ, ГР). Тогда Р{(ш):Х(<о)= 2	1
= п=р(Л)=4=д. •
*) Решка — лицевая сторона монеты (аверс), где указан ее номинал, «герб» — оборотная сторона монеты (реверс).
36
Рассмотрим пример случайной величины, определенной на несчетном множестве элементарных событий.
О Пример 3.2. Пусть опыт состоит в определении времени безо, казной работы прибора. Известно, что прибор заведомо откажет за время от нуля до Т, причем если / + Д<7', то вероятность отказа в интервале времени (/, / + Д) для любых Д пропорциональна длине интервала Д и не зависит от t, т. е. момент отказа прибора в определенном смысле равновозможен в любой момент времени от нуля до Т. Построим математическую модель этого опыта.
Введем элементарные события со,= {прибор проработал безотказно время t и в момент I отказал), где	Случайный момент
X отказа прибора является функцией от элементарного события, X(co,) = t.
Множество элементарных событий Й = (со/:О^<^7’} не является дискретным, элементы этого множества нельзя перенумеровать. Такие множества называют несчетными. Зададим поле событий S. В качестве элементов поля событий будем рассматривать всевозможные события вида {со,:7гД|, (Д—произвольный промежуток, принадлежащий [0, 7"]), а также конечные или счетные суммы и произведения этих событий. Зададим вероятность на поле S. Если Л=|ш|:!еД, Де е[О, 7']|. то Р(Л)=—уЦ где IДI — длина интервала Д. Приведенная формула определяет вероятность для любых событий поля S. ф
В обоих рассмотренных примерах каждому элементарному событию со ставилось в соответствие число X (со).
§3.1. Определение случайной величины и ее функция распределения
Случайной величиной называется функция Х’=Х’(со), определенная на множестве элементарных событий й, соей. В случае конечного или счетного й случайной величиной является любая функция, определенная на й. В общем слу  чае функция X (со) должна быть такова, чтобы для любых х событие А = {со:X (со)<х}, состоящее в том, что случайная величина X попадет в интервал (— оо,х), принадлежало полю событий S и, таким образом, для любого такого события была определена вероятность Р (А)=Р {Х<х}.
Случайные величины будем обозначать прописными латинскими буквами X, У, Z....значения случайной величины
на элемент арном событии — строчными латинскими буквами х. У, г, ...
Если множество элементарных событий конечно, то случайную величину можно задать перечислив ее значения на всех элементарных событиях. В приведенной ниже таблице помещены элементарные события со,-, вероятности Р (со,) и зна
37
чения случайней величины X из примера 3.1, равной числу выпавших «гербов» при подбрасывании двух монет.
i	1	2	3	4
<0/	гг	РГ	ГР	РР
Р (ох)	1/4	1/4	1/4	1/4
X (<*)	2	I	I	0
Обратим внимание на то, что случайная величина X может принимать на различных элементарных событиях одни и те же значения. Так, в приведенном примере X (ог)= = Х(соз)= 1.
Во многих задачах нет необходимости рассматривать случайные величины как функции от элементарного события, а достаточно знать лишь вероятности любых событий, связанных со случайной величиной, т. е. закон распределения случайной величины. Говорят, что закон распределения случайной величины X задан, если для любого множества действительных чисел В, являющегося объединением или пересечением конечного или счетного числа промежутков, задана вероятность Р{ш:Х(ш)еВ} события, состоящего в том, что X (и) примет значение из этого множества.
Допустим, например, что в опыте с подбрасыванием двух монет (пример 3.1) нас интересуют лишь вероятности, с которыми случайная величина X, равная числу выпавших «гербов», примет то или иное значение из множества возможных значений {0, 1, 2}. Событие, состоящее в том, что случайная величина X примет значение, равное нулю, равно {РР}, вероятность этого события равна 1/4. Событие {ы;:Х (ш,)= 1} равно событию (РГ, ГР}, его вероятность равна Р{Х=1}= =Р|РГ, ГР}= 1/2. Наконец, Р {Х=2}=Р {ГГ}= 1/4. При построении математической модели в данном случае можно было бы объединить события РГ и ГР в одно и в качестве элементарных рассматривать события {0}, {!}, '2}, состоящие в том, что число выпавших гербов равно нулю, одному или двум соответственно:
{0}=(РР}, {1}={ГР, РГ}, 12) = {ГГ).
Чтобы задать вероятностное пространство и случайную величину иа «суженном*- пространстве элементарных собы тий, в данном случае достаточно задать лишь возможные значения случайной величины и соответствующие вероятности, с которыми эти значения принимаются. Они приведены
38
Таблица 3.1
Xi	0	1	2
Pi	1/4	1/2	1/4
в табл. 3.1, где х,-— значения случайной величины, р;= =Р{Х=х4, i=l, 2, 3.
Случайная величина дискретна, если она принимает значения только из некоторого дискретного множес-'-ва, или, точнее, случайная величина дискретна, если существует конечное или счетное множество чисел Х|, х2, *з, — таких, что
Р И=х„}=р„>0, п= 1. 2, 3, ... и р1 + р2+р3 + „.= 1.
Закон распределения дискретной случайной величины X определен, если известны все хп и вероятности р„=Р {Х = х„) такие, что pi +р2 + ра + -- = 1- Если составить таблицу, в верхней строке которой поместить значения дискретной случайной величины, а в нижней — соответствующие вероятности, то получим ряд распределения случайной величины. Сумма вероятностей, записанных во второй строке таблицы, должна быть равна 1. Ряд распределения задает закон распределения дискретной случайной величины. В табл. 3.1 приведен ряд распределения случайной величины X из примера 3.1.
В примере 3.2 закон распределения случайной величины X уже нельзя задать аналогично предыдущему. Здесь любое значение принимается с вероятностью, равной 0. При построении математической модели опыта в этом примере в качестве элементарных выбраны события сцей, состоящие в том, что случайная величина X примет значение /(X(w<)= = t, tе[0, Г]), в качестве поля событий — совокупность событий, состоящих в том, что X примет значение из произвольного промежутка А, или же конечного или счетного объединения, или пересечения промежутков. Так как для любого события из поля событий S определена вероятность, то тем самым для любого множества А, являющегося объединением или пересечением промежутков, задана вероятность Р {о(:Х	Таким образом, в данном случае задан закон
распределения рассматриваемой случайной величины.
Закон распределения случайной величины X задан, если можно определить вероятность события |й:Х(ш)еЛ) для любого множества А, являющегося объединением или пересечением произвольных промежутков. В свою очередь, любые такие множества А можно получить с помощью операций
39
объединения, пересечения и дополнения из множества всевозможных интервалов вида (—оо,х). Следовательно, и события {<о:Л	можно получить с помощью соответствую-
щих операций над сооытиями из всевозможных событий вида (ы:Х (w)<x}. По определению случайной величины для любых х событие {<о:X (о)<х} принадлежит полю событий S; следовательно, и события вида {<o.X(o)eZ) также принадлежит S и для них определена вероятность. Таким образом, чтобы задать закон распределения произвольной случайной величины X, достаточно знать для любых х вероятности событий (о: X (со) < х}.
Функция распределения Fx (х) случайной величины X определяется формулой
Fx (х) = Р {о: X (со) < х}.
Последнее равенство обычно записывают короче в виде Fx (*)—Р {Х<х}. Для простоты в тех случаях, когда это не может привести к неточности, будем писать F (х) вместо fx(4
Рассмотрим свойства функции распределения.
1°. Функция распределения принимает значения из промежутка [0, 1 ]:
0<Р(х)< 1.
□	Данное свойство вытекает из того, что функция распределения — это вероятность события (Хсх), а значение вероятности любого события неотрицательно и не превышает единицы. 
2°. Вероятность того, что случайная величина примет значение из полуинтервала [хь х2), равна разности F (х2) --Р(х,):
Р {х1<Х<х2|=Р (х2)-F (х,).
□	Представим событие, состоящее в том, что случайная величина примет значение, меньшее х2, в виде суммы несовместных событий
{ш:Х (го)<х2)—((и:Л (<>)<х[)и{“:<X (ш)<х2).
По аксиоме сложения, вероятность суммы несовместных событий равна сумме вероятностей этих событий:
F(x2)=P {ш:Х (ш)<х2)=Р {<о:Х (<o)<Xj)+P {<й:х,<Х (ш)<х2)=
=F(X|)+P{io:x1<X (ш)<х2],
откуда получаем свойстве 2°. 
40
3° Функция распределения — неубывающая функция, т. е.
F (х2)^ F (х если x2>xt.
□	Пусть Х2>Х\. Повторяя приведенные выше выкладки и учитывая, что вероятность любого события неотрицательна, получаем
F (х2)=F (х ,) 4-Р (о: х t С X (<>) < х2} > F (х,). 
4° Р {%>*)= I —Г(лс).
□	Событие (ы:Х (<о)^х) является противоположным событию (ы'Х(ы)<х| и, следовательно,
Р(Х>х)=1-Р{Х<х}=1-Р(х). 
5°. Если х->оо, то F(x)->1.
□	Действительно, пусть Xi, Хг, .... х„, ...— бесконечно возрастающая числовая последовательность, х„-*-оо при п->оо. Рассмотрим последовательность несовместных событий А,, А2, .... А„...;
Л1=(а>.:Х(о)<х1}, An = {a>:xn_l^X (a>)<xn), п = 2,3, ...
Очевидно, событие (ы:Х(ы)<х„) можно представить в виде суммы событий Л(, Аг .... А„:
(ы:Х(<о)<хл}=Д1иД2и..иЛг1.
Согласно аксиоме сложения,
Р(*„)=Р к»:* (“)<*„)=
= Р(Л1)+Р(Л2)+.„ + Р(Лл)= £ Р(А>
«= I
Очевидно также, что событие, равное сумме всех событий А/, является достоверным событием
J А£=й.
i= 1
Воспользовавшись второй аксиомой и расширенной аксиомой сложения, получаем
1=Р(Й)=Р ( и лЛ= V Р(Л,)= lim V Р(Л^)= lim Р(х„).  \'=»	/	,“1	n->ooi=i	я-*°°
6°. Если X-*-—оо, то Р(х)->0.
7*. Функция распределения непрерывна слева, т. е.
lim F(x — A) = F(x).
д-*-+о
41
Свойства 6° и 7° можно доказать, опираясь на следующую аксиому непрерывности.
Аксиома 3". Пусть Ai, А»,	А„, ...— последователь-^
ность событий из поля событий S, причем AiZsAjZ»...^
zz>Ano... и П Л„ = Д. Тогда
п»= 1
lirn Р (АП)=Р (А).
П-ь- со
В аксиоме непрерывности сформулированы условия предельного перехода под знаком вероятности. В ней утверждается в определенном смысле непрерывность вероятности как функции случайных событий.
К аксиомам теории вероятностей можно отнести либо аксиому 3' (расширенную аксиому сложения), либо аксиому 3" (аксиому непрерывности) и тогда другую аксиому можно доказать (она становится уже не аксиомой, а теоремой).
□	Аксяома 3" выводится из 3' следующим образом. Пусть А1Э
СО
=>Л2=)...А„=>... и П Ап=А. Тогда Ai<=A2c. сЛ„с... и п~ 1
со _	_	_
U АП =А. Представим А„ и А в виде суммы несовместных собы-п — I тий:
Ап=АI и (А ,\А2) и I А2\А3) и... и (Ав_ ,\ля)
A=A,U (Л,\Л2) U (Л2\Л3) U-U (Лп_ |\АП) U-- •
Последние равенства легко проверяются с помощью диаграмм Эйлера—Вьенна. Воспользовавшись расширенной аксиомой сложения, получаем
Р (А)=Р (AJ-t-P (Л,\Л2)+...+Р (A^VU-b.^
= Дт [Р (Л,) +Р (А ,\Л2) + ...4-Р (Л„_ ДЛП)] =
= lim Р I(A1)UlA1\A2)U.-U(An_1\Arl)] =
Л-*-со
= lim Р (Лп).
П->оо
Р (Л) = 1—Р(А)= 1— lim Р(А„)= Нт (l-P(A„)]= lim P(A„).B Л-> ©о	СО	со
Докажем теперь с помощью аксиомы непрерывности свойство 6° функций распределения.
□	Рассмотрим произвольную бесконечно убывающую монотонную числовую последовательность Х1>Хг>Хз>...>хп>..., хп->-
42
__ро при n->oo. Рассмотрим последовательность событий А|А2, .... t Лп=(и:-^ (“)<*<•). По определению функции распределения, (х„). Очевидно, последовательность событий Лл, п= 1, 2.
удовлетворяет условиям аксиомы непрерывности: 4iZ3A2=3 4з=э...=э :эАп=>... и П ^„=0-Тогда
Пт Г(хп)= Пт Р(Лп)=Р(0)=О. П~> оо	п~* °о
Тем самым доказано, что при — оо F (х)->-Ь 
□ Для доказательства свойства 7° рассмотрим бесконечно убывающую монотонную положительную последовательность чисел Д|> >Д2> — >ДЛ> — и обозначим через А„ событие Л„={<о:х—Д„^ ^Х(ю)<х), п=1, 2.... Оевидио, Л„+1сзЛл и пересечение всех
событий Аг является событием невозможным (не существует такого
ве(!, что х—Лл<Х(ю)<х для любых и), П Лп= 0. По аксиоме п= 1
непрерывности, lim Р (Ап)=Р (0)=О, но, согласно свойству 2°,
Р(Л„)=Г(х)-£(х-Дп).
Таким образом, получаем
0= lim Р(Л„)= lim (F(x)—£(х—Дп))=£(х)— lim £(х—Д„), П-*- оо	Л~> оо	п—*- оо
откуда
lim F(x—Д )=£(х).И лл—Ю
Функцией распределения может быть любая функция, удовлетворяющая свойствам 1°, 3°, 5°, 6е, 7°, т. е. непрерывная слева в каждой точке х монотонная неубывающая функция, множеством значений которой является промежуток (0, 1) (включающий или не включающий граничные точки 0 и 1).
§ 3.2. Распределения дискретных случайных величин
Дискретные случайные величины принимают конечное нли счетное множества значений. Пусть X — дискретная случайная величина, принимающая значения X1<X2<X3<C <... с вероятностями pi, р2, рз .... Р1+Р2+Р3+ — = 1-
Если по оси абсцисс отложить х>, х2, Хз, .... а по оси ординат — соответствующие вероятности рь р2, рз, ... и соединить соседние точки отрезками, то получим многоугольник распределения случайной величины X. Многоугольник распределения — это графическое изображение ряда распределения Дискретной случайной величины. На рис. 3.1 приведен много-
43
угольник распределения рассматриваемой в примере 3. 1 случайной величины, равной числу выпадений «герба» при подбрасывании двух монет (ряд распределения случайной величины представлен в табл. 3.1).
Рассмотрим функцию распределения F (х) дискретной случайной величины X. Если х^хь то Г(х)=Р{Л'<.х}=0, так как в этом случае событие {Х<х} является невозможным. Если xi<x^x2, то событие (Х<х| наступит тогда и только тогда, когда наступит событие {X = Xi}, поэтому F (х)=Р {Х< <xJ=P(X=XiJ=pi. Если х2<Х^х3, то событие (X<xJ равно сумме событий {X=xi} н (Х=х2) и
F (х)=Р (Х<х}= Р {X=x,J+P {Х=х2}=Р1+р2.
Аналогично, если xf<x^x,+i, то F (х)=р1-)-р2 + ...+р1.
Таким образом, функция распределения дискретной случайной величины равна
F (х}= £ р;,
где р,=Р{Х=х,} и суммирование производится по тем i, для которых х,<х.
Функция распределения дискретной случайной величины постоянна на промежутках (—оо, xij, (Xi x2J, .... (х<, Х'-ц], ... . В точках Xi, х2, Хз, ... функция распределения имеет скачки, равные вероятности того, что случайная величина примет соответствующее значение.
Найдем функцию распределения случайной величины из примера 3. 1, равной числу выпадений «герба» при бросании двух монет. Она может принимать значения 0, 1.2 с вероятностями 1/4, 1/2, 1/4 соответственно (см. табл. 3.1). Функция распределения при х^О равна нулю. В точке х = 0 она имеет скачок, равный 1/4, в точке х= 1 — скачок, равный 1/2, и в точке х=2 — скачок, равный 1/4. Между этими точками функция распределения постоянна. Прн х>2 функция F (х)= I. Таким образом,
{О, если х^О, 1/4, если 0<х«^1, 3/4, если 1<х^2, 1, если х>2.
График функции F (х) изображен на рис. 3.2.
44
Приведем законы распределения дискретных случайных величин, часто встречающиеся в различных моделях.
1.	Равномерное распределение на множестве {1, 2, .... «} Случайная величина X, принимающая целочисленные значения от 1 до п, имеет равномерное распределение, если
P{X=mJ=—, m=l,2........п.
п
Многоугольник распределения случайной величины X представляет собой отрезок прямой, параллельный оси абсцисс. Концы отрезка имеют координаты (1, 1/п) и (п, 1/п).
2.	Гипергеометрическое распределение
Случайная величина X имеет гипергеометрическое распределение, если
rm z-r.— m
niv I V M —Л1	_ , „	-	/ 1Л
P(X = m}=------ ----, m = 0, 1,2...min (n, M).
C-n
Гипергеометрическое распределение имеет место, например, в следующей задаче. Пусть в партии из N изделий М изделий 1-го сорта, а остальные N — М изделий — 2-го сорта. Из этой партии извлекаются для контроля п изделий. Требуется иайти закон распределения случайной величины X, равной числу изделий 1-го сорта среди выбранных п изделий. В соответствии с (1.1.3) X имеет гипергеометрическое распределение.
3.	Геометрическое распределение
Случайная величина X имеет геометрическое распределение, если Pm=P{X=rn}=qmp, m=0, 1,2,..., 0<р< 1, Я= 1—р.
45
Просуммировав бесконечно убывающую геометрическую прогрессию, легко убедиться в том, что
ОО	ОО	ОО	-
I Pm=i: Е р-= I
<я=0	ги=0 т=0	~
Геометрическое распределение имеет случайная величина X, равная числу испытаний Бернулли до первого успеха с вероятностью успеха в единичном испытании р.
4.	Распределение Пуассона
Случайная величина X имеет распределение Пуассона с параметром К. если
1 т
Рт=Р\Х = гг}=—-е~\ ш=0, 1,2, ... Х>0. т!
Воспользовавшись разложением ех= £ —р получаем /п = 0	'
ек в ряд Макпорена
п т
е-хех= 1.
т!
со	оо	оо
Z р-= Z —e-*=e-*z m=0	т*-=0	т~0
Многоугольники распределения случайных величии, имеющих распределение Пуассона с различными значениями параметра %, и юбражены на рис. 3.3.
5.	Биномиальное распределение
Целочисленная случайная величина X, принимающая значения от 0 но п. имеет биномиальное распределение, если Р{Х = т} задается формулой Бернулли (2.2.2):
46
р 1х=т}=рп(т)=с^ртдп-т.
т—0, 1,2,..., n, 0<р< 1, <7=1 — р.
Ряд распределения случайной величины X имеет следующий вид:
т	0	1	2		k		п
Pn (т)	<7Л	Cl.pq"-1	суг2		с‘Ая_‘		р"
Как показано в § 2.2, по формуле Бернулли можно найти вероятность т успехов в п испытаниях Бернулли с вероятностью успеха р и неуспеха q = 1—р Таким образом, случайная величина, равная числу успехов в п испытаниях Бернулли, имеет биномиальный закон распределения.
При больших значениях п вычисление вероятностей Pn(m) по формуле Бернулли становится затруднительным. Однако в ряде случаев удается заменить формулу Бернулли подходящей приближенной асимптотической формулой. В частности, если п велико, а вероятность успеха р мала, то
Следующая теорема обосновывает использование указанной поиближенной формулы.
Теорема 3.1 (теорема Пуассоиа). Если и р-*-0, так что пр-*4., 0<Х<оо, то
Pn(rn) = ^pmqn-m-^pm=^-^ ml
при любых ш, m = 0, 1, 2, ....
□ Обозначим Хя=ир' тогда р=-. По условию теоремы,
п
при л->оо. Представим Pn(m) в виде
Prt(^=c^V_m=
n(n-l)fa-2Mn-(m-Q) у Л_ V"" ml	\n J \ п /
47
При п-»-оо имеем
Отсюда получаем утверждение теоремы
——е Л при н—оо.И
Если при больших п вероятность р успеха в испытаниях Бернулли близка к единице, то вероятность неуспеха q близка к нулю. В таком случае пуассоновское приближение можно использовать для вычисления вероятности количества неуспехов.
При больших п и малых р погрешность от замены точной формулы приближенной мала. В табл. 3 2 приведены сравнительные результаты вычислений Р^т) по точной формуле
Pn(,nl=C?p"</-m
н по асимптотической формуле Пуассона
Рг. (т)»Рт
с-пр mt '
При л= 10 вероятности Р„(т) вычислены для р= 1/5, а при п= 100 — для р= 1/50. Параметр распределения Пуассона Х=лр в обоих случаях равен 2.
Таблице 3.2
т	0	1	2	3	4	5
Рт	0,1353	0,2707	0,2707	0 1805	0,0902	0,0361
Рю (т)	0,1074	0,2684	0,3020	0.2013	0,0880	0,0264
Ркт (т)	0.132R	0,2707	0,2734	0,1823	0,0902	0,0353
О Пример 3.3. Прядильщица обслуживает 1000 веретен. Вероятность обрыва нити на одном веретене в течение 1 мин равна 0,002 Найти вероятность того, что в течение 1 мин обрыв произойдет более чем на трех веретенах.
Если обр^в нити назвать «успехом», то в данном примере требуется найти вероятность того, что в п = 1000 испытаниях Бернулли число успехов р„ превысит 3. Вероятность успеха в каждом испытании
48
рж0.002, а вероятность неуспеха <7 = 0,998. Имеем
Р(р„>3|= 1 —Р(Цл<3)= 1 — Р{ц„ = 0) — Р|ця= 1}—Р{ц„ = 2)—
Р {р»=3}-
Воспользовавшись формулой Бернулли, получим
Р (цп>3)= 1 —0,998100°— 1000-0,002-0.9989" —
1000'9j^. о 0022.0.998998-10°—99'998-. 0.0023 • 0,998еэт.
2	6
В данном случае число п велико, а вероятность р мала, Х=ри = = 2. Воспользовавшись теоремой Пуассона, находим
— 2 2°	-2 2	—2 22	—2 23
01	1!	2!	31
₽К>3)=1-е
= 1 — 0,1353 — 0,2707—0,2707 — 0,1805 = 0,1428_>
Замена формулы Бернулли при больших п приближенной формулой Пуассона оправдана, если npq^9. Если же произведение npq велико, то для вычисления Р^т) используют локальную теорему Муавра--Лапласа.
Теорема 3.2 (локальная теорема Муавра—Лапласа). Пусть р^ (0, 1) постоянно, xm=-^-=^S- ограничено, |хт| <
< с, где с — любое число. Тогда при п-*- оо
1	__г2 /о
Р»=С:Ру-%	-----е (1 + а(п, ш)),
-\j2irynpq
С|
где |а(л, т)| <—ci — некоторое число.
\п
Доказательство теоремы 3.2 можно найти, например, в [10, 44]. Отметим, что в условиях теоремы 3.2 из того, что «-►оо, следует, что ш—>-оо.
Согласно теореме 3.2, при больших п
Рп (т)« рт=<р (хт), ynpq
ynpq	у2л
Для вычисления вероятности Рп(т) по формуле (3.2.1) используют таблицы функции ф(х)=—?—Р-^/2.
(3.2.1)
= е '2л
49
Таблица 3.3
tn	0	1	2	3	4	5	6
Pio (zn) pm	0,1074 0,0904	0,2684 0,2307	0,3020 0,3154	0,2013 0,2307	0,0880 0,0904	0,0264 0,0190	0,0055 0,0021
Погрешность от замены Р^т) на рт мала при больших п Наиболее хорошие результаты с помощью асимптотической формулы можно получить при p = q= 1/2. Практически можно считать, что рт дает хорошее приближение для Рп(т), если пр<7>9. В габл. 3.3 приведены для сравнения точные и приближенные значения вероятностей при р = 0,2.
Для вычисления при больших п вероятности того, что число успехов в п испытаниях Бернулли находится между пц и тг, используется интегральная теорема Муавра— Лапласа.
Теорема 3.3 (интегральная теорема Муавра—Лапласа). Если вероятность успеха в каждом испытании р, 0<р< <1, постоянна, то при п->оо для любых а, Ь
□ Для фиксированных а, Ь представим вероятность
в виде
{р — пр )	_,
I
т — пр
где хт=—----- и суммирование ведется по тем зиачеииям т для
д/лр?
которых	Воспользовавшись локальной теоремой Муав
ра—Лапласа, получаем
Рп(а. Ь) = У ‘	<р (xm) (1 -t- а (и, m))=
У <J> (Xj * + У q> (Xm) ~ a (n, m),
50
<p(x)=—L^e д/2л
1
Множитель — -- является приращением Дх„ величины х„: л/прч
^хт~-Хт+1 Хт
т+1 ~пр
т—пр
1
Таким образом, первую сумму можно представить в виде

причем Дхт->0 при п-»-оо. Оиа является интегральной суммой, соответствующей интегралу q>(x)dx. Следовательно, при п->оо
а
1 г
У <р (xj 	<р (х) dx.
~\пРЧ а
Оценим вторую сумму У <j> (хт) —а (л, т). Множи-
W
С|	.--
тель ]а (n, т)| <——- Так как а<х„<6, то np+a\npq^m^np + уп
+lr\]npq и, следовательно, число слагаемых ие превосходит величины (Ь—a)~\lnpq + l. Имеем
I У	q>(xm)—= a(n, m)| С
W? Vя \пРЧ Уп
При п-»-оо вторая сумма стремится к нулю.
Таким образом, для постоянных а, Ь теорема доказана. Она справедлива и в том случае, если вместо а или b подставить — оо или оо. 
На основании интегральной теоремы Муавра — Лапласа
для вычисления вероятности события
51
больших п используют приближенную формулу
р„(а, Ь)=Р	bI«\ <р(х) dx,
1 \nPQ I 2
где <p(x)=—J=e у2л Обычно приближенную формулу используют, если npq> ь
>9. Значение J <р (х) dx можно найти воспользовавшись а
1 Г 2
таблицами функции Ф(х)=—= \ е—1 /2 d/: \2л -оо
Ъ	Ъ	а
J<p(x)dx= J <p(x)dx — J <р (х) dx = <D (Ь) —Ф (а). а	— со	— со
Таким образом, при больших п
(3.2.2)
где
г	2
Ф(х)=—*=- t e-'/2d/ Joo
Таблица функции Ф (х) для х^О приведена в конце книги. Если х<0, то Ф (х) вычисляют по формуле
Ф(х)= 1-Ф(-х).
Действительно, так как функция <р (х)
1	—x^/2
-= е '— чет-’2л.
ная, <р(х)=<р(—х), то
J <p(x)dx= J <p(x)dx
и тогда
Ф(х) + Ф(-х)= J <p(x)dx+ J <p(x)dx=
52
= $ 4>Wdx+ $ <p(x)dx =
<p(x) dx = lim P
n-> oo
Так как события
достоверные, то
и, следовательно.
е *!/2djt=l,
(3.2.3)
Ф (х)= 1 — Ф ( — х).
Заметим, что событие	равносильно еобы-
(т, — пр	цп — пр т2 — пр\
тию)— -—— I. Поэтому в соответст-
1 ynpq ynpq ynpq J
вии с (3.2.2) для вычисления вероятности того, что число успехов в п испытаниях Бернулли заключено в пределах от mi до т^, можно использовать формулу
I *
P{wii<p.n<m2}«—— t е~'!/2 d/ = ®(x2) —Ф(х,),
№ X,
где х,=
т{ — пр
fnpq
х2
ГП2— пР
Если npq сравнительно невелико, то приближенную формулу (3.2.2) рекомендуется заменить другой (см., например [37, 44]):
Рп — пр
~ф(ь+* тМ-ф(а~Т~T=Y	<324)
\	2 ynpq /	\	2 упря /
Формула (3.2.4) дает лучшее приближение для рв(а, Ь) по сравнению с (3.2.2), однако это заметно при сравнительно
53
Таблииа 3.4
п	р	/Пь т2	0; 2	3:5	6; 8	9; 10
10	0,2	р {mi, т2) рь (пи, m2) pi (mi, m2)	0,6778 0,4429 0.6316	0,3158 0,2059 0.3455	0,0064 0,0007 0,0029	0,0000 0,0000 0,0000
	0,5	p (mi, m2) po (mi, m2) pi (mi, m2)	0.0547 0,0277 0,0558	0,5684 0,3980 0,5696	0,3662 0,2356 0,3651	0,0107 0,0057 0,0133
100	0,2	mi, m2	10; 15	16; 20	21; 25	26; 30
		p (mi, m2) po (mi, m2) pi (mi, m2)	0,1262 0,0994 0,1250	0,4310 0,3413 0,4223	0,3531 0,2957 0,3480	0,0814 0,0606 0,0795
	0,5	mi, m.2	30, 50	36; 40	41; 45	46; 50
		p {mi, m2) po (mi, m2) pi (mi, m2)	0,0017 0,0013 0,0018	0,0267 0,0202 U,026y	0,1557 0,1227 0,1563	0,3557 0,2881 0,3558
небольших п, не превышающих 30—50. Наглядный пример преимущества формулы (3.2.4) иллюстрирует табл. 3.4, в которой
Р {т{пг^=Р {т, < н„<
р0(т1т2)=Ф
т2—пр
-Ф
т,—пр
'npq
Pi (пг|т2)=ф
т2 — пр-{-1/2
’npq
npq
Обозначим через р вероятность того, что относительная частота успехов в п испытаниях Бернулли отклонится от вероятности успеха р не более чем на е>0. Имеем
Hi —-pi <4=^
п	)
(3.2.5)
54
Если п достаточно велико, то с помощью формулы (3.2.2) можно определить вероятность 0:
Получаем
{| £_,| <«}»2Ф («	1. (3.2.6)
Равенство (3.2.5) содержит четыре параметра: п, р, е, р. Зная три из них, можно с помощью (3.2.6) определить четвертый параметр. Если известны п, р, е, то вероятность р находится непосредственно по формуле (3.2.6). Пусть теперь известны р, е, р. Определим, сколько надо провести испытаний, чтобы отклонение относительно частоты рп/и от вероятности р было меньше е с вероятностью, не меньшей р. Другими словами, найдем такое п, для которого выполняется неравенство
(3.2.7)
Воспользовавшись (3.2.6), получаем 2Ф
откуда Ф	=ф (хр). Из таблицы функции
I I R
Ф(х) найдем число xjf, для которого Ф(хр) =———. Так как
Функция Ф (х) монотонно возрастающая, то е ~\г
р. от-
*	— квантиль нормального распределения, отвечающая уров-
ню вероятности (1 + Р)/2 (см. (3.3.3) и гл. 7).
55
куда получаем
n>pq^--е
(32.8)
Если число испытаний п удовлетворяет условию (3.2.8). то выпотняется неравенство (3.2.7).
Допустим теперь, что вероятность р успеха в единичном испытании Бернулли неизвестна и требуется (при заданных е и р) определить число испытаний п, обеспечивающее выполнение неравенства (3.2.7). В число искомых значений входят те, которые удовлетворяют неравенству
1
(3-2-9)
4 е
Действительно, если п удовлетворяет неравенству (3.2.9), то, воспользовавшись тем, что 1/4, получаем, что выбранное п удовлетворяет (3.2.8) при любых р:
1 4 . Х1 п>-£-т>рч-т-4 е е
Из интегральной теоремы Муавра—Лапласа непосредственно вытекает следующая теорема:
Теорема 3.4 (теорема Бернулли) Пусть р.п— число успехов в п испытаниях Бернулли с вероятностью успеха в каждом испытании р, 0<р< 1. Тогда для любого е>0
lim Р 11 —- -р | <е|= I.
П-> ао	fl	}
□ Воспользовавшись интегральной теоремой Муавра — Лапласа и равенством (3.2.3), получаем
= lim Р
Теорема Бернулли отражает свойство статчстичсской устойчивости относительной частоты случайного события. Из
56
опыта известно, что если, например, много раз подбросить сальный кубик, на гранях которого нанесены числа от 1 до 6 то относительная частота появления четного числа очков ' /п близка к 1/2, т. е. к вероятности этого события в единичном испытании. То же самое можно сказать об относительной частоте случайного события и в других испытаниях, укладывающихся в рамки схемы Бернулли. Это свойство называют статистической устойчивостью относительной частоты случайного события. В соответствии с теоремой Бернулли для любого е>0 и любого сколь угодно близкого к единице р, 0<р< 1, можно найти такое число п (е, р), что для любых п>п(е, р) выполняется (3.2.7), т. е. с вероятностью, не меньшей р, относительная частота цп/п находится в пределах р — е<цп/«<р + е.
Если Р очень близко к 1, то событие {р — е^рп/п^р+е) будет практически достоверным при п~^п(е, р), т. е. оно должно, как правило, осуществляться, если п^п(е, р).
В теореме Бернулли сформулирован закон больших чисел для числа успехов в испытаних Бернулли. Более общая форма закона больших чисел приведена в гл. 5.
О Пример 3.4. Вероятность того, что случайно выбранный нз партии прибор нуждается в дополнительной регулировке, равна 0,05. Если при выборочной проверке партии приборов обнаруживается, что 6% отобранных приборов нуждаются в регулировке, то вся партия возвращается для доработки. Определить вероятность того, что партия будет возвращена, если для контроля из партии выбрано 500 приборов
Воспользуемся схемой Бернулли с п = 500 испытаниями. Будем считать, что имеет место «успех», если выбранный прибор требует дополнительной регулировки. Требуется найти вероятность того, что в п испытаниях Бернулли число успехов не меньше mi=0,06n = 30. Вероятность успеха р = 0,05, неуспеха 7 = 0,95, пр = 25, npq = 23,8, \/npfl=4,87. Для решения задачи применим интегральную теорему Муавра — Лапласа:
Р{30<цл<500)=Р
[30—25 < МП-"Р < 500-25 )
( 4,87	4,87 J
= р Jl,03< ”Р	f e-x2/2dx = <l(97) —Ф(1,03) =
I 'Jnpq J y2n । оз
= 1,000 - 0,808 = 0,192
Значение Ф (1,03) найдено по табл. 2 приложений Как видно из этой таблицы, для х5*4,05 Ф(х)=1 с погрешностью, не превышающей 5-10~6, поэтому Ф (97)= 1,090. ф
57
О Пример 3.5- Определим, сколько нужно отобрать деталей, чтобк с вероятностью 0,95 можно было утверждать, что относительная частота бракованных деталей будет отличаться от вероятности их появления не более чем на 0,01.
Выберем в качестве математической модели схему Бернулли н воспользуемся интегральной теоремой Муавра — Лапласа. Будем считать «успехом» появление бракованной детали. Надо найти такое и, чтобы выполнялось неравенство (3.2.7), если е=0,01, ₽ = 0,95, а вероятность успеха р неизвестна. Значение п находим с помощью неравенства (3.2.9): из табл. 2 Приложений определяем хр = 1,96, ,	х 1+₽	1+0,95 лп__
удовлетворяющий условию Ф(хр)=—-—=-------------=0,975, затем
получаем
1	_ 1 1,962
4 е2 4 0,012
9600.
Таким образом, достаточно отобрать п=9600 деталей.
Если в условиях примера 3.5 известно, что р^0,1, то ^0,1-0,9 и тогда в соответствии с (3.2.8) можно определить п нз
неравенства п> 0,1 -0,9—~~^pq —откуда получаем nJ>3460. Вос-е2 е2
пол1 зовавшись дополнительной информацией, можно почти втрое уменьшить объем выбираемой совокупности деталей, ф
§ 3.3. Распределения непрерывных случайных величии
Очевидно, что если множество элементарных событий £2 дискретно, то н случайная величина, определенная на £2, также дискретная. Наряду с дискретными случайными величинами (т. е. случайными величинами, принимающими конечное или счетное множество значений) в теории вероятностей н ее приложениях широко используются непрерывные случайные величины. Множество значений непрерывной случайной величины несчетно и обычно представляет собой некоторый промежуток, конечный или бесконечный. Непрерывная случайная величина определена на несчетном множестве элементарных событий £2. Рассмотрим, каким образом можно задать вероятность на таком множестве £2.
В примере 3.2 случайная величина X задает взаимно однозначное соответствие между множеством элементарных событий и отрезком (0, Г]. Поэтому при построении математической модели данного опыта в качестве множества эле ментарных событий можно выбрать отрезок [0, Г]. Элементами поля событий S — случайными событиями — являются объединения всевозможных промежутков, принадлежащих
-18
(О Г] • Вероятность любого события равна отношению длин оомежутков, составляющих события, к длине отрезка [О, Г]
Обозначим через <₽(/) функцию <р(0=1/Г,	Тогда
если А=[а, fe]e[O, Г], то
»	I ь
P(A)=\<f(t)<H = —\At--------
если же событие А равно объединению каких-то непересекаю-щихся промежутков, то вероятность события А равна сумме интегралов от <р (г) по этим промежуткам Р (Д)=j <р (/) б/. Аналогично можно задать вероятность и в более общем случае. Рассмотрим подробнее этот способ задания вероятности.
Пусть множество элементарных событий Q совпадает с множеством действительных чисел Q = (x:xe(—00,00)} и пусть случайными событиями из поля событий S являются всевозможные конечные или бесконечные промежутки и их конечные или счетные объединения Вероятность на поле событий S задается с помощью неотрицательной функции ф(х), интегрируемой на любом конечном или бесконечном оо
промежутке и такой, что <р (х) dx = 1. Если событие А рав-— оо
но объединению непересекающихся промежутков, то вероятность Р (Д) равна сумме интегралов от <р (х) по этим промежуткам:
Р ф (х) dx.
Определенная таким образом на S вероятность удовлетворяет всем аксиомам теории вероятностей. Описанное выше вероятностное пространство будем называть непрерывным вероятностным пространством.
Не всякая случайная величина, определенная на несчетном множестве й, является непрерывной.
Случайную величину X будем называть непрерывной, если существует неотрицательная функция Рх(х) такая, что при любых х функцию распределения Fx (х) можно представить в виде *
J Рх(У)йУ-— °°
В ряде руководств такие случайные величины называются абсолютно непрерывными.
59
Будем рассматривать только такие случайные величины, для которых рх (х) непрерывна всюду, кроме, быть может, конечного числа точек.
Функция рх (х) называется плотностью распределения вероятностей или плотностью распределения. Если из изложения ясно, о какой случайной величине идет речь, то будем писать р (х) вместо рх (х).
Из определения вытекает, что в точках непрерывности плотность распределения равна производной функции распределения:
p(x) = F'(x).
Из определения также следует, что плотность распределения рА(х) определяет закон распределения случайной величины х.
Для любых Xi<X2
хг
Р (х,	X< х2}= J р (х) dx.
(3.3.1)
□ Действительно,
Х2	Х1
Р{х1<Х<х2}=Р(х2) —Р(х1) = J p(x)dx — J p(x)dx = — оо	— оо
X,	Х2	X]	Х2
= J р(х) dx+J р(х) dx— J p(x)dx= J р (х) dx.  Xj	-ОО	x,
Вероятность P{xi^X<x2} равна площади фигуры, ограниченной прямыми x=xi, х=х2, у = 0 и плотностью распределения у = р (х). На рис. 3.4 изображена плотность распределения вероятностей р (х) и заштрихована площадь фигуры, равная вероятности P{x,^X<x2}
Интеграл по всей числовой прямой от плотности распределения вероятностей равен 1.
«Р
Рис. 3.4
□	Действительно,
°°	г
( p(x)dx=lim \ p(y)di/=lim Р(х)=1. 
А
Вероятность того, что непрерывная случайная величина примет конкретное значение, равна нулю:
Р{Х=а}=0.	(3.3.2)
□	Представим событие (Х=о) в виде (Х = а}=
== П |а sSj X<: а +1/л} и воспользуемся аксиомой непрерыв-л== 1
ности 3".
Р(Х = а}= lim Р Ja<X<a + —U
«->оо	J
а+ 1/п
= lim p(x)dx=0.  п—« J
Из (3.3.2) получаем, что для непрерывных случайных величин
Р {х, ^.Х<х2}=Р (Xj ^Х^х2}=
=Р {Xj <Х<х2}=Р {х, <Х<х2].
Из (3.3.1) вытекает, что если х — точка непрерывности плотности распределения р (х) и если Л->0, то
Р {х<Х<х + Д)=р (х) А + а (А) А,
где а (А) — бесконечно малая величина. Чем больше плотность распределения р (х), тем больше вероятность того, что случайная величина попадет в заданный небольшой интервал (х, х+Д).
Плотностью распределения может быть любая неотрицательная функция, интеграл от которой по всей числовой прямой равен 1.
Функция распределения случайной величины любой точке Хр ставит в соответствие вероятность p=F (хр)=Р [X<Zxp]. Иногда возникает обратная задача: по заданному значению р найти такое хр, чтобы
F(xp)=p.	(3.3.3)
Точка хр, для которой выполняется (3.3.3), называется квантилью, отвечающей заданному уровню вероятности р, или 100 %-ной квантилью.
61
Из определения непрерывной случайной величины следует, что функция распределения непрерывной случайной величины непрерывна. Поэтому для непрерывной случайной величины для любых р, 0<р<1, существуют квантили хр.
Если положить, например, р=0,95, то получим 95 %-ную квантиль. В математической статистике обычно используют квантили, отвечающие уровням вероятности 0,01, 0,05, 0,1, 0,9, 0,95, 0,99.
Квантиль, отвечающая значению р=1/2, называется медианой распределения. Медиана является одной из характеристик центра распределения вероятностей. Случайная величина с равной вероятностью может принимать значения, меньшие или большие медианы.
Непрерывные случайные величины уже встречались в примере 3.2. Пусть X — случайная величина из этого примера, определенная на множестве элементарных событий Й = [0, Г]. Вероятность события А из поля событий S задается с помощью формулы Р (4)=^ V W ^Г. где <р (0=1/7', если О^Г^Г. Если О^х^Т, то
F(x)=P(X<x}=i±dr=A.
Положим <р(Г)=О, если Г^[0, Г]. Тогда если х<0, то
X Р(х)=Р(Х<х1=0=	<₽(f)d*.
— оо
а если х> Г, то
F(x)=P(X<x|=l
О	Г	х	X
J 0d/ + J -Ld/ + ( 0d/= J <f.(r)d/.
— oo	0	*	— OO
Итак, при любых x функцию распределения можно представит! в виде интеграла от неотрицательной функции <р (f):
X
f(x)= J <J) (Г) dr; — oo
следовательно, X — непрерывная случайная величина с плотностью распределения <₽(/), непрерывной всюду, кроме Г=0 и Г = Г.
О Пример 3.6. Пусть пространство элементарных событий £2 является отрезком, Й=[—1,1], событиями являются всевозможные объединения промежутков, принадлежащих отрезку (—1,1]. Пусть далее вероятность событий задается с помощью функции f(<o)=l/2,
62
постоянной иа всем отрезке [—1,1]:
Р И!=Р {<о:<оЕЛ|= (-1 d <0.
Если А=[а, 6]е[-1,1), то Р 0|=(Ь-а)/2.
Мы опреде (или все элементы вероятностного пространства (Й, S, р\. Зададим теперь на множестве элементарных Событий Й случайную величину. Пусть X 1<в) = 2| <л| (например, при <о=—0,4 X (<о)= _2-0,4=0,8) Найдем функцию распределения и плотность распределения случайной величины X.
Так как 0^Х(ш)^2, то F(x) = 0 для х^О и F(x)=l при х^ ^2. Найдем Г(х) для хе(0,2).
Множество Лх={ш:Х (<о)<х) представляет собой интервал ( — х/2, х/2):
Лж= {<о:Х(<о)<х)={ш:2 |<о| <х|={ш: — х/2<ш<х/2|.
Для хе (0,2) функция F (х) равна
E(x)=PHJ= ( f<<fl)do>= ydo)=yX-
Лх	—х/2
В результате имеем
0 при х^СО,
х при 0<х^2,
1 при х>2.
Г рафик функции F (х) изображен на рис 3.5. Функция распределения F (х) непрерывна на всей числовой оси и дифференцируема всюду, кроме точек х=0 и х=2. Следовательно, X — непрерывная случайная величина. Найдем ее плотность распределения’
{О при х<0,
при 0<х<2,
О при х>2.
В точках х=0 и х = 2 можно положить р(х) равной произвольному числу, например нулю. График плотности распределения р (х) приведен иа рис. 3.5.
63
В заключение параграфа приведем наиболее распространенные законы распределения непоерывных случайных величин.
1.	Равномерное распределение
Непрерывная случайная величина X, принимающая значения на отрезке [а, Ь], имеет равномерное распределение, если плотность распределения р (х) имеет вид
плл= f 0 при х<£[а, fe], ' '	|l/(fe— а) при хе[а, Ь].
ОО
Нетрудно убедиться, что J p(x)dx=l. — оо
Для случайной величины, имеющей равномерное распределение, вероятность того, что случайная величина примет значения из заданного интервала (х, х + Л)е[а, fe], не зависит от положения этого интервала на числовой оси и пропорциональна длине этого интервала Д:
1	Д
Р {х<Х<х + Д}= \ --------dt=-------.
J b — а	Ь — а
Функция распределения X имеет вид
при х^	5 а.
при а<	Сх<Ь,
при	>Ь.
Найдем медиану распределения х05. Имеем F (х05) = 0,5, откуда х05=—-—. Итак, медиана равномерного распределения совпадает с серединой отрезка [а, 6].
Случайные величины из примеров 3.2 и 3.6 имеют равномерное распределение на отрезках [О, Г] и [0, 2] соответственно. Графики плотности распределения и функции распределения случайной величины, имеющей равномерное распределение на отрезке [0, 2], приведены на рис. 3.5.
2.	Экспоненциальное (показательное) распределение
Непрерывная случайная величина X, принимающая неотрицательные значения, имеет экспоненциальное (показательное) распределение с параметром X, если плотность рас пределения случайной величины при х>0 равна р (х) = 1 е~Кх и при х<.0 р(х)=0.
64
Функция распределения случайной величины X равна
F(x)= J p(/)df = — оо
Г 0	при х^О,
л I —	прн х>0.
Графики функции распределения и плотности распределения приведены на рис. 3.6.
О Пример 3.7. Пусть, как и в примере 3.2, опыт состоит в определении времени безотказной работы прибора, однако на этот раз заменим условие, состоящее в том, что прибор должен отказать до момента времени Т, на более оправданное во многих ситуациях усло
вие, что момент отказа прибора t может быть любым неотрицательным числом, те(О, оо). Обычно выполняется следующее условие: если
прибор проработал время т, то это никак не отражается на вероятностных характеристиках оставшегося времени наработки на отказ. Так, вероятность отказа прибора в интервале времени (0, t) равна вероятности отказа в интервале (т, т + /), если прибор уже проработал безотказно время т. Последнее условие обычно называют «отсутствием последействия», поскольку время ожидания отказа не зависит от
того, сколько времени прибор уже проработал.
Выберем в качестве множества элементарных событий числовую ось —оо, оо)|, где t — момент отказа прибора. Зададим поле событий S. Пусть элементами S являются всевозможные промежутки числовой оси и их объединения в конечном или счетном числе. Вероятность на поле S зададим с помощью неотрицательной функции р (/):

Введем случайную величину X — момент отказа прибора: Х(/)= = Л (ей. В данном случае элементарными являются события, состоящие в том, что случайная величина X примет то или иное значение. Очевидно, функция p(t) является плотностью распределения случайной величины X, поскольку
F (х)=Р (Лх)= J р (/) dt = j р (t) di, /	— ОО
где —оо, х). Рассматриваемая случайная величина X имеет экспоненциальное распределение. Покажем, что она удовлетворяет условию «отсутствия последействия». Для этого начо доказать, что
3 В. А. Колемаев и др.
65
условная вероятность наступления отказа прибора Р(т+а^Х^т-р 4-Ь/Х^т) в промежуток времени [тЦ-а, т-t-bj при условии, что прибор проработал время т, равна безусловной вероятности наступления отказа Р(а<Х<Ь) в промежуток времени [а. 6J где 6>а>0.
Найдем вероятность Р (а^Х^6|. Имеем
Р (а < X < 6} = F (6) - F (а)=е ~ *“—е ~ >ь.
Воспользовавшись тем, что пересечение событий (т+а^Х^т-f-b) и (Х^т| равносильно событию (г-|-а^Х<т4-д}, и определением условной вероятности, получаем
_ Р{а+т<Х<&+-г}
Р(Х>т}
Вычислим числитель и знаменатель дроби:
Р{а+т^Х<6+т|=е-х(т+‘1)-е-х<т+6)=е_*'т(е_’л-е_*'6),
Р{Х^т}=1-Р(т)=е“Хт.
результате получаем искомый результат:
е—(e~ka—е—’‘Ь
Р {а+т^Х < &+т/Х>т)=-----------------=
е Кт
=е-^-е-к',=Р{а<Х^Ь}.
Отсюда непосредственно вытекает, что если случайная величина X имеет экспоненциальное распределение, то
F (t)=P (Х</+т/Х>т).
(3.3.4)
Равенство (3.3.4) отражает свойство «отсутствия последействия» Использование экспоненциального распределения в математических моделях реальных явлений обычно связано именно с этим характерным свойством распределения. Экспоненциальный закон — единственный из законов распределения, который обладает данным свойством. ф
3.	Нормальное распределение
Непрерывная случайная величина X имеет нормальное распределение вероятностей с параметрами а и о>0, если ее плотность распределения имеет вид
Если X имеет нормальное распределение, то будем кратко записывать это в виде Х~УУ(а, а).
66
Доказательство того, что
1 , опирается на
формулу (3.2.3):
30	СО
1 p(x)dx = д- е
J	— оо д/2л о
2
dx.
Сделаем замену переменных Х— а-=<; тогда dx = odt Далее
имеем
A-e-4di=-t д/2ла	д/2л
плотности
Графики распределения при различных значениях параметра одном и том же значе-а приведены на рис. Плотность распределе-р(х) симметрична от-прямой х =
Рис. 3.7
а и НИИ 3.7. НИЯ
носительно = а (т. е. р(а + у) = р(а — —у)). Если х->-±оо, то р(х)-»-0. При уменьшении а график «стягивается» к своей оси симметрии х = а.
Будем говорить, что последовательность случайных величин Хь Хг,... Х„,... асимптотически нормальна, если для любых х при п—>оо
1 (х-а)2
2 а2
dx.
роль в теории с тем, что в со-
lim Fx (х) = Д.  j °°	" д/2ло _•
Нормальное распределение играет особую вероятностей и ее применениях. Это связано
ответствии с центральной предельной теоремой теории вероятностен при выполнении определенных условий сумма большого числа случайных величин имеет «примерно» нормальное распределение. Центральная предельная теорема рассматривается в гл. 5.	।
Так как <р(х) =——плотность нормального за-у2л
кона распределения с параметрами а —О и а=1, то функция
3*
67
Ф (х)=—р=- ( е /2/2d/, с помощью которой по формуле у2л — оо
Нп — ПР
(3.2.4) вычисляется вероятность Р|а^— — fe), являет-\npq
ся функцией распределения нормального распределения с параметрами а = 0, а=1.
Функцию распределения нормальной случайной величины с параметрами а, о можно выразить через Ф(х) — функцию распределения нормальной случайной величины с параметрами а = 0, о=1. Пусть X~N(a, о). Воспользовавшись за-t — а меной переменных под знаком интеграла-----=у,
о
получаем
В практических приложениях теории вероятностей часто требуется найти вероятность того, что случайная величина X~N(a, о) примет значение из заданного отрезка [хц х2]. В соответствии с (3.3.5) эту вероятность можно найти по таблицам функции Ф(х):
Р Iх 1 ^Х^х2}= Fх (*2) Рх (•xi)=
Найдем медиану нормальной случайной величины X~ ~ N (а, о). Так как плотность распределения рх (х) симметрична относительно оси х—а, то
$ Рх (x)dx= $ px(x)dx
и, следовательно,
Р(Х<а}=Р(Х>а}=0,5.
Таким образом, медиана нормальной случайной величины Х~(У(а, а) совпадает с параметром а:х05 = а.
68
§ 3.4. Многомерные случайные величины
На одном и том же пространстве элементарных событий может быть определена не одна, а несколько случайных величин Необходимость в этом возникает, например, при моделировании ситуации, когда объект характеризуется несколькими случайными параметрами. Так, при вероятностном моделировании структуры расходов затраты случайно вы бранной семьи на питание, обувь, одежду, транспорт, иа удовлетворение духовных потребностей являются случайными величинами, определенными на одном пространстве элементарных событий.
Пусть Х|, Х2,..., Х„ — случайные величины, определенные на множестве элементарных событий Й. Удобно рассматривать их как координаты «-мерного случайного вектора Х= =(Х1, Х2, ..., Х„). Под п-мерной случайной величиной, или случайным вектором, понимается упорядоченный набор п случайных величин X = (Xi, Х2, .... Хя).
На многомерные случайные величины распространяются почти без изменений основные определения, относящиеся к одномерным случайным величинам.
Функция распределения Fx (Xi, Х2,.... Хп) п-мерной случайной величины X=(Xi, Х2, ..., Хп) определяется формулой
х2,..., хп)=Р {<о:Х1(<о)<х1, Х2(ш)<х2,.... Х„(<о)<хп).
При этом Fx(x{, х2> ••• хп) — неубывающая функция каждого аргумента.
Функция распределения Fx (х) определяет закон распределения случайной величины X.
Случайная величина X=(Xi......Хп) дискретна, если су-
ществует конечное или счетное множество «-мерных векторов *1. х2,... таких, что
ОО
£ р(х=х,}=1.
4=1
Закон распределения дискретной случайной величины полностью определяется заданием векторов Xi, х2, ... и вероятностей pi=P(X=Xi}, р2=Р{Х=х2), ... таких, что Pi +рг+ ...= 1.
Многомерную случайную величину X=(Xi, Х2,.... Хп) называют непрерывной, если существует неотрицательная функция р*(Х|,.... х„) такая, что для любых x=(xi,.... х„) функцию распределения Fx (х) можно представить в виде п-мерно-
69
го интеграла:
*1	Х2	Хп
Fx(x)= J d/, ,J d/2... J px(t...........
— ca — oo	— oo
При этом функция Px(t\....tn) называется плотностью рас-
пределения вероятностей случайной величины X.
Наряду с функцией распределения плотность распределения определяет закон распределения «-мерной случайной величины. В точках непрерывности плотности распределения
РХ (*1 .	*п)
д' Р (х....хп)
дх.....дхп
(34.1)
Если А — некоторое подмножество «-мерного пространства Еп, то для дискретных случайных величин Р (ХеЛ) равна сумме вероятностей Р(Х=х,} по всем таким х,, что х,еА:
Р{Х<=Л)= £ Р{Х=4	(3.4.2)
х^А
Для непрерывных случайных величин, если (XeA|eS, вероятность Р (ХеЛ) равна «-мерному интегралу по множеству Л от «-мерной плотности распределения
Р{ХеЛ|=^Рх(х.........xn)dx, ... dxn. (3.4.3)
Случайные величины X,, Х2, Хп называются независимыми, если для любых х>, х21. . 4 х„ независимы события
(<o:Xj (<o)<xi), {ш:Х2(ш)<х2), .... {<о:Х„(<о)<хп).
Из определения непосредственно вытекает, что для независимых случайных величин Х|, Х2,.. ъ Х„ функция распределения «-мерной случайной величины X=(Xj, Х2,_, Х„) равна
произведению функций распределения случайных величин Х|, Х2, .... Х„:
Fx(xi. х2, .., xn)=FXi(x1)F*2(x2)...FAJxn). (3.4.4)
Условие (3.4.4) может быть положено в основу определения независимости случайных величин.
Если X = (Xi, Х2,.. , Х„) — непрерывная случайная величина, то из (3.4.4) и (3.4.1) следует, что для независимых случайных величин
Рх (*|. х2..x„)=pXi (х,)	(х2), • • •. Рхп (хп). (3.4.5)
Если X=(Xi, Х2,.. , Х„) — дискретная случайная величина, то из (3.4.4) н (3 4.2) можно получить, что для неза-
70
ВИСИМЫХ случайных величин
Р {X] =Х], Х2=х2,..., Хп = хп}=
=Р (X, =xt}P {Х2=х2}.. Р {Х„=хп}.	(3.4.6)
Условия (3.4.5) и (3.4.6) являются необходимыми и достаточными условиями независимости непрерывных и дискретных случайных величин соответственно, и, таким образом, они равносильны определению независимости для этих случайных величин.
Случайные величины X], Х21 ..., Хп независимы тогда и только тогда, когда для любых числовых множеств Л], Az, Ап, для которых определены вероятности {х;еАД, имеет место равенство
Р {X! Х2еЛ2.........Х„<=Л„}=
=Р (X, eAJ Р {Х2е А2}.. Р (Хпе лп}. (3.4.7)
Для дискретных случайных величин (3.4.7) можно получить из (3.4.2) и (3 4.6), для непрерывных случайных величин— из (3.4.3) и (3.4.5).
При построении вероятностных моделей случайные величины считают независимыми, если известно, что случайные явления, связанные со случайными величинами, причинно независимы между собой. Так, например, при моделировании естественно считать независимыми случайными величинами число очков, выпавших на каждом кубике, при подбрасывании двух игральных кубиков, число дефектных изделий, обнаруженных при контроле качества продукции п однотипных автоматических линий.
Дальнейшие свойства многомерных случайных величин будем рассматривать на примере двумерных случайных величин.
Пусть Х=(ХЬ Х2). Тогда
°°)= ,im Fkxvxz)=
Х2-*-— оо
=* Нт~ Р ((X, <х,)П(Х2<х2)}=Р (0}= 0.
Аналогично, если в многомерной функции распредедения хотя бы одна из координат х,--»—оо, то функция распределения будет стремиться к нулю.
Пусть теперь одна из координат х,—*оо; тогда
Fx(xp оо)= lim Fx(xp х2) =
Х2->оо
= lim P{(X,<x1)n(X2<x2)}=P{X1<x,}=F (х,).
Xq->oo	1
71
Таким образом, если устремить к бесконечности одну нз компонент функции распределения fx(xl,x2'), то получим функцию распределения другой компоненты случайного вектора. Аналогично, если устремить к бесконечности какие-то компоненты функции распределения п-мерной случайной величины, то.получим функцию распределения оставшихся компонент случайного вектора.
Функции распределения компонент случайного вектора X однозначно определяются функцией распределения этого вектора. Обратное утверждение в общем случае неверно. Однако если случайные величины Хь Х2, .... Хп независимы и Х=(ХЬ Х2, .... Хп), то
(х„ .... xn)=FAi (х,),..., Fx* (хп).
Закон распределения дискретной двумерной случайной величины Х=(ХЬ Х2) может быть задан набором вероятностей Pij = P (Xi = Xi, Уг=У]}- При этом сумма вероятностей по всем значениям х,- и у, должна быть равна единице.
• j
Как известно, функции распределения одномерных случайных величин X] и Х2 могут быть определены, если известна функция распределения двумерной случайной величины Х= = (Х|, Х2). Покажем теперь, как можно найти распределение вероятностей координат Хь Х2.
Обозначим р,_ =Р |Х| =х;}, р.,=Р {Х2=у;} и представим достоверное событие в виде суммы несовместных событий:
(Х2=«/,}.
J
Тогда
А. =Р (X, = х,}=Р ((X, =х,.)ПЙ}=Р Г(Х, =х,)Г У (Х2=рД = (	j J
=	(Х.=х/)П(Х2=!/,)|=у Р	Pii.
(3.4.8) Аналогично имеем
p.j = P{X2 = p/}=£ P{(X1=xi)n(X2 = i/j)}=£ Pij. (3.4.9) *	i
Таким образом, суммируя при фиксированном значении i вероятности р,у по всем возможным значениям j, получаем
72
Таблица 3.5
i		1	2	3	4	А
i	\ У> Xi	0	0,1	0,2	0,3	
1	5	0,2	0,1	0,05	0,05	0,4
2	6	0	0,15	0,15	0,1	0,4
3	7	0	0	0.1	0,1	0,2
А	J	0,2	0,25	0,3	0,25	Z Z Рч = | i=l j = i
вероятность того, что Xi примет значение, равное х,-, а суммируя pij при фиксированном значении / по всем возможным значениям i, получаем вероятность того, что Хг = 1//.
О Пример 3.8. Качество продукции характеризуется двумя случайными параметрами: X и У. Закон распределения двумерной случайной величины Z=(X, У) представлен в табл. 3.5. На пересечении i-Й строки и /го столбца таблицы находятся вероятности р,,=Р|Х = Л, У =«/,}
Найдем распределение вероятностей (закон распределения) координат X, У случайного вектора
Вероятность события (Xi = х<] равна сумме вероятностей, находящихся в i-й строке табл. 3.5:
4
P{X=xj]=pl.= £ pj?
i=i
Вероятности р(- находятся в последнем столбце табл. 3.5.
Ряд распределения случайной величины X имеет следующий вид:
Х<	5	6	7
А	0,4	0,4	0,2
Ряд распределения У находим, вычисляя суммы элементов столбцов в табл. 3.5:
з
РР=У^Р.,= £ Р„-/=1
Эти вероятнссти находятся в последней строке табл. 3.5.
73
Ряд распределения У имеет следующий вид:
У/	0	0,1	0,2	0,3
Pl	02	0.25	0,3	0,25
Рассмотрим двумерную случайную величину Х=(Х], Х2), одна из координат которой Xi — урожайность культуры на данном поле, другая — Хд — количество удобрений, внесенных на это поле. Зная закон распределения X, можно определить распределение вероятностей одномерных случайных величин Xi и Х% Допустим теперь, что количество удобрений, внесенных на поле, равно у. Урожайность культуры Xi останется при этом случайной величиной, но ее закон распределения будет зависеть от того, какое именно значение приняла случайная величина Х2. Соответствующее распределение вероятностей случайной величины Х( называют условным распределением Xi при условии, что Xi=y.
Дадим определение условного распределения для дискретных случайных величин. Пусть Z=(X, У)— дискретная случайная величина, Р{Х=х>, У=у;}=р,у,«,/ = 1, 2,....
Условные распределения рх (х^у^) и pr {yt/x^ определим равенством
Рх ^/У,)=Р {X=Xi/Y=y}. /=1,2,...;
pY(y,/x^=P{Y=yl/X=x^ /=1.2.......
В соответствии с определением условных вероят ностей событий условная вероятность рх [xjy^ равна
(	. Р{(Х=х;)П(У=//,)} Ру
Рх ^/У,}=Р^=х^=у^-----------,
(3.4.10) где р.у=2 р^.
При фиксированном значении «// сумма вероятностей Px\xi/y/} по всем значениям х,- равна 1. Действительно,
р
У Рл Ыи)~У ---------1.	(3.4 11)
i	i p-i pl
Аналогично,
£ рг1у//х^=1-
74
О Пример 3.9. Найдем условное распределение случайной величины X, заданной в примере 3.8, при условии, что случайная величина У приняла значение у2 = 0,1.
Выбрав значения рц из столбца табл. 3.6, соответст ;ующего 7 = 2, и разделив их на 0,25, получаем следующее условное распределение X при условии, что 7 = 0,1:
Xi	5	6
РгШУг}	0,4	0,6
Пусть теперь X=(Xi, Хг) — непрерывная случайная величина с плотностью распределения рх(Х\, х2). Найдем плотности распределения случайных величин Х| и Х2.
Функция распределения случайной величины Х| равна
Fxt (xi) —00 )—
Рх(У^У2УйУ2 * aj/i-
При каждом фиксированном значении yi интеграл, стоящий в круглых скобках последнего равенства, принимает определенное значение. Он является, таким образом, функцией от yi. Обозначим эту функцию через рх< (yi).
оо
Рх,(У1)= $ Рх(Уи У2) аУ2-— со
(3.4.12)
Тогда
*1
fx,(xi)= $ Px,(l/i)d«/i-— оо
Как следует из последнего равенства, рх> (у() является плотностью распределения вероятностей случайной величины Xi.
Итак, плотность распределения одномерной случайной величины Xi может быть получена из плотности двумерной случайной величины Х=(Х|, Хг) по формуле (3.4.12).
Аналогично, плотность распределения случайной величины Хг равна
оо
Рх2(х2)= $ PJf(*P*2)dxi-	(3.4.13)
— со
В общем случае, зная плотность распределения п~м :рной случайной величины X=(Xi, Хг......Хт,..., Х„), можно полу
75
чить плотность распределения т мерной случайной величины У=(Хь Х2,.... Xm) (m<n) по формуле
ру(х,,х2..... xj=
ОО	ОО
= S - S Рх(*РХ2..........Хт.....*„)d*m+1 - dx„.
— оо	— оо
В теории вероятностей и ее приложениях большую роль играет многомерное нормальное распределение. Плотность распределения п-мернон нормальной случайной величины задается следующей формулой:
Рх(*1....Хп)
=----* ехр { —'(х — а) 2 1 (х — а)
I 2
(3.4.14) где 2 — симметричная матрица, определитель которой |2, > О (матрица 2= (а,,) симметрична, если &ц=оц), 2_| — обратная матрица, ац — элементы матрицы 2~‘, х' = (*1,.... хп), a'=(ai,.... ап), х=^;^,	Матрица 2
и вектор а являются параметрами многомерного нормального закона распределения.
Плотность двумерной нормальной случайной величины можно представить в виде
Рх (xi xz)------------I---г X
2ла1а2 д/1 —г
Хехр
9. ‘ --2. tf-lrZ^ + Z*)
2(1 Г )
Xi —О;
где Zi=------, 1=1, 2.
а-
Величины О|, 02, at, as, г являются параметрами двумерного нормального распределения, причем а(>0, cr2>0, |r| < 1.
Найдем распределение вероятностей координат двумерной нормальной случайной величины.
76
О Пример 3.10. Пусть Z=(X, У) — случайный вектор, имеющий двумерное нормальное распределение с параметрами Ci=a2 = 0, Oi = _02=1. Вычислим плотность распределения случайных величин
X и К Имеем
ОО
РЛ(*)= 5
— оо
х2 — 2гху + у2 \
2 (1—г2)	)
dy=
Под знаком последнего интеграла стоит плотность нормального закона распределения с параметрами а = гх, а=у!—г2; следовательно, этот интеграл равен 1. В результате получаем
PxW=-4='e
д/2л
Плотность распределения случайной величины У равна
Ру(у)
__ 1	е-У5/2.
у/2л
Таким образом, компоненты X и У двумерной нормальной случайной величины Z=(X, У) с параметрами Oi=as = 0, oi = o2=l имеют нормальное распределение с параметрами с = 0, а==1. Также можно показать, что и в том случае, когда Z=(X, У) имеет двумерное нормальное распределение с параметрами о2, О|, a2, г, одномерные случайные величины X, У распределены по нормальному закону, причем X~N(0101), У~ЛГ(а2аг). •
В общем случае если случайная величина Х„ = =(Х>, Х2, .... Х„ ... Ха) имеет n-мерное нормальное распределение с параметрами (oi, пг...а„,... а„) и Х„, то m-мерный случайный
вектор Хт = (Х\, Х2, ..., Хт) также имеет нормальное распределение с параметрами (оь а2,..., а„) и матрицей Хт, получающейся из вычеркиванием (т4-1)-й, (т-)-2)-й, .... т-й строк и столбцов.
77
Определим теперь условные распределения вероятностей непрерывных случайных величин. Пусть Z=(X Y)—непрерывная случайная величина с плотностью распределения рг(х, У) Ру(у) — плотность распределения У, ру(Уо)^®- Тогда, по определению, условная плотность распределения вероятностей случайной величины X при условии, что У = «/о, равна
Рх (х/Уо)=РАх’ У^/Ру (Уо)-
Условная плотность распределения вероятностей случайной величины У при условии Х = хо равна
Ру (У/хо)=Рг^.хоУ)/Рх (*о).
где Рх (*o)=^O» Рх(х)— плотность распределения случайной величины X.
Условные плотности распределения вероятностей определяют закон распределения условных случайных величин и обладают всеми свойствами плотности распределения. Покажем, в частности, что
ОО
$ Рх (х/У) dx=l.	(3.4.15)
— оо
Воспользовавшись формулой (3.4.13), получаем
с	F Pztx> У)
,(,/„) <k-J —

Аналогично можно показать, что
Ру(У/х)ду=\.
О Пример 3.11. Пусть Z—(X, У) — двумерная нормальная случайная величина с параметрами ai=O2=0, 01=02=1. Найдем условную плотность распределения случайной величины X при условии что У=Уо-
В примере 3.10 найдена плотность распределения случайной величины У
78
Условная плотность распределения вероятностей рх (х/у) равна Рх (Х/У)—Рг <*• У)/Ру <*/)=
1	(	Xi—2rxy+y2
- — exp J---------- —
/[Z7	1	гц-г2)
=_______1______exp (-1
(3.4.16)
Условная плотность распределения px (х/у) представляет гобой плотность нормального распределения с параметрами а=гу и о= у! —г2. Таким образом, условное распределение случайной величины X при условии, что Y=y, является нормальным распределением.
Аналогично можно доказать, что для произвольной двумерной нормальной случайной величины Z=(X, У) условные плотности распределения вероятностей рх (х/у) и ру (у/х) являются плотностями нормального распределения, ф
§ 3.5. Функции от случайных величин
Приведем примеры, когда при построении математической модели появляются случайные величины, связанные функциональной зависимостью.
Рассмотрим три случайные величины X] — число бракованных деталей в партии из 100 изделий, Х2 — число небракованных деталей в этой партии, Хз — штраф за поставку недоброкачественной партии изделий, пропорциональный количеству бракованных изделий с коэффициентом пропорциональности а. Случайные величины Хг и Хз можно рассматривать как функции от X,:
Х2 (a>)=ft (X, (<о)) = 100-Х, (со), Х3 (co)=f2 (X, (со))=аХ, (ш).
Случайное время ремонта Y наладчиком двух станков равно сумме времени ремонта первого X, и второго Хг станков:
Y=f(Xlt X2)=Xt+X2.
Пусть в общем случае Х( (to), Хг(со), ..., Хп (со)— случайные величины, определенные на множестве элементарных событий Q, S — поле событий; f (x)=f(xi, х2,.... хп) — некоторая функция. Тогда Y=f (X}=f (Xi, Х2,.... Хп)—случайная величина; каждому шей она ставит в соответствие число У (co)=f (X(to)). В соответствии с определением случайной величины Y = f(X) —случайная величина только в том случае, если (со: У (со)<«/}еЗ для любых у.
79
Если случайная величина X дискретна, то и функция от нее Y=f(X) также дискретная случайная величина.
О Пример 3.12. Случайная величина Х = Х(со), соей, имеет следующий ряд распределения:
Xi	— I	1	2
Pi	0,5	0,4	0,1
Найдем ряд распределения случайных величии У=№ и Z = = 10Х+2. Обозначим через Ах событие, состоящее в том, что случай пая величина X примет значение х: 4х = {со:Х (со)=х), где х принад лежит множеству {—1. 1; 2). По условию, Р {4_||=0,5; РИ1|=0,4 Р(Л2}=0,1. При <оеЛ_1 имеем У (со)=Х2 (со)=(—1)2= I. Z (со)= = 1ОЛ(со) + 2= —8; при соеЛ, получаем У (со)=1, Z(u>)=12, на конец, для (оеАг находим У (со)=4, Z (со)=22.
Случайная величина У принимает с положительной вероятностью два значения (у, = 1, 1/2=4), причем
Р (yt)=P О' (<>)= 1|=Р И_, +А,)=Р И_ ,|+Р И1)=0,5 + 0,4 = 0,9;
Р (у2)=Р (У (со) = 4|=Р И2)~ 0,1.
Ряд распределения У имеет следующий вид:
у.	1	4
P (УА	0,9	0.1
Случайная величина Z принимает с положительной вероятностью три значения. Ряд распределения Z имеет вид
	— 8	12	22
P (z<)	0.5	0,4	0,1
Решение поставленной задачи иллюстрирует табл. 3.6. в которой через {X (4Х)|, (У (Л«)|, (Z (Дх)| обозначены одноэлементные множества
Таблица 3.6
4X	Л-i	A,	A?
P(4X)	0.5	0.4	0.1
X|(A.)I	-1	1	2
Г (Лх)|	1	1	4
{Z (4X)J	-8	12	22
80
|Х(д й=(Х(М):иеЛ,)=И,	|У(Д,)|={У(ш):с»еЛ«}=рг2|, (Z(Л,)|=
= [Z	4х|=|10х+2|.
q Пример 3.13. Пусть U =(Х, Y)—случайная величина, закон распределения которой приведен в табл 3 7 Найдем ряд распределения случайной величины Z = X-\-Y.
(Z = 4). Случайная величина Z принимает значение равное 4, если случайный вектор U принимает одно из следующих значений: (1; 3); (2; 2); (3; I). Тогда Р4=р1з + р2г+рз1 = 0,05 + 0,15 + 0 = 0,2.
Аналогично вычисляют и другие значения pt, keL. Ряд распределения случайной величины Z приведен в следующей таблице:
Zk	2	3	4	5	6	7
р»	0,2	0,1	0,2	0.2	0,2	0,1
Если y = f(x) — непрерывная монотонно возрастающая функция и, следовательно, существует обратная ей (также монотонно возрастающая) функция x=f~! (у), то функцию распределения случайной величины Y=f (X) можно представить в виде Fy(x) = Fx(f~l (х)). Действительно,
Fy W=P|f (Х)<х)=Р{Х<Г*	« (3.5.1)
В примере 3.12 случайная величина Z является функцией от X:Z = f(X), где f (х)=10х + 2 — монотонно возрастающая непрерывная функция; обратная ей функция равна f~l(x)=(x — — 2)/10. Таким образом, функцию распределения Fz(x) можно найти по формуле
Fz(x)=Fx((x-2)/lO).
Если X — непрерывная случайная величина с плотностью распределения рх (х) и функция f (х) дифференцируема, то
81
с помощью (3.5.1) можно найти плотность распределения случайной величины У:
Ру (x)=F'y(x) =
^х(Г'И) df~' (х)
<*Г‘ (*) __ dx
=рНГ'(*))^Ц^
(3.5.2)
Пусть теперь y = f(x) — непрерывная монотонно убывающая функция. Тогда и обратная ей функция также монотонно убывающая. Функция распределения случайной величины Y=f(X) равна
Fy(x) = P{f (Х)<х]=РГ' (f (*))>Г‘ «)=
= Р{Х>Г' (x)}=l-P{X<f~l (х)).
Если X — непрерывная случайная величина и функция f (х) дифференцируема, то, учитывая, что Р {Х=/~* (х)}= = 0 н (*) <; о, получаем
Ру(х)=(\-Р{Х^Г1 (х)))' = -F'x (Г‘ (*))=
= -Рх (Г1 «) d/d'W=Px (Г' (*)) 1^ 'Wl. (3.5.3) С1Л	Qa
Объединяя (3.5.2) и (3.5.3), получаем, что если f(x) — монотонная дифференцируемая функция, X — непрерывная случайная величина, то плотность распределения случайной величины Y=f(X) равна
Ру (*}=Рх (Г‘ W) I-—•	(3-5.4)
Проиллюстрируем вывод формулы (3.5.4) на примере.
О Пример 3.14. Положим Y=aX-Yb, где X -  непрср! 1вная случайная величина. Если а>0, то функция f (х)=ях-|-6 — монотонно возрастающая и тогда получаем
Fy (х)=Р {аХ+6<х}=Р (z<±Z±1=f /
I а I \ а, /
откуда
/ \ с/ / х—Ь\ / х — Ь\ 1
Ру (*) - х	~~Рх
(3.5.5)
Если а<0, то )(х)=ах-|-Ь — монотонно убывающая фун-
«2
киия
Тогда
Рг(х) = Р(аХ + Ь<х}=
вР(Х>^ = |_р[х<±±=|_£Л—Y
I a J I a J X a /
откуда	у / x~b\\'	f * — b\ 1
Объединяя (3.5.5) и (3.5.6), имеем
PaX + b W= Px ( ~	(3 5-7)
Получим теперь формулу (3.5.7) непосредственно из (3.5.4): если х—b d/~1	1
y=f (х)=аХ + Ь, то f	(х) =—-—-, ~d~ -=— и тогДа
,1	(х~Ь\ 1 л
С помощью формулы (3-5 7) можно показать, что если X~N(a, а), то У=Ьх -рс^Л^ай-Ьс, o|fr|).
□ Действительно, пусть X~N(a, о), f (x)=bx-j-c. Тогда
PyW=Px(±=£)-||r=
(	/ х — с	\2\
1 f 1 \ b /1
^О\Ь\ еХР1 2	)
1	f	1 (х — (аЬ-Ьс))2)
~\2^\Ь\	V W )
Плотность распределения случайной величины У является плотностью нормальной случайной величины, с тедов а те пьн о, Y~N(ab + c, o|t>|). 
Если b = l/a, с=—а/а, т. е. если У=(Х — а)/о, то
y=-?^-~7V(0,l).	(3.5.8)
а
При построении вероятностных моделей встречаются законы распределения случайных величин, представляющих
83
собой нелинейные функции от нормальных случайных величин. В частности, при моделировании технико-экономических показателей часто встречаются случайные величины, имеющие логарифмически нормальное распределение.
Неотрицательная случайная величина У имеет логарифмически нормальное распределение, если X=ln У имеет нормальное распределение. Из определения вытекает, что если У имеет логарифмически нормальное (логнормальное) распределение, то она может быть представлена в виде У=ех, где X~N (а, о).
О Пример 3.15. Найдем плотность распределения случайной величины У, имеющей логнормальное распределение.
Пусть X — 1п У ~ N (а, о), тогда, подставляя в (3.5.2)
, х 1 рх (х)= —-у2л<у
1 U-o)2
2 о2
f~' (х)=1п х, -f 1(X)=-L, dx х
получаем
1 (Inx —а)2
, х 1
Ру (*)=—_ -у2лах
Графики плотности логарифмически нормального распределения при различных зна
чениях параметров приведены на рис. 3.8. ф
Рассмотрим на примере случай Y = f(X), когда f (х) — немонотонная функция.
О Пример 3.16. Пусть X—непрерывная случайная величина, f(x)=x2. Найдем Ру (х) и ру(х) случайной величины l'=f(.Y) = №
Если x^JO, то Fy(x')—P |У<х}=0 и (x)=F'j, (х)=О.При х> > 0 имеем
Fy (х)=Р рг2<х)=Р |-	(лЙ-/\ (-V*),
откуда
Р у (*)=(Fx (V*) - Fx (	=Pxbfy —V+ Рх (—V*) —*7^=
2\]x	2yjx
=—^(Px(V*)+Px(—V*))- •	(3.5.9)
2yx
О Пример 3.17. Используя формулу (3.5.9), найдем плотность распределения квадрата нормальной случайной величины с параметрами а= О, а=1.
84
Пусть X~N (0, 1). Y=Х2- Тогда при х>0
Р у (х)=—--- (рх (д/х) +	( —дЙ) =
Очевидно, ру (х)—0 при х^О. ф
Q Пример 3.18. Найдем плотность распределения модуля отклонения нормальной случайной величины от параметра а.
Пусть X~N(a, о), У=|Х—в|. Тогда при х>0
fy(x)=P [|X-а| <х}=Р 1д-х<Х<а+х}=
= fx(a+x) — Fx(a—х), откуда получаем
Ру (*)=Рх (“+*)+Рх (а-х)=
(a+x-a)2	(a-x-n)2 \	х2
2о2	_|_е	2о2	)_	2	?	ф
д/ЙЛО
При построении вероятностных моделей часто встречаются также функции многомерных случайных величин. Рассмотрим важный частный случай, когда требуется найти закон распределения суммы двух случайных величин.
Пусть Х = (ХЬ Х2); У= = f (X) = Xi +Х2. Вычислим по формуле (3.4.3) функцию распределения случайной величины
Fу (х)—Р (Х| +Х2<х}— J j Рх 0е]» xi) dx2, где интегрирование производится по множеству »х = ={(xi, x2):xi4-x2<x). Область интегрирования Ах изображена на рис. 3 9. При фиксированных значениях х, переменная Хг может принимать значения из интервала (— оо,х—Xj), интервал изменения Х| при этом равен (—оо, оо). Имеем
Fv(x)=
Рх Х2) dx2
dxr
85
Произведем во внутреннем интеграле замену x2=t—xl и затем поменяем порядок интегрирования:
Pxtx^t—xjdt
dx,=
В соответствии с определением функция
Рг(0= $ Рл(*р *i)d*i
(3.5.10)
является плотностью распределения случайной величины У= = Х14-Хг-
Если первоначально изменить порядок интегрирования в двойном интеграле, то аналогично получаем
ОО
Рг(0= $ Рх(‘~*2. *2) d*2-	(3.5.11)
С помощью формулы (3.5.10) или (3.5.11) можно, зная плотность распределения двумерной случайной величины Х = =(Х1, Хг), находить плотность распределения суммы случайных величин Х1 + Х2.
Особое значение имеет случай, когда случайные величины Х|, Хг независимы В этом случае в соответствии с (3.4.5) имеем
Рх (*р *2)=Рх, (*i) Рх2(х2).
Подставляя последнее равенство в (3.5.10) и (3.5.11), приходим к формуле свертки, или композиции для плотностей:
СЮ
Рх1+х2^')~ J Рх, (А:1)Рх2U xi) top (3.5.12) — 00
00
Рх,+x2W~ J Px, U хг) Px2 (хг) to2. (3.5.13) — no
Выведем теперь формучу для вычисления распределения вероятностей суммы двух независимых дискретных случайных величин. Пусть Хь Х2 — независимые дискретные случайные
ОО
величины, £ Р{Л,=х.)=1. Представим событие Лх={Х1 + 1=1
86
_|_Х2=х) в виде суммы г.есовместных событий:
ОС
Лх= £ {Х1=*(. Х2=х — х,|.
R силу независимости Xi и Х2 имеем P[Xi = x(, Хг=х—х,)= |X1 = x,}-P{X2=x — Xi}. Тогда
Р {X, + Х2 = х}=Р Их)=
= £ Р (X, = х,} Р {Х2=х - х,}.	(3.5.14)
i= 1
Итак, получена формула свертки для независимых случайных величин с дискретным распределением.
О Пример 3.19. Найдем закон распределения суммы независимых случайных величин Xt, Ха, имеющих распределение Пуассона:
X? -X	*5 -X
Р{Х.=п}=-2-е ', Р|Х2 = М=-тт-е г, n,fe = O, 1,2......
1 п!	к!
(3.5.15)
Подставляя (3.5.15) в (3.5.14), получаем
РРГ1+Х2 = /П}= £ -^Ге~К1 P|X2 = m-n}.
п — 0
Так как Р(Х2 = ш — п)=0 для п>т, то
^i+ч) V_____inim—п_________
ml	Zj п\(т — п)! 1 2
п=о '	'
=-!_е-Х,+г2У С"Х?Х?~П, ml L, т 1 2
л = 0
где С"=—- т'—;-----биномиальные коэффициенты, n = 0, 1, 2,
пЦт — п)1
-., т.
В соответствии с формулой бинома Ньютона
у я = 0
В результате получаем
р |xt+x =m;^(Z|+^ е~(К| +Ч
1	т\
87
т. е. сумма независимых случайных величин, распределенных по закону Пуассона с параметрами Х| и Хг, также имеет распределение Пуассона, причем его параметр X=X1-|-X2. ф
О Пример 3.20. Пусть Хь Х2— независимые нормальные слу-чайные величины с параметрами а=0, »=1. Найдем закон распределения У=Х1+Хг-
Плотность распределения суммы У=Х1-|-Х2 будем искать по формуле (3.5.!2). Имеем
Ру(О= J е J е dx = _"оо V2л	\2п
5	еХР	( —тт	*)2)1 dx=
zn	J	I z
— co	k	)
Подынтегральная функция является плотностью нормальной случайной величины с параметрами а=-^-1 о=д/1/2, поэтому интеграл равен единице. Тогда
Функция pY (/) является плотностью нормального распределения с параметрами а = 0, о=^/2. Таким образом, сумма независимых нормальных случайных величин с параметрами (0, !) имеет нормальное распределение с параметрами (0, ^2):Х{ + X2~N (0, -^2). ф
Аналогично можно доказать, что если Хь Х2— независимые нормальные случайные величины, Xi~V^a1ai), Х2~ ~ N (а#, о2), то Xi + Х2~ N lai + аг, уа2 + а2)- Итак, сумма независимых нормально распределенных случайных величин имеет нормальное распределение.
Рассмотрим пример композиции для плотностей, задаваемых разными формулами на разных участках.
О Примеу 3.21. Для выполнения некоторой работы необходимо выполнить последовательно две операции. Время выполнения первой
88
операции (случайная величина Л\) имеет равномерное распределение на отрезке [1,3], время выполнения второй операции Хг имеет также
равномерное распределение, но на отрезке [2,5] Время выполнения второй операции не зависит от продолжительности первой
операции. Найдем распределение вероятностей времени Xi-f-Xs выполнения всей рабо
ты.
В данном случае естественно считать Xi, Хг независимыми случайными величинами. Плотности рх^ (х,) и рх^ (х2) задаются следующими формулами:
Рис. 3.10
< 1/2 при х(г[1,3];	г 1/3 при х2е[2, 5];
Рх/х1)=|0 при х(<£[1,3]; /Ч(х2)={0 при х2<=£[2,5].
Подставляя в формулу (3.5.12) плотности распределения случайных величин X, и Х2 и учитывая, что рх (х|)=0, если х, < 1 или Х| > >3, получаем
с	। 3
Px1+X2W= J ₽х, (xi)Px2^—x|) dxi=y J Рх2 dxr — со
Переменная интегрирования Х| изменяется от 1 до 3, а функция рх (1—х()#=0, если 2^1—Х|^5. На рис. 3.10 изображена область G, удовлетворяющая этим ограничениям: G = {(x1,/): 1 ^Х] ^3, 2^ <1—х,<5| Плотность Рх	(1) = 0 для всех таких t, для которых
(xi.l)^G, поэтому рх +х (t) =0 при <<3 и />8. Пусть (xi, l)eG, тогда px^(t— х,)= 1 /3. При 3^/^5 имеем рх^ (t — Xj)#=0, если переменная интегрирования Xi изменяется от 1 до Х| = 1 — 2, поэтому
,Л_1 ‘Та _'~3
Px, + x2W—у у | dxi----у-
Если 5</<:б, то
... 1 1 С н _ 1 Px|+x2w—2-y)dxi-y
Наконец, если ^8, то
... 1 1 Г а -8~~' Ч+х2(0-тт \dX|—в-’
График плотности распределения Рх +х изображен на рис. З.Н. •
89
О Пример 3.?2. Две ремонтные бригады обслуживают водопроводную систему города. Время ожидания очепедной заявки на ремонт имеет экспоненциальное распределение с параметром к. Первую поступившую заявку обсчуживает 1-я бригада, следующую заявку выполняет 2-я бригада. Требуется найти закон распределения времени ожидания своей заявки 2-й бригадой.
Пусть X! — время ожидания первой заявки, Х2 — интервал времени между первой и второй заявками. Случайные величины Xi н Хг будем считать независимыми. Время ожидания заяеки 2-й бригадой равно сумме Х^Ха. По условию. Xi и Ха имеют экспоненциальное распределение с плотностью
[0 при КО. (Хе-w при /^0.
Так как случайные величины Х[ и Х2 независимы, то плотность распределения суммы Х^Х? равна
СЮ
Г	00
₽x1 + x2W= \ WPj2(*-x)dx= ( p^ft-xjix.
оо	и
Если x>t, то Px^(t—х)=0, поэтому i	t
(C)=j Хе-dx=X2e-’ j d/=X2te~w. •
Закон распределения суммы п независимых случайных величин, имеющих экспоненциачьнос распределение, называется законом Эрланга (п — 1)-го порядка. Этот закон был получен при моделировании работы телефонных станций в первых работах по теории массового обслуживания — одной из ветвей теории вероятностей (в настоящее время самостоятельная научная дисциплина).
В примере 3.22 быта найдена плотность распределения закона Эрланга первого порядха. Экспоненциальное распределение является распределением Эрланга нулевого порядка. Плотность распределения Эрлаша k-ro порядка для /^0 равна
₽*(') = Х^ГС’*<	(ЗВ16)
90
формулу (3.5.16) можно доказать с помощью метода математической индукции. При этом индуктивный переход от й=п к k= __n_p1 осуществляется аналогично переходу от k=0 к Л=1 в примере 3.22.
Часто используется следующее свойство независимых случайных величин.
Теорема 3.5. Если случайные величины Х\, Хг, ..., Х„ независимы, то независимы также случайные величины У| = f,(Ai), У2=/2(Х2),...,/»(ХЖ).
□ Воспользуемся формулой (3.4.7) для независимых случайных величин Xi, Хг, ...л Х„. Обозначим через Л((х“) множество А(х?) = =	I= •> 2,.... л. Тогда для любых х“, х2, .... х„ име-
ем
Fу (Хр Х2, .... Х^)=Р р , <Хр У2 <*2’ • ^п<д;п1=
=Р {/ (Х.Хх» f (Х2)<х°,.... f (Хп)<х«}=
=Р {X,еЛ, (х«), Х2еЛ2 (х°),.... ХпеЛ„ (х°))=
=Р (X, ЕЛ, (х«)) Р (Х2еЛ2 (х«)} ... Р {Х„<=ЛВ (х°„)}=
=Р (f, (Х,)<хО)Р {f2 (Х2)<х»}... Р {fn (Х„)<х°)=
= Fг, (*i) Fy2 (*”) " Py„ (л°)-
Функция распределения случайной величины У=(У1, У2, .... У„) удовлетворяет условию (3.4.4); следовательно, У2, У2, .... У„ независимы. И
В математической статистике часто используют законы распределения случайных величин, являющихся функциями независимых нормальных случайных величин. Рассмотрим три из них, чаще других встречающиеся при моделировании случайных явлений.
1 Распределение хи-квадрат (^-распределение)
Пусть Х|, Хг, .... Х„— независимые нормальные случайные величины с параметрами а = 0, о=1. Составим случайную величину Xv = -X? + -Xl+---+Яу. Закон распределения случайной величины х1 2 называется х2-РаспРеделением с v степенями свободы. Таким образом, х2-ропределение с v степенями свободы имеет сумма квадратов v независимых нормальных случайных величии с параметрами (0, 1).
91
В примере 3.17 найдена плотность распределения случайной величины Хр имеющей х’-распределение с одной степенью свободы;
Pi (*)=
О при х<0,
-е~х^2 при х>0. '2лх
Найдем плотность распределения случайной величины, имеющей Х2-распределение С двумя степенями свободы.
Пусть Xi, Xi — независимые нормально распределенные случайные величины Xi~N(Q, 1), »=1, 2. Так как Хь Хг независимы, то по теореме 3.5 также независимы X2 и Х^.Найдем по формулам (3.5.12) плотность распределения рДх) суммы Xi-f-Xl. Для />0 имеем
Р2 (0=
Р1 WPi (f-x)dx=
-~e“x/2p.(t-x)dx.
y/2nx
Если t — x<0. то pi(/— x) = 0, поэтому
p (f)=( -J— e~x/2---------1----e -(*—*>/2 dx =
\2лх д/2л (/—x)
=—— e Г/,22 arcsin 1 =—e 2л	2
Таким образом, плотность х2'распределения с v=2 степенями свободы равна
р2(х)=( ^"Х/2 ПР« *>°-0 при х<0.
Плотность х2-распределеиия с v степенями свободы для х> >0 имеет вид
Ру(х)=^е-Х''2х''''2-1.	(3.5.17)
ОО
где множитель А, удовлетворяет условию 1 pv(x)dx = l.
92
Пусть Xi, Xi,.... X, независимы и Хк~М (a, a), k= 1,2,v.
Тогда в соответствии с (3.5.8) случайные величины
У	——--'Лг(0, 1). Следовательно, случайная величина
'	о

(3.5.18)
имеет ^-распределение с v степенями свободы.
Распределение %2 табулировано. В табл. 3 Приложений приведены ЮОа-процентные точки распределения %2 v, удовлетворяющие соотношению Р {xv>Xa. 4=а- В соответствии с центральной предельной теоремой (см. гл. 5) последовательность случайных величин Xv. v=l, 2, .... имеет асимптотически нормальное распределение Поэтому табл. 3 При-v	2
ложении содержит процентные точки х -распределения для v<30. Для v^>30 значения х«.v можно определить с помощью таблиц нормального закона распределения.
2.	Распределение Стьюдента (t-распределение)
Пусть Хо, Х|, Хг, ..., Xv — независимые нормально распределенные случайные величины с параметрами (0, о):Х,~ N (0, о), i = 0, 1, .... V.
Тогда случайная величина tv = Xa/	имеет
по определению распределение Стьюдента (или /-распределение) с v степенями свободы.
Плотность распределения Стьюдента имеет вид
.2 \-(*+D/2
Р/ (*)=Ь
v
График плотности распределения симметричен относительно прямой х = 0. По виду он напоминает график плотности
нормального распределения, но он более «пологий», с «утяжеленными хвостами» (рис. 3.12k С ростом числа степеней свободы распределение Стьюдента приближается к нормальному расппеделе-нню с параметрами (0, 1).
93
Обозначим через F (х, <т) функцию распределения случайной величины t,r если X,~N(0, er), t = 0, 1, 2, .... v. Так как х0, Xi...X, независимы и X,~W(0, о), то случайные величины
У= — X.- также независимы и У<~ ТУ (0, 1), z = 0, 1, 2, .... v о
Тогда
-F(x, 1).
Итак, доказано, что распределение Стьюдента не зависит от параметра а.
Если Хо, Х|, Хг..Xv независимы и Xi~N (а, а), то слу-
чайные величины {Xi — а) независимы и (X, — а) ~ ТУ (0, о). Следовательно, распределение Стьюдента имеет случайная величина
(3.5.19)
Если положить Х/~ТУ (0, 1), i = 0, 1, 2, ..., v, то получим, что распределение Стьюдента имеет случайная величина А»=-Ко/ Xv» гДе Xv имеет %2-распределение.
Таблица распределения Стьюдента приведена в Приложениях. В ней содержатся значения удовлетворяющие равенству Р((Л,1<Л,.а}=1—а. Для больших v значения tv, а определяются по таблицам нормального распределения.
94
3.	Распределение Фишзра (F-распределение)
Пусть Хь Х2, .... ХЯ(, Х„1 + 1,.... ХЯ|+„2 — независимые нормальные случайные величины: Х,~/У (О, о), i= 1, 2,ni + n2. Тогда случайная величина
имеет распределение Фишера (или /•’-распределение) с ni и т степенями свободы.
Распределение Фишера не зависит от параметра и (доказательство аналогично предыдущему).
Если Xi независимы и Xi~N(a, a), t=l, 2, ..., П1-*-П2. то
случайная величина
“1
»» 1
имеет распределение Фишера.
Положив о=1, получаем, что распределение Фишера _	1 о / 1	2	2
имеет случайная величина гЯ( я^=— хП1/~Хл„' где Хп, и
9	v	9
Х„ — случайные величины, имеющие х -распределение.
В табл. 5 Приложений приведены 100а%-точкн /•'-распределения /^П]. nj, а> удовлетворяющие равенству Z3 п2> ->^п,.п2а)=а- При больших «| и п2 распределение Фишера
заменяется нормальным распределением.
В заключение отметим, что некоторые функции могут приводить к случайным величинам, которые нельзя отнести
ни к дискретному, ни к непрерывному типу. Примером может служить случайная величина Y=f(X), где X ~ W (а, о),
f (x)=max (0, х)= {О при х<0,
х при х>0.
Очевидно, функция рас пределення FY (х) имеет
S5
скачок при х=0, равный значению функции распределения Fx(x) при х = 0. График функции распределения Fv(x) приведен на рис. 3.13. Случайная величина У имеет смешанное распределение с дискретной и непрерывной компонентами.
Задачи
3.1.	Четыре станка расположены на одной прямой; расстояние между каждыми двумя соседними станками одинаково и равно а. Рабочий, обслуживающий станки, переходит от станка, на котором работа закончена, к любому из трех остальных с равными вероятностями. Найти распределение вероятностей Х-длииы совершаемого им каждый раз перехода
3.2.	В партии из 5 деталей имеется 3 дефектных. Наудачу отобраны 3 детали. Составить ряд распределения случайной величины X — число стандартных деталей среди отобранных.
3.3.	Вероятность выпуска сверла повышенной хрупкости (бракованного) равна 0,02. Сверла укладываются в коробки по 100 шт. Воспользовавшись теоремой Пуассона, определить вероятность того, что:
а)	в коробке не окажется бракованных сверл;
б)	число бракованных сверл не превышает двух,
в)	в коробке не менее двух бракованных сверл.
3.4.	Машина состоит из ЮООо деталей. Каждая деталь независимо от других оказывается неисправной с вероятностью р. причем для =1000 деталей pi =0,003, для п? = 2000 деталей рг=0,0005 и для п3=7000 деталей р3=0,0001. Машина ие работает, если неисправны хотя бы две детали. Найти вероятность того что машина не будет работать.
Указание. Воспользоваться теоремой Пуассона.
3.5.	Вероятность наличия бракованного изделия в партии равна р = 0,1. Из партии выбираются 2О')О изделий. Оценить вероятность того, что число бракованных изделий:
а)	больше 250;
б)	заключено в пределах от 150 до 250.
Кроме того, определить:
а)	с какой вероятностью относительная частота изделий отклонится от своей вероятности больше чем на е = 0,01;
б)	сколько изделий следовало бы выбрать, чтобы вероятность отклонения относительной частоты бракованных изделий от вероятности р=0,1 ие превышала е = 0,01 с вероятностью, не меньшей 0,998.
3.6,	Плотность распределения X задана формулой
пМ — (сх при Ч; ₽w-l 0 при х<£[0, 1].
Найти: а) постоянную с; б) функцию распределения F (х); в) построить графики р(х) и F (х); г) определить Р (X> 1 /2| и Р (1/4<Х<3/4|.
96
3.7.	Плотность распределения X задана формулами Рх(х)—с/х4, х>1; Рх(х) = 0, х<1.
Найти: а) постоянную с; б) функцию распределения Fx(x); в) плотность распределения случайной величины У=1пх; г) вероятность Р (2СХ<4|; д) построить графики Рх(х) и Рх(х).
3.8.	Совместное распределение случайных величин Xlt Хг задано следующей таблицей:
X. у’ Xi \	— 1	0	1
— 1	1/8	1/12	5/24
1	5/24	1/6	1/8
В ней на пересечении i-й строки и j-ro столбца, i= — 1, 1; / = = — I. О, 1, приведены вероятности p,i = P (Xi=i, %2 = /|- Найти:
а)	одномерные законы распределения Х| и Х2;
б)	закон распределения X3 = Xi4-Xs;
в)	закон распределения Х4 = Х|;
г)	Р(Х3=0, Х4=1|;
д)	условное распределение вероятностей Хг при условии, что Х> = -1.
3.9.	Даны распределения независимых случайных величии X и У, P(X=xJ=p, Р(У=У/|=9/, i,/ = l, 2. 3.
Xt	0	2	4	Pl	2	3	4
Pi	0,4	0,2	0,4	4l	0,3	0,4	0,3
Найти законы распределения следующих случайных величин: а) X-f-У; б) X—У; в) (Х-У)2; г) (Х-У)3
Построить графики функций распределения случайных величин:
д) X; е) Х + У; ж) найти Р (0XУ6}.
3.10.	Случайная величина X имеет показательное распределение с параметром Х = 2. Найти плотности распределения следующих случайных величин:
a)	б) У2 = Х2; в) У3=-1-1пХ; г) У4=1-е^
3.11.	Доказать справедливость формулы (3.5.16) для плотности распределения Эрлинга fe-го порядка.
Указание. Воспользоваться методом математической индукции.
3.12.	Показать, что если случайная величина X имеет непрерывную функцию распределения F(х)=Р{Х<х|, то слу
4 В. А. Колемаев
и др
97
чайная величина Y=F(X) имеет равномерное распределение на отрезке [0, 1].
3.13.	Случайные величины X и У независимы и имеют равномерное распределение на отрезке [0, 1]. Найти плотности распределения следующих величин:
а) X-f-У; б) Х-У.
3.14.	Случайные величины X и У независимы и имеют равномерное распределение на отрезке (0, а). Найти плотности распределения следующих случайных величин:
а) X-f-У (закон Симпсона); б) X —У; в) ех+У.
3.15.	Плотность распределения случайного вектора (X, У) равна нулю вне области G и постоянна в области G, где G = =((х, У):у>0, x-f-t/<l, 2у—х<2}. Найти:
а)	Р(Х>0};
б)	функцию распределения Fx (х)=Р (Х<х);
в)	плотность распределения случайной величины X.
3.16.	Плотность вероятностей Pz(x,y) двумерной случайной величины Z = (X, У) равна 1/4, если (х, ЙеО, и нулю в противном случае; G = {(x, у):0^х^2, 0^у<2}. Доказать, что X и У независимы.
Глава 4
ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН
Функция распределения дает полную, хотя и труднообозримую, информацию о законе распределения случайной величины. Однако часто бывает достаточно знать одну или несколько числовых характеристик случайной величины, которые давали бы менее полное, но более наглядное представление. При этом иногда достаточно знать некоторое «среднее» число, вокруг которого группируются значения случайной величины (центр группирования распределения), и ту или иную характеристику вариации значений случайной величины (степень рассеивания ее значений). Так, например, при изучении распределения заработной платы интересуются прежде всего средней заработной платой и характеристикой ее рассеивания — дисперсией. Эти характеристики иногда полезно дополнить характеристиками формы распределения вероятностей (характеристики формы плотности распределения для непрерывных случайных величин и формы многоугольника распределения для дискретных случайных величин). Для многомерных случайных величин могут использоваться характеристики, отражающие степень взаимосвязи случайных величин. Возможно конструирование также и других числовых характеристик, позволяющих получить в совокупности детальное представление о характере распределения случайных величин.
Все эти числовые характеристики случайных величин рассматриваются в настоящей главе.
§ 4.1. Числовые характеристики центра группирования
Допустим, что предстоит выбрать один из трех способов обработки древесины, причем отходы древесины при использовании каждого из способов — случайные величины. Надо выбрать такой способ, чтобы отходы «в среднем» были минимальными. Таким образом, желательно иметь некоторую «характеристику положения», дающую возможность сравнивать случайные величины. Для этого обычно используют подходящим образом определенное понятие центра группирования Распределения случайных величин. Имеется несколько способов определения центра группирования.
4*
99
Основной и наиболее употребительной характеристикой центра группирования является математическое ожидание MX случайной величины X.
Вместо термина математическое ожидание случайной величины X используют также термин среднее значение X, или среднее X. Определение математического ожидания связано с понятием среднего значения совокупности. Пусть, например, множество элементарных событий £2 конечно: £2 = =	©ч,, ©„J и Р (<о,}= 1/n, i=l, 2...п, т. е. все <о;
равновероятны, и пусть X (иц)=х1. Тогда среднее значение случайной величины X естественно определить формулой
х. + х2 4*... 4“Х_
MX =—-	2 п.
п
В результате элементарных преобразований эта формула принимает вид
AfX=-tx14-^x2+...+±xn =
= Р (<!>,) X (0),)4-Р (<о2) X (<о2) + ... + Р (<о„) X (о)„).
Если вероятности Р (о,-) отличны от 1/п, то среднее значение X естественнс вычислять с помощью последней формулы.
МХ=Р (<о,) X (0),)+Р (<о2) X (<о2)+... + Р («>„) X («>„). (4.1.1)
Эта формула может быть распространена и на случай счетного £2.
Пусть £2 = {<i)|, <о2, ...} — дискретное множество элементарных событий, (£2, S, Р}—вероятностное пространство. Тогда математическим ожиданием случайной величины X, заданной на дискретном пространстве элементарных событий £2, называется число
Л4Х= £ Х(Ш.)Р(Ш.),	(4 12)
»= I
если ряд абсолютно сходится, т. е. если сходится ряд
оо
£ |Х(<О,)|Р (<!>;). 1=1
Если £2 = {<01, ©г, ..., <i)J—конечное множество, то верхний предел суммирования в (4.1.2) заменяется числом |£2| = = п и тогда (4.1.2) переходит в (4.1.1) (при этом отпадает требование абсолютной сходимости ряда). В дальнейшем, 100
чтобы избежать дублирования, в случае дискретного Й используется, как правило, лишь формула (4.1.2).
Если ряд в (4.1.2) ие сходится абсолютно, то говорят, что математическое ожидание случайной величины X не существует.
Рассмотрим теперь случай, когда {й, S, Р} — непрерывное вероятностное пространство. Для любых событий А из поля событий S вероятность Р (Л) задается с помощью функции (<о):Р (Л)=Д Ф (ш) Тогда математическим ожиданием МX л
случайной величины X называется число
X (о>) <р (со) d<o,	(4.1.3)
если интеграл абсолютно сходится, т. е. если существует интеграл |Х(<о)| ф(<о) d<o.
В случае непрерывного пространства элементарных событий й при определении математического ожидания используют тот же подход, что и для дискретных й, только суммирование заменяют интегрированием.
Под математическим ожиданием п-мерного случайного вектора X=(Xi, Х2, ..., Хп) понимается вектор МХ={МХ\, МХ2.....МХп).
Есл1. случайная величина У=У(со) является функцией случайных величин Хь Х2, ..., Хп, т. е. Y=f(X)=f(Xt, Х2, ..., Х„), то в соответствии с определением, если й — дискретное пространство, имеем
ОО
Л4Х=Л4 (f (Х))= £ f (X (а,?)) Р (<*?),	(4.1.4)
(=1
а если й — непрерывное пространство элементарных событий, имеем
Л4У = М (f (X)) = р (X (ы)) ф (<0) d<o. (4.1.5)
Если известна плотность распределения случайной величины или заданы вероятности значений дискретной величины, то может оказаться, что математическое ожидание удобнее вычислять не по сформулированным выше определениям, а по фор г улам, которые будут получены как частные случаи теорем 4.1. и 4.2.
Теорема 4.1. Пусть Х=(ХЬ Х2, ..., Х„) — дискретный случайный вектор, принимающий значения Xi, х2, ...,
101
х„, ... с вероятностями pi, рг, ... , рп, ...: Р|Х=х,)=р1
со
и £ pf= 1, и пусть f(x)~f (xi, х2,... . хп) — некоторая функ-i= ।
оо
ция п аргументов. Тогда, если ряд IlfWI Pi сходится, i=i
случайная величина Y—f (X) имеет математическое ожидание
оо
МХ = £ f(xt)p,	(4.1.6)
i=l
□ Доказательство теоремы основано на «приведении подобных членов». Обозначим через А, событие, состоящее в том, что X примет значение Х|:А={ю:Х (ю)=хД Тогда pi=P ИЛ и Y (ю) = ( (X (ю) = ( (х,), если веЛ,-. 1=1, 2....
Пусть й={<01, о>г, ..} —дискретное пространство элементарных
ОО
событий. Тогда ряд У f (х (ю()) Р (ю-) сходится абсолютно и, следова -1=1
тельио, по определению (4.1.2), существует математическое ожида нне MY случайной величины У:
ОО	со
= 1 Z /(хг)Р(юг)= £ f(Xi) £ Р^= i=l	i=l
оо
= Y, f W Pi-i=l
Если й — непрерывное пространство элементарных событий, то, согласно (4 13),
А1У=^ У(ю) <р (ю) dto = ^ f (X (ю)) ф (ю) 4ю =
=X У ф dto=
Ф (ю) da> =
со	оо
= 2^ Г(х;)РИ,1= £ !(Xi)Pi. i=l	i=l
Тем самым формула (4.1.6) получена и в случае непрерывного пространства элементарных событий. И
102
Теорема 4.2. Пусть X=(Xi, Х2,	, Хп) — непрерыв-
ная п-мерная случайная величина, плотность распределения которой равна р (хь х2, ..., х„). Тогда если п-мерный интеграл
ОО
$ ... 5 <К*1. х2. - *п)1 р(*1, *2.	*n) d*i. 6*2.dxn
— оо	— ео
сходится, то случайная величина У =f (X) имеет математическое ожидание
MY= 5 I 1 ^Хр%2.........Х,‘>Р ^Хр Х*..dXp dXz’ " ’ dX“’
— ОО — оо
(4,1.7)
Получим формулы для вычисления математического ожидания дискретных и непрерывных случайных величин в том случае, когда известен их закон распределения.
Пусть X — дискретная случайная величина, pi — P{X=Xi]
и у р, = 1. Тогда, по теореме 4.1, математическое ожидание 1=1
случайной величины f(X)=X равно
MX=^xiPi,	(4.1.8)
i=l
оо	оо
если ряд £ If (xf)| pf= £ 1х4-| сходится. i=l	i=l
Пусть теперь X — непрерывная случайная величина.
Закон распределения непрерывной случайной величины определяется плотностью распределения. Аналогично предыдущему, применив теорему 4.2 к случайной величине f(X)=X, получаем формулу для вычисления математического ожидания X, если известна ее плотность распределения р(х):
МХ= j xp(x)dx,	(4.1.9)
— ОО оо	оо
если только интеграл |f(x)| p(x)dx = t |х| p(x)dx exo-
— oo	— co
ДИТСЯ.
Проиллюстрируем иа примерах понятие математического ожидания случайной величины и способы его вычисления.
103
О Приме*) 4.1. Рассмотрим альтернативную случайную величину, определенную на произвольном пространстве элементарных событий:
v ,	11 при шеЯ,
при шеЛ.
(4.1.10)
Эта случайная величина была использована в гл. 2 для описания единичного испытания в схеме Бернулли: в случае успеха, т. е. если произошло событие А, эта величина равна единице, в противном случае — нулю. Согласно (4.1.8),
MX, = 1Р (Хд = 1}+ О • Р {%Д = 0)= Р (Л)=р, т. е. математическое ожидание случайной величины Л, равно вероятности осуществления события А (вероятности успеха в схеме Бернулли). ф
О Пример 4.2. Найдем математическое ожидание случайной величины X, равной числу выпадений «герба» при подбрасывании двух монет, и покажем, что MX можно вычислять как по формуле (4.1.1), так и по формуле (4.1.8).
Ряд распределения X приведен в табл. 31. По формуле (4.1.1) получаем
МХ=Х (ГГ) Р (ГГ)+Х (РГ) Р (РГ)+Х (ГР) Р (ГР)+Х (РР)Р (РР)= =2-1/4 + 1-1/4 + 1-1/4 + 0-1/4 = 1.	(4.1.11)
Согласно формуле (4.1.8), имеем
з
МХ= £ х.р. = 0-1/4+1 -1/2 + 2-1/4=1.	(4.1.12)
Таким образом, при вычислении MX по формуле (4.1.8) мы фактически «приводим подобные члены» — два средних слагаемых в (4.1.11), соответствующие элементарным событиям, для которых случайная величина равна 1, в (4.1.12) объединены, ф
О Пример 4.3. Существует три способа контроля партии изделий. При использовании каждого из способов число ошибочно признанных годными некондиционных изделий является случайной вели чииой. Ряды распределения этих случайных величии представлены в следующих таблицах:
104
Требуется выбрать способ контроля, обеспечивающий минимум среднего числа некондиционных изделий в партии.
Найдем математические ожидания или средние значения случай-ных величин X, У, Z по формуле (4 1.8). Имеем:
М X = 0 • 0,5 + 1  0,4 4- 2 • 0,05 4- 3  0,05 = 0,65;
МУ=0-0,74- 1 -0,1 4-2-0,! 4-3-0.1 =0,6, MZ = 0,5.
Для контроля партии изделий выбираем третий способ, при котором математическое ожидание числа некондиционных изделий в партии минимально: MZ — 0.5. ф
О Пример 4.4. Найдем среднее значение случайной величины X, имеющей распределение Пуассона с параметром X.
Распределение Пуассона задается формулой
р =Р{Х = т}=------Х>0, т = 0, 1,2..........
т	ml
По формуле (4.1.8) получаем
ОО	ОО	оо	— . I
_	- ,	___	лГП—I
МХ~ У тр = У т—ге-*’= У -----------------пГе~К=
m=v	т —I	m=i
ОО
= Хе~х У —=АехеЛ = А. 4=0 *'
Таким образом, параметр А. является математическим ожиданием случайной величины X ф
О Пример 4.5. Найдем среднее значение случайной величины, имеющей равномерное распределение на отрезке [а, Ь].
Плотность распределения случайной величины X, имеющей равномерное распределение на отрезке [с, Ь], равна
О прн х & [а, Ь],
I	г
-----при хе[а, о).
Ь —а
р w=
По формуле (4 1.9) имеем
ОО	b
MX — ( xp(x)dx = (--^—
J	J b— а
1	b2 — а2	а + Ь
йх—ь^-2-
Среднее значение случайной величины X, как и следовало ожидать, совпадает с серединой отрезка [с, Р). ф
О Пример 4.6. Время безотказной работы устройства является случайной величиной, имеющей показательный закон распределения с параметром X. Найдем среднее время безотказной работы устройства.
Плотность распределения случайной величины X. имеющей показательный закон распределения, равна
"Не-
при /<0, при t^0.
105
Среднее время безотказной работы MX находим по формуле (4 1 9) МХ= tp(t)6t = $ Z-O-dZ + J tke-udt=-( t de~w=
— oo	— oo	о	0
= -<e-W|o“ + je-^d/=±.
Итак, среднее MX экспоненциального (показательного) закона распределения обратно пропорционально параметру распределения х-.мх=\/х.
Рассмотрим свойства математического ожидания случайной величины.
1°. Математическое ожидание постоянной равно этой постоянной, т. е. если с— постоянная, то МХ = с.
□	Постоянную величину с можно рассматривать как случайную величину, принимающую с вероятностью 1 значение с. Тогда по формуле (4.1.8) получаем
Л1с=с-1=с. 
2°. Постоянную величину можно выносить за знак математического ожидания, т. е. если X — случайная величина, ас — постоянная, то
М(сХ)=с-МХ.
□	Пусть X — дискретная случайная величина. Тогда, полагая п=1 и f(x)=cx, по теореме 4 1 получаем
М(сЛ)= (ex-) Р (Х=х}=с У xtP {Х=х)=сМХ. 1=1	i=l
Пусть теперь X — непрерывная случайная величина с плотностью вероятности р (х). Тогда, согласно теореме 4 2,
М(сХ)= (cx)p(x)dx=c хр (х) dx=cMX.  — оо	— оо
3° Математическое ожидание суммы случайных величин равно сумме математических ожиданий этих случайных величин, т. е. если определены MX и MY, то определено математическое ожидание М (Х+ Y), причем
M(X+Y)=MX+MY.	(4.1.13)
Для выполнения этого свойства не требуется независимость случайных величин. Оно верно как для зависимых, так и для независимых случайных величин.
106
□ Пусть X, У — дискретные случайные величины, принимающие значения Xi. У) соответственно с вероятностями р; и p,jt оо	“>
2, . £ Pi =’’ Z ₽ i = 1 i=!	i—1
Обозначим pii=P{X=xlfY=y!}; тогда в соответствии с (3.4.8)
и (3.4.9) имеем рь = 2 pi)t р.; = 2 Р1? Полагая n = 2, f(x,y) = x+ i=>	1=1
в соответствии с теоремой 4.1 имеем
СО оо	оо со	ОО ОО
м(х+ю= £ £	(х1+^р,/-= £	х, £	рц+ £	^ £	₽«=
i=J | = 1	»=1 j=l	i = l
= £ *(Рь + £ yjp.j=AfX + My. ,=i	j=i
Порядок суммирования можно было менять, так как сумма абсолютно сходящегося ряда по своим свойствам аналогична конеч-
ной сумме, а ряд £ Е (х[ + У/)Ру сходится абсолютно, поскольку
сходятся абсолютно ряды S х,р; = £ х, Ер^и Е У:Р.,= Е У: 2 Р,,
1 1	__t ; 1 :—1 ‘ 1 г — t 1— 1
Пусть теперь X, У — непрерывные случайные величины с плотностями распределения рх(х) и ру(у) соответственно; pz(x, у) — плотность распределения двумерной случайной величины Z = (X, У). Тогда в соответствии с (3.4.12) и (3.4.13)
ОО	ОО
Р*(*)=	Р^-У^У' Р (у)= Р(Х’У^Х-
Воспользовавшись теоремой 4.2, получаем
ОО оо
М(Х+Г)=	(*+j/)P (X, y)dxdy=
— оо — оо
р/х, у) dy
ОО	оо
= J хРх Wd*+ ypr(i/)dy=MX + MY.
— оо	— оо
Законность изменения порядка интегрирования и абсолютная сходимость двойного интеграла обосновываются аналогично предыдущему случаю.
Формула (4 I 13) справедлива и в случае, когда одна из случайных величии X или У дискретна, а другая — непрерывна. 
107
р1-.=Р{Х=х1), р~Р {/=//,}, £
Из двух последних свойств математического ожидания вытекает, что
М (с.Х, + с2Х2 + ... + c„Xn)=C|MX1 -j-c2MX2-f- ...~УспМХп.
4°. Математическое ожидание произведения независимых случайных величин равно произведению математических ожиданий этих случайных величин, т. е если X и У — неза-висимые случайные величины (имеющие математическое ожидание), то
М(ХУ)=МХ-МУ.
□ Рассмотрим случайную величину Z=(X, У). Пусть X, У — независимые дискретные случайные величины,
ОО
1=1
р..=Р{Х=х., у=г/.|.
Тогда (см. (3.4.6)) Pii — Pj.p.j.
Снова воспользовавшись теоремой 4.1, получаем ОО ОО	оо оо
i=l /=1	«=|/=1
oo	oo
= £ xiPi. У Ур i=MX.MY.
<=1	/ = 1
Пусть теперь X, У — независимые непрерызные случайные величины; рх (х), Ру (у), pjx,y) — плотности распределения вероятностей X, У и Z=(X, У) соответственно. Так как X и У независимы, то р^х,у) = рх(х)рг(у) (см (3.4.5)). На основании теоремы 4.2 получаем
ОО ОО	оо оо
М(ХУ)= J	J хур^х.у) dx dy= J	J xypx (x)pr (y) dx dy=
-- OO - OO	- oo — co
= J xpx(x)dx ypr(y)dy=MX-My — oo	— oo
Можно доказать, что Af (ХУ)=Л4Х-Л4У и в том случае, когда одна из независимых случайных величин, X или У, дискретна, а другая — непрерывна. И
Отметим еще раз, что М (ХУ} = МХ-МУ для независимых случайных величин X и У.
108
5Р. Пусть X (<о)^ У (со) для любых оей; тогда MX^MY.
□ Если, например, й — дискретное пространство элементарных событий, то
MX-MY=M (X - У)=£ (X (<о£) — Г (cOj)) Р (и>Д
Так как для любых со,ей Р (со,)>О и X (со,)—У (со,)>0, то MX — — MY^O и, следовательно, MX^MY. И
Рассмотрим примеры, в которых для вычисления математического ожидания MX используются рассмотренные выше свойства математического ожидания.
О Пример 4.7. Найдем математическое ожидание числа успехов в п испытаниях Бернулли с вероятностью успеха р.
Случайная величина щ, равная числу успехов в п испытаниях Бернулли, имеет биномиальное распределение:
р{р,я = га|=Рп(т)=С^т<7я~т,
m = 0, 1, 2,.... п, q=\—p
Математическое ожидание случайной величины X можно вычислить непосредственно по формуле (4.1.8);
п МН„ = £ тРп(т), т=0
однако в данном случае удобнее воспользоваться тем фактом, что математическое ожидание суммы случайных величии равно сумме математических ожиданий этих величии.
Обозначим через X,- случайную величину, равную числу успехов в i-м испытании Бернулли; тогда Р{Х, = О}=^, Р |Х,= 1|=р, МХ,= п
~р (см. пример 4.1). Случайная величина у Х; и, следова-(=1
тельно, л	п
Мрп= V MXt= у р = пр.
Итак, среднее число успехов в п испытаниях Бернулли равно пр. •
О Пример 4.8. Найдем математическое ожидание нормальной случайной величины X, Х~ N (а, о).
Плотность распределения X равна
109

Математическое ожидание X можно найти по формуле (4.1.9). Имеем
г 1
МХ= \ xpx(x)dx = —_ -
д/2ла
Выполним замену переменных t=(x—а)/а, тогда 00	'	00 —JL/2
МХ =——— ( (а<4-с)е 2 о d/=—( /е 2 d< +
У2л о _io	д/2л Л
оо	_1_*2
4-а t - * е 2 df.
- оо
Первый интеграл равен нулю, поскольку подынтегральная функция нечетная; второй интеграл равен 1 как интеграл от плотности нормальной случайной величины с параметрами а=0, а—1, поэтому МХ = а.
Рассмотрим другой способ вычисления математического ожидания случайной величины X ~ N (а, с), который проще и короче предыдущего
Пусть У=(Х—а)/с тогда У~1У(О, 1) (см. (3.5.8)). Далее имеем
Случайная величина X связана с У соотношением Х=аУ4-а; следовательно, MX=tj-MY -\-Ма=а. Таким образом, если Х~ N (а, а), то МХ=а. ф
Рассмотрим теперь среднее случайной величины X при условии, что Y=y. Пусть (X, У)— дискретная двумерная оо оо случайная величина рц=Р {X=xi, Y=yji, £ £ ptj = i=i j=i
= 1. В § 3.4 было показано, что
оо	оо
Pi. =Р (*=*<)= У Pi;.; p.j=P {Y=y.^= £ pit i=i	i=i
(4.1.14) и что условные вероятности
Рх (Xi/yj)=p {X=xi/Y=yj}=pij/p.l (4.1.15)
оо
удовлетворяют равенству £₽x(W=l (СМ. (3.4.8)-£=1
(3.4.11)) и, таким образом, при фиксированных У/ вероятности Px(xi/yj)> t==l» 2,.... можно рассматривать как условное распределение случайной величины X при условии, что Y=yj.
НО
Математическое ожидание случайной величины X, вычисленное по условному распределению (4.1.15), называется условным, математическим ожиданием случайной величина X при условии, что У=у,.
В соответствии с (4.1.8) для дискретных X н У условное математическое ожидание X при условии, что У=У/, равно
оо
M(X/yj)=M(X/y—yl)= £ xlpx(xi/y) =
1=\
00 П	1	°°
<4Л16) i=l r.j
Аналогично получаем
M{Y/x=x)= £ yjPr	Z W
j=l	j = l	ri. Ft. j—i
Определим условное среднее для непрерывных случайных величин. Пусть Z=(X, У) — непрерывная случайная величина, р^х,у), ру(у) — плотности распределения Z и У соответственно, тогда
Рх (х, у)
р/х, у) Ру&)
(4.1.17)
— условная плотность распределения вероятностей случайной величины X при условии, что У=у.
Математическое ожидание случайной величины X, вычисленное по условному распределению (4.1.17), называется условным математическим ожиданием случайной величины X при условии, что у=у. В соответствии с (4.1.9) имеем
оо
М(Х/у)=М (X/Y=y) = J хрх(х/у)дх=
(4.1.18)
Аналогично получаем
М (У/х)=='^7?Г I УРАх’У)АУ-РХ\Х) -оо
Рассмотрим функцию fx(y)=M (Х/у). Эта функция каждому у ставит в соответствие условное математическое ожи
III
дание X при условии, что Y=y, т. е. она отражает зависи мостьот у условного среднего X при условии, что Y=y. Функция }х (у) = М (Х/у) называется функцией регрессии X на У
Аналогично, функция fY (х) = М (Y/х) называется фуН кцией регрессии Y на X.
Найдем математическое ожидание случайной величины fx(Y) = M(X/Y).
□ Если Z=(X, У)— дискретная случайная величина, то по формуле (4.1.6) получаем
М[М(х/У)]=£ М(Х/у^р.Г i=i
Подставляя в последнее равенство (4.1.16) и воспользовавшись (4.1.14), имеем
«(«wm- £ р.,д- £ м,- р, £
7=1 H j j=1	i=l / = 1
= £ xiPi_=MX
Таким образом,
МХ=МрИ(Х/У)].	(4.1.19)
Формула (4 1.19) называется формулой полного математического ожидания.
Если Z=(X, У) — непрерывная случайная величина, то, воспользовавшись формулами (4.1.17), (4.1.18) и (3.4.12). получаем
М[М(Х/У)]= J M(X/y)pr(y)dy = — оо
= х/ J р/х, у) dy j dx =	xpx(x)dx = MX.
—	\ 4* ОО	У	— оо
Таким образом, формула (4.1.19) доказана и для непрерывных случайных величин. Она справедлива и в том случае,
112
когда одна из случайных величин X или У дискретна, а другая — непрерывна. 
С помощью формулы (4.1.19) можно, зная закон распределения У, найти математическое ожидание случайной величины X, если известны условные средние М (Х/у).
О Пример 4.9. Пусть качество выплавляемого чугуна характеризуется параметром X, а качество шихты — параметром У; пусть так-п
же У — дискретная случайная величина, p(yi) = P (У= t/Д £ р (у(-) = 1 = 1
= 1. Допустим, что для каждого у, известно условное среднее значение M.(X/yi) параметра X. Определим среднее значение Л1Х случайной величины X.
Так как мы знаем закон распределения случайной величины Y и для любого у,, /=!, 2, ..., л, известно условное среднее X при условии, что У=й, то в данном случае для вычисления Л1Х используем формулу полного математического ожидания (4.1.19):
п
м(х/у?)р • i=i
Кроме математического ожидания (среднего) в качестве характеристики центра группирования иногда используют среднее геометрическое, среднее гармоническое, медиану и моду случайной величины [2]. Среднее геометрическое и среднее гармоническое определены только для положительных случайных величин, т. е. таких, для которых X (со)> >0 при любых шей.
Среднее геометрическое значение G (X) случайной величины X (Х>0) определяется формулой
G(X) = eMW>.
Происхождение термина станет ясным, если рассмотреть среднее геометрическое дискретной случайной величины, имеющей равномерное распределение:
Pi — P {X=xJ= 1/n, t=l, 2, .... n.
Среднее геометрическое этой случайной величины равно среднему геометрическому значений xt, Xz, ..., х„:
Среднее геометрическое значение случайных величин используют, например, при изучении процессов, рост которых пропорционален уже достигнутому уровню (рост численности населения, валового продукта и т. д.), оно используется также при расчетах «индексов цен».
Среднее гармоническое И (X) случайной величины X (Х>. >0) равно Н(Х)=\/(М(\/Х)).
В экономике Н (X) используют иногда в индексных расчетах.
Медиана Me X случайной величины X является квантилью распределения, соответствующей вероятности р = 0,5 (понятие медианы введено в § 3.3). На основании свойства устойчивости частот при многократных испытаниях независимых одинаково распределенных случайных величин относительная частота реализаций, превышающих Me X, примерно равна относительной частоте реализаций, меньших Me X.
Мода Mo X дискретной случайной величины — это наиболее вероятное значение случайной величины; для непрерывной случайной величины Mo X — точка максимума плотности распределения.
Мода может быть неединственной. Для одномодальных распределений моду можно рассматривать как одну из возможных характеристик центра группирования.
Если распределение вероятностей случайной величины X симметрично относительно некоторой прямой х= а (т. е. если плотность распределения или многоугольник распределения симметричны относительно прямой х=а) и одномодально, то среднее, медиана и мода совпадают между собой: МХ=МеХ —МоХ. Для ассиметричных распределений это не так.
§ 4.2. Характеристики вариации
Характеристики вариации уточняют представление о распределении вероятностей случайной величины. Они дают представление о степени рассеивания случайной величины относительно центра группирования.
Естественной характеристикой вариации является среднее модуля отклонения случайной величины от своего математического ожидания, т. е. Л4(|Х —Л4Х|). Для дискретных случайных ветичин ее можно найти по формуле
Л4(|Х—Л4Х|)= £ lx(-MXI Р[Х=х1},
1=1
114
дня непрерывных случайных величин — по формуле Л4(|Х—Л1Х|)= J |х-.МХ| р (х) dx. — оо
Если
. . .	.	fx — MX при х^МХ,
f(x)=|x-A!X|=|_(jc_M^ при x<MKt
т0 М ]Х—МХ\ =Mf(X). Использовать характеристику Af(|X~ МХ|) сложнее, чем другие характеристики вариации, поскольку функция f (х) задается разными формулами на разных участках. Этого недостатка лишены дисперсия случайной величины и среднеквадратическое отклонение случайной величины (равное квадратному корню из дисперсии). Эти характеристики степени рассеивания случайной величины используют наиболее часто. Математическое ожидание и дисперсия случайной величины являются ее основными числовыми характеристиками.
Дисперсией случайной величины X называется число DX, равное математическому ожиданию квадрата отклонения случайной величины от своего математического ожидания:
DX = M(X-MX)2.	(4.2.1)
Таким образом, DX=Mf(X), где f (х)=(х— MX)2-
Если известен закон распределения случайной величины X, то для дискретной и непрерывной случайных величин дисперсию можно вычислять соответственно по формулам (4.1.6) и (4.1.7):
DX= Y (х; -Л4Х)2 Р |Х=х(|;	(4.2.2)
i=\
DX= J (x-MX)2px(x)dx.	(4.2.3)
Часто дисперсию случайной величины удобно находить по формуле
DX = MX2 — (MX)2.	(4.2.4)
которая вытекает из определения дисперсии и свойства линейности математического ожидания:
DX = M (Х-МХ)2 = М (X2 —2ХМХ+(МХ)2)=
= MX2 — 2МХ • MX + (MX)2 = MX2 - (MX)2.
115
Дисперсия любой случайной величины неотрицательна:
DX^O.
□ Если X дискретна, то DX= £ (xt~MXf Р {X=Jt;} (=i
Все слагаемые суммы неотрицательны, следовательно Ш>0.
Если X—непрерывная случайная величина, то £>Х = со
J (х—MX}' dx. Так как подынтегральная функция неотри-— оо
цательна, то DX^O. 
В качестве меры рассеивания случайной величины наряду с дисперсией используют среднеквадратическог отклонение случайной величины ох, равное квадратному корню из дисперсии случайной величины: оА =^DX.
Среднеквадратическое отклонение случайной величины выражается в тех же единицах, что и сама случайная величина и ее математическое ожидание Если, например, X — урожайность культуры (ц), то и математическое ожидание урожайности и ее среднеквадратическое отклонение также выражаются в центнерах, в го время как единицей дисперсии DX = a2 является центнер в квадрате.
Свойства среднеквадратического отклонения случайной величины непосредственно вытекают из соответствующих свойств дисперсии.
Дисперсия и среднеквадратическое отклонение характеризуют степень рассеивания случайной величины относительно ее математического ожидания: чем больше дисперсия или среднеквадратическое отклонение, тем больше степень рассеивания случайной величины.
О Пример 4.10. Пусть случайная величина X — погрешность регистрации веса груза при взвешивании на весах с ценой деления 1 кг, У — погрешность регистрации при взвешивании на весах с ценой деления 2 кг. При регистрации вес груза округляется до ближайшего деления на весах. Найти дисперсии DX, DY и средиеквадратиче-ские отклонения ах, ау.
В данном случае в качестве закона распределения погрешности регистрации X и Y естественно выбрать равномерное распределение: X — на отрезке (—0,5, 0,5), Y — на отрезке (—1, 1).
Математическое ожидание случайной величины Z, имеющей равномерное распределение на [а, />1 совпадает с серединой отрезка [а, 6} MZ—(a-Yb)/2 (см. пример 4.5).
Найдем дисперсию Z, а затем подставим в полученную формулу
116
числовые значения из примера. Подставляя в (4.2.3)
_ /н = РЛ6~а) при X6[fl. И Pz(x’ | о при х^[а, 6J,
получаем
ь
о + Ь \2
2 )
Ь—а
(6 — а)2 dx=—1Г-
(4.2 5)
откуда

22

Одни из весов вдвое точнее других, но дисперсии соответствующих случайных величин отличаются в четыре раза, в то время как среднеквадратические отклонения отличаются в два раза. Единицей дисперсии является килограмм в квадрате, единицей среднеквадратического отклонения — килограмм
О Пример 4.11. Найдем дисперсию случайной величины Хл, равной числу успехов в одном испытании Бернулли с вероятностью успеха р = Р(Д).
Математическое ожидание Хл равно р (см. пример. 4.1). Рассмотрим случайную величину, равную квадрату отклонения Хл от своего математического ожидания:
f(^(“))=(^(“)-p)2 =
(1 — р)2 при <1>еЛ
(—р)2 при о^А
{q2 при шеЛ, р2 при ш^Д,
где р=Р(Д), <7 = 1— р;
DXa = М (Хл — МХЛ)2 = q2p + p2q = pq (q + p)=pq. •
Свойства дисперсии случайной величины непосредственно вытекают из определения и соответствующих свойств математического ожидания случайной величины.
1°. Дисперсия постоянной с равна нулю: Dc = 0.
□ Имеем
Dc=M (с—Мс)2=М(с—с)2 = М0=0. 
Можно также доказать, что если DX = 0, то Р(Х = с)=1.
2 . Дисперсия произведения случайной величины X на постоянную с равна произведению дисперсии случайной величины X на квадрат постоянной:
D(cX) = c2DX.	(4.2.6)
117
□	В гамом деле,
D (сХ) = М (сХ - М (сХ))2 = М (сХ — с MX)2 = = М (с2(Х - MX)2) = с2М (X - MX)2 — c2DX.
3°. Если случайные величины X, У независимы, то дисперсия их суммы равна сумме их дисперсий:
D(X+Y)=DX+DY.	(4.2.7)
□	Действительно,
В(Х+У) = М(Х+У-М(Х + К))2 = М((Х- МХ) + (У-МУ))2 =
= М((Х-МХ)2 + 2(Х-МХ)(У-МУ) + (У-МУ)2) =
= М ((Х-МХУ + 2Л1 ((X—MX)(Y — MY)) + M (У-Л1У)2)=
= DX + DY+2М ((X - МX) (У - МУ)), т. е.
D (X + У) = DX + DY+2М ((X - MX) (У - М У)).	(4.2.8)
Так как X и У независимы, то, по теореме 3.5, независимы и случайные величины X — MX и Y — MY и, следовательно, математическое ожидание их произведения равно произведению их математических ожиданий:
М ((Х — МХ) (У-МУ))=М(Х-МХ)М (Y-MY) =
= (MX-MX) (МУ-МУ) = 0.	(4.2.9)
Подставляя (4.2.9) в (4.2.8), получаем, что для независимых случайных величин D(X + Y) = DX-C- DY. Я
Из (4.2.7) по индукции получаем, что если Xlt Хг,..., Хп независимы, то дисперсия их суммы равна сумме их дисперсий:
D (X, + Х2 +... + Х„) = DXt + DX2 +... + DXn. (4.2.10)
Из (4.2.6) и (4 2.7) следует, что дисперсия разности независимых случайных величин рее на сумме их дисперсий:
D(X-Y)=DX+DY.	(4.2.11)
□	Действительно, если X и У независимы, то, по теореме 3.5, независимы и случайные величины X и (—У). Тогда
D(X-Y)=DX-y D(-Y)=DX + (-l)2DY=DX+DY. 
4°. Дисперсия случайной величины X не изменится, если к ней прибавить постоянную с, т. е.
D(c + X)=DX
118
□ Имеем
D (С+X)=М ((с + X) - М (с 4- X))2 = М (с 4- X - с - МX)2 = = M(X — MX)2=DX. 
Таким образом, если к случайной величине X прибавить постоянную с, то математическое ожидание изменится на величину с:М (с-{-Х)=с-1-МХ, но дисперсия при этом не изменится.
Пусть Х(, Хг, .... Х„—последовательность независимых одинаково распределенных случайных величин, имеющих математическое ожидание МХ, = а и дисперсию £)Х, = о2, i= — 1, 2,.... п. Найдем математическое ожидание и дисперсию среднего арифметического п независимых случайных величин:
Af/—У хД=— У МХ-=— У а=— па=а; (4.2.12) \п ) п п п
(1	"	\	1	/ "	\
— У ХЛ=Л°( У ХЛ=
л J п2	J
« п	« п	2
=-L £ OX,.=-L £ о2= °	(4.2.13)
п2	п2	«
Следовательно, при п->оо математическое ожидание среднего арифметического п независимых одинаково распределенных случайных величин остается неизменным, равным среднему случайных величин а, в то время как дисперсия стремится к нулю. Это означает, что среднее арифметическое случайных величин при п->со как бы перестает быть случайной величиной, стремится к постоянной а. Это свойство статистической устойчивости среднего арифметического случайных величин отражает закон больших чисел, рассматриваемый в следующей главе. Свойство статистической устойчивости среднего арифметического числа успехов в испытаниях Бернулли было ранее установлено в теореме Бернулли (см теорему 3.4) с помощью интегральной теоремы Муавра—Лапласа.
Из свойств дисперсий вытекают соответствующие свойства среднеквадратического отклонения случайной величины:
1°. <Тх = О тогда и только тогда, когда X — постоянная.
2°. Среднеквадратическое отклонение произведения случайной величины X на постоянную равно произведению среднеквадратического отклонения случайной величины X на модуль постоянной, т. е.
ocX=y'D (сХ) = д/с2ОХ= |с| д/©Х=|с| аг.
119
3°. Если X, У — независимые случайные величины, то среднеквадратическое отклонение суммы X + У равно
ox+Y = y/D(X+Y)=yDX + DY= д/пх + ^у-
4°. Среднеквадратическое отклонение среднего арифметического п независимых случайных величин с одинаковой дисперсией о2 равно o/yjn.
Действительно, если Xt, X?,.... ХЛ — независимые случайные величины с одинаковой дисперсией DXt = o2, то дисперсия среднего арифметического этих случайных величин Уп =
1 "	1 "	а2
=— £ X, равна DYn=— JT Dx,=— и, следовательно, •= 1 <= 1
о ог " д/п
В математической модели случайная величина описывает те или иные параметры изучаемого случайного явления. Числовые значения исходных параметров зависят от выбора масштаба его измерения (например, рубли, тысячи или миллионы рублей). При этом рассмотренные выше характеристики вариации случайной величины также зависят от выбора масштаба измерения исходного параметра. Для изучения свойств случайных величин, не зависящих от выбора масштаба измерения и положения центра группирования, исходную случайную величину приводят к некоторому стандартному виду.
Случайную величину У будем называть нормированной, если Л4У = 0, £)У=1. Преобразование случайной величины ((V. Х-МХ	. .
вида f (л)=------назовем нормированием случайной вели-
ах
чины X.
Нетрудно убедиться в том, что случайная величина Х-МХ
f (Л =-------является нормированной:
°х
Mf(X)=M Х~МХ =— M(X — MX)=(j, °х °х
Df(X)=^ D (Х-МХ)=-^- DX = 1. °х	°х
Приведя случайную величину X, соответствующую некоторому параметру случайного явления, к нормированной
120
случайной величине Y=----------, мы как бы меняем начало
отсчета и масштаб измерения исходного параметра таким образом, что Л1У = 0 и единицей измерения становится а __ среднеквадратическое отклонение случайной величины
X. При этом сама случайная величина У является безразмерной и не зависит от выбора масштаба измерения исходного параметра.
Стремление получить безразмерную характеристику степени рассеивания случайной величины, не зависящую от масштаба измерения исходных параметров случайных явлений, привело также к понятию коэффициента вариации случайной величины.
Коэффициент вариации Vx— это отношение (%) среднеквадратического отклонения случайной величины к ее мате-л/DX	°х
магическому ожиданию: Vx =	100 % =~^-100 %
(предполагается, что Л1Х=#=0).
В экономике коэффициент вариации используют, например, при моделировании технике-экономических показателей. Коэффициент вариации применяют в тех случаях, когда степень рассеивания исходного параметра естественно описывать безразмерной характеристикой по отношению к среднему.
Рассмотрим примеры вычисления характеристик вариации случайных величин и найдем их для наиболее известных законов распределения.
О Пример 4.12. Найдем дисперсию числа успехов в и испытаниях Бернулли с вероятностью успеха в единичном испытании р.
Пусть р„ — число успехов в п испытаниях Бернулли. Представим, п
как и в примере 4.4, ц„ в виде суммы: pn=y X., где X,—-число < = 1
успехов в i-м испытании. В примере 4.11 показано, что Dxt = pq. Случайные величины Х|, Хг,..., Х„ независимы, поэтому дисперсия нх суммы равна сумме их дисперсий. Имеем
У хД=У DX— У pq = npq. •
\i-l / i=i i=i	(4.2.14)
О Пример 4.13. На заводе изготовлено 50 партий изделий, каждая из которых состоит нз 100 однотипных изделий Вероятность того, что данное издечие требует дополнительной регулировки, не зависит от состояния других изделий и равна р = 0,05. Из каждой партии извлекаются для контроля 10 изделий, и если среди них обна
121
руживается хотя бы одно неотрегулированное, то вся партия возвращается на доработку. При этом себестоимость партии возрастает на 500 руб. Себестоимость кондиционной партии изделий составляет ЗОООруб. Найти среднюю себестоимость изготовленной продукции и ее среднеквадратическое отклонение.
При математическом описании дважды воспользуемся схемой Бернулли. Найдем сначала вероятность события А, состоящего в том, что данная партия изделий будет возвращена на доработку (вероятность хотя бы одного успеха в 10 испытаниях Бернулли):
Р (Д)= I -р (Д)= 1 _(1 — 0,05)10 = 0,4.
Пусть X — себестоимость всей продукции. Y — число возвращенных на доработку партий. Воспользуемся еще раз схемой Бернулли с вероятностью «успеха» Р (А) Математическое ожидание числа возвращенных партий равно произведению числа изготовленных партий п = 50 на вероятность успеха Р(А) = 0,4 (см. пример 4.7):
MY=nP (А) = 50-0,4 = 20.
В соответствии с (4 2.14) срецнеквадратическое отклонение Y равно с Y = л]npq-^'50-0,4 (I —0,4) = 3,47.
Себестоимость всей продукции X складывается из затрат с= 50-3000= 150 000 руб. на изготовление 50 партий изделий и затрат на доработку возвращенных в цех партий:
Х=с + 500У.
Средняя себестоимость всей продукции MX и ее среднеквадратическое отклонение сх (руб.) соответственно равны
MX=М (с + 500 У) = 150 000 +500 • 20 = 160 000,
°х ~ ас+500У—а500У—500ог—500 -3,47—173з ф
О Примеп 4.14. Найдем дисперсию и среднеквадратнческое отклонение нормальной случайной величины X~N(a, с).
В примере 4.8 показано, что MX— а. В соответствии с (3.5.8)
Y=——-—N (О, 1). Найдем дисперсию К а затем дисперсию слу-о
чайной величины Х = сУ (-а Используя формулу (4.2.3) и формулу интегрирования по частям, получаем
I	о
поскольку—;—е	—плотность нормального закона распределе-
д/2л
122
нИя Воспользовавшись свойствами дисперсии, найдем теперь DX и ах. Имеем
DX=D(cY + a')=D(oV) = c2DY=c2,
cx=-\JdX = c.
Объединяя результаты примеров 4.8 и 4.14, получаем, что если X~N(a,a), то параметр а является математическим ожиданием, а а__среднеквадратическим отклонением случайной величины X.
Нормальный закон распределения, следовательно, полностью определяется своим средним и средиеквадратическнм отклонением. •
О Пример 4.15. Найдем дисперсию и среднеквадратическое отклонение случайной величины X, имеющей экспоненциальное распределение с параметром X.
В примере 4.6 показано, что AfX= 1 /X. Воспользовавшись формулой (4.2.4), вычислим DX. Получаем
МХ2= ?p(/)d<= J ?Xe“’-/d/= —Т l2de-u = — оо	б	О
= —l2e-u|^+\ e-u2f dl=-?- \ (Xe~u dt=-MX=-?-, «	К К	X2
ВХ-МХ2-(МЛ)2=А_ _L=_L
X2 X2 X2
Среднеквадратнческое отклонение случайной величины X равно
Таким образом, среднеквадратнческое отклонение случайной величины, имеющей экспоненциальное распределение, равно ее математическому ожиданию и равно 1 /X. ф
О Пример 4.16. Найдем дисперсию н среднеквадратнческое отклонение случайной величины X, имеющей распределение Пуассона с параметром X.
Параметр X является математическим ожиданием случайной величины X (см пример 4.4).
Дисперсию X будем искать по формуле (4.2.4) Имеем °°	°°	,т	°°	,т-|
ЛТУ2 = у т2р= У т2—-е_х = Х У т--------------,тге ^
т4п	т Л,	"•!	А	(т—1)!
т = и	т=1	т=1
Обозначим k = m — 1; тогда
°°
Л1Х2 = Х У (fe + l)±_e-k = X
*'
“ ,fc	°°
Г Ле~1+К У ——е
А=0
= хмх + х-1 =х2 + х.
DX-MX2 — (MX? = X2 + X — X2 = X.
123
Итак, дисперсия случайной величины X, имеющей распределение Пуассона, равна математическому ожиданию и равна параметру
Среднеквадратическое отклонение равно сЛ =\^DX="0ё. ф
§ 4.3. Моменты случайных величин.
Характеристики <рормы распределения
Математическое ожидание случайной величины X называют также первым начальным моментом случайной величины: ai=MX.
Начальным моментом k го порядка, k= I, 2,.... случайной величины X называют число а* = а*(Х), равное математическому ожиданию случайной величины X*:
а*=М(Х*).	(4.3.1)
Число	равное математическому ожиданию k-ii
степени отклонения случайной величины от своего математического ожидания, называют k-м центральным моментом случайной величины:
р, = М(Х-МХ)\	(4.3.2)
Число М |Х|* называется абсолютным начальным моментом порядка k, число М |Х— МХ\к— абсолютным центральным моментом порядка k случайной величины X, k —1,2,
Из существования момента am=MXm следует существование моментов МХк более низких порядков, А=1,2,..., т— 1.
Первый центральный момент случайной величины X равен нулю:
И1 = М (X—MX)=MX - М (MX)=0.
Второй центральный момент — это дисперсия случайной величины:
р2=М(Х — MX)2 = DX.
В соответствии с (4.2.4)
И2 = DX = MX2—(MX)2=а2 — а I.
Центральные моменты высших порядков можно также выразить через начальные моменты (Х|. аг,.... а*. Сделаем это, например, для рз:
рз = М (X — MX)3=М((Х3 — ЗХ-МХ + ЗХ (MX)2 — (MX)3)= = MX3 — ЗМХ2 - MX + ЗМХ (MX)2—(MX)3 = а3 — За2а, + 2а|.
124
Если многоугольник распределения дискретной случайной величины или плотность распределения непрерывной случайной величины симметричны относительно прямой х — МХ, т е. если распределение вероятностей случайной величины симметрично относительно математического ожидания случайной величины, то все центральные моменты нечетного порядка равны нулю:
Н2*+1=0> й=1,2,... .
□ Пусть, например, X— непрерывная спучайная величина и ее плотность распределения симметрична относительно прямой х=МХ. Центральный момент М24 + 1 равен
СЮ
М2»+1= J (x-MX^+'pfxJdx. — сю
На рис. 4.1 приведен пример симметричной плотности р (х) и соответствующей подынтегральной функции f (х)=(х—(х). График функции f (х) симметричен относительно точки (Л4Х, 0) поэтому р.2* + 1=0- Этот же результат можно получить и не на основании рисунка:
МЛ	оо
H2fc+1= \ (x-W*+,p(x)dx+ ( (t-MX?k+lp(t)At. — сю	MX
В силу симметричности плотности р(МХ— и)=р (MXи). Выполнив замену переменных х — МХ=у, t — МХ =—и, получаем
О	— сю
H2*+l= $ y2k + 'p(MX+y)dy+ \ (-u)2t+,p(MX-U)d(-u)= — со	О
О	0
= J 1?к + ,р(МХ+у)йу-	u2* + lp(MX + u)du = 0.
— сю	— СО
Анало-нчно можно показать, что р2А_^,=0 для дискретной случайной ветичины, многоугольник распределения которой симметричен относительно прямой х=МХ. 
125
Все центральные моменты нечетного порядка нормального закона распределения равны нулю, так как плотность нормального распределения симметрична относительно математического ожидания. Можно доказать, что если x~N(a, с), то все центральные моменты четного порядка равны [44]
(4.3.3)
_ (2*)’ „2* ^21---Z °
2kk\
Чем больше моментов случайной величины известны, тем более детальное представление о законе распределения мы имеем. В теории вероятностей и ее приложениях используют две числовые характеристики случайной величины, основанные на центральных моментах третьего и четвертого порядков соответственно,— коэффициент асимметрии ₽ и эксцесс у. Моменты более высокого порядка на практике обычно не используются. Коэффициент асимметрии и эксцесс дают представление о форме плотности распределения или многоугольника распределения. Эти характеристики являются безразмерными величинами — они не зависят от масштаба измерения моделируемых случайных параметров.
Коэффициентом асимметрии случайной величины X называется число р = р(Х), равное отношению третьего центрального момента к кубу среднеквадратического отклонения случайной величины X
Р(Х)=Из/<4	(4.3.4)
Коэффициент асимметрии случайной величины X является третьим моментом нормированной случайной величины v х-мх .	„ „
Y—---------(если среднее значение случайной величины рав-
о
но нулю, то начальные моменты совпадают с центральными):

л1/Л_2?£у«Л1уЗ = аз(У)=|1з(У).
4	7	(4.3.5)
При умножении случайной величины X на число с>0 ее коэффициент асимметрии, очевидно, ие изменяется: р (Х)= = р(сХ); если же с<0, то Р(сХ)=— Р (X). Коэффициент асимметрии случайной величины, закон распределения которой симметричен относительно математического ожидания, равен нулю, поскольку в этом случае рз(Х)=0. Если распределение вероятностей несимметрично, причем «длинная
часть» распределения расположена справа от центра группирования, то Р>0, если же :длинная часть» расположена слева, то Р<0. Если «длинная часть» распределения распо ложена справа от среднего значения случайной величины, то рз положительно, так как взвешенная сумма кубов больших
126
положительных отклонений от среднего больше суммы кубов отрицательных отклонений. Так как среднеквадратнческое отклонение ох>0, то в этом случае Р(Х)>0 и асимметрию называют положительной, если же Р(Х)<0, то асимметрию называют отрицательной. Пример плотности распределения вероятностей случайной величины Xi с положительной асимметрией приведен на рис. 4.2. Там же приведен многоугольник случайной величины Хг, имеющей отрицательную асимметрию.
В качестве характеристики большей или меньшей степени «сглаженности» плотности или многоугольника распределения по сравнению с нормальной плотностью используют понятие эксцесса.
Эксцессом случайной величины X называется число у = =у(Х), равное разности отношения четвертого центрального момента к четвертой степени среднеквадратичного отклонения случайной величины и числа 3:
U4
у=-4—3.	(4.3.6)
°х
Эксцесс случайной величины X равен разности четвертого „ .	v Х-МХ
момента нормированной случайной величины Y=------ и
°х числа 3:
у(Х)=р4(П-3 = а4(У)-3.
Это можно показать аналогично тому, как было сделано для коэффициента асимметрии р (X):
р4 (X)	1
у(Х)=——3=—т-Л4(Х—Л/Х)4 —3 =
Ох	ох
= М|
Х—МХ \4
Ох )
-3 = р4(У)-3 = а4(У)—3
(так как МУ=0, то р4 (У) = а4 (У)).
127
Эксцесс случайной величины Y=aX-\-b равен эксцессу случайной величины X:
y(aX+b)=f(X).
Доказательство вытекает из того, что нормирование случайных величин X и аХ-\-Ь приводит (с точностью до знака) к одной и той же случайной величине У.
Найдем эксцесс нормальной случайной величины X. Если X~/V(a, а), то нормированная случайная величина
У=^^-~ЛЦО, 1). о
Тогда
<	°°	__L/2
у (Х) = у(У)=а4(У) —3=—=- ( /4е 2 d/-3= Л
— 3 dt = 3DY — 3 = 0.
Эксцесс нормального закона распределения вероятностей равен нулю. Если распределение вероятностей случайной величины X одномодально и плотность распределения р (X) более «островершинна», чем плотность распределения нормальной случайной величины с той же дисперсией, то у (Х)> >0, если же р(Х) менее «островершинна» и более «сглаже на» по сравнению с плотностью соответствующего нормального распределения, то у(Х)<0. На рис. 4.3 приведены плотность нормального распределения (у = 0) и плотности
128
паспределення случайных величин с положительным (у>0) и отрицательным (у<0) эксцессом.
Выше были получены коэффициент асимметрии и эксцесс нормального закона распределения. Найдем эти характеристики для ^ -которых других законов распределения.
О Пример 4.17. Пусть X имеет распределение Пуассона с параметром X,	т = °’ 1<2’ -  Вычислим Р(Х). Найдем тре-
тий центральный момент через начальные моменты по формуле рз = _.ct3_3ct2a1+2а3. Моменты ai и а2 найдены ранее в примерах 4.4 и 4.16: ai=A4X = X, а2 = Л4Х2 = X* + X. Найдем третий начальный
момент аз:
Хт— I т -——— е (т—1)!
Обозначим k = m— I. Тогда
“з=*£ <*+п2^-х=
Л=0
= кМХ2 + 2ШХ + Х=Х (X2 + Х) + 2Х2 + Х=Х3 + ЗХ2 + Х.
Подставляя а,, а2, аз в формулу для вычисления рз, получаем
ц3 = Х3 + ЗХ2 —X —3(Х2 + Х)Х + 2Х3 = Х.
Таким образом, третий центральный момент случайной величины X также равен параметру распределения Пуассона X. Найдем коэффициент асимметрии:
Рз(*)
X
Р(Х) =
Коэффициент асимметрии случайной величины, имеющей распределение Пуассона, больше нуля. Многоугольники распределения Пуассона с параметрами 0,5; 2; 4 приведены на рис. 3.3. «Длинная часть» распределения расположена справа от среднего значения случайной величины.
Можно показать, что у(Х)=1/Х. Так как Х>0. то эксцесс распределения Пуассона всегда положителен. ф
О Пример 4.18. Найдем коэффициент асимметрии числа успехов Мл в л испытаниях Бернулли с вероятностью успеха в единичном испытании р.
В примерах 4.7 и 4.12 найдено: Л4р„ = лр, Dp.n = npq, где <?=1 — Р- Представим, как и ранее, р.„ в виде суммы л независимых слу-
5 В. А. Колемаев и др.	129
п
чайных величин: рп = £ X,, где X/ принимает значение 1 с вероятно-| = 1
стью р н 0 с вероятностью q.
Обозначим отклонение случайной величины X/ от своего среднего через Yr. Yi=X,—р, тогда ЛУ=0, i= I, 2,п. Случайная величина У? принимает значения (0 — р)3 = — р3 с вероятностью q и (1 —р)3 = ^з с вероятностью р. Найдем третий центральный момент рз(р») случайной величины р„:
= 11
i=i/=it=i
Последняя сумма содержит п слагаемых вида MYl и слагаемые вида М(У?У;.)(«=/=/) и Л1(У,УуУ*), i^j, i^k, j=^=k;
MY?= —p3q + q3p = pq (q2 — p2)=
=pq(q — p)(q+p)=pq (q — p).
Так как случайные величины У/,i=l,2.п, независимы, то
М (YfYi) =MY?MYi=O, М (YiYjYii) =MYiMYlMYk = 0.
В результате получаем
п	п
Нз(ип)= MYi^ X i= 1	f=l
Коэффициент асимметрии ₽ (р„) равен
130
С ростом п коэффициент асимметрии стремится к нулю и, следовательно, распределение вероятностей становится все более симмет-пичным относительно математического ожидания пр. Если р = <7 = 0,5, то ₽W=°- если ₽<0'5- то ₽ (Рл)>0, и если Р>0,5, то ₽(р„)< 0 Многоугольники распределения случайной величины цг0 при р = 0 1 • 0,3; 0,5; 0,7 и 0,9 приведены на рис. 4.4. Можно доказать, что эксцесс случайной величины равен
т(и„)=1±^₽±^.
,<р<7
С ростом п величины р (p„j и у (р„) стремятся к нулю, т. е. к соответствующим характеристикам нормального закона распределения.
§4.4. Числовые характеристики меры связи случайных величин
Между случайными величинами может существовать функциональная взаимосвязь (см. §3.5). Однако между случайными величинами может существовать взаимосвязь и другого рода. В § 3.4 были рассмотрены условные распределения случайных величин. Взаимосвязь случайных величин при этом проявлялась в том, что условный закон распределения одной случайной величины изменялся в зависимости от значений, принимаемых другой случайной величиной. Такую взаимосвязь называют стохастической или вероятностной. Одной из характеристик стохастической взаимосвязи двух случайных величин является ковариация случайных величин.
Ковариацией случайных величин Xt, X, называется число Gij=cov (Х<, Xj), равное математическому ожиданию произведения отклонений случайных величин X, и X,- от своих математических ожиданий
olT=cov (X,, Х/)=Л4(Х,.-Л1Х,.)(Х,.-Л4Х/)	(4.4.1)
(ковариацию называют также вторым смешанным центральным моментом случайных величин Х<, X,).
Кроме формулы (4.4.1) ковариацию можно вычислять по следующей формуле:
О..=М (ХГ Х,) —МХ.МХ,.	(4.4.2)
Формула (4.4.2) получается из (4.4.1) на основании свойств математического ожидания;
о,-, = М (Х; — М XJ (X, — МХ-)=М (Х/Х, — Х^Х. — XiMXj +
+ MX.MXj)=(МХ,Х;) — MXjM Xt—MXiMXj + MXiMXj =
= M(XiXj)—MXiMXl.
Если X| и Хг независимы, то
cov (X,, Х2) = 0.	(4.4.3)
5*
131
Это свойство вытекает из (4.4.2), так как для независимых случайных величин М (Xi, Xj) = MX, MX,.
Для независимых случайных величин cov (Xi, Х2)=0, следовательно, если cov (Хь Х2)=#0, то случайные величины Xt, Х2 зависимы.
Из свойств математического ожидания также следует, что
cov (Х„ X2) = cov (Х2, X,), cov (Х,Х,)= DXlt
COV (X, + Cj, X2 + C2) = COV
cov (ciXi+c2X2, X3) =ci cov (ХЛ) 4-C2COV (X2X3),
где Ci, c2 — постоянные.
Ковариационной матрицей случайного вектора Х= = (Х|, Х2, .... Х„) называется матрица 2, элементами которой являются ковариации o,, = cov (X, X/):
(4.4.5)
Из свойств ковариации вытекает, что ковариационная матрица является симметричной (оц=ор) и ее диагональные элементы равны дисперсиям случайных величин Х|, Х2, ..., Хл:
ой =Dx„ i=l,2,.... п
Определитель ковариационной матрицы Е называется обобщенной дисперсией. Обобщенную дисперсию можно использовать как меру рассеяния п-мерной случайной величины.
Ковариационная матрица и вектор средних МХ = =(Л4Х|, Л4Х2, .... МХ„) являются основным^ 'числовыми характеристиками случайного вектора X.
В теирги вероятностей и ее приложениях частно воЬцикаеХнеобходимость перейти с помощью линейного преобразования от' случайных величин X|, Xi,..., Х„ к новым случайным^деличииам У|, Yi,.... Ym: |=1,2. ...,m.	(4.4.6)
Обозначим через С=(с,-,) матрицу коэффициентов линейного преобразования, через X и У — вектор-столбцы:
Yi=cnxi + саХ2 + -+cinXn,
132
тогда (4 4.6) можно записать в зиде
У=СХ.	(4.4.7)
Из свойств математического ожидания получаем Л4У= ==СЛ1Х. Связь ковариационных матриц векторов X и У определяются следующей теоремой.
О Теорема 4.3. Если для случайных величин Xi, Хъ,.... Хп существуют oy = cov (A.A,), i, / = 1, 2,.... п, то при любых постоянных Cih 1=1, 2, ..., m, для случайных величин У,= с,|А|-|-с12А2-|-...-|-с1ПА„, /= 1, 2,..., п, существуют ковариации hit=cov (YtYj), причем ковариационные матрицы	и Х=(о,-,) случайных векторов У и X связа-
ны равенством
Н=С ХС',	(4.4.8)
где С=(Сц), a С — матрица, транспонированная к С.
□ Используя свойства (4.4.4), получаем
сот (У(., y)=cov
= cov

где (С X С'),) — ij-н элемент матрицы С X С'. 
Из теоремы 4.3 как частный случай получаем форл-улу для вычисления дисперсии линейной комбинации зависимых случайных величин:
ckci°ki-
(4.4.9)
Действительно, воспользовавшись (4.4.8), имеем
D
п п
=(СЕС')Й= £ £ cikctPkr k--1 z=i
что совпадает с (4.4.9), если в левой и правой частях последней цепочки равенств заменить с(», Си на с* и с,-.
Так как дисперсия случайной величины — неотрицательное число, то из (4.4.9) получаем, что для любых С|,с2,.... с„
ckci°ki>°-
(4.4.10)
133
Свойство (4.4 10) означает, что любая ковариационная матрица является неотрицательно определенной матрицей.
Формула (4.4.9) включает в себя как частный случай ряд полученных ранее свойств дисперсии. Если положить п = = 1 или п = 2, с1 = с2=1, то
D (С|Х1) = С|С1Оц = c2DXl;
D (X,	@22 =
= DX । -J" DX2 4~ 2о [2-
D (Х| —Х2)=ст11 — 2 ст 12 4- о22= DXj 4" DX2 — 2сг12-
Два последние равенства можно записать в виде
P(X,±X2)=DX,4-DX2±2g12,	(4.4.11)
т. е. дисперсия суммы (разности) двух случайных величин равна сумме их дисперсий плюс (минус) удвоенная ковариация этих величин.
Из (4.4.11) получаем, что если Xi и Х2 независимы, то D(X,±X2)=DXi4-DX2, так как О|2 = 0.
Полагая в (4.4.9) с* = С/=1; k, I— 1, 2,..., п, получаем формулу для дисперсии суммы случайных величин:
(4.4.12)
т. е. дисперсия суммы п случайных величин Х|, Х^, Хп равна сумме элементов ковариационной матрицы вектора Х= =(Х,.Х2....Х„).
Если случайные вели'-йны Х'ь Х2,..., Х„ независимы, то внедиагональные элемент^! ковариационной матрицы Е равны нулю и матрица 2 в этом случае-------------------"
является диагональной:
Из (4.4.12) получаем тогда формулу (4.2.10) для дисперсии суммы независимых случайных величин:
134
Q Пример 4.19. Вычислим ковариационную матрицу Е случайного вектора Z=(X, V) из примера 3.8, закон распределения которого ппиведеи в табл. 3.5, а также дисперсии случайных величин U, — X + у и /72 = 2Х — ЗУ и ковариационную матрицу Н вектора 17 = (Lit, Ut)-
Законы распределения случайных величин X и У определены в примере 3.8. Найдем MX, MY и М (ХУ). Имеем
МХ = 5-0,44-6-0,44-7-0,2 = 5,8,
М У = О • 0,204- о, 1 • 0,25 4-0,2 - 0,30 4-0,3 • 0,25 = 0,16; 3	4
Л1(ХУ)=£ £ *^=5-0-0,24-5.0,1-0,14-1= 1 /=* 1
4-5-0,2-0,054-5-0,3-0,054-6.0-04-6-0,1-0,154-6-0,2-0,154-
4-6-0,3-0,104-7-0-04-7-0,1-04-7-0,2-0,1 4-7-0,3-0,1=0,975.
Элементы ковариационной матрицы X вычислим по формуле (4.4.2):
а,2=о21 = cov (X, У)=Л4(ХУ)-Л4Х-МУ=
= 0,975 —5,8  0,16= 0,047; о,, = DX = 7ИХ2—(МХ)2 =
= 52 - 0,4 4- 62 • 0,4 4- 7г - 0,2 — 5,82 = 0,560;
а22 = D У=М У2 - (Л4 У)2 =
= 4- 0 • 0,2 4- 0,12 • 0,25 4- 0,22 - 0,3 4- 0.32 - 0,25 — 0,162 = 0,037.
Таким образом, 2_/°ti ai2\ /0,560 0,047\ — \ст21 °22}~\ 0,047 0,037/
По формуле (4.4.12) дисперсия суммы 1Л=Х4-У равна 2	2
ОТ/| = О(Х4-У)= у £	=0,560 4-0,0474-0,0474-0,037 = 0,691.
/= I
Согласно формуле (4.4.9), дисперсия Uz = 2X— ЗУ равна 2	2
Dl/2=D(2X ЗУ)= У У ckci°ki~
*=1/—i
= 2-2-0,560 + 2 (-З)-0,047 — 3-2-0,0474-( — 3)-(—3)-0,037 = 2,009.
Ковариационную матрицу вектора 17=(1Л, С/2) можно определить по формуле (4.4.8), положив
„ /Сц с12\_/1	1\.
ЧС2> Vs
H^cV	1\/0,560 0,047\/1	2\ /0,691 0,962\
\2 — ЗДо,047 0,037Д1 —3^—\0,962 2,009/
135
Диагональные элементы матрицы Н равны дисперсиям случайных величин Ut и U2, cov (X, У)>0; следовательно, X и Y зависимы. Иногда в таких случаях говорят, что связь X с Y положительная (если cov(X, У)<0, то связь отрицательная). Сказать что-нибудь более определенное о степени зависимости случайных величин X и У только по виду ковариационной матрицы сложно. Существуют специальные методы исследования зависимостей случайных величин, в основе которых лежит анализ ковариационной матрицы Некоторые из них рассматриваются в ч. 2 книги, ф
Как следует из (4.4 4), cov(Xi, Х2) линейно зависит от выбранного масштаба измерения моделируемого исходного параметра: если изменить, например, масштаб измерения параметра, соответствующего Х2, и перейти от Х2 к новой случайной величине У2 = с2Х2 (с2 — постоянная), то cov (X|, У2)=с2 cov (Xi, Х2). В то же время естест венным является требование, чтобы характеристика степени зависимости случайных величин не зависела от выбранного масштаба
измерения исходных параметров, т. е. не зависела от преобразования случайных величин вида Y = aX-j-b. Чтобы получить такую характеристику, перейдем от исходных случайных величин к нормированным. Напомним, что нормированные случайные величины Yi=(X,—МХ,)/сх являются безразмер-
ными, МУ,- = О, DYi—l (см. § 4.2).
Из (4.4 4) получаем, что если У;=(Х,-— МХ,)/ох, t = 1, 2, то
cov (У„ y2)=cov (Х^Х^/^о^).	(4.4.13)
Действительно,	\

cov (У, У2)=соу
°*.
Х2 — МХ2
°х л2
cov (X, — MX,, Х2 — МХ2)
cov (X,, Х2)
О*1°Л2
В качестве количественной характеристики зависимости случайных величин Х|, Х2 используют коэффициент корреляции рх х> равный ковариации нормированных случайных
X,—MX,	X, —МХ2
величин У,=---------- и У2=—”-------:
°х,	%
Px,x2-cov
(4.4.14)
136
Из определения и
(4 4.13) следует, что
cov (X,, Х2)
РхЛ=	'
Л} Л2
(4.4.15)
(4.4.16)
cov (Х„ Xj)—Px^fx^x^
Для независимых случайных величин рх^ = 0, поскольку в этом случае cov (X,, Х2)=0. Обратное утверждение: если коэффициент корреляции равен нулю, то случайные величины независимы,— неверно; коэффициент корреляции зависимых случайных величин может быть равен нулю.
О Пример 4.20. Пусть X|~W(O,1), f(x)=x2 — 1, Х2 = ((Х|)= =Xi — 1. Случайные величины Xi, Хг зависимы. Покажем, что их коэффициент корреляции равен нулю.
Так как Xi~W(0,l), то Л4Х|=0 и Л4Х? = 0. Отсюда и из свойств ковариации (4.4.4) получаем
cov(Xi,X2)=cov(Xi,Xi — l) = cov (Xj, X?) —cov(Xt, 1)= = M [X, (Х?-Л1 (Х?))] -Л4 [X, (1 -1)]= Л4Х?-M (X?) MX, =0.
Следовательно,
Pxlx2=cov ^2)/(axlax2)=®-
Случайные величины X, и X2 называются некоррелированными, если их коэффициент корреляции равен нулю, т. е. если рх х =0.
Как было показано выше, из независимости случайных величин вытекает их некоррелированность, в то время как некоррелированные случайные величины могут быть зависимы, т. е. из некоррелированности не следует независимость случайных величин.
Абсолютное значение коэффициента корреляции не может быть больше единицы, т. е.
IPx.xjKI-	(4.4.17)
□ Обозначим через У, нормированные случайные величи-
Xi — MXi
ны У,=----------, |=1, 2. Тогда в соответствии с (4.4.11)
Ч
D (У| ± Уг) = DYi -|- DY%+z2 cov (У> У2) > и так как Р(У| + У2)^0» cov (У|.Уг)=рЛ х, DYi = DY2=i9 то
D (У, ± У2)=2±2рХ1%2 = 2 (1 ±рЛ/2)>0.	(4.4.18)
Отсюда получаем 1+Рх  ^0 и 1— рх х ^0, что эквивалентно (4.4.17). 
Покажем, что IPx^l = 1 тогда и только тогда, когда Х| и X? связаны линейной зависимостью, т. е. Хг=аХ, 4-fe, где
137
а^О и Ь — постоянные, причем Рдд=1, если а>0, и pxix2= — 1, если а<0.
□ Если р„ у = 1, то из (4.4.18) получаем D (У| — У2) =2 (1 — — рх х )=0. Согласно свойствам дисперсии, D(Y,— У2) =0 в том и только том случае, если У,— У2 = с, где с—постоянная. Постоянная с = 0, так как Л4(У|— Ys)=Mc=c и с = Л4(У|— У2)=Л1У|—МУ2= = 0—0=0. Таким образом, У, — У2 = 0, т е. У| = У2, следовательно, Х{—МХ{	Х2 —МХ2
откуда
Х2=аХ1+Ь,	(4.4.20)
где а=—Ь=МХ2-------MX..
%	°х,
Аналогично, если р (Хр Х2)= — 1, то D (Fj -f- F2)=0, откуда получаем
х2=----—Xt+( MX2+—MXt\ (4.4.21)
°xi	\	°xi /
Докажем теперь обратное утверждение:
_ I 1 при а>0, 1—1 при а<0.
Если Xs = aXt+b, то
Х2-МХ2 аХ- +b-M(aXl+b) a(Xt-MXt) а
2~ °Хг	°aXl+b	1“1 СТХ,	'
Используя свойства ковариации (4.4.4), получаем
Px,x2=cov(yi. У2)=соу^У1,-^-У1^=^-соу(У1, yi)=
о __f 1 при а>>0,_
— |а| I—1 при а<0.
Коэффициент корреляции можно рассматривать как характеристику степени линейности взаимосвязи случайных величин X и Y. Сформулируем это утверждение более определенно.
Найдем такие коэффициенты а и Ь, чтобы дисперсия D(Y — аХ — Ь) отклонения Y от функции aX-f-b была минимальна. Задача поиска наилучшего приближения Y с помощью линейной функции аХ + b является оптимизационной задачей. Можно доказать [34], что минимум дисперсии D(Y—аХ — Ь) достигается, если
°о = Рхг^. fco=My-Px)”M'V- <4-4-22)
138
При ЭТОМ
Р(У-а0Х-60) = 4(1-р'-1,).	(4.4.23)
о
Отсюда следует, что чем ближе р^у к единице, тем меньше дисперсия отклонения Y от наилучшего линейного приближения а0Х-|-б0. В этом смысле коэффициент корреляции можно считать «измерителем» степени линейности взаимосвязи двух случайных величин.
В соответствии с (4.4.22) наилучшее линейное приближение функции регрессии У на X на основании критерия минимума дисперсии D(Y — аХ — Ь) имеет вид
y = p%y —Х-1-Л1У —рЛу—МЛ.	(4 4.24)
°х	°х
Отсюда, в частности, следует, что если функция регрессии У на X имеет вид f (x)=ax+b, т. е. если М (Y/X=x)=ax-f-b, то коэффициенты а и b определяются формулами (4.4.22) и формула (4.4.24) в этом случае задает функцию регрессии.
Корреляционной матрицей случайного вектора Х = = (Xi, Хг,Хп) называется матрица R, элементами которой являются коэффициенты корреляции Pi, = pAj<:
✓	* P|2 Р13	Р|л \
р I	Р21	Р23	Р’п \
' Рп1 Рл2 РпЗ 1 '
Диагональные элементы R равны единице, поскольку Рц = Рх/х1=1- Так как
cov (Х(, Xj) cov (X., Xt)
то корреляционная матрица R является симметричной матрицей.
В силу (4.4.15) коэффициенты корреляции могут быть получены делением ковариаций на соответствующие среднеквадратические отклонения:
Р<( = °ч7(о*оХ)),
Поэтому, чтобы из ковариационной матрицы 2 получить корреляционную матрицу R, надо разделить первую строку матрицы 2 на оХ), вторую — на сх^, i-ю строку — на аЛ1, i = = 1, 2, ..., п, а затем разделить первый столбец на ох > вто-рой — на сх^ j-й — на <ц, /=1, 2,..., п.
139
Отметим, что из неотрицательной определенности ковариационной матрицы 2 вытекает неотрицательная определенность корреляционной матрицы R.
□ Действительно, пусть Ci, С2... с„ — произвольные числа. Цс.
хот,я из (4.4.10) покажем, что
п п
£ £ слрм>°-
fe=l Z=1
Имеем
£ ckciPki= )

Тем самым доказана неотрицательная определенность матрицы R. 
О Пример 4.21. Найдем корреляционную матрицу R случайного вектора Z= (X, У) по известной ковариационной матрице 2, полученной в примере 4.19, а также функцию регрессии У по X и иаилучшее линейное приближение у=аХ-\-Ь функции регрессии, минимизирующее дисперсию D(Y — aX — b).
Коэффициент корреляции Р|2 — Рхр находим по формуле (4.4.15):
д/0,560-0,037
P2I—Рух-"Р12' Р||— Р*, X—Р22 — Ру, У—I'
Таким образом.
1 0,33\
к~\о,зз I )
В соответствии с (4.4.24) наилучшее линейное приближение функции регрессии имеет вид
</ = МУ+рА у (оу/ох)(х — Л<Х), которое после подстановки конкретных значений параметров, полученных в примере 4.19, принимает вид
</=0,081 х — 0,32.	(4.4.25)
Воспользовавшись табл. 3.6, найдем теперь по формуле (4 1.18) значения функции регрессии У на X и сравним их с приближенными
140
значениями, полученными по уравнению (4.4.25). Имеем:
X У)Рч
0-0,2 + 0,1 -0,1 +о,2-0,05 + 0,3-0,05	_ nQQ
= —-----—————-------------------------= U .ио о,
0,4
X yiPi! шг/х=6)=-¥ет=
0-0 + 0,1 -о + о,2-0,1 +о,3-0,1
Л1 (У/Х = 7)
X «'/Рз/
1 = 1
Р{х = 7}
0-0 + 0,1-0 + 0,2-0,1+0.3-0.1 =0250
0,2
Значения функции регрессии Л1(У/Х=х1-) и ее линейного приближения j/, = 0,084X1 — 0,32, i= 1, 2, 3, приведены в табл. 4.1. В данном случае прямая линия является достаточно хорошим приближением функции регрессии.
Таблица 4.1
Xi	5	6	7
М(У/Х=х,)	0,088	0,188	0,250	•
У.	0,094	0,177	0.261
Рассмотрим двумерную нормальную случайную величину Z = (X, У) с параметрами at, az, Qi, ог, г. Напомним, что плотность распределения Z имеет вид
141
Координаты X, У случайного вектора Z имеют нормальное распределение (см. пример 3.10):
X~ А (а,, ст,), Y~ N (а2, о2).
Можно показать, что параметр г является коэффициентом корреляции случайных величин X и У:
Рху=г-
(4.4.27)
Отсюда вытекает важное для приложения теории вероятностей следствие: если нормальные случайные величины некоррелировины, то они независимы.
□ Действительно, если г=0, то плотность (4.4.26) можно представить в виде произведения плотностей распре деления координат X и У, что означает независимость случайных величин X и У:
Ранее было показано, что из независимости случайных величин следует их некоррелированность. Итак, для нормальных случайных величин некоррелированность равносильна независимости.
Найдем функцию регрессии У на X, если 2 = (Х, У) — нормальная случайная величина с плотностью (4 4.26). В том случае, если at = =02=0. ai=O2=l, условная плотность рх(х/у) имеет вид (3.4,15). Аналогично можно получить условную плотность рх(у/х) случайной величины У при условии, что X =х, если Z= (X, У) имеет нормальное распределение с произвольными параметрами ai. cj. щ, аг, г:
Ру (У/х)=------—X
д/2л aY у1 —г2
а,,	-.2
у-МУ —г——— (х — MX) ___________°х________ д/1 — г2
Условное распределение У при условии, что Х=х, является нормальным с параметрами
а = М (У/х)=МУ-|-г — (х — MX)-	(4.4.28)
ах
а2=£)(У/х)=а2 (1—г2).
(4.4.29)
142
Отсюда следует, что для нормальных случайных величин X, Y Функ-Оу
иия регрессии Y на X является прямой линией у = МУ-[-г-(х — МХ),
°х
при этом условная дисперсия D(Y/x) не зависит от х и равна VtY/x^Al-r2).
Пусть Z=(X, У)— произвольный случайный вектор. В случае нелинейной связи в качестве характеристики степени рассеивания случайной величины У относительно функции регрессии используется корреляционное отношение р2/Х:
_	М[У-/у(Х)1г
Рг/х = 1---L—2	3	(4.4.30)
аг
где пу—дисперсия У; fr (х)=М (У/Х=х)—функция регрессии У на X.
Можно доказать, что дисперсию У можно представить в виде суммы среднего значения квадрата отклонения У от fY(X) и среднего квадрата отклонения случайной величины fy (X) от М У:
п2у=М (Y-fy (X)f + M (fy (X)-MY)2.	(4.4.31)
Подставляя (4.4.31) в (4.4.30), получаем еще одну формулу для вычисления корреляционного отношения:
^-M(Y-fr(X))2 Mtfy(X)-MYf
Py/x=---------2--------=--------2---------------• (4-4.32)
G у	Gy
Из (4.4.30) и (4.4.31) следует, что корреляционное отношение заключено между нулем и единицей: O^py/Jr^ 1- Из определения корреляционного отношения также вытекает, что ру/х= 1 тогда и только тогда, когда М (У — fy(X))2 = 0 и, следовательно, У—fy(X)=O, т. е. случайная величина У функционально связана с Х:У=[у(Х). Аналогично из (4.4.32) получаем, что р2/х=0 тогда и только тогда, когда fr (X)—MY, т. е. линия регрессии является горизонтальной прямой. В соответствии с (4 4.24) это может быть только тогда, когда X к Y некоррелированы.
В отличие от коэффициента корреляции корреляционное отношение рУ/х несимметрично относительно X и У, т. е. в общем случае Ру/х=/=Рх/у- Между показателями р2/х и р2/У нет
143
какой-либо простой зависимости. Можно показать, что квадрат коэффициента корреляции не превышает корреляционно-2^2 го отношения, т. е.
Для случайного вектора Х=(Хц Xi, .... Хп) используют также ряд других показателей тесноты связи совокупности случайных величин. Рассмотрим некоторые из них.
Ковариация между двумя случайными величинами X и У может вызываться тем, что существует ковариация этих величин с третьей случайной величиной Z. Чтобы найти коэффициент корреляции между X и У, «очищенный» от влияния Z, заменим X и У соответственно на Xi=X—atZ — bt и У[ = У— atZ — bi, некоррелированные с Z. Случайные величины X и У можно представить в виде X = X + Xi = a1Z + 61 -|-Xi, У= У-f-У| —OaZ-f-bz4 К|, где X=UiZ~l~bi и y=O2Z-|_ Ьг — наилучшие по критерию минимума дисперсии отклонения линейные приближения X и У соответственно, X, и некоррелированы с Z,
Л1Х1=А1У|=0, ai = pxz(cx/oz), ai=pyZ(ay/oz), bi=MX — Pxz(°x/°z)MZ,	bi=MY—pyZ(uy/uz)MZ.
Частный коэффициент корреляции pXy/z определяется формулой
cov (X,, У.)
Pxr/z= „ „	.	(4-4-33)
где
Х'=х-рхг^г-(мх-Рхг^.мгу <^ = dx|:
По формуле (4.4.23), nx,=(l-Pxz)nx. <=(1-Prz)o2y.	(4.4.34)
Воспользовавшись свойствами ковариации, преобразуем числите ть (4.4.33) Имеем
cov (Х,У1) = соу(Х- a.Z-bp У —a2Z —Ь2) =
= cov (¥—a,Z, У — a2Z) = oxOypXy — c^^zPrz —
e
4
aiaXazPxZ + ala2aZ-
144
Подставляя в последнее равенство at и а2, получаем cov(X,, У1)=(р*г PxzPyz) ах°т- (4.4.35)
Если (4 4.34) и (4.4.35) подставить в (4.4.33), то получим формулу для вычисления частного коэффициента корреляции 7 через коэффициенты корреляции случайных величин X, гХ>f Y и Z:
_ Рхт PxzPyz
PXY/Z -PxzV1-Prz
Аналогично (4.4.33) может быть определен частный коэффициент корреляции случайных величин Х|, Х2, когда учитывается влияние случайных величин Х3, Х4... Хп:
cov (Г,. Г,)
Р|’°...">
где Ei=Xi — Xi, Y2=X2—Х2, a Х1 = ,(3 J >=*= = X2.j3 nj — «наилучшие» линейные приближения Xi и Х2 случайными величинами Хз, Х4, ..., Хп, минимизирующие математическое ожидание квадрата отклонения Xi и Х2 от функций f (X) вида ао + а3Х3 + а4Х4 + ...+апХп. Коэффициенты	....
а® «наилучшего» приближения случайной величины Х(, «=1, 2, являются решением оптимизационной задачи
М
г= 1, 2.
Частный коэффициент корреляции Р,2 (з, 4,... л) может быть вычислен через коэффициенты корреляции случайных величин Х| Х2,..., Хп с помощью формулы
Р12(3. 4...п)
/?12 д/^11^22
где — алгебраическое дополнение элемента ptJ в корреляционной матрице R вектора X = (Xt, М2, .... Х„).
Характеристикой линейной связи между одной случайной величиной Х1 и совокупностью других случайных величин Х2. Хз,..., Х„ служит коэффициент множественной корреляции. Этот коэффициент широко используется в анализе линейных регрессий, и его определение приведено в гл. II. посвященной корреляционному и регрессионному анализу.
145
Задачи
4.1.	В условиях задачи 3.1 иайти среднюю длину совершаемого каждый раз рабочим перехода.
4.2.	Дискретная случайная величина X имеет равномерное распределение, Р {Х = т)= 1/11, т — 1,2,.... 11. Найти математическое ожидание X, ее среднеквадратнческое отклонение, коэфф-,, циент асимметрии и эксцесс.
4.3.	Производятся многократные испытания некоторого элемента на надежность до тех пор, пока элемент не откажет. Вероятность отказа элемента в каждом опыте равна 0,1. Выбрав в качестве модели последовательности испытаний схему Бернулли, определить математическое ожидание, дисперсию и среднеквадратическое отклонение случайной величины X —- числа произведенных испытаний.
4.4.	Контролер проверяет на соответствие стандарту п изделий. Вероятность того, что каждое из изделий будет признано годным, равна 0,9. Найти математическое ожидание и среднеквадратическое отклонение относительной частоты признанных годными изделий, если: а) п = 26: б) п = 210.
4.5.	Вероятность того, что изготовленное изделие стандартно, равна 0,9. В каждой партии 5 изделий. Найти математическое ожидание и среднеквадратнческое отклонение случайной величины X — числа партий, в каждой из которых содержатся равно 4 стандартных изделия, если изготовлено 50 партий.
4.6.	Случайная величина X, принимает только целые иеотри-
ОО
цательные значения. Доказать, что МХ = V Р{Х>А}.
k=i
4.7.	Плотность случайной величины А' равна
ах ПРИ хе(°-2)> ' I 0 при х^(0,2).
Вычислить вероятность Р {IX—AlAJ<0,5J.
4.8.	Функция распределения случайной величины X равна
р /г\=/0,25х3(х+3) при х е (0,1), w I 0 при х (0,1).
Найти MX, DX, а, и M(X2— 1).
4.9.	Случайные ошибки измерения подчинены нормальному закону со среднеквадратическим отклонением a = 2Affe. Систематические ошибки измерения отсутствуют. Произведено 9 независимых измерений. Определить среднеквадратическую ошибку среднего арифметического этих измерений и математическое ожидание числа измерений, ошибка в которых не превосходит по модулю величин 1 Мк.
4.10.	Распределение вероятностей случайной величины Z=
(X, У) определяется формулами
Р(Х = 0. У=-1|=/>(Х=0, У=1}=Р(Х=1, Г=0)=
=Р{Х=-1, У = 0)=4-. 4
Найти: 1) MX, 2) МУ, 3) по формуле полного математического ожидания М(Х/У); 4) коэффициент корреляции у; 5) Л4(Х—У); 6) Р(Х-У); 7) ЛЦХ2-У); 8) D(X2-Y). Являются ли случайные величины X и У: а) некоррелированными; б) независимыми?
Г л а в a 5
ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
В теории вероятностей и ее приложениях часто рассматриваются случайные величины, являющиеся, в свою очередь, суммами большого числа случайных величин. Непосредственное вычисление распределения вероятностей суммы большого числа случайных величии обычно связано со значительными трудностями. В то же время, как было показано в § 4.2, например, среднее арифметическое независимых одинаково распределенных случайных величии Хц Хг,Хп, имеющих математическое ожидание а и дисперсию а2, при больших п ведет себя устойчиво, имеет малое рассеяние относительно а, его дисперсия стремится к нулю при п-г-со. Таким образом, при больших значениях п можно в определенном смысле считать, что среднее арифметическое п независимых случайных величин примерно равно числу а. Математическую формулировку свойства устойчивости среднего арифметического п случайных величии дает закон больших чисел, рассматриваемый в § 5.2. Одна из форм закона больших чисел рассматривалась в гл. 3 — в теореме 3.4 (теорема Бернулли) сформулирован закон больших чисел для числа успехов в испытаниях Бернулли, точнее, для последова гельности случайных величии Х|. Хг,..., Х„, каждая из которых равна числу успехов в одном испытании.
Закон больших чисел может быть получен из неравенства П. Л. Чебышева, если это неравенство применить к случайной величине, равной отклонению среднего арифметического п случайных величии от своего математического ожидания, и перейти к пределу при п-^-оо. Неравенство Чебышева рассматривается в $ 5.1.
Теоремы, относящиеся к закону больших чисел, устанавливают условия, пр», которых среднее арифметическое случайных величии обладает свойством устойчивости В центральной предельной теореме формулируются услсвия, при выполнении которых нормированная сумма п случайных величии имеет в пределе при п->~ -* ос нормальное распределение. Центральная предельная теорема рассматривается в § 5.3.
§ 5.1. Неравенство Чебышева
Если известна дисперсия случайной величины, то с ее помощью можно оценить вероятность отклонения этой величины на заданное значение от своего математического ожида-1ч8
ния причем оценка вероятности отклонения зависит лишь от дисперсии. Соответствующею оценку вероятности дает неравенство П. Л. Чебышева.
Неравенство Чебышева является частным случаем более общего неравенства, позволяющего оценить вероятность события, состоящего в том, что случайная величина X превзойдет по модулю произвольное число />0:
(5.1.1)
В соответствии с неравенством (5.1.1) (неравенством Маркова) для любой случайной величины вероятность события {<о:|Х| не превосходит произведения частного 1/t на математическое ожидание модуля случайной величины М |Х|.
□ Доказательство неравенства (5.1.1) проведем отдельно для дискретных и непрерывных случайных величин.
Пусть X — дискретная случайная величина, Р {Х=х,}=р,, сю
i= 1, 2,.... Pi= 1. Тогда вероятность события [|Х| ^t\ рав-1=1
на сумме вероятностей pi, для которых х, находятся вне промежутка ( — t,i). Очевидно, для всех х<, не принадлежащих промежутку (— t, /), имеет место неравенство |х,|//^
1.	Учитывая это неравенство, получаем
I X, I	Г—. X,
У —	У — Р.+
i:|x.|>«	i:x“>« *	r.|x“>« 1
V l*il 1	1
+ X -7-0-7 E 1*=7ВД. i:|xfl« ‘	i=l	‘
Неравенство (5.1.1) доказано для дискретных случайных величин. Пусть теперь X — непрерывная случайная величина с плотностью вероятности р(х).
Вероятность того, что |Х| равна сумме интегралов от плотности вероятности по промежуткам (— со, —f)
| |	I X |
и (/, со). На этих промежутках—у—	1. Так как-у— р(х)^О,
Г I х|
То J —p(x)dx^O. Воспользовавшись формулой
СО
Л«|Х|= ( |х| р (х) dx, в результате преобразований получа
149
ем неравенство (5.1.1) для непрерывных случайных величин.
Р(|Х|>/}= J р (х) dx+ J р(х) dx< J j£Lpfx)dx + — со	7	— оо
5 +-^-p(x)dx< f jALp(x) dx+BpW dx + 7 I	J I	*	*
+ ^-V-P»d*=4 I |x|p(x)dx=-J-M|X|. 
J *	I J	I
— t	— oo
Событие, состоящее в том, что |X|^f, равносильно событию {Х2^/2}. Оценивая вероятность последнего неравенства с помощью неравенства А. А. Маркова (5.1.1), получаем оценку вероятности события |Х| через второй начальный момент М (X2):
Р[|Х|>/) = Р[Х2><2}<-1-Л[(Х2).	(5.1.2)
Применяя неравенство (5.1.2) к случайной величине, равной отклонению случайной величины X от своего среднего значения Л1Х, получаем оценку вероятности события (|Х — —МХ| /) через дисперсию DX:
Р [|X-ЛГХ|	(Х-МХ)2=Д- DX (5.1.3)
Г	г
Неравенства (5.1.2) и (5.1.3) впервые были получены русским математиком конца XIX в. П. Л. Чебышевым. Неравенство (5.1.3) называется неравенством Чебышева.
Неравенство Чебышева справедливо для любых случайных величин, имеющих дисперсию; оценка вероятности в нем не зависит от закона распределения случайной величины X.
Положив t=3ax, оценим вероятность отклонения случайной величины X от своего среднего MX на величину, превышающую утроенное среднеквадратическое отклонение случайной величины:
P{|X-AfX| >3ox}<-L-dx=4-
Таким образом, вероятность отклонения любой случайной величины от своего математического ожидания на величину, превышающую Зах, не больше 1/9. Напомним, что для нормального закона эта вероятность равна 0,0027.
150
Рассмотрим два следствия неравенства Чебышева, используемые как при доказательстве закона больших чисел, так и непосредственно для оценки вероятности отклонения от нуля случайной величины |Х—Л1Х| на заданное значение t.
Следствие 1. Для любых ОО
Р {|X-МХ\ </}> I-V DX.
Г
(5 1.4)
□ Перейдя к событию, противоположному событию
____МХ\<$, и воспользовавшись затем неравенством Чебышева, получаем
Р {|X-МХ\</)= 1 -Р (|Х—Л1Х| >/}> 1 ~-L Dx. 
Следствие 2. Если Xi, Хг, —, Х„ — независимые случайные величины, то для любого е>0
Р (I — У х;-— у AIX-1 <Д> | п 1 п	I
I	1 = 1	* = 1	I
I DX, -|- DX2 + — + DX
> 1-----------—---- -	-----	(5.1.5)
пе2	п
Неравенство (5.1.5) дает оценку снизу для вероятности отклонения среднего арифметического независимых случайных величин от своего математического ожидания. Эта оценка отличается от единицы на величину произведения средне-
1 V*	1
го арифметического дисперсий— ) DX, на число ——. Ес-п	пе2
ли среднее арифметическое дисперсий ограничено, то при фиксированном е>0 и п->оо эта оценка стремится к единице. На основе неравенства (5.1.5) доказывается закон больших чисел
□ Для доказательства (5.1.5) рассмотрим случайную величину У, равную среднему арифметическому п независимых случайных величин Xi, Хг, ..., Х„. Воспользовавшись свойствами математического ожидания и дисперсии, получаем
MY=M
/ 1 "	\	1 п
I — у хД=— у мхл \п & J
ЛУ=Й
151
Применяя к случайной величине У неравенство (5.1.4) получаем
= Р {| У -МУ | < е}> 1 L DX=
1 DX} + DX2 + -.. + DX„ пе2	п
5.2. Закон больших чисел
Теоремы, относящиеся к «закону больших чисел», устанавливают условия сходимости среднего арифметического п случайных величин к среднему арифметическому их математических ожиданий.
Будем говорить, что последовательность случайных величин Xi, Хг, .... Х„,... сходится по вероятности к числу Ь, если при п-*-со для любого е>0:
Р ||Х„-Ь\<е}^1.	(5.2.1)
Таким образом, закон больших чисел устанавливает условия сходимости по вероятности среднего арифметического п случайных величин к своему математическому ожиданию.
Как известно, дисперсия среднего арифметического п независимых одинаково распределенных случайных величин при п-»-со стремится к нулю. Дисперсия характеризует степень рассеивания случайной величины относительно математического ожидания, и, таким образом, степень рассеивания среднего арифметического п независимых одинаково распределенных случайных величин стремится к нулю при п->со. Тогда в соответствии с (5.1.5) для любого е>0 нижняя оценка вероятности отклонения среднего арифметического случайных величин от своего среднего на величину, меньшую е, в этом случае стремится к единице. Вероятность любого события не может быть больше 1, поэтому и сама вероятность отклонения стремится к 1 при п->оо для любых е>0.
Закон больших чисел справедлив и в более общем случае, когда рассматривается среднее арифметическое п независимых случайных величин с равномерно ограниченной дисперсией. Условия сходимости вероятности отклонения к единице устанавливает в этом случае закон больших чисел в форме Чебышева.
152
Теорема 5.1 (закон больших чисел в форме Чебышева) Пусть Xi, .... Хп, ... — последовательность независимых случайных величин, дисперсии которых ограничены сверху одним и тем же числом с: DX.^c, i= 1, 2.Тогда для любо-
го е;>0
lim pfl— V X,-— У ЛМ,| <Д= 1.
1 п	п	|
DXl + DX2 + ... + DXn то-------------------
□ Так как DX,^c. i= 1, Ч, . п
^.с. Воспользовавшись следствием из неравенства Чебышева
(5.1.5), получаем
п
DX,
пе2 п	пе2
(5.2.2)
и так как вероятность любого события не превышает 1, то
Переходя в полученном неравенстве к пределу при п->оо. получаем утверждение теоремы. 
Из доказанной теоремы непосредственно вытекает справедливость закона больших чисел для среднего арифметического независимых случайных величин с конечной дисперсией, имеющих одинаковое распределение вероятностей.
Теорема 5.2 (закон больших чисел для одинаково распределенных случайных величин с конечной дисперсией). Если Xi.... Х„, ... — последовательность попарно независи-
мых одинаково распределенных случайных величин с математическим ожиданием а и дисперсией о2, то для любого е>0
□ Заметим, что — У MXi=—na = a, дисперсии случайных величин Xi равны одному и тому же числу о2 и, следо
153
вательно, ограничены. Воспользовавшись законом больших чисел в форме Чебышева, получаем утверждение теоремы
Данную теорему можно также доказать непосредственно воспользовавшись следствием (5.1.5) из неравенства Чебышева и перейдя к пределу при п-*оо:
п
(5.2.3)
Закон больших чисел справедлив для независимых случайных величин с одинаковым математическим ожиданием и ограниченной дисперсией. В этом случае условия теоремы 5 1 также выполняются. Неравенство (5.2.2) в этом случае принимает вид
(5.2.4)
Закон больших чисел для независимых случайных величин с одинаковым математическим ожиданием отражает сходимость среднего арифметического случайных величин в сериях независимых испытаний к общему математическому ожиданию этих случайных величин. Он имеет многочисленные практические приложения. Пусть, например, производится п независимых измерений некоторой величины, истинное значение которой равно а. Результат каждого измерения является случайной величиной X,. Если измерения выполняются без систематической погрешности, то математическое ожидание случайных величин X, можно считать равным истинному значению измеряемой величины, МХ,=а, »=1, 2,.... Диспер сию результатов измеоений часто можно считать ограниченной некоторым числом с. Тогда случайные результаты измерений удовпетворяют условиям теоремы 5.1 и, следовательно, среднее арифметическое п измерений при большом числе измерений практически не может сильно отличаться от истинного значения измеряемой величины а Этим обосновывается выбор среднего арифметическою измерений в качестве истинного значения измеряемой величины. Нижнюю оценку вероятности отклонения среднего арифметического измерений от истинного значения измеряемой величины а при конкретных значениях п и е можно получить с помощью неравенств (5 2.3) или (5.2.4). С помощью этих неравенств можно также определить, сколько необходимо произвести измерений, чтобы
154
погрешность измерения с заданной вероятностью не превышала заданного значения е.
Закон больших чисел для числа успехов в испытаниях Бернулли называют теоремой Бернулли:
lim Р 11 ——р | < el = 1,	(5.2.5)
где И" — число успехов в п испытаниях Бернулли, р — вероятность успеха.
Если представить р„ в виде суммы альтернативных слу-п
чайных величин Н„= £ X<t где X/ — число успехов в i-м ис-пытании, причем MXt = p, DXi=pq, то оказываются выполненными условия теоремы 5.2 н, следовательно, имеет место (5.2.5).
Следствие (5.1.5) из неравенства Чебышева для случайных величин р.„ принимает вид
^(1—-р|	<5-2-6)
Vя J пе
В § 3.2 теорема Бернулли была получена как следствие интегральной теоремы Муавра—Лапласа. Теорема Бернулли отражает свойство статистической устойчивости относительной частоты числа успехов в испытаниях Бернулли. Нижнюю оценку вероятности отклонения от р относительной частоты при заданиях е и п дает неравенство (5.2.6). При больших и эту вероятность можно определить по формуле (3.2.6).
Если р.„ — число успехов в п независимых испытаниях, в каждом из которых успех появляется с вероятностью pt,i = 1,2,..., то для произвольного е>0
I- п(1	Р1+Р2 + —+рл 1^-1 ,
lim Р J--------------------< е } = 1.
Л— оо 1 tl	П	J
Закон больших чисел в этом случае называют теоремой Пуассона.
О Пример 5.1. Определить, сколько надо произвести замеров поперечного сечения деревьев на большом участке, чтобы средний диаметр деревьев отличался от истинного значения п не более чем на 2 см с вероятностью, не меньшей 0,95. Предполагается известным, что среднеквадратнческое отклонение поперечного сечеиия деревьев не превышает 10 см и измерения производятся без погрешности.
Будем считать выбор деревьев для замеров таким, что можно считать результаты измерений независнмымн случайными величинами. Обозначим через X,- результат измерения поперечного сечения i-ro дерева. По условию,	10, и, следовательно, 0X^100.
155
Полагая в неравенстве (5 2 4) е = 2, с=100, получаем
откуда п 500. Итак, в данном случае достаточно выполнить 500 замеров диаметра поперечного сечения деревьев, ф
Закон больших чисел справедлив и для независимых одн-наково распределенных случайных величин с конечным математическим ожиданием, но не имеющих дисперсию. Соответствующая теорема была получена советским математиком А. Я. Хинчиным. Закон больших чисел для зависимых случайных величин был получен А. А. Марковым. Согласно теореме Маркова, закон больших чисел справедлив для последовательности зависимых случайных величин Хц Хг, ..., если
Теорема Маркова непосредственно вытекает из неравенства (5.1.5).
§ 5.3. Центральная предельная теорема
Рассмотрим после ховательносто независимых случайных величин Xi, Хг...Х„ .... Пусть а,= Л4Х„ о?= DX,2, i= 1, 2 ....
Образуем последовательность Ул, п = 1,2..нормированных
сумм случайных величин:
Согласно нейтральной предельной теореме, при достаточно общих предположениях о законах распределения случайных величин Xi, Хг,.... Хл,... последовательность функций распределения нормированных случайных величин Y„ при п со сходится для любых х к функции распределения Ф (х) нормированной нормальной случайной величины Напомним, что в таких случаях говорят, что последовательность случайных величин Уь Уг,... асимптотически нормальна.
Интегральная теорема Муавра—Лапласа (теорема 3.3)
156
является центральной предельной теоремой для последовательности независимых одинаково распределенных случайных величин, принимающих два значения: 0 — с вероятностью и 1 — с вероятностью р.
Действительно, согласно этой теореме, при п->оо
где Ил— число успехов в п испытаниях Бернулли с вероятностью успеха в единичном испытании р; q=\—p\ <р(х) =
I	О	49
=.____е — плотность распределения нормальной слу-
дДл
чайной величины с параметрами (0, 1); Ф (х) — соответствующая функция распределения. Представим р„, Afp.,, и в следующем виде:
п	п	п
Нл=£х.. Мц„ = пр= £ МХ= £ ait
i=i	i=l	i=l
п
Dn„ = npq= £ а?,
где Xi — число успехов в i-м испытании Бернулли. Теорему Муавра — Лапласа можно теперь сформулировать следующим образом.
Пусть Xi, Хг,.... Х„,...— независимые случайные величины, принимающие два значения: 1 с вероятностью р и 0 с вероятностью <7=1 —р. Тогда при п-»-оо для любых х(— оо < <х< оо)
Утверждение (5.3.2) имеет место для случайных величин с произвольным законом распределения, числовые характеристики которого удовлетворяют определенным условиям. Условия сходимости функций распределения случайных величин Уц для независимых случайных величин Х2, Х3,.... имеющих различные распределения, дает теорема 5.3.
157
Теорема 5.3 (центральная предельная теорема).
Пусть Xi, Xi...Хп,...— независимые случайные величины,
имеющие конечный третий абсолютный момент. Положим
си = МХи al=DXi, с?=М |Х,-—аН3, * = 1,2, ... Тогда если
lim
Я-*-оо
д/с? + с|+ +cf ~\lo2l+Oi+ ... +Ол
(5.3.3)
то при п-+оо для любых х(—оо<х<оо) имеет место (5.3.2).
По теореме 5.3 достаточным условием асимптотической
нормальности последовательности случайных величин
=(Ь.-Ь)/д/Ь’
если Xi, Xi,..., Хп, ... независимы.
является условие
(5.3.3),
Из теоремы 5.3 можно получить следующее утверждение: если независимые случайные величины Xi, Xi, ..., ХП,... име-
ют одинаковое распределение и если существует их третий абсолютный момент, то при п->оо для любых х
п

где a = MXi, a2=DXj, i=l,2,....
Чтобы убедиться в этом, достаточно показать справедливость условия (5.3.3) в данном случае. Пусть Xi, Xi,.... Хп,...— независимые одинаково распределенные случайные величины, а = МХ,, o2=DX,, с3 = М |х,-—а|3. Тогда
Поскольку (5.3.3) выполняется, по теореме 5.3 выполняется п	п
утверждение (5.3.2), и так как У а, = па, У о2 = по2 то
<=i	i=i
имеет место (5.3.4).
Если случайные величины Xi, Xi,..., Хп, ... имеют одинаковое распределение, то условия теоремы 5.3 могут быть ослаблены. В этом случае для выполнения (5.3.4) достаточно существования дисперсий случайных величин X,-, а третий
158
абсолютный момент при этом может и не существовать . е соответствующая сумма или интеграл могут быть расходящимися). Приведем центральную предельную теорему для одинаково распределенных случайных величин (без доказательства).
Теорема 5.4. Пусть Xi, Хг,.... Хп — независимые оди-
наково распределенные случайные величины, имеющие конечную дисперсию a2 — DXit и пусть a = MXi, i= 1,2,.... Тогда при п-*-°о для любых х(— оо<х<оо) имеет место (5.3.4), формула (5.3.4) позволяет при больших п вычислять с помощью нормального приближения вероятности различных событий, связанных с суммой п независимых одинаково распределенных случайных величин. В условиях теоремы
5.4.	найдем вероятность того, что
b<Y.X^l i=l
л
Перейдем от случайной величины Х( к нормированной
;=|
случайной величине и применим теорему 5.4. Имеем
где ф (х)=——= ( е —функция распределения
-\2п _Joo
нормальной случайной величины с параметрами (0, 1).
Решение вопроса, при каких значениях п рекомендуется использовать нормальное приближение, а при каких п — нет, зависит от требуемой точности вычисления вероятности. Часто центральную предельную теорему используют, если п>10.
Условие сходимости распределения вероятностей суммы случайных величин к нормальному закону на практике часто выполняется. Этим объясняется частая встречаемость нормального распределения. Например, при измерении некоторого параметра погрешность измерения может складываться из большого числа случайных слагаемых, законы распределения которых неизвестны. Согласно центральной предельной теореме, суммарная погрешность измерения имеет закон распре
159
деления, близкий к нормальному. Поэтому при измерениях очень часто исходят из того, что погрешность измерения имеет нормальное распределение Некоторые показатели в экономике также представляют собой сумму большого числа слагаемых, каждое из которых имеет малый вклад в суммарный показатель. В этом случае исследуемый показатель имеет примерно нормальное распределение.
Пример 5.2. В цехе изготавливают шарики для подшипников. Каждый шарик должен иметь диаметр d, однако в силу ряда причин, неизбежных в условиях массового производства, фактический диаметр несколько отличается от d. По техническим условиям среднее по модулю отклонение диаметра шарика от номинала d не должно превышать величины 6 = 0,008 мм. Каждый шарик проходит контроль: если его диаметр оказывается вне отрезка [d —0,02; d -f-0,02], то шарик бракуется. Если в партии из и = 10 000 шариков обнаружено более 500 бракованных, то оборудование останавливается для регулировки. Найти вероятность «ложной» остановки, в то время как среднее отклонение шарика от номинала не превышает заданной величины 6, а повышенный брак оказался случайным.
Обозначим через X отклонение фактического диаметра i-ro шарика от номинала d. Так как отклонение диаметра шарика от номинала складывается из суммы отклонений по разным причинам в соответствии с центральной предельной теоремой, будем считать отклонение диаметра шарика X,- нормальной случайной величиной со средним 0 н средним по модулю отклонением 6 = 0,008, 1=1,2, ..., 10 000
Найдем вероятность р того, что i-й шарнк окажется бракованным. Шарик будет забракован, если значение его диаметра окажется вне отрезка )d— 0,02; d-|-0,02) а это имеет место, если X, примет значение вне отрезка I—0,02; 0,02]. Перейдя от случайной величины Х, ~Л/(0, а) к нормированной случайной величине (с параметрами (0,1)) и воспользовавшись формулой (3.2.3), получаем
г = р (| X. | > 0,02) = 1 — Р (— 0,02 < X,- С 0.02)=
По условию известен средний модуль отклонения М |Х,| = 6 = = 0,008. Определим из этого условия о. Так как Х, ~/У(0, о), то ее плотность распределения р (Г) — четная функция, тогда н функция |1| р (1) также четная и, следовательно.
ОО	ОО
$ UI P(t)dt = 2 t tp(t)dt.
— со	0
160
Имеем
0,008-ЛГ |Х(| = J 1Л р (fl d/=2 {//>(/)<!/ =
откуда о = 0,008 д/л/2. Вероятность изготовления бракованного шарика
„=2-2©/-^ =2 (1 — Ф (1,99))=2 (1 —0,9767)=0,0466.
Г \ ° /
Считая независимыми события, состоящие в том, что очередной шарик окажется бракованным, применим схему Бернулли. Будем считать ^успехом» изготовление бракованного шарика. «Ложная тревога» наступит, если в п=10 000 испытаниях Бернулли с вероятностью успеха р = 0,0466 число успехов ц„>500. Для вычисления вероятности «ложной тревоги» воспользуемся интегральной теоремой Муавра — Лапласа:
Р ).,><«).!-<	1-Р	}-
( и —пр	)
= 1 Р J ."	< 1,611 -Ф (1,6I)= I-0,946=0,054.
( VW	J
Вероятности «ложной» остановки оборудования равна 0,054. В соответствии с законом больших чисел при массовом производстве число «ложных» остановок исправного оборудования составит примерно 5,4 % от общего числа изготовленных партий, ф
Задачи
5.1.	Случайная величина X имеет нормальное распределение с параметрами (а, о). Оцените по неравенству Чебышева Р (IX — —а| ^2о). Сравните с точным значением этой вероятности.
5.2.	Закон распределения случайной величины X определяется формулами
2	2
Р(Х=0)=1-° Р(Х=-Д|=Р(Х = Д)=-^—.
Д2	2Д2
Сравните точное значение вероятности />(|Х|>Д) с оценкой, полученной по неравенству Чебышева.
5.3.	Предполагается провести 10 измерений Х<, Хг.Хю
неизвестной величины а. Считая X,, Хг, .... Хю независимыми
6 В. А. Колемаев и др.
161
нормально распределенными сл’чайными величинами с MXt!=a DA* = 0,0I, нантн Д, если
10’ чисел, каждое из которых Предполагая, что погрешности равномерно распределены в
найдите пределы, в которых с
округлено от округ, интервале
вероятно-
Оцените Д, используя неравенство Чебышева. Сравните полученные результаты.
5.4. Складывается с точностью до 10-". лення независимы и (----- 10“т, — 10т\
\ 2 2 /
стью. не меньшей 0,99, находится суммарная ошибка. Найдите также оценку этих пределов, используя неравенство Чебышева Сравните полученные результаты.
5.5. На заводе произведено 10 000 однотипных деталей. Вероятность того, что наудачу взятое изделие высшего качества, равна 0,75. Определите с помощью интегральной теоремы Муавра — Лапласа вероятность того, что фактическое число деталей отличного качества отклонится от своего математического ожидания не более чем на 100 деталей. Получите оценку этой вероятности с помощью неравенства Чебышева. Сравните полученные результаты.
5.6. Дисперсия каждой из 1800 независимых случайных величин не превышает 4. Оцените вероятность того, что отклонение средней арифметической этих случайных величин от средней арифметической их математических ожиданий не превысит по абсолютной величине 0,2.
Глава 6
ВВЕДЕНИЕ В ТЕОРИЮ СЛУЧАЙНЫХ ПРОЦЕССОВ
В предыдущих главах изучались в основном отдельные случайные величины. На практике явления протекают во времени и пространстве, поэтому приходится иметь дело не с отдельными случайными величинами, а с семейством случайных величин, зависящих от параметра. Именно такая схема рассматривается в настоящей глгве.
§ 6.1.	Определение случайных процессов
Под случайными процессами обычно подразумевают случайные величины, изменяющиеся в зависимости от времени или какого-либо другого параметра. Например, при малых временных интервалах плодородие почвы — функция пространственных координат; прн интервалах времени, измеряемых десятками, сотнями, тысячами лет, нужно еще учитывать зависимость от времени.
Приведем еще один пример. Количество рождающихся детей на каждую тысячу человек населения данного региона хотя и измеряется статистическими органами ежегодно, но от времени оно зависит относительно. Рождаемость — это функция возрастной структуры населения и других условий, в первую очередь, планирования числа детей в семье. Рождаемость зависит также от традиций и многих других факторов, а от времени она зависит лишь постольку, поскольку все факторы, влияющие на рождаемость, развиваются во времени.
Определение 6.1. Случайным процессом называется семейство случайных величин X (t)=Xt (<в), /еГ, заданных на вероятностном прос транстве {й, S, Р}, где Т — некоторое множество значений параметра.
Параметр t обычно интерпретируют как время. Функцию времени Х((<в0) при фиксированном элементарном событии Моей называют реализацией (траекторией) случайного процесса. Если фиксировать значение времени to, то Xt (<в) — обычная случайная величина.
6*
163
Если параметр t принимает дискретные значения (обычно /=0,1,2,...), то X (/) — процесс с дискретным временем (случайная последовательность), если же t изменяется на некотором интервале, то X (/) — процесс с непрерывным временем.
В свою очередь, если случайные величины семейства принимают дискретные значения, то имеет место процесс с дискретными значениями, если же непрерывные то с непрерывными значениями.
Так как речь идет о семействе случайных величии, то их взаимозависимость может быть охарактеризована только многомерными распределениями.
Определение 6.2. Случайный процесс считается заданным, если для любого набора	— <tn, ti^T, ука-
зано многомерное распределение
....«„ (^.*2. -.*з)=
=Р {X (/()<xiX (t2)<x2...X (tn)<xn),	(6.1.1)
причем эти распределения согласованы между собой, т. е. при п' <п
Ftvt2..».,(*!• *2. ...,х„0=
= Л1,<2..Ia *2- Хп'< +	+ °°)-
Определение 6.3. Случайный процесс X (/) называется процессом с независимыми значениями, если для любого набора 0^/|</г.. <ztn, tt^T, случайные величины X(h), X (t2).X (tn) независимы.
Многомерные распределения случайного процесса с независимыми значениями целиком определяются одномерными распределениями, так как
Ftt,t2.,SXl< Xs' X’^=F‘I	^2 (х^	^X^'
Определение 6.4. Математическим ожиданием случайного процесса X (t) называется неслучайная функция а (/)= =МХ (/), значение которой при фиксированном значении t = = to равно математическому ожиданию случайной величины Х(М.
Математическое ожидание a(t) представляет собой некоторую среднюю функцию, около которой группируются реализации случайного процесса. Иногда математическое ожидание обозначают m(t).
Определение 6.5. Дисперсией случайного процесса X(t) называется неслучайная функция o2(t) = DX(t)=M[X(t)—с(/)]2.
164
значение которой при фиксированном значении t=to равно дисперсии случайной величины X(t0).
Дисперсия характеризует рассеяние реализаций случайного процесса относительно среднего течения случайного процесса, т. е. относительно а (/).
И математическое ожидание, и дисперсия случайного процесса определяются по его одномерным распределениям, поэтому не дают никакого представления о взаимозависимости случайных величин, образующих случайный процесс.
Определение 6.6. Корреляционной (автокорреляционной) функцией случайного процесса X (t) называется неслучайная функция
В (t, s)=cov[X (/), X [s)]=M [X (0-а (/)) (X (s)-a (s))],
значение которой при фиксированных значениях t=to, s = so равно коэффициенту ковариации двух случайных величин Х('о). X(s0) при t = s Bit, s) = c2(Z).
Нормированная корреляционная функция
Р ('. s)
В (t, s) О (0 о (s)
характеризует степень зависимости случайных величии в моменты времени t и s. Правильнее было бы назвать функцию В (/, s) ковариационной, а функцию р (/, s) — корреляционной. Для процессов с независимыми значениями В (t, s)=0, а следовательно, и р (/, s)=0.
Важным классом процессов, для которого a(t) и В (/, s) полностью определяют многомерные распределения, является гауссовский процесс, многомерное распределение значений которого в моменты	<tn, heT, задается следую-
щей функцией распределения:
tn (•*!• х2>
_____!____х
(глГ^ТГвГ
ехр1—аУ в '(*—«)
dxb ..., dxn.
где
(6.1.3)
a(/t)4
, В = ||В И, i,/= 1, 2,..., и,
(U/
1®1 определитель матрицы В.
1Г5
Определение 6.7. Случайный процесс X (/) называется стационарным (в узком смысле), если его многомерные распределения инвариантны относительно сдвига, т. е. для любого s
^1,+s. ;2 + s <n + s	x2< >xn) =
= t2....fn(xOX2....Xn)-	(6.1.4)
Определение 6.8. Случайный процесс с непрерывным временем называется стационарным в широком смысле, если a (/)=a = const, a2 (/)=<j2 = const,
B(/,s) = B(s-0, s>/.	(6.1.5)
Стационарный в узком смысле процесс является стационарным в широком смысле, но не наоборот. Для гауссовских процессов многомерные распределения целиком определяются функциями а (/) и В (t, s). Поэтому для таких процессов понятия стационарности в узком смысле и в широком смысле эквивалентны.
§ 6.2.	Цепи Маркова
Рассмотрим случайные процессы с дискретным временем и дискретным конечным множеством значений — состояний Si, S2,..., Sm, в которых находится элемент (или частица) процесса.
Например, каждый работник предприятия в любой рабочий день может находиться в одном из следующих состояний: Si — работает, S2— в командировке, S3—в отпуске, S4 — болен. Как видим, состояния могут быть не обязательно числовыми.
Состояния студентов на начало учебного года могут быть определены, например, так: Si — первокурсник, S2— второкурсник, S3 — третьекурсник, S4 — четверокурсник, S5 — выпускник, Se — окончил, S? — выбыл В качестве единицы времени в данном случае естественно рассматривать год.
В данной главе рассматриваются случайные процессы X (/), в которых X (/) принимает значение того состояния, в котором процесс (т. е. его элемент) находится в момент t- Рассмотрим моменты В, /2,...,	... ; как и ранее, Xt=X (t)
и X, принимает значения Si, S2...Sm-
Простейшим обобщением процесса с независимыми значениями является марковский процесс, для которого
Р (Xi=xi\Xl=xl, Х2=х2, ..., Xi_1=xi_I)=
=Р(Х,.=х/|Х(_|=х/_1),	(6.2.1)
166
е вероятность попасть в состояние Xi=Sj в момент tt зависит не от всего прошлого, а лишь от состояния Xi-i = Si, котором процесс был в предыдущий момент времени t.-i.
Если обозначить Р (X (/,) = S,I(Л—i) = S,-1 =рц, то получим матрицу Р с элементами ру. Матрица Р размера называется матрицей вероятностей перехода, поскольку ее элементы — вероятности переходов из состояния i в состояние /.
Далее будем рассматривать марковские процессы, для которых разности смежных моментов наблюдения — равны постоянному числу (шагу для простоты принимаемому в качестве единицы времени) и все возможные состояния перечислены. Такие марковские процессы называют цепями Маркова.
Марковские цепи называются однородными по времени, если вероятности перехода за единицу времени не зависят от того, где на оси времени происходит переход.
Рассмотрим примеры цепей Маркова с конечным множеством состояний.
• Пример 6.1. Множество состояний студентов некоторого вуза с пятнлетннм сроком обучения следующее: Si — первокурсник, S2 — второкурсник,.... Ss — выпускник. Студенты могут выбывать из вуза в результате отчисления и его окончания, поэтому дополним систему следующими состояниями: Se — специалисты, окончившие вуз, и S? — лица, обучавшиеся в данном вузе, но не окончившие его.
Для множества учащихся вуза теперь все возможные состояния перечислены. Составим матрицу переходов из состояния в состояние, предполагая, что исключенные не могут быть восстановлены.
Из состояния Si (первокурсник) за год возможны переходы в следующие состояния: S2 (второкурсник). Si (остаться на 1 курсе) и, наконец, переход в состояние S? (выбыло из вуза). Остальные переходы считаем невозможными. Поэтому первая строка матрицы состоит из трех положительных чисел: pt — вероятность выбыть из института, л — переход на II курс и — остаться на I курсе. Итак, Ри = <7ь pi2=n, pi? = pi (<?i+pi+ri = l); остальные вероятности перехода равны 0.
Для второкурсника (состояние S2) возможны переходы в состояния ST, St н S3 с вероятностями р2з = Лг, Р22 = <?2, р2?=рг (р2 + <?г + + г2=1). Аналогично вводятся вероятности перехода для состояний S3, S< и т. д.
Поэтому матрица вероятностен переходов имеет следующий вид:
	/<?1	г2	0	0	0	0	Р1\
	' 0	<?2	rl	0	0	0	₽2 \
	0	0		г3	0	0	Рз 1
р = |	0	0	0	?4	Г4	0	Р4 •	(6.2.2)
	0	0	0	0		г5	р5 1
	1 0	0	0	0	0	1	0 /
	\ 0	0	0	0	0	0	1 /
167
О Пример 6.2. Для многих экономических задач (энергетики мелиорации и т. д.) необходимо знать чередование годов с определенными значениями годовых стиков рек. Конечно, это чередование не может быть определено абсолютно точно. Для определения вероятностей чередования (перехода) разделим стоки (элементы процесса) введя четыре градации (состояния): первую, вторую, третью и четвертую. В результате накопления влаги (в земле, водохранилищах н т. д.) будем для определенности считать, что за первой градацией (самый низкий сток) никогда ие следует четвертая (самый высокий сток), а за четвертой — первая. Допустим, что остальные переходы возможны и:
из первой градации можно попасть в каждую из средних градаций вдвое чаще, чем опять в первую. Следовательно, вероятности переходов из первой градаций соответственно равны рц=0,2, р12= 0,4, р|з = 0,4, рн = 0;
из четвертой градации переходы во вторую и третью градации бывают в четыре и пять раз чаще, чем возвращение в четвертую градацию, поэтому ро=0, р<2=0,4, р4з = 0,5, р44 = 0,1;
нз второй градации переход в другие градации может быть только реже: в первую — в два раза, в третью — на 25 %, в четвертую — в четыре раза, чем переход во вторую, следовательно, р2| =0,2, Р22=0,4, р2з = 0,3, р24 = 0,1;
из третьей градации переход во вторую градацию столь же вероятен, как и возвращение в третью градацию, а переходы в первую и четвертую градации бывают в четыре разг реже, поэтому: р31 =0,1, Рз2 = 0,4, Рзэ = 0,4, р34 = 0-1
Таким образом, матрица вероятностей переходов для стоков реки такова:
(0,2	0.4	0,4	0	х
0,2	0,4	0,3	0,1	\
0.1	0,4	0,4	0.1	I
0	0.4	0,5	0,1	/
(6.2.3)
Е примерах 6.1 и 6.2 получены две матрицы вероятностей переходов из одного состояния в другое: в первом примере семь состояний, а во втором — четыре. Если цепь Маркова имеет т состояний, то ее строки представляют собой т рас-предепений вероятностей. Для однородных цепей Маркова матрицы вероятностей переходов не зависят от времени. Для краткости матрицы Р называют просто матрицами переходов или переходными матрицами.
Переходные матрицы обладают следующим свойством: все их элементы неотрицательны, и суммы по строкам равны единице. Иногда матрицы с таким свойством называют стохастическими. Матрицы переходов позволяют вычислить вероятность любой траектории элемента случайного процесса, представляющего собой цепь Маркова, с помощью соотношений (6.1.1) и (6 2 1) (см. задачи 6.2, 6.3).
168
§ 6.3.	Характеристики цепей Маркова
При изучении цепей Маркова наибольший интерес представляют следующие величины: вероятности перехода за t шагов среднее время пребывания в определенном состоянии и др.
Вероятности перехода между состояниями за t шагов
Обозначим вероятности переходов за t шагов из Si в $/ через р,,(0. а матрицу перехода с элементами pit (t) для t= _ 1, 2, 3 — через Р (/)• Для t= 1 вероятность _р„ (1)=р,7 и матрица Р(1) = Р Рассмотрим момент времени s, l<s</, и какое-либо состояние S,-. Вероятность перехода из состояния Si в состояние S,- за время t отлична от 0, если возможен переход из S в Si за время s, т. е. pi,(s)>0, и возможен переход из Si в S/ за оставшееся время (t — s>0), т. е. pn(t — s)>0 для какого-либо /. Таким образом, вероятность перехода из состояния Si в состояние S/ через состояние S/ равна ри (s) Pu Для получения вероятности перехода из S,- в S/ в соответствии с формулой полной вероятности следует просуммировать такие произведения вероятностей по всем промежуточным состояниям I. Имеем
m
рц^=^рирц^-^	(6.3.1)
Соотношение (6 3.1) для всех /= 1, 2,..., m можно представить как произведение матриц:
P(/)=P(s)P(f — s).	(6.3.2)
В результате имеем Р (2)=Р (1) Р (1)=Р2, далее получаем Р(3)=Р(2)Р(1)=Р(1)Р(2)=Р3 и т. д. Итак,
Р (/)=Р (1) Р (/- 1)=Р (/-1) Р (1)=Р'.
что дает возможность найти вероятности перехода между состояниями за любое число шагов зиая матрицу переходов за один ша.\
2. Распределение по состояниям на шаге i—^oo
Зная матрицу перехода за t шагов и начальное положение, можно найти вероятность находиться иа шаге t в состоянии S;. Обозначим через е,- вектор-строку, состоящую из нулей и единицы, которая находится на i-м месте, Si — начальное состояние процесса. Из соотношения (6.3.2), заменяя при $= 1 р (1) на е,Р и t — s на t—1, получаем для каждого
169
i в матричной форме соотношение
e.P(/-l)P=eiP(0=*iP',	(6.3.3)
которое определяет вектор	рт (/)), т. е. распреде-
ление цепи Маркова по состояниям S,- через t шагов после выхода из состояния S,-. Установим, будет ли р/ (!) с ростом t зависеть от начального состояния или нет.
Обозначим вектор из элементов р,(/) через p(f)= (Pi (0. Р2 (0.Рт (0)-
Теорема 6.1. Если для некоторого t все элементы матрицы Р* положительны, то вероятность находиться в состоянии S) для цепи Маркова при /—»-оо не зависит от начального состояния Sj и удовлетворяет уравнению р=рР где р — вектор-строка с неотрицательными элементами (т	х
I ₽i=1)
□ Остановимся на основных моментах доказательства.
Из соотношения (6.3.3) имеем
р(/)=е,Р( = е,.Р'-1Р=р(1-1)Р.
Если бы было известно, что вектор р (/) с ростом i стремится к пределу р, то этот предел удовлетворял бы уравнению
рР=р.	(6.3.4)
Остается только показать, что для цепи р (t) стремится к пределу. Tai.oe доказательство приводится, например, в (11 ]. 
Вектор р называют предельным распределением. Смысл предельного распределения состоит в следующем. При Л-»-оо цепь Маркова входит в устойчивый режим, который характеризуется следующими свойствами (Т — достаточно большое времяV
а)	среднее время пребывания в состоянии S/ равно PjT;
б)	среднее время возвращения в состояние S,- равно 1/Pi-
Cl Пример 6.3. Найдем среднее время между засухами и полноводными годами для стоков рек, описанных в примере 6.2.
Для этого нужно найти предельное распределение для цепи Маркова (см. задачу 6.4) с матрицей вероятностен перехода (6.2.3) Засушливые и дождливые годы, как правило, не повторяются, поэтому рн=р4|=0. Легко проверить, что все элементы матрицы Р2 положительны. Периодичность возвращения в состояние S, равна 1/Р«> а предельные вероятности засушливых и дождливых лет равны 0,15 и 0,08 (см. пример 6.4), следовательно, периодичность засушливых лет в среднем равна 6—7 лет, а дождливых— 12—13 лет. ф
170
Выводы теоремы 6.1 неверны при нарушении ее условий.
О Пример 6.4. Рассмотрим матрицу переходов
/О 1 0\ Р=(0 0 11.
\1 О о/
Легко проверить, что
/О 0 1\	/10 0\
Р2 = ( 1 О О I и Р3 = ( 0 10).
\0 1 0/	\0 0 1 /
Поэтому Р4 = Р, Р5 = Р2, Р® = Р3 и т. д. Следовательно, для любого 1 в матрице р имеются нулевые элементы и условия теоремы 6.1 не выполнены. Однако вектор р=(1/3, 1/3, 1/3) удовлетворяет уравнению р = рР, что проверяется непосредственной подстановкой. Таким образом, при /->оо предел для вероятностей р, (!) не существует и для произвольно большого t любое состояние S, точно определяется начальным, ф
3. Среднее время пребывания
До сих пор рассматривались цепи Маркова, в которых из любого состояния S; возможно попасть в любое другое состояние S; за один или несколько шагов. В примере 6.2 это не так: из состояния 5з нельзя попасть в состояния Si и S2, а из состояний Sc и S? можно попасть лишь в состояния Sc и S? соответственно. Поэтому состояния S, цепи Маркова, из которых частицы могут лишь вернуться обратно в S,, называют поглощающими. Для поглощающих состояний рц=1.
Далее k — число состояний цепи.
Для цепей Маркова с поглощающими состояниями теорема 6.1 неверна. В этом случае нарушено условие положительности элементов матрицы Р1: при любом t переходы из поглощающего состояния, например Sa, в любые другие невозможны. В матрице Р‘ при Раа=1 элементы ра) = 0 при любом t и j=/=w, следовательно, всегда имеются нулевые элементы. Убедиться в этом можно, перемножая матрицы Р, у которых строка а имеет все нулевые элементы, кроме раа=1. Соберем все поглощающие состояния, перенумеруй их, в первые Z, т. е. состояния Sf при i= 1, 2,..., I — поглощающие.
Состояния Sj, i = /-|- 1, I-|-2, .... tn, m^k, из которых можно выйти, т. е. при каком-либо t элементы pi( (Z)>0 Для « = / + + ’, Z+2...k и /=1, 2,..., k, но в которые нельзя вернуться,
т- е- Pji (0 = 0 при любом t и при /= 1, 2,..., Z, Z +1,.... k и i = = Z-|-1> Z-(-2, .... k, называются невозвратными. Далее рассматриваются лишь только цепи Маркова с числом состояний ^ = /n + Z, в которых последние k — I состояний S„ i = l-\-1, Z +
171
+ 2 k,— невозвратные, а первые l состояний S,, /=_ = 1,2 /,— поглощающие. При этом безразлично, можно ли из любого невозвратного состояния попасть в любое другое невозвратное или нельзя. Для таких цепей Маркова называемых поглощс ющими, возможно приведение матрицы переходов порядка feXfe к блочному виду:
где Q — матрица порядка (k — l)X(fe — I), R— матрица порядка (fe — /)Х1, Л — единичная матрица порядка /X/, О — нулевая матрица порядка /Х(&— О-
Система, описываемая цепью Маркова с переходной матрицей (6.3.5), постепенно переходит из невозвратных состояний в поглощающие, находясь в невозвратных состояниях некоторое случайное время.
Пусть т,у — случайная величина, равная общему числу единиц времени, которое система проводит в состоянии Sy, если в начальный момент времени она находилась в состоянии Sy. Для определения средних значений величин туу используют следующую теорему.
Теорема 6.2. Для поглощающих цепей Маркова с матрицей переходов (6.3.5)
^, = 7,..,
где Тц — элементы матрицы
k—l
Пусть /,- = £ т,-у — общее время, включая время пребыва-/=1
иия в исходном состоянии Sy, которое система проводит во всех невозвратных состояниях до попадания в какое-либо поглощающее состояние; Ьц — вероятность попадания систе мы в поглощающее состояние Sy, /= 1, 2,..., /, при выходе его из Sy, t =	/+2,..., k. Тогда справедлива следующая
теорема.
Теорема 6.3. Для поглощающих цепей Маркова с матрицей перехода (6.3.5) Mti равно компонентам вектора Т1, где 1 — вектор-столбец с компонентами, равными 1, а вероятности — элементы матрицы B = 1R.
О Пример 6.5. Продолжим рассмотрение примера 6.1. Приведем матрицу (6.2.2) к виду (6.3.5) с 1=2 и k = 7 (см. задачу 6.6).
172
в частном случае* при р.=р = 0,2, г. = г = 0,7 и <?, = <?=0,1 матрица переходов вида (6.3.5) имеет вид
(10	0	0	0	0	0 \
0	1	0	0	0	0	0	\
0,2	0,7	0,1	О	О	О	О	I
0,2	0	0,7	0,1	О	О	О	I
0,2	О	0	0,7	0,1	О	О	I
0,2	О	0	0	0,7	0,1	0	/
0,2 О	ООО	0,7 0.1/
где
<?=
0,1 0,7 О О О
О 0,1 0,7 О О
О О 0,1 0.7 О
О О О 0,1 0,7
О О
О
О 0,1
0,2 0,2 0,2 0,2 ‘0,2
О,7 \
0 \
0 I
0 /
О /
Матрица 7=(/s — Q)
(см. задачу 6.7) такова:
(1,11
0,86 0,67 0,52 0,41
О О
1,11 О 0,86 1,11 0,67 0,86 0,52 0,67
О О О 1,11 0,86
О
О
О
О
1.Н
Рассмотрим средние значения времени пребывания в институте, т. е компоненты вектор-столбца
/1,Н\ / 1,98 \ t =Т1 = | 2,65 1.
\ 3 ,7 /
Х3.58 /
Подсчитаем также матрицу вероятностей попадания в поглощающие состояния, т. е. матрицу B — TR где
Поясним числовые результаты. Из матрицы В следует, что вероятность закончить учебу для первокурсника равна 0,28, т. е. из каждых 100 поступивших заканчивают вуз лишь 28 студентов.
На время пребывания студента в вузе действуют два противоположных фактора: возможность остаться для повторного обучения, что увеличивает время пребывания в институте, и возможность отчисления, что уменьшает это время. В результате влияния обоих
Данные — условные, они взяты из [18].
173
факторов для каждых 100 пятикурсников суммарное время обучения иа курсе 111 человеко-лет, 100 четверокурсников—198 человеко-лет, третьекурсников — 265, второкурсников—317, первокурсников — 358 человеке пет обучения в вузе до окончания или отчисления На IV курсе, если бы учились далее все 100 перешедших на него суммарное время обучения было бы равно 200 человеко-лет, но из-за отчислений это время меньше и равно 198 человеко-лет. Особенно заметна разница для начавших курс обучения в вузе: вместо 500 человеко-лет обучения каждые 100 поступивших учатся 353 человеко-лет. •
О Прит-ер 6.6. Цепи Маркова применяют в демографических методах передвижки возрастов, для которых известны вероятности дожития человека, находящегося в возрасте i (состояние S,), до возраста / (состояния S/). Как правило, смежные состояния-возрасты отличаются дру, от друга на один год. Из каждого состояния возможны переходы за одни шаг лишь в два состояния: либо в следующее за ним, либо в особое, поглощающее состояние. Для приведения матрицы перехода к виду (6.3.5) занумеруем состояния так: S, — поглощающее состояние; S2 — некоторый «предельный» возраст, в котором человек может оставаться, 5з — возраст, иа единицу времени меньший, и т. д., St-f-i — возраст, не достигший единицы времени. В этих обозначениях переходная матрица имеет следующий вид:
1	0	0	0
'	l—qi	<74	0	0
1—	rt_i	rt_,	О	0
Г* -2 0
0 0
. 0 О
. о о
. о о
1—Г2	О	0	0
1—Г|	0	0	0
. о о
. Г1 0
Матрица Р по виду напоминает матрицу перехода студентов с курса на курс из примера 6.1; отличие состоит в следующем:
1)	вместо числа курсов, равных 5, имеется k возрастов людей;
2)	нет возможности ^остаться на повторное прохождение курса»;
3)	есть только одно погпощающее состояние.
Из сравнения примеров 6.1 и 6 6 следует, что qt—O, i<Zk, поэтому при 1=1, 2.........k—1, т е р,= 1—г, при <у=Л и р; — веро-
ятность умереть на i-м году жизни, а п — вероятность дожить до возраста < + 1 лет, если человек дожил до возраста i. Поэтому, ис-
174
пользуя соотношения		примера 6.5 и задачи 6.7, получаем			°\ 0 0
		Г=-	 •~9* 0 1 fk-t	X		
	1 /	Г*-1 ' Гк- ins		0 0 1	... 0 ... 0 ... 0	
X		-		... -	-
	Г»_|Г*-2.  ' Г»_|Г»-2 . - - Г|	3 . - • Г2 ГЛ-ЗГЛ-З -  • Г1 -	Г»-ЭГ»-4   • Г2 Гк-зГк-4 . . . Г|	... 1	0 1
Из предположений настоящего примера следует, что человек находится в состоянии S, (в возрасте от г — 1 до i полных лет) ровно год. Это упрощение моделирования, вызванное переходом от непрерывного времени к дискретному, отразилось на матрице Т В матрице средних времен пребывания Т на диагонали находятся средние времена пребывания в состоянии г, если цепь в него попала. Эти средние Мтг, равны единице времени. Если единица времени — год, то это означает отсутствие гибели в течение года, что приводит к отличию от действительности, т. е. к некоторой ошибке, не превышающей года. Если взять за единицу времени месяц, то ошибка моделирования будет не больше месяца, но в этом случае число состояний увеличится в 12 раз.
Рассмотрим суммы матрицы Т по строкам, т. е. элементы вектора Г1, и пусть «предельный» возраст — это возраст выхода на пенсию. Сумма по первой строке Г равна Л = 1/(1—qt), по второй —
г к — 1 “Ь 1
<2=—;-------и т. д., сумма по /-Й строке равна
'~Чк
~(rk-lrk-2-  Jk-l-i +
+ гЛ-2Г*-3- - ГЛ-£+|+* ' +rfe_f+l + l).
Тогда tk-100 — среднее число лет, прожитое 100 родившимися до их выхода иа пенсию, а 1004-is— среднее число лет, прожитое ста 20-летними до выхода их на пенсию.
Если «предельный» возраст — это возраст, до которого люди ие доживают (например, 300 лет), то, учитывая, что в этом случае ц» = 0, 100/* — среднее число лет, прожитое 100 родившимися до их смерти, или tk — ожидаемая продолжительность жизни людей. Аналогично можно определить среднее число лет, которое человек, прекративший работу по возрасту, получает пенсию и т. д.
Следует еще раз обратить внимание на тот факт, что в последнем примере, как и ранее, цепь Маркова была однородной во времени, т. е. все вероятности не изменялись с ростом времени, ф
175
§ 6.4.Случайные временные ряды и нх характеристики
Как и ранее, в этом параграфе будут рассмотрены случайные процессы с дискретным временем, которые обычно называют временными рядами В экономике основные статистические данные имеют вид временных рядов с одинаковыми промежутками времени между смежными наблюдениями. Далее описываются только одномерные временные ряды, хотя в экономике очень часто встречаются и многомерные. К последним относятся, например, наблюдения во времени спроса и предложения, которые следует рассматривать в совокупности. Имеются временные ряды и большей размерности.
О Пример 6.7. Приращение ДР (t) основных производственных фондов F (г) некоторой отрасли в году t зависит от капиталовложений и их накопления за несколько предыдущих лет, поскольку не все объекты могут быть закончены в год начала их строительства. Следовательно,
ДР(О=ао/ |<) + а)/(/-]) + ..„
где at — доля ввода фондов в году t от капиталовложений /(/ — k), сделанных в данную отрасль в году i — k Таким образом, приращение складывается из суммы капиталовложений за несколько лет. Обычно в эту сумму добавляют еще случайную составляющую, отражающую сокращение ввода фондов за счет неблагоприятных условий и увеличение ввода за счет благоприятных условий, а также «аккумулирующую» влияние всех других факторов, влияние каждого из которых в отдельности незначительно, ф
О Пример 6.8. Число вновь появившихся особей в некоторой популяции, например человеческой, зависит от числа особей, которые появились в предыдущие гиды и дожили до настоящего времени. Если y(i) — число особей, появившихся в году t, Ct — доля выживших за i лет. bi — чиспо появившихся потомков у особей в возрасте I за один год, то число появившихся новых особей в году /
!/W = “i {/(/ —1) + я2!/(/ —2) + -.
где Ui-Cibi.
Действительно, если i лет назад появилось у (t—i) особей, то до года t дожило c,y(t — i). У каждой особи возраста i (их С, у (/ — i)) появляется за год fe, потомков, поэтому всего от особей, появившихся i лет назад, в году t будет Ь,с,у(1—i) потомков.
Чтобы получить общее число особей, появившихся в году t, следует просуммировать число потомков особей всех возрастов.
Очень часто первые щ равны 0, поскольку bi для i= 1, 2, .... п равны 0. Так, ель начинает плодоносить с пятнадцати лет, поэтому в по пуляцин елей й,= 0 для »=1, 2, .... 14, а в популяции дубов а,— = 0 для i=l, 2, .... 55. Для популяции некоторых ценных пород рыб сравнение для y(t) имеет аналогичный вид, только первые щ отличны
176
иуля для i=4, 5, 6,а для людей, как правило, а,=#0 при i=17-j-]8 лет. Как и в предыдущем примере, из-за разных причин (слу-число потомков, случайное число доживших до определенного о;чряста и т. д.) число вновь появившихся особей случайно, поэтому ® уравнению для y(t) добавляют случайную составляющую, среднее которой равно 0. •
Перейдем к анализу моделей и состава временных рядов.
любого временного ряда можно выделить две компоненты: деТерминированную и случайную.
Саму детерминированную компоненту в экономике обычно представляют в виде регулярной и сезонной периодической составляющих. Например, трудовая активность работников города имеет четко выраженный недельный период. Демографические волны (спады и подъемы в рождаемости, изменения возрастной структуры населения) повторяются через 20—
30 лет, что очень четко прослеживается в послевоенные годы Более подробно вопрос выделения регулярной составляющей из временного ряда, содержащего детерминированную и случайную составляющие, рассмотрен в гл. 13. Далее на примерах будет показано, как модель временного ряда позволяет установить вид регулярной составляющей.
Рассмотрим схему примера 6.8, в которой
Y(t)=at /(/-1)4-02 У(/-2)4-...4-a* Y(t-k)+X„
(6.4.1) где Xt—независимые при разных / случайные величины с
/ИХ, = 0 и DXt = <?.	(6.4.1')
Временной ряд, определенный соотношением (6.4.1), обычно называют авторегрессией k-ro порядка. В авторегрессии наличие и вид регулярной составляющей определяются корнями следующего уравнения, называемого характеристическим:
х*—O|Xfc_1 — a2xl!~2—...—aft = 0.
Если все корни характеристического уравнения по модулю меньше 1, то авторегрессия не имеет ни функциональной, ни периодической составляющей, т. е. временной ряд стационарен. Покажем это на примерах.
Пусть имеется авторегрессия первого порядка
У(/)=аУ(/-1)4-Х,;	(6.4.2)
ТогДа, согласно свойствам математического ожидания, имеем, Что Л4У(/)=аЛ47(/—1). Обозначая Л4У(/)=ги(/), получаем Лг(/)=дщ(/—1), а характеристическое уравнение х — а = О определяет корень х=а.
177
При |а| <1 и т(О)=т математическое ожидание m(fy^ —►О, поскольку т(1) = агп, т(2)=ат (1)=а2т, т (3)== =ат (2)=а3т и т. д. Поэтому (см. задачу 6.8) т (<)=-= am(t—1) = а'т и а1-►О при <->оо, что приводит к т (<)_>. -►0. Если Xi ие зависит от У (t—1), то дисперсия У (t) при —► оо равна DY=с2/(1—а2) (см. задачу 6 9), т. е. будет постоянной (далее этот же результат будет получен другим путем).
Если а= — 1, т. е. |а|=1, то математическое ожидание будет равно то т, то —т, a DY (Г) линейно увеличивается (задача 6.10). Таким образом, функциональная компонента временного ряда имеет периодическую составляющую.
Наконец, при а>1 и математическое ожидание, и дисперсия растут при /—► оо как а1 и а2‘ соответственно. Последнее означает тенденцию к увеличению — регулярная компонента будет иметь вид а1. Итак, при |а| 1 временной ряд, удовлетворяющий (6.4.2), нестационарен. Аналогичные результаты можно получить и при авторегрессии (6.4.1) более высоких порядков.
В примере 6.7 поведение временного ряда зависит от последовательности I (<) при /=0, 1, 2,.... т. е. от экзогенной переменной.
Возвращаясь к соотношению (6 4.2), рассмотрим еще один случай: допустим, что t достаточно велико и |а| < < 1. Тогда, последовательно подставляя в (6.4.2) выражения (6.4.2) для t— 1, ( — 2, .... получаем
Г(0 = Х/ + а(Х/_1+аГ(/-2)) =
= Х( + а(Х1_1+«(Х,_2 + ...)...).
Отсюда
У (f)=Xf + aX(_|+o2-Kj_a + —+	* + •• •
Временной ряд У (t) в последнем соотношении получается с помощью скользящего суммирования, если все величины Xt считаются некоррелированными (независимыми) с МХ/= =0 и DX.=a2,
Итак, рассмотрены три типа временных рядов:
1)	авторегрессии, заданные соотношением (6.4.1);
2)	скользящего суммирования, заданного соотношением *
У(/)= у ^Х,^, t>k, i=l
где Л(таковы, что AfXt=O, DXi = a2 и cov (Xt, Xs)=0 при
178
3)	распределенных запаздываний или лагов, заданные соотношением
г—1
Г(П= £ цхг_,+хг
i=i
Последнее соотношение представляет собой другую запись временного ряда из примера 6.7.
Если временной ряд Y (/) распределенных лагов имеет коэффициенты а, = а', то он является авторегрессией первого порядка. Для остальных случаев
k
MY(t)=0 и DY (t)=e2 £ а?.
г—1
Одной из самых важных характеристик стационарных временных рядов является нормированная корреляционная функция р ($), которая определяется соотношением
P(s)_^o±^a.	(6.4.3)
Для нестационарных временных рядов корреляционная функция является функцией двух переменных: момента времени /-положения и сдвига s.
Учитывая, что неравенство |cov(X, Z)| DY справедливо для любых X и Z, в том числе и для X=E(/-|-s) и Z = = У (i), из соотношения (6.4.3) получаем следующие свойства корреляционной функции:
1°. р(0)=1.
2°. |p(s)|<l (свойство ограниченности)-
3°. При p(s) = 0 функции y(/-|-s) и У (/) линейно независимы, т. е. У (/-|-s) не является линейной функцией от У (/), и наоборот.
4°. p(s) = p( — s) (свойство симметрии).
□ Действительно, cov (У (/ + s) У (/))=cov (У (и) У (и—s)), если положить u = t-f-s, т. е. t=u — s. Используя (6.4.3), видим, что левая часть равна DY (/)p(s), а правая—DY (и)р( — s). Так как процесс стационарен, то ОУ (/)= ОУ (и) и, действительно, p(s) = P(~s). 
Известно (см. также задачу 6.11), что для процессов скользящего суммирования
{k — s
при s<fe,
О при s>k.
179
Процессы распределенных лагов могут быть и с бесконечным числом слагаемых (/г=оо), но для существования (конечности) дисперсии в этом случае требуется сходимость
ОО ряда £ а?. i=0
В частном случае а, = а‘ ряд £ af сходится при |а|<;
=|
<1. Поэтому Л1У(<)=0, DY (t)=—----у и p(s) = a|s|.
В случае |а|<1 процесс распределенных лагов (при k = = оо) — это авторегрессия первого порядка (6.4.2). При а~ = 1 процесс авторегрессии первого порядка является процессом с независимыми приращениями. Авторегрессия первого порядка — это марковский процесс с дискретным временем, но с непрерывным множеством состояний. Процесс с независимыми приращениями — марковский процесс и может быть исследован методами марковских процессов.
Рассмотрим авторегрессионный стационарный процесс У (/) с математическим ожиданием M.Y (/) = О, значения которого до момента Т известны. Определим прогноз P(T’-)-l) в виде линейной функции от реализации У (/), т. е.
Р(Т+ 1)=Ь, У(Т)+Ь2 У (Т- 1)+....	(6.4.4)
Будущее значение У (74-1) (случайная величина) может отличаться от прогноза Р(7-|-1) (функции, зависящей от У (Т), Y (7— 1),...). Найдем неизвестные коэффициенты b\, bi, ... так, чтобы дисперсия 7)[У(Т-|-1)—Р(7-)-1)] была минимальной. Используя (6.4.4.) и (6 4.1), получаем соотношение
У (Т+ 1)-Р(Г+1) =
= (а|-Ь|)У(Г) + (о2-Ь2)У(Т-1) + ...-)-Хт+1.
Дисперсия полученной разности равна
M[y(T+l)-P(7+l)f=(al-b1)2a2K + (a2-b2)2a2r +
+ 2 («! —bj (а2 — b2) <% R (1)4-
где o% = DY(t), a u% = DXt для любых t. Дисперсия минимальна при bi = ai, поэтому наилучший прогноз Р(Г4-1)’ построенный на основе известных реализаций У(/), t=T, Т — 1, ..., равен
Р(Г4-1) = а, У(Г) + а2 Г (7-1)4-.. +ак Y(T-k+l),
180
т е Р(7"+0 отличается от У (Г+1) только на слагаемое
-X 1
Г+Аналогично можно получить прогноз на два шага ?(?+
-j-2). Так как
р(7-+2) = с, У(Т+ 1)+с2 У(Т) + - + сА У (Г —fe-J-2)
и отличается от У (T-f-2) двумя слагаемыми: случайной ошибкой Хт+2 и разностью неизвестного У (Г + 1) от полученного ранее прогноза Р(7’+1), равной	т. е.
У(7’+2)-Г(7’+2)=с1 Хг+1+Хг+2.
Таким образом, прогноз на два шага
Г(Г+2)=а, У(Г+1)+о2 У(Г) + ... + аА Y(T-k + 2), так как коэффициенты Ci для У(Т4-2) снова равны а<.
Для прогноза на произвольное число шагов т, учитывая, что Y(t)=Y(t) ПРИ можно получить аналогичное выражение:
Р(Г+т)=
р,Г(Г+т— 1)+с2Т(Т-|-т—2)-|-...+ааР(7'+т—k) при x>k, = | а^Т+т— 1)+а2У(7'+т — 2)-Н +akY(T+x—kj при т</г;
во втором соотношении последние k — т слагаемых представляют собой известные реализации У (Т), У (Т— 1), а первые — полученные на их основе прогнозы Pff+r—i). Дисперсия наилучшего линейного прогноза для авторегрессии k-ro порядка имеет вид
nrv/т 1 \ v/т . м / (,+а?+. .+а»)Ол при x>k,
Задачи
6.1.	Задан процесс У (/), для значений которого при фиксированном t до /=10 функция распределения нормальна, т. е. имеет плотность <р((х) = —!—е-*2^2, а после момента / = 30 плотность д/2п
равномерна на отрезке [—6, 6], т е.
а, (х\=Л/12 при хе[—6,6], ] 0 при х<— 6 и х>6.
Плотность функции распределения значения процесса У (/) для каждого t от /=10 до Z = 30 равна
Убедитесь, что процесс У (t) может быть стационарен в широком смысле, но не стационарен в узком смысле.
181
6.2.	Покажите, что в примере 6.1 вероятность закончить вуз начав учиться с I курса, за 5 лет равна qxq^qiqiq^, а за 6 лет
+ <71 г 2472<73<7<<75 + <?1<72Гз<7з<74<?з + <7 i <7s <7 зг4?<<7s 4. -|-<?|<72<7з<74Г5<7б.
6.3.	Покажите для примера 6.2, что вероятность того, что четыре последние года следующей пятилетки будут засушливыми равна 0,5 • 0,1 • 0,2 • 0,2 • 0,2 + 0,4 • 0.2 • 0,2 • 0,2 • 0,2 = 0,0004 0,00064 = 0,00104, если первый год пятилетки был дождливым
Указание. Покажите, что первое слагаемое равно Pi3P3iP2iPnPn и соответствует траектории S3SiS|S|Sr, второе слагаемое P42P2i₽iiPiiPii — траектории S2SiS,S|Si; других возможностей нет.
6.4.	Проверьте, что для матрицы примера 6 2 вектор-строка (0,15 0,4 0,37 0,08) является предельным распределением.
6.5.	Пусть Р — матрица перехода примера 6.2. Покажите, что матрица перехода за два шага Р2 имеет все положительные элементы.
6.6.	Покажите, что если перенумеровать состояния цепи Мар-
кова примера 6.1 приводится к виду		в обратном (6.3.5):		порядке, то матрица переходов		
				0 0	0 0	° \ °\
/1 1 0	0 1	. 0 . 0	0 0			
р	 1 Ps	<75	. г5	0	0	0	0	/ /2 о\
1 Pi	0	 <7«	Л 4	0 .	0	0	\R Q/'
\ Рз	0	. 0	<7з	гз	0	0
\ Рг	0	. 0	0	<72	г2	0 ,
' Pi	0	. 0	0	0	9i	Г| /
где k = 7, 1=2.						
6.7. Покажите	чтс	матрица Т		=(Л	-Q	1 для цепи Маркова
из предыдущей задачи определена следующей таблицей:
Начальное состояние	Среднее время пребывания в состоянии				
	5	4	3	2	1
5	1	0	0	0	0
4	gsgi	1 gT	0	0	0
3	W3 gbgigS	Гз gig3	1 w	0	0
2	Г4ГЗГ2 gsg4g3g2	Г3Г2	Г2 glg2	1 V	0
1	Г4ГЗГ2Г1	ГЗГ2ГХ	Г2Г1	П	1
	g5gig3glgt	g«g3g2gl	g3g2gl		
В табл, использовано следующее обозначение: g,=pi + r,.
182
указание. Умножьте матрицу Т на матрицу (/s — Q).
6.8.	Покажите, что в случае — (6.4.2) при m (0)= 1 и а=1 /2, 4=10 математическое ожидание, удовлетворяющее уравнению m(0=am(^—')> меньше 0,001 по абсолютной величине.
6.9.	Проверить следующее утверждение: если вычесть из левой части (6.4.2) m (/), а из правой — am (t— 1), затем возвести обе части получившегося равенства в квадрат и вычислить математическое ожидание, то имеем равенство
DY(t)=a2 РУ (Z—1) + а^ + 2а cov (У (Z —1), ХД
Учитывая, что cov (У (Z —I), Х() = 0, для независимых и y(t__1) получите, переходя к пределу по равенство DY=
=	—а2), которое при а——— имеет вид РУ=4о^/3.
6.10.	Покажите, как в задаче 6.9, но для частных случаев, что: а) DY (0 = DY (t — 1) + а* при a2 = l. Отсюда для DY (0)=0, py(l)=a^, DY (2)=2а^, DY (3)=3а^, DY (4)=4 а2 и т. д.; б) при а2 = 2 РУ(1) = а^, поскольку РУ(0)=0, так как Y (0) задано, т. е. У (0) — число не случайное. Далее DY (2) = 2a^ + a^ =
оЗ — 1
=(2' + l)a2,	РУ(3)=(22 + 2-|-1)-а®=^—j-a2 , и т д
6.11.	Для процесса
У (<)=a0X/ + a1X/_ ] 4-02^—2 покажите, что
ДУ(<) = (а2+а2 + с4)4
И
cov (У (<), У (< +1))= DY (0 р (1) = а2 (аоа,
РУ(<)р(2) = а^аоа1,
р(3) = р(4) = р(5) = ... = p(s) = 0 при s>fe = 2.
Убедитесь, что р(— 1)=р (1) и р(2)=р(—2).
ОО
6.12.	Убедитесь, что при У (/)=	а‘Xt_it где все Х_,-, Хо, Xi
i=l
независимы (некоррелированы), AfX, = 0 и DXt = a^, выражение для корреляционной функции таково:
р (s) = alsl.
Постройте график для р (s) при a = 0,8 и а= — 0,6.
183
613. Пусть У (Z)= 1,8У (/—lj—1,09У (/— 2) —0.108У (/ —3)_l 0,272 У (t- 4,4- X,.
У(0)=—4,223,
У(3)=—0,067,
У (6)= 1,553,
У(1)=—4,504, У (4)= 2,184, У (7) =-0,164
У (2) =-3,062, У (5)=2,544, у (8) =—2,462.
Пусть, кроме того Xi — независимые одинаково распределенные величины с AfX, = 0 и DXf=l, t=l,2, ... . Покажите, что наилучшие прогнозы для t=4, 5, 6, 7 по известным У (/), Z = 0, 1, 2 3, соответственно равны Р(4)=2,56, Р(5) = 3,8, Р(6) = 3,2, Р(7)= 1.3. Р(8)= —0,9, а их средние квадратические отклонения таковы: 1; 2,06; 2,33; 2,33; 2,25. Постройте график временного ряда для / = 0, 1, 2, 3, 4, 5, 6, 7, 8 и график прогнозов для / = 4, 5, 6, 7, 8 вместе с зоной из 2о^.
Часть 11
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Глава 7
ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОГО МЕТОДА
Основная задача математической статистики состоит в получении выводов о массовых явлениях и процессах по данным наблюдений над ними или экспериментов. Эти статистические выводы относятся не к отдельным испытаниям, а представляют собой утверждения об общих характеристиках этого явления (вероятностях, законах распределения и их параметрах, математических ожиданиях и других моментах и т. п.) в предположении постоянства условий, порождающих исследуемое явление.
Математическая статистика опирается на теорию вероятностей, и ее цель — оценить характеристики генеральной совокупности по выборочным данным. Генеральной совокупностью называется вероятностное пространство {й, S, Р( (т. е. пространство элементарных событий й с заданным на нем полем событий S и вероятностями Р) и определенная на этом пространстве случайная величина X. Единицей генеральной совокупности называется элементарное событие и отвечающее ему значение случайной величины. Случайная величина X имеет определенную функцию распределения и вытекающие из нее числовые характеристики (например, математическое ожидание или другие начальные или центральные моменты). Функцию распределения случайной величины X, ее параметры и числовые характеристики далее будем называть теоретическими в отличие от выборочных (эмпирических), которые определяются по выборочным данным.
Определение 7.1. Случайной выборкой или просто выборкой объема п называется последовательность Xi, Хг, .... Хп, п независимых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением исследуемой случайной величины X.
185
Иными словами, случайная выборка — это результат п последовательных и независимых наблюдений над случайной величиной X, представляющей генеральную совокупность.
Для конечной генеральной совокупности случайный равновозможный выбор на каждом шаге приводит к зависимости отдельных наблюдений, случайный равновозможный выбор с возвращением — к независимости наблюдений. Далее, если не оговорено противное, речь всегда будет идти о случайной выборке, т. е. в случае конечной совокупности — о выборе с возвращением.
Конкретный набор выборочных значений хь х2, .... х„ следует рассматривать как реализацию (одну из многих? многомерной случайной величины Xi, Хг, ..., Х„, компоненты которой независимы и имеют одну и ту же функцию распределения F (х), соответствующую генеральной совокупности. Поэтому многомерная случайная величина Xi, Хг, ..., Хл, характеризующая выборку, имеет следующее распределение:
F(2,,22, ...,2л)=/’1Х1<21,Х2<22, .... Хл<2„) =
= [IP(XJ<2/)=fjF(2;). ,=1 1=1
Отметим, что при изучении генеральной совокупности с помощью выборочного метода в распоряжении исследователя имеются только выборочные значения и, быть может, некоторые априорные предположения о генеральной совокупности. Иными словами, все выводы о генеральной совокупности делаются только по выборке. Точность и надежность (достоверность) статистических выводов определяются не по отношению к данной конкретной выборке хь х2, .... хп, т. е. реализации многомерной случайной величины Хь Хг, .... Х„, а применительно ко всему мыслимому набору выборок, характеризуемому распределением этой многомерной случайной величины.
Основные задачи математической статистики состоят в разработке и применении различных методов оценки общих характеристик совокупности, проверки статистических гипотез, выявления взаимосвязей между несколькими характеристиками объектов, согласия наблюденных данных с теорией, принятия решений, планирования эксперимента и т. д.
Все задачи можно разбить на две большие группы: параметрические и непараметрические. В теории вероятностей описаны вероятностные модели, содержащие параметры.
186
К ним относятся биномиальное, нормальное, показательное, равномерное распределения, распределение Пуассона т д. Так, например, в показательном распределении параметром может быть либо интенсивность, либо среднее значение. Если известны вид распределения и область изменения параметров, то имеют место параметрические задачи. Если же нет представления даже о виде плотности, не говоря уже о возможных значениях параметра, то речь идет о непараметрических задачах.
В настоящей главе дается понятие о статистическом оценивании на примере оценки математического ожидания и функции распределения случайной величины, в последующих главах речь идет об общем случае статистического оценивания параметров и проверке статистических гипотез, а также рассматриваются имеющие важное прикладное значение схемы, содержащие как детерминированную, так и случайную составляющие.
Оценкой числового параметра 6 называется функция вы борочных значений 6 (Xi, Хг,.... ХП) = 6П, которая в определенном статистическом смысле близка к истинному значению этого параметра.
Важнейшими статистическими свойствами оценки, определяющими ее близость к истинному значению числоьой характеристики, являются свойства несмещенности, состоя тельности и эффективности.
Оценка называется несмещенной, если ее математическое ожидание как случайной величины равно истинному значению числовой характеристики:
мр„=е.
Оценка называется состоятельной, если она сходится по вероятности к истинному значению параметра, т. е. для любого е>0
Р |iS„ — 61	при п-»-оо.
Оценка называется эффективной, если она имеет минимальную дисперсию в определенном классе оценок.
Кроме понятий несмещенности, состоятельности и эффективности оценок параметров в математической статистике часто используют понятия квантилей, процентных точек (односторонних критических границ) и двусторонних критических границ.
Определение 7.2. Квантилью уровня р или р-квантилью случайной величины X с функцией распределения F (х) называется такое число dp, что вероятность события P(A<dp)
187
равна заданной величине р, иными словами, dp — решения уравнения F (dp) = p.
Понятие процентной точки (односторонней критической границы) тесно связано с понятием квантили.
Определение 7.3. Процентной точкой уровня q, 0^^^ 100, или q %-ной точкой ич, или односторонней критической границей, отвечающей уровню значимости а = д/100, непрерывной случайной величины X с функцией распределения F (х) называется такое значение случайной величины, что вероятность события Х^ич равна д/100, т. е.
\-F{ug)=P\X^u4\=q/\QQ.
Связь между квантилями и процентными точками такова: di_p = UiooP для любого	1. Для симметричных случай-
ных величин, у которых плотности распределения симметричны относительно некоторой точки а, процентные точки для малых значений д<50 % и больших значений д>50 % связаны между собой:
“,-«ioo-, = 2a
ИЛИ
’/2(и, + «юо-,)=°
при любом q.
Это свойство дает возможность приводить таблицы лишь для процентных точек или квантилей, больших а. Например, для стандартной нормальной величины можно приводить процентные точки «,^0, т. е. 5 %-ная точка нормального стандартного распределения равна «5=1,64. Поэтому, зная «5, МОЖНО наЙТИ «95=—«5= — 1,64.
В настоящем пособии используются также понятия отвечающих уровню значимости а нижней критической границы и верхней критической границы иа, которые определяют-
188
СЯ из следующих условий:
P{X<ua}=F(ua)=a/2,
Р {и* С X < ла} = F (ма) - F (nJ = 1 - а,
Р|Х<йа}=1 —F(ua) = а/2.
Между критическими границами и квантилями для симметричных распределений ц^= — иа= — иа существуют следующие соотношения:
иа=Ла=^а/2’ Ua = Ua = ^1 — а/2.
Квантиль, процентная точка и двусторонние критические границы изображены на рис. 7.1.
§ 7.1. Оценка математического ожидания
Во введении к главе и далее конкретная выборка xi.%2, Хп понимается как реализация многомерной случайной величины Xi, Х2,..., Х„ с независимыми компонентами, каждая из которых имеет одну и ту же функцию распределения F (х), соответствующую генеральной совокупности. С другой стороны, саму конкретную выборку можно рассматривать как конечную генеральную совокупность Xi, х2,.... х„ с равновероятными исходами Р (Х = х,)= 1/я и определять числовые характеристики этой «выборочной случайной величины» X.
Так, математическое ожидание и дисперсия «выборочной случайной величины» X выражаются через выборочные значения согласно соответствующим формулам для дискретных случайных величин следующим образом:
МХ= £ х, Р(Х=х,)=— £ xf=x, (7.1.1) i — 1	i — I
DX = M(Xt-MX)= £	P(X=x,.)=— £ (x,-x)2.
t=I	i=I
Теория подтверждает, что полученные таким образом оценки математического ожидания, дисперсии и других моментов теоретической случайной величины оказываются близкими к истинным значениям соответствующих числовых характеристик генеральной совокупности либо могут быть «улучшены» с помощью небольшого уточнения.
Рассмотрим в качестве оценки математического ожидания МХ=а случайной величины X среднее арифметическое ее
189
выборочных значений
I " а=— У Х.=Х ",£i
и установим статистические свойства этой оценки.
Рассматриваемая оценка не смещена. В самом деле,
Ма = М (— У X, \= - SMX, = a.
V <-1 / я
Эта оценка состоятельна, т. е. сходится по вероятности к истинному значению математического ожидания генеральной совокупности: а=>а при п-^оо, что, согласно определению сходимости по вероятности для любого е>0, означает
PJIX — а|^е)—>1 при п->-х>,
но последнее есть не что иное, как утверждение закона больших чисел.
В конце этого параграфа будет доказано, что исследуемая оценка эффективна в классе линейных оценок. Итак, среднее арифметическое выборочных значений X является несмещенной, состоятельной и эффективной оценкой математического ожидания генеральной совокупности.
Такими же свойствами обладает и частость появления успехов в п последовательных независимых испытаниях Бернулли, в каждом из которых успех появляется с вероятностью Р(А)=р, иными словами, частость p = tn/n, рассматриваемая как выборочная оценка теоретической вероят ности р, является несмещенной, состоятельной и эффективной (в классе линейных оценок) оценкой вероятности.
В самом деле, исход отдельного «-го испытания описывается альтернативной случайной величиной
y__fl, если имел место успех А.
10, если успеха не было;
следовательно, общее число положительных исходов в п испытаниях равно
<п=£х,..
1=1 поэтому оценка математического ожидания МХ = р случайной величины равна
1 п
Л 1 v V т р=— ) X =— п 1 п
I— 1
190
и как это было показано выше применительно к оценке математического ожидания, обладает свойствами несмещенности и состоятельности. ~
Теорема 7.1. Если 0п— несмещенная оценка параметра 6 и ее дисперсия lffn-+O при п-*-оо, то она состоятельна.	_
□ Оценка 0„ параметра 0 не смещена, т. е. М0„ = 0 существует, поэтому при любом е из неравенства Чебышева получаем Р(|0„ —01 <е}> 1 — 13?п/пг2->1. Но Л0„^О при „^оо; следовательно, для каждого фиксированного е отноше ние Л6п/пе2->-0 при п-^-оо т. е. 1 — £6„/пе2-»-1. Однако левая часть неравенства Чебышева больше 1 быть не может, поэтому левая часть стремится к 1, что и требовалось доказать. 
В заключение параграфа рассмотрим оценку математического ожидания по неравноточным наблюдениям. Пусть результат каждого i-го выборочного испытания описывается случайной величиной X,, MXt = a, DXi = ot а испытания независимы друг от друга и характеризуются разными, но известными дисперсиями о2,. Наилучшую в статистическом смысле оценку будем искать в классе линейных оценок
п
а = ciXi = а (с).
i=i
Сначала определим требования к коэффициентам G, обеспечивающим несмещенность оценки:
Ма = М	£ с,Л1Х. = а £ с._
п
Таким образом, оценка не смещена, т. е. Ма = а, если с, = 1. i=l
Теперь определим значения коэффициентов, которые обеспечивают минимум дисперсии:
п
Da = min Da (с) при с(. = 1.
i=l
Найдем дисперсию оценки для некоторого конкретного набора коэффициентов с,, используя независимость X,. Имеем
Da (с)= D £ с,Х{^= £ с2 DXt = £ с2 а2.
191
Итак, надо определить такие значения коэффициентов с,-, при которых
min с4о? = min f (c),
если выполняется условия g(c)= д ct — 1 =0. Это задача на /=1
условный экстремум, которая с помощью принципа Лагранжа сводится к задаче на безусловный экстремум функции L (с) = f (с) — kg (с). Поэтому для определения коэффициентов а приравниваем нулю производные:
4^=2с.о,2— Х = 0, i=l,2, п, dct
4£-=g(c) = 0,
п
откуда Ci = k/2ot /=1,2, .... п. Из условия £ cz=l находим i=l
1 * 1
= 1, —=--------, поэтому окончательно имеем
Ь/а?
1/о?
с,= п- —, i=l,2,.... п.	(7.1.2)
Z
<=|
Таким образом, эффективная линейная оценка математического ожидания по неравноточным наблюдениям получается тогда, когда наблюдения входят в оценку обратно пропорционально своим дисперсиям, т. е. менее точные наблюдения входят с меньшим весом, а более точные — с большим. Если дисперсии равны, то в соответствии с последней форму-
лой с,=—, i=l, 2,..., п, а эго значит, что среднее арифметическое выборочных значений является эффективной оценкой математического ожидания в классе линейных оценок при условии, что выборочные наблюдения равноточно!
Проверим состоятельность полученной оценки математического ожидания по неравноточным наблюдениям. Найдем 192
дисперсию
оценки, используя независимость наблюдений:
Da= D f £ СД ) = £ ^ DX< =
(7-1.3)
Л
Таким образом, если £ l/of->oo при п->оо, то, согласно «=1
теореме 7.1, оценка а состоятельна. Приведенное условие выполняется, если, например, дисперсии ограничены oi<o2, i=l 2,.... п, или допускается небольшой их рост Oj = fen‘,

при П-> ОО.
§ 7.2. Оценка функции распределения
Наиболее полная характеристика случайной величины, как это известно из ч 1 настоящего пособия,— это ее функция распределения. Пусть хь х2,.... хп — выборка из генеральной совокупности, представленной случайной величиной X. Рассмотрим, как оценить функцию распределения F (х) этой случайной величины, о которой известно только, что она непрерывна.
Чтобы построить оценку ?п(х) функции распределения F (х), обычно располагают наблюдения х, в порядке их возрастания, т. е. находят вначале Xf=min Xi, затем следующее по величине наблюдаемое значение и т. д.; если есть одинаковые значения, то их расположение не играет никакой роли.
Определение 7.4. Последовательность неубывающих величин Xi^XK„.^XX полученных после упорядочения выборки, называется вариационным рядом.
По вариационному ряду, в котором нет совпадающих точек, строится следующая неубывающая функция:
{О	при хXf,
k-1/п при X?_,<x<Xf,	(7.2.1)
1	при х>Х*.
т. е. ступенчатая функция со скачками, равными по величине 1/п, в точках вариационного ряда. Если I точек вариационно-
7 В. А. Колемаев и др.
193
го ряда совпадают и равны X* то скачок в точке X? равен 1/п.
Функция, построенная по эмпирическим данным, изображена на рис. 7.2.
Такие неубывающие ступенчатые функции называются эмпирическими функциями распределения. Формально эмпирическую функцию распределения можно ввести так:
F„(*)=v W/«.
где v (х) — число точек XI, меньших или равных х
Эмпирическая функция распределения обладает всеми свойствами функций распределения. Вопрос в том, какое отношение она имеет к теоретической функции F (х).
Обычно рассматривают две меры уклонения F„(x) от F (х). Одну из них вычисляют так: рассматривают наибольшие уклонения Ря(х) от F (х) в точках вариационною ряда X*. Функция F (х) непрерывна, поэтому в точке Xf можно вы-ft	ft_]
числить ——F (X'j^ и F (Хь}~  —• наибольшую из них по абсолютной величине обозначим dk. Из п величин dt выбирают наибольшую D„= max dk. Величина D„ (наибольшая по всем х величина разности |F„(x)—F (х)|)—это уклонение эмпирической функции распределения от теоретической.
Другой мерой уклонения служит величина
194
Различие в мерах уклонений состоит в том, что для величины Dn все точки х одинаково важны, в то время как для величины важнее наиболее вероятные точки и совсем не важны очень маловероятные. Очевидно, что из малости D„ следует и малость со2, но не наоборот.
Теорема 7.2. Если F (х) непрерывна, то при г> О и п—*-°°
P{yJnD <г}->К(г),
где К (z) — распределение Колмогорова
Теорема 7.2 позволяет определить величину различия между эмпирической и теоретической функциями распределения:
Z |Fn(x)-F(x)l	(7.2.2)
vn
где Za— решение уравнения K(z)=l—о. относитечьно z, т. е. za — критическая граница, соответствующая уровню значимости а. Аналогичный теореме 7 2 результат известен 2
и для уклонения соп при «->оо, а именно:
Р{псо2<г}->Л (z),
где A (z) — распределение критерия Мизеса **\
Уклонение со2 впервые предложил Мизес, поэтому распределение A (z), точный вид которого получил советский математик Н. В. Смирнов, называют часто распределением критерия Мизеса.
Таблица 7.1
Уровень доверия 1—a	Уровень значимости а	Критические границы	
		Колмогорова	критерия Мизеса
0,9	0,1	1,224	0,35
0,95	0,05	1,358	0,46
0,99	0,01	1,628	0,84
Поведение обоих уклонений с ростом п показывает состоятельность оценки Fn (х) теоретической функции распределения F (х). Кроме того, известно, что оценка (х) является несмещенной оценкой для F (х). С помощью табл. 7.1, содержащей критические границы для распределения Кол-
Таблицы распределения Колмогорова можно найти в (5].
1 Таблицы распределении критерия Мизеса приведены в [5J.
7*
195
могорова и распределения критерия Мизеса, можно проверить близость эмпирической функции распределения к теоретической.
Соотношение (7.2.2) можно с помощью табл. 7.1 записать в более привычном виде, например для 95 %-ного уровня доверия получаем
F «—1	(х)<Е (х)+-Ц^-.	(7.2.3)
\п	\п
Для п=100 эмпирическая функция распределения отличается от теоретической в любой точке х не более чем на 0,13, а по мере роста п различие между теоретической и эмпирической функциями стремится к нулю, т. е. оценка Fn(x) состоятельная.
§ 7.3. Оценка плотности распределения
Строить оценки функций распределения затруднительно при значительном числе испытаний. В этом случае для получения оценок функций или плотностей распределения все наблюдавшиеся выборочные данные объединяют в группы. Например, при построении выборочного распределения числа детей в семьях группируют семьи, у которых не более одного ребенка, 2 или 3 ребенка, 4 или 5 детей и т. д. В табл. 7.2 приведены группированные данные по запасам обуви в 100 магазинах.
Таблица 7.2
Интервал, тыс. руб.	0,2—2,2	2,2—4,2	4,2—6,2	6.2—8.2	8,2 -10,2	10,2—12 2
Число магазинов в интервале	70	20	4	3	2	1
Для оценки плотности используют два способа: гистограммы и полигоны частот. Гистограмму строят следующим образом: на оси х откладывают интервалы наблюдения, затем параллельно оси у откладывают из середин интервалов величины, пропорциональные наблюдаемому числу попаданий в интервалы. Коэффициент пропорциональности может Сыть для всех интервалов одинаковым, если все интервалы имеют одинаковую длину. Если интерва ты различной длины, то коэффициенты пропорциональности следует разделить еще на длины интервалов.
196
Таким образом, исходя из табл. 7.2, для первого интервала следует откладывать по оси Оу число, пропорциональное наблюдаемому числу vi = 70, т. е. 70-	, где 100 — число
наблюдений п, а 2 — длина h интервала Ль для второго
интервала 20-
и т. д. Затем на каждом интервале
длины h, строят прямоугольники с основанием Д,- и высотой,
Гистограмма для табл. 7 2 изображена на
vi равной ——.
рис. 7.3.
Если в табл. 7.2 объединить два первых интервала, то число наблюдений в нем составит 90. Но новый интервал имеет вдвое большую длину, поэтому новый прямоугольник должен иметь высоту 90-	*- . а не 90-	. На
1 Vy V» “л	* VJVJ * £
рис. 7.3 новый прямоугольник изображен штриховой линией.
Напомним, что была построена оценка плотности, а не вероятности попадания в интервалы. Оценка для вероятности была приведена в § 7.1.
Полигон частот строят точно так же, как гистограмму, но вместо прямоугольников середины верхних граней прямоугольников гистограммы соединяют прямыми линиями. Полигон частот представлен на рис. 7.4. На этом же рисунке, как на рис. 7.3, штриховой линией изображен полигон частот с объединенными в один интервал первыми двумя интервалами табл. 7.3. Для случайных величин с гладкой плотностью распределения полигон частот лучше оценивает эту плотность.
197
^пС^) \ I
Приведем доказанную Н. В. Смирновым теорему, которая подтверждает этот факт. Обозначим теоретическую плотность через f (х), а полигон частот — через (х). Допустим, что: а) интервал от а ди Ь, в котором оценивается плотность, ,	,	.	, Ъ—а
разбит на равных интервалов А длины п=—-—;
б)	непрерывная плотность f (х) имеет на замкнутом интервале [а, &] минимум fo>0, т. е. min f (x)=Jn>0;
4
в)	число /д = 2'уп (т. е. связано с числом наблюдений
так, что с ростом п увеличивается и число интервалов, и число наблюдений, попавших в них);
г)	вероятность попадания в замкнутый интервал [a, ft]
меньше 1;
д)	число X. — корень уравнения
Ф(х)=1— 1а
где
Ф (х) — функция стандартного нормального распределе
ния.
Теорема 7.3. Если выполнены условия а) — д), то
lim Р
l£(x)—f(x)|
max ----------
-yf (х)
-2е~'
Теорема позволяет построить область, в которой находится оценка плотности. Обозначим через /р величину X-|-z/X, для уровня доверия 1 — 0; тогда
rw-<( д/®<№<Н«>Д д/®-
198
Таблица 7.3
Г"	"" Число наблюдений п	Число интервалов /я	Величины для уровня доверия 1 — а		
		0,90	0,95	0.99
100	5- 6	2,40	2,64	2,90
200	7—8	2,45	2,69	2,93
300	8-9	2,48	2,73	2,94
500	9—10	2,э4	2,77	2,96
700	10—11	2,58	2,81	2,97
1000	11 — 12	2,62	2,84	2,98
Из неравенства следует, что с ростом п полигон частот — состоятельная оценка для любой неизвестной плотности. Кри-гические границы /р приведены в табч. 7 3.
Задачи
7.1.	Покажите, что решение системы уравнений с,а2—с„а2 = О, i=l. 2. .... л — 1, Ci + C2+... + Cn=l относительно неизвестных ft, 1=1, 2, .... и, задается соотношениями ------------------------------------
Е'/”?
1 = 1
7.2.	Покажите, что при о’=а2 в задаче 7.1 с,= 1/л.
7.3.	Найдите оценки среднего при неравноточных измерениях, если Dx, = ki^, для i го измерения Xi, где а2 неизвестно, a k,— известные положительные величины.
7.4.	Докажите с помощью неравенства Чебышева состоятельность оценки а=Х, не используя при этом теорему 7.1
7.5.	Покажите, что максимальное значение среднего квадра-тического отклонения \ /—-----— оценки р не превосходит
. . V	"
-к ДЛЯ любых	1
2 -уп
7.6.	Проверьте, сшласуется ли полигон частот с плотностью распределения
f(x)=	°-2)/“ ПрИ хо,2,
^0	при #<0,2,
где а=2 тыс. руб. Для этого постройте f(x), а также по данным табл. 7.2 постройте полигон и границы содержащей его области.
Глава 8
ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
Имеется два способа оценки параметров: точечный и интервальный. Точечные методы указывают лишь точку, около которой находится неизвестный оцениваемый параметр. С помощью интервальных способов можно найти интервал, в котором с некоторой, как правило с большой (выбираемой самим исследователем), вероятностью находится неизвестное значение параметра. В настоящей главе рассматриваются различные методы точечной оценки параметров. Несколько методов рассмотрены из следующих соображений. Во-первых, если один метод не дает ответа, то его можно получить используя другой метод. Во-вторых, из нескольких методов легче выбрать такси, оценки которого либо не меня'отся, либо мало меняются при изменении вида распределения, т. е. найти так называемые устойчивые или робастные оценки.
§ 8.1. Метод моментов
В гл. 7 было показано, что эмпирическая (выборочная) функция распределения с ростом числа наблюдений сколь угодно мало отличается от теоретической (истинной) функции распределения с вс роятностью, сколь угодно близкой к 1. Поэтому при большом числе наблюдений выборочные и теоретические моменты близки друг к другу. Если теоретическая функция зависит от каких-либо параметров, то для определения параметров можно воспользоваться выборочными моментами.
Пусть, например, параметров два, т е. 0 = (0Ь02). Если функция распределения такова, что существуют первые два момента, то их можно выразить через 0 следующим образом (для абсолютно непрерывных распределений):
+ “
а, = J xj (х, 0) dx=a1 (0),
— оо
+ о°
а2 =	х2} (х, 0) dx=а2 (0).
200
Эмпирические или выборочные моменты могут быть найдены по выборочной функции распределения [см. (7.2.1)]:
(8.1.1)
Из результатов предыдущей главы следует, что выборочные моменты с ростом п сходятся по вероятности к функциям И1 (е) и at (0) в точке 0 = (0i, 0г) и, следовательно, при большом п ai(0)»ai = Ci, а «2 (0)~ 0,2 = 02- Заменяя приближенные равенства точными, получаем два уравнения, которые нужно решить относительно 01 и 0г. Найденные решения и 0г и являются оценками методам моментов параметров 0t и 0г.
Метод моментов содержит неопределенность, поскольку можно получить уравнения для неизвестных 0j и 0г используя как начальные, так и центральные моменты (1=1,2,...)
4-00
g.= J (х —aj f (х, 0)с1х = рД0). — со
Если число параметров больше двух, то необходимо использовать столько моментов, сколько имеется параметров.
Рассмотрим примеры получения оценок методом моментов.
О Пример. 8.J. Пусть имеется нормальное распределение с неизвестными средними 0] и дисперсией 02
U-e,)2 f(X:0)=_‘ е .
-у2п02
где 0=(0,, 02).
Было показано, что первые два начальные .момента соответственно равны со (0) = 0i и аг (0) = 02-|-01. Уравнения для нахождения оценок в этом случае таковы: 0i=ai и 0s-|-0i = a2. Решения этой системы уравнений 6\h 62 являются оценками метода моментов.
Подученные оценки .метода .моментов можно привести к следующему виду.
i=l	i=l
Величины ± £ Х{ и ± £ (^-^=1. £ (Xi-Xf i~ I	t~ 1	i= 1
часто встречаются в статистике, называются соответственно
201
выборочной вредней и дисперсией и имеют специальные обозначения:
Х=с1=/711=— у Хр
s2 = т2 =~ £ (X, —X)2.	(8.1.2)
О Пример
>?
/М=4-е 28 и
8.2. Распределение Рэлея, плотность которого —
Случайная величина с этой плотностью представляет
собой расстояние от двумерной случайной точки с координатами,
имеющими одинаковое нормальное распределение, до ее математиче
ского ожидания.
Приравнивая начальные первые выборочный и теоретический моменты, получаем уравнение -\/л0/2 = Х=ар а приравнивая вторые моменты, имеем 20 = а2, где а> и а2 заданы (8 I I). Решая первое уравнение, получаем первую опенку метода моментов (?0=д/2/л X2, а решая второе, находим другую оценку ®12)=а2/2. В результате имеем две различные оценки одного и того же параметра. Кроме этих двух оценок можно найти еще одну оценку 0=s2/(2— л/2) из уравнения, которое получается при использовании второго центрального момента:
20—^-0=m2=s2. ф
Этот пример показывает неопределенность оценок метода моментов, состоящую в том, что можно получить много оценок одного и того же параметра.
Для многомерных случайных величин применим аналогичный подход, при этом моменты удобнее обозначать буквой с несколькими индексами. Например, для двумерной случайной величины X = (Xi, Х2) с плотностью распределения f (xi,x2, 0)
4“ ОО + оо
aoi = J J XlXzf (хр Х2< ®)	=	(0),
— оо — оо
-j-оо 4“°°
“10= $	5 (хрх2, 0)dx, dx2 = alo(0),
— со — оо
4- оо 4- оо
Н11= J J (х1— “ю)1 (х2 — “oi)‘ f(x1.x2,0)dxi,dx2 = p11(0).
— оо — оо
202
Выборочные моменты для двумерных выборок (Хц, Ха), । 2	, и, получаются аналогично одномерному случаю:
<’oi X а'0==~п Z Xli’ i=l	i—1
1 "
/пп=— £ (Ху —аю)	— а01) и т-д-
Отсюда, если использовать центральные моменты, оценка коэффициента корреляции р может быть получена методом моментов в следующем виде:
£ (Хи-Х,)(Х2Х2) "’ll	•=’
г=Р = ,	=-----.	- . - .
Оценки метода моментов часто бывают смещенными и неэффективными.
Рассмотрим в качестве примера свойства выборочной дисперсии sz как оценки дисперсии для нормального распределения. Вначале найдем ее математическое ожидание. Вычитая в (8.1.2) из Xt и X величину а и раскрывая скобки, в результате преобразований получаем
s2=-J- Z (Х-а)~(Х^) У {Х-а)+(х^? = п /-1	п .м,
1=1	«=1
=4 Z п 1=1
где Х^=± J (Х,-а).
Раскрывая скобки и используя свойства математических ожиданий и дисперсий для независимых случайных величин, получаем
Ms2=M |~JL £ (X.-cf
I n	। n n	2
i=l	“ 1=1/=1
203
Таблица 8.1
Оценки	Начальные моменты		Центральные моменты	
	обозначения	значения	обозначения	значения
Одномерные	Mav	av	Mmv	Pv + e„*
	nDav	«2v — a.	nDm,	P2v— Pv— 2vjlv-ljlv+l+v2jlv l|l2 + e„
	п COV (dv, CZp)	av+p + avOp	n cov (mv, mp)	Pv~}-p “ JXvpp VJlv— iPp 4-1 P|lv4~ 1 Pp~ 1 ~F 'VpP'SPv — 1 Pp — 1 “F
Дву-мерные	Afciv.p	ttv.p		pv,p ~F 6n
	nDciv.p	Ct2v,2p **v,p	nDm,f	~ •* 4Й P2v,2p— Pv,p + V2p2.OPv-l.p + p2po.2Pv.e -1+	* +2vppi,iHv-i.pHv.p-i — 2vgv+i.pPv-i.p~ 2ppv.p + iPv.p-i +en
	fl COV (lZv,p» SR -;s	OCv + u.p + u Clv.pClu.p	n cov (mV4), mUiV)	M'V-f-u.p + v ' P'v.pP'U.u-F ’V^P2.0Pv— l,pp«— l.p + pypo.2Bv,p — 1 P«,u— 1 HF ~F	p,y — l,p[tu,v — I -F P Wpi i Pv,p — 1	— l,v	Wj.lv-f-1 ,pl^u~ 1 .v' " P'v.p 4-1 P'U.v — 1 ~~ V jly — i ,pp« 4-1 л	PP-v,p — 1	v 4- J “F
О при п-+оо.
поскольку M(Xi — a)(Xj — a) = 0 при MXt = a и l=£j. Итак,
—L^a2. Последнее равенство означает, что s2 как оценка о2 имеет смещение, равное о2/и. Но это смещение легко устранить; для этого умножим правую и левую части о П— 1	9	п г,
равенства Мг=—-—о на — —  Получаем
M-^-s2 = 02,
п — 1
2	1 п
Следовательно, несмещенной оценкой дисперсии о2 явля-
1 "
ется статистика о2 ==—Ц- У (Х;-Х)2, но это уже не прямая
оценка метода моментов, а исправленная оценка метода моментов.
Таким образом, оценка метода моментов оказалась смещенной. Но оценки метода моментов имеют и положительные свойства, которые вытекают из приводимой ниже теоремы.
Выше было показано, что оценки 0 метода моментов должны быть функцией от выборочных моментов, т. е. с, или nij для некоторых i и j. Для определенности формулировки рассмотрим функцию Н (а,, а,) от двух начальных моментов. Оценка может быть функцией и одного момента (оценка среднего) и трех моментов (оценка коэффициента корреляции), причем, быть может, и центральных. Обозначим через М точку (Л1Щ, Afc,); пусть Но=Н (Mai, Ма,),
Т е о р е м а 8.1 (о свойствах оценок метода моментов). Если функция Н (су, с,) такова, что она явно от п не зависит, в окрестности точки М непрерывна вместе со своими первыми и вторыми частными производными, то случайная величина И асимптотически нормальна и предельное нормальное распределение имеет математическое ожидание Но и дисперсию
DaiH\-\-2HiH2 cov (0,0^)+ DafH2.
Значения дисперсий и ковариаций выборочных моментов (а они являются случайными величинами, поскольку зависят от выборочных значений и могут для разных выборок меняться) приведены в табл. 8.1. Из теоремы 8.1 и этой таблицы
205
следует, что дисперсии предельных распределений, которые представляют собой оценки метода моментов, при п->оо можно представить в виде о2(0)/м, т. е. эти дисперсии стремятся к нулю.
Таким образом, теорема 8.1 позволяет приближенно исследовать оценки, представимые в виде гладкой функции от моментов. Полученная ранее оценка дисперсии нормального распределения — линейная функция Н (т.\)=т\ от центрального момента, поэтому она имеет две непрерывные производные и теорема 8.1 применима, т. е. можно находить среднее и дисперсии предельного распределения оценки дисперсии.
Из теоремы 8.1 и табл. 8.1 можно определить дисперсию предельного распределения оценки метода моментов 62 = т2 „• п и «исправленной», т. е. несмещенной, оценки 02 =---р т2.
Имеем
т. е. предельное распределение исправленной оценки имеет больший разброс, но не имеет смешения.
§ 8.2. Метод максимального правдоподобия
Рассмотрим выборку X=(Xi, Х2....Хп), которая получена
из совокупности, распределенной по закону р (х, 0). Если случайная величина X дискретна, то р (х, 0) — вероятность, а если X непрерывна, то р (х, 0) — плотность распределения.
Для разных 0=(0i, 02....0И) получаются различные за-
коны р(х, 0) распределения набора Л=(Ал, Х2,..., Хп). Задача состоит в том, чтобы найти такое распределение р(х 0), которое бы лучше всего соответствовало выборочному набору X=(Xi, Х2,.... X,.). Соответствие распределения, зависящего от параметра 0, и набора наблюдений означает, что вероятность получить тот же самый набор X при другом значении параметра меньше.
Возникает следующая задача: при заданном наборе Х= ={Xi, Х2,.... Хп) определить такой параметр 0 , чтобы вероятность р (X, 0) (в дискретном случае) или плотность распределения р (X, 0) (в непрерывном случае) была наибольшей. Таким образом, далее будет рассматриваться функция L (в)=р (X, 0), когда X — фиксированная точка, а 0 — переменная Такая функция L (ё)—р(Х, 0) была названа Фишером функцией правдоподобия.
206
Итак, если 0е0, 0 — замкнутая область допустимых значений, то вместо вероятностной или статистической задачи имеем задачу математического программирования: найти такое 6*. чтобы
£ (0*)=тах £ (0).	(8.2.1)
е<=е
Известно, что точка максимума не изменяется, если вместо £(0) рассмотреть In £ (0)=/„(0). Функция /п(0) называется логарифмической функцией правдоподобия.
Если максимум функции /г(0) достигается внутри допустимой области 0, то в точке максимума 0о выполняются необходимые условия экстремума:
I е=во = 0 при /== 1, 2.т. (8.2.2)
Полученная система уравнений называется уравнениями правдоподобия. Корни этой системы 0=(0i, 62,...»6m) могут соответствовать максимуму, минимуму функции /«(§), а также являться точками перегиба. Поэтому необходимо проверить, соответствует ли полученное решение (Г максимуму.
Если же система 8.2.2 не имеет внутри области 0 решения, то это может означать, что решение 0 задачи (8.2 1) находится на границе области допустимых значений 0.
Так как X — выборка, т. е. Xi — независимые одинакозо распределенные случайные величины, то
£ (0)=р (Х,0)=р	0) р (Х2, 0)... р (Х„, 0) и
п
/„(0)=£ 1пр(хр8). i=l
Рассмотрим некоторые примеры оценок максимального правдоподобия.
О Пример 8.3. Нормальное распределение. Для выборки объема п и 61= а, 02=а2 имеем
(*.-У	(\~«,f
Л 'п(е)=-^-1п2л—”-ше2-£ i—1
(*.—в,/ 202
207
Найдем сначала первое уравнение системы (8.2.2). Получаем
«„(в)
де.
А.£2(х,-^(-81)_0;
п
в результате преобразований получаем	—л6|=0, а затем вто-
/=1
рое уравнение
W)
<?о2
"У (Г-0.)2 = О; 2 е2 262 ,4 '	'
после преобразований имеем
У (Xi-e1)2-ne2=o.
1=1
Итак, получена следующая система уравнений правдоподобия:
У^.-пе^о.	y^i-e1)2-ne2=o.
*=1	i=l
Из первого уравнения находим
Л I V %TTIW-
а из второго, используя значения для 0Ь получаем
i= 1
Остается показать, что в точхе (?=(/, s2) функция /„ (0) достигает максимума, для этого надо проверить достаточные условия .максимума функции, ф
О Пример 8.4. Распределение Парето. Это распределение имеет место в задачах распределения душевого дохода и имеет вид (6>0, а>0)
fa <е\»+1 р(х, е)= {“о“( Т)
I о
при х>0.
при xj>0.
Функция правдоподобия имеет следующий вид:
а6“+1 а0“+1
а0“+‘
Ь(0)=< Х“+1 %“+’
i0, если хотя бы одно значение ^^0.
при ^.>0, г =1,2, ..., п.
208
Отсюда следует, что L(0)>O лишь тогда, когда 0 cmin Х„ но •бываниом 0 при а>0 величина 0“ также убывает, поэтому maxi(O) при 0>О достигается в точке S’=minX,-. Эта точка и является оценкой максимального правдоподобия. В этой задаче п'„ дполагалось, что а известно. •
1 О Пример 8.5. Распределение Парето (параметр а неизвестен). Неизвестный параметр мы условились обозначать 0, поэтому ппотность распределения примера 8.4 запишется в виде
(0 /^\е+‘ р (х, 0)= 4 с \ X )
( О
при х>с>0, (0>О).
при x<Zc,
п
Теперь найдем /п(6)= 1пр(ЛГр 0) при Х^с. i=l
Так как
In р(Х;, с)=1п 0 —In с+(0+ 1) (1п с — In ХД
то
ln (6)=n In 0 — п 1п с+п (0+1) 1п с — (0+1)	In Xt.
< = 1
Отсюда получаем уравнение относительно 0
л	п X
Z'‘(e)=T+rt,nc-Z 1пХ‘=Т“ Е 1п~г=0-
V Xi
Решая его, находим точку 0 = п/	1п---- Сумма со слагаемыми
х,
In--- положительна, поскольку все X.J&c, т. е. Х,/с^1, а лога
рифмы величин, больших или равных I, положительны или равны 0.
Для доказательства того, что полученный экстремум является максимумом, найдем* вторую производную-
и
Она отрицательна для всех конечных положительных 0, т. е. и для точки 0. Отрицательность второй производной в точке экстремума н является достаточным условием максимума. @
1 Свойства оценок максимального правдоподобия
Для обеспечения «хороших» свойств оценок максимального правдоподобия необходимы некоторые условия регулярности, накладываемые на плотности (вероятности в дискретном случае).
209
Запишем эти условия для непрерывного случая (для дискретного случая вместо интегралов должны быть соответствующие суммы).
Условия регулярности:
а)	плотность распределения р (х, 0) набора X такова, что область, где плотность р(х. 0)=И=0 для всех х, не зависит от параметров 0;
б)	соотношение All = J ip (х, 0) dx= 1 можно дважды дифференцировать под знаком интеграла, а соотношение
Л1(Г— J 0 (х) р (х, 0) dx
можно один раз дифференцировать под знаком интеграла; г д1пФ)
в)	Л1/"(0)=\ — -чн~Р(х, 0) dx=#o при i^j;
Замечание 1. Все интегралы в условиях б) и в) многомерные.
Замечание 2. Если плотность р (хДЭ) зависит лишь от одного параметра и приходится иметь дело не с произвольным набором данных, а с выборкой, то условие в) упрощается, поскольку
Ml”(0)= £ $Г(0)р(х,0)dx=n J /;'(0)р(х,0)dx, i=l
где /j (0)= In р (х, 0) и все интегралы одномерные. Величина
1 (°)= 5[д-1П^Х,е) Jr (х, 0) dx=M
~dlrp(x,0)T
<50
называется информацией (по Фишеру) о неизвестном параметре, содержащемся в одном независимом наблюдении X.
Теорема 8.2 (о свойствах оценок максимального правдоподобия). Если для выборки Х=(Х\, Хг, ...,ХП) объема п выполнены условия регулярности а) — в), то:
1)	решение 0 уравнений правдоподобия единственно;
2)	0 — состоятельные оценки параметра 0;
3)	распределение оценки б асимптотически нормально и предельное распределение имеет математическое ожидание 0 и дисперсию 1/п/ (0);
4)	оценка максимального правдоподобия эффективна при п-»-оо.
Условия регулярности —- достаточные условия для того, чтобы оценки максимального правдоподобия были асимптоти
210
чески наилучшими, т. е. несмещенными, и имели наименьшую исперсию, хотя имеются примеры, когда условия регулярности нарушены, а оценки максимального правдоподобия могут быть наилучшими после устранения смещения.
Пункты 3) и 4) теоремы позволяют находить асимптотически наименьшую дисперсию, поскольку при п-+оо эффективность
п/(0)£)0	1
г\а	___ __________
^п/(0)	Л4[/;(0»]2
1
Неравенство /ХГ>1/п/(0) для несмещенных оценок на-
зывается неравенством Рао — Крамера — Фреше.
Для многомерного параметра 0 величины М
dQidGj
в ус-
ловии в, для любых i и / образуют матрицу /(0), и это условие
означает для нее невырожденность, т. е. существование обратной матрицы/ (0). Неравенство Рао — Крамера — Фреше означает при этом, что матрица р)0—— /-1(0) | асимптотически неотрицательно определена. Напомним, что JX для
многомерного параметра превращается в матрицу центральных вторых моментов оценок 0=(0|, 62, .... 0„), как набора случайных ветнчин.
Проверка условий — самое «уязвимое» место в теореме 8.2. При нарушении условий регулярности несмещенные оценки максимального правдоподобия могут не быть даже состоятельными, но могут быть и сверхэффективными, т. е. иметь дисперсии меньшие, чем /_* (0)/п, например ЕЯ = = с (0)/п2, т. е. скорость стремления дисперсий к 0 может быть большей, чем 1/п.
Примеры асимптотически наилучших оценок
Схема Бернулли с неизвестной вероятностью «успеха» в одном испытании. Если «успех» соответствует Х= 1, а «неудача»— Х = 0, то вероятность случайной величины X запишется так:
пД	ПРИ *=1.
pU0)=|1_0 п*рИ х=0
(8.2.3)
211
Для вероятности р (х, 0) логарифмическая функция правдоподобия для оцного испытания X такова:
/ = 1пр(х, 0)=|!п?.	- прн х=1,
1 и \	/	(1п(1—0) при х=0.
для п испытаний (v — число успехов)
/„ = v In 0-f-(n —v) In (1—0).
Отсюда можно получить оценку 0 =— / Х(=— (см. за-Я i = |
дачу 8.3), а также найти

при х = 1, при х=0.
Теперь получаем (см. § 7.1), что Af<F=0, и находим 1 / 1 \2 /(0)=A4(/;y= fr р(1,0)+/_±_ Ь(о,0)= =±+*= __ 1 . 0	1—0	9(1—0)
Из неравенства Рао — Крамера — Фреше и теоремы о свойствах оценок максимального правдоподобия следует, что наи-. „	0(1—0)
меньшая дисперсия равна 1/(п/(0)) =—---но такая же
п
„ 1 v
дисперсия и у оценки	0=— > X.; следовательно,
" .=1
оценку улучшить нельзя.
Для этого примера все условия регулярности выполняются, посколпку логарифмическая функция правдоподобия — конечная сумм? и в каждой точке х=0,1 дифференцируема.
Нормальное распределение с неизвестным средним и известной дисперсией с2. В этом случае
U-8)2
р(х, 0)=——е 2о2 .
у2л о
л — 11
Оценкой параметра 0 является Q = X=— ) Xit а
In р (х, 0)= /, (0)= - 1п (<2л ,о)- (Х2р26".
212
Поэтому l'i (0)=* Л и *"(0)=--у- Последняя величина не
11	U	G
зависит от X, т. е.
лф'(0)]=м	Ь=-/(0).
Отсюда следует, что дисперсия DX=a2/n такая же, как и в § 7.1, поэтому X — лучшая оценка в классе любых функций от результатов наблюдений, а не только среди линейных комбинаций.
Нормальное распределение с неизвестной дисперсией и известным средним а. В этом случае
(*-д)г
р (х, 0)=—===-е	28 .
д/2л0
Логарифмическая функция правдоподобия для выборки Х= =(Xi, Xlt .... Х„) объема п равна
(0)= У In р (Xif 0) = -п In	In 0—
Находим уравнение правдоподобия:
/'(0)=-” ‘ +-У У (Х,-а)2 = 0.
"' '	2 0 п 202 AV
Решением этого уравнения является величина — I (Л-а)2. i= 1
отличающаяся от уже найденной ранее только тем, что оценка а=Х заменена истинным значением а. Теперь остается определить лишь дисперсию эффективной оценки, т. е. Ж'(0). Имеем
/"(0)= " L V (Х. — а)2.
202	03
Согласно свойствам математического ожидания, учитывая, что M(Xt — а)2 = 0, получаем
202	03 А,	202	03	202
213
Полученное значение отличается от /(0) только тем, что 1	п
/(0)=-— при п=1; —5-=п^если п>°- Таким образом, 20	202
1 "
дисперсия 0=— £ (Xj — a)2 должна быть равна в силу теоре-П i=l
мы о свойствах оценок максимального правдоподобия при п->оо величине 202/п В самом деле, полученная оценка 1 "
— £ (Л —а)2 несмещенная и имеет дисперсию 202/п для
любого (а не только большого) числа наблюдений (см. задачу 8.4).
Распределение Парето. Если распределение Парето записано в виде
{0	\в+‘
— I — I при Х^с,
с \х /
О при х<с.
то оценка максимального правдоподобия параметра была найдена ранее. В силу теоремы о свойствах оценок максимального правдоподобия эта оценка при большом числе наблюдений является примерно нормальной со средним значе-„	1	02
иием 0 и дисперсией, равной---	„—, что следует из
~ ™['n(0)] п
примера 8.5, в котором было найдено значение I"(0).
Если в распределении Парето неизвестен другой параметр, т. е.
(а /0 \“+’
Г (у)
О при х<0,
то область, где р (х, 0)=/=О, является полупрямой от 0 до оо; следовательно, она зависит от неизвестного параметра. Для набора из двух наблюдений это первый квадрант координатной плоскости с началом, перенесенным в точку (0, 0); для п наблюдений — соответствующая многомерная область. Поэтому условие регулярности а) не выполняется, ио в данном случае оценка максимального правдоподобия сверхэффективная.
Равномерное распределение:
/	|4- при 0^0,
р (х, 0)= < 0 1	’
0 при х<0 и х>0.
214
Оценку нельзя анализировать аналогично предыдущим примерам (см. задачу 8.7). Скорректированная несмещенная оценка метода максимального правдоподобия S-__^±L max X, будет наилучшей.
0 П
§ 8.3. Другие методы оценивания
Кроме уже описанных методов оценки параметров распределения существует ряд других методов, например метод наименьших квадратов, метод наименьших абсолютных отклонений н, наконец, метод наименьшего максимального абсолютного отклонения. Каждый из методов в определенных ситуациях обладает преимуществами по сравнению с другими.
Все из рассматриваемых ниже методов связаны с методом максимального правдоподобия, хотя каждый из них возчик отдельно и имеет самостоятельное значение. Метод максимального правдоподобия выступает как ориентир и гарантирует в определенной мере их «качественность».
Все методы будут проиллюстрированы на примере одной и той же задачи
Пусть необходимо узнать часовую выработку 0 рабочих в обычных условиях для какой-либо операции. Результаты наблюдений обозначим Xi, t = l, 2, .... п. В силу характерных, специфических для каждого конкретного рабочего факторов и условий наблюдений Xi будут отличаться от средней часовой выработки 0 на некоторую величину е,, т. е. Х; = 0 + е<, где о величинах е/ известно лишь, что в среднем отличия е, нивелируют друг друга, т. е. Ме, = О и для них существует дисперсия.
О Призер G.6. Метод наименьших квадратов. Предположим, что распределение е, нормальное. Поэтому распределение X, имеет вид
fr~8)2
—L-e	2о2 , /=1.2..... п;
^2л а
Функция правдоподобия равна
—з-Уу-в>2 2сг '
£(в)-=(1/^а)пе	=Се-°г,
где С=(1 /дйл о)" > 0, а = 1 /(2а2) > 0 и Т =	(Л{ — в)2. Следователь-
1=1
215
ио, функция правдоподобия при изменении 0 имеет максимум тогда п
когда Т= (X, —0)2 достигает минимума, ф i=l
Итак, метод наименьших квадратов определения оценки неизвестного среднего состоит в том, чтобы определить ее из решения задачи математического программирования: найти такое значение, 0 которое минимизировало бы
Г= £ (Х..-0)2,
<= i
если на 0 накладываются такие ограничения, что допустимые 0 должны принадлежать замкнутому множеству 0. Так как минимизируется сумма квадратов отклонений от среднего, то и метод называется методом наименьших квадратов. Если на параметр 0 не накладываются ограничения типа 0е Е0, то оценка для 0, полученная по этому методу, 0 = Х, т. е. совпадает с оценкой максимального правдоподобия для нормального распределения.
Отметим, что оценка максималпного правдоподобия для 2
неизвестного параметра и почти совпадает с минимумом Г и равна
О Пример 8.7. Метод наименьших абсолютных уклонений. Допустим, что Bi распределены по закону Лапласа с нулевым средним, тогда Xt распределены по этому же закону, ио со средним 0, т. е.
1	IX,—01
р(Х.,0)=—е ° а
Функция правдоподобия в этом случае равна
где С=(~у>0, а=-|->0 и Т= £ IX,—0|>О.
Максимум функции правдоподобия достигается, если Т достигает минимума, т. е. определять оценку нужно из решения следующем задачи: минимизировать величину
Т= £ IX,—01, Оеб.
1=1
216
Если множество в — многогранник, то нахождение оценки своей к решению задачи линейного программирования, которое может быт! получено, например, симплекс-методом.
Если ограничений на 0 нет, т. е. 6 — вся прямая, то решением является выборочная медиана 0, равная для п = 2/г —1 6=Х£== —3 г для п = 2/г оценкой может быть любая величина 31/2 = 0, е" «"только	(см. задачу 8.8).
Заметим, как и ранее, что оценка максимального правдоподобия для неизвестного параметра а равна
5=— У IX,—51,
и 2о как и выборочная дисперсия, служит мерой рассеяния случайной величины X. ф
О Пример 8.8. Метод минимакса (наименьшего максимума абсолютных отклонений). Рассмотрим равномернее распределение е(; в этом случае распределение X, также равномерно:
Р(хрв)=(-^- ПР“ 'еР-*. 0+°1.
( 0 при х^[0 — а, 0+а].
Функция правдоподобия
L (0)=(1/(2а))л,
если все X, удовлетворяют неравенствам 0 — а^Х.^О^-о, и равна нулю в остальных случаях. Случай, когда параметр а известен, малоинтересен, так как функция правдоподобия постоянная и нужно найти любую точку 0, где L (0)#=О. Если неизвестны 0 и а, то можно менять в функции правдоподобия не только 0, ио и а, при этом L (0, о) будет равна либо 0, либо (——Для максимизации L (0, а) нужно миии-\2а /
мизировать а во всех точках (0, о), где L (0, а)=#0. Задача сводится к решению следующей задачи математического программирования: минимизировать по 0 max |Х,- — 0|, т. е. найти такое значение 0, что
max IX— 61 =min max IX— 0|, 0е0. в 
Если дополнительные ограничения иа (0, а) не накладываются, т- е. (О, о)—вся полуплоскость (0, а>0), то решение известно (см. также задачу 8.9):
max Xj-f-min X,
(8.4.1)
max X—min X(
о =—-----— ---- rnm max (X, — 0). ф
2	e i
217
Приведенные оценки, как оценки максимального правдоподобия, обладают очень хорошими свойствами, но каждая для своего распределения случайной составляющей е.
Теперь рассмотрим случай, когда о распределении известны только такие общие свойства, которые не позволяют конкретизировать вид плотности распределения. Например известно, что плотность распределения симметрична относительно некоторой точки, вероятности попадания в окрестности которой наибольшие,— это один класс распределений или отклонения случайной величины от некоторого значения ограничены и вероятности попадания в окрестности границ не малы, а скорее велики,— таков другой U-образный класс распределения. Другими словами, рассмотрим вопрос, что произойдет, если исследователь «перепутает» распределения примеров 8.5 и 8.7 или «перепутает» распределение примера 8.8 с {/-образным распределением на том же интервале.
Рассмотрим для простоты свойства лишь оценки параметра 0 (для параметра а эти свойства аналогичны). Выборочная медиана — состоятельная и асимптотически нормальная оценка для случая а), а оценка (8 4 1) асимптотически наилучшие и для равномерного и {/-образного распределения.
Итак, на практике бывает выгоднее в широком классе распределений искать такую оценку, которая хотя бы и не была нанлучшей для каждого конкретного вида плотности (например, нормального распределения, распределения Лапласа или распределения Коши), но была бы одинаковой дчя всех распределений (т. е. устойчивой для всего класса) н обладала бы достаточно хорошими свойствами. Подобные оценки часто называют устойчивыми или робастными.
Приведем для распределений с непрерывнт дифференцируемыми плотностями результат о выборочной медиане (обозначим ее йд/г), который показывает ее устойчивость (робастность).
Теорема 8.3. Если f (di/2)#=0, го выборочная медиана tTi/a асимптотически нормальна и предельное распределение имеет математическим ожиданием di/2 и дисперсию, разную
1 1
п 4f(dI/2)’
Для класса распределений с плотностями, равными нулю вне некоторого отрезка, можно получить теорему, показывающую устойчивость (робастность) оценок вида (8.4.1) для середины этого неизвестного отрезка.
Бывают другие трактовки устойчивости (см. задачу 8.10). Вместо параметра 0 в примерах 8.6—8.8 может
218
некоторая известная функция от t с неизвестными оаметрами, например 0 = а + Ь(, где t известно, а парамет-ы а и b неизвестны. Их следует оценить по наблюдениям ,езультатов X,- и
Задачи
8.1.	Пусть для выборки Xi. Х_ ... Х„ объема п получена выборочная функция распределения F(х). Рассматривая ее как функцию распределения некоторой случайной величины, покажите, что первые начальные моменты (относительно 0) соответственно равны
a2=yZx?- °з=^-£л?. i=l	i=l
и т. д., а первые центральные моменты (относительно aj равны
m'=v Z	т2=^- £
i=I	i=l
тз=4- £ <x/-ai)3 н т-д-
i = I
Указание. Так как в точках X*вариационного ряда F(х) имеет скачок, равный 1/п, если среди X/ только одна величина равна X* (или 2/п, если среди Xj ровно две величины равны друг другу и равны X/и т. д.), то «вероятность» появления X* для функции распределения F(х) равна числу точек Xi, равных ХЙ деленному иа объем выборки (используйте данные табл. 8.2).
8.2.	Проверьте справедливость следующего равенства при любой константе с:
i=l	i=l
8.3.	Покажите, что оценка максимального правдоподобия для неизвестной вероятности успеха 0, если сделано п независимых испытаний (схема Бернулли), в которых получено v успехов, равна 0=v|n. Докажите, что оценка 0 несмещенная.
8.4.	Покажите, что
м R- £ (Х-я)21=а2 и D Г± £ (X-af l=°i,
L •=> J	|_ <=i J
где a=MXi и a2= DXh а распределение независимых X,- нормально для всех i=l, 2, .... п.
219
Указание. Воспользуйтесь тем, что
оо	<X~Q^
щ = \ (х-а)*-4=ге	2о2 dx=M(X,.-a)4 = 3a4
J	д/2ла
— ОС	’
для любого «=1, 2....п.
8.5.	Покажите, что нанлучшей оценкой для параметра 6 6*
в распределении Пуассона р (х, &)= — е~®, х = 0, 1, 2, 3,
является 0=— V X., обладающая следующими свойствами-
п '-1 «=1
мб=е, вё=е/п.
8.6.	Покажите, что наилучшей оценкой для параметра О в показательном распределении
р(х,О)= [те”Х/6 ПРИ х^0' ( 0 при х<0
_ 1 "	„ е2
является 6=— У X; причем Л1О=0, а Ов=—.
п 1—* 1	п
1=1
8.7.	Покажите, что оценкой максимального правдоподобия для равномерного распределения
п1х (Я-/1/0 ПРИ ОСхС0.
Р(х. и; —| 0 при х<о и х>0
служит 0= max X,.
I<i<n
8.8.	Покажите на примере n — 2k (fe=l), что решением задачи IX, —01-f-IX2 —0|—>min для Xi =— 1 и Х2 = 0 может быть любая
точка, лежащая между Xi и Хг. Для n=2k — 1 и /г=2 покажите, что решением задачи | — 1—0|4-|0 — 01 4-12 — 0|->min, т. е. при Xi=0, Х2 =— 1, Х3=2, это точка 0 = 0.
Указание. На числовой прямой отметьте точки X, и рас-
смотрите все случаи, когда точка 0 принимает значения от — с» до 4- сю.
8.9.	Покажите, что функция, равная
при (0, о) таких.
что 0 —а<Х, и 04-о>Х(, и 0 в остальных случаях, достигает
максимума, когда
min Xf4-min Xf
min Xf —min Xt
a=—!---—!-----=min max |X, —01
Z	e i
для точек X. = l, X2=2, X3 = 4
220
Указание. На полуплоскости (0, о>0) изобразите три множества (0, о) таких, что 0 —п<Х/ и 04-п^Х,-, 1=1, 2, 3....
Найдите их общую часть и для нее определите минимальное значение а и соответствующее ему значение 0.
8.10.	Даны выборки Xi, Хг,..., Хп для четырех законов распределения.
Таблица 8.2
Номер наблюдения	Закон распределения			
	1	2	3	4
1	11,291	6,876	11,812	11,527
2	10,273	10,437	9,384	8,888
3	14,891	10,377	10,131	9,040
4	9,353	9,569	9,440	10,713
5	9,864	11,370	10,181	8,185
6	10,592	3,785	9,396	10,703
7	9,424	9,953	10,311	8,701
1 8	12,595	7,614	10,785	10,868
9	10,482	12,175	11,752	11,781
10	8,051	9,936	9,880	9,804
11	10.120	10,403	8,855	8,703
12	11,948	9,431	11,068	11,600
По выборкам для четырех различных законов распределения (табл. 8.2) постройте оценки параметра 0 методами наименьших квадратов (1), наименьших абсолютных отклонений (2) и минимакса (3) по первым одиннадцати наблюдениям и заполните табл. А (см. примеры 8.6—8.8).
Таблица А
Закон распре деления	Метод оценивания		
	(1)	(2)	(3)
1 2 3 4			
Таблице Б
Закон распределения	Метод оценивания		
	(1)	(2)	(3)
1 2 3 4			
Заменив какое-либо одно из одиннадцати наблюдений (например, десятое иа двеьадцатое), заполните табл. Б.
Какие нз оценок изменились? Объясните почему.
Глава 9
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
В предыдущей главе были рассмотрены методы получения точечных оценок неизвестных пара» етров по выборочным данным, было установлено, что говорить о полуденной оценке (например, оценка а среднего а равна 1,097) как об истинном параметре (среднее равно 1,097) «довольно рискованно». Лучше вначале получить разброс этой оценки (в качестве меры разброса можно принять среднее квадратическое отклонение оценки среднего, например оа=0,23) и лишь после этого высказывать соображения об истинном среднем. При этом принято говорить не о точке (1,097), а называть интервал для истинного среднего. В этой главе как раз и рассматриваются методы построения интервальных оценок или доверительных интервалов для неизвестных параметров.
§9.1. Доверительный интервал для математического ожидания
Из § 8.2 известно, что 0’=Х =— £ Xt является наилуч-п i-i
шей несмещенной оценкой для математического ожидания MX=Q нормального распределения
f (х, 0)=—------e-(x-e)!/(2as)
^2ла2
по выборке объема п. Пусть дисперсия Xt DX;=c2 известна, где о2 — некоторое конкретное число. Как далеко может находиться случайная величина X от неизвестного числа 9, оценкой которого она является? Чтобы ответить на этот вопрос, рассмотрим случайную величину 0—Х=Д, представляющую собой отклонение X от 0; |Д| — расстояние от случайной величины X до неизвестной постоянной величины 9-
222
Отклонение Д, вообще говоря, может изменяться от — оо
। оо, поэтому нас_ прежде всего интересует вероятность того что отклонение X от 0 не превысит предельной ошибки
е допустимого уровня:
Р(|Л| <е)=Р( —е<Х —0<е).
Так как в этом неравенстве только величина X является случайной, то эта вероятность зависит только от распределения X.	_	_
Рассмотрим два события: Л) — е<0 — Х<г и В) X — е<
Х+е. Очевидно, что если произошло событие А, то произошло и событие В, и наоборот, если произошло событие В, то произошло и событие А. Поэтому эти события эквивалентны, т. е.
Р(Д)=Р(В)=Р(9-е<Х<0 + е) = Р(Х-е<0<Х+е).
(9.1.1)
Таким образом, если F_ (z) — функция распределения непрерывной случайной величины X, то
P(0-e<X<O + e)=F_(O + e)-F_(O-e).
Определим (z) — функцию распределения случайной
величины Х=—X. +—Хг + ,.... — Х„, где X^e^(9, о2). Из-п п	п
вестно, что линейная функция от нормальных случайных величин является нормальной. Поэтому X — нормальная случайная величина, а нормальная случайная величина задается двумя параметрами: математическим ожиданием и дисперсией
МХ=— У мх. = 9, Dx=-L У dx= —. " i=i	n2 1=\	n
Таким образом, плотность распределения Xt такова:
(z—мх)2	(z-ef
e 2DX = -__1 - _ e 2^n,
\2nDX	~\l2n o/~^n
отсюда
z	z .^-flL
J/_(z)dz=-=i---=- S e2o2/n dz,
oo x	y2n o/yn -a.
223
поэтому
__	0 4^ в
P(0-e<X<0 + e)= J f_(z)dx =
6 —е %
После замены переменных и =---j=- имеем
о/д/п
__	। г.'уп/в и?
Р(0 —е<Х<0-|-е)=—=г	J е 2 du =
V2lt -е^/о
= ф(±д^)-ф(—1д,П)=1-2ф(- ®
где Ф (z) — функция распределения стандартной нормальной случайной величины *\
Из (9.1.1) следует, что
Р(0-е<Х<0 + е)=Р(Х-е<0<Х + в)=
Обозначив X — e = 0i(X), X^Xi, Хп), и Х + е=?2(Х), имеем интервал (0i (X), 02 (X)), который накрывает с вероятностью, равной Ф	—Ф —- -д и У неизвестную вели-
чину 0, и эта вероятность не зависит от 0, т. е. она одна и та же для любых значений 0. Отсюда следует, что, каково бы ни было неизвестное значение 0, интервал (61 (X), 62 (X)) с вероятное гьк? 1—Ф( —— д/n | накроет это неизвестное значе-\ ° /
ние 0. Сам интервал можно определить зная X. Например, если сделано п = 400 наблюдений и получено Х=27,6, то интервал (27,5; 27,7) накроет неизвестное число 0 с ееро-
Из определения функции распределения следует, что найдена вероятность полуоткрытого интервала, у которого один (левый) конец принадалежит ему, а другой — нет. Но вероятностью попаденпя в точку можно пренебречь, поскольку она равна 0.
224
ятностью (интервал получен при е = 0,1, о2 = 2,87)
._2ф/-------2d = ЛЙ00\=1— 2Ф(-1,18)=0,76.
у/2^7 v /
Теперь можно дать строгое определение доверительного интервала.
Определение 9.1. Интервал /(Х)=(0|(Х), 62 (X)) называется доверительным интервалом надежности 1 — а для неизвестного параметра 6, если вероятность тех X, для которых выполнено неравенство &i (X) < 9 < бг (X), равна 1—а для любого допустимого значения 9.
Может оказаться, что вероятность ошибки (в рассмотренном выше числовом примере вероятность того, что интервал не накроет неизвестный параметр, равна 0,24) слишком велика. Выясним, нельзя ли эту вероятность уменьшить. Для этого рассмотрим выражения 1—2Ф^—Ъ—^п^. Увеличивая е можно увеличить надежность, т. е. вероятность того, что интервал (9i (X), 92 (X)) накроет неизвестный параметр 9. Но это исследователя также может не устроить, так как увеличивает допуск на 9. Но надежность можно также повысить увеличивая число наблюдений. Допустим, что имеется возможность наблюдать столько раз, сколько нам необходимо. Тогда возникает следующая задача.
О Задача. При заданных точности е и надежности 1—а доверительного интервала определить наименьшее число наблюдений по, которое обеспечивает указанную надежность, т. е. при л^Ло
Р(Я'1(Х)<0<е2(Х))>1-а.
Так как
/>(6, (Х)<е<е2(Х))=1-2Ф
то получаем соотношение
Это неравенство выполняется, если--~ —а/2 =
/-	\2
__	-	Ct	t Ua \
----ия, где д = —-100 %, откуда следует, что л> I ——о ) =п0.
х	\ 8	/
В частности, при уровне доверия 1 — а-=0,95, <? = 2,5 % и йя= ~di _а/2 = 1,96 имеем
с е. л0=1104. ф
® В. А. Колемаев и др.
225
Запишем теперь явный вид доверительного интервала для оценки среднего значения в нормальном случае, когда дисперсия наблюдений известна и равна о2, через квантили:
б, (Х)=Х —d‘~“/2 о=Х+-^-о, б2(Х)=Л+-^Ц^-0, д/п	д/n	у/п
через q %-ные точки (^=—100 %):
„	—	„	— и„
6,(Х)=Х----^=-о, 02(Х)=ХЧ—‘L-o,
уп	-уп
и через двусторонние (критические) границы
ад=Х4-ио-^, б2(Х)=Х+иа-^_ д/n	д/п
Учитывая, что Х = б—оценка неизвестного математического ожидания, которая является нормальной, а также что Л1б'=0 и Ej§=a*/n, можно записать (1 —а) 100 %-ный до
верительный интервал следующим образом (^=— 100
б, (Х)=Х
и,	—	„
-^о<0<%4—-о = 0,(Х). д/п	”
Возникает вопрос: если наблюдаются случайные величины, не имеющие нормального распределения, то как построить такой интервал (б|, б2) для неизвестного параметра 0, чтобы Р (6j (X) <0<бг(Х))= 1 — а для любого допустимого значения 6, т. е. Ое0?
В следующем параграфе обосновывается метод прибли-енного построения доверительных интервалов в тех случаях, когда число наблюдений достаточно велико, а распределение генеральной совокупности отличается от нормального.
§ 9.2. Общий подход к доверительному оцениванию
Известно, что при достаточно большом объеме выборок п (и—>оо) опенки максимального правдоподобия и оценки метода моментов (см. § 8 1 и 8.2) асимптотически нормальны, т. е. имеют примерно нормальное распределение. Поэтому можно воспользоваться результатами предыдущего параграфа.
Пусть б=б(Х)—какая-либо оценка (будем рассматривать только регулярный случай, если оценка 0 является 226
оценкой максимального правдоподобия). Известно, что при _>оо Мб->9 и дисперсия ведет себя как 1 /п, умноженное на
функцию от 0. Обозначив эту функцию через о2(0), при достаточно большом п имеем
Л19яе; О0ло2(9)/п,
что отличается от равенств для оценки среднего в § 9.1 лишь тем, что 09 может зависеть от неизвестного параметра. Если о2 (9) не зависит от 0, то задача сводится к только что решенной. Если же о2 (9) зависит от 0, то поставим вопрос так: нельзя ли преобразовать оценку 0" в g(6)=g и неизвестный параметр 0 в g (0)=£, чтобы g была оценкой g, и для g дисперсия уже не зависела от неизвестного параметра? Тогда можно воспользоваться результатом § 9.1, построить доверительный интервал для g и затем с помощью обратного преобразования g~l, которое является обратной функцией к функции g, перейти к интервалу для 0.
Пригедем несколько примеров, в которых параметры а, Ь, с неотрицательны
1*. Если y=g (x)=ceax+tl, то обратная функция х = =g~'(y)=-^(ln у—1п с—Ь), у>0.
2*. Если y=g (x)=a-sin bx, при —Т°
x = g-1(y)=-|-arcsin (у/а), —
3*. Если y=g(x)=ayx — b и х^Ь, у>0, то x=g~'(y)=y*/c?+b.
4*. Если y=g (х)=-^- In -J-i^-=arcth x и — 1<х<1,то
рУ__е~у
функции th и arcth — нечетные, т. е. th( — у)=—х и arcth( —х)= —у.
Из этих примеров следует, что если каждому значению y~g(x) в области всех у ставится в соответствие лишь одно значение х, а в области значений х каждому значению х — лишь одно значение у, то обратная функция g~' всегда существует.
Определим теперь преобразование g (0), т. е функцию g (0). Если 0 — оценка метода моментов, то из теоремы о свойствах оценок метода моментов следует, что g (6)=g при
8*
227
п-^со является оценкой для g = g(Q) и она примерно ноо-мальна, причем
Mg=Mg(^g(e\
Og = Dg^ [g'(Q)f D (6)=^(e)°(9)]2.
n
Аналогичные выражения можно получить и для оценок максимального правдоподобия в регулярном случае.
Таким образом, функция g (0) при п-»-оо примерно нормальна:
М£(?Г)«£(0),
Dg(^«^[g'(0)o(0)]2«^/n.
Но для сведения рассматриваемого случая к результатам предыдущего параграфа необходимо, чтобы величина о-а «£'(0)°(0) не зависела от 0, т. е. чтобы выражение g'(9)o(0) не зависело от 0. Это означает, что g'(Q) о(0) должно быть постоянным, например g'(0) с(6)= 1. Последнее равенство возможно, так как получено дифференциальное уравнение g' =
—
0(0) Произвольная постоянная в неопределенном интеграле может быть выбрана так, чтобы окончательные выражения были наиболее простыми.
Воспользовавшись результатами § 9.1 и учитывая, что Dg=Dg(6)= 1/п, можно приближенный доверительный интервал для g(0) выразить через g(6):
g(0)_^<g(0)<g(g)+_1^.
vn
Этот интервал с вероятностью, равной примерно 1 —а, накроет неизвестное значение g(0) Результат тем точнее, чем больше величина п.
§ 9.3. Примеры построения доверительных интервалов на основе общего подхода
/. Оценка параметра пуассоновского распределения
Пусть Xi, Хг,Хп — независимые наблюдения, каждое из которых распределено по закону Пуассона, т. е при 0>О
Р(Х,=х)=-^-е-е, х = 0, 1,2,...,
где 0 — неизвестный параметр (интенсивность текучести).
228
Оценим 9 с помощью доверительного интервала. Наилуч' — 1 л
щей оценкой для 9 являются 9=—Xt и МО = 6, ZM) = 9/и. П <=1
Таким образом, о2(9) = 9, т. е. о(9)=дД Отсюда следует, что функция g(0) равна \-^=2д/9.
J д/и
Теперь можно построить доверительный интервал для y[Qt а именно: при достаточно большом п
Р f Ггд/б —j < 2^jQ< ^2лД+^- р «1 - а
для любого значения 9. Поэтому если п таково, что (2^t-uo)A'«>0, то
(здесь были использованы результаты примера 3* для обратных функций из § 9.2)
«Качество» приближения приведенных интервалов демонстрируется для некоторых данных в табл. 9.1, в которой для разной надежности и объемов выборки приведены точные и приближенные границы.
Таблица 9.1
Надежность	1— а = 0,95		(ы« =	1,96)	1—а=0.99		(иа=2,58)	
Объем выборки	л =	10	п —	40	п =	10	п =	40
Границы доверительного интервала	Точные	При-бли-жен-ные	Точные	Прибли- жен -ные	Точные	Приближен -ные	Точ- ные	Приближен -ные
Начало интервала	0.480	0,476	0,714	0,714	0,372	0,350	0,638	0,633
Конец интервала	1,839	1,716	1,362	1,334	2,140	1,982	1,484	1,450
229
Из таблицы следует, что с ростом надежности качество приближения «ухудшается», но даже в самом «плохом» случае 2,14—1,982
отличие от точных границ не более--fggg----*00=8 %, что
вполне достаточно для экономических приложений.
2. Оценка неизвестной вероятности
Пусть ц — число успехов в п независимых испытаниях; тогда оценка максимального правдоподобия неизвестной вероятности р = 9 равна 0 = р/п. Оценка несмещенная и эффективная, 09=-^-^——=	. Поэтому g (9) = д/о (1 —9) и
п п	’
g (9) = \—, —	- = 2 arcsin \1д.
Используя результат § 9.2, получаем приближенный доверительный интервал (при arcsin д^Г>«о/2д^Г):
«Качество» приближения иллюстрирует табл. 9.2.
Таблица 9.2
Надежность	1— а = 0,95		(««=1.96)		1— а=0,99		(иа = 2,58)	
Объем выборки	п —	=20	П =	=80	п =	= 20	п =	80
Г раиицы доверительного интервала	Точные	При-бли- жен-ные	Точные	Прн-бли-жен-ные	Точные	При-блн- жеи-ные	Точ- ные	Приближен -ные
Начало интервала	0,087	0,091	0,160	0,162	0,058	0,054	0,137	0,135
Конец интервала	0,491	0,456	0,359	0,349	0,560	0,526	0,394	0,383
230
3 Оценка коэффициента корреляции
Пусть (Xi, У|), (Хг, У2),	(Хп, У„) — независимые наблю-
ния над двумерной случайной величиной. Оценим коэффициент корреляции р. Оценкой метода моментов для коэффициента корреляции является выборочный коэффициент корреляции
Р
mii
т02т20
где, как и в § 8.1,
m„=-У (Х.-Х)(У,-У), Х=± V Xt, Y=±- У У.,
Из теоремы (8.1) о свойствах оценок метода моментов получаем
Мр«р и
поэтому а (р)= 1 —р2
g (p)=J 1п 4±T=arcth р=2-
J I —р	1 Р
Получено z-преобразование Фишера для коэффициента корреляции. Это преобразование хорошо исследовано, поэтому для него известны следующие более точные соотношения:
М argth р« argth р + 2	.
D argth р«
1
п-3'
Построим теперь (1—а) доверительный интервал для argth р (заменим п на и —3, ио по-прежнему будем пренебрегать величиной-------в выражении для математическо-
2 (и— 1)
го ожидания). Имеем
argth р
< argth р< argth р 4
“а
д/п —3
231
Функция th, обратная функции argth, однозначна и монотонно возрастает, поэтому получаем
Р
argth р
<th argth p-f
Найденный приближенный доверительный интервал настолько мало отличается от истинного, что может применяться для выборок объема п ^10.
§ 9.4. Свойства доверительных интервалов
В § 9.1 был получен доверительный интервал для неизвестного среднего нормального распределения
е, (х)=х—^о, е2(Х)=х+-^б, д/и	д/п
который имел надежность 1— а Однако определению (1 — — а)-доверительного интервала удовлетворяют и другие интервалы / (А"), концы которых определяются квантилями
р и q (р и q такие, что q — р=1 — a, q=£\—
/	- d.	- d.
цх)=( е, (Х)=Х4—^о, о2(х)=хч—
\	д/п	д/п
Возникает вопрос, нельзя ли использовать создавшуюся дополнительную свободу для выбора лучшего доверительного интервала. Для анализа этой задачи следует убедиться (см. задачу 9.2), что вероятность события A = {0| eJ (X)}, т. е. вероятность того, что интервал надежности 1—а, построенный для 0, накроет значение 0Ь равна (вообще говоря, 0,^=0)
Рв (А)=Рв (0, е/ (Х))=Ф (^L-d^-Ф (^L-d^
где Д0 = 0|—0.
Теперь можно рассмотреть значения вероятностей накрыть 01 двумя разными (1 — а)-доверительными интервалами 1 (X) и J (X), полученными для 0.
В задаче 9.3 приведены конкретные значения, из которых
232
следует, что вероятность накрыть интервалом J значение 6, больше, чем интервалом /, при 6i>6. Оказывается, что это справедливо всегда, т. е. для любых конкретных значений 01 >0- а не только для указанных в задаче. Это означает, что для всех 0<0! (1 — а)-доверительный интервал / лучше J, поскольку для первого вероятность накрыть значение 0>, для которого он (/) не предназначен, как, впрочем, и J, меньше, чем для второго.
Огределение 9.2. Если для оценки параметра 0 построено два различных (1—а)-доверительных интервала I и J, то интервал I меньше интервала J тогда и только тогда, когда при каждом 0 вероятность накрыть любое 0i=/=0 интервалом I меньше или равна вероятности накрыть 0| интервалом J.
Если бы было точно известно, что все другие 0| не могут быть меньше 0 , то построенный в задаче 9.3 (1—^-доверительный интервал / был бы всегда меньше J. Например, это так, если рассматривать урожайность «диких» сортов пшениц 0 и урожайность культурных сортов 0|; для последних почва соответствующим образом готовится, все прочие условия одинаковы.
Если же первоначально ясно, что 01 может быть как больше, так и меньше 0, то наименьшего интервала получить нельзя.
Но интервал I обладает одним свойством, которое справедливо при любых значениях 0Ь как больших, так и меньших 0. Из конкретных данных задачи 9.3 видно: вероятность того, что доверительный интервал I накроет значение 0, для которого он предназначен, больше, чем вероятность того, что этот доверительный интервал накроет любое другое 0i, большее или меньшее 0. Это полезное свойство можно доказать и в общем случае в условиях § 9.1.
Определение 9.3 Доверительный интервал 1 надежности (1—а) для 0 называется несмещенным, если вероятность накрыть им любое 0i=/=0 меньше или равна 1—а.
Интервалы, построенные в § 9.3, основаны, как правило, иа оценках максимального правдоподобия, которые чаще других эффективны при п-»-оо. Известно, что доверительные интервалы, основанные на эффективных оценках, обладают •несмещенностью, а иногда и свойством быть самыми меньшими. Поэтому интервалы, которые построены в § 9.3 при больших объемах выборки, не смещены и найти меньшие интервалы нз несмещенных нельзя.
Таким образом, доверительные интервалы, построенные при и—>оо с помощью несмещенных эффективных оценок, наилучшие в указанном в этом параграфе смысле.
233
§ 9.5. Интервальная оценка дисперсии по малой выборке
В § 9.2 и 9.3 были рассмотрены методы оценки параметров, основанные на предположении, что п->-оо, т. е. что выборки большие. Но иногда приходится оценивать параметры на основе выборки сравнительно малого объема. Эта ограниченность экспериментальной информации ставит исследователя перед необходимостью компенсировать недостаток данных некоторыми предположениями. Чаще всего это гипотеза о нормальности распределения наблюдаемых данных, которая и принята ниже.
Нормальное распределение — это распределение с двумя параметрами: математическим ожиданием а и дисперсией а2. Доверительные интервалы для этих двух параметров наиболее хорошо исследованы.
1. Доверительный интервал для дисперсии при известном математическом ожидании
Наилучшая оценка для дисперсии при известном среднем уже была получена:
Величина о2 обладает очень важным свойством — она не меняется при изменении начала отсчета, поскольку
X — a = Xt — b + b — а=(Х,— b)-(a — b)=X'i — а'.
При изменении начала отсчета изменяются на одну и ту же величину b и :е значения случайной величины Х'=Х, — b и ее математическое ожидание а'—а—Ь.
Однако величина а2 зависит от единицы измерения. На пример, при переходе от мет ров к сантиметрам необходимо изменять и с2. Чтобы избежать этой зависимости, й2 необходимо нормировать, т. е. разделить на масштабный множитель Разделим о2 на а2, в результате получаем соотношение
У fx-~Q V о2 п ,	\ °	/
в правой части которого — среднее арифметическое независимых нормальных величин со средним, равным нулю, и дисперсией, равной единице.
Сумма квадратов независимых стандартных нормальных случайных величин распределена по закону %2 с п степенями
234
свободы (см. § 3.5). Используя квантили х? (п) и х? (и) уровней р1 /2 и q>1/2, q—р=1—а, получаем систему доверительных интервалов надежности 1 — а следующим образом.
Так как
пп2
с
то
и, наконец, имеем
На основе выборки можно получить с2, а границы n/х? (и) и п/х2(п)— из таблиц распределения х2. при этом величины р и q для малых п выбирают специальным образом [для наилучших границ, т. е. для несмещенных доверительных интервалов, имеются таблицы (см. Приложение)], хотя иногда и рекомендуют для простоты выбирать р = а/2 и q = = 1—tx/2. Таким образом, получаем следующий доверительный интервал (см. обозначения во введении к гл. 7):
Xa \п)	£? п>	1 2
2. Доверительный интервал для дисперсии при неизвестном математическом ожидании
Наилучшей оценкой дисперсии нормального распределения, как и в предыдущем случае, является
i= 1
Аналогично имеем, что
о2_ 1	/Х-Х\?
о2 Л=Л a /
не зависит от начала отсчета и от единиц измерения; известно
пенями свободы (см. §3.5).
имеет распределение х2 с п— 1 сте-
235
Точный доверительный для дисперсии при неизвестном среднем надежности 1—а
(и-1)52 <(Т2< (г —1)62
Х2,(п-1)" ^Х2(п-1)'
где, как и ранее, х?(п—0 — р-квантиль распределения
с п — 1 степенями свободы и q—р=1— а. Границы иесме-
п— 1 п— I
щенных доверительных интервалов ——------и —--------для
Х2(»-1)	Х>-1)
разного числа степеней свободы приведены в Приложениях.
Таким образом, доверительные интервалы в рассмотренных случаях отличаются только числом степеней свободы: во втором случае число степеней свободы на 1 меньше, чем в первом.
§ 9.6. Интервальная оценка математического ожидания по малой выборке
Доверительный интервал для оценки среднего нормального распределения в случае известной дисперсии был уже найден в § 9.1. Рассмотрим доверительный интервал для среднего при неизвестной дисперсии.
Известно, что наилучшей оценкой для среднего является среднее арифметическое X, а наилучшей оценкой для дисперсии служит исправленная выборочная дисперсия о2 =
1 "
=------У (А,— А2), поэтому построим доверительный интер-
п— 1 .“ i= I	_
вал на основе этих двух оценок. Рассмотрим разность А — а. Эта статистика не зависит от начала отсчета. Чтобы обеспечить независимость ее от масштаба, следовало бы, как и ранее, разделить ее на а. Так как о неизвестно, то заменим его оценкой
которая будет известна после получения выборки. Отношение
А — a	„
—л— отличается от случайной величины, имеющей распре-а
деление Стьюдента, лишь тем, что А — а не распределена нормально с параметрами 0 и 1. Но так как (А — а)/—
236
м	__	_	„
£ (Xf—Xf независима от X и ее распределение х с п —
где
уже нормальная случайная величина N (0, 1), а статистика 1 о2.
_ [ степенями свободы, то случайная величина \[п(Х—а)	(X — а)
та и единицы измерения и имеет распределение Стьюдента с п—\ степенями свободы.
Введем критические границы распределения Стьюдента с n— 1 степенями свободы ta = ta{n— 1), обеспечивающие достоверность 1 — а:
Теперь можно записать доверительный интервал для неизвестного параметра а — среднего нормального распределения, когда неизвестна дисперсия о2 (по аналогии с §9.1):
у	^("-0
л-----. .. s а Л + -—, - -	5-
Этот интервал улучшить нельзя, но можно записать в другом, более близком к § 9.1 виде:
<п
Таким образом, если дисперсия известна, то используют критическую границу нормального распределения, а если дисперсия неизвестна — распределение Стьюдента с п — — 1 степенями свободы. При малых выборках эти границы отличаются значительно, но при больших выборках этой границей уже можно пренебречь.
При малых выборках для сохранения уровня достоверности существенно расширяются доверительные интервалы оцениваемых по выборке параметров. Это свидетельствует о том, что имеющейся информации недостаточно для получения качественных выводов о числовых характеристиках явления или процесса. В случае малых выборок особенно сказывается
237
недостаточность статистической информации — ее пытаются компенсировать введением дополнительных гипотез относительно распределений.
Для получения границ доверительных интервалов требуется большая аналитическая работа. Во-первых, следует найти статистики, которые бы не зависели от неизвестных и оцениваемых параметров. Во-вторых, надо получить распределения этих статистик и, наконец, табулировать полученные распределения.
Для малых выборок особенно необходимо «выжать» из полученной в результате обследования информации все, что в ней заключено. В этом случае играют большую роль все свойства оценок и доверительных интервалов, характеризующие их качество.
Задачи
9.1	Покажите, что приближенный доверительный интервал для среднеквадратического отклонения а основанный на оценке тг, при надежности 1—а равен
।— —и Г&п	I— и /~&п
ут2 е “	^<т^ут2е“
где и» — критические границы иор-а льного распределения, отвечающие уровню значимости а.
9.2.	Пусть q—р-доверительнь'й интервал
построен в условиях §9 1 для среднего значения 6 (rfp<l/2, d, > 1 /2 — квантили).
do
Покажите, чт< события А к В(А состоит в том, что X -|—
^0, ^ХЧ—т. е. что интервал J (X) накроет значение 0>, воз-дт
6,— 0
можно, отличное от 0; В состоит в том, что---\п—d ^zsC
о v ’
. в1-0 Г- .	Х-0 .
------д/п—d, где z =-------- J эквивалентны и имеют веро-° р
ятность
Указание. Убедитесь, что, добавляя 0[ —0 —X к обеим частям неравенства, определяющего событие А, и умножая эти неравенства на — \/п/а, приходим к неравенствам, определяю-
238
шим событие В. В силу построения ] (X) случайная величина z нормально распредепена со средним, равным 0, и дисперсией, равной 1.
9.3.	Для 76 %-ных доверительных интервалов / (X) (р = ==а/2 и <?=!—а/2, а= 1—0,76 = 0,24) и /(Х)(р = 0,23 и <7 = 0,99) покажите, что вероятности />/ = Р8 (0< е/ (X)) и =Ре (0, е/(X)) при а = д/2,87, и =400 и 0<—0 = 0,09	(см.9.2) соответ-
ственно равны Р; = 0,53 и Ру = 0,86, а при 0—0=—0,09 имеем Р, = 0,53 и = 0,37.
9.4.	Покажите, что доверительный интервал надежности 1 — ________а = 0,95 для оценки дисперсии при неизвестном среднем, полученный для выборки Х< = 0,464; Х2 = 0,137; Хз = 2,455; Х4 = —0,323 при р = а/2 и <7= 1 — а/2 (а/2 = 0,025), длиннее, чем при р = =0,04 и <7 = 0,99 (распределение нормальное)
9.5.	Для нормального распределения и выборки задачи 9.4 найдите доверительный интервал надежности 0,95 для неизвестного среднего при неизвестной дисперсии, а также при дисперсии, равной 1,5.
Убедитесь, что в первом случае интервал значительно больше.
9.6.	Покажите, что приближенный доверительный интервал при п—>-оо тля неизвестной дисперсии 0, основанный иа статистике , "
m2=s2=—	(Х£ —X)2, равен
<=|
s2 /«/2/^2 с 0 с s2 /l
Сравните его с точным доверительным интервалом надежности 1—а = 0,95 при р — а/2 и 9 = 1 —а/2 и „=20, 40, 80. Прн п = = 4 сравните с интервалом, найденным в задаче 9.4.
Указание. При решении в общем виде считайте выборочный второй момент Ш2=1,5 для любых п.
Глава 10
ПРОВЕРКА ГИПОТЕЗ
На практике часто приходится иа основе результатов обследований, испытаний и т. д. проверять различные предположения о характеристиках конкретного массового явления. Приведем некоторые примеры.
О Пример 10.1. Заболеваемость животных, измеряемая долей заболевших, в обычных условиях имеет некоторый уровень ро- Предполагается, что в результате вакцинации заболеваемость должна уменьшаться до уровня pi<po На основе обследования заболеваемости животных нужно определить, действительно ли это так. •
О Пример 10.2. При замене одного сорта пшеницы с урожайностью ао другим с урожайностью а> требуется проверить предположение, что второй сорт имеет большую урожайность при районировании его в данной области, ф
О Пример 10.3. При обследовании заработков работников бригад в некоторых колхозах двух разных районов может быть обнаружен разброс. Требуется проверить предположение о том, что разброс в первом районе меньше, чем во втором.
Замечание. Если разброс очень мал, то это может свидетельствовать об «уравниловке». Такое предположение иногда требуется проверять, ф
Приведенные примеры показывают, что предположения-гипотезы могут быть самыми разными. Во всех этих примерах предположения могут быть проверены на основе статистических данных. Проверку гипотез на основе выборочных статистических данных называют статистической проверкой гипотез.
Одну из гипотез выделяют в качестве основной и обозначают, как правило, И (или Яо), а другую — в качестве альтернативной (конкурирующей) и обозначают К (или Hi).
Очевидно, что на основе статистических данных очень трудно, а иногда и невозможно, делать безошибочные выводы.
Ошибки при проверке гипотез могут быть двух родов. Ошибка первого роде состоит в том, что отвергается основная гипотеза, когдв на самом деле она верна. Ошибка второго рода состоит в том, что отвергается конкурирующая гипотеза, когда она верна. Последствия ошибок могут быть различными.
Статистические проверки гипотез выполняют во многих случаях неоднократно, поэтому нужно зиать, как часто делаются те или другие ошибки, а частота ошибок непосредственно связана
240
с вероятностью Но даже при однократной проверке гипотезы на основе статистических данных важно найтн такой способ, чтобы вероятности ошибок были не только малыми, но н наименьшими из всех возможных.
§ 10.1. Описание гипотез
Е примерах 10.1 —10.3 были уже приведены гипотезы, вернее — их описательная словесная форма. Но для математической статистики эту форму нужно преобразовать в математическую.
Вернемся к примеру 10.1. Рассмотрим несколько групп животных и в некоторые моменты времени долю больных животных в каждой из наблюдаемых групп. Если доля заболевших животных в разных группах и в разные моменты времени колеблется около некоторого уровня, то этот уровень р и называют заболеваемостью С позиций теории вероятностей заболеваемость — это вероят ность р обнаружить больное животное при случайном выборе одного из любой группы в любой момент времени. Если же для обследования случайным образом выбирается одно животное (затем его опять отправляют в стадо), то результатом обе гедования является одно независимое испытание в схеме Бернулли с вероятностью успеха р (в данном случае «успех» заключается в обнаружении больного животного, причем р = О,1=р>о в обычных условиях и p = 0,05=pi — при вакцинации, р, =0,05<0,1 = = ро). Через некоторое время обследование повторяется.
Таким образом, когда в примере 10.1 говорится о заболеваемости в обычных условиях или о гипотезе, что вакцинации нет, то подразумевается следующее: каждое из наблюдаемых (обследуемых) животных — это результат неза внеимого испытания в схеме испытания Бернулли с вероятностью успеха рп = 0,1. Если же применяется вакцинация, то подразумевается другая схема Бернулли с меньшей вероятностью успеха pi <0,05 (pi =0,05<0,1 =ро). Итак, следует различать две гипотезы — две точки р0=0,1 и р,=0,05 на отрезке [0; 1J.
В примере 10.2 урожайность зависит от многих факторов (погоды, качества земли, обработки почвы, количества и соотношения различных видов удобрений и т д.), поэтому можно допустить, что урожайность — нормальная случайная ве личина со средним уровнем h и некоторым разбросом, с определенной дисперсией. В этом случае урожайность старого сорта — нормальная случайная величина с параметром й = = 20 ц/га = а и дисперсией а2, а урожайность нового со
241
рта — нормальная случайная величина с параметром h = Ь и той же дисперсией.
Таким образом, получили две гипотезы: основная И состоит в том, что имеется два нормальных распределения (с одинаковыми дисперсиями) со средними значениями Ь — =а = 20 ц/га (т. е. средние старого и нового сортов совпадают) и конкурирующая К:6>а = 20 ц/га (новый сорт лучше старого).
Если урожайность b неизвестна, то на полуоси урожайности (так как урожайность неотрицательна) для основной гипотезы задана точка а = 20 ц/га, а для конкурирующей — полупрямая Ь>а.
В примере 10.3 аналогично примеру 10.2 можно перейти в пространство параметров распределений заработков, поскольку есть теоретические доводы считать логарифм заработка нормальной случайной величиной. Но в примере 10.3 неизвестны ни средние, ни дисперсия, хотя предположение касается только дисперсии. Если обозначить дисперсию для первого района 01 = 0?, а для второго — 02=о2, то область неизвестных параметров — это область точек (0i, 0а) на плоскости, где 0(>0. 02>О, т. е. I квадрант.
Гипотеза Н (или /7о) состоит теперь из точек I квадранта таких, что 0j=02 (или а?=о2). В пространстве параметров гипоя еза Н: 0| =02 изобразится в виде прямой — биссектрисы I квадранта. Гипотеза К (или Н\) изображается в виде всех точек I квадранта, которые не лежат на биссектрисе.
В примере 10.1 гипотезы простые, поскольку там возможны только два случая: р = 0,1=ро—вакцинации нет; p=0,05 = pi — вакцинация делалась. В примере 10.2 гипотезы не такие, как в примере 10.1, так как в нем следует проверить: гипотезу Н — урожайность равна 20 ц/га = а; гипотезу К — разность положительная. Хотя гипотеза Н в примерах 10.2 и 10.1 одинакова, следует проверить, равен ли параметр конкретному числу, т. е. распределение случайной величинн известно полностью (в примере 10.1 0,1 =ро, а в примере 10.2 — 20 ц/га=а), ио гипотеза К в примере 10.2 другая — разность Ь — а может быть любым положительным числом, следовательно, гипотезе К. соответствует какое-либо распределение из множества распределений.
В примере 10.3 положение еще сложнее: если разброс измеряется дисперсией, то при имеющихся дисперсиях о! и о? гипотеза И сводится к тому, что О| = о2, а гипотеза К — к неравенству о?^=о2. Но о? может быть и больше, и меньше ai
Все рассмотренные случаи приводят к следующей клас-
242
— рикации гипотез. Гипотеза — простая, если ей соответствует одИо распределение или одна точка пространства параметров, и сложная, если она сводится к выбору какого-либо распределения из целого множества или точке из интервала (конечного или бесконечного).
С этих позиций можно рассмотреть примеры 10.1 —10.3. В примере 10.1 должна проверяться простая гипотеза Н: р = —р0 относительно простой альтернативы X. р=рь В примере 10.2 простая гипотеза Н'.Ь = а должна проверяться относительно сложной альтернативы К'.Ь—а>0, но такой, что все альтернативные гипотезы (точки на прямой урожайности) лежат по одну сторону от основной, т. е. конкурирующая гипотеза односторонняя.
Если в примере 10.3 проверять гипотезу о равенстве разбросов Н:01 —аг (читается: «Я состоит в том, что о? равно о!») против гипотезы X.’oi^oi и делать это на основе, например, отношения дисперсий, то гипотеза Н сводится к простой, а гипотеза К — к сложной, притом такой, что точки о?/о1 лежат по обе стороны от одной точки О|/п2=1, соответствующей гипотезе Н. Так как при H’.(ft/o2=\, a X:oi/o2=#=l, то говорят о конкурирующей гипотезе, как о двусторонней альтернативе.
§ 10.2. Критерии проверки гипотез и их свойства
При провс рке гипотез базируются на выборочных данных. Выборка объема п — это последовательность, состоящая из л результатов независимых наблюдений, поэтому ее можно изобразить как точку в n-мерном пространстве, которое называют выборочным. Каждой конкретной выборке соответ-
ствует одна точка.
Если наблюдается несколько выборок, т. е. реализация n-мерной нормальной случайной величины, компоненты которой имеют среднее а и дисперсию о2 (см пример 10.2), то точки (соответствующие выборкам) в n-мерном пространстве будут концеит риро-ваться около точки с координатами (а, а, ..., а). Для л =2 на рис. 10.1 изобра
Рис. 10.1
213
жены множества выборочных точек из нормальных совокупностей с двумя разными средними и одинаковыми дисперсиями. Число точек — это число выборок. «Облако» точек около начала координат (0; 0) соответствует выборкам из нормального распределения ЛЦ0;о2), а «облако» около точки (6; Ь)— выборкам из W (6; о2).
По расположению точек можно узнать, какая из гипотез верна Это значит, что n-мерное выборочное пространство можно разделить на две области так, что попадание полученной выборки в одну из частей ведет к принятию одной гипотезы, а в другую — другой. Таким образом, основной гипотезе будет соответствовать одна область, а конкурирующей — другая.
Допустим, что области определены. Тогда если выборочная точка принадлежит области, соответствующей конкурирующей гипотезе, то основная гипотеза отвергается (и наоборот) .
Определение 10.1. Область S, при попадании в которую выборочной точки отвергается основная гипотеза, называется критической.
В статистике, говоря о критерии проверки основной гипотезы, подразумевают критическое множество. Пусть критическая область S задана, тогда можно найти вероятность множества тех выборочных точек, которые попали в S, когда верна основная гипотеза, т. е. Рн (S) Вероятность отвергнуть верную основную гипотезу назовем вероятностью ошибки первого рода или уровнем значимости критерия и задается равенством PH(S) = a, при этом часто область S задается в форме неравенства <р(Л)^с, где X— точки выборочного пространства, а <р — какая-либо функция (см. задачи 10.1 — 10 4); более подробно: 5={¥:<р (Л)^с} (S — множество точек X, удовлетворяющих условию <р(Л)<1с).
Рассмотрим характеристики критериев начиная с критериев для простых гипотез.
Вероятность ошибки первого рода или уровень значимости критерия должны быть достаточно малыми, поскольку при этом высока надежность критерия, т. е. вероятность принять основную гипотезу, когда она верна. В самом деле, пусть верна основная гипотеза И и S — критическое множество, тогда вероятность дополнительного к нему множества S, при попадании в которое выборочной точки отвергается конкурирующая гипотеза и, следовательно, принимается основная, т. е. надежность критерия, равна
Pw(S)=l-Pw(S)=l-a.
244
Зафиксируем уровень значимости и будем далее рассматривать только критические множества S с этим фиксированном уровнем.
Вероятность ошибки второго рода р — это Рк (S) — вероятность отвергнуть верную конкурирующую гипотезу. Желательным свойством хорошего критерия может быть минимальность вероятности ошибки второго рода p = /\(S) при фиксированной ошибке первого рода. Но так как Рк (S) = I — Рк (S) — 1—р, то вероятность отвергнуть основную гипотезу, если верна конкурирующая, т. е. сделать правильный вывод, будет максимальной. Вероятность попасть точке-выборке в критическое множество, когда верна конкурирующая гипотеза, называется мощностью критерия.
Если случайные величины непрерывны, то всегда можно за счет изменения критической области увеличить мощность, оставив уровень значимости тем же
Определение 10.2. Критерий S называется наиболее мощным, если
Pk(S)^Pk(S)
при любых S.
Если конкурирующая гипотеза сложная, то мощность критерия S зависит от того, какое значение принимает параметр, например, в области, определяющей К- В этом случае лучше отождествлять гипотезу К с областью значений параметров и записывать мощность в виде Р (S, I 6еК); при этом
Pe(S)=l—₽(0)=у(0),
т. е. мощность критерия, обозначенная у (0), является функцией от конкретной конкурирующей гипотезы 0.
Хороший критерий проверки гипотез должен обладать еще одним свойством: вероятность отвергнуть правильную основную гипотезу а должна быть меньше или равна вероятности принять правильную конкурирующую. Другими словами, если критерий S предназначен на проверку одной (основной) гипотезы, то он должен давать правильный ответ с большей вероятностью (чаще) при справедливости этой гипотезы, чем при справедливоеги других (т. е. правильности любых конкурирующих).
Определение 10.3. Критерий S проверки основной гипотезы не смещен, если Рн (S) — a = y (6)^Рк (S I G^K)=PK(S) при любых S с уровнем значимости а.
Критерий, обладающий свойством несмещенности и наибольшей мощности, называют наиболее мощным несмещенным критерием или просто наилучшим. Если конкурирующая
245
гипотеза сложная, а критерий S оказался одним и тем же для проверки всех конкретных конкурирующих гипотез то критерий равномерно наиболее мощный.
Наиболее мощные критерии всегда не смещены, поэтому если найден наиболее мощный критерий, то проверка несмещенности не нужна. Ни, к сожалению, например, для двусторонних альтернатив наиболее мощных критериев не существует. Поэтому в этом случае находят наиболее мощные критерии среди несмещенных, т. е. несмещенные равномерно наиболее мощные критерии, которые также иногда называют наилучшими.
§ 10.3. Методы построения критериев
Рассмотрим вначале простейший случай, когда простая основная гипотеза Н состоит в том, что теоретическое распределение имеет плотность /о(х), а простой конкурирующей гипотезе К соответствует плотность ft (x)=#fo(x).
Задача состоит в том, чтобы определить критическую область S, при попадании в которую выборочной точки Х = (Хь Хг,.... Хп) основная гипотеза Н отвергается
Обозначим через A (x)=f, (Xi) Д (x2)...f, (х„), i=0, 1, плотность распределения выборочной точки X, когда верны следующие гипотезы: основная И, i = 0, и конкурирующая К, 1= = 1. Будем называть множество S критическим множеством
( Л(*)	1
критерия отношения правдоподобия, если S = <х:		> и
S = {x:P, (х)/Р0 (х)<с|. Критерий будет иметь уровень значимости а (вероятность ошибки первого рода) при
J P0(x)dx=Pd(S)=a.
.s
Имеет место следующая теорема о свойствах критерия отношения правдоподобия.
Теорема 10.1. Если критерий S проверки основной гипотезы Н (плотность /о(х)) относительно конкурирующей гипотезы К (плотность ft (х)) совпадает с критерием отношения правдоподобия, то этот критерий наилучший.
Замечание 1. Теорема верна не только для непрерывных случайных ьеличин, но и для дискретных, однако в последнем случае не всегда может быть получен желаемый уровень значимости критерия отношения правдоподобия из-за знака неравенства Po(x)/Pi(x)^>c, поскольку не при всех уровнях значимости можно найти такую сумму Po(xi) = г <=Д I
246
__(,$), чтобы она была равна вероятности ошибки первого рода (см. ниже пример 10.5).
И Замечание 2. Из теоремы не следует, что критерий отношения правдоподобия существует, но теорема существования здесь не приводится, хотя она и верна. Критерий S, совпадающий с критерием отношения правдоподобия, может быть наилучшим лишь тогда, когда ошибка второго рода р минимальна, т. е. мощность критерия у максимальна.
Замечание 3. Аналогичные теоремы о свойствах критерия отношения правдоподобия существуют и для сложных гипотез, когда 0е 7/ — основная гипотеза, а 0еК — конкурирующая. При этом часто так //, так и К могут состоять и из одной, и из многих точек (например, // = {0е[0ь 02]}, [0Ь 02] — отрезок, а К состоит в том, что 0[0,, 02]). Если можно найти оценку 0 максимального правдоподобия для 0, то с ее помощью строят критерии типа 0<С|, 0>c2(c2>ci), которые являются наилучшими для проверки сложных гипотез.
О Пример 10.4. Пусть в результате наблюдений можно получить одну выборку Х=(Х(, Х2,..., Х„), о которой известно, что все ее элементы X, распределены нормально с известной дисперсией о2. Гипотеза Н состоит в том, что теоретическое среднее равно а0, а гипотеза К — в том, что среднее равно af и
Так как
. . ,	1	-(x-a/AZo2)
/о(*)= г— е	и
у2л о
Г I \	1	-(ж— с ^ДЙо2)
fi (х) = е д/2л о
то плотности распределения Х=(Х|, Х2...Хп)
Л(*)=Л(Х|)^(х2)...Л(х„). / = 0.1,
равны
/ j \п/2
у 2лсг / а отношения правдоподобия имеет вид
Р,(х)	1Г °Л
МТ'
После приведения разности (х,— ai)2—(х,— ао)2 к виду — ~2х, (а, — а0)_|_(О] ~ао)г и логарифмирования неравенства
247
Р] (*)/Л> (х)^ с получаем
Г [-2х. (а> “ао)+(а1 -во)2]^,п с’
Умножая последнее неравенство на —2о2, изменяя при этом его знак и вычитая п (а\—а0)2, имеем
— 2 (а, — а0) £ xi С2а2 1п с — я (а2 — а0)2.
i=l
Разделив теперь правую и левую части на —2п (си—а0) (знаки неравенства снова меняются), обнаруживаем, что критерий отношения правдоподобия основан на выборочном среднем
°1 ~ао
1	। а1—ао
,ПС+^—
С.
В правой части неравенства неизвестно с, поэтому всю правую часть можно обозначить С, которое также неизвестно. Так как AeW(ao, о2/«), то
P0(S) = P(X>C, а = а0)=1—Ф
Теперь из равенства а= 1—Ф
Ф
— а следует, что
С а0
'n=di_a = u„ (<7= 100а).
а
Остается определить константу С:
d._„	и„
С = а0Ч--о = а0Ч—
\п	\п
(10.3.1)
Критерий S теперь полностью определен, поэтому можно найти его мощность у или вероятность ошибки второго рода Р=1—у. Мощность критерия равна
Р, (S) = P(X>C | о = а,)=1-Ф
(^4
так как X при гипотезе К имеет нормальное распределение со и 2
средним си и дисперсией о .
248
,Са г\
Рассмотрим y=1— Ф(—-----д/n I. Подставляя вместо
С его значение из (10.3.1) и учитывая, что ai>a0, получаем
(О, Gn	।—	_ \
----L—).	(10.3.2) о	* /
Величина (си—ao)/a показывает удаленность гипотез И н К ДРУГ от ДРУга- поэтому иногда ее называют расстоянием между гипотезами. Из результатов решения задачи 10.5 следует, что с ростом расстояния мощность увеличивается, хотя критерий остается одним и тем же. Это приводит к тому, что полученный в примере 10.4 критерий — наилуч ший и для сложной конкурирующей гипотезы, когда значения среднего у наблюдений принимают любые значения на полупрямой	°°). т. е. ae]ai, оо[.
Решение задачи 10.5 показывает также, что не всегда даже с помощью нанлучшего критерия можно получить приемлемые результаты. Так, если выбран очень высокий уровень значимости, то вероятность отвергнуть правильную конкурирующую гипотезу (следовательно, принять неверную основную) очень велика. При близких гипотезах (расстояние 0,1) эта вероятность равна 0,91. Поэтому лучше взять несколько большую вероятность ошибок второго рода, но уменьшить вероятность ошибки первого рода: при а = 0,05 р=1— у=0,74.
Каков же должен быть объем выборки, чтобы при уровне значимости а вероятность ошибки второго рода была равна р?
Для решения этой задачи из соотношения (10.3.2) получаем ошибку второго рода:
При заданном р аргумент Ф (х) равен dp, т. е.
и ai ао г- . ,	ai~ao г~ . - , 1ЛПЧ
“₽ =------ Vn + di-a=--------------V" + «?(<? = «-100).
Отсюда получаем, что объем выборки при заданной ошибке первого рода а = ^/100, для того чтобы ошибка второго рода была меньше или равна р = р-100/, должен быть больше или равен
«с
(rfp-^-J2 (u+uf
249
£Z| Gq
Для p=q = 5% и ---------=0,1 имеем n0=1076 (см. задачу
10.6) О
О Пример 10.5. Допустим, что в течение года ежемесячно можно наблюдать X, — количество уволившихся с некоторого предприятия: Х>, Хг, .... Хп- Требуется построить критерий для проверки гипотезы, что в месяц в среднем увольняется один человек. Допустим, что это число (1) — нормальный уровень текучести при численности данного предприятия. Важно не пропустить момент, когда текучесть возрастет в 1,5—2,5 раза по сравнению с нормальным уровнем (меньше 1 текучесть на предприятии быть не может).
Проверялось неоднократно, что число X, уволившихся в течение i-ro месяца распределено по закону Пуассона, и числа Х( не зависят друг от друга в разные месяцы. Поэтому р(х, 0)=---е®, где 0—интенсивность увольнения. Основа-
иая гипотеза И состоит в том, что 0 = 0© и 0о= 1. Выберем некоторый уровень значимости а и найдем критерий проверки Я:0 = 0о при альтернативе X:0i и 0| = 2,5.
Для этого рассмотрим отношение правдоподобия
Л
Отсюда следует, что критерий отношения правдоподобия может быть основан на статистике, отличающейся от наилучшей оценки лишь миожителем 1/п, т. е. при
Г X,. >[In С + п (0, - 0П)]/ 1п ^-= с.
<=1	°0
Так как С неизвестно, то неизвестно и с, а зная с, так как 0| и 0о известны, можно найти С.
Будем далее определять неизвестную константу с, задавшись уровнем значимости а. Вспомним, что сумма п случайных величин Xj, каждая из которых распределена по закону Пуассона с параметром 0, также распределена по закону Пуассона, но с параметром п0. При справедливости
250
основной гипотезы 0 = 0О=1 и п=12, поэтому необходимо найти
t^c	t^c
при с=18 и 0о = 1 имеем £ [(12//М] е 12 = 0,06297, что следует из таблиц распределения Пуассона. При с = оо
19 и 00=1 £ 1(12)7*!] е-|2 = 0,03742.
Следовательно, точный уровень значимости, равный 0,05, не может быть достигнут. Он может быть равен либо си = 0,063, либо «2 = 0,037. Для дискретных распределений достижения уровня значимости скорее исключение, чем правило.
Теперь определим мощность критерия и вероятности ошибок второго рода. Для этого нужно из таблиц распределения (n0j)' _„е
Пуассона иайти суммы )———е	1 при 0i > 1 и с = 18 и 19.
«=с	'•
Результаты для 0=1, 5/3, 5/2 приведены в табл. 10.1
Таблица 10.1
Значение е	Величина с			
	с=18		с=19	
	МОЩНОСТЬ V (6)	ошибка р (6)	мощность 7 (0)	ошибка р (6)
1	0,06297	0,93703	0,03742	0,96257
5/3	0,70348	0,29652	0,61909	0,38091
5/2	0,99274	0,00726	0,98708	0,01292
При использовании таблицы следует помнить, что мощность критерия при 0=0о=1 равна уровню значимости критерия. На основе данных таблицы можно сделать вывод, что предпочтительнее выбирать с=18. Хотя это и приводит к незначительному увеличению вероятности ошибки первого рода а.=0,063 («ложной тревоги по поводу увеличения текучести»), но зато делает малой вероятность ошибки второго рода ₽ = 0,007 («ложного спокойствия при действительном увеличении текучести») для значения 0 = 01 = 5/2, т. е. при увеличении текучести в 2,5 раза.
251
§ 10.4. Проверка гипотез и доверительные интервалы
Для демонстрации связи критериев при проверке гипотез с доверительными интервалами рассмотрим упрощенный при-мер 10.3 о равенстве разбросов зарплат. Формализуя гипотезу примера 10.3, можно сформулировать более простую задачу о равенстве дисперсий при известных и одинаковых средних при нормальном распределении наблюдений.
На основе выборки Х=(Х|, Хз,..., Хп) объема п, где все Xi^N (а, о2) и а — известное число, следует проверить гипотезу /7:о2 = Оо (оо — известное число) при ачьтернативе /С: в2
Если воспользоваться критерием отношения правдоподобия, то окажется (см. задачу 10.7), что единой (односвязной) критической области не существует. Поэтому для построения критерия проверки Н против К следует использовать свойство несмещенности, которое дает критерий, основанный сразу на двух множествах, приведенных в задаче 10.7. Действительно, если взять критерий для односторонней гипотезы К:о2>оо п
с критической областью £ (Xt— af^c, то гипотезы о о2 из «=1
К- о2<Оо имеют большую вероятность быть принятыми, чем п
гипотеза Н, а для критерия	(X,—af<Zc принять гипотезу
i=i
К:о2>ао более вероятно, чем Н.
Итак, при сложной двусторонней гипотезе К для проверки простой гипотезы Н имеем двусторонний критерий, состоящий в выполнении какого-либо одного из следующих двух неравенств:
с, < £ (X, - а)2, £ (X, - а)2 > с2. i={	i=l
Но дополнительное множество S (множество принятия основ-п
ной гипотезы), если учесть, что I (Я.-*)2 = ns2, имеет вид /=== I
9 с, < ns <с2.
Сравнивая последнее неравенство с доверительным интерва-2	9
ns 2 ns
лом —-----<о0<—-------для неизвестной дисперсии, равной
Мп) Мп)	,	,
2	2 яг „2 VL
в данном случае Оо, получаем, что Ci = oL,--, ас2 = о0——
П
252
(t? (n), x₽ I”) — квантили). Теперь имеем несмещенный критерий отношения правдоподобия в виде
£ (X.-afCc,, £
где ci и Сг уже определены из границ доверительных интервалов. Величины Хр(п)/п и х,(н)/л для иаилучших критериев можно получить из таблиц для несмещенных доверительных интервалов (см. Приложения), а при больших п имеем р = = а/2 и q= 1 — а/2.
Принцип перехода от доверительных интервалов /(Л)= =(01(Х); 02(А)) для параметра 0 к критерию проверки основной гипотезы 0 = 0о против гипотезы К:0=/=0О очень прост и в тех случаях, когда I (X) основан на оценке максимального правдоподобия; он дает наилучший критерий проверки гипотезы И против гипотезы К.
Рассмотрим еще один пример. Проверим в нормальном случае основную гипотезу Н:а = ао против конкурирующей К:а#=ао по выборке объема п при известной дисперсии о2.
В доверительном интервале для значения а — ао имеется оценка X, входящая в концы интервала для значения а = аР. Для получения критерия проверки гипотезы Н'.а = ао против гипотезы /<:аУ=ао следует поменять местами X и а в неравенстве, т. е. получить неравенство для X. Зная границы для X, содержащие а = ар, имеем замкнутое множество. Это множество S является дополнительным к критическому множеству S, которое и следовало определить (см. задачу 10.8):
п	п
£	£	Xt>c2,
i=i	i=i
гдес2 = паь + ив д/n о и cl = nao— uq	yfn	о	Ю0^.Итак,
получен наилучший критерий для проверки гипотезы Н:а = ао против гипотезы К‘.а^а0.
Для больших объемов выборок можно предложить еще более простой способ проверки основной гипотезы /7:0 = 0о против конкурирующей Л:0^=0о, основанный на результатах § 9.2. В этом параграфе находилась функция g (0) такая, что g (0, была распределена примерно по нормальному закону со средним g (0) и дисперсией 1 /п.
При гипотезе А/:0 = 0О имеем g(0) = g(0o), поэтому
g(0o)--^<g(@)<g(6-0)+
vn	л!п

253
Отсюда, если использовать оценку 0 максимального правдоподобия для 0о, при больших п получаем следующий приближенный наилучший критерий проверки гипотезы //:0 = 0О против гипотезы Л:0^=0о: если
_	„ и„	„	и„
g(0)<g(0o)----= или g(6)>g(Oo)4—
\!П	yjn
то гипотеза Н отвергается, если же
g (0o)+^-<g(5)<g (0о)+-^£ д/п	д/п
то нет оснований при уровне значимости критерия а отвергать основную гипотезу. Напомним, что в приближенном способе проверки гипотез dp — квантиль стандартного нор-_ .,,	_ . ,	100 — п
мального распределения, т. е. ф(йр)=р, а Ф(ир) =—
(Р в %).
§ 10.5.	Проверка гипотез о равенстве средних и дисперсий
В настоящем параграфе рассматриваются критерии о равенстве средних и дисперсий двух генеральных совокупностей. Предполагается, что генеральные совокупности имеют нормальные распределения. Выборку из первой генеральной совокупности будем обозначать через Х = (ХЬ Х2,..., Х„), а из второй — через У = (У|, У2, .... Кт).
1.	Гипотеза о равенстве дисперсий при неизвестных средних
Итак (см. пример 10.3), имеем две выборки Хг, ..., Хп и Ki, Yi, ..., Ym из нормальных совокупностей с неизвестными средними и дисперсиями о% и Оу соответственно. Следует проверить гипотезу = против гипотезы К:с^#=0у. Интуитивный способ проверки понятен: нужно оценить о^
и Оу и сравнить оценки.
Так как средние неизвестны, то наилучшими оценками дисперсий и о^. являются
i=l	i=I
Вопрос о наилучшем критерии в рассматриваемом случае хорошо изучен.
254
Рассмотрим статистику
(10.5.1)
—г Z i= I
zn •
которая при справедливости основной гипотезы не зависит от неизвестных параметров нормального распределения В самом деле, в § 9.5 было показано, что <т£ и о2 не зависят от средних значений выборки, а о^/о2 и а2/о2 распределены как X2 с п—1 и т—1 степенями свободы и не зависят ии от среднего, ни от дисперсии, если справедлива основная гипотеза //:о^ = о| = а2. Но так как о^/о2 и о^/о2 не зависят ни от средних, ни от дисперсий, то и их отношение также не зависит от средних двух выборок, как и от дисперсий двух ьыборок, лишь бы дисперсии были равны.
Очевидно, что при отношении дисперсий о^/о2 = 1 отношение их оценок должно быть близким к 1. Поэтому критерий выглядит следующим образом: гипотеза И отвергается, если
°х	<*х
—<с, или —>с2(с1 <1<с2).	(10.5.2)
Оу*	Оу
Остается найти константы С| и с2. Для этого необходимо знать распределение отношения (10.5.1). Это распределение известно и табулировано. Оно называется распределением Фишера с т = п — 1 и п2=т — 1 степенями свободы Таблицы для наилучшего критерия приведены в приложениях, но иногда можно использовать таблицы для ^%-ных точек, которые соответствуют 1—а квантилям Fi-O(«i, п2). Для а-квантитей справедливо соотношение Fa(n,; п2) = l/Fi-aOiz п\). Если, например, уровень значимости a = 0,05, то
С1 = ^0,025 (П1 ’> пг) И с2 — ^0,975 (ni > п2) —
= 1/Л),025 (П2> п|)-
2.	Гипотеза о равенстве дисперсий при известных средних Эта гипотеза проверяется аналогично предыдущей, но в данном случае
(*.—«х)2 и °2 =4- z (r<-ao2. i=l	<=|
255
где ах, aY — известные средние генеральных совокупностей. Если верна гипотеза //:о^ = о| = а2, то о^/о2, и <^,/а распределены по закону х2 соответственно спит степенями свободы. Поэтому статистика о%/о% распределена по закону Фишера спит степенями свободы.
3.	Гипотеза о равенстве средних пои неизвестных дис-
персиях
Рассмотрим две независимые выборки X и У, объемы которых равны п и m соответственно, причем известно, что они извлечены из нормальных генеральных совокупностей с равными дисперсиями п^ = о2=о2, причем как величина дисперсии, о2, так и средние ах и bY неизвестны. Требуется проверить основную гипотезу H:ax=av при конкурирующей К‘.ау^ау.
Гипотеза Н справедлива при любых а = ах и a — aY, т. е. она сложная, но может быть сведена к простой, если рассматривать разность средних ах — ау В этом случае естественно рассматривать и разность оценок X—Y, распределение _ которой нормальное, поскольку нормальны сами оценки X и Y. По аналогии с методом получения доверительного интервала для неизвестного среднего при неизвестной
дисперсии попытаемся построить статистику, распределенную по закону Стьюдента.
Чтобы разность X—Y была распределена по стандартно-
му нормальному распределению, ее нужно нормировать средним квадратическим отклонением. Найдем его. Имеем D(X — — Y)~DX-\-DY, что следует из независимости выборок X и Y. Учитывая, что DX = o%/n и DY=o^/m, где = равны неизвестной общей дисперсии ог = ах = <^, получаем
0% су2 , D(X— У)=—Ч—-=<т2 п m
n + m пт
откуда	______
vw-од/^ Следовательно,
1).
д/О(Л—Г) о V п + т
(10.5.3)
Оценим неизвестную величину о. Для этого воспользуемся тем, что а2=-^Ду- £ (Xt-Xf, a o2Y= - —- £ (Y,-Yf.
256
Так как известно, что
о„ и («-!) — о
распределены по закону х2 с п — 1 и т — 1 степенями свободы соответственно, то
Л2	£2
(n-i)-^+(™-i)-4-	<105-4)
о	сг
распределена по закону х2 с Рассмотрим
(л — 1) о2 + (т — 1) о2
(п + т — 2) степенями свободы.
Л—1 л
—n + m —2	— п + т — 2
Так как Л1о$=Л4о2 =о2, то л — 1 Л2 т— 1 л2 п + т — 2	п + т — 2
т— 1 п + т—2
М
п — 1 о . т — 1	« о
=---------о2 4---------— сг = сг;
п + т— 2 п + т— 2
следовательно, величина [(л— 1) ox + (/n—1) оЦ/(л + т—2) является несмещенной оценкой для о2, т.е.
у [(« - 1) о2к + (т ~ 1) о2г] п -f- т — z
Теперь получаем, что величина
Х-F	-Л Г.
о=
t=______________________________________
\[(п — 1) ох + (т — 1) а2у]/(п + т — 2)
пт п + т
(10.5.5) не зависит от неизвестных ах, ау и о2 и распределена по закону Стьюдента с п+т — 2 степенями свободы в силу (Ю.5.3) и (10.5.4).
Из изложенного можно получить следующий критерий уровня значимости а для проверки гипотезы Н:ах — ау. Гипотеза Н отвергается, если
|(|>(о (п + ш-2), гДе ta(n + m—2) — критическая граница распределения Стьюдента, соответствующая уровню значимости а. Числовой пример приведен в задаче 10.9.
9 В. А Колемаев и др.
257
Интуитивно критерий очевиден. Если разность X—Y мала, то гипотеза Н принимается. Для понимания того, что такое малость разности X — У в строгом статистическом смысле, и понадобились все приведенные выше рассуждения.
4.	Гипотеза о равенстве средних при известных дисперсия к
Эту гипотезу проверить гораздо легче Критерий может быть получен из соотношения (10.5.3), так как случайная величина
Д-р_-	-^(0:1).
д/DX + DY ^/п+о^/п
Поэтому гипотеза Н’.ак = а^ отвергается при уровне значимости а, если
IX—F|
---- —«<<<., у п пг
где иа — критическая граница стандаотного нормального распределения, т. е. Р {|Z| >на)=а.
Все приведенные в настоящем параграфе критерии являются точными и наилучшими, поэтому их можно использовать как при малых, так и больших объемах выборок (при нормальном распределении генеральных совокупностей). Для проверки указанных гипотез в случае больших выборок из генеральных совокупностей, не имеющих нормального распределения, также можно (с известной осторожностью) применять рассмотренные здесь процедуры, поскольку X н Y распределены асимптотически нормально.
§ 10.6.	Критерии согласия
При изложении в предыдущих параграфах методов проверки гипотез всегда были известны две гипотезы: основная и конкурирующая. Однако не всегда есть основания высказывать конкурирующую гипотезу в явном виде. Часто под конкурирующей гипотезой подразумевается то, что просто не выполнена основная. В отличие от рассмотренных ранее схем конкурирующая гипотеза здесь в явном виде не высказывается и задача ставится так: согласуются ли результаты наблюдений с высказанным предположением.
258
В настоящем параграфе описаны именно критерии согласия, хотя с некоторыми из них мы уже встречались в § 7.2. С помощью оценок функции распределения и плотности можно проверить гипотезы о том, насколько хорошо выборочные данные согласуются с теоретическими выводами о функции распределения или плотности распределения. Однако часто вид функции распределения или плотность известны, но не известны конкретные значения входящих в них параметров. В этом случае можно проверять гипотезы о параметрах, но вопрос о согласии с плотностью распределения может остаться открытым.
/. Критерий согласия относительно коэффициента корреляции
Пусть ранее было установлено, что значение коэффициента корреляции р = 0,72. Последние п=12 наблюдений за теми же двумя параметрами дали следующий результат: р = 0,63. Согласуется ли новое значение (0,63) оценки коэффициента корреляции с предыдущим (0,72), которое считается точным? В соответствии с § 9.3 воспользуемся наилучшими доверительными интервалами для р. Вычислим z-преобразо-вание Фишера для р:
z = argth р = 0,7414, Л<г= argth р
2(п-1)
= 0,9076 + 0,0413 = 0,9489.
Воспользуемся нормальностью распределения z-преобра-зования Фишера для коэффициента корреляции и вычислим стандартное отклонение. Имеем
г-Мг 0,7414 - 0,9489
Zq — ——-----=---------— -------= о (—	I oj = — U.bzzo,
1/9
где ог = д/1/(п —3). Полученное отклонение |z0| меньше “0.05=1,96, поэтому полученные данные согласуются с полученными ранее. Поправка к Мг, равная р/[2(п — 1)} дает ошибку во втором знаке после запятой, поэтому ее можно было бы не вычислять.
2.	Критерий согласия для плотности распределения
Рассмотрим более сложную ситуацию. Пусть имеем выборку объема п для проверки определенного закона распределения f (%, в), параметры которого 0=(0i, 02, ..., 0*) неизвестны. Все данные разбиты на m групп по n,, i=l, 2, ..., m, в каждой так, что в групп)- попадают те выборочные значения
9*	259
Xi, которые накрываются одним из т непересекающихся интервалов Ц, 1я, ..., 1т- В каждом из интервалов подсчитаем вероятности
р, (0)= р(х, 0) dx,
где Zi-i и г, — концы i-ro интервала /;=(Zi_i, Z;).
Для того чтобы р, (0) были известны, вместо параметров 0 поставим их эффективные оценки 0. Теперь можно сравнить наблюдаемые частоты п, попадания в каждый интервал с ожидаемыми пр,- (0). В качестве меры отклонения наблюдаемых частот от гипотетических возьмем сумму
2 V —
(10.6.1)
которая мала при хорошем согласии. Если р, (0) — гладкие по 0 функции и число интервалов maslgjn, то распределение и О	2
случайной величины при п-»-оо сходится к распределению X2 с m — k — 1 степенями свободы.
Для больших п следует выбирать интервалы так, чтобы в каждом из них было 10 наблюдений или более, а в качестве оценок 1)—такие, которые минимизируют сумму (10.6.1).
Рассмотрим следующий пример. Среди п = 244 уволившихся работников крупного предприятия были и рабочие, и служащие, причем служащих на предприятии 40 %. Следует проверить, что время непрерывной работы на данном предприятии от постутения на него до увольнения и рабочих и служащих распределено по показательному закону. В табл. 10.2 приведены данные, необходимые для получения 2
критерия % для смеси двух показательных распределении.
Табл ща 10.2
Интервалы	Частота		Разности частот	Интервалы	Частота		Разности частот
	ожидаемая	наблюдаемая			ожидаемая	наблюдаемая	
0—150	61,9	57	— 4,9	750—900	10,7	9	— 1,7
150—300	41,5	47	+ 5,5	900—1200	14,9	11	— 3,9
300- -150	28,3	33	+ 4,7	1200—2000	21,5	17	-4,5
450—600	19,9	21	+ 1.1	2000—3000	13,9	15	+ U
600—750	14,3	15	+ 0,7	3000—9000	17,1	19	+ 1.9
26и
Полученную по данным таблицы сумму х„ = 4,68 следует сравнить с критической границей отвечающей уровню значимости критерия а. Так как по выборке оценивались два параметра закона распределения смеси f (х, 0Ь 02) = ==0 601е в|* + О,402е ^(х^О), то число степеней свободы равно т — k—1 = 10 — 2—1=7, поэтому при а = 0,05 кван-,иль является критическим значением и Xo.os(7) = 14,1. Это критическое значение больше наблюдаемого %„ = 4,68, поэтому гипотезу о согласии показательного закона для стажа непрерывной работы на предприятии с эмпирическими данными можно принять.
Рассмотрим, наконец, ситуацию, когда закон распределения только формируется. Но для предполагаемого закона сделаны k независимых выборок объемом rij каждая, / = 1, 2, k. Данные каждой выборки сгруппированы в т одинаковых групп (интервалов). Частота попадания объектов j-й выборки в i-ю группу хц. Общее число объектов в группе k	т
i v,-.=	v(/-, а число объектов в выборке j v,,=
Для проверки гипотезы однородности всех аыборок вычисляют статистику:
'	\ 2
VyV*; Y
V-------------— I
*' n )
m
При справедливости предположения о совпадении зако-ь
нов распределения всех выборок и п= £ п--»-оо так, что 1=‘
9
Vij-^oo, распределение статистики хп хорошо изучено и схо-дится к распределению %2 с (k— 1) (т — 1) степенями свободы. Числовой пример приведен в задаче 10.10. Более подробно эта схема дисперсионного анализа рассматривается в гл. 12.
3.	Общая схема проверки гипотез
Хотя, как было показано в настоящей главе, критерии проверки гипотез очень разнообразны, их объединяет общность логической схемы. В общих чертах эта схема сводится к пяти шагам.
l-й шаг. Исходя из содержательных экономических соображений формулируют основную гипотезу И.
2	ш а г. Задаются величиной уровня значимости критерия «, т. е. вероятностью отвергнуть основную гипотезу И, когда
261
она верна. Этот уровень, как правило, выбирается следую, щим образом. Если гипотеза очень правдоподобна и нужны веские аргументы, чтобы ее отвергнуть (в данном случае — сильно не согласованные с гипотезой статистические данные) то уровень значимости выбирают очень малым, например 0,05, 0,01 или даже 0,005 и меньше. При наличии столь же правдоподобной альтернативы К уровень значимости следует выбирать равным вероятности ошибки второго рода (отвергнуть конкурирующую гипотезу К, когда она верна).
3	ш а г. Выбирают некоторую функцию — статистику ф от результатов (будущих) наблюдений Xi, Х2, .... Хп — и при обеих гипотезах (основной и конкурирующей) находят законы ее распределения Г» (х). Это самый сложный этап с теоретической (математической) точки зрения.
4	шаг. С помощью закона распределения F на основе выбранного уровня значимости (шаг 2) область возможных значений статистики разбивают на две или три части с помощью квантилей или процентных точек распределения F* (на две части — при односторонней альтернативе, на три — при двусторонней.) В последнем случае должны быть области неправдоподобно малых уклонений статистики н области не правдоподобно больших значений статистики ф.
5	ш а г. Делают выборку X=(Xi, Х2,.... Хи) и по ее результатам вычисляют статистику ф (шаг 3). Выясняют, в какую из областей попадает значение ф (Xi, Х2, .... Хп> Если величина ф находится в области, где правдоподобна гипотеза Н, то считают, что эксперимент не противоречит основной гипотезе Н, т. е. оиа принимается. Этому выводу всегда соответствуют вероятности ошибок а и 0(а = 0, где две гипотезы априори одинаково правдоподобны.)
Задачи
Задачи 10.1—10.4 развивают умение строить критические области в многомерных пространствах для наиболее распространенных способов проверки гипотез.
10.1.	Пусть ф(х) =—х.-|-х,+.. -|——х , гдех = (Х1,Хг, •••.
п п	п
Хл) — точка выборочного пространства. Покажите, что область S={x:q> (х)2Э-с) — часть n-мерного пространства, отделенного гиперплоскостью. Для п = 2, с—1 и с=1 изобразите область S в системе коор шнат (xi.xj).
10.2.	Пусть<р(х) = -1-(Х1_а)2 + 2_(Х2_с)2+..,+JL(Xn-fl)2.
Покажите, что 5 = {х:ф(х)<с)—часть п мерного пространства, ограниченного гиперсферой с центром в а=(а, а, .... а). Прн п =
262
2 изобразите область S для с=1 и с=1/2, положив с=1, на плоскости в прямоугольных координатах (хг, х2).
10.3.	Пусть <р(х) = -^-I*! —а]+—|х2 —а|+•. .+^-|хи —а|. Покажите, что область 5=рс:<р(х)^с)—внутренность многогранника с центром в а=(с, а, .... а). Для значений с и а задачи 10.2 выполните изображение на плоскости и в трехмерном пространстве.
10.4.	Пусть <р(х)= max |х. — а|. Покажите, что область S = 1С <’ С п
=(x:q> (х)<;С} — n-мерный куб с центром вв=(а, а, .... а). В условиях задачи 10.2 выполните изображение на плоскости.
10.5.	Покажите, что мощность у в примере 10.4 (см. § 10.3) критерия уровня значимости а = 0,05 при расстоянии между гипотезами (си—а»)/о = 0,1; 0,2; 0,3 и п=100 равна соответственно 0,26; 0,64; 0,91, а при <х=0,01 и тех же п и (щ— а0)/а имеем у = 0,09; 0,37; 0,74.
10.6.	Заполните следующую таблицу необходимых объемов выборок при проверке гипотезы примера 10.4:
Расстояние Д[ —До		« = Р		Ошибка а	Ошибка р		
с	0,10	0,05	0,01		0,1	0,05	0,01
0,1 0,2 0,3				0.1 0,05 0,01			
10.7.	Покажите, что для выборки X=(Xi, Х2, .... Х„), ЛЦа, о2) (а — известное число), критерий отношения правдоподобия для проверки гипотезы Я:о2 = -^ при альтернативной гипотезе К:о2=#=о2 (о, и о2 — конкретные числа) может быть при-п	п
веден к виду £ (Х; —а)2>с при <^>а2 и к виду
4=1	4=1
<с при O2<(J2.
10.8.	Покажите, что для выборки X=(Xi, Х2, ..., Х„) объема п из нормальной совокупности с неизвестным средним а и известной дисперсией а2 несмещенный критерий отношения правдоподобия с уровнем значимости а для проверки основной гипотезы Н:а=(ц> против альтернативной К.'.а=^=ао может быть приведен л	п
к виду S: £ JQsCq и £	й<с2.
*=1	i=l
Указание. Константы щ и с2 можно найти сопоставляя Дополнительное множество S с доверительным интервалом r:ci=na0 — uqG/^Jn, c2 = na0 + uqc/yfn Гф=-|-100у
263
10.9.	Две выборки Х= (0,052; 1,504; —1,350; —1,124; — 0,521) и У=(1,815: 0,101; —0,561; 0,236; 0,166; 0,227, —0,309) получены из нормальных совокупностей. Покажите, что:
а)	статистика o^/Oy=2,238, Fi -о.л2б(4,6) = 6,23 и Fo.o2s(4,6) = = 0,16. Интерпретируйте результат в терминах критерия проверки гипотезы = с уровнем значимости 0,05;
б)	наблюдаемая величина для проверки гипотезы о равенстве неизвестных средних при неизвестных, но равных дисперсиях равна	a-Z0.025(10) = Z0,975(10) = 2-23- Мож-
но ли считать, что средние у нормальных совокупностей равны?
10.10.	Критерий однородности х2 В следующей таблице приведено распределение служащих двух отраслей по зарплате. Проверьте гипотезу однородности распределений. Покажите, что Хд = 14,58, а х^05(7)= 14,067. Интерпретируйте результат.
Интервалы зарплаты	Количество работников		Интервалы зарплаты	Количество работников	
	отрасль А	отрасль В		отрасль А	отрасль Б
130—150	4	1	250—300	22	34
150-170	4	1	300—350	3	7
170—200	15	8	350—400	1	3
200—250	51	43	400—500	0	3
Глава 11
КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики и предназначены для изучения по выборочным данным статистической зависимости ряд а величин; некоторые из них являются случайными. При статистической зависимости величины не связаны функционально, ио как случайные величины заданы совместным распределением вероятностей. Исследова ние взаимозависимости случайных величии приводи* к теории корреляции как разделу теории вероятностей н корреляционному анализу как разделу математической статистики. Исследование зависимости случайной величины от ряда неслучайных и случайных величии приводит к моделям регрессии и регрессионному анализу на базе выборочных тайных. Теория вероятностей и математическая статистика представляют лишь инструмент для изучения статистической зависимости, но не ставят своей целью установление причинной связи. Представления и гипотезы о причинной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление. Формально корреляционная модель взаимосвязи системы случайных величин Х'=(Х\, Х2, .... Хь) может быть представлена в следующем виде:
(X,Z),
где Z— набор внешних случайных величии, оказывающих влияние на изучаемые случайные величины. Примером корреляционной связи является статистическая взаимозависимость между отдельными частями человеческого тела (длиной руки и длиной ноги, весом и ростом человека и т. п.), обусловленная их взаимосвязью и влиянием определенных первичных факторов, связанных прежде всего с наследственностью (см. пример 11.1).
В случае же одномерной (парной и множественной) регрессии, которая является основным предметом статистического изучения настоящей главы, одна случайная величина (зависимая переменная У) зависит от ряда неслучайных факторов, которые представлены независимыми переменными x’=(xi, ..., хь), и от набора случайных величии Z:
r=f(x,Z).
Примером регрессионной зависимости служит зависимость между урожайностью определенной сельскохозяйственной куль-
265
туры и влияющими на нее природными и экономическими факторами. Здесь из внестатистических соображений ясно, что дожди влияют на урожай, а не наоборот. Следовательно, надо изучать зависимость урожайности от дождей и других природно-экономических факторов.
Первый параграф настоящей главы посвящен корреляционному анализу как инструменту исследования на основе выборочных данных статистической взаимозависимости. В остальных параграфах приводятся основные сведения по исследованию зависимости результирующих экономических показателей от де терминированных природно-экономических факторов с помощью регрессионного анализа.
§ 11.1. Введение в корреляционный анализ
1. Парная корреляция
Корреляционная зависимость двух случайных величин задается моделью
X=X(Y,Z), У=У(Х, Z)
где Z — набор внешних случайных факторов.
Парная корреляция занимается изучением характеристик взаимосвязи двух случайных величин. Основой получения этих характеристик служат совместное распределение случайных величин
F(x,y)=P{X^x, Y^y\.
Основные корреляционные характеристики уже были приведены в § 4.5. Это коэффициент парной корреляции
р=М(Х-Л1Х)(У--МУ)|	=	(11 лл)
°XCY
линии регрессии у по х и х по у (линии условных математических ожиданий)
y(x)=M(Y/X=x), x(y)=M(X/Y—y)\	(11.1.2)
а также линии условных дисперсий, которые характеризуют, насколько точно линии регрессии передают изменение одной случайной величины при изменении другой,
^/х= D (Y/X=x) = M{ [Y—y (x)f /Х=х],	}
^/y = D(X/Y=y)=M{[X-x(y)f/Y=y}.
Средние из условных дисперсий характеризуют точность прогноза одной случайной величины с помощью другой на 266
всем диапазоне изменения последней:
=	Wf/X = x}}=M[y-y(X)f, j
o2/y = Af (M {[X-x (y)f/Y=y))=M [X-x (Y)f.
Точные (или приближенные) прямолинейные регрессии y(x)=«i + p1x, х(у) = а2 + §2у
задаются следующими коэффициентами:
а^МК-^Л/Х, а2 = Л1Х—р2ЛТ К
Если случайные величины X и Y независимы, то р = 0, все условные математические ожидания и дисперсии не зависят от фиксированного значения другой случайной величины и совпадают с безусловными:
у (x)=MY, х(у)=МХ, Oy/x — °f’ ах/г==ох-
В случае нелинейных регрессий степень концентрации распределения вблизи линии регрессии показывает корреляционное отношение
(11.1.6)
Оу	Оу
Как видно, корреляционное отношение меняется в пределах от 0 до 1, оно равно единице тогда и только тогда, когда с^/я=О, т. е. все распределение сосредоточено на кривой регрессии (имеет место функциональная зависимость). Это отношение равно нулю тогда и только тогда, когда линия регрессии у пох представляет сооой горизонтальную прямую линию, проходящую через центр распределения, т. е. если Y и X некоррелируемы. Можно доказать, что во всех случаях Р2<Пу/х, Р2<т)х/у-
2. Множественная корреляция
При изучении корреляционной зависимости между более чем двумя случайными величинами Xi, Хг, .... X* с заданным совместным распределением используют множественные и частные коэффициенты корреляции и корреляционные отношения.
Применение полных коэффициентов парной корреляции при множественной корреляции для изучения связи двух
267
случайных величин может привести к неправильным выводам. Если коэффициент парной корреляции между двумя случайными величинами уменьшается или становится близким к нулю при других фиксированных случайных величинах, то можно сказать, что взаимозависимость этих случайных величин в значительной мере (или определяющим образом) имеет место благодаря третьим факторам. Если же при фиксации третьих факторов степень взаимозависимости двух случайных величин возрастает, то это означает, что эти факторы «маскировали» истинную взаимозависимость двух случайных величин.
Частный коэффициент корреляции — это мера линейной зависимости между двумя случайными величинами из некоторой совокупности случайных величин Xi, Х2, .... Xt, когда исключено влияние остальных случайных величин:
Р12- —Р1.2-(3..*)


(11.1.6)
где F^X.-Xf, У2=Х2 —X?, а Х1=Х*.(3..........ft), Х*=Х2*.(3 t)
— наилучшие линейные приближения величин Х|, Х2 случайными величинами Хз..... Xt, коэффициенты которых определяются из следующих соотношений:
t	k
min М(Х1 — ар— £ а;Х.)2, min М(Х2 — а0— £ аД)2.
“	<=з	“	(=3
Частный коэффициент выражается через элементы корреляционной матрицы /?=||р,у||, составленной из коэффициентов парной корреляции:
Pl2-(3...4)
^12 "\/^ 11^22
(11.1.7)
Здесь Rtj — алгебраическое дополнение элемента рч в корреляционной матрице.
Выше было показано, как по различиям между полным и частным коэффициентами корреляции можно судить о зависимости Х|, Х2 между собой и от других случайных величин. Если случайные величины Xi, Х2, .... Xt попарно некоррелируемы, т. е. рп=О при i=£j, то и все частные коэффициенты корреляции равны нулю.
Множественный коэффициент корреляции служит мерой линейной зависимости между случайной величиной Хг и некоторым другим набором случайных величин Х2, .... Xt- Мно-
268
шественный коэффициент корреляции Р|.(2...определяется
как обычный коэффициент парной корреляции между Xi и Xt, где АТ— наилучшее линейное приближение Xi величинами Xj, Хь коэффициенты которого определяются из соотношения
k
min М (Xj — а0 — У aiXlf.
“	1 = 2
При k — 2 множественный коэффициент корреляции совпадает с обычным коэффициентом корреляции.
Множественный коэффициент корреляции выражается через элементы корреляционной матрицы следующим образом:
Р?.=Р1.(2,	(П-1-8)
где det R — определитель матрицы /?;	— алгебраическое
дополнение элемента рц = 1.
Если р?. =1, то величина Х| с вероятностью единица равна линейной комбинации случайных величин Хг, ..., Xt- С другой стороны, р, =0 тогда и только тогда, когда Xi не коррелирована ии с одной из случайных величин Хг, ..., Хь, т. е. pi2 = ... = pifc = 0.
Для вычисления множественного коэффициента корреляции можно также использовать следующую формулу, которая лучше поддается интерпретации, чем формула (11.1.8):
Р?- — Pl-(2,	1
°И2..ft) _ j
О?
DX*
DX,
(11.1.9)
Именно это выражение оправдывает назначение коэффициента множественной корреляции как показателя тесноты линейной связи. В самом деле, чем лучше приближается случайная величина Xi линейными комбинациями случайных величин Х2, ..., Хи, тем ближе модуль этого коэффициента к единице; чем хуже линейное приближение, тем этот коэффициент ближе к нулю.
Совокупность методов оценки корреляционных характеристик и проверка статистических гипотез о них по выборочным данным называется корреляционным анализом. В корреляци-нном анализе используют следующие основные приемы: 1) построение корреляционного поля (двумерных и трехмерных сечений пространства, если речь идет о многомерном пространстве значений случайных величин Xi, Хг, ..., Xk) и составление корреляционной таблицы;
2Ь9
2) построение выборочных коэффициентов корреляционных отношений;
3) проверку статистических гипотез о значимости связи.
Некоторые из этих приемов уже были рассмотрены в гл. 8—10, поэтому приведем лишь основные результаты касающиеся методов и приемов корреляционного анализа.
3. Анализ парной корреляции
При изучении по выборке (хь i/i), (х2, у2), (хп, уп) корреляционной зависимости двух случайных величин общую картину их взаимной изменчивости можно получить изобразив на координатной плоскости все выборочные точки. Это изображение называется корреляционным полем. На рис. 11.1 приведено корреляционное поле, отражающее зависимость между ростом и весом человека.
Если выборка небольшая, как это имеет место в примере 11.1 (рис. 11.1), то оценки корреляционных характеристик вычисляют непосредственно по выборочным данным с помощью следующих формул:
оценки первых моментов
/=1	/=1
оценки вторых моментов
?20 = 5X=-^- X	(11.1.11)
270
1 \ *
Н02 = Оу = — Е	~
^n=cov(X, У)=~ £ fy—xjfy — y). /=•
По этим оценкам, в свою очередь, определяются оценки коэффициента парной корреляции и приближенных линейных регрессий:	п
£(*,-*) (У,— У)
= ‘	.(11.1.12)
=i	j=i
0 =р 02 = р4^, ai = y —flue, a2=x—fky. (11.1.13) Ox	°Y
В качестве примера рассмотрим расчет корреляционных характеристик парной зависимости между длиной руки и длиной ноги наугад взятого студента-первокурсника.
О Пример 11.1. Исходные данные приведены в табл. 11.1. Для расчета корреляционных характеристик воспользуемся формулами
Номер наблюдения	Рост, см		Вес, кг	
		Xj — X	У1	У, — У
1	165	—9,7	72,9	9,9
2	171	—3,7	48,4	— 14,6
3	182	7,3	66,3	3,6
4	165	—9,7	64,1	1.1
5	183	8,3	62,7	—0,3
6	180	5,3	76,0	13
7	183	8,3	72,8	9,8
8	166	-8,7	50,6	— 12,4
9	173	-1,7	52,3	— 10,7
10	184	9,3	68,6	5,6
11	168	— 6,7	52,6	— 10,4
12	164	9,3	72,8	9,8
13	170	— 4,7	61,6	— 1,4
14	174	— 0,7	66,8	3,8
15	172	— 2,7	56,5	-6,5
X	2620		945	
271
Используя табл. 11.1, прежде всего находим среднеарифметические выборочных значений Имеем
। 15 x=-L > 15 L
^= 174,7;
15
1 15
y=15tyi
^-=63,0.
15
Вычислив отклонения от средних, одноименные отклонения возведем в квадрат, разноименные — перемножим. Суммируя, имеем
15	15
£ (х.-х)2 = 747,35,	£ Ц.-у)2=1153,
15
£ (жу—х) а/7—у)=482.
Используя приведенные выше суммы, получаем: 15
= 1Г t (^-х)2=^1=49.82; 5х = 7,06;
52у=-^ У (у-£)=-^=76,87; а = 8,77;
15	1	15
.	1	_	482
»*•• = Тй" _Е (^-^)Ч-!/)=-ТГ=32,12.
Теперь можно определить эмпирический коэффициент корреляции и оценки коэффициентов приближенной прямолинейной регресии:
Рп 32,12
Р----* Г Л/- о 77	0,5 9,
охау 7,06-8.77
Р " О у	U
Р, = —тс—-=0,418; ₽.=р- -тг—=0,645;
Оу	ох
а2=х — Pj?/= 148,4; at=y— $1х =—49,7.
Соответствующие прямолинейные линии регрессии изображены на рис. 11.1. ф
Если выборочных данных много, то их объединяют в корреляционную таблицу, в каждой клетке которой указывают число попавших в нее выборочных данных rtkm. Клетке таблицы соответствует на корреляционном поле прямоугольник
272
с координатами центра:
^=^o+(fe-1) л*;
fe= 1,.... пх,
т — 1,.... пу,
Ут=Уи+(»1-1)Лу;
у	П.	%	"г
пк= £ nkm, «„= £ пкт, £ £ пкт=п,
in = 1	k = i	m = 1 ft = 1
где пх, пу — число равных интервалов длины Дх, Ду, на которые разбиты области выборочных значений случайных величин X, Y.
При использовании данных корреляционной таблицы формулы (11.1.Ю) и (11.1.11) принимают следующий вид (они отличаются от предыдущих на погрешность округления, возникшую в результате замены координат каждой выборочной точки координатами центра прямоугольника, в который эта точка попала):
п
-	1 V*	~~
х=— ) (х0-|-Дхй)=х0 + Дх/г, п
{/ = — £ (Уо + ^Ут)=Уо + ^Ут’
т = 1
.2

(Ax)2	Г\2 12	(Ду)2 V /	—\2
> (H-kf, <?х=±-*”- У (ц —т),
П. *—*.	Il
v.~ 1	u = 1
(11.1.14)
к=1
Л Дх - Ду	-j-.	—.
Нн=---------- £ £ (x-fe)(n — т),
х=1 |* = 1
Пх	п
где	£	kn*'	£	mn^
fe = l	m=l
По данным корреляционной таблицы можно эмпирические линии регрессии:
п
построить
£
к т ~ 1
k=l,...,n:
п
^(ут)=~ £ ^Пкт. т=\,...,пу.	(11.1.15)
273
Если линии эмпирической регрессии заметно отклоняются от линейной формы, то в качестве меры связи необходимо использовать выборочные корреляционные отношения
(11.1.16)
Величину Лу/х —р2 используют в качестве индикатора отклонения регрессии от линейной.
Проверка гипотезы о значимости связи основывается на распределениях выборочных корреляционных характеристик. В том случае, если совместное распределение случайных величин X, Y нормальное, выборочный коэффициент корреляции значимо отличается от нуля, если
Р!>-----(И-1.17)
1+-^
где tp = tp(n — 2)—критическое значение распределения Стьюдента си —2 степенями свободы, соответствующее уровню значимости р.
Если связь значима, то для истинного коэффициента корреляции имеет место следующий приближенный доверительный интервал (при больших выборках):
1-р2 р-“₽—

(11.1.18)
где ир — критическая граница для нормального распределения, соответствующая уровню значимости р.
4. Анализ множественной корреляции
В случае множественной корреляции основой статистического анализа служит матрица выборочных значений X — ||х/,||; 1—^	»=1. —, k; п — объем выборки, k — число
рассматриваемых случайных величин. Для анализа парной
27 ч
ависимости могут быть использованы формулы, приведенные ыше для анализа парных корреляций. Однако парная зависимость осложнена влиянием других случайных величин. Поэтому наряду с корреляционной матрицей, состоящей из коэффициентов парных корреляций, и с другими характеристиками парной корреляции необходимо использовать и выборочные характеристики множественной корреляции — частные и множественные коэффициенты корреляции.
Выборочную оценку коэффициента частной корреляции случайных величин Хц Хг, если исключено влияние остальных случайных величин Хз, .... Xk, можно получить с помощью следующего выражения [аналога выражения (11.1.7)]:
Р12 =Р12 (3.ft)= в ~1	(11.1.19)
\1 ‘ "-22
где Ra — алгебраическое дополнение элемента рц выборочной корреляционной матрицы Я.
Сравнивая выборочные полный и частный коэффициенты парной корреляции р,;- и pif_, можно делать выводы о том, насколько взаимозависимость между величинами X,-, X,- вызвана их собственной взаимосвязью и зависимостью каждой из иих от других случайных величин (различные варианты таких выводов были даны в начале настоящего параграфа).
В качестве выборочной оценки коэффициента множественной корреляции используют выражение
Pl-=Pl.(2..*)=	(11L20)
А 1 V	-
где 5|=— у (х(1 —jc'|)2 — полная выборочная дисперсия слу-п i=i
чайной величины Хц
/=1
Хц — наилучшие линейные приближения выборочных значений хд выборочными значениями х/2, ...» Xjk, т. е.
k
*/i=«o + £ Цг
(=2
Здесь а0, а21 ..., определены методом наименьших квад
275
ратов
Подробнее определение оценок коэффициентов линейной регрессии и их свойства рассмотрены в последующих параграфах настоящей главы.
Чем ближе значение выборочного коэффициента множественной корреляции к 1, тем лучше приближается случайная величина линейными комбинациями случайных величин Х2...Xt.
§ 11.2. Регрессионные модели как инструмент анализа и прогиозирования экономических явлений
Для описания, анализа и прогнозирования явлений и процессов в экономике применяют математические модели в форме уравнений или функций. Модель экономического объекта (или производственного процесса), отражая основные его свойства и абстрагируясь от второстепенных, позволяет судить о его поведении в определенных конкретных условиях.
В случае применения регрессионных моделей результат действия экономической системы или объекта в виде одного или нескольких выходных показателей представляется как функция влияющих на него факторов. Некоторые из этих факторов оказывают существенное влияние на результат, другие — весьма незначительное. Как правило, существенных факторов немного, в то время как несущественных достаточно большое число, поэтому последними полностью пренебрегать нельзя. Как известно из политэкономии, источником любого богатства является труд (прошлый или настоящий). Поэтому к числу основных факторов при изучении экономического объекта относят обычно настоящий труд (или трудовые ресурсы в той или иной мере), прошлый труд (энергия, сырье, материалы, оборудование, здания, сооружения и т. д.). Вместе с тем труд прилагается при определенном состоянии внешней среды, т. е. при определенных природных условиях, поэтому соответствующие факторы также должны найти отражение в модели.
В процессе производства и распределения продукции имеют место массовые многократно повторяющиеся события, например многократное изготовление одинаковых деталей,
276
ов машин в крупносерийном производстве, многократно Повторяющиеся акты продажи в продовольственных и промтоварных магазинах. Несмотря на динамизм экономики и ее отдельных частей, на протяжении относительно небольших оемеиных периодов и в пределах отдельных экономических подсистем имеет место стабильность в условиях совершения массовых событий. По крайней мере (особенно при прогнозировании), подразумевается возможность многократного повторения производственной ситуации, быть может, при других значениях существенных и несущественных факторов, однако при относительно стабильном комплексе внешних условий.
Таким образом, приходим к следующей теоретико-вероятностной схеме. Результирующий показатель у является функцией
(еь вп) факторов:
y = F(Xi,...,xk, г.е„).
Исходя из предположения эволюторности поведения экономической системы на относительно небольшом временном интервале и при сравнительно малых изменениях переменных, с помощью разложения в ряд Тейлора получаем:
У = Оо+ / aiMl + o(Nx)+	avAev + o(Ae),
A—/	v=I
существенных (xi,х*) и несущественных
aQ = F(x°l,...	.44		4); (=1...
dF . о dxj	-.4 4-	..e2); i=l,.
_dF /0 4	(x„ ..	P°	-.4. v=l,
Ах,=х,—x°,	Aev = ev	- 4, Af Aev.
Ах = max (| Ajq |,.... |AxJ),
Ae = max (| Aej |, ..., |Aen|),
*’ Несмотря на инерционность поведения экономических систем (особенно больших), возможны и резкие изменения в связи с достижениями научно-технического прогресса (например, появление новой технологии), в новых условиях надо рассматривать другую Функцию.
277
где о (Д) — бесконечно малая величина большего порядка малости, чем Д; х°,	х%, е?, .... ей — набор значений факто-
ров, в окрестностях которого изучается поведение экономического объекта.
В случае независимости случайных факторов, их относительной малости (в смысле влияния на результат) и достаточно большом числе, согласно центральной предельной теореме теории вероятностей, получаем, что случайная составляющая
п
е= £ av Де¥ + о(Де) »=i
распределена по закону, близкому к нормальному с параметрами Л1е=0, De = a2. Если эти предположения нарушаются, то возможно образование другого распределения.
Детерминированная составляющая регрессионной модели
k
i7 (-S..xk, е°,.... e°)=f (Дх.ДхЛ)=а0+ £ а, Дх. + о (Дх)
i=i
при небольших изменениях независимых переменных (значений существенных детерминированных факторов) является линейной функцией. Если интервалы изменения независимых переменных увеличиваются, то в случае существенной нелинейности функции следует рассмотреть ее разложение в ряд Тейлора более высокого порядка:
k
f (Дх,, .... AxJ = a0+ £ Ч- Дх. + i=l
k
+ £ а/;-Дх(. Дх;.о [(Дх)21
dF 1
а./ = d- dXj I х=ж°, t=e°: 0	= max (I Дх£ Дх(.I).
Введя ноиые переменные х,7 = Дх,Дх/, вновь получим линейную детерминированную составляющую регрессионной модели
/(Дх.......	Z1.1, Z1.2. .... Zk.k) =
k	k
=au+ £ а,-Дх(+ £ a^ + oRAx)2].
i=l	»,j = l
278
В принципе с помощью полиномов можно с высокой сте-ью приближения описать любую достаточно «гладкую» / олюторную) функцию, однако это связано с появлением большого числа коэффициентов, которые надо определять иа основании нового объема исходных данных. Поэтому в случае невозможности линеаризировать функцию (разлагая в ряд или преобразуя) при небольшом числе коэффициентов используют методы нелинейного оценивания. В настоящем пособии в основном рассматриваются методы линейного оценивания. Введение в методы нелинейного оценивания приведено
в § 13.3.
§ 11.3. Парная линейная регрессия
В этом случае имеется только один детерминированный фактор х и линейная регрессионная модель записывается следующим образом:
y=yW + e, У (х) = а0 + а^;	(11.3.1)
у(х)=а°4-а1 (х—х0), а°=у (х0) = а0 + а1х0, (11.3.2) где у(х) — детерминированная составляющая; а°=у(хо)— значение детерминированной составляющей в стандартной точке; ai — теоретический коэффициент регрессии, показывающий, насколько изменится детерминированная составляющая, если фактор изменится на единицу; е — случайная составляющая с независимыми значениями, Afe = 0, Ds = o2.
Оценка параметров регрессии ао, он в условиях конкретной ситуации проводится по статистической совокупности, которая рассматривается в качестве выборки;
(Ур^),	/=1....п,
где п — число единиц совокупности (наблюдений) или объем выборки.
Как будет показано далее, удобнее всего в качестве стандартной точки выбирать среднее арифметическое выборочных значений хо=х. В этом случае
У (х)=а° + а1 (х—х), а° — у(х),	(11.3.3)
У (Х)=У (z) = «° + «iz. z=x—х, (11.3.4) при этом
н	л	п
Z Z/ = I	I х-пх = 0.
7=1	/=1	i = l
279
Для того чтобы определить два коэффициента регрессии по правилам детерминированной математики, необходимы два уравнения, однако в условиях вероятностной ситуации этого недостаточно, так как требуются дополнительные уравнения для определения главных характеристик случайной составляющей. В данном случае имеется п уравнений (п>2)
У, = «о + aixi + 8/,	(И.3.5)
где е, — реализация случайной составляющей, или те же п уравнений, но записанных в другой форме:
= а°+	4-еу,	х. (11.3.6)
Статистические оценки ао, см параметров регрессии ао, см выбираются таким образом, чтобы эмпирические значения детерминированной составляющей t/j = ao+ хрс, как можно ближе приближались к фактическим значениям результирующего признака у,. В качестве меры близости обычно выбирают сумму квадратов отклонений, реже — сумму модулей отклонений. Выбор той или иной формы меры близости определяется статистическими свойствами случайной составляющей. Так, если случайная составляющая имеет нормальное распределение, то оценки, обладающие иаилучшими свойствами,получают с помощью метода наименьших квадратов (МНК).
В гл. 7 было показано, что при распределении случайной составляющей по закону Лапласа ** следует использовать метод минимальных отклонений, а в случае равномерного распределения — критерий минимизации максимальных отклонений.
Наиболее прост и в определенном смысле наиболее универсален метод наименьших квадратов, который и используется ниже для расчетов. Прежде всего составим сумму квадратов отклонений как функцию возможных, но не известных параметров ао, си:
Q («о- «1)= £ (у, - «о—“1х/)2-	о137>
/=1
*• Случайная величина X имеет распределение Лапласа, если ее
1 х—а|
i плотность равна ехр
где а, р — параметры.
а
280
для минимизации функции необходимо приравнять нулю частные производные по параметрам. Имеем
4^-1	=~2 Е (У,— ао-а1Х,)=0,
—=-2 £ Ц-“о-«1^)=о-
'«1=«| /=’
Получаем следующую систему из двух уравнений, которая называется системой нормальных уравнений:
na0+( £ *,)«> = £ У г
V=i /	/=|
(Ех, Уо+ (Е У« = Е у-хг (113 8) \i=i /	\(=i	/	,=1
Из первого уравнения получаем
а0 = у — atx.	(11.3.9)
Подставляя это значение во второе уравнение, определяем оценку и другого коэффициента:
Е у^х‘~Х^= Е так как у Е Ц~^=0 b=i /=•	<=' J
а1=-^---------------------------• (И 3.10)
Е(^-^)2	Е(х/-^2
/=1 ,=|
Перейдя к стандартным обозначениям, имеем
п	п
Е yiz<	ЕДу/2/
ДО -	1=’	/=|
^У,=У— У-
(11.3.11)
281
Эмпирическая линия регрессии имеет уравнение
у = у + а,(х—х),	(И.3.12)
т. е. проходит через точку с координатами (х, у).
Полученные с помощью метода наименьших квадратов оценки параметров регрессии являются несмещенными н состоятельными. В самом деле, представим каждую из этих оценок в виде суммы детерминированной и случайной составляющих:
а° = а0 + е,
«=«1 + £ e/z/£ 2Г	(Н 3 13)
i=i j=i
Так как Afe/ = O, то Afa° = a°, Mzi=ai, т. е. оценки не смещены.
Эти оценки имеют следующие дисперсии и ковариацию:
ОЙ°=Ое = —о2,
п
п
,п	п Ч
Da, = D J	•
i =i	/=i
(11.3.14) cov (a0, a,) = Af (a° — a0) (a, — a,)=
=M6 у w£ £ ^=°-\ /=>	/= / /=>	~^/=l
Следовательно, первая оценка всегда состоятельна, а вторая
Л
состоятельна в том случае, когда z^-^oo при п-»-оо.
i=i
Можно также показать, что рассматриваемые оценки являются эффективными (т. е. имеющими минимальную дисперсию) в классе линейных несмещенных оценок
Построим теперь несмещенную оценку дисперсии случайной составляющей. Оценками реализации случайной составляющей в, служат отклонения фактических значений У) от
282
выравненных у,;
обозначим эти отклонения через е,. Имеем
—y; = “° + 'xiz/ + e/ ——“iz/ =
= (а° — а°) + (а, -а,) 2,- + ^.
Оценки коэффициентов регрессии не смещены и Ме, = 0. поэтому Mej=O- Представляется естественным строить оценку дисперсии на базе суммы квадратов отклонений £ е?.
Определим теперь коэффициент при этой сумме, при котором оценка дисперсии является несмещенной. Согласно (11.3.13), имеем
п	п
ej==Rj-z-z. £ e,z,/£ zf, 1=1	i=i
поэтому
СП	\2 / П \ 2
Г еЛ j / ( £ j +
zf — 2Ме(ё —
и окончательно
м I Г Ме/=^(п-2)-1=1	1=1
Таким образом, получена следующая несмещенная оценка дисперсии случайной составляющей:
^-^2 £ ^“^2- £	° L3 I5)
1=•	1=1
При проверке гипотез и построении доверительных интервалов для параметров регрессии и всего уравнения в целом необходимо знать распределения соответствующих величин. Если случайные составляющие ej распределены нормально, то оценки параметров регрессии и детерминированной составля
283
ющей, являющиеся линейными функциями е,, /=1, ... п также распределены нормально При этом сумма квадратов отклонений —j-распределена по закону х2 с п— 2 степенями свободы. Поэтому при построении доверительных интервалов следует воспользоваться распределением Стьюдента си — 2 степенями свободы.
Используя (11.3.13), получаем следующие доверительные интервалы для параметров регрессии:
У —/рО/’\^<а°<У + 1рО/д/«.	(П.3.16)
j=i j=i	у /=1
<«< X ул/£ z’+IpVa/z /=1	1=1	V /=1
где tp — критическая граница распределения Стьюдента с и—2 степенями свободы, соответствующая уровню значимости р.
В действительности может оказаться, что фактор х не влияет на результирующий признак, что эквивалентно ai = 0, однако при этом выборочный коэцтфициеит он, вообще говоря, отличен от нуля. Для проверки существенности отклонения ai от нуля служит критерий значимости. Рассматриваются гипотеза Но:«1 = О и конкурирующая гипотеза Н\'.щ^ 0. Затем рассчитывается эмпирическая значимость
Ч =«./%=! 2>УГЛа/^ Z
которая сравнивается с теоретической значимостью tp. Если И («i)l ^/р, то с вероятностью ошибки р принимается гипотеза Но, в противном случае, т. е. при |/ (cti)l >tp, принимается гипотеза Hi. В случае принятия гипотезы Но фак-тор х исключается из модели и тем самым принимается, что наилучшее описание системы наблюдений — с помощью среднего арифметического у=у.
В общем случае при достаточно слабых ограничениях на е, и Xj, / = 1. п,	МНК-оценки параметров регрессии и детерминиро-
ванной составляющей являются асимптотически нормальными и эффективными.
284
В качестве меры того, насколько хорошо регрессия описы-т данную систему наблюдений, служит коэффициент де-ВЭ минации, при этом за базу сравнения принято описание помощью среднего арифметического. Составляются следующие суммы квадратов отклонений: п
S2=^ (у,—У}2 — фактических значений от их среднего
арифметического
п
(у-—yf—выравненных значений от среднего /=|
арифметического фактических значений;
п
S2= £ (у,—у;)2— фактических от выравненных зна-/ =|
чений;
при этом имеет место равенство
S2 = S24-S|,	(11.3.17)
поскольку
S2= £ (У,-^= £	= £ ^-У^Ч-
j=i	i=i	i=i
+ £ (У,-У?+ 2 £ (yj-y^iyi-y)^
,=| ,=|
а последняя сумма равна нулю:
£ (У/-У,)(У/-у)= £ («//-У-»!2,) «izj =
i=i	/=>
= «1 £ (У/—У — «|z/) z, = /=|
=«, £ (у-у)?- £ {y-y)Zj =0.
L/=i	j=i	J
Коэффициент детерминации есть отношение объясненной части вариации ко всей вариации в целом, поэтому из
285
(11.3.17) имеем
s2 s2 s2 
(11.3 J 8)
Таким образом, чем «ближе» этот коэффициент к 1, тем лучше описание, разумеется, если при этом модель методически правильна.
Сами расчеты и проверка достоверности полученных оценок коэффициентов регрессии не являются самоцелью, это лишь необходимый промежуточный этап. Основное — это использование модели для анализа и прогноза поведения изучаемого экономического явления. Прогноз осуществляется подстановкой значения фактора х в оценку детерминированной составляющей:
У W = y + “, (*—х)-	(И3 19)
Это точечная оценка детерминированной составляющей у(х) в точке х. Можно показать, что (11.3.19) наиболее точный в среднеквадратичном прогноз. Чтобы измерить точность этой оценки и построить доверительный интервал для у (х), необходимо найти дисперсию точечной оценки у (х). Имеем
Di'(x) = Dy + D [ai(x —х)]+2 соу [у, cti (х — х)] =
= -^-+(х-х)2
и2
(x—xf
п
24
/=|
(11.3.20)
последнее равенство верно, поскольку
cov [у. а, (х—х)]=(х—х) cov (у, at) =
X — X
с2 (х—х)
✓ п п м( X Y1
Окончательно получаем следующий доверительный интервал для прогностического значения у (x) = ao + «i -х детерми-
286
нированной составляющей:____
г+а,(х-*НА /^-+^^<У(х)<У + а1(х-^)+
V Ц
/=|
V
1=1
Рассмотрим конкретный пример расчета параметров парной регрессии и прогноза по полученному уравнению эмпирической регрессии.
О Пример 11.1. Исследуем зависимость розничного товарооборота (млн. руб) магазинов от среднесписочного числа работников. Товарооборот как результирующий признак обозначим через у, а среднесписочное число работников (чел.) как независимую переменную (фактор) — через х. На объем товарооборота влияют факторы (объем основных фондов, их структура, площади торговых залов и подсобных помещений, расположение магазинов по отношению к потокам покупателей н др.). Предположим, что в исследуемой группе магазинов значения этих последних факторов примерно одинаковы, поэтому влияние различия их значений на изменении объема товарооборота сказывается незначительно. В табл 11.2 во втором и третьем столбцах приведены значения объемов розничного товаро-
Таблица 11.2
Порядковый номер магазина	х	У	Ах	Д'/	(Ах)2	Ду-Дх	(Д'/)2	У	Ду	(Д'/)2
1	2	3	4	5	6	7	8	9	10	11
1	73	0,5	— 40	-0,7	1600	28	0,49	0,43	0,07	0,0049
2	85	0,7	-28	— 0,5	784	14	0,25	0,661	0,039	0,0015
3	102	0,9	- 11	-0,3	121	3,3	0,09	0,998	— 0,088	0,0077
4	115	1,1	2	-0,1	4	-0,2	0,01	1,239	— 0,139	0,0193
5	122	1,4	9	0,2	81	1,8	0,04	1,373	0,027	0,0007
6	126	1,4	13	0,2	169	2,6	0,04	1,45	— 0,05	0,0025
7	134	1,7	21	0,5	441	10,5	0,25	1,604	0,096	0,0092
8	147	1,9	34	0,7	1156	23,8	0,49	1,854	0,046	0,0021
Итого	904	9,6	0	0	4356	83,8	1,66	1,199	0,001	0,0479
287
оборота и среднесписочного числа работников, а в следующих ctoio цах приведены значения расчетных величин, необходимых для опре деления оценок коэффициентов регрессии и дисперсии случайной составляющей (Дх, = х/—х, Лу/=у,— у, &у/=у1—у,).
Найдя по итогам второй и третьей колонок средние х=904/8 = 113, у=9,6/8=1,2, последовательно заполняем 4—8-й столбцы и подводим итоги по этим столбцам. Теперь можно определять эмпирические коэффициенты регрессии. По формулам (11.3.10) находим следующие точечные оценки коэффициентов регрессии:
а°=у = 1,2; а0=у — а,х= 1,2 — 0,01924-113 = 0,974,
У У) (*,—*)
«I =—----------------=-^4-=0,01924
1	"	4356
Z i=i
Значение нулевого коэффициента представляет собой ординату эмпирической линии регрессии в точке х = х=113, а коэффициент регрессии ai =0,019— угловой коэффициент этой прямой линии. На рнс. 11.2 изображены система соединенных штриховой линией точек наблюдений н прямая эмпирический регрессии. Если не учитывать, что мы имеем не теоретическую, а эмпирическую линию регрессии (кот орая действительно является приближением теоретической линии регрессии), то коэффициент си =0,01924 показывает, что увеличение среднесписочной численности на одного человека приводит к увеличению объема товарооборота в среднем на 19,24 тыс. руб. Это своего рода эмпирический норматив приростной эффективности использования работников данной группы магазинов. Если увеличение численности на одного работника приводит к меньшему росту объема товаро-борота, то прием его на работу необоснован.

Теперь можно вычислить выравненные значения (значения орди-нат эмпирической линии регрессии)
у=a°+at (^ — х)= 1,2 + 0,01924(^—113)
заполнить 9, 10 и 11-й столбцы. Итог 11-го столбца, в свою очередь, позволяет получить оценку дисперсии случайной составляющей:
й2=-*^ £ (У._^=2^1«О,ОО8.
п—2 ,1-1 I I 6
Знание дисперсии случайной составляющей позволяет проверить статистические гипотезы о параметрах регрессии и уравнении в целом, а также строить интервальные оценки параметров регрессии и прогноза по уравнению регрессии.
Для проверки гипотезы о том, значимо ли отличается от нуля выборочный коэффициент аь находим, согласно (11.3.17), эмпирическую значимость коэффициента
_ 0,01924-66 0,08944
14,198,
которую теперь надо сравнить с теоретическим значением tp(n — 2), найденным из таблицы распределения Стьюдента. Выбираем уровень значимости равным 5 % (т. е. с вероятностью 0,05 мы допускаем отклонение гипотезы cci =0, когда она на самом деле верна); тогда по таблице находим /о.оз (6)=2,447 Эмпирическая значимость (14,198) существенно больше теоретической (2,447), поэтому ai значимо отличается от нуля, т. е. принимаем гипотезу cci=#O.
Этот же вывод подтверждается и высоким значением коэффициента детерминации
..2
d= 1-----1 -2—!--------------= 1 - °-0.*79 = 97,1 %,
$2	"	1,66
Z fy—
/=|
который показывает, что в исследуемой ситуации 97,1 % общей вариабельности розничного товарооборота объясняется изменениями числа работников, в то время как на все остальные факторы приходится лишь 2,9 % вариабельности. Этот статистический вывод не абсолютен. Допустим, что в магазинах исследуемого типа стало °льще работников, при этом предельная эффективность работника
Ю В. А Колемаев и др.	289
упадет, а на первый план выходит влияние других факторов По видимому, это прежде всего доля дефицитных товаров в ассортименте н комплекс всех факторов, который характеризует культуру обслужи вания.
Построим интервальные оценки параметров регрессии а0 О1 в форме а°±/ро_0, сЦ ±tpc« . Здесь середины интервалов являются точечными оценками коэффициентов регрессии, которые уже рассчитаны: ао=р=1,2 а, = 0,01924. При выборе уровня значимости 5 о/ loos (6) = 2,447. Остается только иайти стандартные ошибки коэффициентов регрессии. Согласно (11.3.14), имеем
Отсюда окончательно получаем, что с вероятностью 0,95 истинные значения параметров лежат в пределах
1,2 —2,447.0,032<а0<1,2 + 0,078 или 1,122<а°< 1,278,
0,01924—2,447.0,0014<сс, <0,01921 + 0,00343 или
0,01581 < а, <0,02267.
Найденные отклонения фактических значений от выравненных (столбец 10) позволяют провести сравнительный анализ работы различных магазинов рассматриьаемой группы Прежде всего необходимо обратить внимание на магазины с отрицательным отклонением (3, 4, 6-й) Особе нно велико отклонение у 4-го магазина. В реальной ситуации необходимо внимательно обследовать эти магазины и установить причины отклонения фактического значения товарооборота от выравненного («нормативного» значения). В данной ситуации это может быть расположение магазина в стороне от основных потоков покупателей, плохое снабжение товарами повышенного спроса, устаревшее оборудование, неудовлетворительный кадровый состав и т. п. При чисто статистическом анализе при сделанных выше предположениях н на основе имеющихся данных приходим к выводу, что в этих магазинах, по-видимому, имеются резервы в организации труда работников. Напротив, в магазинах 1, 2, 5, 7, 8 работники нспользу-
290
я эффективнее статистического норматива, но может оказаться, эти магазины объективно находятся в лучших условиях.
ЧТ° Полученное уравнение регрессии может быть использовано для гноза. В частности, пусть намечается открытие магазина такого " типа с численностью работников х=140 чел., тогда достаточно обоснованный план товарооборота следует установить по уравнению регрессии
^(Х)=а° + а| (х—х)= 1,2 + 0,01924 (140—113)= 1,72 (млн. руб.).
С точки зрения принятой теоретической схемы полученный прогноз является лишь точечной оценкой истинной детерминированной составляющей у (х), а сама эта составляющая лежит внутри доверительного интервала y(x)±tpc^M, в котором, согласно (11.3.20),
=VDj)(x)=o
0,008.*+^=^=0,039,
поэтому получаем следующий доверительный интервал для теоретического значения прогноза:
1,72- 2,447 • 0,039< у (х) < 1,72+0,095
или
1,625<у(х)< 1,815. •
§ 11.4. Множественная линейная регрессия
В случае линейной множественной регрессии модель имеет следующий вид:
k
У = У(х)+г, у(*)=а0+ £ aixi (11.4.1)
i=i
Или
k	k
S?(*) = a°+ £ аД*(-х?), а°=а0+ £ arf, (11.4.2) i=l	i—l
10*
291
где у (х)— детерминированная составляющая, зависящая от факторов
(Х> \
1,
**/
а°=у(х°)— значение детерминированной составляющей в стандартной точке х°:
а, — коэффициент регрессии при z-м факторе, показывающий, насколько изменится детерминированная составляющая, если i-й фактор изменится на единицу; е — случайная составляющая с независимыми значениями, Л4е = 0, Ое = о2. Оценка параметров регрессии ао, а>, ..., а* осуществляется по выборочным значениям результирующего признака и факторов у,, Xjt, .... Xjk, .... п, n>fe + l. При наличии конкрет ной выборки целесообразно, как было показано § 11.3, в качестве стандартной выбрать точку, координатами которой служат средние арифметические выборочных значе-k
ний факторов х°=х„ при этом t/(*)=a° +	a;z;, zj=xI—
i= I
«°=5w. k	k
t/(*)=a°+	аДх,—*f)=a° +	“j2,. zi~xt~a° = t/(x).
i=l
(11.4.3)
При изучении множественной регрессии используется тот же подход, что и при изучении парной регрессии. Прежде всего определим оценки метода наименьших квадратов:
п	k
<2 («о- “.aJ= £	£ “л/.
/= I	i= I
2 Z “° Za6o=<>. u	1= I	1=1
-§-la( = S=-2 £ (У “«О- Z а.*ё)*// = 0’ /=1.........
1	/ = 1	i = 1
292
Таким образом, для определения (Лг-|- 1)-й оценки пара-етров регрессии получена система £-|-1 нормального урав-
нения
1=1,.... k.
(11.4.4)
Если выразить а0 нз первого уравнения
k
а0 = У~ £ aixi •=1
и подставить в другие нормальные уравнения, то для определения оценок остальных k параметров получим следующую систему из k уравнений:
I Z	“ = Е У, 1=1...........fc-
(11.4.5)
или [в обозначениях (11.4.3)]
£ ( Z zi‘zn) & = Z 1=^ ••••k- (П 4-6)
Все дальнейшие расчеты и построения удобнее выполнять > матричной форме. Введем следующие матричные обозначения (слева от обозначения матрицы указаны ее размеры):
(пХ1),
— вектор-столбец выборочных значений результирующего признака и центрированных значений;
[пХ(* + 1)], Х=
293
—	матрица значений факторов, включая единичный столбец отвечающий свободному члену;
1«Х(*+ 1)]. Z =
—	матрица центрированных значений факторов;
[(* + 1)Х(* + 1)], 4 = ZZ
—	матрица нормальных уравнений в центрированной форме-
[(* + 1)Х(*4-1)], С=Д-‘ =
/ — о о ... о '
/ п
= 1 0 сн с|2 ... с1к
\ 0 cki ск2 ... скк
—	матрица, обратная к матрице нормальных уравнений;
[(*+1)Х1], « =
—	вектор-столбец всех параметров регрессии;
Р+1)Х1]. а =
— вектор-столбец метром а°;
параметров регрессии с начальным пара-
(пХ 1), е =
— вектор-столбец значений;
отклонений фактических от выравненных
(пХ1),
— вектор-столбец выборочных реализаций случайной составляющей с ковариационной матрицей Гг = Мее' = о2£п, где
294
____единичная диагональная матрица (пХ«), а штрих здесь алее означает транспонирование. В матричном виде мо-ИелЬ в форме (11.4.2) записывается так:
Д	Г=Ха+е.	(11.4.7)
система нормальных уравнений имеет вид
(Х'Х)а = Х'К a=(X'X)~l X'Y, (11.4.8)
а в форме (11.4.4) —в виде
Y=Za + e	(11.4.9)
и система нормальных уравнений такова:
(7'2)а=2'У.	(11.4.10)
Из (11.4.10) получаем решение нормальных уравнений в форме
a = (Z'Z)1 Z'Y=CZ'Y.
а°=у.	(11.4.11)
Используя (11.4.9), разложим оценки на детерминированную и случайную составляющие. Имеем
a=(Z'Z)-1 Z'Y^Z'Z)-' Z'(Za + e)=a + CZ'e,
а°=у=—	( «°+ jP +	)=а° + е. (11.4.12)
” /=1 \ <=1 /
В первом равенстве воспользовались тем свойством, что
/=|
Как видно из (11.4.12), оценки параметров регрессии являются несмещенными. Кроме того, оценка а0 статистически не зависит от любой из оценок а,, так как
/ k п	\
cov (а0, а^ = М I е £ £ cilzjlej 1=
\ /=1 /=|	/
। и А я	2 k п
= Z Z I	£ са £ 2., = 0,
v = l/=l/ = l	» = 1	/ = 1
(11.4.13)
поскольку У ^ц=0
295
Оценка а° имеет дисперсию
D£° = De=— п
(4.4.14)
и поэтому состоятельна.
Найдем теперь ковариационную матрицу оценок остальных параметров регрессии:
Га = II cov (а(, а() || = М (а — а) (а — а)' = =М (Z'Z)-1 Z't [(Z'Z)'1 Z’e\ = =(Z'Z)~' Z'Mw'Z(Z'Z)-' = <fC.
(4.4.15)
Из (11.4.15), в частности, вытекает, что
££,=0%, cov (а, а.1)=о2си	(11.4.16)
и, следовательно, оценка состоятельна при си->0, п->оо. В частности, если наблюдения факторов расположены таким образом, что матрица нормальных уравнений диагональна, то
Сц=-------и, следовательно, са-»-0 при z?->-oo, n->oo.
Z 4
/=1
Рассмотрим теперь сумму квадратов отклонений е/=у( —
—У1 фактических значений от выравненных значений. Имеем в форме (11.4.1), используя (11.4.8),
e=Y—?=Xa + f — Xa = Xa + e — X(X'X)-lX'(Xa + ^=
= е—X (Х'Х)~1 Х'г = Не.
где Н=Еп — Х(Х'Х)~' X'.
Матрица Н симметрична и обладает следующим свойством:
if = [£„ - X {Х'Х}-1 Л'] [Еп - X (Х’Х)~1 Х']= =Еп—2Х(Х’Х)-' *' +
+ X(X'X)-' Х'Х(Х'Хг' Х'=Еп-Х(Х’Х}~1 Х' = И, поэтому получаем
М £ (у— y,f=M £ ^ = Ме'е = Мг'Н'Не =
/=1 /=<
= Mz'lfe, — Ме-Не.
296
Так как Ме2=о2 и Л4е,е¥ = 0 при v=#j, то
Ме'Не=М £ еД„е„ = о2 £ Л/7 = о2 tr (Я), /, v = i	i=i
где tr (Я)— сумма диагональных элементов матрицы у/ Так как
tr (Я) = tr (£„)-tr [X (Х'Х)-1 Х']=
=tr (£„) - tr [(Х'Х)-1 Х'Х]= tr (En) - tr [£а +, ]= п - k - I,
ТО окончательно получаем
М £ (у,— У,)2 = а2(п — k— 1) i=i
и тем самым
о2 =---‘ У (у - у?	(11.4.17)
п —« —1 А, 1	1
!—1
является несмещенной оценкой дисперсии случайной состав-
1 "
ляющей, а величина - £ (у,—у()2, если случайная состав-о /=1
ляющая нормальна, распределена по закону х2 с n — k — 1 степенями свободы.
Последний факт и соотношения (11.4.16) позволяют проверять гипотезы о значимости выборочных коэффициентов регрессии. Если расчетная значимость коэффициента
меньше по модулю теоретической значимости tp, то теоретический коэффициент регрессии принимается равным нулю (а,=0) с вероятностью ошибки, равной р. Теоретическая значимость — критическая граница распределения Стьюдента с n — k—1 степенями свободы. Если выборочный коэффициент а; оказался незначимым, то соответствующий фактор выводится из модели. В ряде работающих программных систем на ЭВМ принят следующий алгоритм последовательного исключения факторов из модели. На каждом этапе рассчитываются эмпирические значимости всех коэффициентов регрессии t,-, i=l,.._, fe. Эти значимости ранжируются
297
по значениям их модулей, и если минимальное значение меньше теоретической значимости, то соответствующий фактор выводится из модели и расчеты повторяются. Как только все факторы оказались значимыми, то расчеты завершаются.
Качество всей модели в целом определяется по критерию Фишера: если
£ (у—
< Fp (*• п ~ k - 1 )>
i=i
(11.4.18) то уравнение в целом незначимо, в противном случае — значимо. Здесь Fp(k,n — k — 1) — критическая граница распределения Фишера с k, п — k—1 степенями свободы, соответствующая уровню значимости р.
Аналогично парной регрессии может быть рассчитан коэффициент детерминации как доля объясненной вариации в общей вариации:
S2
rf=V-=1-^-	(11Л19)
•J	о
Знание распределений и дисперсий оценок параметров регрессии позволяет построить доверительные интервалы для их теоретических значений:
а(<а, + tpa^c^. (11.4.20)
Наибольший интерес представляет использование модели регрессии для прогноза. Точечный прогноз получаем подстановкой прогностических значений факторов в уравнение эмпирической регрессии
k
У(*) = У + £ а, (*,—х). i=i
Чтобы получить доверительный интервал для теоретической детерминированной составляющей, необходимо найти
298
дисперсию точечного прогноза: o2 = Dy(x)=Dy+D
“i (*;
2	к
=_+О2 У (х — х) c^Xf-Xt). И , Р.
(11.4.21)
Здесь мы использовали формулы (11.4.13), (11.4.16).
Из (11.4.11) получаем следующий доверительный интервал для детерминированной составляющей:
k	k
у+ V а, (^ — *<) —	“° + £ <*«“ *<)<£+
/=|	»=1
+ Е
i=i
В матричной форме легко получить оценки параметров регрессии и в том случае, когда значения случайной составляющей являются зависимыми, т е. Мее' = Ге- Введя новые переменные
У=ГГ1/2Г, Х = ГГ,/2Х.
е = Ге-|/2в,
сводим задачу к предыдущей, поэтому имеем а = (Х'Ге-,Х)-,Х'Ге-‘>
Га=(хтг,х)-1.
В частности, в случае пространственно-временной выборки случайную составляющую естественно представить как сумму двух компонент
^=6, + ^, Mejt = O,
Dg, = oo, О6д=о2;
1=1,..., Т,
первая из которых характеризует случайные отличия единиц статистической совокупности, а вторая является остаточным членом. Даже в случае предположения о независимости обеих компонент друг от друга и независимости их отдельных значений приходим к следующей форме ковариационной мат-
299
рицы размера (пТ'Х.пТ):
°2 + оо о?	... о2
°0 О2 + <Т§	... д2
°0 °0	О24-и2
Обратная структуру:
матрица также имеет блочно-диагональную
«г+^-по2
О2 + 7о2
Оо
О
при i=i',
при /=/', при /¥=/'.
t = t',
Метод максимума правдоподобия (ММП) приводит к следующим оценкам:
1=0, I,..., k,
ГГ' = 1|х,(/т11.

а° пТ(Т—\) ‘
t&r где
k еп=Уц~ Z “Л/г i = 0
Если выборочные значения факторов приближенно ортогональны, то можно вывести следующие формулы для диспер-300
сИй оценок МНК и ММП:
Da,= * - (о2 + Гроо).
где р.=——=---------, 0<р,<1; <7, = 1—р;, откуда видно,
Т L V i
i.t
что оценка ММП, учитывающая структуру ковариационной матрицы, более эффективна, чем оценка метода наименьших квадратов. В целом обе эти оценки асимптотически эффективны. Можно также показать, что оценки, полученные по пространственной выборке осреднением данных по времени, менее точны, чем приведенные выше, поэтому использование пространственно временных выборок расширяет возможности пространственных выборок.
§ 11.5. Особенности практического применения регрессионных моделей
Регрессионная модель, как и всякая другая математическая модель, отражая основные свойства изучаемого экономического явления или объекта, не в состоянии полностью воспроизвести его поведение. Но даже то, что исследователь наметил отразить, трудно сделать в условиях реальной экономической ситуации. Все дело в том, что в распоряжении исследователя имеются данные о фактической траектории экономического объекта либо совокупности участков траекторий ряда сходных объектов. При этом значения факторов, не расположены так, чтобы оценки параметров регрессии оказались самыми точными н чтобы исследователь получил ответ на вопросы о влиянии всех интересующих его факторов отдельно и во взаимодействии на результирующий признак. Последнего можно добиться только в условиях контролируемого (планируемого) эксперимента, когда значения факторов можно выбирать по усмотрению исследователя, но при этом, разумеется, нельзя полностью воспроизвести условия реальной экономической ситуации.
301
Например при изучении влияния минеральных удобрений на урожайность по фактическим значениям урожайности конкретной сельскохозяйственной культуры и фактическим дозим внесения минеральных удобрений под эту культуру на единицу площади в рамках определенной совокупности сходных хозяйств может оказаться, что коэффициент регрессии по этому фактору незначим, а это при прямолинейной трактовке служит основанием для вывода: минеральные удобрения не влияют на урожайность. На самом деле это, конечно, совсем не так. Более тщательное изучение всех условий, формирую-щнх результирующий показатель и значения факторов, поможет выяснить обстоятельства неправильного вывода. Так может оказаться, что во всех этих хозяйствах внесение минеральных удобрений находится примерно на одинаковом уров не и практически не сказывается на вариабельности результирующего признака Могут быть и другие особенности, например с увеличением внесения удобрений на единицу площади в меньшей степени соблюдаются агротехнические условия внесения и т. п.
Итак, необходимо, чтобы в условиях конкретной выборки каждый из введенных в модель факторов обладал достаточной вариабельностью (в смысле влияния на результат). Это можно выяснить, исключая данный фактор нз модели и сравнивая полученные до н после исключения коэффициенты детерминации и F-отношения (не забывая прн этом о возможном взаимодействии исключенного фактора с другими) Существенность влияния фактора в конкретных условиях определяется также его значимостью.
Следующим осложняющим обстоятельством является мультиколлинеарность факторов, т. е. твкое расположение их выборочных значений, при котором последние близко прилегают к некоторой гиперплоскости в пространстве факторов. Применительно к нормальным уравнениям это означает, что их определитель близок к нулю и поэтому уравнения практически нельзя решить- Наиболее распространенные в таких случаях следующие приемы: исключение одного из двух сильно связанных факторов, переход от первоначальных факторов к их главным компонентам, число которых быть может меньше, затем возвращение к первоначальным факторам. Другим приемом является так называемая гребневая регрессия с получением ридж-оценок. Суть приема состоит в усилении обусловленности матрицы нормальных уравнений добавлением неотрицательных чисел к ее диагональным элементам
а(0)=(Х'Х+0Гл)-'Х'Г,
(11.5.1)
302
чтом естественно, оценки получают смещение, однако ^является возможность более устойчивого их определения. ° Особым случаем мультиколлинеарностн при использовании временных выборок является наличие в составе переменных линейных или нелинейных трендов В этом случае теория рекомендует сначала выделить и исключить тренды, а затем определить параметры регрессии по остаткам, при этом используется следующая теоретико-вероятностная схема:
yt=y(О+Пс
(Н.5.2)
...•">£«)+«/. А«е, = о, Ое/ = о2.
В этой схеме у (/), x^t) — регулярные функции времени, т. е. тренды зависимой и независимых переменных, a tp, — отклонения от трендов. В условиях прогноза по тренду приходится считать эти отклонения выборочными значениями случайных величин, однако при рассмотрении регрессии в остатках отклонения от трендов независимых переменных рассматриваются как детерминированные, а отклонение от тренда зависимой переменной расчленяется на детерминированную (регрессию по остаткам независимых переменных) и случайную составляющие.
Игнорирование наличия трендов в зависимой и независимой переменных ведет к завышению степени влияния независимых переменных на результирующий признак, что получило название ложной корреляции. В качестве примера явно выделим ложную корреляцию в случае парной регрессии по динамическим рядам зависимой и независимой переменных, содержащих тренды:
4х,=Ч /Ч'+Чч/ЧА’ (Н’5’3)
Где Чх(’Чч(— эмпирические коэффициенты корреляции первоначальных переменных и их отклонений от трендов; гу(Д’Ч<— эмпирические коэффициенты корреляции перемещения со временем; 0Л, 0Е — доли вариации остатков в общей вариации зависимой и независимой переменных.
Как видно из формулы (11.5.3), эмпирический коэффициент корреляции переменных распадается на произведение эмпирических коэффициентов корреляции переменных по времени (ложная корреляция) и на часть, обусловленную истинной корреляцией в форме эмпирического коэффициента корреляции остатков.
303
Наиболее часто в практических исследованиях возникает вопрос: сколько надо наблюдений для надежного определе. ния параметров регрессии? Однозначного ответа на этот вопрос нет. Выше было показано, что очень многое зависит от расположения выборочных значений факторов. Далее в этом параграфе подробнее будут рассмотрены осложняющие обстоятельства, связанные со случайной составляющей. Будем предполагать, что случайная составляющая удовлетворяет стандартным условиям, сформулированным в § 11.4, а матрица нормальных уравнений достаточно обусловлена. Последнее означает, что можно перейти от первоначальных к ортогональным факторам, например к главным компонентам в том же количестве. Далее будем считать, что это уже сделано.
Выбор числа наблюдений определяется требованиями к точности и надежности оценок параметров, что аккумулируется в конечном счете в размере доверительного интервала прогноза. Таким образом, из требований к точности прогноза и вытекает требование на число наблюдений. Обозначим требуемый размер половины доверительного интервала через ha, где а2 — оценка дисперсий случайной составляющей. Достижение этой желаемой точности определяется как объемом выборки, так и расположением прогностических значений факторов Чем более разнесены последние от средних выборочных значений, тем меньше точность прогноза. Выберем определенные уровни отклонения, пропорциональные отклонениям выборочных факторов:
При указанных условиях необходимый объем выборки, согласно (11.4.21), при ортогональности выборочных значений факторов определяется из следующего соотношения:
или
304
откуда
"=-Л-( i+Z e? I <11-5-4) /г \	1=1	/
Из формулы (11.5.1), в частности, вытекает, что прн й = 1, g __ 1, г-=1,..., Л, и /р=2 на каждый фактор должно приходиться по четыре наблюдения, а при сохранении тех же требований к точности прогноза, но при увеличении в два раза отклонений прогностических значений от среднего арифметического фактических значений факторов, т. е. при 0,-=2, i= 1,..., й,— по 16 наблюдений.
Самым большим препятствием к применению регрессии является ограниченность исходной информации, прн этом наряду с указанными выше затрудняющими обстоятельствами (мультиколлинеарность, зависимость остатков, небольшой объем выборки и т. п.) ценность информации может снижаться за счет ее «засоренности», т. е. проявления новых обстоятельств, которые ранее не были учтены.
Резко отклоняющиеся наблюдения могут быть результатом действия большого числа сравнительно малых случайных факторов, которые в достаточно редких случаях приводят к большим отклонениям, либо это действительно случайные один или несколько выбросов, которые можно исключить как аномальные. Однако прн наличии не менее трех аномальных отклонений на несколько десятков наблюдений мы склонны приписать это наличию одного или нескольких неучтенных факторов, которые проявляются только для аномальных наблюдений.
В таком случае приходим к следующей теоретико-вероятностной схеме:
//.=^ + 6,4-6;,	п,
где g, — случайная составляющая, отражающая влияние неучтенных факторов, которые проявляются только для аномальных отклонений; M^i = 0, D^j = al; е/— обычная случайная составляющая; Ме, = 0, Об(=о2.
Таким образом, согласно такой схеме, имеет место система неравноточных наблюдений, при использовании которой каждое наблюдение должно входить в расчет обратно пропорционально своей дисперсии, т. е. аномальные отклонения войдут с меньшим весом, обычные — существенно большим.
Перенумеруем наблюдения таким образом, чтобы первые
из них были обычными: «// = </,-, / = 1,..., П|, а последние Пг~п — «I—аномальными: «/=«„,,•; / = !,..., «г;
-у/ -УП] If *
305
и обозначим через
6=-^^Aeg + ^)«l.
«1
Тогда «взвешенные» средние выражаются через средние обычных н аномальных наблюдений так:
-2
У=Ч-------=—---------------------~(1 ~Ь)У' + Ку",
х^(1—Ь)х'+Ьх"
Коэффициенты нормальных уравнений и их правые части имеют внд
аи=(1 -б) а^ + ба,';, б, = (1 -б; Ц + Щ'.
Следовательно, средние и коэффициенты регрессии таким образом выражаются через соответствующие величины, рассчитанные по обычным наблюдениям, при этом учитываются поправки, отвечающие аномальным наблюдениям:
У=у' + &&' —У'), a = a/4-6A-* (b"—A2A~‘b').
Например, согласно этому правилу, два сильно отклоняющихся аномальных наблюдения с приблизительно равными значениями независимых переменных следует заменить одним наблюдением с теми же значениями независимых переменных и с значением зависимой переменной, равной полусумме соответствующих значений объединяемых наблюдений.
Подобную же процедуру реализует робастное оценивание, при котором наблюдения с меньшими отклонениями берутся с большим весом, с большими отклонениями — с меньшим.
Задачи
11.1. Имеются следующие ряды оценок по тестам чтения и арифметики:
Чтение	43	58	45	53	37	58	55	61	46	64	46	62	60	56
Арифметика	32	25	28	30	22	25	22	20	20	30	21	28	34	28
306
Вычислите коэффициент корреляции.
11.2. Ниже приводятся данные об индексе розничных цен иа пищевые товары и индексе промышленного производства:
Год	1949	1950	1951	1952	1953	1954	1955	1956	1957	1958
Индекс цел	100	101	113	115	113	113	111	112	115	120
Индекс производства	64	75	81	84	91	85	96	99	(00	93
Обозначив через х индекс цен и через у индекс производства, определите:
а)	формулу для прогноза у по х\
б)	значения у для х= 100, 113, 199;
в)	долю вариабельности у, которая объясняется вариабельностью х.
Глава 12
ЭЛЕМЕНТЫ ДИСПЕРСИОННОГО АНАЛИЗА
Дисперсионным анализом называют статистический метод анализа результатов, зависящих от действия качественных факторов. Дисперсионный анализ может быть использован для выявления совместного влияния экономических факторов, не поддающихся количественному измерению, на изучаемый экономический показатель. Суть метода состоит в том, что общая вариация результирующего показателя расчленяется на части, соответствующие раздельному и совместному влиянию различных качественных факторов, и остаточную вариацию, аккумулирующую влияние всех неучтенных факторов. Статистическое изучение этих частей позволяет делать выводы о том, действительно ли оказывает влияние на результирующий показатель тот или иной качественный фактор.
Например, в качестве фактора может быть рассмотрена организация производства на различных производственных участках оснащенных примерно одинаковым оборудованием. Тогда различия в выпуске продукции в расчете на одного работающего определяются различиями в способах организации производства на разных участках.
§ 12.1. Однофакторный дисперсионный анализ
В этом случае исследуется наличие или отсутствие влияния на результирующий признак одного качественного фактора. В основе однофакторного анализа лежит следующая теоретико-вероятностная схема:
/
^ = а/ + еп> /=1. i=l,«, = «, i=l
где Jp — случайные величины, представляющие результирующий признак, а,- — среднее (математическое ожидание) результирующего признака при i-м значении качественного фактора (например, a,-, »=1,средние размеры изде
308
лИй выпускаемых I различными экземплярами одного и того we вида оборудования); ед— случайные нормально распределенные отклонения результирующего признака от средних, = £>ед = о2 (например, отклонения от средних размеров, вызванных действием многочисленных малых источников погрешностей размеров, в том числе отклонения физикохимических свойств заготовок от номинала, биения, вибрации механической части оборудования, вариации параметров электрической части оборудования, погрешности в работе электронной управляющей части и т. п.), п,— число наблюдений при i-м значении качественного фактора; п— У
•=1
__общее число наблюдений.
Среднее можно представить в следующем вчде:
/ а(=а + <хР У а(. =0, (=1
где а=— У а, —общее (генеральное) среднее; а, = а; — а, I 1=1
j = 1./,— главные эффекты фактора.
В результате осуществления выборочного эксперимента получим / групп выборочных значений результирующего признака уц, j=l,...,ni\ <=1,2,По указанной выборке необходимо проверить справедливость гипотезы Ho:a.i = 0', i=l,2,.... /, или ai=O2 = .. = а/ = а, т. е. что качественный фактор не влияет на результирующий признак (например, все / экземпляров оборудования не различаются по систематическим смещениям размеров изделий).
Введем следующие обозначения для общего и групповых выборочных средних:
y=t"t "t у?
(=1/=1	I j=i
Согласно гл. 7, выборочные групповые средние являются несмещенными (МУ,=а/) и состоятельными (Y,=>ai) оценками средних а;. Если, согласно гипотезе Но, все средние, at одинаковы, то общее выборочное среднее у не должно статистически отличаться от групповых у,. В npoi ивном случае отличие должно быть статистическим значимым.
Представим полную сумму квадратов отклонений результирующего признака от общего среднего в форме двух сумм
309
квадратов отклонений. Имеем
52 = X X <Уц~У?= X Z ^ц-^+у—у/ =  =!!=! /-/-!
/ ",	/ ",
= X Z ^-йУ + 2 £ £ (Уц-1й(У1-у)+ 1=1 /=1	1=1 /=1
] п.	I п.	j
+ Z	X u/^-^+X n,(y -yf=SK+s2A.
i=li=l	<=1/=1	<=1
Стоящий внутри двойной суммы квадрат [(у,,— (y>~y)f приводит при раскрытии к трем двойным суммам, которые сводятся к двум крайним, так как промежуточная сумма обращается в нуль, т. е.
' _ _ _ ' _ _
X X	Z Z (У/<-^)=°-
i=I/ = 1	i = l	/=1
поскольку
п|	ni	ni
X (У,-У^ X У,~п^=У Уц~п^ X ^=0-
7=1	/=!	rti j=[
I
Из оставшихся двух сумм одна S^= X nt (У,—yf пред-«=1
ставляет собой сумму квадратов отклонений между группами, т. е. вариацию, обусловленную качественным факто-/ "i
ром, а другая — S^= X X ^<7 — У^ — сумму квадратов от-i=i /=1
клонений внутри групп, т. е. остаточную вариацию, обусловленную случайными отклонениями от групповых средних.
Л
1
Из § 3.5 следует, что —— X (Уц~У^ имеет распреде-° i=i
денне %2 с щ—1 степенями свободы; следовательно, —j-= о
=	2_, X ^‘i—У;)2 имеет Распределение х2 с п — / степеня-
м i=i у=1
мн свободы. Можно показать, что при ai = az=... =ai S3 и Sr 310
S2 1
независимы и —£-= £ п( (& — у)2 имеет распределение х2 с /—1 степенью свободы.
Итак, в случае справедливости гипотезы Но F-отношение
F .Sa/{-1 ~ S2R/n-l
имеет распределение Фишера с /—1, п — 1 степенями свободы. Если эта гипотеза верна, то у{ и у являются состоятельными оценками одного и того же общего математического ожидания и, следовательно, близки между собой, поэтому S2 мала. Если же гипотеза Но неверна, т. е. а, различны, то
—	V”*	—
MYi—Oi, MY= ) —ait поэтому У< и Y сближаются с разны-,=i п
ми математическими ожиданиями, при этом S2 должна принимать большие значения.
Таким образом, для проверки гипотезы Но получаем следующий статистический критерий: если F^Fa(I— 1, п — Г), то гипотеза Но принимается, в противном случае — отвергается.
В этом критерии а — ошибка первого рода, т. е. вероятность отвергнуть гипотезу Но, когда она верна, равна
Р {F>Fa(I—I, п—Г)/Н0}=а.
Итак, если гипотеза Но отвергнута, то принимаем решение, что изучаемый качественный фактор влияет на результирующий признак, причем оценкой теоретических средних су п.
служат выборочные групповые средние а,=у,=— ) у,, а fl.	‘
‘ / = 1 несмещенной оценкой дисперсии случайной составляющей, т. е. отклонений от групповых теоретических средних, служит
О Пример 12.1. Рассмотрим выборочное обследование производительности труда рабочих одинаковых профессий на четырех однотипных заводах разных городов Производительность выражена в относительных величинах по отношению к базовой, принятой за единицу- Требуется установить, существенно ли различаются производительности труда рабочих рассматриваемых профессий на четырех заводах. Исходные данные приведены в табл. 12 1.
311
Таблица 12 |
Поряд-ковый номер	\ Заводы			~ ~——
	Уп		Ун	У.~~~
1	1,3	1,4	1.44	
2	1,27	1,3	1,4	1,05
3	1,21	1,28	1,28	1.24
4	1,09	1,27	1,28	1,22
5	1,03	1,24	1,06	
6	1,01	1,08		
7	1,09			
Таким образом, для проверки влияния на производительность труда одного качественного фактора (организации труда) имеем четыре группы наблюдений: П[ = 7, ns = 6, пз = 5, nt = 4 — общим числом п = 22.
Для проверки основной гипотезы Но (качественный признак влияния не оказывает) прежде всего чайдем групповые средние (с точностью до тысячных долей)
-	1 V _ 1,3+1,27-f-1,21 + 1,09-|-1,03+1,01 + 1,09
? - -
1 / = 1
п2
1 V 1,4 + 1,3+1,28+1,27+1,24+1,08	7,57	,
^ = ~гГ L -------------------6--------------= ~= 1.262;
z j= 1
1 v 1,44+1,4+1,28+1,28+1,06
L у^=---------------э-----------=
3 i=i
1 v 1,27+1,05+1,24+1,22	4,78	,
^4=7; L УН = -----------4----------=—=1.195
’ 1=1
и общее групповое среднее
-	1 V V	8,0 + 7,57 + 6,46 + 4,78	26,81	,
у п L, L. И1‘	22	22
>=1 7=1
В табл. 12.2 и 12.3 приведены результаты расчетов отклонений от групповых и общего средних, квадратов отклонений и их сумм. Сум-312
Таблица 12.2
—	1	2	3	4	5	6	7	8
ПоряД-						%-		Si-s
новый	1 =>	'3	' =>		 3		' 3	• з
номер	1	1	1		1	1	1	1
	3	J3	3		3	_3	3	3
1	0,157	0,0246	0,138	0,0190	0,148	0,0219	0,075	0,0056
2	0,127	0,0161	0,038	0,0014	0,108	0,0117	— 0,145	0,0210
3	0,067	0,0045	0,018	0,0003	— 0,012	0,0001	— 0,045	0,6020
4	-0,053	0,0028	0,008	O.uOOl	— 0,012	0,0001	0,025	0,0006
5	-0,113	0,0128	-0,022	0,0005	— 0,232	0,0538	—	—
6	-0,133	00177	-0,162	0,0262	—	—	—	—
7	—0,053	0,0028	—	—	—	—	—	—
X	—0,001	0,00685	0,018	0,0475	0	0,0876	0	0,0292
Таблица 12.3
	1	2	3	4	5	6	7	8
Поряд-		сч		сч				
ковый		1 3	 3	' 3	 3	'"з	' 3	*з
номер	1	1	1	1	1	1	1	1
	3	,3	3	J3	3	3?	3	^3
1	0,081	0,0066	0,181	0,0328	0,221	0,0488	0,051	0,6326
2	0,051	0,0026	0,081	0,0066	0,181	0,0328	— 0,169	0,0286
3	-0,009	0,0001	0,061	0,0037	0,061	0,0037	0,021	0,0004
4	-0,110	0,0121	0,051	0,0026	0,061	0,0037	— 0,001	0
5	-0,189	0,0357	0,021	0,0004	— 0,159	0,0253	—	
6	— 0,209	0,0437	— 0,139	0,0193	—	.—	—	
7	-0,129	0,0166	—	—	—	—	—	
X	— 0,514	0,1174	0,256	0,0654	0,365	0,1143	— 0,096	0,0316
мы отклонений в табл. 12.2 должны быть равны нулю, небольшое отличие от расчетных значений от нуля — результат округления.
В табл. 12.3 суммы отклонений по столбцам уже, вообще говоря, не Должны быть равны нулю, только сумма итоговых отклонений по столб-
/ "<
нам должна быть нулевой. В настоящем примере Z
<=1/=i
= - 0,514 + 0,256 + 0,365— 0,096 = 0,011, т. е. эта сумма действительно
близка к нулю (отличие за счет округления)
Теперь вычислим суммы квадратов отклонений, необходимые для выполнения дисперсионного анализа. Из табл. 12.2 находим сумму
313
квадратов отклонений внутри групп (т. е. о< гаточную вариацию)
Sr = £ Ё	-У,)2 = °.°685 + °-0475 + 0.0876 + °-0292 = 0,2328
(=1 /=1
Далее определяем сумму квадратов отклонений между группами (т. е. вариацию, обусловленную качественным фактором):
/
S2 = £	—у)2= 7-(1,143—1,219)2 + 6-(1,262—1,219)2 +
/=1
+ 5-(1,292—1,219)2+4-(1,195—1,219)2 = 0,08.
И наконец, из табл. 12.3 находим сумму квадратов отклонений от общей средней (т. е. полную вариацию):
l ni
S2= £ £ (t/^ + y)2 = 0,1174 + 0,065 + 0,1143 + 0,0316 = 0,3287. = 1 j=l
Теперь можно построить табл. 12.4 дисперсионного анализа.
Таблица 12.4
Компонента ' вариации	Сумма квадратов	Число степеней свободы	Средний квадрат
Между заводами	=0.0959	3	0,0320
Внутри заводов	5^ = 0,2328	18	0,0129
Полная	S2= 0,3287	21	0,0157
Из табл. 12.4 находим расчетное F отношение:
Е = ^Zl).=^=2,481;
S|/(n-/)	0,0129
сравниваем его с табличным Fa (/— 1, п — 7) = FoiO5(3, 18) = 3,16, определенным при 5 % ном уровне значимости.
Так как F — 2,481 <3,16 = fu.o5(3,18), то гипотеза о влиянии уровня организации производства на производительность труда отвергается. Инымя словами, можно считать, что производительность труда рабочих изучаемой профессии на всех четырех заводах одинакова. Если бы в результате статистического анализа было принято противоположное решение, то следовало бы исследовать отдельно, какие попарно заводы отличаются по производительности труда, выявить причины этого отклонения. Если причины отклонения устранить в сложившихся условиях нельзя, то иа разных заводах должны быть использованы различные нормы выработки для рабочих данной профессии. ф
314
§ 12.2. Двухфакториый дисперсионный анализ
В этом случае теоретико-вероятностная схема имеет следующий вид:
K/,*=a» + eJ»: /=1.2,.... niA; i=l,...,/; k=l,...,K, где Yjtk — случайные величины, представляющие результирующий признак; а/* — среднее значение результирующего признака при i-м значения первого качественного фактора и fe-м значении второго качественного фактора; ед* — независимые нормально распределенные случайные величины (ЛТед*=О, Dbiik=o2), представляющие собой отклонения результирующего признака от соответствующих средних; п,* — число наблюдений в (i, £)-ячейке.
Среднее можно представить в следующем виде:
a,* = a + a/+₽* + b,
I к I к
£ «!= £ ₽*= £ ?,*= £ ъ.
i=i *=i i=i *=i
I V-'
где а=—— ) aih — общее (генеральное) среднее;
— главные эффекты первого качественного фактора;
— главные эффекты второго качественного фактора;
эффекты взаимодействия.
Дисперсионный анализ позволяет оценить эффекты отдельных факторов и их взаимодействий, а также проверить некоторые гипотезы о них. Далее без доказательства приведем результаты полного дисперсионного анализа, т. е. при наличии хотя бы одного наблюдения в каждой ячейке.
315
Оценки эффектов
Нанлучшими оценками эффектов являются МНК-оценки-
а=тт<-£^'	^=тЕа«-а-
I, k	k	i
ftk	(Ул	J У Ул 2-< + /Д' У, ^ik )’
\	i	k	i. k J
1
У*=^Г У y'lk'
** /=1
Общая вариация результирующего признака расчленяется на составляющие при	для всех i, k
_	/ I —	_\2
у (y^-yf= KNZ[^Z Ул-У +
k \ * i	/
4-tf X (Ул——гГ^+г/ J + £ (у)л-УлУ =
i.k \ A k	‘ i	/ I. k,j
=s2a-',-s2b+s2ab+s2r, которые представляют собой соответственно вариации, обусловленные первым, вторым признаком, их взаимодействием, а также остаточную вариацию.
Проверка гипотез НА‘.а^ = 0, i=l,2../;
//B:₽ft=0, *=1,2,..., К;
/7.,д:^ = 0, /=1,...,/; *=1, ...,/<.
316
S2 KI — 1)
Бели	то HA OT-
s2r/ik(n-\)
вергается.
FcJIH	F [K_ ! jK _ jд T0 H 0T.
E S2r/1K(N-1)
вергается.
5дй/(/—i) (К—О	iKIN Hl
EM" -SS/Z/CtAT-l) =»
то Ялеотвергается.
С помощью гипотез в дисперсионном анализе можно получить очень полезные выводы. Например, убедившись в отсутствии взаимодействия, можно говорить об аддитивности влияния факторов, а в такой ситуации на основе сравнения главных эффектов какого-то признака уже можно определенно судить о том, какое из его значений наиболее предпочтительно, и т. п.
В случае частичного заполнения клеток таблицы возможны различные неполные разновидности дисперсионного анализа.
§ 12.3. Понятие о ковариационном анализе
Ковариационный анализ занимается изучением теоретико-вероятностных моделей, в которых присутствуют как качественные, так и количественные признаки, т. е. ковариационный анализ объединяет регрессионные и дисперсионные методы. Ниже рассмотрим для простоты только аппарат однофакторного ковариационного анализа с одной независимой переменной.
В этом случае ковариационная модель имеет следующий вид:
Уд = ai+ ?*,; +
где Yji — случайные величины, представляющие значения результирующего признака, хц — значения независимой переменной: ед — значения случайной составляющей, которые являются независимыми нормально распределенными случайными величинами с Л1ед=0, Dbji=d2; i, I — номер значения качественного признака и общее их число; j, п, — номер наблюдения внутри i-й группы и общее их число; п, — главные эффекты качественного признака; у — регрессионный коэффициент.
Ковариационный анализ позволяет находить точечные и интервальные оценки параметров модели (аь ..., aF у; о2),
317
проверять различные гипотезы о них и о модели в Пусть имеется выборка yjt;	n,; i=l,
Введем следующие обозначения:
i.l
— общее среднее, п = ^ «,•;
1 I
Целом.
— частное среднее для группы i\
туу = ^^~^П^' МУУ = Ъ^~П^'
Мхх = Х 4“
i.l
тХу = Г хцУц - Г n<x^’ МХу = Г Xi‘yi‘ ~ пху’ i.i	i	i.j
...2
$2 = Ш------------—
уу т
s2—m — Мух
6	Mrr
Точечные оценки:
коэффициента регрессии
. т„,
Т=—Му=у, тхх
главных эффектов
а—у — ухр Mai = аг, cov (ар а() =
= °2
'А
п.п.
V/

дисперсии случайной составляющей
а2
1 П-/-1
S2.
318
Проверка гипотез: о коэффициенте регрессии Но:у=О.
ta (п — / — 1), то коэффициент рег-
Если--------
цессии иезначим;
о влиянии качественного фактора
Ha:ai=a2 = ... = al = a.
Есл| ~	Дп — f - 1)	~ 1(П~ 1~ Т° ГИП°Те3а П₽И'
пиается, т. е. влияние качественного признака отсутствует.
Задачи
12.1.	В табл. 12.5 приведен вес (кг) поросят, родившихся в восьми опоросах.
Таблица 12.5
Номер поросенка в опоросе	Номер опороса							
	1	2	3	4	5	6	7	8
1	0,8	1,4	1,32	1,28	1,04	1,24	1,04	1,0
2	1,12	1,12	1,44	1,32	1,04	1.16	0,88	0,96
3	1,32	1,28	1,04	1,28	1,16	1,24	0,88	1,2
4	1,28	1,4	1,24	1,16	0,8	1,0	1,0	0,6
5	1,76	0,92	1,28	1,32	0,8		0,48	
6	1,44	0,96	1,32	1,0	0,84		0,48	
7	0,76	0,8	1,16	1,04				
8	1,32	0,64	1,36	1,12				
9	1,12		1,28					
10	0,44		1,28					
а)	Постройте таблицу дисперсионного анализа. Проверьте с уровнем значимости 0,1 гипотезу об отсутствии различия между средними весами в восьми опоросах;
б)	предположив, что опоросы 1, 3, 4 получены от одной свиноматки, а остальные — от другой, определить, значимо ли различие между средними весами в этих двух группах.
12.2.	Партии мяса от пяти различных поставщиков загружаются в машину для упаковки в банки. Машина имеет шесть наполняющих цилиндров. Наудачу из каждой партии и из каждого Цилиндра было взято по три наполненных банки. Веса банок в условных единицах приведены в табл. 12.6.
319
Таблица 12.6
Номер цилиндра	Номер поставщика				——-
	1	2	3	4	5
1	1,1,2	4,3,5	6,3,7	3,1,3	1,3,3
2	—1,3, —1	— 2 1,0	3,1,5	2,0,1	1,0,1
3	1,1,1	2,0,1	2,4,3	1,3,3	3,3,3
4	— 2,3,0	— 2,0,1	3,3,4	0,0,2	о,1 1
5	1,1, —1	2,1,5	0,1,2	1,0,-1	-2,3,1
6	0,1,1	0,0,3	3,3,4	3,0,2	3,1,2
а)	Проверьте с уровнем значимости 0,05 гипотезу, заключающуюся в том, что математическое ожидание веса наполненной банки не изменяется от поставщика к поставщику и от цилиндра к цилиндру;
б)	проверьте с уровнем значимости 0,05 гипотезу отсутствия взаимодействия.
Глава 13
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
В общем случае временной ряд содержит как детерминированную, так и случайную составляющие; для простоты далее будем считать их аддитивными:
!//=/(*.*/)+ ez, /=1,2.Т,
где у, — значения временного ряда; f (t, Xi) — детерминированная составляющая; xi — значения детерминированных факторов, влияющих на детерминированную составляющую в момент t; е, — случайная составляющая, Mei = 0; Т — длина ряда.
Математическая статистика занимается анализом и прогнозом временных рядов, содержащих случайную составляющую.
В экономике роль детерминированной составляющей играет, например, результирующий показатель, представляющий собой объем производства, обусловленный общей тенденцией экономического роста, научно-техническим прогрессом и затратами экономических ресурсов. На этот результат кроме экономических факторов могут оказывать долговременное влияние, поддающееся предсказанию, и некоторые природные факторы. Например, солнечная активность оказывает влияние на урожайность сельскохозяйственных культур с периодичностью 11,2 года. Случайная же составляющая аккумулирует влияние множества не включенных в детерминированную составляющую факторов, каждый из которых отдельно оказывает незначительное воздействие на результат.
Основная задача анализа временных рядов состоит в выделении на основе знания отрезка временного ряда {j/r, t = 1.7}
детерминированной и случайной составляющих, а также в оценке их характеристик. Получив оценки детерминированной и случайной составляющих, можно решать задачи прогноза будущих значений как самого временного ряда, так и его составляющих.
§ 13.1. Трендовые модели
Под трендом (в узком смысле) понимается детерминированная составляющая, зависящая только от времени. Тогда временной ряд представляется следующей теоретике-вероятностной схемой:
*=1....Г,	(13.1.1)
гДе f (t) — тренд; в/ — случайная составляющая, Afe/ = O.
Ч в. А. Колем 1ев и др.	321
Если тренд линеен относительно своих параметров, а слу чайная coci авляющая имеет известную матрицу ковариаций то задача сводится к задаче множественной регрессии, они’ санной в гл. 11. В самом деле, в таком случае соотношение (13.1.1) принимает следующую форму:
k
(// = а0+£ а.'Р, (O+eJ t=\,...,T,	(13.1.2)
i=l
где (/) — полностью известные функции времени. Например, в случае полиномиального тренда соотношение (13.1 2) имеет вид
k
(// = «о + £ «/ + 8р *=1.
1=1
Обозначив (р^ (/) через xfl-, придем к обычной модели множественной регрессии, линейной относительно параметров
k
У, = “о + £ aixti + е/.	(13.1.3)
i=l
нлн в матричной форме
У=Ха4-е,	(13.1.4)
где
Приведем общее решение, исходя из теории регрессионного анализа, содержащейся в гл. 11 Форма решения зависит от статистических характеристик случайной составляющей.
Случайная составляющая с независимыми значениями
В этом случае ковариационная матрица случайной составляющей имеет вид
Г = || cov(bz, ег)|| = о2/, Det =
322
аиЛучШие оценки коэффициентов тренда получаются по мето-И наименьших квадратов и имеют следующий вид:
АУ 1) оценка коэффициентов тренда
а=(Х,Х)-'ХУ, Ма = а,
Г- = || cov (а„ а,)|| = а2 (Х'Х)~1 = а2 С;	(13.1.5)
2)	оценка дисперсии случайной составляющей
(13.1.6)
где
У, = х',а = Oq + ) ад = ад + £ а,<р, (0.
Точечный прогноз детерминированной составляющей на глубину т выполняется по формуле
f (Т+т)=у(Т+т) = *,Г4.та =
k
=«о+ Е “.<₽л7’+т)-1=1
(13.1.7)
Отметим, что
k
A^(T+T)=f (7’4-т) = а0+ £ а;ф;(Т+т). i=I
Df (Гф-т) — а2х,г_|_тСхг^_т, где
*Г+г=[1. ф| (У4-Т). .... фДГ + т)].
Интервальный прогноз для детерминированной составляющей на глубину т задается следующей формулой (в предположении, что случайная составляющая имеет нормальное распределение либо рассматривается достаточно длинный отрезок ряда):
Т(Т + т) — tpoj[T+i:)^f(T+T)^T(T 4-т)+ 0оКг+т),
(13.1.8) где tp=t,, (Т—k — 1) — доверительная граница распределения Стьюдента с T — k — 1 степенями свободы, соответствующая
11*
323
уровню значимости р\ aRf + x) ~ ° ~\]X't+i;CxT+i: =
=о	+т> с"<р' +т>-
Рассмотрим более подробно случай линейного тренда: f(0=«o + <M. *=1,Ф, (/)=*•
Формулы (12 1.5) — (12.1.8) принимают следующий вид:
1)	оценка коэффициентов линейного тренда
Л _ Л 2 Л t=i	,	14-Г
«о=У —ai?> а1=-------т-----------’ ?=—2 ;	(13.1.9)
/=|
2)	оценка дисперсии случайной составляющей
1 т
Р2= т_2 £ (У/-Р/Л	(13.1.10)
где
Л Л Л - Л	_ Л /	Т4-1 \
»/ = ao + ai*=!/+«i (*~ 0=4'+«1 Н--2~ );
3)	точечный прогноз детерминированной составляющей
Hr4-T)=^+a, 0^-+т),	(13.1.11)
Л<Г(7’4-т)=а04-а1 (ТЧ-т),
4) интервальный прогноз детерминированной составляющей
Я Т+т) — ^т+^Т{1 4-T)<f(7’ 4-т)4-(рот-(Г+т),
(13.113)
324
Априорные предположения о форме тренда могут быть сформулированы в виде рабочей гипотезы. Например, в случае рабочей гипотезы о постоянстве годовых абсолютных приростов f (/+1)—f (0=ai = const приходим к линейному тренду. Если же имеет место гипотеза постоянства темпов роста f (<+l)/f (f)=a> = const> то получаем экспонентный тренд /(0 = фваь который в логарифмах сводится к линейному. Так как не всегда удается иметь дело с трендом, линейным относительно своих коэффициентов или сводимым к такому виду, то приходится использовать нелинейные методы оценивания, понятие о которых дано в § 13.3.
Значения случайной составляющей зависимы, матрица ковариаций известна
В этом случае задана известная ковариационная матрица случайной составляющей r = Afee' = ||cov (e>,es)||, t, s = 1,.... T, и наилучшие несмещенные точечные оценки коэффициентов тренда определяются методом максимального правдоподобия. В матричной форме эти оценки определяются следующими выражениями:
а=(ХТ-‘Х)-,ХТ-,У>
Afa = a, rs=||cov(az, aJIl^T-’X)-1. (13.1.14)
Точечный прогноз детерминированной составляющей на глубину т осуществляется по следующей формуле:
k
Г(7’ + т) = а0+ £ а.фДТ’+т), 1=1
(13.1.15)
при этом
k
M(r+T)=f(7’+T)=a0+ £ а^ДТ+т), 1=1
ДГ(7’+т)=4+т(Х'Г-,Х)-,хг+т.
325
где
*г+т=[1. Ф1 (т+т)>	<Рк (Т+*)1
Проверка гипотез о значимости оценок коэффициентов тренда и всего уравнения тренда в целом может быть выполнена по формулам, приведенным в гл. 11.
Значения случайной составляющей зависимы, матрица ковариации неизвестна
Если ковариационная матрица неизвестна, ио имеет специальную структуру, определяемую некоторым числом параметров, то для оценки конечного числа параметров (коэффициенты тренда и параметры ковариационной матрицы) можно применять метод максимума правдоподобия.
В общем случае, когда о структуре ковариационной матрицы ничего неизвестно, теория рекомендует применять итерационную, по крайней мере двухшаговую, процедуру; на первом шаге с помощью метода наименьших квадратов определяют оценки коэффициентов тренда а и оценку ковариационной матрицы Г по отклонениям, на втором шаге находят уточненные оценки коэффициентов тренда по формулам (13.1.14), в которые вместо матрицы Г подставлена ее оценка Г, что позволяет получить прогноз детерминированной составляющей на глубину т по формуле (2.1 15).
§ 13.2. Выявление тренда в динамических рядах экономических показателей
При исследовании динамических рядов экономических показателей обычно выделяют следующие четыре основные составляющие: долговременную эволюторно изменяющуюся составляющую *; долговременные циклические колебания; кратковременные циклические колебания (сезонная составляющая); случайную составляющую. В нашем понимании первые три составляющие представляют собой тренд, т. е. детерминированную составляющую. Случайная составляющая образована в результате суперпозиции большого числа внешних факторов, не участвующих в формировании детерминированной составляющей и оказывающих каждый отдельно незначительное влияние на изменение значений показателя.
* Многие исследователи именно эту составляющую называют трендом.
326
g целом влияние этих факторов на изучаемый экономический показатель проявляется в изменении во времени его значений.
Долговременная эволюторно изменяющаяся составляющая является результатом действия факторов, которые приводят к постепенному изменению данного экономического показателя Так, в результате научно-технического прогресса, совершенствования организации и управления производством относительные показатели результативности и эффективности производства растут, а удельные расходы ресурсов на единицу полезного эффекта снижаются.
Дол! овременная циклическая составляющая проявляется на протяжении длительного времени в результате действия факторов, обладающих большим последействием либо циклически изменяющихся со временем. Примером такого рода явлений служат капиталистические кризисы перепроизводства и структурные кризисы Другой пример связан с природным фактором — солнечной активностью. Так, с большой степенью достоверности доказано, что изменение солнечной активности с периодичностью 11,2 года оказывает существенное влияние на развитие биологических объектов. Исследование длинных рядов урожайности сельскохозяйственных культур в районах устойчивого земледелия позволяет выявить долговременную циклическую составляющую с 11-летним периодом и амплитудой 5—7 % от среднегодовой урожайности.
Сезонная циклическая составляющая легко просматривается в колебаниях продуктивности сельскохозяйственных животных з зависимости от времен года, а также в колебаниях розничного товарооборота по временам года.
Эволюторно изменяющуюся долговременную составляющую можно достаточно хорошо представить отрезком ряда Тейлора; следовательно, эта составляющая во многих практических случаях может рассматриваться как полиномиальный тренд.
Что касается долговременной и сезонной циклических составляющих, то обе они являются периодическими функциями, которые достаточно хорошо могут быть представлены отрезками ряда Фурье; следовательно, эти составляющие могут рассматриваться как тригонометрический тренд.
Ниже на простых примерах демонстрируется техника расчета оценок коэффициентов полиномиального и тригонометрического трендов и их использования для прогнозирования будущих значений детерминированной составляющей. Опенка коэффициентов одновременно присутствующих эво-люторной и циклической составляющих — несколько более сложная задача, но она полностью укладывается в схему
327
расчетов, приведенную в § 13.1. Если амплитуда циклической составляющей эволюторно изменяется, т. е. имеет место мультипликативное представление детерминированной составляющей в форме произведения эволюторной функции ца периодическую, то для анализа и прогнозирования можно воспользоваться методом сезонного экспоненциального сглаживания, который рассмотрен в § 13.4.
Полиномиальный тренд
Схема расчетов, приведенная в § 13.1 для тренда, представляющего собой линейную комбинацию некоторого набора функций <ро (0.	(0. — (0» в случае полиномиального трен-
да выглядит следующим образом. Роль функций (/) играют степени времени, т. е. <р,- (/)=/', <ро(0=1> поэтому
k
f (t,a) = a0+ £ а/, f=l...Т.
r=I
Исходную модель временного ряда (ср. с обозначениями § 13.13, 13.14) k
t/( = a0+£ а/ + е(, Met = 0, f=l..Т,
>=|
можно записать в матричной форме
У=Х« + е,
где в качестве X используется матрица, столбцами которой служат значения времени в различной степени:
111	... I
(1 2 2s ... 2*\
1 ” \ "X ? /
1 Т Iй ... Tk'
Остальные обозначения совпадают с (13.1.4).
Матрица коэффициентов нормальных уравнений имеет вид т
А=Х'Х= II £ f+'||, i, l = (j, 1.k,
t=l
т. e. ее элементы являются суммами натуральных чисел в целой степени, которые могут быть заранее рассчитаны, протабулированы и использованы для любого исходного ряда. Правые части нормальных уравнений необходимо подсчитывать для каждого ряда
т
*'У=1|£ у/ц, 1=о......k,
t= I
328
примем для Оц-енки свободного члена используется формула «о=^~ £ «Л
/=1
в ксрторой коэффициенты при оценках at
I т
'~h?/
так>же могут быть заранее протабулированы.
Прогноз на глубину т осуществляется по формуле k
#т+т=“о+ £ аДГ+т/.
<=i
Доверительный интервал для детерминированной состав-ляк»щей записывается в следующей форме:
k	k	k
I аД7Ч-т)‘-/Дг+,< £ а.(Г + гУ< £ а, (Г+г)+/Дг+г
<=0	i = 0	1 = 0
где
си(Т+тУ+1, С=(Х')~',
T-k-l
О Пример 13.1. В качестве примера исследуем динамический ряд среднегодовых удоев молока (кг) от одной коровы в колхозах, совхозах и межхозяйственных предприятиях Эстонской ССР за 19611 — 1985 гг. (длина ряда — 25 лет). Для расчетов используем формулы полиномиального треда при й = 1, т. е. примем гипотезу лиыейного тренда, состоящую в примерном постоянстве по годам среднегодовых приростов удоев молока от одной коровы. Формулы Для] линейного тренда (13.1.9) — (13.1.13) приведены в § 13.1. Расчеты по аналогичным формулам парной регрессии уже проводились в Примере, рассмотренном в § 11.1, поэтому аналогичные расчеты пРо>ведены с меньшей подробностью. Исходные и расчетные данные приведены в табл. 13.1.
Прежде всего по формуле (13.1.9) находим оценки коэффициентов лин1ейного тренда, используя исходные данные табл. 13.1. Имеем:
т
329
Таблица 13.1
Годы	Фактический удой *> у.	ty>	Выравненный удой yi	Отклонения yt — yt	Квадрат отклонений (у, — у,)2
1961	2532	2 532	2565	-33	1 089
1962	2317	4 634	2621	— 304	92 416
1963	2341	7 023	2676	335	112 225
1964	2513	10 052	2731	— 218	47 524
1965	2968	14 840	2787	181	32 761
1966	2956	17 736	2842	114	12 996
1967	3041	21 287	2898	143	20 449
1968	3182	25 456	2953	229	52 441
1969	3177	28 593	3008	169	28 561
1970	3181	31 810	3064	117	13 689
1971	3201	35 211	3119	2	4
1972	3192	38 304	3174	18	324
1973	3156	41 028	3230	— 74	5 476
1974	3364	47 096	3285	79	6 241
1975	3489	52 335	3341	148	21 904
1976	3587	57 392	3396	191	36 481
1977	3648	62 016	3451	197	38 809
1978	3475	62 550	3507	—32	1 024
1979	3475	66 025	3562	— 87	7 569
1980	3579	71 580	3617	— 38	1 444
1981	3473	72 993	3673	— 200	40 000
1982	3385	74 470	3728	— 343	117 649
1983	3701	81 523	3784	— 83	6 889
1984	3854	92 496	3839	15	225
1985	3966	99 150	3894	72	5 184
Z	80 753	1 121 733			643 793
Данные о фактическом удое молока от одной коровы (кг) в колхозах, совхозах и межхозяйственных предприятиях Эстонской ССР взяты из справочников «Народное хозяйство СССР» за 1960—1985 гг
V /2	7’(7’+1)(27’+1)	25-26-51	с
Л 5	5
т
Л 1=1	‘==1
£('-<)2	£«2-г(02
/=1	/=1
330
1 121 733 —25-13-3230	71 983 „
=----------------------=---------= 55.37:
5525 — 25-132	1300
an = u— a. (=3230— 720=2510.
Теперь рассчитываем выравненные значения $i = ao + cxi( (с точностью до 1 кг) и заполняем столбцы j/<, yt—yt, (yt—yif табл. 13.1 т
По найденной сумме квадратов отклонений S^=
/=1
= 643 792 теперь можно получить оценку дисперсии случайной составляющей
1 Т
о2 = г_2	(У( — У1? = 27 "*> откуда 0=167,3.
Найдем расчетную значимость коэффициента линейного тренда
_ “1 _ V f = 1	_ 55,37 у/1300
“1 а»	о	167,3	’ ’
“i
которая существенно превышает табличную значимость <o.os(23)= =2,069 при 5 %-ном уровне значимости (5 %-ном риске), т. е. коэффициент линейного тренда существенно отличается от нуля, и, следовательно, тренд действительно имеет место
Теперь можно найти прогностические значения тренда среднегодовых удоев молока от одной коровы на 1986—1990 гг.:
(74-1) = 3949 (1986 г),
$г+2 = а0 + а1 (7Ч-2) = 3995 (1987 г.),
^тч-з=“о+“1 (Г4-3)=4050 (1988 г.),
$г+4=«о+“1 (7’+4)=4Ю5 (1989 г),
£г+5=“о+“1 (7Ч-5)=4161 (1990 г).
Построим доверительный интервал для теоретического тренда удойности за 1987 г., т е. при прогнозе на два года вперед:
Уг + 2 — *0,05 (23) %-+2^'х0"1“'х1 (^ + 2)^= Ут4-2 + *о,05 (23) ayT+i' Так как (o.os (23)=2,069,
331
то окончательно получаем доверительный интервал J844<a04-a1 (7Ч-2)С4146,
размах которого равен 302. т е. достаточно велик и составляет 7,5 % по отношению к значению середины интервала. Вместе с тем его размах вполне приемлем для практических прогнозов значений долговременной тенденции удойности на несколько лет вперед.
Более углубленный анализ динамического ряда удойности совместно с динамическими рядами экономических факторов, оказывающих на удойность решающее влияние, показывает, что колеблемость удойности вокруг тренда главным образом обусловлена колеблемостью урожайности кормовых культур. И это полностью соответствует действительности, поскольку именно обеспеченность кормами оказывает решающее воздействие иа продуктивность животных. Практически синхронная колеблемость вокруг своих трендов рядов динамики удойностей и урожайности зерновых хорошо видна на рис 13.1, на котором точки отсчета и масштаба выбраны таким образом, чтобы тренды исходили из одной точки, а размахи рядов были примерно одинаковы. Фактические и выравненные значения ряда урожайности зерновых показаны штриховой линией, а для ряда удойности коров — сплошными линиями.
У,
Л7
24
ZO-/б-/Z
Рис. 13.1
Синхронное изменение значений двух рядов, обусловленное решающей зависимостью продуктивности коров от обеспеченности кормами, приводит к мысли о возможности прогнозирования отклонений удойности от тренда по отклонениям урожайности от своего тренда (см. также § 11.3). Это имело бы большое практическое значение для более достоверного предвидения производства животноводческой продукции, если бы имелись надежные методы прогнозирования отклонений значений урожайности от тренда в зависимости от вариации погодных ус товий. Однако к настоящему времени надежных методов прогноза урожайности сельскохозяйственных культур в за-
332
Таблица 13.2
Годы	Значения урожайности		Отклонения У1-У-	Годы	Значения урожайности		Откло-нения У- — У1
	фактические yt	выравненные yt			фактические yt	выравненные yt	
1960	13,3	11,67	1,63	1973	19,5	22,52	-3,02
1961	12,2	13,36	— 1,16	1974	30,1	23,08	7,02
1962	12,4	14,6	— 2,2	1975	26,7	23,63	3,07
1963	12,4	15,62	— 3,22	1976	31,0	24,17	6 83
1964	164	16,53	— 0,13	1977	28,4	24,71	3,69
1965	22,0	17,34	4,66	1978	20,0	25,24	-5,24
1966	17,2	18,1	-0,9	1979	24,7	25,76	-1,06
1967	21,8	18,81	2,99	1980	26,9	26,27	0,63
1968	22,4	19,49	2,91	1981	21,3	26,79	-5,49
1969	24,8	20,13	4,67	1982	28,6	27,3	1,3
1970	21,3	20,76	и,54	1983	27,7	27,8	-0,1
1971	26,7	21,36	5,34	1984	30,0	28,3	1,7
1972	17,9	2* ,95	— 5,05	1985	22,9	28,8	-5,9
Таблица 13.3
Годы	Прогноз	Стандартная ошибка прогноза
1986	29.8	1,69
1987	30,4	1,32
1988	31,0	1,9
1989	31,5	2,02
1990	32,1	2,11
виснмости от метеорологических условий и их прогноза на длительный срок пока нет. Существующие методы дают недостаточно достоверные прогнозы урожайности. Поэтому для прогноза удойности пока наиболее практически доступным является метод выделения тренда, прогноз остатков станет осуществим в будущем.
Что касается выявления тренда урожайности зерновых (ц/га), то результаты соответствующих расчетов приводятся ниже и представлены в табл. 13.2 и 13.3:
а0 = 14,6, а( = 0,56, 3^ = 393, а2=17,1, а = 4,ТЗ.
Итак, стандартные ошибки достаточно высоки, поэтому размахи доверительного интервала прогноза по тренду составят ±3,4,..., ±4,3, что весьма значительно. Тем ие менее эти прогнозы можно
333
Таблица 13.4
Формула тренда	Значения коэффициентов		Остаточная сумма квадратов отклонений
	А	В	
A+Bt	14,6	0,56	392
Аев‘	11,5	0,029	448
A+B/t	24,9	— 18,3	512
l/(A + Bt)	0,069	-0,0015	581
А+В In t	9,27	5.5	328
еЛ+В1	3,2	-0,97	463
Экспоненциальное сглаживание ут+т= =29,68 +0,6427т	29,68	0.6427	439
использовать на практике в предположении, что сохранится сложившаяся долговременная тенденция изменения значений данного показателя. Если тенденция изменится под влиянием определенного фактора, то отклонение от прогноза по тенденции можно будет рассматривать как суперпозицию результата влияния нового фактора и случайной составляющей.
Возвращаясь к примеру 13.1 и анализируя рис. 13.1, видим, что в последнее десятилетие годовой прирост урожайности снизился, поэтому возможно улучшить результат выбором тренда, более всего отвечающим реальной ситуации.
В табл. 13.4 приведены результаты расчетов по различным трендам, линейным относительно двух параметров. Как видим, наименьшая из рассмотренных сумм квадратов отклонений у логарифмического тренда, который характеризуется постепенным падением абсолютных приростов, что отвечает сформулированной выше гипотезе:
f (/+ l)—f (i)=A +В in (t-f-1)- A-В In t= В In (1 +y
Этот тречд дает более осторожный прогноз по сравнению с прогнозом по линейному тренду, что видно из табл. 13.5.
Таблица 13.5
Годы	Прогноз по линейному тренду	Прогноз по логарифмическому тренду	Экспоненциальное сглаживание
1986	29,8	27,4	30,3
1987	30,4	27,6	31,0
1988	31,0	27,8	31,6
1989	31,5	28,0	32,3
1990	32,1	28,1	32,9
334
В табл. 13.4, 13.5 приводятся коэффициенты прогнозирующего полинома и прогнозы тенденции этого же ряда на те же годы, полученные методом экспоненциального сглаживания (теория метода изложена в § 13.4)
Тригонометрическая регрессия
Снова рассмотрим модель, содержащую детерминированную н случайную составляющие:
yt = f(t, 004-6,,	Т,
где Л1б( = 0, De( = o2, cov(6(,es) = 0 при t=£s, f (t, а) — периодическая функция с известным периодом т, нацело делящим Т, т. е. Т = hm. Далее т, а следовательно, и Т будем считать четными.
При рассмотрении тренда только в наблюдаемые моменты времени его можно точно выразить через Т линейно независимых тригонометрических функций. Если же период тренда равен т<Т, то вс? его первые m значений затем повторя-
Т
ются еще-----1 раз, т. е всего h раз, поэтому в точное разло-
ги
жение функции в точках	Т достаточно включить
m членов, которые дают точное представление функции в точках /=1,..., т, а все остальные значения повторяют первые т значений.
2л/	2л/	т
Функции cos —— t, sin —— i имеют период -г-, поскольку т	т	j
Г2л/	. т \1	( 2л/ , , _ \	2л/
cos I——( (4- — I |=cos I—С/4.2л )= cos—— t,
I m \	1/1	\ m	/	m
Г 2л/ (,	.	m \1	.	/ 2л/	, . „	\	2л/
sin I—— I (4-— J 1= sin I —C/4-2л )=sin —— t,
Lm \	i/i	\m	/	m
причем этот период укладывается в общей длине ряда ——= firn '
раз, т. е. целое число раз, если / — цечое. Теперь подберем т таких функций с наименьшими периодами. Прежде всего в разложение необходимо включить константу, т. е. в число функций времени войдет <р0 (0s 1- Затем последовательно а	.	2л/
будем включать пары тригонометрических функции cos - /,
2 л/
sin  / при /=1,2,..., причем каждому j соответствует па-.	т ~
ра функции с периодом —Следовательно, остановившись на
335
(т 1
~2~~1
мы включим т—1 функцию. Таким образом.
ж	• т
осталось включить еще одну функцию с	имеющую
т
период
2, в качестве такой функции выберем
фт_1(0=(-1)'.
Окончательно получаем следующее представление периодического тренда:
т — 1
Н*. а)= £ а/Ф;(0=
1=0
(13.2.1)
Например, при рассмотрении ежемесячных данных, имеющих сезонный характер (т. е. период т=12), достаточно включить в разложение 12 членов, т. е.
Фо (0=1.
Ф2/-1 (9 = COS^-^-f),
12
/ ’
/=1,2,3, 4, 5,
т =
Фи (0=(— О'. т = 2,
и разложение принимает вид
5
cos/- , /V
(13.2.2)
Теперь воспользуемся методом наименьших квадратов для оценки параметров а/ получившейся георетико-вероятно-
336
стной схемы
+ <xm_, (-l)'+e„ /=1. 2,.... Т. (13.2.3)
Нормальные уравнения в терминах функций времени (1) запишутся следующим образом:
-1 т ф/(Оч>((о «>= Е /=1
(13.2.4)
— ив данном случае распадутся на m отдельных уравнений, содержащих только одно неизвестное, что вытекает из ор тогональности рассматриваемых тригонометрических функций.
Рассмотрим оценку для свободного члена m— 1 а0 = У— £ «,Ф,(0-1=1
Согласно Приложению 2, т
,,, 1 v (А 1 v / п ф2/-_. (о=т2. coshrz Ь Zcos—*=0’
<=1 ' z
Фт_к(о=у
поэтому
<?,(,=у.
Рассмотрим внедиагональные члены матрицы нормальных уравнений (13.2 4). Выше было показано, что
г	т
^Ф;(0Фо(0= £ Ф4(0=0.
.	t— 1
12 В. А. Колемасв и др.
337
При условии, что Ocicl^m— 1, внедиагональные коэффициенты обращаются в нуль; действительно,
г
Z/ 2njh \	/ 2nkh \	.
cos I —— t |-cos I — — t 1=0, z = 2/ — 1, l = 2k — 1,
\ Т /	\ Т /
1=1	\	/	\	/
V /А /А V 2п/ 4 	21Х^ 4
) Ф/ (0 Ф< (0= > cos t sin	t =
m m
Е/ 2njh \ . / 2nkh \
cos I——1\ sin f—-—l=2k,
/=i	'	' x '
V • 2я/ ) sin —-
5- m
(-l)' = 0, i = 2j.
Коэффициенты при единственном неизвестном в каждом из нормальных уравнений также определяются го формулам
i = 2j— 1 <m— 1,
Окончательно получаем а0=У.
Л 2 V / 2я/ \ . т 1
= Т	1 = 1.2~1'
(13.2.5)
Л 2 V /2л/ Д 1 m । «2/=т2л8,п(-^-9 i=l..........-г-1-
ат_,=^г £ УЛ”1/-
Таким образом, точечные оценки тренда определяются выражением
+ «2/ sin (^-	(-0J.	(13.2.6)
а оценка дисперсии случайной составляющей
г’"тД Z
т
2
2
£ («2,_1 +Ч)~ Г“т-1
/=1
(13.2.7)
Построение доверительных интервалов для параметров не вызываем затруднений, поскольку легко находятся дисперсии их точечных оценок:
о2
Da0 = Dy=—,
_Л 2О2	. , т
Оа2/_1 = Оа2/=^г-, / = 1,...,—-1,
Dam_,=-^-.
12*
339
Вследствие некоррелируемости оценок параметров легко определяется дисперсия точечной оценки тренда:
Dyt=Da0 +
+ D“m-
_ о2 2g2 / т	\ о2 _ то2 _ о2
Т + Т 2	)+ Т Т h'
О Пример 13.2. Используем формулы тригонометрического тренда для выделения тренда в динамическом ряде помесячных удоев от одной коровы. Для примера использованы данные *. Из них выбраны только данные за годы, которые характеризуются практически одинаковым среднегодовым удоем; это означает, что отсутствует смещение, отличающее один год от другого и имеют место только сезонные циклические колебания. В табл. 13 6 (и далее) используется
Таблица 13 6
Месяц	Годы			Всего	Среднее at
	1975	1978	1983		
Январь	140	143	133	416	138,7
Февраль	147	148	135	430	143,3
Март	196	196	183	575	191,7
Апрель	210	208	203	624	208
Май	259	240	254	753	251
Июнь	288	290	294	872	290,7
Июль	271	278	276	825	275
Август	244	245	264	743	247,7
Сентябрь	190	195	196	681	193,7
Октябрь	136	136	144	416	138,7
Ноябрь	104	НО	115	329	109,7
Декабрь	116	120	124	360	120
Итого	2301	2309	2311	6921	2307
Среднее	191,8	192,4	192,6	576,8	192,2
* Рекомендации по оперативному прогнозированию сельскохозяйственного производства.— Новосибирск: СО ВАСЗНИЛ, 1984.
340
обозначение
i 2
У Г у‘+ ° 1 = 0
121-
Используя данные табл. 13.6, получаем а,0=у = 192,2.
Легко также найти
1	36	47
Остальные коэффициенты найдем следующим образом:
2 у 2nj 1 у - л/
“2--*=36- Lyt cos “if а‘cosv*' /==1 1
А 2 V .2л/	1 у - . л/
“=>-36 2лs,n Уе-,2, °*s,n т ' 1=1 1
Исходные данные для расчета приведены в табл. 13.7.
На основе данных табл. 13.7 получаем значения оценок остальных коэффициентов, которые помещаем в табл. 13.8. Как видно из табл. 13.8, наибольшее значение амплитуды у первой гармоники с периодом mi —12, причем это значение на порядок выше амплитуд остальных гармоник, поэтому в практических случаях можно ограничиться одной гармоникой
yt —192,2 — 82,8 cos
(2л \	. / 2л \
(тг') “"(л)
или двумя гармониками
yt = 192,2 — 82,8 cos
— 2,9 cos
)+13,7 sin
Более точные результаты получаются при включении всех шести гармоник:
yt = 192,2 — 82,8 cos
— 2,9 cos
4л Д ,	. ( 4л ,\	_	/ 6л . \ ,
)+13,7 • sin (-уд-1 )+0,5-cos( —t )+
341
Таблица 13.7
	at	cos — t S	sin — t 6	Jt . cos — t 3	sin — t 3	П , cos — t 2	sin — t 2	2л cos — t 3	. 2л , sin — t	5л , cos —— t 6	. 5л . sin	1 6
1	138,7	0,866	0,5	0,5	0,866	0	1	-0,5	0,866.	0,866	0,5
2	143,3	0,5	0,866	-0,5	0,866	-1	0	-0,5	-0,866	0,5	-0,866
3	191,7	0	1	-1	0	0	-1	1	0	0	1
4	208	-0,5	0,866	-0,5	-0,866	1	0	-0,5	0,866	-0,5	-0,866
5	251	-0,866	0,5	0,5	-0,866	0	1	-0,5	-0,866	0,866	0,5
6	290,7	-1	0	1	0	— 1	0	1	0	-1	0
7	275	-0,866	-0,5	0,5	0,866	0	-1	-0,5	0,866	0,866	-0,5
8	247,7	-0,5	-0,866	-0,5	0,866	1	0	-0,5	-0,866	-0,5	0,866
9	193,7	0	-1	-1	0	0	1	1	0	0	-1
10	138,7	+ 0,5	-0,866	-0,5	-0,866	-1	0	-0,5	0,866	0,5	0,866
11	109,7	0,866	-0,5	0,5	-0,866	0	-1	-0,5	-0,866	-0,866	-0,5
12	120	1	0	1	0	1	0	1	0	1	0
	£d(q> (t)	-496,95	-30,15	-17,35	-84,26	3	7	40,05	-43,21	-17,3	30,9
Таблица 13.8
Оценка коэффициентов
	/ = 1	/ = 2	/ = 3	/=4	/ = 5	/ = 6
«2/-1	82,8	— 2,9	0,5	6,7	— 2,9	-1,6
«2/	— 5,0	13,7	1,2	-7,2	5,2	—
Амплитуда	83	14	1,3	9,8	5,9	1,6
Р; = д/ссг/ - 1 + «2/ Период т/= 12//	12	6	4	3	2,5	2
< < о / 6л , j . г* / 8л , \	. t 8л ,
4-l,2*sin I -j2~t J+6,7cos 1 -j2~^ j—7,2-sin f
— 2,9 cos
(-^L/)+5>15 sin Z)~l>55 (-1)'-
В табл. 13.9 приведены фактические значения ряда и нх оценка по первой гармонике, а также по первой и второй
Таблица 13.9
Месяц	Фактические at	Расчетные по первой гармонике		Расчетные по первой и второй гармоникам	
		Si	at—yt	Si	at — yt
Январь	138,7	118	20,7	128,5	10,2
Февраль	143,3	146,5	-3,2	159,9	-16,6
Март	191,7	187,2	4,5	190,1	1,6
Апрель	208	229,3	— 21,3	218,8	-10,8
Май	251	261,4	— 10,4	248	3
Июнь	290,7	275	15,7	272,1	18,6
Июль	275	266,4	8,6	276,9	— 1,9
Сентябрь	193,7	197,2	-3,5	200,1	—6,4
Октябрь	138,7	155,1	— 16,4	144,6	— 5,9
Ноябрь	109,7	123	— 13,3	109,6	0,1
Декабрь	120	109,4	10,6	106,5	13,5
Сумма модулей отклонений фактических от расчетных значений			137,7		89,4
343
гармоникам. Добавление всех остальных гармоник приводит к весьма незначительному улучшению результата.
§ 13.3. Нелинейные тренды
В гом случае, когда тренд нелинеен относительно коэффициентов и его невозможно линеаризовать, применяют нелинейные методы оценки коэффициентов, основанные на итерационных процедурах, на каждом шаге которых используются алгоритмы линейных оценок. В настоящем параграфе дано общее представление о нелинейном оценивании на примере метода Ньютона — Гаусса.
В случае тренда, нелинейного относительно параметров, имеет место следующая теоретико-вероятностная схема y=f(t,a)+et, t=l,...,T,	(13.3.1)
где/ (/, а) — тренд, нелинейный относительно вектора параметров а, а'=(аь .... ая); е<— случайная составляющая с Afe(=O, Dei = o2, причем для простоты будем предполагать, что ее значения независимы.
Рассмотрим сумму квадратов отклонений известного отрезка ряда yt, /=1, ..., Т от тренда
Q(a)= £ [yt-f (Л a)f-
Г=1
Для минимизации суммы квадратов отклонений необходимо приравнять нулю производные по параметрам:
2 ............................“
(13.3.2)
с df	.
Если линейно независимы как функции времени, то оа,
матрица X имеет ранг k:
11^2) II. .........т.
Для исследования движения к точке экстремума необходимо рассмотреть и вторые производные:
"=Е < Д~2 Е ь-I « «я Дг
34»
Исследование проведем при следующих предполож! ниях, которые сознательно сформулированы не очень строго (чтобы было можно только изложить суть метода):
1) нелинейный тренд имеет относительно невысокий порядок нелинейности, иными словами, вторые производные имеют не очень большие по модулю значения;
2) точка а!-0\ с которой начато исследование, находится вблизи точки минимума a* = arg inf Q (а), т. е. (а(0) — а*) мало.
Исходя из этих предположений, рассмотрим разложение тренда в окрестности некоторой точки
f (t, a)=f (t. a«)- £	(«£-о (Д),
(13 3.3)
Д = тах lot; — a^|,
причем вследствие предположений 1) — 2) вторые производные в разложении отсутствуют.
Последовательность точек aw, 1—0, 1, 2,..., будем строить таким образом, чтобы она сходилась к а*. Введем следующие обозначения:
i ). Н«)=( i)
Ут /	\f(T. a)/
II dai 11 ’
/=!,..., T; i=l......k.
Тогда имеем
У = f (a) + e=f (a«) + Xl (a - aW) + ё,	(13.3.4)
где величина e вобрала в себя и остаточные члены разложения каждой временной компоненты f (а), при этом по-прежнему считаем, что А4е = 0.
Если предыдущая точка уже каким-то образом определена, то будем искать последующую точку a<z+1) с помощью метода наименьших квадратов, рассматривая в качестве исходной модели (в матричном виде) следующим образом преобразованное выражение (13.3.4):
Y-f (a('))=X,(a-a('))+e, А4ё=О. (13.3.5)
345
Выражение (12.3.5) представляет собой модель тренда, линейного относительно коэффициентов at — а!р, причем наблюдаемыми значениями ряда являются yt — f(t, aw), а значениями функций времени при параметрах регрессии — <р,. (/) = df (t, aw) „
— ——----Применяя метод наименьших квадратов к оцен-
ок
ке параметров линейной модели (13.3.5), получаем
a - aw=(X;XZ)-	[У— f («<°];
обозначив полученную оценку а через о?+1, имеем а'+^чдаг1*;^-/ («(°]-
Таким образом, начиная с некоторой точки а0 рекуррент-нымобразомполучаемпоследовательностьточека^, а(,\ а®, ... таким образом, что каждая последующая точка получается из предыдущей с помощью метода наименьших квадратов для линейного относительно коэффициентов тренда. Можно доказать, что указанная последовательность в предположениях 1) —2) сходится к точке минимума
= arg inf Q (a)
§ 13.4. Экспоненциальное сглаживание
В случае линейных и нелинейных временных трендов, рассмотренных в § 13 1, 13.3, необходимо было постулировать форму тренда с точностью до параметров перед началом экспериментального исследования на основе известного отрезка yt, t=l,.... Т, временного ряда. Метод экспоненциального сглаживания позволяет анализировать временной ряд и получать прогноз без предварительного задания формы тренда. Требуется лишь, чтобы в области исследования тренд изменялся достаточно постепенно, эволюторно.
В основе экспоненциального сглаживания лежит следующая теоретико-вероятностная схема:
yl = f Met = O, De^c2.	(13.4.1)
Для простоты далее будем предполагать, что значения случайной составляющей в разные моменты времени некорре-лированы, т. е.
cov(eres) = 0 при Z=#=s.
346
Из первоначального временного ряда yt сглаженный ряд St(y) можно получить с помощью следующего линейного оператора сглаживания:
$< (</) = «ЯН-(1	(у),	(13.4.2)
где а — константа сглаживания, 0<а^1. Если применить оператор сглаживания последовательно ко всем значениям отрезка ряда, то получим
Sr (у) = ауг+(1 —a) Sr_(Q/) = af/y + (l —а) [ayT_t +
+(1 —а) Sr_2(f/)]=af/r + a (1 — а) ут_1 +
+ а (1 -а)2 уг_2 +(1 -а)3 Sr_3 (</)=	(13.4.3)
= а«г + а(1 —а) yT_t + а (1 — а)2 Уг-з + -
••• + «(1—а)Г-2{/2 + (1 — а)Т УI.
при этом в последнем равенстве сглаженное значение Si (у) заменим на первое известное значение ряда. Таким образом, в случае экспоненциального сглаживания наблюдения входят в обработку не с одинаковыми, а с экспоненциально убывающими весами, т. е. настоящие наблюдения как бы воспринимаются с большим доверием, чем прошлые. Напомним, что и в методе скользящих средних имеет место неравенство весов: наблюдения, попавшие в отрезок осреднения, входят с равными весами, а остальные наблюдения — с нулевыми весами.
Так как веса экспоненциально убывают, то при достаточно большой длине ряда его прошлые значения входят с быстро стремящимися к нулю (по мере удаления) весами, поэтому условно ряд можно считать бесконечным, расширив за пределы самых удаленных значений. В этом случае оператор сглаживания запишется в следующем виде:
оо
S,(y)=a £ (l-ayyt_s.	(13.4 4)
s=0
Оператор сглаживания как в первоначальной, так и в унифицированной форме линеен, поэтому, применяя его к отдельным составным частям теоретике-вероятностной схемы, можно в результате сложения получить результат сглаживания всего исходного ряда.
347
Применим оператор к случайной составляющей, тогда имеем
S,(e)=a	(•—«)’е,_s-
s = 0
Найдем теперь дисперсию сглаженных значений случайной составляющей, воспользовавшись независимостью ее значений в различные моменты времени:
DSt(e) = A, а £ (1-а)Ч_, 	в=0
= а2 £ (l-a)s+re,_sE/_r =
s, г —О
= aV V(l-a)2s=-------------=^-^а2
А	1—(1—а)2	2-а
Отсюда следует, что в результате сглаживания дисперсия случайной составляющей, вообще говоря, уменьшается, по-
скольку ———<1, так как а^2 — а, т. е. действительно 2 — а
имеет место сглаживание. «Выступающие» значения детерминированной составляющей также сглаживаются, т. е. сглаживанию действительно подвергается временной ряд в целом.
Оператор сглаживания можно вновь применить к уже сглаженным значениям; в результате получим оператор сглаживания второго порядка, последующее сглаживание дает оператор третьего порядка и т. д.:
-«) 341 (у).	(13.4.5)
Sf=aS<l> ({/)+(!—a) S®, (у),
S<^ = aS<w-1^)+(l -а)
Применяя несколько раз оператор сглаживания, а также подбирая соответствующим образом константу улаживания, можно практически полностью исключить случайную составляющую, в результате останется только преобразованная детерминированная составляющая.
Возникает вопрос: как же все-таки построить прогноз’ Из изложенного выше следует, что пока имеет место такая же ситуация, как и в случае метода скользящих средних: можно аналитически выделить в преобразованном виде детерминированную составляющую, однако нет аналитической формулы для получения ее прогностических значений.
348
В случае экспоненциального сглаживания (в отличие от метода скользящих средних) имеются аналитические выражения для прогноза. Теорема Брауна, являющаяся фундаментальной в методе экспоненциального сглаживания, утверждает, что коэффициенты полиномов, по которым производится прогнозирование, определяются с помощью дисконтированного метода наименьших квадратов и аналитически выражаются через сглаженные значения ряда.
Введем следующие обозначения для прогнозирующего полинома степени N, построенного в предположении, что значение ряда в момент t является последним:
N а™
=	(13-4.6)
Таким образом, по этому полиному можно получать прогноз в точках (/ + т). Коэффициенты полинома должны быть определены так, чтобы прогноз был наиболее точным.
Теорема Брауна. Коэффициенты прогнозирующих полиномов, определенные по дисконтированному методу наименьших квадратов
°°	/	п а<0	\2
а X (’ -аЦ у‘~*~ Z ’	(,3-4-7)
s = 0	\	/ = 0 *	/
линейно выражаются через сглаженные значения ряда S^(y),.... S<N>(y), S<w+I’(y).
□ Доказательство теоремы сопряжено с громоздкими выкладками, поэтому приведем его только для случая М = = 1. Имеем

Найдем оценки двух параметров прогнозирующего полинома с помощью дисконтированного метода наименьших квадратов (индекс t опущен, введено обозначение р=1 —а). Получаем со
Q(a0, а,)=а £ ^S(yl_s-ao — als)'2.	(13.4.8)
s = 0
Точку минимума, как обычно, находим из условия равен
ства нулю производных:
dQ 
СО
2а £	— М = °-
s=0
42- = 2а V sf.s (yl_s — ao — ais) = O, да.
1	в=0
3-.S
ТО
откуда получаем следующие уравнения:
' оо	\	Z оо	\	оо
X s₽‘ Ц-( I s2ps )ai= I sP4-s-s=0	f	ys —0	/	s=0
Так как
’ = 0	s = 0
1—а , у	(1—а)(2—а)
s = 0	а
а2
Со~ ю а) “1=З1’ (у)’
(1 _а) ад-Ij- ю)ю(2 а) а, = S<2’ ДО-аХ*» (у).
поэтому окончательно имеем c^=2^(y)-S^(y),	(13.4.9)
^=T“-|W)-^ (!/)]• 
В случае наиболее часто используемого квадратичного прогнозирующего полинома
«8>+^,-4-т2 можно аналогично получить следующие выражения для оценок его коэффициентов: S^=3^(y)-3S^(y)+^(y),
1 “2(1 —а) Х
X [(6-5а) S$‘> (у)-2 (5-4а) S)2> (/о+(4-За)	(//)],
.2 [ffl	(у)+ S® (у)]. (13.4.10)
(1 а)
Для расчетов на ЭВМ применяют следующие рекуррентные формулы, эквивалентные (12.4.10):
%?=yt+(• ~а)3 -У11
350
где
1) + а^	— у а2 (2 — а) (у,— у,).
&?=$ °—а3 (у,-у,),
y/=a*-)+^-,)+|ari)
Из этих формул видно, что при появлении нового наблюдения не обязательно хранить весь предыдущий отрезок временного ряда, надо лишь знать коэффициенты прогнозирующего полинома, найденные по этому отрезку.
Для прогнозирования на глубину т за пределы известного отрезка ряда используют прогнозирующий полином, найденный на основе всего ряда
" ар .
(13.4.11)
В том случае, когда в окрестности точки Т детерминиро-Еанная составляющая близка к постоянной, применяют аппарат однократного экспоненциального сглаживания и прогноз определяется по формуле
!/тч-т = 5г) (у)-
Так как
DS<!>(y)=DS<!,(e)=^-, z — а
то получаем следующий доверительный интервал прогноза:
5Р(у)±/р(7--1)о у
Если в окрестности точки Т детерминированная составляющая линейная, то применяют двойное экспоненциальное сглаживание и точечный прогноз осуществляют по формуле Уг+т = аР + аР т.
В результате подсчетов можем получить
°Ут+^
(2-а)3
X[I +4 (1 -а)+5 (1 -af + 2a (4 - За)т + 2а2?],
351
поэтому имеем следующий доверительный интервал для прогноза:
аЬП + а<1Г)т±<р(7'-2)оХ
Va [1 +4(1 —а) + 5(1 —а)2 + 2а (4 — За)т+2а2т2] (2-а)3
Если детерминированная составляющая — нелинейная в окрестности Т, то применяют тройное экспоненциальное сглаживание и точечный прогноз определяется формулой
В том случае, если детерминированная составляющая кроме роста испытывает еще и периодические колебания, т. е. в окрестности t может быть описана формулой
^а+т)=(Л/ + В/т)Еа+т),
где F[t) — периодическая функция с известным периодом М, то может быть применено сезонное экспоненциальное сглаживание, которое реализовано в ряде пакетов прикладных программ. Программная система по заданному периоду инициализации М производит первоначальную оценку периодической функции
= .Л Г /М+1 Ль] 1
F (0=«//«/,- (—у—.
t^kM,	i=l, .... ft;
(ft —1)M2
/•	1 4—1
; F,=- £ Л(/+Ш); t, j= 1,2,.... M.
V F	K 1 = 0
В дальнейшем производится взаимосвязанное сглаживание периодической функции и коэффициентов тренда по формулам (ftAf— число наблюдений):
Л/ = к_^+(1-к)(^_1 + Л/_1), F/_M = F/, t^M, ‘t—м
352
?(=₽^-+(1-₽)Л_Л(. '>м.

Прогноз временного ряда на т шагов вперед осуществляется по формуле
р(+1=(Я, + Я|)Г(/+т-М).
Оптимальные значения констант сглаживания я, р, у вы-зирают по минимуму суммы квадратов отклонений прогнозов (на один шаг) от действительных значений ряда.
Задачи
13.1.	Определите вид и параметры тренда в динамическом ряде выплавки стали с 1960 по 1979 гг. (см. табл.).
Годы	I960	1961	1962	1963	1964	1965	1966	1967	1968
Выплавка стали, млн. т	65,3	70,8	76,3	80,2	85,0	91,0	96,9	102,2	106.5
Годы	1969	1970	1971	1972	1973	1974	1975	1976	1977	1978
Выплавка стали, млн. т	110,3	115,9	120.7	125.6	131,5	136,2	141,3	144,8	146,7	151,5
13.2.	Выпишите из справочников «Народное хозяйство СССР» динамические ряды урожайности важнейших сельскохозяйственных культур и найдите по ним коэффициенты линейных трендов. Определите экономический смысл коэффициентов.
13.3.	Выпишите из справочников «Народное хозяйство СССР» данные о прямых затратах труда на производство важнейших видов сельскохозяйственной продукции Определите среднегодовые темпы снижения трудоемкости.
Указание. Рассчитайте параметры линейного тренда динамического ряда логарифмов исходного ряда.
Глава 14
ЭЛЕМЕНТЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА
Сущность многомерного статистического анализа заключается в переходе от первоначальной системы, как правило, сильно коррелированных между собой экономических показателей, к новым, уже некоррелированным компонентам или факторам, число которых меньше и вариабельность которых исчерпывает всю или максимально возможную часть вариабельности исходных показателей.
В данной главе вначале изложены вероятностные основы моделей многомерных наблюдений, а затем приведены статистические задачи оценки параметров и проверки гипотез в многомерном анализе. Для простоты рассмотрены только линейные модели.
§ 14.1. Общие модели многомерного анализа
Начнем рассмотрение некоторых вопросов многомерного анализа со следующего примера.
О Пример 14.1. При индивидуальном пошиве одежды закройщик измеряет у каждого человека много параметров, в частности размах рук, длину предплечья, длину ноги, окружность груди, бедер и т. п. При промышленном изготовлении одежды ее размеры характеризуются всего двумя параметрами: ростом h и размером s. Возникает вопрос: возможно ли и если да, то как обосновать замену набора многих параметров всего двумя?
Обозначив размах рук Xi, длину предплечья — Х2, длину ноги— Хз, окружность груди — Xt и т. д., получим ft-мерный вектор-столбец параметров (признаков) X = (Xi, X?,..., Xt). В этом случае можно предположить, что
=ai + ^i^ + cis + ^i-
^2 = a2T"M + c2s + 6l>	(14 j j)
Хк — ak + М + cks + 6*>
где а, — средняя величина i-го параметра для всех людей; ft и s — основные (общие) отклонения от средних значений из-за индивидуальных значении роста и размера каждого конкретного человека;
354
6, — характерные для каждого человека особенности, не объяснимые ростом и размером; Ь, н с, — степень влияния роста и размера, которые иногда называют нагрузками наблюдений (замеров) на общие (рост и размер) факторы. Величины а,-. Ь,, С/ и D6, = d?— неизвестные постоянные.
Из соотношений (14.1.1) видно, что общие факторы можно без ограничения общности считать нормированными и центрированными. Так как рост и размер (характеристики каждого человека) — случайные величины, то центрирование всех факторов означает, что Mh = Ms=M6i = 0, а нормирование — что Dh=Ds=l. Покажем, что центрирование и нормирование всех факторов (общих и характерных) действительно не ограничивают общности.
Пусть Mbi = mi=/=0, a Mh и Ms равны нулю. Тогда Л1Х, = а,+ + M6j = а, + mi. Но в этом случае вместо неизвестного а, появляется другая, также неизвестная величина cu+mt. Поэтому если неизвестная величина MXi = cu, то следует определять MXi, а при известной или неизвестной величине Mb. = т, все равно следует определять MXi, равное теперь а, + т,, где ненулевое среднее значение Л1б, = т, входит как составная часть в неизвестную величину Mv,-. Аналогично, средине значения факторов s и ft, если они не равны нулю, войдут в качестве составных частей в неизвестное среднее ALX,-.
Рассмотрим теперь нормирование. Из свойств дисперсии следует, что
PXt.=ft?Dft+c^Ds4-di + 2fticjcov (ft, s)+
4-2ft(. cov (ft, 6j)4-2c(. cov (s, 6Д
Таким образом, величина дисперсии наблюдения X, складывается из дисперсий факторов и их связей — коэффициентов корреляции. Из cov (ft, б() нормирования факторов следует, что cov(ft, s) = rAs, -—-=гы,
cov (д,б.) а -------------
rsi. Если какая-либо из дисперсий, например Dft = <^,
не была бы равна 1, то вместо
РХ. = Ь? + с? + d? + 26^/^ + 2д(.й/ы + 2с было бы получено более сложное выражение
РХ(. =	+ с? 4- d? +	+ 261ortdl-rft( +
+ 2ci<sP	(14.1.2)
содержащее то же количество переменных, поскольку и ft, и Ь&ь неизвестны.
Так как вначале всегда стремятся упростить модель, в которую уже вошли неизвестные коэффициенты си, bi (или fc.a/J, с,- и d,, то кроме нормирования факторов предпотагают еще некоррелированность между собой всех факторов. При выполнении последнего предположения некоторые параметры становятся известными: г^ = гы= гя = 0, а выражение для дисперсий значительно упрощается и при-
355
нимает вид
DXt =^+c? + d?=a?.
Чтобы упростить соотношения относительно cov (X,-, Х;), предполагается еше и некоррелированность характерных факторов б,- между собой. В этом случае
cov (Х(, Х;.) = bb- + cicf + dldj.
Таким образом, при предположении о нормироваиности, некоррелированности и центрированности всех факторов (общих и характерных) параметрами модели являются пншь величины a,, bt, с, и d,-. i = = 1,2,.... k. В результате замены б,- равной случайной величиной d^ вместо модели (14.1.1) будем иметь
Х; = at + б;А + cts + dty, i = 1,2,.... k •
О Пример 14.2. Рассмотрим миграцию населения некоторой страны, разбитой на несколько регионов. Пусть наблюдается численность приезжающих из всех регионов в какой-либо фиксированный регион. Пусть X, — число (поток) людей, приехавших в этот регион из региона i в течение некоторого периода времени, например года; Xi — поток из региона /; Хг — поток из региона 2 и т. д. Если всего k регионов, то наблюдается k величин Xi, Хг, .... X*. Потоки обусловлены различными факторами, которые обычно разбивают на несколько групп: а) поиродно-климатические; б) экономические. Таким образом, потоки являются функциями многих факторов. •
Экономические и социальные факторы в стране бывают различными или общими для всех регионов. Климатические факторы для малых стран могут быть общими, а для больших — иногда даже характерными.
На основе приведенных примеров можно построить общую модель многомерного анализа. Обозначим исходные показатели (признаки) Xi, Хг,.... Xk (каждый признак X, — случайная величина), вектор признаков X=(Xi, Хг,.... Х$ будем считать вектор-столбцом. Пусть, далее, ft, f-z,..., fm — общие факторы, F — вектор-столбец всех общих факторов. Действие всех характерных факторов (центрированных и нормированных) на каждое наблюдение сведем к одному. Тогда характерных факторов будет столько, сколько наблюдений. Вектор столбец, составленный из этих характерных факторов, обозначим через е = (В|, ег,..., е*)'. Нагрузки общих факторов f на i-e наблюдение, или просто факторные нагрузки, обозначим вектор-строкой (ап, а&, .... а1т). Из этих строк образуем матрицу размера kXtn нагрузок на общие факторы
356
Диагональную матрицу размера feXft нагрузок на характерные факторы, которые иногда называют специфическими или частными, обозначим через
/ V, 0 ... О А у = I 0 v.2 ... О 1
\0 о ... vj
Таким образом, каждый признак Xi можно представить в виде
^i = a,o + ailfl +0,2/2+ — + aimfm + Viei<
а вектор признаков — в следующем виде:
X=a + AF+Ve.	(14.1.3)
При этом, как и ранее, предполагаем, что Mf, = 0, cov (Д, fj)= = 6ij, Ме, = 0, cov(h, e/)=0, cov(e,-, е/) = 6</, где 6,-/ — символ Кронекера, т. е. 6,,= 1 и 6,,=0 при i=#/. Ковариационная матрица вектора, составленного из всех факторов (общих и характерных), является единичной размера (т + Л)Х(щ У к)
Модель многомерных наблюдений (14.1.3) можно упростить, обозначив через Z разность X—а. Теперь MZ=0, но остается не решенным вопрос, всегда ли можно, наблюдая реализации X, перейти к наблюдениям Z. Далее будет показано, что такой переход возможен, поэтому иногда рассматривают более простую модель
Z = AF+Ve.,	(14.1.4)
которая аналогична (14 1.3).
В экономических исследованиях компоненты вектора X, а также Z выражаются в разных единицах. Например, характеристики предприятия представляют собой число занятых, основные фонды и т. д. Поэтому нагрузки на факторы a‘i — размерные величины, что вызывает иногда трудности в трактовке их сумм квадратов и произведений. Чтобы избежать этих затруднений, можно центрированные величины Z еще и нормировать, т. е. разделить на среднее квадратическое отклонение и рассматривать новые показатели (признаки)
Z, Х.-а,
У,= —=—---------
°i ai
которые теперь безразмерны, так же как и факторы
Если значения а, и о, известны, то предлагаемый переход от Xt к Zi и У, не вызывает затруднения, а нагрузки на факторы безразмерны. Поэтому возможно определить, какая часть разброса, измеряемого дисперсией, приходится на общие факторы, а какая — на характерные. Так как результаты
357
экономических наблюдений, как правило, сильно зависят друг от друга, то выяснение вопроса, можно ли объяснить их меньшим числом общих для всех наблюдений факторов, является очень актуальным.
Рассмотрим далее разновидности моделей многомерных наблюдений, считая, пока это возможно, что все признаки центрированы и нормированы. Хотя нормирование i-ro признака и изменяет нагрузки на факторы, не будем пока изменять их обозначения, поскольку старые величины нагрузок (для ненормированных наблюдений) отличаются от новых лишь множителем 1/о,.
Модель главных компонент можно получить из общей модели в том случае, когда а) характерные факторы отсутствуют, т. е. У=0, и б) число общих факторов равно числу признаков (ft = m).
Модель факторного анализа состоит в том, что число общих факторов т меньше числа признаков, но у каждой компоненты многомерного признака может иметься характерная особенность (характерный фактор), т. е. диагональные элементы матрицы V неотрицательны
§ 14.2. Модель и свойства главных компонент
Суть метода главных компонент состоит в замене первоначальных коррелированных признаков (показателей) тем же количеством преобразованных некоррелированных компонент (факторов). В §14.1 исходные признаки обозначались через Х>, Хг,..., Xk, их центрированные значения — через Zi, Z2,..., Zk. Воспользуемся этими обозначениями. Линейная модель главных компонент для центрированных значений записывается в следующем виде.
t
z,= Z a‘jfr i=1’2............k' C14-2-1)
/=1
cov(f„	j=0,	/; i, /=1, 2, ..., k,
или в матричной форме
Z=AF MF=Q, MFP = I
где fi, fi,..., fk — центрированные, нормированные и некоррелированные факторы (компоненты).
Чтобы определить матрицу нагрузок Д=||а;/||, рассмотрим уравнение для собственных значений ковариационной 358
матрицы Z=A1ZZ' первоначальных признаков (detZ#=O) SZ = XZ,
где X — собственное значение, a l=(h, lz,.... Ik)' — собственный вектор-столбец, соответствующий собственному значению X.
Так как матрица 2 неотрицательно определена, то существует ровно k собственных неотрицательных чисел Xi, Хг,.... X* и соответствующих им собственных нормированных векторов /1, /г, .... h, ортогональных между собой, иными словами, имеют место следующие соотношения:
SZ/=^//, ^>0, /=1,2...k.
1'1,= У I I = | ° ПРИ	(14.2.2)
I 1 L ri п	I 1 при i = j.	v '
г= 1
Умножив обе части равенств (14.2.2) слева на /£, получим
z;t,.=x,
0 при i=/=/, Х;. при i = j.
(14.2.3)
Рассмотрим теперь матрицу L, составленную из векторов Zi, lz, h в порядке убывания соответствующих собственных значений:
L=(/i./г, .... Ik) и Х1^Хг^Хв^...^Х4.
Эта матрица на основании условий (14.2.2) ортогональная.
Выполним теперь линейное преобразование над исходными признаками с помощью матрицы L' = L~\ обратной к L-ортогональной матрице:
F = L'Z, Z=LF;
тогда вектор F новых признаков ft, f2,... г, будет иметь некоррелированные компоненты. Действительно, найдем ковариационную матрицу новых признаков:
MFF' = M(L'Z).(L'Z')]=M( L'ZZ'L)=L'MZZ'L = L'SL.
Используя соотношения (14.2.3), получаем
MFF' = L’ ZL=A, где
(X, 0 ... 0\
0 X»; ... 0 1.
0 0 ... ХА/
359
Таким образом, новые признаки (компоненты) fa, f2, fa,. ,fa некоррелированы и имеют дисперсии Dfa=ki,Dfa = = Х2. .... Dfa=Kk, расположенные в порядке убывания.
Ортогональное преобразование сохраняет расстояние, по-k	k
этому Z *?- X и, следовательно, i=i	i=i
(k \	/ k \ k	h
Итак, главные компоненты исчерпывают всю вариабель ность исходных признаков, а вклад каждой компоненты в эту общую вариабельность представлен соответствующим собственным значением X,- ковариационной матрицы 2.
Для перехода к модели (14.2.1), т. е. к таким ортогональным факторам F, что MF = 0 и M(FF') = I, следует изменить факторные нагрузки. Так как вместо факторов F должны быть взяты факторы F = A-1/2F, где А~|/2— диагональная матрица с элементами на главной диагонали, то А =£Л|/2; следовательно, и факторы, и факторные нагрузки легко вычислить Из изложенного выше вытекает справедливость следующего утверждения для F.
Теорема 14.1. Если ковариационная матрица 2 k-мер-ных наблюдений Z имеет ранг т, то модель главных компонент существует и факторы, и факторные нагрузки определяются однозначно:
F=a'/2L'Z, A = LA.1'2,
где столбцы матрицы L, т. е. fa, fa,.... lm — это собственные векторы ковариационной матрицы 2, удовлетворяющие уравнениям 2 li = Kifa и соответствующие собственным числам Х„ a Xi^X2^...^Xm — отличные от 0 решения уравнения |2 — — Х/| =0; Л= ||6qXi|| — диагональная матрица размера «X Хт, где 6,/=0 при i=/=j и 6д=1 при i=j (i,/=1,2,.... m).
Однозначность определения факторов и факторных нагрузок называют идентифицируемостью модели главных компонент Числовой пример идентифицируемости приведен в задачах 10.1 и 10.2. Рассмотрим фундаментальные свойства главных компонент.
1. Свойство наилучшей самовоспроизводимости
Это свойство показывает, насколько хорошо можно при ближать многомерные наблюдения с помощью меньшего числа факторов.
360
Рассмотрим исходные признаки Z=(Zi, Z2, ..., Z*) и набор искусственных предсказывающих признаков щ, U2,..., ит. Для каждого признака Z, рассмотрим предсказывающую линейную комбинацию щ:
т
6il«l+6,2U2 + - + 6im«m= £ bilul-l=\
Таким образом, вектор-столбец Z будем приближенно заменять вектор-столбцом Ви, где В — матрица размера feX/n, а и—вектор-столбец размера mXl-
Матрицу В, т. е. все коэффициенты Ьц, Ьц,..., blm линей ных комбинаций из и, подберем так, чтобы «отклонения» этих линейных комбинаций из т предсказывающих признаков и от предсказуемых k признаков Z были минимальными, В качестве меры отклонения используем величины
(14.2.4)
которые образуют неотрицательно определенную симметрическую матрицу Д. Отклонения тем меньше, чем «ближе» матрица Д=||ДЧ|| к матрице, состоящей из одних нулей
Существует несколько показателей f (Д) близости матрицы Д к 0, в частности, а) след матрицы fi (Д) = 1г Д = Дц + + Д22 + ... +Д**; б) евклидова норма матрицы, равная квадратному корню из суммы квадратов всех элементов Д, т. е.
т. е. /з(Д)=йе! Д= |Д|. Все эти три показателя близости очень легко находятся, если известны собственные числа матрицы Д (см. задачу 14.3).
Известно, что минимум целого класса показателей близости, в том числе и /j (Д), f2 (Д), f3 (Д), достигается тогда и только тогда, когда предсказывающие признаки щ, и3,.... ит являются функциями Zi, Z2...Z*, причем в качестве щ, 112,.... Um
следует использовать либо первые т главных компонент ft, либо т первых факторов f модели (14.2.1)
О Пример 14.3. Пусть k = 3 и ковариационная матрица признаков Z равна S (см. задачу 14.1). Рассмотрим самовоспроизводи-мость, используя показатель близости ft (Д) и первую главную компоненту fi, т. е. т = 1. В перную очередь следует определить матрицу В, которая в данном случае имеет размерность (ЗХО, т. е. является
361
вектор-столбцом с компонентами Ьь Ь2, Ьз- Используя центрированность признаков и главных компонент, найдем
ди = М	- b/, f = DZ, + Ь? Df, - 26,-cov (Zp Ц).
cov (Zt,f J
Минимум Ди no bt достигается при Ь( =--------------—------ и равен
cov2 (Zit f,)
DZj------—-----Поэтому относительная ошибка, если измерять ее в
Dh
долях дисперсии признаков Z,, равна данные задач 14.1 и 14.5, получаем:
cov2 (Z,.. /,)
6-=|—dF.dz. • ИгпользУн
б, = 1 %, £2=2%, 63=4% -
относительные ошибки воспроизводимости наблюдений Z. Z2 и Z3 по первой, главной, компоненте Точно такие же результаты имеют место для первого фактора fi. ф
2. Свойство наименьшего искажения геометрической структуры
Так как выбор пг из k главных компонент переводит наблюдение Z (точку в fe-мерном пространстве) в точку в m-мерном пространстве (набор факторов fi, fa, —, fm), то из-за линейности преобразования признаков в факторы получаем, что это преобразование — проекция точки Z из й-мерного пространства в точку f из m-мерного пространства (m<fe). Такие проекции обладают следующими свойствами.
1°. Сумма квадратов расстояний от п fe-мерных точек до пространства, натянутого на tn (m<k) главных компонент (факторов f), наименьшая среди всех соответствующих сумм других подпространств размерности ш, полученных с помощью линейного преобразования исходного fe-мерного пространства и проходящих через «центр тяжести» системы из п точек.
2". Среди всех подпространств заданной размерности m	полученных из fe-мерного пространства признаков
с помощью произвольного их линейного преобразования, в пространстве, натянутом на первые ,п главных компонент (факторов /), меньше всего искажается сумма квадратов расстояний между всеми парами п выбранных Л-мерных точек (п наборами по k признаков в каждом).
3°. В пространстве, натянутом на m главных компонент (факторов f), среди всех подпространств заданной размерности m<zk и полученных из fe-мерного пространства наблюдаемых признаков с помощью линейного преобразования, мень ше всего искажаются: а) расстояния от любых п наблюдений (точек) до их общего «центра тяжести» и б) углы между
362
любыми парами прямых, проходящих через все пары точек и «центр тяжести».
Мерой искажения геометрической структуры при проекции пространства признаков на пространство tn главных компонент (факторов f) могут служить следующие величины: для fi (А)
р(т)
\n + 1 + \п + 2 + — + ^1 + ^2 + • • • +
ДЛЯ f2(A)
<7(m)
^m+I +^m+2 + — +
x?+x2+...+^
И T. Д.
Соответственно мерой сохранения геометрической структуры служат величины 1—р (т) или 1—q (т) и т. д.
В примере 14.3 (см. также задачу 14.1) проекция точек трехмерного пространства на линию первой главной компоненты (фактора fi) дает искажение геометрической структуры в 0,0136 («1,4 %), если измерять искажение величиной р(1).
В заключение отметим, что если все признаки X. центрированы, то все геометрические картины особенно наглядны. На рис. 14.1 изображены точки и эллипсоиды рассеивания в трех системах координат: (xi, х2), (zb z2) и (fi, f2). Из этого рисунка следует, что линия первой главной компоненты — это линия ортогональной регрессии. На рис. 14.2 изображен график сохранения геометрической структуры, если искажения мернть с помощью fi (A)=tr A (fe=10). Степень сохране-
363
Рис. 14.2
ния структуры измеряют также долей суммарной дисперсии, обусловленной первыми главными компонентами.
Часто в экономических исследованиях приходится иметь дело ие только с центрированными, но и с нормированными величинами. В этом случае вместо ковариационной матрицы во всех рассуждениях используют корреляционную матрицу. Следует учесть, что направления осей главных компонент (рис. 14.1) не меняется при замене центрированных признаков на центрированные н нормированные, а изменяются лишь факторные нагрузки, так как все признаки при нормировке де пят на среднеквадратические отклонения.
§ 14.3. Модель факторного анализа
Модель факторного анализа, как уже было отмечено, состоит в том, что все признаки выражаются через меньшее число факторов
X, =aufi+ai2f2 + ...+aimfm4-ц,е,., 1=1, 2,.., k,
где все общие и характерные факторы fi, е,- центрированы, независимы в совокупности между собой и имеют дисперсии, равные 1.
Таким образом, каждый объект описывается k признаками X,, которые зависят от общих для всех них факторов fi, fs.fm, присущих каждому объекту, и характерных ei —
разных для разных признаков Отсюда следует, что связи признаков заключены в общих факторах. Это особенно хорошо видно (см. задачу 14.7) из выражения для ковариацион
364
ной матрицы
или (в обычной записи)
т
°и= Ё ai+vb
т
•ц= I аиац’ ‘J=1,2...k,
i=i
Допустим, что известна только ковариационная матрица 2. Тогда возникают следующие вопросы: I) при каких ограничениях на 2 существуют такие матрицы' А (размера и ^-диагональная размера kxk), что 2=44'+^; 2) если матрицы А и V2 существуют, то при каких условиях на X можно найти А и V2 единственным образом. Ответ на второй вопрос соответствует задаче идентификации.
Наконец, допустим, что все условия существования и единственности выполнены; тогда возникает еще один вопрос как найти А и V2, зная лишь 2, т. е. нужно еще иметь алгоритм вычисления по 2 матриц А и V.
Ответ на вопрос о существовании модели факторного анализа известен. Условия существования имеют достаточно сложный вид, поэтому они в настоящем пособии не приводятся. Если удается каким-либо способом найти матрицы А и V, то вопрос о существовании модели решен.
Что касается единственности то следует обратить внимание на следующее: факторы и факторные нагрузки определяются не однозначно, а с точностью до произвольного ортогонального преобразования. Действительно, пусть L — ортогональная матрица размера mX«i. т. е. LL'=I. Возьмем в модели факторного анализа
Z=AF + Ve
вместо факторов f другие факторы g, которые, как и f, независимы и нормированы: g=L'F. Тогда при факторных на-
Если у наблюдений, т. е. у общих и характерных факторов, имеются не только вторые моменты, но и моменты четвертого порядка, те модель фг игорного анализа единственна, если она существует
365
грузках B=AL вид модели не изменяется, поскольку Z= = Bg^- Ve. = ALL'F A- Ve = AF + Ve, т. e. появляются другие факторы и другие факторные нагрузки, а первоначальные признаки не изменяются. Изменения в ковариационной матрице 2 невозможны, поскольку для факторов g матрица 2 = = ВВ' -\-V, а из B = AL следует, что ЗВ' = ALL'А' = А1А = = АА', т. е. ковариационная матрица не изменилась.
Итак, если найдены какие-либо факторные нагрузки А, то факторные нагрузки B=AL также допустимы, т. е. допустим целый класс нагрузок, связанных любыми ортогональными преобразованиями. Таким образом, в прямом смысле единственности нет (см. задачу 14.8). Но есть единственность (т. е. идентифицируемость) с точностью до ортогонального преобразования, следовательно, из всех ортогональных преобразований можно выбрать такое, для которого матрица факторных нагрузок имеет самую «простую структуру».
Так как общие необходимые и достаточные условия идентифицируемости довольно сложны, то приведем более простые условия.
Обозначим через 2т подматрицу ковариационной матрицы 2, полученную в результате выбора т произвольных столбцов матрицы 2 и последующего исключения строк, содержащих диагональные элементы матрицы 2. Таким образом, подматрица 2т состоит из Л — т строк и т столбцов.
Если все подматрицы 2т матрицы 2 имеют ранг меньше т, то модель факторного анализа неидентифицируема при т общих факторах. Отсюда, в частности, следует, что при m>k/2 модель факторного анализа неидентифицируема.
Если срети всех матриц 2т найдется такая, что при исключении любой ее строки остается подматрица ранга т, то модель факторного анализа с т общими факторами идентифицируема.
Если модель факторного анализа существует и идентифицируема, то тем не менее невозможно найти значение всех факторов. Это связано с тем, что при k признаках число всех факторов равно m-\-k (т общих, k характерных), в то время как имеется только k линейных уравнений. Однако можно найти средние значения и ковариационные матрицы факторов для фиксированных признаков.
Если же характерные факторы определять ие нужно, то из k уравнений нужно найти tn (m<k) неизвестных общих факторов. В этом случае определение общих факторов либо невозможно из-за несовместимости системы уравнений, либо сводится к модели регрессии с ошибками, которые имеют в общем случае разную точность, определяемую коэффици
366
ентами V< для i-ro наблюдения. Таким образом, значения факторов не могут быть точно найдены по уравнениям модели факторного анализа.
При описании модели главных компонент было отмечено свойство наилучшего приближения всей ковариационной или корреляционной матрицы k признаков с помощью первых т главных компонент. Для модели факторного анализа справедливо аналогичное свойство. Если рассматривать не все т факторов, которые полностью определяют всю ковариационную или корреляционную матрицу, а только m'<tn из них, то эти т' факторов можно выбрать так, чтобы ковариационная матрица для величин
Z.	+ai2f2 + ... + aim,fm,
как можно меньше отклонялась от исходной, т. е. сумма
Л, Л, [cov (Zj, cov (Z;
fa cov (Z„ Zj cov (Z/t zj
была минимальной. Таким образом, модель факторного анализа предназначена для объяснения только связей между признаками, но не дает объяснения их вариабельности.
§ 14.4. Статистика модели главных компонент
До сих пор рассматривался случай, когда и модель и ковариационная (корреляционная) матрица были известны. На практике же бывают известны лишь реализации наблюдений. Обозначим число этих известных наблюдений через п и, как обычно, будем предполагать, что все они не зависят друг от друга. Ранее при определении факторных нагрузок мы использовали известную корреляционную (ковариационную) матрицу, сейчас заменим ее выборочной корреляционной или ковариационной матрицей R или
Обо; начим выборочные наблюдения через Xi, Х2,.... Хп, где Xi — вектор-столбцы с компонентами Хц, т. е. Xi= =(Xu,X2i, ...,Xkt)'. Матрица X состоит из п вектор-столбцов Xi. Если сложить все столбцы матрицы X (все многомерные наблюдения) и результат разделить на п, то получим вектор оценок математических ожиданий
367
Известно, что вектор X — несмещенная состоятельная оценка неизвестного математического ожидания MX, если, конечно, оно существует. Предположим, что существуют математические ожидания и вторые момсн-ы компонент случайного вектора X, реализации Xi которого наблюдаются. Выборочные дисперсии компонент
в этой главе удобно заменить на оц, так.как это диагональные элементы выборочной ковариационной матрицы X. Остальные элементы матрицы X — это выборочные ковариации
Oi/=—	(Х„ — X,) (Xjt —X). Если обозначить через Zu раз-
” fc=i
ность Хц — X., то вектор-столбцы Z/=(Zi/, Zu, ..., Zki)' образуют матрицу Z размера ky.n. Теперь матрица £"=— ZZ', а п
корреляционная матрица R=D£D, где матрица D — диагональная с элементами на диагонали (см. задачу 14.9).
На основании теоремы 8.1 о функциях от выборочных моментов можно сделать вывод, что выборочная ковариационная (корреляционная) матрица £ (R; является асимптотически несмещенной, нормальной и состоятельной оценкой ковариационной (корреляционной) матрицы £(/?), если число наблюдений велико (п->оо), а размерность наблюдений не очень велика.
Рассмотрим только методы, когда k/n мало (k/n->Q), например k конечно, а п-*-оо, хотя имеются многочисленные результаты для случая больших k и п. В последнем случае рассматривается асимптотика Колмогорова, т. е. такие Лип, что л-»-оо и k(n^*-c, где с — постоянное значение или lim (k/n) = c, п-^оо, при этом необходимо во всех оценках, критериях проверки гипотез и т. д. делать поправку на величину с. Если же с настолько мала, что этой поправкой можно пренебречь, то приходим к рассматриваемому случаю с = = 0 или k/n -> 0.
В том случае, когда распределение наблюдений нормально, выборочная ковариационная матрица £" — оценка метода максимального правдоподобия. Собственные числа и собственные векторы ?,• матрицы £"—оценки максимального правдоподобия величии X,- и Ц. Поэтому они обладают всеми качествами оценок максимального правдоподобия: асимптотической несмещенностью, асимптотической эффек
368
тивностью и асимптотической нормальностью. Все эти свойства (кроме, возможно, эффективности) имеют и оценки метода моментов, поскольку и А,- и — функции от выборочных моментоз.
Из свойств модели главных компонент получаем оценки метода моментов (или метода максимального правдоподобия при нормальном распределении наблюдений) для нагрузок иа факторы	и оценки факторов Д. Необходимо обра-
тить внимание на следующий факт: так как выборочные нагрузки на факторы а,- и собственные векторы ц — это оценки, то они имеют ошибки, которые непосредственно входят в погрешности как главных компонент, так и факторов Д-. Поэтому можно говорить лишь об оценках главных компонент и средних значений факторов
Известно, что:
I) величины
д/п—1 (\ —А), 1=1,2,.... ft,
при п-^со асимптотически нормальны со средним, равным О, и дисперсией, равной 2А?, и не зависят от других kj (при j =£1);
2) вектор
д/п-1 ft-/,), i=l,2,	(14.4 1)
при п^>оо имеет в пределе многомерное нормальное распределение с вектором средних значений 0 и с ковариационной матрицей, элементами которой являются
i^i
При этом компоненты вектора Z,- не зависят от всех к, и от компонент всех векторов lh j=£i.
Используя общий подход § 9.2, можно на основе (14.4.1) получить доверительный интервал дчя А,- (см. задачу 14.10). Но если известно несколько доверительных интервалов, полученных разными методами, то при малых п (поскольку распределение наблюдений неизвестно) лучше использовать самый большой из них — он дает наиболее надежные результаты.
О Пример 14.4. Допустим, что при обследовании 24 объектов, характеризуемых тремя признаками, получена матрица приведенная в задаче 14.1. Найдем доверительный интервал для Х3. Так как п = 24. то, выбрав вероятность ошибки равной 0,05, получаем иа=1,96 и 1,86^Х3^6,78. Поскольку (см. задачу 14.1) Хг попадает
13 В А. Колемаев и др.
369
в доверительный интервал для Хз, возникает предположение, что Х2 = = Хз, a Xi отличается от £з из-за случайных причин. ф
Рассмотрим гипотезу о равенстве t собственных чисел ковариационной матрицы £:	Х/+, =Xi+2 = ... = Xl+l— при
следующей альтернативе: не все Xi+1,\+2, .... \+/ равны между собой. Известно, что при п-*<х> и справедливости основной гипотезы статистика
?,= -(«— 1) £ 1п^+(п —1)Лп
/=>+1
2 К* “Г * J 1	-
распределена по закону х с ——-—1 степенями свободы.
Отсюда следует, что гипотеза о равенстве t корней отвергается с вероятностью ошибки, равной а, если
2
<(<+») 2
где %р(Л) — р-квантиль распределения х2 с свободы.
k степенями
О Пример 14.5. Проверим гипотезу о том, что Х2 = Хз, возникшую в примере 14.4. Пусть вероятность ошибки а = = 0,05; тогда при i = 2, 1 = 2, Ходе (2)=5,99, Х3=6,5, Х2= = 2,86 статистика
у2= — 23 (1п 6,5 +In 2,86) -|-46 In
6,5 + 2,86 \___
2	)~ ’
Поскольку 3,7О=?2<Хо,95 (2)=5,99, гипотезу о равенстве Х2 и Хз следует принять. Но в этом случае нужен новый доверительный интервал для двух одинаковых собственных чисел Х2 и Хз- •
Доверительный интервал для t одинаковых собственных чисел ковариационной матрицы строится следующим образом. Пусть Х,-+| =(^+| +\+2 + — + \+1)/Л а а, как и прежде, вероятность ошибки первого рода; тогда доверительный интервал надежности (1— а) для X/	1, i-j-2,.... t’ + 0 за-
дается неравенством
^-И<^+1
О Пример 14.6. Построим доверительный интервал для Х2=Х3 в условиях примеров 14.4 и 14.5, задавшись надежностью 0,95, т. е.
370
«=0,05. Так как 1=2,	= 6.50+2,86 и	т0
_______1^===2,62<Х1 <6,21 =_____________________________ 1 +1,96-\/2/(23 • 2)	'	1 —1,96 д/2/(23-2)
Полученное неравенство выполняется в среднем в 95 случаях из 100. •
Иногда по выборочной корреляционной матрице £ можно высказать предположение о равенстве всех парных коэффициентов корреляции. Из такой гипотезы следует: а) равенство всех последних собственных значений; б) явный вид собственных векторов. Приведем статистику (критерий согласия) для проверки гипотезы о равенстве всех гу = г по данным о выборочной корреляционной матрице £=||г;;||.
Для проверки этой гипотезы вначале вычисляют средние коэффициенты корреляции по строкам (или столбцам)
1 к
ri=~7—т- У г(у; затем средние коэффициенты корреляции k~1 /=1
fe	k
по всей матрице г=———— У >	У г, и нормиро-
1 / i — 1	” i = 1
(A —if (2 —г) г
вочную величину с=------—-----
fe(fe —2)(1—г)2
числить статистику критерия
Теперь возможно вы-
1Й*
yW=
я—1 (1-rf
rf-c £ (G-r)2 i=i
которая при я->-оо распределена как величина х2 с (A + l)(fe-2)
—----------— степенями свободы. Поэтому гипотезу о
равнокоррелированности всех наблюдений П) = г следует отвергнуть, если y(r)>Xi-.^—а — уровень значимости.
О Пример 14.7. Для выборочной корреляционной матрицы, полученной в задаче 14.10, в условиях примера 14.4
/1.0000 0,9740 0,9726 \
£ = ( 0,9740 1,0000 0,9655 1
\0,9726 0,0655 1,и000/
13*
371
проверим гипотезу о равенстве всех коэффициентов корреляции Получаем: ri=0,9733, г2 = 0,9698, г3 = 0,9691, г = 0 9707 и
(3-1 f (2 -0.9707) 0,9707
С =----------------------= Z OZ 0,0.
2-(3 —2) (1 — 0.9707)2
Отсюда имеем у (г) = 0,825.
(3 п (3__2)
Задал уровень значимости критерия а = 0,05 для ---------=2
степеней свободы, из таблиц находим квантиль у2 95 (2) = 5,99 Так как у (г)=0,825<5,99 = 95 (2), то гипотезу о равнокоррелированности всех трех признаков можно считать согласующейся с имеющимися результатами обследования. Ошибка может иметь место в среднем в 5 случаях из 100. ф
Кроме доверительных интервалов и критериев согласия в статистике главных компонент применяются критерии проверки независимости (некоррелированности) и равноточности всех наблюдений. Критерий некоррелированности основан на матрице а критерий некоррелированности и равноточности — на ST. Эти критерии строятся при фиксированном k и больших п. Имеется также и критерий проверки гипотезы о некоррелированности против гипотезы о равнокоррелированности набчюдений, построенных для любых п и любых k. Но последний критерий основан на знании самих наблюдений, а не их выборочной корреляционной или ковариационной матрицы. Кроме того, приходится предполагать, что сами наблюдения имеют многомерное нормальное распределение.
§ 14.5. Статистика модели факторного анализа
Вычислительная сторона факторного анализа сопряжена со значительными трудностями. Вычислительная часть факторного анализа состоит из двух задач. Первая задача — оценивание параметров модели факторного анализа. Вторая — определение такого поворота в пространстве факторов (ортогонального преобразования), чтобы выполнялись некоторые дополнительные свойства.
Для решения первой задачи часто используют наиболее простые с вычислительной точки зрения ограничения на факторные нагрузки А. Приведем несколько примеров.
I. Решение для А и V2 системы
V 2
ищется среди таких матриц А и V2, чтобы матрица A'VA была диагональной и ее диагональные элементы были упорядочены в порядке убывания.
372
2. Решение для А и V2 выбираются из соображений диагональности матрицы АА'. При этом дополнительно предполагается, что диагональные элементы АА’ расположены в порядке убывания при возрастании номеров строк (столбцов) .
в. Решение для А ищется среди всех А, имеющих вид
А —	/«Н «21 С31	сч сч сч О О Q	а о о ы ьэ ы ы	• 0 \ . 0 . 0
	«т1	ат2	атЗ "	
	, О<:|	ak2	ak3 	- акт 1
Последняя матрица хороша тем, что первый признак выражается лишь через 1-й фактор, второй—через 1-й и 2-й факторы, третий — через 1, 2 и 3-й и т. д. Лишь последние k — т—1 признаков выражаются через все факторы. Далее будет рассмотрен только первый случай. Решение выполняется по схеме, включающей вопросы минимизации некоторой неотрицательной функции от всех элементов матриц. Эта функция f является обобщением понятия «расстояние», когда имеются в виду две матрицы, поэтому она зависит от двух матриц, например В и С. При Ь = С функция f (В, С) достигает минимума: f (В, В) =0; прн В=£С функция f (В, С)>0. Функция f (В, С) может быть выражена через собственные значения обобщенной задачи о собственных векторах и числах с помощью строго соответствующей f функции g (X).
Прежде чем рассмотреть этапы расчета оценок, напомним, что предполагается существование модели и ее идентифицируемости, кроме того, считается известным число общих факторов т в факторной модели. Так как матрица S точно не известна, а имеется лишь ее оценка £, то даже при известном числе факторов нельзя ожидать получения точного решения задачи факторного анализа, а можно лишь оценить это решение с той или иной степенью точности.
Обобщенная задача о собственных векторах и числах состоит в следующем. Пусть заданы неотрицательно определенная матрица В и положительно определенная матрица С; тогда обобщенные собственные числа Х{ удовлетворяют уравнению |В — ХС| =0, а для Ц собственных векторов справедливо соотношение = Для решения на ЭВМ задач об обобщенных собственных числах и векторах имеется соответствующее программное обеспечение.
373
Итак, зная число общих факторов m и £, требуется из системы S=AA'-j- V2 оценить А и V2.
Этап 1. Выбираем метод оценивания, т. е. вид функции f (В, С) или, что то же самое, g(X), где X — решения уравнения k
\В — кС\=О, f(B, С)= £ £(>,.), Х|>Х2 i— I
Этап 2. Находим оценку корреляционной матрицы R по результатам п наблюдений.
Этап 3. Находим диагональную матрицу V2 среди всех неотрицательно определенных матриц с диагональными элементами O^Vu-^1, удовлетворяющую равенству
f(R, V2)=minf(ff, V2).
Если бы матриц V2 было конечное число, то, подставляя в функцию f (В, V2) при одной и той же R последовательно все матрицы V2, можно было бы найти минимум Но множество всех V2 бесконечно, поэтому лля решения этой задачи используются методы математического программирования.
Этап 4. Оценка Р2 получается следующим образом. Пусть D — диагональная матрица, полученная из диагональных элементов о„ матрицы £da=-y!a£ тогда
P2=dv2d
Этап 5. По оценке Р2 получим оценку А:
А = НЦ — Ат)=И—ИАт и
Ага= ||бгД,||, i, j— 1, 2, ..., т,
где Н — матрица размера	полу-
ченная из матрицы L размера А ХА, состоящей из k собственных векторов li задачи £/f=XiP2Zi, следующим образом: матрицу L' обращаем и из нее выбираем т первых столбцов.
Отметим, что каждой функции g, а следовательно, и f, соответствует свой метод оценивания параметров факторов модели и, наоборот, каждому методу соответствует своя
функция. Например, если известно, что все наблюдения нормальны, то параметры модели факторного анализа могут быть оценены методом максимального правдоподобия. Этому
методу соответствует функция g (Х)=——|-1пХ—1, Хд>0.
А
374
Таблица 14 1
Признак		1	2	3	4	5	6	7	8
1.	Рост	1	0,846	0,805	0,859	0,473	0,398	0,301	0,382
2.	Размах рук	0,846	1	0,881	0,826	0,376	0,326	0,277	0,415
3.	Длина предплечья	0,805	0,881	1	0,801	0,380	0,319	0,237	0,345
4	Длина ног	0,859	0,826	0,801	1	0,436	0,329	0,327	0,365
5.	Вес	0,473	0,376	0,380	0,436	1	0,762	0,730	0,629
6.	Окружность бедер	0,398	0,326	0,319	0,329	0,762	1	0,583	0,577
7.	Окружность груди	0,301	0,277	0,237	0,327	0,730	0,583	1	0,539
8.	Ширина груди	0,382	0,415	0,345	0,365	0,629	0,577	0,539	1
О Пример 14.8. Рассмотрим матрицу коэффициентов корреляции восьми признаков, определяющих качество женской одежды. Матрица получена по выборке объема п = 305 (табл. 14.1).
Решение получено с помощью ЭВМ. Нагрузки на общие факторы, число которых т = 2 и т = 3, приведены в табл. 14.2, там же даны значения составляющих частей дисперсий V2.
Таблица 14.2
Признак	Число факторов						
	т = 2			m=3			
	h	h	V3	f.	h	h	V3
1. Рост	0,856	-0 324	0,162	0,862	— 0 320	0,164	0,127
2. Размах рук	0,848	—0,412	0,111	0,877	— 0,432	— 0,423	0,002
3. Длина предплечья	0,808	—0,409	0,178	0,808	— 0,388	— 0,05’	0,193
4. Длина ног	0,931	— 0,342	0,192	0,838	— 0,343	0,180	0,157
5. Вес	0,750	0,571	0,111	0,748	0,584	0,090	0,090
6. Окружность бедер	0,631	0,492	0,360	0,625	0,499	0,007	0,360
7. Окружность груди	0,569	0.510	0,417	0,569	0,515	—0,020	0,411
8 Ширина груди	0,607	0,351	0,508	6,003	0,344	—0,164	0,491
Сумма квадратов	4,449	1.510	—	4,481	1,532	0,156	—
375
Факторы часто интерпретируют по нагрузкам. Так, первый фактор теснее всего связан с длиной рук, ног. размером рук и ростом, поэтому при маркировке одежды его называют ростом. Второй фактор в большей мере определяет вес, окружность бедер, груди, поэтому его можно было бы назвать полнотой, но при маркировке одежды его называют размером
Из табл. 14.2 видно, что суммы квадратов нагрузок на характерные факторы (т. е. дисперсии) как при двух общих факторах, так и при трех факторах слишком велики, чтобы этих факторов было достаточно для относительно точного описания фигуры.
По последней строке можно судить о доле каждого общего фактора в разбросе (дисперсии) наблюдаемых признаков. Доля третьего фактора 0.156/8 = 0,02 слишком мала, чтобы его учитывать, в то время как доля первых двух составляет 5,959/8 = 0,745 (для т = 2) и 6.013/8 = 0,752 (для т = 3), т. е. очень велика. ф
Возникает вопрос сколькими же факторами следует ограничиться? Проверим гипотезу о том, что число общих факторов равно выбранному заранее числу т. Если бы корреляционная (или ковариационная) матрица была точно известна, то это можно сделать очень просто: найти решения для нагрузок на общие и характерные факторы, т. е. А и V2. Это решение AA'-j-V2 должно совпадать с заданной матрицей R или £. Однако для R или £ ожидать подобного же совпадения с AA'-j- Р? не приходится, поэтому следует статисти чески оценить разность между £ или R и AA'-f-Ф2 и установить, насколько она значима.
Так как £ или Ё—функции от выборочных моментов, а А, Р2 — функции от £ или /?, то А и Р2 также функции от моментов, поэтому к А и Р2 применимы теоремы о функциях от моментов.
Если же известно распределение для наблюдений, например оно нормальное, то А и Р2 — это оценка максимального правдоподооия со всеми их свойствами. Используя эти факты, можно найти статистику для проверки гипотезы о том, что при заданном т оценки А и Р2 достаточно хорошо описывают £ или /?
Имеется два метода проверки гипотезы о числе общих факторов. Более точный основан на приращении информации при переходе от т факторов кт-|-| фактору, поэтому он требует очень больших вычислений.
Известно, например, что менее качественный метод при малом числе наблюдений «завышает» число общих факторов, необходимых для оценки модели факторного анализа, а при большем числе наблюдений — «занижает» это число. При ведем лишь последний, более простой для понимания метод.
376
Для нормального распределения наблюдений известно, что величина
<pm = nln	-	(14.5.1)
асимптотически распределена при п->-оо по закону %2 с числом степеней свободы
ш=-^-[(/г— mf — Д’ — mJ	(14.5.2)
О Пример 14.9. Используем данные примера 14.8 для проверки гипотезы о числе общих факторов в факторной модели. Для этого выберем уровень значимости а = 0,05 и а = 0,01. Допустим, что общих факторов т = 2. Из соотношения (14.5.2) найдем ш=0,5|(8 — 2f — 8 — 2]=8. а из таблицы границ распределения х2 найдем квантили Х295(8)=15,5 и Хд gg (8) = 20,09. Расчеты, проведенные по данным табл. 14.1 и 14.2, дают <р2 = 79,8. Так как <рг>х?_а(“')• то гипотезу о двух факторах следует отклонить, при этом вероятность неправильного отклонения гипотезы равна а.
Аналогично можно поступить и при проверке гипотезы о числе общих факторов т = 3. Результаты сведены в табл. 14.3.
Таблица 14.-3
Число факторов	Число степеней свободы	Значение Xi-e при вероятности ошибки			Результат вычисления Ч>"
		0.05	0,01	0,001	
2	8	15,507	20,090	26,125	79,8
3	7	14,067	18,475	24,322	24,1
Результаты приведенные в таблице, показывают, что число общих факторов т = 2 слишком маловероятно, поскольку <рд слишком велико. Даже при Х=0,001 Хо995(8)=26,125<<р2 =79,о. Поэтому возможность характеризовать фигуру лишь двумя общими факторами очень маловероятна Для числа общих факторов т = 3 положение ие столь ясное Хотя при а = 0,05 и а = 0,01 <Р2>Х?_а(7), но при а = = 0,001 имеем Хо.эээ (7) = 24,3 и фз<Хо999(7), т. е. гипотеза уже может быть принята. ф
После проверки гипотезы о числе общих факторов и вычислении нагрузок на факторы можно оценить средние значения факторов. В отличие от метода главных компонент сами общие факторы оценить нельзя, поскольку матрица А, переводящая общие факторы в наблюдения, имеет ранг т, мень
377
ший k. Для оценок средних значений общих факторов существуют несколько методов. Рассмотрим один из них.
Соотношения, связывающие оценки средних значений общих факторов f с оценками факторных нагрузок для каждого конкретного наблюдения Xt, таковы:
T=S'S-lxt, где 1— оценка ковариационной матрицы, полученная по всем Xt, 1=1,2, А — оценка матрицы факторных нагрузок, a Xt — вектор признаков объекта I.
Задачи
14,1.	Ковариационная матрица для трехмерных центрированных наблюдений г имеет вид
(451,39
271,17
168,70
271,17 168,70\
171,73 103,29 \
103,29	66,65/
Покажите, что собственные числа таковы: М =680,40; >-2 = 6,50;
Хз=2,86, а соответствующие собственные векторы следующие:
/0,8126 \	/ —0,5454 \	/—0,2054 \
/, = 1 0,4955 j	12 = ( 0,8321 У	13 = ( -0,2491 У
\0,3068/	\ 0,1006/	\ 0,9465/
Убедитесь, что скалярные произведения векторов /,• и 1У равны 0 при /=/=/ и 1 при i=j, =1,2,3.
14.2.	Для данных задачи 14.1 покажите, что матрица нагрузок А на факторы f равна
(0,8126
0,4955
0,3068
—0,5454 0,8321
0,1006
— 0.2054 х /Д/&80.4
—0,2491 ) I о
0,9465/\	0
0
(21,20 —1,39 —0,347 \ 12,92	2,12 —0,421 I;
8,0	0,256	1,60/
,	0,81	, 0,50	, 0,31
/ j --------_	-------^2 "4“' . - . _ 2л
д^80,4	V680.4	V680-4
= 0,031 0z, -J- 0,0192z2 + 0,0119z3;
—0,55 тД5
. О-1
z2 + -7=-\^5
4
2з =
= — 0,2157г, +0,3255z24-0,0392z3;
378
= —0,1243z( — 0,1 479z2 + 0.5621 z3.
Убедитесь, что ft, ft и ft не коррелированы между собой и имеют дисперсии, равные 1.
14.3.	Полагая матрицу Д равной матрице S задачи 14.1, убедитесь, что: а) след матрицы Д
f, (Д) = 1гД = Х|+Л2 + Х3;
б)	эвклидова норма матрицы Д
^2(Д) = д/^ + Н + ^
в)	определитель матрицы Д
!з
Указание Используйте данные задачи 14.1.
14.4.	Покажите, что tr Д в примере 14.1 достигает минимума тогда, когда достигают минимума по fc, каждая из дисперсий разностей г,-—bff\.
14.5.	Покажите, исходя из задачи 14.1 и 14.4, что cov (z,fi) равна 0,8126 cov (ZtZi) + 0,4955 cov (ziz2) + 0,3061 cov (ziz3), где cov(z,z() находятся в i-м столбце матрицы S, a bi =0,805, i2 = =0,493 и fc3=0.310.
14.6.	Покажите, что относительные ошибки воспроизводимости наблюдений zi, z2, z3 в задаче 14.1 по первому фактору равны соответственно 6i= 1 %, 62 = 2 % и 63 = 4 %.
14.7.	Покажите, что из условий Alf = 0, 7Ие = 0, MFF' = 1т, Мее' = It и Z=AF+ Уе, гдеF — случайный вектор-стопбец размера т; Z и е — случайные вектор-столбцы размера k\ Ii — единичные матрицы размера I, А — матрица размера &Хм; V — диагональная матрица размера feXfe, следует, что: 1) MZ= = 0 и 2) MZZ' = AA' + V2.
14.8.	Проверьте, что при любом угле а матрица
£ _ / cos a sin с\ \—sin a cos а/
ортогональна, т. е. LL' = L'L = I2.
14.9.	Покажите, что если:
а) выборочная ковариационная матрица £=— ZZ', где элементы матрицы Z
ZU=*u-^
379
6)0- диагональная матрица с элементами на диагонали где ои — диагональные элементы £, то выборочная корреляционная матрица il = DS.D
Покажите также, что корреляционная матрица, полученная по ковариационной из задачи 14.1. равна
(1,000	0,9740	0,9726 \
0,9740 1,0000 0,9655 ] 0,9726 0,9655 1,0000/
14.10.	Используя подход §9 2, покажите, что при п->оо ( 2хз \
доверительный интервал для ?-3 е N I Х3,-р I при уровне зна-
чимости а равен
Убедитесь в эквивалентности доверительного интервала, найден-
ного в этой задаче при п-хю, доверительным интервалам
полученным другими методами. Путем прямых расчетов для п = = 19,33, 51 покажите, что последний интервал — самый большой (возьмите а = 0,05).
14.11.	Покажите, что для факторной модели
г, = 0.5/, +0,8f2 +0,33с,, г2 = 0,8/, + 0,3/2 + 0,51Е2. г3 = 0,6/, 4-0,6f2 + 0,53e3,	z4=0,7f, +0,4f2 + 0,59e4.
z5 =0,7/,-)-0,7/2 4-0,14e5
ковариационная матрица и корреляционная матрица совпадают
и равны (оставьте только два знака после запятой)						
	1	0,64	0.78	0,67	0,91 1	
	0,64	1	0.66	0,68	0,77	
И=	0,78	0,66	1	0,66	0,84	
	0,67	0,68	0,66	1	0,77	
	0,91	0,77	0,84	0,77	1 |	
убедитесь, что Л=АА'-|-У2.
380
ПРИЛОЖЕНИЯ
1.	Решение некоторых задач
Задача 6.11. Для У(1)=д06*+Д16/-1+0261-2, где Mg( = 0, D£t = = о2, a cov (E(£(+i)=0 (1#=0), имеем cov (У (1), У (l+i))=cov ((a06i + +ai6*-i +*1261-2), (ao6<+.+ai6<+i-1 +«261+1-2)).
Так как cov (X, У) = М [(X — ах) (У—ду)], то найдем вначале М [У (/+/)]. Из свойств математического ожидания следует, что А4У (1+i)= М (До6*+* +* а16*+• — i + “.261+1—2) = ao^46i+* +fli^6i+.J !-f-+ Д2А4^ + (_2 = 0.
Теперь для определения cov (У (<), У (<+i)) нужно найти среднее произведения (Oo6*+ai6*-i 4-Д261-2) (До6*+.+aiE*+*—1 + а2б1+*—2)= —До6<6<+<+аоД16<6<+( -1 + 00*126161+1-2 + Д1До6<- i Б*+* +* а?6*Б*+* +* + Д|Д2$<— l£( + i-2 + a2ao6l-26/ + i + a2al6<-2&<-26< + l-l +«2б<-2б(-Ц-2-
Рассмотрим следующие случаи: а) 1 = 0; 6)1=1; в) 1= — 1, г) i=— 2; д) 1 = 2; е) 111 >2.
а)	При 1=0 все слагаемые, кроме Доб2, Д?62-1, 0261-2, содержат произведения случайных величин 6 с различными индексами. Все онн равны 0 из-за некоррелированности случайных величин 6 в разные моменты времени. Отсюда, учитывая, что DY (l)=cov (У (1), У(<)), имеем
D У (0=(«? + о?+а2) ^5? -= («£ + а?+of) о2-
б)	При 1=1 слагаемые dofli6i6*+i-i и а1аг6/—16*+*—2 содержат произведения величин 6, полученных в одни и те же моменты времени. Из за некоррелированности только их математические ожидания отличны от 0 и равны соответственно доД1С2 и Д]Д2а2, поэтому
cov (У (1). У (< + 1))=(ДрД| +а|Д2) о2.
в)	При 1= — 1 только средние величины слагаемых Д/Доб* -16<+* и ДгД16*-2б*+/-1 отличны от 0 и сумма их равна (Д0Д1+Д1Д2) о2.
Остальные случаи рассматриваются аналогично.
Задача 6.12. Так как Afg,=O, то и МУ (<)=0. Отсюда им°ем / оо	оо	\
cov(y(o, y(i+s»=M ( £ дг_. £ «'Х+*-/)
\<=о	/-0	/
Условимся считать, что s>0. Так как произведение сумм — это сумма произведений д‘Б«. ,д'6*+5-/, a m 0 отличны только средние тех произведений, для которых t — i = t s—j, т. е. j—i=s или / = s-|-i, то при ; = s-|-i
cov (У (1), У(1+д))= £
i=0
381
Такнг обоазом.
cov (У (О, Y(t+s))= £ rfrf+sAfg/_^+s_s_l.= i=0
со _ -	оо
=as У di‘M^_l=as<j2 у a2i Из неравенства |д|<1 следует, что -=о
сумма ряда с членами (д2)' сходится и равна ———, поэтому
1 —д'
J 2
cov^(0, У(/+.<))=—-.
1 —д
Из симметрии ковариаций следует, что
д|5|о2
cov(У(/), У(/-д))=
для положительных и отрицательных s.
Из известного равенства (s = 0) cov(У (/), У(Z-f-s))= DY(/) сле-о2
дует, что DY (<)=-----— для любого t, откуда, по определению корре-
1 — а2
ляцнонной функции,
р ст (У (Ц У -\lDY(f) DY(t+s)
так как DY (/)= DY (/-J-s), a
2
cov (У (/), У (/ + s;)=fl|s|-
Задача 8.5. Для доказательства нужно найти: а) дисперсию оценки; б) нижнюю границу дисперсии из неравенства Рао—Крамера — и показать, что оии равны
а)	Для случайной величины X, распределенной по закону Пуассона, известно, чтоЛ1Х = 0 и DX=&. Используя свойства математического ожидания и дисперсии для независимых случайных величин, имеем
н
пе=Д п
382

б)	Найдем теперь функцию правдоподобия:
Логарифмируя по основанию е, имеем
I (0)= — 1п Ц ХЛ X Xi 1П е — "е‘
1 V
Вторая производная равна-----> X.; найдем ее математическое
е .= 1
ожидание (аналогично п. а):
л
м/"(0)=—V У МХ(=—Ьпе=-" о2	е2 е
t—1
Из неравенства Рао — Крамера для несмещенных оценок следует, 10	—.
что ---------—— -=—. Но дисперсия S' как раз и равна 0/п, поэто-
— Ml" (0)	п
му улучшить несмещенную оценку нельзя.
Задача 8.8. Решим только первую часть задачи (вторая решается аналогично).
Рассмотрим при x2>-xi следующие три области: Д|=]—oo.xj, Д2 = [Х1, х2] и Д3 = ]х2, оо[. Для области Д] функция
|Xj — 0| + |х2— 0| = —0+Х| +(— 0+х2)=(Х| +х2) 20
и тем меньше, чем больше 0. Для области А2 функция |xi —0| + |х2 — — 0| =0—xt+x2 — 0 —Xi+x2 не зависит от 0. Наконец, для обчастн Дз, где 0>xi и 0>x2, т. е. х, — 0<О и х2 —0<О, эта функция равна |xi—0|+|х2 — 0|=0 — Х1Ц-0 — х2=20 — (X) +х2) н тем меньше, чем меньше 0. Поэтому минимум функции достигается в любой точке отрезка [х,, х2].
Вторая часть задачи для Х|<х2<Хз решается аналогично, но следует рассмотреть четыре области, т. е. Д1 = ]—оо,Х|[, Д2=[Х|, х2], Дз = [х2, хз] и Д4 —]х3. оо[, объединение которых дает всю числовую прямую *).
В области Д1 функция равна xi+x2+x3 — 30; в области Д2, она равна х3+х2—Xi — 0, в области Д3 она равна Хз—Xi—х2-)-0; в области At функция равна 30 — (xi+х2+хз), т е. состоит из кусков прямых линий, проходящих через точки (xi, хз+х2—xi), (х2, Хз—х2) И (х3, х3—х2 —Х|).
*) В силу непрерывности функции |Х|— 01 + |х2—01 + 1х3 — 0| точка х2 может входить в два отрезка Д| и Д3; аналогично, точки Xi и х3 можно включить в отрезки Д| и Д4.
383
Задача 8.9. Рассмотрим границы областей в полуплоскости (0, о), в которых функция отличается от 0. Для точки X, эти границы состоят из пары прямых 6 — о=х, и 0-f-o = xj. т. е. о = 0— xt и о=х,— 6. Отсюда область, соответствующая неравенствам 0 — o=ajx, и O-f-o^ 5=хь представляет собой внутренность прямого угла с началом в тоь ке (х„ 0), поскольку точка (0, о)=(х„ |х;|) удовлетворяет двум неравенствам. Для нескольких точек xt (i — 1,2,...) следует найти пересечение всех прямоугольных областей. Это пересечение представляет собой также внутренность прямого угла, координаты начала которого определяются крайними точками из х,-, i= 1, 2, .... т. е. точками max х.
i
и min х;, так как продолжение луча одной из сторон области проходит i
через точку (min х 0), а продолжение другой — через точку (max хр 0) i	i
под углами л/4 и Зл/4. Вершина равнобедренного прямоугольного треугольника с основанием на оси абсцисс и является точкой пересе-ченияпрямыхо = тах х,— 0ио = 0 — min х(,т е. решением системы двух i	I
уравнений
f 0-|-о = тах х^
| 0 — o = min xf
с двумя неизвестными о и 0. Следовательно, решения
max Xj-J-min xt	тахх,- — minx;
Функция (1/2о)" растет при убывании о, поэтому она достигает в точке (0, о) максимума.
Задача 9.4. Так как для заданной выборки Х = 0,683, то о2 = = 1,499 представляет собой несмещенную опенку дисперсии. Теперь имеем
J(n —l)^2 %£(«-•) ^ " Х₽ ("-!)’
при п = 4 р = 0,025, 9 = 0,975 в первом случае и р = 0,01 и д = 0,96 во втором. Из таблиц распределения с тремя степенями свободы получаем. Xoto25 (3)—9,3, /0.975 (3) = 0,216,	= (3)= 11,3 и
Хо ng (3) = 0,30. Отсюда в первом случае имеем
_ 3-1,499	,< 3-1,499 _
и.з " " 0.216
20,8,
во втором случае
0,398=^1^0^2^1= 15.0.
11,3	0,30
Итак, второй интервал короче.
Задача 9.6. Для сравнения нескольких доверительных интервалов, полученных разными методами для одной и той же выборки.
384
приведем их к одному виду:
й2Х, (л)<о2<а2К2(л),
где для несмещенного доверительного интервала множители Kt (л) и Кг (л) можно найти из таблиц; для доверительного интервала с границами-квантилями р = а./2 и q= I —tx/2, взятыми из распределения с п—1 степенями свободы, множители для границ находят по формулам (л — 1)/Хр (л — 1) и (л — 1)/х^ (л —1). Для приближенного доверительного интервала, полученного для л—>оо, множители границ определяются соотношениями
da/2	at-а/1
K.(n)=^Lc^ и к2(п)=^±е	,
л	л
2 л — 1 Л2 которые следуют из того, что s =----о .
п
Вычислим теперь множители Kt (л) и Кг (л) для всех случаев и объединим их в следующую таблицу.
Число наблюдений	Граница	Метод вычисления		
		точный	для p — a/'i — 0,025	приближенный
4	Нижняя	0,268	0,3209	0,188
	Верхняя	10,127	13,889	2,999
20	Нижняя	0,560		
	Верхняя	2,050		
40	Нижняя		0,671	
	Верхняя		1,649	
80	Нижияя	0,743	0,749	0,724
	Верхняя	1,391	1,403	1,346
Для л = 4 задача уже решена (см. решение задачи 9.4). Для л = = 80 решение приводится, остальные случаи предлагаем рассмотреть самостоятельно.
Из таблицы следует, что приближенный доверительный интервал для дисперсии сходится с ростом объема выборки л к точному очень медленно, поэтому использовать приближенные доверительные интервалы следует очень осторожно — они могут давать ложное уменьшение длины доверительного интервала. Другими словами приближенный доверительный интервал дает искаженное представление о надежности выводов.
Рассмотрим, как получить приближенный доверительный интервал для неизвестной дисперсии. Обозначим дисперсию через 6. Если
385
у распределения существуют центральные моменты четвертого порядка, то состоятельной и асимптотически нормальной оценкой для дисперсии является второй центральный выборочный момент m2 = s2. Для этой оценки известно (см. табл. 8.1), что Ms2 = 6, a Ds* = — — (р4 — б2 — 4р!ц3-|-4р]6). Для нормального распределения
Ps2=3e2—е2,
in 0	<
поскольку р3 = Р1=0, а рч = 302. Поэтому g(6)=---и
1	1п 0	1
— in s2 + da/2/^<—In s2 + dt_a/2/-^n.
Умножая на и возводя е в степень, равную всем частям неравенства, получаем ответ на поставленный вопрос.
Задача 10.3. Рассмотрим случай п = 2 (остальные случаи аналогичны).
Теперь <р (х)=—(|Х( —а| + |х2 —а|); исследуем границу области
<р(х)^с, т. е функцию |Х] — а\ + |х2 — а\ =2с, где с>0, если |х2 — — а\=2с—|xi—а\. Ясно, что при любом с>0 имеем |xi—а|^2с, иначе |х2 — а\ становится отрицательной, что невозможно. Аналогично, |х2— а \ ^2с. Отсюда следует, что область определения и область значений функции х2 от аргумента xt ограничены.
Перенесем начало координат в точку (а, а), т. е. обозначим yt = =xi—а и у2=х2—а. Имеем |i/2|=2c— |i/il. Рассмотрим случай, когда у2 положителен, т. е. 0^у2^2с. Теперь у2 = 2с— |t/i|, т. е. при yt >0 имеем прямую линию у2 = 2с — уи а при у\ <0 — прямую у2 = = 2c-j-yt Для ys<ZO рассуждения аналогичны. Все четыре прямые проходят последовательно через пары точек At=(O, 2с), А2 = (2с, 0), Аз = (0,—2с) и Л4 = (— 2с, 0), и неравенство \yt | Ц- |i/2( ^2с выполняется при yi=y2 = 0. Следовательно, область |t/iI + |t/2| ^2с образует квадрат около начала координат с диагоналями длины 4с. проходящими вдоль координатных осей; область |xi—д| + 1х2 — а| 2с такая же, но имеет центр в точке (а, а).
Задача 10.4. Перенесем, как и в задаче 10.3, начало координат в точку (а, а,.... а), т. е. выполним преобразование у,=х, — а и рассмотрим случай п = 2. Определим, что представляет собой граница множества <р(х)^с при с неотрицательном, т. е. найдем у2 — функцию c = max|t/J, заданную неявным образом. Пусть вначале значение I
функции у2> 0, а у, — такой аргумент, что |t/il<c. Равенство c = max|i/(| выполняется при любых yi таких, что |t/tl <с, поэтому i
уг = С', для </2<0 аналогично получаем, что у2 =—с при любых yi таких, что |t/tl<c. Прн ly2l<Zc У\ = ±с. Следовательно, граница множества <р(«/)^с представляет собой квадрат с центром в начале координат и сторонами, параллельными координатным осям. Прн этом стороны равны 2с.
Множество q>(x)^c, где x,=i/,+a также квадрат (для п>2 — куб) с центром в точке (а, а) н сторонами, параллельными осям и равными 2с.
386
2. Нормальное распределение
Плотность вероятности нормированного нормального распределения
е-*2/2
X 0123456789
0,0 0,1 0,2 0,3 0,4 0.5 0,6 0,7
0,8 0,9 1,0 1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9 2,0 2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9 3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8 3,9
4,0
0,39894	39892	39886	39876	39862	39644	39822	39797	39767	39733
39695	39654	39608	39559	39505	39448	39387	39322	39253	39181
39104	39024	38940	38853	38762	38667	38568	38466	38361	38251
38139	38023	37903	37780	37654	37524	37391	37255	37115	36973
36827	36678	36526	36371	36213	36053	35889	35723	35553	35381
35207	35029	34849	34667	34482	34294	34105	33912	33718	33521
33322	33121	32918	32713	32506	32297	32086	31874	31659	31443
31225	31006	30785	30563	30339	30114	29887	29659	29430	29200
28969	28737	28504	28269	28034	27798	27562	27324	27086	26848
26609	26369	26129	25888	25647	25406	25164	24923	24681	24439
24197	23955	23713	23471	23230	22988	22747	22506	22265	22025
21785	21546	21307	21069	20831	20594	20327	20121	19886	19652
19419	19186	18954	18724	18494	18265	18037	17810	17585	17360
17137	16915	16694	16474	16256	16038	15822	15608	15395	15183
14973	14764	14556	14350	14146	13943	13742	13542	13344	13147
12952	12758	12566	12376	12188	12001	11816	11632	11450	11270
11092	10915	10741	10567	10396	10226	10059	09893	09728	09566
09405	09246	09089	08933	08780	08628	08478	08329	08183	08038
07895	07754	07614	07477	07341	07206	07074	06943	06814	06687
06562	06438	06316	06195	06077	05959	05844	05730	05618	05508
05399	05292	05186	05082	04980	04879	04780	04682	04586	04491
04398	04307	04217	04128	04041	03955	03871	03788	03706	03626
03547	03470	03394	03319	03246	03174	03103	03034	02965	02898
02833	02768	02705	02643	02582	02522	02463	02406	02349	02294
02239	02186	02134	02083	02033	01984	01936	01888	01842	01797
01753	01709	01667	01625	01585	01545	01506	01468	01431	01394
01358	01323	01289	01256	01223	01191	01160	01130	01100	01071
01042	01014	00987	00961	00935	00909	00885	00861	00837	00814
00792	00770	00748	00727	00707	00687	00668	00649	00631	00613
00595	00578	00562	00545	00530	00514	00499	00485	00470	00457
00443	00430	00417	00405	00393	00381	00370	00358	00348	00337
00327	00317	00307	00298	00288	00279	00271	00262	00254	00246
00238	00231	00224	00216	00210	00203	00196	00190	00184	00178
00172	00167	00161	00156	00151	00146	00141	00136	00132	00127
00123	00119	00115	00111	00107	00104	00100	00097	00094	00090
00087	00084	00081	00079	00076	00073	00071	00068	00066	00063
00061	00059	00057	00055	00053	00051	00049	00047	00046	00044
00042	00041	00039	00038	00037	00035	00034	00033	00031	00030
00029	00028	00027	00026	00025	00024	00023	00022	00021	00021
00020	00019	00018	00018	00017	00016	00016	00015	00014	00014
00013	00009	00006	00004	00002	00002	00001	00001	00000	00000
387
3. Нормальное распределение
Функция распределения нормированного нормального распределения . * ф(х)=—1— t e“'2/2d/
х 0	12	3	4
5	6	7	8	9
0,0 0,50000 50399 50798 51197 51595 0,1 53983 54380 54776 55172 55567 0,2 57926 58317 58706 59095 59483 0,3 61791 62172 62552 62930 63307 0,4 65542 65910 66276 66640 67003 0,5 69146 69497 69847 70194 70540 0,6 72575 72907 73237 73565 73891 0,7 75804 76115 76424 76730 77035 0,8 78814 79103 79389 79673 79955 0.9 81594 81859 82121 82381 82639 1,0 84134 84375 84614 84850 85083 1.1 86433 86650 86864 87076 87286 1,2 88493 88686 88877 89065 89251 1.3 90320 90490 90658 90824 90988 1,4 91924 92073 92220 92364 92507 1,5 93319 93448 93574 93699 93822 1,6 94520 94630 94738 94845 94950 1,7 95543 95637 95728 95818 95907 1,8 96407 96485 96562 96638 96712 1,9 97128 97193 97257 97320 97381 2,0 97725 97778 97831 97882 97932 2,1 98214 98257 98300 98341 98382 2,2 98610 98645 98679 98713 98745 2,3 98928 98956 98983 99010 99036 2,4 99180 99202 99224 99245 99266 2,5 99379 99396 99413 99430 99446 2,6 99534 99547 99560 99573 99585 2,7 99653 99664 99674 99683 99693 2,8 99744 99752 99760 99767 99774 2,9 99813 99819 99825 99831 99836 3,0 99865 99869 99874 99878 99882 3,1 99903 99906 99910 99913 99916 3,2 99931 99934 99936 99938 99940 3,3 99952 99953 99955 99957 99958 3,4 99966 99968 99969 99970 99971 3,5 99977 99978 99978 99979 99980 3,6 99984 99985 99985 99986 99986 3,7 99989 99990 99990 99990 99991 3,8 99993 99993 99993 99994 99994 3.9 99995 99995 99996 99996 99996 4,0 99997 99998 99999 99999 99999
51994 52392 52790 53188 53586 55962 56356 56749 57142 57535 59871 60257 60642 61026 61409 63683 64058 64431 64803 65173 67364 67724 68082 68439 68793 70884 71226 71566 71904 72240 74215 74537 74857 75175 75490 77337 77637 77935 78230 78524 80234 80511 80785 81057 81327 82894 83147 83398 83646 83891 85314 85543 85769 85993 86214 87493 87698 87900 88100 88298 89435 89617 89796 89973 90147 91149 91308 91466 91621 91774 92647 92786 92922 93056 93189 93943 94062 94179 94295 94408 95053 95154 95254 95352 95449 95994 96080 96164 96246 96327 96784 96856 96926 96995 97062 97441 97500 97558 97615 97670 97982 98030 98077 98124 98169 98422 98461 98500 98537 98574 98778 98809 98840 98870 98899 99061 99086 99111 99134 99158 99286 99305 99324 99343 99361 99461 99477 99492 99506 99520 99598 99609 99621 99632 99643 99702 99711 99720 99728 99736 99781 99788 99795 99801 99807 99841 99846 99851 99856 99861 99886 99889 99893 99896 99900 99918 99921 99924 99926 99929 99942 99944 99946 99948 99950 99960 99961 99962 99964 99965 99972 99973 99974 99975 99976 99981 99981 99982 99983 99983 99987 99987 99988 99988 99989 99991 99992 99992 99992 99992 99994 99994 99995 99995 99995 99996 99996 99996 99997 99997
388
'	4. -/^-распределение
Значения х2 соответствующие вероятности р = Р {/^> х» р1. где х» имеет х2_распределенне с v степенями свободы
V	Р							
	0,99	0,95	0,90	0,50	0,25	0,10	0,05	0,025 0,01 0,005 0,001
1	0,0002	0,004	0,02	0,46	1,32	2,71	3,84	5,02 6,63 7,88 10,8
2	0,02	0,10	0,21	1,39	2,77	4,61	5,99	7,38 9,21 10,6 13,8
3	0,12	0,35	0,58	2,37	4,11	6,25	7,81	9,35 11,3 12,8 16,3
4	0,30	0,71	1,06	3,36	5,39	7,78	9,49	11,1 13,3 14,9 18,5
5	0,55	1,15	1,61	4,35	6,63	9,24	11,1	12,8 15,1 16,7 20,5
6	0,87	1,64	2,20	5,35	7,84	10,6	12,6	14,4 16,8 18,5 22,5
7	1,24	2,17	2,83	6,35	9,04	12,0	14,1	16,0 18,5 20,3 24,3
8	1,65	2,73	3,49	7,34	10,2	13,4	15,5	17,5 20,1 22,0 26,1
9	2,09	3,33	4,17	8,34	11,4	14,7	16,9	19,0 21,7 23,6 27,9
10	2,56	3,94	4,87	9,34	12,5	16,0	18,3	20,5 23,2 25,2 29,6
11	3,05	4,57	5,58	10,3	13,7	17,3	19,7	21,9 24,7 26,8 31,3
12	3,57	5,23	6,30	11,3	14,8	18,5	21,0	23,3 26,2 28,3 32,9
13	4,11	5,89	7,04	12,3	16,0	19,8	22,4	24,7 27,7 29,8 34,5
14	4,66	6,57	7,79	13,3	17,1	21,1	23,7	26,1 29,1 31,3 36,1
15	5,23	7,26	8,55	14,3	18,2	22,3	25,0	27,5 30,6 32,8 37,7
16	5,81	7,96	9,31	15,3	19,4	23,5	26,3	28,8 32,0 34,3 39,3
17	6,41	8,67	10,1	16,3	20,5	24,8	27,6	30,2 33,4 35,7 40,8
18	7,01	9,39	10,9	17,3	21,6	26,0	28,9	31,5 34,8 37,2 42,3
19	7,63	10,1	11,7	18,3	22,7	27,2	30,1	32,9 36,2 38,6 43,8
20	8,26	10,9	12,4	19,3	23,8	28,4	31,4	34,2 37,6 40,0 45,3
21	8,90	11,6	13,2	20,3	24,9	29,6	32,7	35,5 38,9 41,4 46,8
22	9,54	12,3	14,0	21,3	26,0	30,8	33,9	36,8 40,3 42,8 48,3
23	10,2	13,1	14,8	22,3	27,1	32,0	35,2	38,1 41,6 44,2 49,7
24	10,9	13,8	15,7	23,3	28,2	33,2	36,4	39,4 43,0 45,6 51,2
25	11,5	14,6	16,5	24,3	29,3	34,4	37,7	40,6 44,3 46,9 52,6
26	12,2	15,4	17,3	25,3	30,4	35,6	38,9	41,9 45,6 48,3 54,1
27	12,9	16,2	18,1	26,3	31,5	36,7	40,1	43,2 47,0 49,6 55,5
28	13,6	16,9	18,9	27,3	32,6	37,9	41,3	44,5 48,3 51,0 56,9
29	14,3	17,7	19,8	28,3	33,7	39,1	42,6	45,7 49,6 52,3 58,3
30	15,0	18,5	20,6	29,3	34,8	40,3	43,8	47,0 50,9 53,7 59,7
5. Распределение Стьюдента
Значения Л 4, соответствующие вероятности ^ = Р(| |> С J, где случайная величина С имеет распределение Стьюдента с v степенями свободы
V	Ч							
	0,2	0,1	0,05	0,02	0,01	0,005	0,002	0,001
1	3,08	6,31	12,71	31,82	63,66	127,32	318,30	636,61
2	1,89	2,92	4,30	6,96	9,92	14,09	22,33	31,60
3	1,64	2,35	3,18	4,54	5,84	7,45	10,21	12,92
4	1,53	2,13	2,78	3,75	4,60	5,60	7,17	8,61
5	1,48	2,02	2,57	3,36	4,03	4,77	5,89	6,87
389
Продолжение
Ч
	0,2	0,1	0,05	0,02	0,01	0,005	0,002	0,001
6	1,44	1,94	2,45	3,14	3,71	4,32	5,21	5,96
7	1,41	1,89	2,36	3,00	3,50	4,03	4,79	5,41
8	1,40	1,86	2,31	2,90	3,36	3,83	4,50	5,04
9	1,38	1,83	2,26	2,82	3,25	3,69	4,30	4,78
10	1,37	1,81	2,23	2,76	3,17	3,58	4,14	4,59
11	1,36	1,80	2,20	2,72	з,п	3,50	4,02	4,44
12	1,36	1,78	2,18	2,68	3,05	3,43	3,93	4,32
13	1,35	1,77	2,16	2,65	3,01	3,37	3,85	4,22
14	1,34	1,76	2,14	2,62	2,98	3,33	3,79	4,14
15	1,34	1,75	2,13	2,60	2,95	3,29	3,73	4,07
16	1,34	1,75	2,12	2,58	2,92	3,25	3,69	4,02
17	1,33	1,74	2,Н	2,57	2,90	3,22	3,65	3,97
18	1,33	1,73	2,10	2,55	2,88	3,20	3,61	3,92
19	1,33	1,73	2,09	2,54	2,86	3,17	3,58	3,88
20	1,33	1,72	2,09	2,53	2,85	3,15	3,55	3,85
21	1,32	1,72	2,08	2,52	2,83	3,14	3,53	3,82
22	1,32	1,72	2,07	2,51	2,82	3,12	3,51	3,79
23	1,32	1,71	2,07	2,50	2,81	3,10	3,48	3,77
24	1,32	1,71	2,06	2,49	2,80	3,09	3,47	3,75
25	1,32	1,71	2,06	2,49	2,79	3,08	3,45	3,73
26	1,32	1,71	2,06	2,48	2,78	3,07	3,44	3,71
27	1,31	1,70	2,05	2,47	2,77	3,06	3,42	3,69
28	1,31	1,70	2,05	2,47	2,76	3,05	3,41	3,67
29	1,31	1,70	2,05	2,46	2,76	3,04	3,40	3,66
30	1,31	1,70	2,04	2,46	2,75	3,03	3,39	3,65
40	1,30	1,68	2,02	2,42	2,70	2,97	3,31	3,55
60	1,30	1,67	2,00	2,39	2,66	2,91	3,23	3,46
120	1,29	1,66	1,98	2,36	2,62	2,86	3,16	3,37
ОО	1,28	1,64	1,96	2,33	2,58	2,81	3,09	3,29
6. F-распределение
Значения Fni „г р, соответствующие вероятности р — P{Fni„2>
Рщ П2 р}, где случайная величина Fni „2 имеет ^-распределение с nt и п2 степенями свободы
р = 0,05
\ «1	1	2	3	4	5	6	8	12	24	ОО
1	161,4	199,5	215,7	224,6	230,2	234,0 238,9		243,9 249,0 254,3		
2	18,51	19,00	19,16	19,25	19,30	19,33	19,37	19,41	19,45	19,50
3	10,13	9,55	9,28	9,12	9,01	8,94	8,84	8,74	8,64	8,53
4	7,71	6,94	6,59	6,39	6,26	6,16	6,04	5,91	5,77	5,63
5	6,61	5,79	5,41	5,19	5,05	4,95	4,82	4,68	4,53	4,36
390
Продолжение

	\ «1 пг\	1	2	3	4	5	6	8	12	24	ОО
	6	5,99	5,14	4,76	4,53	4,39	4,28	4,15	4,00	3,84	3,67
	7	5,59	4,74	4,35	4,12	3,97	3,87	3,73	3,57	3,41	3,23
	8	5,32	4,46	4,07	3,84	3,69	3,58	3,44	3,28	3,12	2,93
	9	5,12	4,26	3,86	3,63	3,48	3,37	3,23	3,07	2,90	2,71
	10	4,96	4,10	3,71	3,48	3,33	3,22	3,07	2,91	2,74	2,54
	11	4,84	3,98	3.59	3,36	3,20	3,09	2,95	2,79	2,61	2,40
	12	4,75	3,88	3,49	3,26	3,11	3,00	2,85	2,69	2,50	2,30
	13	4,67	3,80	3,41	3,18	3,02	2,92	2,77	2,60	2,42	2,21
	14	4,60	3,74	3,34	3,11	2,96	2,85	2,70	2,53	2,35	2,13
	15	4,54	3,68	3,29	3,06	2,90	2,79	2,64	2,48	2,29	2,07
	16	4,49	3,63	3,24	3,01	2,85	2,74	2,59	2,42	2,24	2,01
	17	4,45	3,59	3,20	2,96	2,81	2,70	2,55	2,38	2,19	1,96
	18	4,41	3,55	3,16	2,93	2,77	2,66	2,51	2,34	2,15	1,92
	19	4,38	3,52	3,13	2,90	2,74	2,63	2,48	2,31	2,11	1,88
	20	4,35	3,49	3,10	2,87	2,71	2,60	2,45	2,28	2,08	1,84
	21	4,32	3,47	3,07	2,84	2,68	2,57	2,42	2,25	2,05	1,81
	22	4,30	3,44	3,05	2,82	2,66	2,55	2,40	2,23	2,03	1,78
	23	4,28	3,42	3,03	2,80	2,64	2,53	2,38	2,20	2,00	1,76
	24	4,26	3,40	3,01	2,78	2,62	2,51	2,36	2,18	1,98	1,73
	25	4,24	3,38	2,99	2,76	2,60	2,49	2,34	2,16	1,96	1,71
i-	t 26	4,22	3,37	2,98	2,74	2,59	2,47	2,32	2,15	1,95	1,69
	27	4,21	3,35	2,96	2,73	2,57	2,46	2,30	2,13	1,93	1,67
	28	4,20	3,34	2,95	2,71	2,56	2,44	2,29	2,12	1,91	1,65
Г	29	4,18	3,33	2,93	2,70	2,54	2,43	2,28	2,10	1,90	1,64
	30	4,17	3,32	2,92	2,69	2,53	2,42	2,27	2,09	1,89	1,62
	40	4,08	3,23	2,84	2,61	2,45	2,34	2,18	2,00	1,79	1,52
	L 60	4,00	3,15	2,76	2,52	2,37	2,25	2,10	1,92	1,70	1,39
	| 120	3,92	3,07	2,68	2,45	2,29	2,17	2,02	1,83	1,61	1,25
	№ оо	3,84	2,99	2,60	2,37	2,21	2,09	1,94	1,75	1,52	1,00
			7. Обратное /-преобразование								
Значения величины г для значений г
2	0	1	2	3	4	5	6	7	8	9
0,0	0000	0100	0200	0300	0400	0500	0599	0699	0798	0898
1	0997	1096	1194	1293	1391	1489	1586	1684	1781	1877
2	1974	2070	2165	2260	2355	2449	2543	2636	2729	2821
3	2913	3004	3095	3185	3275	3364	3452	3540	3627	3714
4	3800	3885	3969	4053	4136	4219	4301	4382	4462	4542
5	4621	4699	4777	4854	4930	5005	5080	5154	5227	5299
6	5370	5441	5511	5580	5649	5717	5784	5850	5915	5980
7	6044	6107	6169	6231	6291	6351	6411	6469	6527	6584
391
Продолжение
2	0	1	2	3	4	5	6	7	8	9
8	6640	6696	6751	6805	6858	6911	6963	7014	7064	7114
9	7163	7211	7259	7306	7352	7398	7443	7487	7531	7574
1,0	7616	7658	7699	7739	7779	7818	7857	7895	7932	7969
1	8005	8041	8076	8110	8144	8178	8210	8243	8275	8306
2	8337	8367	8397	8426	8455	8483	8511	8538	8565	8591
3	8617	8643	8668	8692	8717	8741	8764	8787	8810	8832
4	8854	8875	8896	8917	8937	8957	8977	8996	9015	9033
5	9051	9069	9087	9104	9121	9138	9154	9170	9186	9201
6	9217	9232	9246	9261	9275	9289	9302	9316	9329	9341
7	9354	9366	9379	9391	9402	9414	9425	9436	9447	9458
8	9468	9478	9488	9498	9508	9518	9527	9536	9545	9554
9	9562	9571	9579	9587	9595	9603	9611	9618	9626	9633
2,0	9640	9647	9654	9661	9668	9674	9680	9686	9693	9699
1	9704	9710	9716	9722	9727	9732	9738	9743	9748	9753
2	9757	9762	9767	9771	9776	9780	9785	9789	9793	9797
3	9801	9805	9809	9812	9816	9820	9823	9827	9830	9834
4	9837	9840	9843	9846	9849	9852	9855	9858	9861	9864
5	9866	9869	9871	9874	9876	9879	9881	9884	9886	9888
6	9890	9892	9894	9897	9899	9901	9903	9904	9906	9908
7	9910	9912	9914	9915	9917	9919	9920	9922	9923	9925
8	9926	9928	9929	9931	9932	9933	9935	9936	9937	9938
9	9940	9941	9942	9943	9944	9945	9946	9947	9948	9949
8. /-преобразование
Значения величины z для значений г
Г	0	1	2	3	4	5	6	7	8	9
0,0	0,0000	0,0100	0,0200	0,0300	0,0400	0,0501	0,0601	0,0701	0,0802	0,0902
0,1	0,1003	0,1105	0,1206	0,1308	0,1409	0,1511	0,1614	0,1717	0,1820	0,1923
0,2	0,2027	0,2132	0,2237 0,2342		0,2448	0,2554	0,2661	0,2769	0,2877	0,2986
0,3	0,3095	0,3206	0,3317	0,3428	0,3541	0,3654	0,3769	0,3884	0,4001	0,4118
0,4	0,4236	0,4356	0,4477	0,4599	0,4722	0,4847	0,4973	0,5101	0,5230	0,5361
0,5	0,5493	0,5627	0,5763	0,5901	0,6042	0,6184	0,6328 0,6475		0,6625	0,6777
0,6	0,6931	0,7089	0,7250	0,7414	0,7582	0,7753	0,7928	0,8107	0,8291	0,8480
0,7	0,8673	0,8872	0,9076	0,9287	0,9505	0,9730	0,9962	1,0203	1,0454	1,0714
0,8	1,0986	1,1270	1,1568	1,1881	1,2212	1,2562	1,2933	1,3331	1,3758	1,4219
0,9	1,4722	1,5275	1,5890	1,6584	1,7380	1,8318	1,9459	2,0923	2 2976	2,6467
9. Границы несмещенных доверительных интервалов для дисперсии в зависимости от числа степеней свободы и надежности
В таблице приведены значения коэффициентов fe/x,{k) и k/Хр (k) при надежности 0,90, 0,95, 0,99 и числе степеней свободы k = 2, 3, ..., 39.
Для получения несмещенных доверительных границ интервалов для оценки дисперсии о2 при нормальном распределении случайных величин в выборке находится несмещенная
392
оценка дисперсии о2, затем эту оценку умножают на коэффициенты. (Пусть по выборке п=10 при неизвестном среднем оценка о2 = 2,87. Здесь число степеней свободы k = 9, а границы доверительного интервала надежности 0,90 таковы, нижняя — 0,498 • 2,87 = 1,429, верхняя — 2,481 • 2,87 = 7,120.)
Число степеней свободы	Надежность					
	0,90		0,95		0,99	
	НИЖНЯЯ граница	верхняя граница	нижияя граница	верхняя граница	НИЖИЯЯ граница	верхняя граница
2	0,254	11,931	0,210	23,606	0,151	114,197
3	0,318	6,297	0,268	10,127	0,198	29,690
4	0,365	4,532	0,312	6,590	0,237	15,154
5	0,402	3,691	0,348	5,054	0,270	9,927
6	0,432	3,201	0,377	4,211	0,297	7,569
7	0,457	2,876	0,402	3,679	0,319	6,239
8	0,479	2,651	0,424	3,314	0,341	5,304
9	0,498	2,481	0,443	3,048	0,360	4,680
10	0,514	2,348	0,460	2,844	0,376	4,243
11	0,529	2,242	0,475	2,683	0,391	3,897
12	0,543	2,153	0,489	2,553	0,405	3,635
13	0,555	2,080	0,502	2,440	0,417	3,424
14	0,566	2,018	0,513	2,354	0,429	3,243
15	0,576	1,965	0,525	2,272	0,440	3,091
16	0,586	1,918	0,534	2,208	0,450	2,961
17	0,594	1,876	0,544	2,147	0,461	2,833
18	0,602	1,839	0,552	2,095	0,470	2,739
19	0,610	1,805	0,560	2,050	0,477	2,664
20	0,617	1,776	0,568	2,006	0,487	2,573
22	0,630	1,725	0,582	1,934	0,501	2,449
24	0,642	1,681	0,594	1,876	0,515	2,342
26	0,653	1,643	0,606	1,824	0,527	2,257
30	0,671	1,584	0,626	1,743	0,548	2,121
34	0,687	1,537	0,642	1,680	0,568	2,009
39	0,703	1,490	0,660	1,618	0,586	1,914
10. Верхние границы несмещенного F-критерия для равенства дисперсий
В таблице приведены лишь верхние границы. Нижняя граница для верхней границы Рт,ь (р) надежности р, если число степеней свободы числителя равно т, а знаменателя — k, равна \/Fk,m(p). (Пусть, например, надежность равна 0,99 и верхняя граница для т = 4 и £=20 равна 6,28; тогда нижняя граница равна 1/6,28 = 0,159.)
393
1 1 394	Число степеней свободы												
К ч OJ							числителя						
те													
о S те X те	2	3	4	6	8	10	12	16	20	24	30	40	60
					Верхняя граница надежности 0,90								
2	18,58	16,25	15,37	14,05	13,45	13,12	12,90	12,65	12,50	12,40	12,30	12,21	12,11
3	10,87	9,29	8,61	7,77	7,37	7,15	7,00	6,82	6,71	6,64	6,57	6,50	6,44
4	8,46	7,13	6,53	5,83	5,50	5,31	5,18	5,02	4,93	4,86	4.80	4,74	4,68
6	6,49	5,39	4,88	4,31	4,03	3,86	3,75	3,62	3,53	3,48	3,42	3,37	3,31
8	5,71	4,71	4,23	3,70	3,44	3,29	3,18	3,05	2,97	2.92	2,87	2,81	2,76
10	5,29	4,34	3,88	3,38	3,13	2,98	2,88	2,75	2,67	2,62	2,57	2,51	2,46
12	5,03	4.11	3,66	3,18	2,93	2,79	2,68	2,56	2,48	2,43	2,37	2,32	2,27
16	4,73	3,84	3,41	2,94	2,70	2,56	2,46	2,33	2,25	2,20	2,15	2,09	2,03
20	4,56	3,69	3,26	2,81	2,57	2,43	2,33	2,20	2,12	2,07	2,01	1,96	1,90
24	4,44	3,60	3,17	2,72	2,49	2,34	2,24	2,12	2,04	1,98	1,93	1,87	1,81
30	4,34	3,50	3,08	2,64	2,40	2,26	2,16	2,03	1,95	1,90	1.84	1,78	1,72
40	4,23	3,41	2,99	2,55	2,32	2,18	2,08	1,95	1,87	1,81	1,75	1,69	1,63
60	4,13	3,32	2,91	2,47	2,24	2,10	2,00	1,87	1,79	1,73	1.67	1,60	1,53
Верхняя граница надежности 0,95
2	35,91	31,84	30,90	27,81	26,54	25 85	25,42	24,92	24,63	24,45	24,27	24,10	23,93
3	17.87	15,34	14,44	12,80	12,08	11,68	11,42	11,11	10,93	10,82	10,70	10,59	10,48
4	12,99	10,95	10,13	8,88	8,31	7,98	7,77	7,51	7,36	7,27	7,17	7,07	6,98
6	9,11	7,53	6,83	5,91	5.48	5,22	5,06	4,85	4,73	4,65	4,57	4,49	4,41
8	7,70	6,29	5,65	4,84	4,46	4,23	4,08	3,89	3,78	3,70	3,63	3,55	3,48
10	6,98	5,66	5,05	4,30	3.94	3,63	3,58	3,40	3,29	3,22	3,15	3,07	3,00
12	6,54	5,28	4,69	3,98	3,73	3,42	3,28	3,10	3,00	2,93	2,85	2,78	2,71
16	6,03	4,84	4,27	3,60	3.27	3,07	2,93	2,76	2,66	2,58	2,51	2,44	2,36
20	5,75	4,60	4.04	3,39	3,07	2,87	2,74	2,57	2,46	2,39	2,32	2,24	2,17
24	5,57	4.44	3,89	3,26	2,94	2,75	2.61	2,44	2,34	2,27	2,19	2,12	2,04
30	"1,40	4,29	3,75	3,13	2,82	2,62	2,49	2,32	2,22	2,14	2.07	2,00	1,91
40	5,23	4,15	3.62	3,01	2,70	2.51	2,38	2.21	2,10	2,03	1,95	1,87	1,79
60	5,07	4,01	3,49	2,89	2,58	2,39	2,26	2,09	1,99	1,91	1,83	1,75	1.66
					Верхняя граница надежности 0,99								
2	159,98	146,99	166,29	136,17	126,76	122,37	119,88	117,22	115,84	115,01	114,24	113,54	112,90
3	52,64	46,65	49,25	40,63	37,60	36,07	35,16	34,13	33,57	33,22	32,88	32,57	32,26
4	33,59	29,21	30,06	24,66	22,64	21,59	20,94	20,20	19,79	19,52	19,27	19,02	18,79
6	18,23	15,27	14,83	12,08	10,95	10,33	9,94	9,48	9,21	9,03	8,86	8,69	8,53
8	13,86	11,40	10,77	8.72	7,84	7,35	7,03	6,65	6,42	6,28	6,13	5,98	5,84
10	11 85	9,63	8.96	7,22	6,45	6,02	5,73	5,39	5,18	5,05	4,91	4,78	4,65
12	10,70	8,64	7,95	6,38	5,68	5,27	5,01	4,68	4,49	4,36	4,23	4,11	3,98
16	9,45	7,55	6,86	5,47	4,84	4,47	4,23	3,93	3,75	3,62	3.50	3,38	3,25
20	8,78	6,98	6,28	4,99	4,40	4,05	3,82	3,53	3.35	3,23	3,11	2,99	2,87
24	8,37	6,62	5,93	4,70	4,13	3,79	3,56	3,28	3,11	2,99	2,87	2,75	2,63
30	7,98	6,29	5,60	4,42	3,87	3,54	3,33	3,05	2,88	2,76	2,64	2,52	2,40
40	7,61	5,97	5,29	4,16	3,63	3,31	3,10	2,83	2,66	2,55	2,43	2,31	2,18
60	7.26	5,67	4,99	3,92	3,41	3,10	2,89	2,62	2,45	2,34	2,22	2,10	1,97
ЛИТЕРАТУРА
1.	Айвазян С. А., Бежаева 3 И., Староверов О. В. Классификация многомерных наблюдений.— М.: Статистика, 1974.
2.	Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Основы моделирования и первичная обработка данньп .— М.: Финансы н статистика, 1983.
3.	Андеосон Т. Статистический анализ временных рядов.— М.: Мир, 1976.
4.	Бокс Дж., Дженкинс Г Анализ временных рядов. Прогноз и управление.— Вып. I, 2. М.: Мир, 1974.
5.	Большее Л. Н.. Смирнов Н. В. Таблицы математической статистики — М.: Наука, 1983.
6.	Боровков А. А. Теория вероятностей.— М.: Наука, 1986.
7.	Ван дер Варден Б Л. Математическая статистика.— М.: ИЛ, I960.
8.	Валтер Я. Стохастические модели в экономике.— М.: Статистика. 1976.
9.	Венцель В. В Интегральная регрессия и корреляция. Статистическое моделирование рядов динамики.— М.: Финансы и статистика, 1982.
10.	Гнеденко Б. В. Курс теории вероятностей.— М.: ГИТТЛ, 1954
II.	Демиденко Е. 3. Линейная и нелинейная регрессия.— М.: Финансы и статистика, 1981
12.	Дрейпер Н.. Смит Г. Прикладной регрессионный анализ.— М.: Статистика, 1973.
13.	Дуб Дж. Л. Вероятностные процессы.— М.: ИЛ, 1956.
14.	Закс Л. Статистическое оценивание.— М.: Статистика, 1976.
15.	Иберла К. Факторный анализ.— М.: Статистика, 1980.
16.	Ито К- Вероятностные процессы.— М: ИЛ, 1960, 1963. Вып. 1, 2.
17.	Кемени Дж.. Снелл Дж. Конечные цепи Маркова.— М.: Наука, 1970.
18.	Кендэл М. Временные ряды — М.: Финансы и статистика, 1981.
19.	Кендэл М., Стюарт А. Статистические выводы и связи.— М.: Наука, 1973.
20.	Кендэл М.. Стюарт А. Теория распределения.— М.: Наука, 1966.
21.	Кильдишев Г. С., Френкель А. А. Анализ временных рядов и прогнозирование.— М.: Статистика, 1973.
396
22.	Колемаев В. А. О математическом обеспечении экономико-статистических исследований и разработок. Ученые записки по статистике.— М : Статистика, 1980. Т. 36.
23.	Колмогоров А. Н. Основные понятия теории вероятностей.— М.: ОНТИ, 1936.
24.	Крамер Г. Математические методы статистики.— М.: Мир, 1975.
25.	Леман Э. Проверка статистических гипотез.— М.: Наука, 1964.
26.	Лоули Д., Максвелл А. Факторный анализ как статистический метод.— М.: Мир, 1967
27.	Лукашин Ю П Адаптивные методы краткосрочного прогнозирования.— М: Статистика, 1979.
28.	Льюис К- Д Методы прогнозирования экономических показателей.— М.: Финансы и статистика, 1986.
29.	Моленво Э. Статические методы эконометрии.— М.: Статистика, 1976.
30.	Прохоров Ю. В., Розанов Ю. А. Теория вероятностей.— М.: Наука, 1987.
31.	Рао С. Р. Линейные статистические методы и их применения.— М.: Наука, 1968.
32.	Розанов Ю. А. Случайные процессы.— М.: Наука, 1971.
33.	Себер Дж. Линейный регрессионный анализ.— М.: Мир, 1980.
34.	Смирнов Н. В., Дунин-Барковский И. В. Краткий курс математической статистики для технических приложений.— Мд Физмат-гиз, 1959.
35.	Тейл Г. Прикладное экономическое прогнозирование.— М.: Прогресс, 1970.
36.	Уилкс С Математическая статистика.— М.: Наука. 1967
37.	Феллер В. Введение в теорию вероятностей и ее приложения.— М.: Мир, 1967.
38.	Фишер Р А Статистические методы для исследователей.— М.: Госстатиздат. 1958.
39.	Харман Г. Современный факторный анализ.— М.: Статисти ка, 1972.
40.	Хенман Э. Анализ временных рядов.— М. Наука, 1964.
41.	Химмельблау Д. Анализ процессов статистическими методами.— М.: Мир. 1973.
42.	Четыркин Е. М. Статистические методы прогнозирования.— М.: Статистика, 1977.
43.	Четыркин Е. М., Ка шхман И. Л. Вероятность и статистика.— М.: Финансы и статистика, 1982.
44.	Чистяков В. П. Курс теории вероятностей.— М.: Наука, 1982.
4Е Шеффе Г. Дисперсионный анализ.— М.: Физматгиз, 1963.
46. Юл Дж Э., Кендэл М. Дж. Теория статистики.— М.: Госстатиздат. i960
ОГЛАВЛЕНИЕ
Предисловие..........................................  3
Введение ............................................. 5
Часть 1. Теория вероятностей
Глава 1.	Вероятностные пространства................. 8
§ 1.1.	Ктассическое определение вероятности...... 8
§ 1.2.	Конечная схема с неравновозможными	исходами	14
§ 1.3.	Исчисление событий....................... 17
§ 1.4.	Аксиоматическое построение теории вероятностей	21
Задачи..................................... 24
Глава 2. Условные вероятности. Последовательности испытаний ...................................................... 26
§ 2.1.	Условньн вероятности................... 26
§ 2.2.	Последовательности испытаний........... 30
Задачи................................... 35
Глава 3.	Случайные величины...................... 36
§ 3.1.	Определение случайной величины и ее функция распределения ........................................... 37
$ 3.2.	Распределения дискретных случайных	величии	43
§ 3.3.	Распределения непрерывных случайных	величин	58
§ 3.4.	Многомерные случайные величины......... 69
§ 3.5.	Функции от случайных величин........... 79
Задачи................................... 96
Глава 4.	Числовые характеристики случайных	величин ...	99
§4.1.	Числовые характеристики центра	группирования	У9
§ 4.2.	Характеристики вариации................114
§ 4.3.	Моменты случайных величин. Характеристики формы распределения........................... ...	.	124
§ 4	4. Числовые характеристики меры связи случайных величии ............................................... 131
Задачи . .	  146
Глава 5.	Предельные теоремы теории	вероятностей ....	148
§ 5.1.	Неравенство Чебышева......................... 148
§ 5.2.	Закон больших чисел.......................... 152
§ 5.3.	Центральная предельная	теорема................156
Задачи..........................................161
398
Глава 6.	Введение в теорию случайных процессов	....	163
§6.1.	Определение случайных процессов........... 163
§6.2.	Цепи Маркова.............................. 166
§6.3.	Характеристики цепей Маркова.............. 169
§ 6.4.	Случайные временные ряды и их	характеристики	176
Задачи......................................181
Часть 2. Математическая статистика
Глава 7, Основные понятия выборочного метода.................185
§ 7.1.	Оценка математического ожидания.................. 189
§ 7.2.	Оценка функции распределения......................193
§ 7.3.	Оценка плотности распределения....................196
Задачи............................................. 199
Глава 8. Точечные оценки параметров распределения . . .	200
§8.1.	Метод моментов.............................200
§ 8.2.	Метод максимального правдоподобия.........206
§ 8.3.	Другие методы оценивания..................215
Задачи......................................219
Глава 9.	Интервальные оценки параметров распределения	222
§ 9.1.	Доверительный интервал для математического ожидания ................................................222
§ 9.2.	Общий подход к доверительному оцениванию .	.	.	226
§ 9.3.	Примеры построения доверительных интервалов на основе общего подхода.............................228
§	9.4.	Свойства доверитечьных интервалов.........232
§	9.5.	Интервальная оценка дисперсии по малой	выборке	234
§	9.6	Интервальная оценка математического ожидания по
малой выборке..............................236
Задачи.....................................238
Глава 10.	Проверка гипотез..................................240
§ 10.1.	Описание гипотез.................................241
§ 10.2.	Критерии проверки гипотез и их свойства ....	243
§ 10.3	Методы построения критериев......................246
§ 10.4.	Проверка гипотез и доверительные интервалы	252
§ 10.5.	Проверка гипотез о равенстве средних и дисперсий	254
§ 10.6.	Критерии согласия................................258
Задачи....................................262
Глава 11.	Корреляционный и регрессионный анализ. . . .	265
§ 11.1.	Введение в корреляционный анализ.................266
§ 11.2.	Регрессионные модели как инструмент анализа и
прогнозирования экономических явлений ....	276
§ 11.3.	Парная линейная регрессия........................279
§ 11.4.	Множественная линейная регрессия.................291
§ 11.5.	Особенности практического применения регрессионных моделей.........................................301
Задачи............................................306
399
Глава 12.	Элементе дисперсионного анализа.......308
§ 12.1.	Одиофакторный дисперсионный анапнз	....	308
§ 12.2.	Двухфакторный дисперсионный анализ	....	315
§ 12.3.	Понятие о ковариационном анализе. ....	317
Задачи................................319
Глава 13.	Анализ временных рядов................321
§ 13.1.	Трендовые модели.....................321
§ 13.2.	Выявление тренда в динамических рядах экономических показателей...........................326
§ 13.3.	Нелинейные тренды.......................  .	344
§ 13.4.	Экспоненциальное сглаживание . ..............346
Задачи......................................  353
Глава 14.	Элементы многомерного статистического анализа	354
§ 14.1.	Общие модети многомерного анализа....354
§ 14.2.	Модель и свойства главных компонент..358
§ 14.3.	Модель факторного анализа............364
§ 14.4.	Статчстика модели главных компонент	....	367
§ 14.5.	Статистика модели факторного анализа	....	372
Задачи................................378
Приложения.......................................381
Литература.......................................396
Учебное издание
Колемаев Владимир Алексеевич Староверов Олег Васильевич Туруидаевский Виктор Борисович ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Зав. редакцией Е. С. Гридасова. Редактор Ж. И. Яковлева. Мл редактор Н. П. Майкова. Художественный редактор В. И. Пономаренко. Технические редакторы Н. В. Яшукова, Г. А. Фетисова. Корректор Г. И. Кострнкова
ИБ № 8568
Изд. № ФМ—961. Сдано в набор 03.08.89. Ппдп. в печать 20.11.90. Формат 84Х108‘/зг. Бум. тип. № 2. Гарнитура литературная. Печать высокая Объем 21,00 усл. печ. л. 21,00 усл. кр.-отт. 21,82 уч.-изд. л. Тираж 91 000 экз. Зак. № 281 Цена 1 р. 90 к.
Издательство жВысшая школа», 101430, Москва, ГСП-1 Неглннная ул., д. 29/14
Ордена Октябрьской Революции, ордена Трудового Красного Знамени Ленинградское производственно техническое объединение < Печатный Двор» имени А. М Горького при Госкомпеча.и СССР 197136, Ленинград. П-136, Чкаловский пр,, 15