/
Author: Кобзарь А.И.
Tags: теория вероятностей и математическая статистика теория вероятностей математическая статистика комбинаторный анализ теория графов математика
ISBN: 5-9221-0707-0
Year: 2006
Text
УДК 519.22
ББК 22.172
К 55
Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных
работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с. - ISBN 5-9221-0707-0.
В книге рассматриваются способы анализа наблюдений методами математической ста-
статистики. Последовательно на языке, доступном специалисту — не математику, излагаются
современные методы анализа распределений вероятностей, оценки параметров распределений,
проверки статистических гипотез, оценки связей между случайными величинами, плани-
планирования статистического эксперимента. Основное внимание уделено пояснению примеров
применения методов современной математической статистики.
Книга предназначена для инженеров, исследователей, экономистов, медиков, аспирантов
и студентов, желающих быстро, экономично и на высоком профессиональном уровне исполь-
использовать весь арсенал современной математической статистики для решения своих прикладных
задач.
© ФИЗМАТЛИТ, 2006
ISBN 5-9221-0707-0 © А. И. Кобзарь, 2006
Посвящаю моей жене,
терпению которой
обязана эта книга
СОДЕРЖАНИЕ
О математической статистике и об этой книге ........................... 13
Глава 1. Распределения вероятностей случайных величин ........... 23
1.1. Непрерывные распределения ................................... 24
1.1.1. Нормальное распределение B4). 1.1.2. Равномерное распределение C4).
1.1.3. Логарифмически нормальное распределение C5). 1.1.4. Экспоненциаль-
Экспоненциальное распределение C6). 1.1.5. Распределение Вейбулла C7). 1.1.6. Гамма-
распределение C8). 1.1.7. Бета-распределение C9). 1.1.8. Распределение х2
(распределение Пирсона) D4). 1.1.9. Распределение Стьюдента (?-распределе-
ние) E1). 1.1.10. Распределение Фишера (F-распределение) E6). 1.1.11. Усе™
ченное нормальное распределение F1). 1.1.12. Распределение модуля слу-
случайной величины, распределенной нормально F2). 1.1.13. Распределение,
порождаемое нормальной плотностью с линейным дрейфом среднего F4).
1.1.14. Распределение, порождаемое нормальной плотностью с линейным дрей-
дрейфом среднеквадратического отклонения F5). 1.1.15. Распределение Рэлея F8).
1.1.16. Распределение Максвелла F8). 1.1.17. Распределение экстремального
значения G0). 1.1.18. Треугольное распределение (распределение Оимпсо-
на) G1). 1.1.19. Распределение Коши G2). 1.1.20. Логистическое распреде-
распределение G3). 1.1.21. Распределение Парето G3). 1.1.22. Композиции законов
распределения вероятностей случайных величин, возникающие при расчете на-
надежности по схеме „нагрузка-напряжение" G4). 1.1.23. Нецентральное распре-
распределение Стьюдента (нецентральное ^-распределение) G9). 1.1.24. Нецентраль-
Нецентральное распределение Пирсона (нецентральное распределение хи-квадрат) (80).
1.1.25. Нецентральное распределение Фишера (нецентральное ^-распределе-
^-распределение) (81).
1.2. Дискретные распределения .................................... 84
1.2.1. Биномиальное распределение (распределение Бернулли) (84). 1.2.2. Рас-
Распределение Пуассона (88). 1.2.3. Отрицательное биномиальное распределе-
распределение (90). 1.2.4. Распределение Паскаля (91). 1.2.5. Геометрическое распре-
распределение (распределение Фарри) (92). 1.2.6. Гипергеометрическое распределе-
распределение (92).
Глава 2. Оценка параметров распределений вероятностей ........... 96
2.1. Оценка параметров нормального распределения ..................... 98
2.1.1. Оценка среднего значения (/л) (98). 2.1.1.1. Точечные оценки (98).
2.1.1.1.1. Оценка максимального правдоподобия (98). 2.1.1.1.2. Оценка с помо-
помощью медианы (98). 2.1.1.1.3. Оценки с помощью порядковых статистик (98).
2.1.1.1.3.1. Простые оценки Диксона A00). 2.1.1.1.3.2. Оценка Огавы A01).
2.1.1.1.3.3. Оценка Пирсона-Тьюки A01). 2.1.1.1.3.4. Быстрые оценки Ке-
нуя A01). 2.1.1.1.3.5. Оптимальные комплексные оценки, использующие об-
общий набор порядковых статистик A02). 2.1.1.1.3.6. Устойчивая (робастная)
оценка Ходжеса^Демана по средним Уолша A03). 2.1.1.1.4. Упрощенная оцен-
оценка по шаблону A03). 2.1.1.2. Интервальные оценки A05). 2.1.1.2.1. Оценка /i
при известной дисперсии а A05). 2.1.1.2.2. Оценка /х при неизвестной диспер-
дисперсии A06). 2.1.1.2.3. Оценка по выборочному размаху A06). 2.1.1.2.4. Оценка
Содержание
по интерквартильной широте A07). 2.1.1.2.5. Оценка по среднему абсолют-
абсолютному отклонению A07). 2.1.1.2.6. Оценка 50%-го доверительного интервала
по вероятному отклонению A08). 2.1.1.2.7. Интервальная оценка для меди-
медианы A08). 2.1.2. Оценка дисперсии а и стандартного отклонения а A11).
2.1.2.1. Точечные оценки A11). 2.1.2.1.1. Оценка максимального правдо-
правдоподобия A11). 2.1.2.1.2. Оценка а по выборочной дисперсии s A11).
2.1.2.1.3. Оценка сг по среднему абсолютному отклонению A12). 2.1.2.1.4. Оцен-
Оценка а по выборочному размаху A12). 2.1.2.1.5. Упрощенная оценка а по
шаблону A12). 2.1.2.1.6. Оценка с помощью порядковых статистик A13).
2.1.2.1.6.1. Оптимальная линейная оценка A13). 2.1.2.1.6.2. Оценка Ога-
вы A14). 2.1.2.1.6.3. Линейная оценка Даутона A15). 2.1.2.1.6.4. Оценка по
сумме подразмахов (оценка Диксона) A15). 2.1.2.1.6.5. Оценка Джини A15).
2.1.2.1.6.6. Оптимальные комплексные оценки, использующие общий набор по-
порядковых статистик A16). 2.1.2.2. Интервальные оценки A18). 2.1.2.2.1. Ин-
Интервальные оценки дисперсии а2 A18). 2.1.2.2.2. Интервальная оценка а по
размаху A18). 2.1.2.2.3. Оценка по среднему абсолютному отклонению A18).
2.1.2.2.4. Интервальная оценка <т, основанная на ее точечной оценке s A19).
2.1.3. Оценки в усеченных и цензурированных выборках A23). 2.1.3.1. Оценки
максимального правдоподобия A23). 2.1.3.1.1. Оценки в усеченных выбор-
выборках A23). 2.1.3.1.2. Оценки в неполностью определенных выборках A24).
2.1.3.1.3. Оценки в цензурированных выборках A26). 2.1.3.1.3.1. Оценка мак-
максимального правдоподобия A26). 2.1.3.1.3.2. Оценки с помощью порядковых
статистик A28).
2.2. Оценка параметров экспоненциального распределения ................. 134
2.2.1. Точечные оценки A34). 2.2.1.1. Оценка максимального правдоподо-
правдоподобия A34). 2.2.1.2. Уточненная двухстадийная оценка A35). 2.2.1.3. Оценки,
основанные на порядковых статистиках A35). 2.2.1.3.1. Оптимальная линей-
линейная оценка A35). 2.2.1.3.2. Оценка по одной порядковой статистике A36).
2.2.1.3.3. Оценка Эпштейна A36). 2.2.1.3.4. Оценка Огавы A37). 2.2.2. Ин-
Интервальные оценки A41).
2.3. Оценка параметров распределения Вейбулла. ....................... 146
2.3.1. Точечные оценки A46). 2.3.1.1. Оценка максимального правдоподо-
правдоподобия A46). 2.3.1.2. Метод моментов A47). 2.3.1.3. Метод наименьших ква-
квадратов A50). 2.3.1.4. Оценка с помощью квантилей A51). 2.3.1.5. Оцен-
Оценки, основанные на порядковых статистиках A52). 2.3.1.6. Оценка парамет-
параметров распределения Рэлея (частный случай распределения Вейбулла) A52).
2.3.2. Интервальные оценки A65). 2.3.2.1. Оценка а при известном /3 A65).
2.3.2.2. Совместная интервальная оценка параметров а и C A66).
2.4. Оценка параметров гамма-распределения .......................... 179
2.4.1. Точечные оценки A79). 2.4.1.1. Оценка /3 при известном а A79).
2.4.1.2. Совместная оценка параметров A79). 2.4.1.2.1. Оценка максималь-
максимального правдоподобия A79). 2.4.1.2.2. Несмещенная оценка для малых выбо-
выборок A80). 2.4.1.2.3. Оценка методом моментов A80). 2.4.2. Интервальная
оценка параметра /3 A80).
2.5. Оценка параметров биномиального распределения. ................... 182
2.5.1. Точечная оценка A82). 2.5.2. Интервальные оценки A82). 2.5.2.1. Ап-
Аппроксимация бета-распределением A82). 2.5.2.2. Аппроксимация F-pacnpe-
делением A82). 2.5.2.3. Аппроксимация распределением Пуассона A82).
2.5.2.4. Аппроксимация биномиальной суммы распределением хи-квад-
хи-квадрат A83). 2.5.2.5. Аппроксимация нормальным распределением A84).
2.5.2.6. Аппроксимация Титенко A86).
2.6. Оценка параметров гипергеометрического распределения ............... 191
2.7. Оценки при неизвестном законе распределения вероятностей ............ 192
2.7.1. Оценки для центра распределения A92). 2.7.1.1. Неравенства чебышев-
ского типа A92). 2.7.1.1.1. Неравенство Чебышева A92). 2.7.1.1.2. Неравен-
Содержание
ство Кантелли A92). 2.7.1.1.3. Неравенство Мейделя A92). 2.7.1.2. Оценка
Нётера A93). 2.7.2. Оценка рассеяния распределения A94).
2.8. Некоторые специальные практические задачи ....................... 195
2.8.1. Оценка интенсивности отказов с периодом приработки A95). 2.8.2. Про-
Прогнозирование для экспоненциальных выборок A95).
2.9. Планирование экспериментов для оценки параметров распределений ...... 197
2.9.1. Нормальное распределение A97). 2.9.1.1. Оценка среднего при известной
дисперсии A97). 2.9.1.2. Оценка среднего при неизвестной дисперсии A97).
2.9.2. Распределение Вейбулла A98). 2.9.3. Биномиальное распределение A99).
2.9.4. Экспоненциальное распределение B00). 2.9.5. Гамма-распределе-
Гамма-распределение B01).
Глава 3. Методы анализа законов распределения вероятностей случай-
случайных величин ................................................. 202
3.1. Общие критерии согласия ..................................... 204
3.1.1. Критерии, основанные на сравнении теоретической плотности распреде-
распределения и эмпирической гистограммы B04). 3.1.1.1. Критерий согласия % B04).
3.1.1.2. Критерий числа пустых интервалов B09). 3.1.1.3. Квартальный кри-
критерий Барнетта-Эйеена B11). 3.1.2. Критерии, основанные на сравнении
теоретической и эмпирической функций распределения вероятностей B13).
3.1.2.1. Критерий Колмогорова—Смирнова B14). 3.1.2.2. Критерий Смирнова—
Крамера-фон Мизеса B16). 3.1.2.3. Критерий Реньи (J?-критерий) B18).
3.1.2.4. Критерий Андерсона-Дарлинга (критерий nQ2) B20). 3.1.2.5. Крите-
Критерий Ватсона B22). 3.1.2.6. Критерий Купера B23). 3.1.2.7. Критерий согла-
согласия Дарбина B24). 3.1.2.7.1. Модифицированный медианный критерий B25).
3.1.2.7.2. Модифицированный критерий Колмогорова-Смирнова B25).
3.1.2.7.3. Модифицированный вероятностный критерий B26). 3.1.2.8. Двух-
выборочные критерии согласия B27). 3.1.2.8.1. Двухвыборочный критерий
Колмогорова—Смирнова B27). 3.1.2.8.2. Критерий Катценбайссера—Хак-
ля B28). 3.1.2.8.3. Двухвыборочный критерий Андерсона B29).
3.2. Критерии нормальности распределения ........................... 231
3.2.1. Общие критерии согласия, модифицированные для проверки нормаль™
ности распределения B31). 3.2.1.1. Модифицированный критерий %2 B31).
3.2.1.2. Критерии типа Колмогорова-Смирнова B33). 3.2.1.3. Критерий Фро-
цини B35). 3.2.2. Специальные критерии нормальности B35). 3.2.2.1. Кри-
Критерий Шапиро—Уилка B38). 3.2.2.2. Энтропийный критерий нормальности
(критерий Васичека) B41). 3.2.2.3. Критерий Хегази-Грина B43).
3.2.2.4. Критерий Али—Чёрго-Ревеса B44). 3.2.2.5. Корреляционный крите-
критерий Филлибена B45). 3.2.2.6. Регрессионный критерий нормальности Ла Бре-
ка B48). 3.2.2.7. Критерий нормальности Локка—Спурье B52). 3.2.2.8. Крите-
Критерий нормальности Оя B54). 3.2.2.9. Критерий среднего абсолютного отклоне-
отклонения (критерий Гири) B57). 3.2.2.10. Критерий Дэвида-Хартли-Пирсона B58).
3.2.2.11. Комбинированный критерий Шпигельхальтера B60). 3.2.2.12. Крите-
Критерий нормальности Саркади B61). 3.2.2.13. Критерий нормальности
Лина-Мудхолкара B63). 3.2.2.14. Критерий нормальности Мартинеса-Игле-
вича B65). 3.2.2.15. Критерий нормальности Д'Агостино B66). 3.2.2.16. Кри-
Критерии асимметрии и эксцесса B68). 3.2.2.17. Критерий характеристической
функции (критерий Муроты-Такеучи) B72). 3.2.2.18. Критерии проверки
нормальности распределения по совокупности независимых выборок малого
объема B73). 3.2.2.18.1. Применение критерия Шапиро-Уилка B74).
3.2.2.18.2. Применение критерия Саркади B74). 3.2.2.18.3. Критерий Смир-
Смирнова B75). 3.2.2.19. Сравнительная мощность различных критериев нормаль-
нормальности B77).
Содержание
3.3. Критерии проверки экспоненциальное™ распределения ................ 279
3.3.1. Критерий Шапиро-Уилка B79). 3.3.2. Критерии типа Колмогорова™
Смирнова B82). 3.3.3. Критерии типа Смирнова-Крамера-фон Мизеса для
цензурированных данных B86). 3.3.4. Критерий Фроцини B88). 3.3.5. Корре-
ляционный критерий экспоненциальности B88). 3.3.6. Регрессионный
критерий Брейна—Шапиро B90). 3.3.7. Критерий Кимбера—Мичела B92).
3.3.8. Критерий Фишера B93). 3.3.9. Критерий Бартлетта-Морана B94).
3.3.10. Критерий Климко-Антла-Радемакера^Рокетта B94). 3.3.11. Критерий
Холлендера-Прошана B95). 3.3.12. Критерий Кочара B98). 3.3.13. Кри-
терий Эппса-Палли-Чёрго-Уэлча B99). 3.3.14. Критерий Бергмана C01).
3.3.15. Критерий Шермана C03). 3.3.16. Критерий наибольшего интерва-
ла C04). 3.3.17. Критерий Хартли C05). 3.3.18. Критерий показательных
меток C05). 3.3.19. Ранговый критерий независимости интервалов C06).
3.3.20. Критерии, основанные на трансформации экспоненциального распре™
деления в равномерное C08). 3.3.20.1. Критерий U C08). 3.3.20.2. Крите-
рий U C09). 3.3.20.3. Критерий Гринвуда C09). 3.3.21. Критерий Манн^
Фертига-Шуера для распределения Вейбулла C11). 3.3.22. Критерий Дешпан-
де C16). 3.3.23. Критерий Лоулесса C17).
3.4. Критерии согласия для равномерного распределения .................. 319
3.4.1. Критерий Шермана C19). 3.4.2. Критерий Морана C20). 3.4.3. Крите-
Критерий Ченга—Спиринга C22). 3.4.4. Критерий Саркади—Косика C23). 3.4.5. Эн-
Энтропийный критерий Дудевича-ван дер Мюлена C24). 3.4.6. Критерий Хе-
гази-Грина C26). 3.4.7. Критерий Янга C28). 3.4.8. Критерии типа Кол-
Колмогорова—Смирнова C30). 3.4.9. Критерий Фроцини C31). 3.4.10. Крите-
Критерий Гринвуда-Кэсенберри-Миллера C32). 3.4.11. „Сглаженный" критерий
Неймана-Бартона C33).
3.5. Критерии симметрии ........................................ 336
3.5.1. „Быстрый" критерий Кенуя C36). 3.5.2. Критерий симметрии Смир-
Смирнова C37). 3.5.3. Знаковый критерий симметрии C37). 3.5.4. Одновыбо-
рочный критерий Вилкоксона C39). 3.5.5. Критерий Антилла—Керстинга—
Цуккини C40). 3.5.6. Критерий Бхатачарья-Гаствирта-Райта (модифициро-
(модифицированный критерий Вилкоксона) C42). 3.5.7. Критерий Финча C44). 3.5.8. Кри-
Критерий Бооса C45). 3.5.9. Критерий Гупты C48). 3.5.10. Критерий Фрезе-
Фрезера C50).
3.6. Подбор кривых распределения вероятностей по экспериментальным данным . 352
3.6.1. Кривые распределения Джонсона C52). 3.6.1.1. Семейство распреде-
распределений Sl Джонсона C53). 3.6.1.2. Семейство распределений Sb Джонсо-
Джонсона C55). 3.6.1.3. Семейство распределений Su Джонсона C57). 3.6.2. Кри-
Кривые распределений Пирсона C68). 3.6.2.1. Кривые Пирсона типа I C69).
3.6.2.2. Кривые Пирсона типа II C75). 3.6.2.3. Кривые Пирсона типа III C77).
3.6.2.4. Кривые Пирсона типа IV C78). 3.6.2.5. Кривые Пирсона типа V C80).
3.6.2.6. Кривые Пирсона типа VI C81). 3.6.2.7. Кривые Пирсона типа VII C82).
3.6.3. Разложение теоретических распределений C84). 3.6.4. Метод вкла-
вкладов C85).
Глава 4. Проверка гипотез о значениях параметров распределений. . . . 388
4.1. Сравнение параметров распределений ............................ 389
4.1.1. Сравнение параметров нормальных распределений C89). 4.1.1.1. Срав-
Сравнение двух средних значений C89). 4.1.1.1.1. Сравнение при известных дис-
дисперсиях а\ и <j\ C89). 4.1.1.1.2. Сравнение при неизвестных равных диспер-
дисперсиях C90). 4.1.1.1.3. Сравнение при неизвестных неравных дисперсиях C91).
4.1.1.1.3.1. Критерий Кохрана-Кокса C91). 4.1.1.1.3.2. Критерий Сатервай-
та C91). 4.1.1.1.3.3. Критерий Уэлча C92). 4.1.1.1.4. Модифицированный
критерий Стыодента C92). 4.1.1.1.5. Парный t-критерий сравнения сред-
средних C93). 4.1.1.1.6. Критерий Уолша, основанный на порядковых статисти-
Содержание
ках C94). 4.1.1.1.7. Двухступенчатый двухвыборочный медианный критерий
Волфа C95). 4.1.1.1.8. F-критерий для сравнения двух средних с одинаковы-
одинаковыми дисперсиями C96). 4.1.1.2. Сравнение нескольких (к > 2) средних C97).
4.1.1.2.1. Модифицированный критерий Стьюдента C97). 4.1.1.2.2. Крите-
Критерий „стьюдентизированного" размаха C99). 4.1.1.2.3. Дисперсионный кри-
критерий C99). 4.1.1.2.4. Критерий Полсона D02). 4.1.1.2.5. Метод прямого
сравнения (критерий Тыоки) D03). 4.1.1.2.6. Критерий „стьюдентизирован-
ного" максимума (обобщенный критерий Тыоки) D05). 4.1.1.2.7. Критерий
Шеффе D06). 4.1.1.2.8. Критерий Стьюдента-Ньюмена-Кейлса D07).
4.1.1.2.9. Критерий Дункана D08). 4.1.1.2.10. Критерий Линка—Уоллеса D08).
4.1.1.3. Сравнение двух дисперсий D12). 4.1.1.3.1. Критерий Фишера D12).
4.1.1.3.2. Критерий Романовского D13). 4.1.1.3.3. Критерий отношения раз™
махов D14). 4.1.1.3.4. Критерий „стьюдентизированного" размаха D15).
4.1.1.3.5. Критерий Аризоно-Охты D15). 4.1.1.4. Сравнение нескольких (к > 2)
дисперсий D16). 4.1.1.4.1. Критерий Бартлетта D17). 4.1.1.4.2. Критерий
Кохрана D18). 4.1.1.4.3. Критерий Неймана—Пирсона (критерий отношения
правдоподобия) D19). 4.1.1.4.4. Критерий Блисса-Кохрана—Тыоки D21).
4.1.1.4.5. Критерий Хартли D21). 4.1.1.4.6. Критерий Кэдуэлла-Десли-Бра-
уна D22). 4.1.1.4.7. Критерий Самиуддина D23). 4.1.2. Сравнение парамет-
параметров экспоненциальных распределений D24). 4.1.2.1. Сравнение двух парамет-
параметров D24). 4.1.2.1.1. Критерий Фишера D24). 4.1.2.1.2. Критерий Фишера
при сравнении интенсивностей отказов (А) D25). 4.1.2.1.3. Двухвыборочный
пуассоновский критерий D26). 4.1.2.1.4. Сравнение значения параметра с
заданным D26). 4.1.2.2. Сравнение нескольких (к ^ 2) параметров D29).
4.1.2.2.1. Критерий Дэвида D29). 4.1.2.2.2. Критерий максимального прав-
правдоподобия D30). 4.1.2.2.3. Критерий отношения правдоподобия (критерий
Нагарсенкера) D31). 4.1.2.2.4. Критерий Чена для двухпараметрических экс-
экспоненциальных распределений D32). 4.1.2.2.5. Комбинированный критерий
Сингха D33). 4.1.3. Сравнение параметров биномиальных распределе-
распределений D35). 4.1.3.1. Сравнение двух параметров D35). 4.1.3.2. Сравнение зна-
значения параметра с заданным D36). 4.1.3.3. Сравнение нескольких парамет-
параметров (к ^ 2) D37). 4.1.4. Последовательные методы проверки гипотез о зна-
значениях параметров распределений (последовательный анализ Вальда) D38).
4.1.4.1. Проверка гипотез о параметрах нормального распределения D39).
4.1.4.1.1. Проверка гипотезы о значении среднего D39). 4.1.4.1.2. Проверка
гипотезы о значении дисперсии D46). 4.1.4.2. Проверка гипотезы о параметре
экспоненциального распределения D47). 4.1.4.3. Проверка гипотезы о пара-
параметре биномиального распределения D49).
4.2. Непараметрические (свободные от распределения) критерии однородности ста-
статистических данных ......................................... 451
4.2.1. Непараметрические критерии сдвига D52). 4.2.1.1. Сравнение парамет-
параметров сдвига двух совокупностей D52). 4.2.1.1.1. Быстрый (грубый) критерий
Кенуя D52). 4.2.1.1.2. Ранговые критерии сдвига D53). 4.2.1.1.2.1. Быстрый
(грубый) ранговый критерий D53). 4.2.1.1.2.2. Критерий Манна—Уитни—Вил-
коксона D54). 4.2.1.1.2.3. Критерий Фишера-Йэйтса-Терри-Гёфдинга D59).
4.2.1.1.2.4. Критерий Ван дер Вардена D60). 4.2.1.1.2.5. Медианный кри-
критерий D62). 4.2.1.1.2.6. Критерий Мостеллера D64). 4.2.1.1.2.7. Критерий
Розенбаума D64). 4.2.1.1.2.8. Критерий Хаги D64). 4.2.1.1.2.9. ^-крите-
^-критерий D65). 4.2.1.2. Сравнение параметров сдвига нескольких (к > 2) совокупно-
совокупностей D66). 4.2.1.2.1. Критерий Крускала-Уоллиса D66). 4.2.1.2.2. Критерий
Неменьи D69). 4.2.1.2.3. Критерий Вилкоксона-Вилкокс D71). 4.2.1.2.4. „Бы-
„Быстрый" критерий Кенуя D73). 4.2.1.2.5. Критерий Фишера-Терри-Йэйтса-
Гёфдинга D73). 4.2.1.2.6. Критерий Ван дер Вардена D75). 4.2.1.2.7. Ме-
Медианный критерий D75). 4.2.1.2.8. Критерий Хеттманспергера D76).
4.2.1.2.9. Критерий Терпстры-Джонкхира D77). 4.2.1.2.10. Критерий Мое-
10 Содержание
теллера D79). 4.2.1.2.11. Критерий Левиса D79). 4.2.1.2.12. L-критерий,
основанный на 17-статистиках D80). 4.2.1.2.13. Критерий Краузе D81).
4.2.1.2.14. Критерий Пейджа D82). 4.2.1.2.15. Критерий Фридмена—Кендалла—
Бэбингтона Смита D84). 4.2.1.2.16. Критерий Андерсона-Каннемана-
Шэча D86). 4.2.1.2.17. Критерий со взвешенными ранжировками Даны
Квейд D87). 4.2.1.2.18. Критерий Кендалла-Эренберга D89). 4.2.1.2.19. Кри-
Критерий Ходжеса—Лемана—Сена D90). 4.2.2. Непараметрические критерии мас-
масштаба D92). 4.2.2.1. Сравнение параметров масштаба двух совокупнос-
совокупностей D92). 4.2.2.1.1. Критерий Ансари-Бредли D92). 4.2.2.1.2. Критерий
Сижела-Тыоки D95). 4.2.2.1.3. Критерий Кейпена D96). 4.2.2.1.4. Критерий
Клотца D99). 4.2.2.1.5. Квартальный критерий E01). 4.2.2.1.6. Критерий
Сэвиджа E02). 4.2.2.1.7. Критерий Муда E04). 4.2.2.1.8. Критерий Сукхат-
ме E05). 4.2.2.1.9. Критерий Сэндвика-Олссона E07). 4.2.2.1.10. Критерий
Краута-Динерта E08). 4.2.2.1.11. Критерий Камата E09). 4.2.2.1.12. Комби-
Комбинированный критерий Буша—Винда E11). 4.2.2.2. Сравнение параметров мае™
штаба нескольких (к > 2) совокупностей критерием Бхапкара-Дешпанде E14).
4.3. Критерии тренда и случайности ................................ 517
4.3.1. Критерий Аббе—Линника E17). 4.3.2. Критерий Фостера-Стюарта E19).
4.3.3. Критерий Кокс-Стюарта E20). 4.3.4. Критерий обнаружения сдвига
дисперсии в неизвестной точке (критерий Хсу) E22). 4.3.5. Ранговый крите-
критерий обнаружения сдвига дисперсии в неизвестной точке E24). 4.3.6. Сериаль-
Сериальный критерий случайности E26). 4.3.6.1. Критерий Вальда-Волфовитца E26).
4.3.6.2. Критерий Рамачандрана-Ранганатана E30). 4.3.6.3. Сериальный кри-
критерий Шахнесси E30). 4.3.6.4. Критерий Олмстеда E32). 4.3.6.5. Критерий
числа серий знаков первых разностей E33). 4.3.7. Критерий инверсий E35).
4.3.8. Критерий автокорреляции E36). 4.3.9. Критерии ранговой корреля-
корреляции E39). 4.3.9.1. Критерий Вальда-Волфовитца E39). 4.3.9.2. Критерий
Бартелса E40). 4.3.10. Критерий кумулятивной суммы E41). 4.3.11. Знаково-
ранговый критерий Холлина E42). 4.3.12. Критерии обнаружения выбро-
выбросов E43). 4.3.12.1. Критерии выбросов в случае нормального распределе-
распределения E44). 4.3.12.1.1. Критерий Шовене E44). 4.3.12.1.2. Критерий Ирви-
на E44). 4.3.12.1.3. Критерий Груббса E45). 4.3.12.1.4. Критерий наиболь-
наибольшего абсолютного отклонения E47). 4.3.12.1.5. Критерий Дэвида E47).
4.3.12.1.6. Критерии Диксона E48). 4.3.12.1.7. Критерий Хоглина-Иглеви-
ча E50). 4.3.12.1.8. Критерий Титьена—Мура для обнаружения нескольких
выбросов E53). 4.3.12.1.9. Критерий Роснера для обнаружения нескольких
выбросов E57). 4.3.12.2. Критерии выбросов для экспоненциального рас-
распределения и распределения Вейбулла E59). 4.3.12.2.1. Критерии выбросов
для экспоненциального распределения E59). 4.3.12.2.1.1. Критерий Смоляка—
Титаренко E59). 4.3.12.2.1.2. Критерий Бродского-Быцаня-Власенко E59).
4.3.12.2.1.3. Критерий Кимбера для нескольких выбросов E61). 4.3.12.2.2. Кри-
Критерии выбросов для распределения Вейбулла E64). 4.3.12.3. Критерий выбро-
выбросов для любого непрерывного распределения (критерий Дарлинга) E65).
4.4. Толерантные пределы ........................................ 569
4.4.1. Толерантные пределы в случае нормального распределения E69).
4.4.1.1. Толерантные пределы при известных параметрах распределения
(/i, мо") E69). 4.4.1.2. Толерантные пределы при неизвестных параметрах рас-
распределения E69). 4.4.1.2.1. Среднее/i неизвестно, дисперсия сг2 известна E69).
4.4.1.2.2. Среднее /j, известно, дисперсия а2 неизвестна E72). 4.4.1.2.3. Сред-
Среднее II и дисперсия а2 неизвестны E73). 4.4.1.2.4. Толерантные пределы, осно-
основанные на выборочном размахе E77). 4.4.1.2.5. Толерантные пределы для
выборочных дисперсий E79). 4.4.2. Непараметрические толерантные преде-
пределы E80). 4.4.3. Толерантные пределы для будущих наблюдений и прогнозиро-
прогнозирование E83). 4.4.3.1. Прогнозные интервалы Холла—Прейри E83). 4.4.3.2. Про-
Прогнозные интервалы в задачах испытаний на надежность E87).
Содержание 11
Глава 5. Методы исследования связей между случайными величинами 590
5.1. Дисперсионный анализ ....................................... 590
5.1.1. Классический дисперсионный анализ нормально распределенных слу-
случайных величин E91). 5.1.1.1. Однофакторный дисперсионный анализ E91).
5.1.1.2. Двухфакторный дисперсионный анализ E94). 5.1.2. Дисперсионный
анализ с использованием размахов E96). 5.1.3. Непараметрический диспер-
дисперсионный анализ E98). 5.1.3.1. Двухфакторный непараметрический диспер-
дисперсионный анализ для неполных данных E98). 5.1.3.1.1. Критерий Принти-
са E98). 5.1.3.1.2. Критерий Мака^Скиллингса F01). 5.1.3.1.3. Критерий
Лемаыа-Мака F03).
5.2. Корреляционный анализ ...................................... 606
5.2.1. Классический корреляционный анализ нормально распределенных слу-
случайных величин F06). 5.2.1.1. Оценка коэффициента корреляции F06).
5.2.1.2. Оценка корреляционного отношения F09). 5.2.1.3. Частная и мно-
множественная корреляции F11). 5.2.2. Непараметрический корреляционный
анализ F14). 5.2.2.1. Оценивание корреляции с помощью порядковых
статистик F14). 5.2.2.1.1. Оценка корреляции с помощью тренда F14).
5.2.2.1.1.1. Критерий Кенуя F14). 5.2.2.1.1.2. Критерий Кокс^Стюарта F15).
5.2.2.1.2. Знаковый корреляционный критерий Нелсона F16). 5.2.2.1.3. Ква-
Квадрантный критерий F17). 5.2.2.1.4. "Угловой критерий Олмстеда—Тьюки F20).
5.2.2.1.5. Приближенный критерий Шахани F21). 5.2.2.1.6. Сериальный
критерий Шведа—Эйзенхарта F21). 5.2.2.1.7. Критерий автокорреляции
Кенуя F22). 5.2.2.1.8. Критерий Блума-Кифера-Розенблатта F23).
5.2.2.2. Ранговая корреляция F24). 5.2.2.2.1. Коэффициент ранговой корре-
корреляции т Кендалла F24). 5.2.2.2.2. Коэффициент корреляции р Спир-
мена F26). 5.2.2.2.3. Критерий Гёфдинга F28). 5.2.2.2.4. Критерий
Ширахатэ F30). 5.2.2.2.5. Критерий корреляции Фишера-Йэйтса F32).
5.2.2.2.6. Коэффициент корреляции Ван дер Вардена F33). 5.2.2.2.7. Коэф-
Коэффициент конкордации Кендалла-Бэбингтона Смита F34). 5.2.2.2.8. Коэф-
Коэффициент конкордации Шукеыи-Фроли F36). 5.2.2.3. Точечыо-биеериальная
корреляция F38). 5.2.2.4. Статистическая оценка связи между качественными
признаками (таблицы сопряженности признаков) F39). 5.2.2.4.1. Оценка свя-
связи признаков в таблицах сопряженности 2x2 F39). 5.2.2.4.1.1. Меры связи
в таблицах сопряженности 2x2 F40). 5.2.2.4.1.1.1. Коэффициент ассоциа-
ассоциации F40). 5.2.2.4.1.1.2. Коэффициент коллигации Юла F40). 5.2.2.4.1.1.3. Ко-
Коэффициент контингенции (сходства) F41). 5.2.2.4.1.1.4. Точный критерий
Фишера F41). 5.2.2.4.1.1.5. Быстрые критерии оценки связи в таблицах сопря-
сопряженности 2x2 F42). 5.2.2.4.1.1.6. Модифицированный критерий знаков Мак-
Нимара F43). 5.2.2.4.1.1.7. G-критерий Вулфа F44). 5.2.2.4.1.1.8. Критерий
Ле Роя для сравнения двух таблиц сопряженности 2x2 F45). 5.2.2.4.1.1.9. Вы-
Выбор числа наблюдений для анализа таблиц сопряженности 2x2 F45).
5.2.2.4.2. Оценка связи признаков в многоклеточных таблицах сопряженности
г х с F46).
5.3. Регрессионный анализ ....................................... 648
5.3.1. Линейный регрессионный анализ F49). 5.3.1.1. Оценка коэффициентов
регрессии F49). 5.3.1.1.1. Оценка наименьших квадратов F49). 5.3.1.1.2. Про-
Простейшие оценки коэффициентов регрессии F52). 5.3.1.1.2.1. Метод Бартлетта—
Кенуя F52). 5.3.1.1.2.2. Метод Керрича F52). 5.3.1.1.3. Робастные методы
оценки параметров регрессии F53). 5.3.1.1.3.1. Медианный критерий Брауна™
Муда F53). 5.3.1.1.3.2. Оценка Тейла F54). 5.3.1.2. Статистическое оценива-
оценивание регрессии F55). 5.3.1.2.1. Статистический анализ коэффициентов регрес-
регрессии F55). 5.3.1.2.1.1. Оценки наименьших квадратов F55). 5.3.1.2.1.2. Ро-
Робастные оценки Тейла F57). 5.3.1.2.2. Статистический анализ уравнения
регрессии F58). 5.3.1.2.2.1. Оценка адекватности регрессии F58).
5.3.1.2.2.2. Анализ регрессионных остатков F58). 5.3.1.2.2.3. Оценка выбросов
12 Содержание
в регрессии F60). 5.3.1.2.2.3.1. Критерий Эктона F61). 5.3.1.2.2.3.2. Кри-
Критерий Титьена—Мура—Бекмана F62). 5.3.1.2.2.3.3. Критерий Прескотта—
Лунда F63). 5.3.1.2.3. Доверительные области и толерантные границы ре-
регрессии F65). 5.3.1.2.3.1. Доверительная область простой линейной регрес-
регрессии F65). 5.3.1.2.3.2. Оценка обращенного уравнения регрессии F69).
5.3.1.2.3.3. Толерантные интервалы для линейной регрессии F70).
5.3.1.3. Сравнение линейных регрессий F72). 5.3.1.4. Некоторые специаль-
специальные задачи линейного регрессионного анализа F74). 5.3.1.4.1. Оценка вер-
вершины кусочно-ломаной линии регрессии F74). 5.3.1.4.2. Определение объ-
объема испытаний для получения заданной точности оценки коэффициента ре-
регрессии F78). 5.3.2. Множественная линейная регрессия F80). 5.3.3. Нели-
Нелинейный регрессионный анализ F81). 5.3.3.1. Линеаризация нелинейной мо-
модели заменой переменных F81). 5.3.3.2. Полиномиальная нелинейная ре-
регрессия (полиномы Чебышева) F82). 5.3.4. Выбор наилучшей регрессион-
регрессионной модели по Вильямсу—Клуту F87). 5.3.5. Прогнозирование по регрес-
регрессии F89). 5.3.6. Специальные методы сглаживания экспериментальных дан-
данных F91). 5.3.6.1. Метод наименьших модулей F92). 5.3.6.2. Метод послед-
последней точки F94). 5.3.6.3. Метод однозначной аппроксимации F94). 5.3.6.4. Ме-
Метод обратных разделенных разностей F96). 5.3.6.5. Метод условно-относи-
условно-относительных разностей F96).
5.4. Контрольные карты ......................................... 697
5.4.1. Контрольные карты Шухарта F97). 5.4.1.1. х- и 1?-карты F98).
5.4.1.2. s-карта F99). 5.4.1.3. х- и s-карты для выборок неравного объема G00).
5.4.1.4. Контрольная карта для доли дефектных изделий (р-карта) G01).
5.4.1.5. Контрольная граница числа дефектов (с-карта) G03). 5.4.1.6. Карты
индивидуальных значений и скользящего размаха G03). 5.4.2. Контроль-
Контрольные карты накопленных сумм (ККНС) G04). 5.4.2.1. ККНС для среднего
значения G05). 5.4.2.2. ККНС выборочных размахов G07). 5.4.2.3. ККНС
для выборочных дисперсий G09). 5.4.2.4. ККНС для доли дефектных изде-
изделий G10). 5.4.2.5. ККНС для числа дефектных изделий, основанная на рас-
распределении Пуассона G11). 5.4.3. Относительная эффективность контроль-
контрольных карт G12). 5.4.4. Контроль без использования контрольных карт G13).
5.5. Математико-статистические методы планирования эксперимента ......... 715
5.5.1. Планирование регрессионных экспериментов при изучении механизма
явления (статистическое моделирование) G15). 5.5.1.1. Линейные ортогональ-
ортогональные планы (планирование первого порядка) G16). 5.5.1.1.1. Полный фактор-
факторный эксперимент G16). 5.5.1.1.2. Дробный факторный эксперимент G20).
5.5.1.2. Нелинейные планы второго порядка G22). 5.5.1.2.1. Симметричные
планы второго порядка G22). 5.5.1.2.2. Ортогональные симметричные пла-
планы G24). 5.5.1.2.3. Ротатабельные планы G27). 5.5.1.2.4./^-оптимальные пла-
планы G28). 5.5.1.2.5. Несимметричные планы второго порядка G29). 5.5.2. Пла-
Планирование экспериментов по поиску оптимума G32). 5.5.2.1. Метод крутого
восхождения G32). 5.5.2.2. Симплексное планирование G34).
Очень короткое послесловие ....................................... 736
Список литературы ............................................. 737
Сокращенные названия использованных журналов ....................... 760
Перечень демонстрационных задач .................................. 761
Перечень математико-статистических таблиц ........................... 789
Предметный указатель ........................................... 806
Именной указатель .............................................. 811
Всякая вещь есть форма проявления
беспредельного разнообразия.
Многие вещи нам непонятны
не потому^ что наши понятия слабы;
но потому, что сии вещи не входят
в круг наших понятий.
Козьма Прутков
О математической статистике и об этой книге
(обращение к читателю)
"Что такое математическая статистика и зачем она нам?
Здравствуй, уважаемый читатель! Кто бы ты ни был — инженер, медик, эконо-
экономист, агроном, биолог, психолог или географ, каждый день и каждый час ты имеешь
дело с потоком данных, обрушивающихся на тебя. С их помощью окружающий нас
мир пытается поведать о себе. Результатами испытаний прибора сообщить инжене™
ру о том, что он создал; сведениями о заболеваниях рассказать медику о результатах
его работы; информацией о работе промышленности заставить экономиста еще раз
проверить эффективность экономической системы. Так или иначе, каждый из нас,
оглядываясь в прошлое или заглядывая в будущее, не уйдет от необходимости
получать информацию и извлекать из нее ответы на свои многочисленные вопросы.
Казалось бы, чего проще — взглянул инженер на результаты испытаний прибора
и выявил все свои недоработки, медик получил результаты анализов и безошибочно
поставил правильный диагноз. Однако горький опыт подсказывает, что это далеко
не всегда так. Оказывается, что, наблюдая одно и то же явление, мы будем полу™
чать все время разные результаты. Это — проявление могущества Его Величества
Случая. Слово случай, такое прозрачное для статистика-профессионала, остается
для большинства инженеров промышленности, медиков, биологов и экономистов
символом вмешательства темных, не поддающихся контролю сил. Отчасти это
является интуитивной реакцией „здравого смысла" на двойственность и взаимо™
обусловленность понятийной пары „случайность — детерминированность".
Любое событие (или цепь событий) наблюдатель справедливо считает проявле-
проявлением реальности. С точки зрения теории вероятностей любое наблюдаемое событие
уникально, неповторимо и, стало быть, формально невероятно, ибо для математи-
математической случайности нет нулевой и единичной вероятностей. Однако версия матема-
математической случайности предполагает, что наблюдаемая последовательность событий
является частью более общей последовательности громадного периода, в которой
наблюдаемая последовательность содержится много раз. Так детерминированность
здравого смысла соприкасается со случайностью математической абстракции.
Возможности человека, слава Богу, будут всегда ограничены. Он не сможет
повторить один и тот же опыт бесконечное число раз, а поэтому он никогда не
узнает все обо всем, и ему всегда придется, принимая решение, исходить из своего
нелегкого опыта. Однако надежды его не так уж беспочвенны, ибо еще гениальный
В. Шекспир отметил, что „непременно за шалой случайностью, радуясь своей
странноватой склонности, как свинья в грязи бескрайности, прикорнула наглейшая
определенность".
14 О математической статистике и об этой книге
Как поймать за хвост эту „наглейшую определенность", как увидеть что-то
осмысленное в обрушивающейся на нас лавине информации, чем защититься от
потока досаждающих случайностей?
Такой инструмент человек нашел более 300 лет тому назад: это математическая
статистика — теория познания мира через опыт. Ее приемы и правила позволяют,
располагая противоречивыми результатами наблюдений, выбрать из всех гипотез
наиболее правдоподобную.
Один из основателей и корифеев математики случайностей Влез Паскаль
определил ее как „учение, объединяющее точность математических доказательств
с неопределенностью случая и примиряющее эти, казалось бы, противоречивые эле-
элементы". Однако у неискушенного в премудростях науки современника статистика
ассоциируется скорее с метким афоризмом Дизраэли — „есть ложь, большая ложь
и статистика", чем с изящным инструментом, крайне необходимым ему в работе.
В Англии конца 18-го века описательная статистика получила знаменательное
название „политическая арифметика". Вот такой „политической арифметикой", спо-
способной на потребу политикам „гармонизировать" любые данные, и осталась для
многих статистика. Подобно „доброму человеку из Сезуана" Б. Брехта, мы привык™
ли к тому, что „дурной конец заранее отброшен, он должен, должен, должен быть
хорошим".
Ясно, что такие призывы никак не могут быть питательной средой математиче-
математической статистики. Ее питательной средой и ресурсной базой являются эксперимен-
экспериментальные и прикладные науки, практическая деятельность человека, рассматрива-
рассматривающая повторяющиеся опыты как единое целое.
Мы познаём окружающий нас мир, выдвигая и проверяя по результатам экспе-
римента гипотезы о его свойствах. Получающиеся при этом выводы и заключения,
никогда не обладая абсолютной достоверностью, тем не менее способны обострить
интуицию исследователя, привести его от предварительных гипотез к более общим
и строгим теориям. Другими словами, методы математической статистики — это
мощный (а иногда, и единственный) многофункциональный инструмент в руках
инженера и исследователя, медика и биолога, психолога и географа, студента и про-
профессора.
Более ста лет тому назад человек, к своему изумлению, выяснил, что если бы
случайность отсутствовала, ее нужно было бы изобрести, ибо, оказывается, в слу-
случайности заключены не только растерянность неопределенности, но и созидающая
сила многовариантности. Как ни парадоксально, но поиск оптимальных условий
протекания процесса наиболее эффективен, когда он реализуется в форме слу-
чайного поиска. Контроль качества изделий в производстве наиболее эффективен
при обеспечении случайного отбора изделий из контролируемой партии. В конце
концов, происхождению жизни, а, следовательно, и нашему существованию, мы
обязаны случаю. Все мы помним пушкинскую строку „ ... гений, парадоксов друг".
Но, если внимательно дочитать поэта, то вслед за этой чудесной строкой следует
не менее замечательная „...и случай, Бог — изобретатель". Поэтому не следует
считать математическую статистику только инструментом устранения досадного
влияния случая. Нет, вместе с созидающим случаем математическая статистика
является языком, на котором „Бог — изобретатель" разговаривает с нами. И знать
этот язык обязан каждый инженер, исследователь, каждый специалист. Если „перед
ошибками захлопываем дверь, в смятеньи истина: „Как я войду теперь?" — справед-
ливо подметил Р. Тагор.
Практически любое решение, которое приходится принимать инженеру, руко-
руководителю производства, так или иначе требует применения методов обработки ре-
результатов наблюдений. Приведет ли внедренное новшество к повышению качества
продукции? зависит ли наблюдаемый процесс от заданного фактора? существует
О математической статистике и об этой книге 15
ли связь между исследуемыми величинами? сколь она сильна? — это типовые зада™
чи математической статистики. Сколь долго можно ожидать безотказной работы
прибора? как спланировать его заводские испытания? — это тоже задачи математи-
математической статистики. Перечисление таких примеров можно продолжать бесконечно,
столь бесконечны и сложны взаимосвязи нашего разума с вечно меняющимся,
бесконечным по форме и бездонным по содержанию миром, нас окружающим.
Однако вместе с разумом человек обрел не только гордость бесконечности, но
и привычку довольствоваться достаточным.
Почему появилась эта книга? Чем она отличается от других?
Можно надеяться, что, вняв изложенным аргументам, инженер или исследо-
исследователь пожелает незамедлительно обострить свою интуицию, раздобыть чудодей-
чудодейственный инструмент решения своих повседневных задач.
Казалось бы, возможности прикладной математической статистики неоспори™
мы. Почему же тогда инженеры и ученые, мастера и рабочие остаются в неведении
относительно этих возможностей? Имея многолетний опыт подготовки студентов
старших курсов вузов, могу утверждать, что и сегодняшние выпускники имеют
весьма смутное представление о современных методах математической статистики,
чаще всего не способны применять их на практике. Преподавание этого курса
в вузах находится далеко не на должном уровне. Практические навыки выпуск-
выпускников ограничиваются туманными воспоминаниями о различных определениях
вероятности, иссушающими душу нудными задачами из теории вероятностей, заста-
заставляющими вычислять вероятности появления событий методами комбинаторики.
Относительно математической статистики молодой специалист знает только одно —
дело это темное и „лучшая из парадигм — это правило трех сигм".
Для аспирантов и соискателей ученых степеней математическая статистика
является чаще всего красивой рамкой или упаковкой для диссертации. Присутствуя
на защитах диссертаций и оппонируя их, автор часто разочарованно убеждался, что
соискатель не владеет основами обработки результатов наблюдений, а соответству-
соответствующие разделы диссертации не более чем подарок коллеги-профессионала.
Так почему же инженеров и ученых промышленности не увлекают прелести при-
прикладной статистики? Оставив в стороне мотивации, способные склонить их к этому,
отметим, что они неизбежно столкнутся, прежде всего, с серьезнейшей проблемой —
неимоверным количеством монографий, книг, статей, таблиц и справочников.
По данным российского исследователя А. И. Орлова, шестая часть публика-
публикаций в математике относится к теории вероятностей, математической статистике
и их применениям в различных прикладных областях. Ежегодно появляются более
5 000 статей и книг по этой тематике (читатель вправе заметить: ну вот, еще одна
появилась, но об этом позже). К настоящему времени известно более миллиона (!)
работ по статистическим методам, причем только по прикладной статистике сохра-
сохраняют актуальность более 100 000 статей и книг. В мире издаются более 400 журналов
и периодических изданий по проблемам математической статистики.
Можно назвать десятки зарубежных журналов математической статистики для
инженеров и исследователей: „Annals of the Institute of Statistical Mathematics",
„The Annals of Mathematical Statistics" (AMS), „Journal of the Royal Statistical
Society" (JRSS), „Biometrics", „Biometrika", „Communication In Statistics", „Journal of
the American Statistical Association" (JASA), „Technometrics", „Statistica Neerlandica",
„Sunkhya", „The American Statistical", в то время как у нас в стране можно отметить
лишь раздел „Математические методы испытаний" в журнале „Заводская лаборато-
лаборатория", журнал „Надежность и контроль качества" (в 1991 году в нем выделено место
для выпусков „Статистические методы") и отчасти журнал „Теория вероятностей
16 О математической статистике и об этой книге
и ее применения" (большинство материалов которого не только начинающему, но
и мне не по зубам).
Простая „лоция" по океану публикаций в области математической статистики не
поможет инженеру или исследователю, лишенному профессиональной подготовки
в теоретических вопросах математической статистики. Да и вряд ли ему будут до™
ступно большинство заокеанских книг и журналов — „материков и островов" этого
океана, о существовании которого подавляющая часть инженеров и исследователей
и не догадывается.
Вряд ли еще в каких-нибудь дисциплинах можно встретить книги, содержащие
такое огромное количество литературных ссылок (например, в книге Л. Закса „Ста-
„Статистическое оценивание"—около 1500 ссылок, в книге М. Холлендера и Л. Вулфа
„Непараметрические методы статистики"—около 800). Даже разнобой в термино-
терминологии может привести неискушенного читателя в замешательство. Вряд ли он сразу
сообразит, что „итерационный" и „сериальный" критерии, „фазочастотный" и „зна™
ковый сериальный" критерии — это различные названия одного и того же критерия.
А от такого, например, оборота лихого статистика-профессионала, как „проверив
предварительно нормальность распределения критерием Лина^Мудхолкара, допол-
дополненным комбинированным критерием Шпигельхальтера, можно приступить к срав-
нению средних нескольких выборок, например, с помощью критерия Стьюдента™
Ньюмена^Кейльса", любой нормальный инженер неизбежно должен впасть в тихую
грусть и навсегда потерять желание заглядывать в этот раздел науки.
Как же быть? Как сделать достоянием практикующих инженеров и исследовате-
исследователей сокровищницу наработанных мировой наукой эффективных методов статисти-
статистического анализа результатов наблюдений? Эти методы адаптируются к реальным
потребностям практиков и включаются в пособия, ориентированные на специали™
стов-нематематиков, как правило, через 10—15 лет после их появления.
Такой попыткой является предлагаемая книга. Математическая статистика —
наука, устроенная довольно своеобразно, и ее применение — искусство, требующее
не только знаний, но и практики, опыта, чутья и интуиции. Сделать такую практику
достоянием инженеров и исследователей — цель автора книги. Автор стремился
прежде всего отобразить богатую палитру методологических подходов прикладной
математической статистики. Он исходил из того, что инженеров и научных работ-
работников нужно знакомить с новыми методами и удачными приемами, если даже их
приходится излагать на эвристическом уровне. Цель книги — научить пользоваться
прикладными методами математической статистики, не требуя владения ее теоре-
теоретическими основами. Недостаток понимания основ восполняется подробными реко-
рекомендациями и предостережениями, а также обширнейшей библиографией. Древние
греки справедливо заметили, что „способности чахнут и теряют естественность при
соприкосновении с иссушающими природу учеными наставлениями". Поэтому автор
стремился елико возможно избегать таковых и, следуя мудрости Ньютона — „при
изучении наук примеры полезнее правил", обратился к наиболее эффективному для
пользователя методу изложения материала — в форме демонстрационных примеров
и задач. Изложение техники и последовательности расчетных процедур заменены,
там, где это не в ущерб истине, пояснением конкретных примеров. При этом ав-
автор исходил из того, что заинтересованный только приложениями математической
статистики инженер-практик не будет читать все подряд, а попытается разыскать
пример, похожий на тот, что его интересует. И он будет прав, ибо прикладная
математическая статистика не является наукой, которая может быть изучена только
путем чтения. Умение и своеобразное чутье выбрать правильный метод приходит
только в процессе решения практических задач. Следуя мудрецу Дейлу Карнеги,
признаем, что „в сущности, всё, в конечном счете, сводится к одному — нужно
О математической статистике и об этой книге 17
практиковаться, практиковаться и практиковаться". Компьютер поможет выпол-
выполнить расчеты, но не заменит ни процесс формирования гипотезы, ни творчество,
проистекающее из воображения.
В книге предлагаются около 400 статистических приемов решения всевозмож-
ных практических задач. То, что автор приводит такое изобилие различных совре™
менных методов, многие из которых известны пока не каждому профессионалу, не
является следствием его неразборчивости, а делается им осмысленно.
Причин тому несколько:
— современные компьютеры сделали доступными ранее недоступные в вычис-
вычислительном отношении методы;
— не следует исключать стремление читателя к разнообразию, проистекающее
от природного любопытства;
— демонстрация различных подходов к одной и той же задаче помогает глубже
ее осмыслить.
Автор на себе опробовал этот путь, именно так начав знакомство с приклад™
ной математической статистикой, будучи молодым специалистом™электронщиком.
Конечный итог даже только знакомства со всем разнообразием методов — путь
к пониманию математической статистики, к овладению практическими навыками
пользования ее методами. Ведь каждый метод — это демонстрация тех или иных
положений статистики.
Обилие различных критериев и оценок в статистике не должно пугать — это
следствие множественности ситуаций, возникающих в реальной жизни. Знаком™
ство с массой различных приемов статистической обработки данных способству-
способствует демонстрации самого механизма, способа мышления, методологии прикладной
статистики, помогает глубокому усвоению как ее методов, так и философии. Поль™
зователя не должна смущать эквивалентность некоторых методов, как не пугает
его возможность решать одну и ту же жизненную коллизию разными способами.
Знакомство с множеством практических приемов позволяет пользователю почув-
ствовать „воздух" математической статистики, на уровне подсознания уяснить ее
методологию, внутреннюю логику, разнообразие и остроумие подходов. Это способ
учиться статистике, да и необходимость выбора подходящего приема из большой
совокупности возможных — неплохой тренинг на долгом пути знакомства с мате-
математической статистикой для любого инженера или исследователя. Так или иначе,
пользователю предлагается совокупность методов и приемов прикладной матема-
математической статистики, которая никогда еще не собиралась в одной книге.
Изложение материала в книге преследует цель дать по каждому методу на™
бор стандартной информации, включающий в себя: логическое обоснование, связь
с другими методами, назначение, авторство, методику расчетов, необходимые та-
таблицы и аппроксимации, указания по особенностям применения и статистическим
характеристикам, набор демонстрационных задач. Располагая такой исчерпыва-
исчерпывающей информацией, пользователь может решать свои практические задачи, не
обращаясь ни к каким другим дополнительным источникам.
Исчерпывающий характер предлагаемой информации дает пользователю уни-
уникальный шанс приобрести в компактной форме весь мировой опыт прикладной
математической статистики, в десятки раз сократить время поиска необходимых
методов в океане публикаций, в сотни раз повысить эффективность своей работы
за счет принятия оптимальных решений в море возможных, сокращения объема
испытаний и экспериментальных работ, повышения качества продукции. Эта книга
полезна для аспирантов и ученых, желающих (и обязанных) на современном уровне
проводить эксперименты и обрабатывать их результаты. Она может быть исполь-
использована студентами вузов как универсальное справочное пособие.
18 О математической статистике и об этой книге
"Что есть в книге и немного теоретических основ статистики
Предлагаемая книга включает в себя пять глав. Все главы связаны между собой
единой логикой методологического подхода и посвящены отдельным важнейшим,
имеющим самостоятельное практическое значение задачам прикладной математи-
математической статистики.
Состав и тематика отдельных глав последовательно отражают логику развития
самой теории вероятностей и математической статистики. Мы уже говорили о том,
что потребность каким-то образом справиться с потоком информации у человека
возникла давно, сразу после того, как он стал понимать, что это информация. Есте-
Естественно, первое, что отметит каждый из нас — это наличие в потоке информации
определенных закономерностей. Источником такой закономерности является нечто
объективное, содержащееся в природе наблюдаемого процесса или явления. Прояв-
Проявлением этого „нечто" является частота появления определенных событий (величин).
Мы отмечаем, что одни события встречаются чаще (или реже), чем другие. Это
наблюдение потребовало найти „нечто", которое, говоря словами Гете, „единичное
искусно обобщает, объединяя все в торжественный аккорд", и это „нечто" было
названо вероятностью. Обращу внимание читателя на одну любопытную деталь.
Хорошо известны такие журналы по прикладной математической статистике, как
„Технометрикс", „Биометрика", „Эконометрика", „Психометрика". Казалось бы, они
являются журналами для специалистов разных профессий, но все они — журналы
прикладной математической статистики, и именно она — математическая статисти-
статистика — является той „метрикой", которая объединяет все прикладные науки, имеющие
дело с потоком числовых данных, ибо, как тонко заметил Валлювар, „что, в сущ-
сущности, буква и цифра? Не глаза ли два, которым открыта вся суть естества?"
Вернемся к вероятности. Понимая под ней частоту появления отдельных собы-
событий в наблюдаемом потоке, человек, естественно, попытался связать вероятность
появления случайного события с ее количественным значением. Такая связь может
быть описана как функция распределения вероятностей или плотность распреде-
распределения вероятностей, являющаяся производной от функции распределения. Опи-
Описанию распределений вероятностей посвящена первая глава книги.
У читателя может возникнуть вопрос: а зачем, собственно, специально описы-
описывать какие-то функции, и откуда они вообще взялись? В конце концов, существуют
достаточно хорошо разработанные в математическом анализе приемы исследова-
исследования функций, изучаемые еще в школе. Можно, конечно, воспользоваться этими
приемами, но мы все-таки имеем дело не просто с математическим соотношением,
а с вероятностной моделью. Поэтому для описания функций распределения веро-
вероятностей используются специальные меры (параметры), называемые моментами.
Отдельные моменты и их комбинации характеризуют такие важные в практическом
отношении характеристики распределения вероятностей, как центр группирования
данных, степень их рассеяния относительно центра, поведение случайных величин
в районе центра группирования, симметричность распределения вероятностей.
Среди известных законов распределения вероятностей каждый наверняка назо-
назовет нормальный закон. Но немногие спросят: а почему он называется нормальным?
Уж не потому ли, что другие распределения ненормальны? Вопрос не так наивен,
как кажется. Ничего нормального, судя по математической функции плотности
распределения вероятностей
/(*) =
в нем нет, если не считать, что она содержит достаточно полный набор символов,
обычно употребляемых в математике.
О математической статистике и об этой книге 19
Дело в том, что если наблюдаемый процесс зависит от совокупности болыно™
го числа взаимонезависимых (или слабозависимых) факторов, вклад каждого из
которых в процесс мал, то, поверь мне, читатель, на слово (это доказали весьма
ученые мужи), мы неизбежно придем к нормальному распределению вероятностей.
Наверное, оттого, что описанная ситуация представляется нам нормальной, назван
нормальным и закон, отражающий влияние случайных факторов на результирую-
результирующий процесс.
Большинство используемых в прикладной математической статистике распре-
распределений вероятностей, так или иначе связано с нормальным законом или сводится
к нему. В первой главе книги „Распределения вероятностей случайных ве-
величин" приведены подробные сведения более чем о 30 непрерывных и дискретных
распределениях вероятностей, исчерпывающих большинство мыслимых практиче-
практических ситуаций. Описаны области их применения, методы расчета вероятностей
и необходимые аппроксимации.
Во второй главе книги „Оценка параметров распределений вероятностей"
рассмотрены методы оценки параметров различных распределений вероятностей.
Математическое понятие параметр распределения в практике инженера представ™
лен такими знакомыми категориями, как средняя наработка на отказ, интенсив-
интенсивность отказов, точность показаний измерительного прибора и т. п. Поэтому ме-
методы оценки параметров распределений для инженера и исследователя являются
методами извлечения из результатов наблюдений, испытаний и экспериментов ин-
информации, позволяющей оценить качество изделий, уровень принятых технических
решений.
Рассмотрены точечные и интервальные оценки всех наиболее распространен™
ных распределений. Большое внимание уделено „быстрым" упрощенным оценкам,
а также непараметрическим (свободным от распределения) и так называемым
робастным (robust) оценкам, устойчивым к засорению выборок посторонними
наблюдениями.
Для практического применения методов математической статистики чрезвычай-
чрезвычайно важно знание закона распределения вероятностей. По существу, сама изучаемая
величина представлена для исследователя только законом распределения вероят-
вероятностей реализации ее значений.
Попытка применить методы анализа результатов наблюдений, разработанные
для конкретных законов распределения вероятностей, в условиях, когда реальное
распределение отличается от гипотетического, является самой распространенной
ошибкой, приводящей к неверным выводам и, в конечном итоге, к существенным
материальным потерям и затратам времени. Именно поэтому любая обработка
результатов наблюдений должна неизменно начинаться с ответа на главный вопрос:
каким законом описывается распределение вероятностей совокупности, из которой
извлечена обрабатываемая выборка случайных величин? На практике обычно эта
проблема формулируется следующим образом. Выдвигается гипотеза, утверждаю-
утверждающая, что наблюдаемое распределение случайных величин описывается конкретным
законом (нормальным, экспоненциальным, равномерным, Вейбулла и т.д.). Задача
первичного анализа — принять или отклонить выдвинутую гипотезу. Если ни одна
из гипотез относительно формы закона распределения не принимается, то может
быть сформулирована более мягкая гипотеза, например — „наблюдаемое распреде-
распределение вероятностей симметрично относительно определенной точки". Установление
даже этого факта дает в руки исследователя более эффективные методы анализа
наблюдений, чем при полном незнании закона распределения вероятностей. И, на-
наконец, если исследователь не получил достаточных оснований для выбора типа рас-
распределения, то возникает задача подбора кривой распределения непосредственно по
экспериментальным данным.
20 О математической статистике и об этой книге
Критерии проверки гипотез о законе распределения вероятностей принято на™
зывать критериями согласия, подразделяя их на две группы — общие и специаль-
специальные критерии согласия. Общие критерии согласия применимы к формулировке
гипотезы о согласии наблюдаемых результатов с любым априорно предполагаемым
распределением. Специальными критериями проверяются специальные гипоте-
зы, формулирующие согласие с конкретной формой распределения — нормальной,
экспоненциальной и т. п. Такие критерии носят соответствующие названия — кри-
критерии нормальности, критерии экспоненциально сти^ критерии равномерности.
Естественно, что при формулировании специфичных требований общие критерии
согласия могут быть трансформированы в специальные критерии.
Следует отметить, что многообразие возможных альтернатив, противостоящих
выдвинутой гипотезе, порождает и чрезвычайное многообразие статистических
критериев, имеющих различную мощность по отношению к различным альтернати-
альтернативам. В третьей главе „Методы анализа законов распределения вероятностей
случайных величин" представлена широкая гамма критериев согласия (более 80),
впервые собранная в одной книге.
В четвертой главе „Проверка гипотез о значениях параметров распреде-
распределений вероятностей" рассматриваются методы проверки предположений о значени-
значениях параметров распределений. Формулирование гипотез о свойствах окружающего
нас мира и проверка их непосредственно наблюдениями или с помощью целенаправ-
ленного экспериментирования составляет основу того, что мы называем наукой или
научной деятельностью.
Проверка гипотез применительно к потребностям ежедневной практики ин-
женера или исследователя приобретает вполне конкретный смысл, зависящий от
специфики наблюдаемых реалий, особенностей возникающих коллизий, потреб-
потребностей практики, стимулировавших сам процесс зарождения и формулирования
гипотезы. Например, часто встречающаяся задача — соответствуют ли параметры
разработанного изделия предъявляемым требованиям — в математико-статистиче-
ской формулировке может звучать так: „необходимо проверить гипотезу о том, что
параметр ? распределения случайной величины X превосходит заданную контроль-
контрольную величину ?0"-
Сколь разнообразен и сложен окружающий нас мир, столь велико и разнообраз-
разнообразно семейство возможных гипотез о его свойствах. Поэтому четвертая глава является
самым объемным разделом книги.
Автор надеется, что знакомство с многочисленными примерами решения задач
является лучшим способом узнавания палитры методов прикладной статисти-
статистики. Впрочем, в случае нежелания наблюдать палитру прагматик, располагая этой
книгой, получает инструмент решения своих практических задач без необходимости
вникать в глубину захватывающего мира обработки результатов наблюдений. Сле-
Следует всегда помнить об антагонистическом противоречии между категоричностью
и надежностью высказывания по гипотезе: надежное высказывание некатегорично,
категоричное высказывание ненадежно. Мы выдвигаем гипотезу и отвергаем ее
тогда, когда получаем результат, маловероятный при истинности выдвинутой гипо-
гипотезы. Принятая граница маловероятности называется уровнем значимости. Если
мы наблюдаем событие, вероятность появления которого не превышает уровень
значимости, мы называем его значимым, используя этот термин в качестве анто-
антонима термину случайность. Такой метод принятия решений в статистике получил
название принципа значимости.
При проверке гипотез возможны ошибки двух типов — неправильное отклонение
верной гипотезы (ошибка первого рода) и неправильное принятие ложной гипо-
гипотезы (ошибка второго рода). Следует помнить, что уровень значимости должен
устанавливаться перед получением данных. Это требование для практи-
О математической статистике и об этой книге 21
ка вообще является некоторой головоломкой, но, уважаемый читатель, поверь,
что это очень важно. Ты можешь задать естественный вопрос: а какой уровень
значимости или достоверности следует выбирать? Увы, но это твоя проблема,
читатель, а не математической статистики. Достоверность, с которой ты бы хотел
получить ответ на поставленный вопрос, должна определяться тобой исходя из
практической ситуации. Желание повысить достоверность заключения по гипотезе
связано с увеличением затрат, стремление снизить затраты на проверку гипотезы
неизбежно приводит к повышенному риску принять ложное решение. Всё должны
определять конкретная ситуация и цена риска. Например, проектируя атомный
реактор или переходя дорогу перед транспортом, мы стремимся свести к нулю
риск даже повышением затрат, ибо цена высока. Одним из методов сохранения
достоверности выводов при снижении затрат на проверку гипотезы является выбор
эффективного статистического приема обработки результатов наблюдений. В этом
поможет предлагаемая книга.
Обычно на практике применяются уровни значимости 0,01; 0,05; 0,1. Важно
неукоснительно выполнять основное требование — гипотезы должны быть выдви™
нуты перед статистическим анализом, а сам числовой материал не должен
быть использован для выдвижения гипотезы. Гипотезы, выдвинутые на основе
анализа полученного материала, могут быть полезны только в качестве новых
гипотез для последующих проверок. Перефразируя Томаса Гексли, укажем на вели™
кую трагедию математической статистики как науки — „она способна уничтожить
прекрасную гипотезу одним безобразным фактом".
В первых четырех главах книги рассмотрены методы и приемы математиче-
математической статистики, позволяющие оценить параметры статистических совокупностей,
сравнить их между собой. При этом, как правило, предполагалась взаимная неза-
независимость сравниваемых совокупностей. В последней, пятой главе „Методы
исследования связей между случайными величинами" рассмотрены вопросы оценки
связей между статистическими совокупностями. В ней последовательно излагаются
методы и приемы дисперсионного, корреляционного и регрессионного анализов,
являющихся последовательными ступенями при изучении характера и особенностей
связей между случайными величинами.
Методами дисперсионного анализа устанавливается влияние заданного фактора
на процесс, отображаемый наблюдаемой статистической совокупностью данных.
Корреляционный анализ позволяет оценить силу (степень) такой связи, а методами
регрессионного анализа можно установить конкретную математическую модель,
адекватно отражающую установленную связь.
Стоит ли иметь эту книгу? Подумай!
Здесь будет немного рекламы. Но кто без нее сегодня обойдется? Если ты при™
обретешь эту книгу, ты станешь обладателем системы знаний в области обработки
и анализа результатов наблюдений.
У читателя может возникнуть вопрос: а не проще ли воспользоваться одним из
пакетов статистического программного обеспечения и поручить ему обработку ре™
зультатов наблюдений, оставив за собой роль беспечного наблюдателя? Несомненно,
такой пакет является изящным и мощным инструментом в руках профессионала,
которому знаком язык математической статистики, но он вряд ли поможет ин™
женеру или исследователю, далекому от мира формальной математики и от тер™
минологического языка математической статистики, творчески осмыслить систему
решения тех или иных задач, логику изучения процессов методами статистики.
Предлагаемая книга может с успехом обеспечить начальный тренинг неподготов-
неподготовленному пользователю, подготовив тем самым ему плацдарм для штурма высот
современного программного статистического обеспечения.
22 О математической статистике и об этой книге
В книге содержится подробное описание около 400 задач, иллюстрирующих
решение практически любой проблемы обработки результатов наблюдений. Пере-
Перевод методов математической статистики, иногда довольно сложно описываемых
языком формальной математики, на язык последовательности выполнения эле-
элементарных вычислительных операций делает их доступными неподготовленному
пользователю, позволяет ему успешно справляться с возникающими затруднениями
на высоком уровне профессионала, не требуя его квалификации и подготовки.
Более 200 математико-статистических таблиц являются мощной „базой данных",
они предоставляют в распоряжение читателя практически весь арсенал известных
таблиц, большая часть которых пока содержится только в специализированных
научных журналах, мало известных большинству инженеров^практиков. В распо™
ряжение читателя, который пожелает углубиться в основания прикладной матема-
математической статистики, предлагается обширный перечень литературы, содержащий
около 700 наименований.
Прикладная статистика становится таковой тогда, когда ее методы широко
применяются на практике. Наша цель — сделать ее таковой, доведя методы матема-
математической статистики до тех, кто, пасуя перед ее высокой математизацией, не вникал
в достаточно простой смысл математических символов.
Некоторое представление об объеме сведений, содержащихся в книге, и ее базе
данных дают содержание глав и перечень основных использованных информацион-
информационных источников. Весьма полезен также прилагаемый перечень задач, являющийся
ориентиром при выборе задачи, похожей на ту, которую предстоит решить пользо-
пользователю.
С уважением,
Доктор технических наук,
профессор
А. И. Кобзарь
ГЛАВА 1
РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ СЛУЧАЙНЫХ ВЕЛИЧИН
Общие положения. Распределение значений случайной величины по вероят-
ности их появления характеризуется интегральной функцией распределения (зако-
(законом распределения) и плотностью вероятностей.
Интегральная функция (закон) распределения случайной величины X обозна-
обозначается через F(x) ж определяется как
где Р[Х ^ х]—вероятность того, что значение случайной величины X не превы-
превысит X.
Плотность вероятности выражается формулой
Свойства функций F(x) и f{x) определяются соотношениями:
F{x)= | f(x)dx,
(^oo) = lim F(x) = 0, f f(x) dx = 1,
F(+oo) = lim F{x) = 1, ?[хг < x ^ x2] = F(x2) - F(x{),
^(^г) ^ F(xi), если Х2 ^ x\.
Если известен закон распределения вероятностей случайной величины, то можно
решать многие практические задачи, возникающие при статистическом анализе экс-
экспериментальных данных. Например, вычисление вероятности попадания случайной
величины в заданный интервал, вероятности превышения случайной величиной
заданного значения и т. п. Определенное представление о функции распределения
дают его квантили. По определению а • 100 %-я квантиль (а-квантиль) распреде-
распределения, обозначаемая ха, соответствует условию
Р(Х < ха) = F(xa) = a.
Для описания функций распределения пользуются специальными мерами, по-
позволяющими охарактеризовать положение, форму и другие их особенности.
Центр распределения характеризуется средним значением /i, медианой Me,
модой Мо. Среднее значение ц равно первому начальному моменту, медиана явля-
является 50%-й квантилью распределения, мода соответствует значению х случайной
величины, для которого f(x) = max.
Рассеяние случайных величин вокруг центра группирования оценивается дис-
дисперсией (математическое ожидание квадрата отклонения случайной величины от
24 Распределения вероятностей случайных величин [Гл. 1
среднего значения), стандартным отклонением (квадратный корень из диспер™
сии), коэффициентом вариации (отношение стандартного отклонения к математи™
ческому ожиданию случайной величины), размахом w = жшах — хш1п.
Симметричность распределения характеризуется коэффициентом асиммет-
асимметрии аз, особенности поведения случайной величины в области максимума ее плот-
плотности описываются коэффициентом эксцесса «4-
Подробно с теоретическими основами теории вероятностей и функциями рас™
пределения можно ознакомиться, обратившись к монографиям [1-22]. Исходя из
природы возникновения случайных величин, различают распределения непрерыв-
непрерывных и дискретных случайных величин.
1.1. Непрерывные распределения
1.1.1. Нормальное распределение
Описание, применение. Наиболее широко применяемое распределение. В са-
самом названии распределения отражена идея его универсальности. Нормальное рас™
пределение подробно исследовано в работах Муавра, Лапласа, Гаусса, Чебышева,
Ляпунова, Бернштейна. Теоретической основой нормального закона распределения
вероятностей является центральная предельная теорема Ляпунова, утверждающая,
что распределение суммы независимых случайных величин с любым исходным рас-
распределением будет нормальным, если число слагаемых достаточно велико, а вклад
каждого в сумму мал.
Нормальное распределение является краеугольным камнем математической ста™
тистики в силу ряда причин:
— схема его возникновения соответствует многим реальным физическим про™
цессам, порождающим результаты обрабатываемых наблюдений;
— при возрастании объема выборки предельное распределение для большин-
большинства распределений является нормальным и с успехом может использоваться для
аппроксимации последних;
— нормальное распределение обладает рядом благоприятных математико-ста-
тистических свойств (легко нормируется и аппроксимируется, обладает свойством
аддитивности).
В теории надежности нормальное распределение обычно используется для опи-
описания износовых отказов, интенсивность которых со временем возрастает.
Свойства
Обозначение -^"(м?а)
Параметры /х, а
ТТ ?( X 1 I I X - U
Плотность j(x;/i,(j) = —-j= ехр < — I
X ,
Функция распределения F(x;u1a) = —-= ехр < —-
— оо ^
(^оо < х < +оо)
Среднее М(ж) = ц
Дисперсия D(x) = a2
Стандартное отклонение а
Коэффициент вариации v = —
1.1] Непрерывные распределения 25
Коэффициент асимметрии аз = О
Коэффициент эксцесса «4 = 3
Мода Мо = и
Медиана Me = /i
Распределение симметрично относительно точки х = /i и имеет два параметра
/л и сг, совпадающих со средним значением и стандартным отклонением.
Для удобства в практических приложениях применяется нормированная слу™
чайная величина z = (х — /i)/c", распределение которой называется стандартным
нормальным с нулевым средним и единичной дисперсией: 7V@,1).
В большинстве пособий по теории вероятностей и математической статистике
приводятся таблицы функции
или связанной с ней функции (интеграла) Лапласа
Очевидно, что
F(-*) = 1 - F(z) и P(a^z^b) = F(b)-F(a).
п
Сумма у = ^Р а^ж^ нормально распределенных случайных величин N(/j,i]ai) рас™
г=1
преде лена нормально, р-квантиль нормально распределенной случайной величины
i?(/i, а) связан с квантилью ис случайной величины, имеющей стандартное нор-
нормальное распределение 7V@,1), соотношением
Up = /JL + UpCT.
В силу симметричности нормального распределения и^ = ^и\_р.
Обширные таблицы нормального распределения приведены в [23—29]. Часть их
воспроизведена в табл. 1. Так как таблицы всегда ограничены, приведем известные
аппроксимации, достаточно легко реализуемые применением существующих массо-
массовых микрокалькуляторов или персональных ЭВМ.
Аппроксимация 1 [30]:
где А = A + bzy1; Ь = 0,33267; аг = 0,4361836; а2 = ^0,1201676; а3 = 0,937298.
Абсолютная погрешность ^ 1 • 10~5.
Аппроксимация 2 [30]:
F(z) = 1 - (V2^2/2) ~X J2 ^\
где А = A + bzy1; Ь = 0,2316419; аг = 0,31938153; а2 = -0,35656378; а3 = 1,7814779;
а4 = -1,821256; а5 = 1,3302744.
Абсолютная погрешность ^ 1 • 10~ .
26
Распределения вероятностей случайных величин
[Гл. 1
Таблица 1
Квантили стандартного нормального распределения
р
0,50
0,52
0,54
0,56
0,58
0,60
0,62
0,64
0,66
0,68
0,70
0,72
0,74
0,76
0,78
0,80
0,00000
0,05015
0,10043
0,15097
0,20189
0,25335
0,30548
0,35846
0,41246
0,46770
0,52440
0,58284
0,64334
0,70630
0,77219
0,84162
Р
0,820
0,840
0,860
0,880
0,900
0,910
0,920
0,930
0,940
0,950
0,960
0,970
0,980
0,990
0,992
0,994
ир
0,91536
0,99446
1,08032
1,17499
1,28155
1,34075
1,40507
1,47579
1,55477
1,64485
1,75069
1,88079
2,05375
2,32635
2,40891
2,51214
Р
0,995000
0,996000
0,997000
0,998000
0,999000
0,999200
0,999400
0,999500
0,999600
0,999700
0,999800
0,999900
0,999950
0,999990
0,999995
0,999999
Up
2,57583
2,65207
2,74778
2,87816
3,09023
3,15591
3,23888
3,29053
3,35279
3,43161
3,54008
3,71902
3,89059
4,26489
4,41717
4,75342
Аппроксимация 3 [31-33]:
(c5 + z(c4 + z(c3 + z(c2
где a = 5,383; c2 = 48,891; c3 = 38,004; c4 = 3277,626; c5 = 21141,006; c6 = 49867,347.
Абсолютная погрешность ^ 5 • 10 .
Аппроксимация 4 [32, 34]:
Относительная погрешность ^ 0,3%.
Аппроксимация 5 [32]:
= <1^ехр И , 0<z^l,96; 0 ^ #(z) ^ 0,95.
Абсолютная погрешность ^ 0,114.
Аппроксимация 6 [32]:
= il-
0 < z ^ 5,327; 0 ^ #(z)
где k = 0,1253.
Относительная погрешность ^ 1%.
Аппроксимация 7 [35]:
ехР Г - *Ч (-
1-7
4
Z
¦°4Т
где ai = 0,278393; a2 = 0,230389; a3 = 0,0000972; a4 = 0,078108.
1.1] Непрерывные распределения 27
Аппроксимация 8 [36]:
{(i±ifpJ'34}, г>0;
при z < 0 F(-z) = 1 - F(z).
Абсолютная погрешность ^ 0,0002.
Аппроксимация 9 [37]:
[] ^ , Р ^ 0,01.
Аппроксимация 10 [38]:
где с0 = 2,515517; а = 0,802853; с2 = 0,010328; 4 = 1,432788; d2 = 0,189269;
d3 = 0,001308.
Абсолютная погрешность ^ 0,00045.
Аппроксимация 11 [37]:
[()] У , Р ^ 0,05.
Аппроксимация 12 [32]:
= --1пA -р2) , р<0,99.
Относительная погрешность ^ 3,7%.
Аппроксимация 13 [32]:
2
где к = 1,898.
Относительная погрешность
Аппроксимация 14 [32]:
0 < р ^ 1 - 1 • 10,
Относительная погрешность ^ 0,3%.
Аппроксимация 15 [39]:
Относительная погрешность ^ 0,3%.
Аппроксимация 16 [36]:
/ X 0,4274
и = 2,0637 In 0,16 - 1,5774, 0,5 ^ р ^ 0,999.
V г~Р J
Абсолютная погрешность ^ 0,0008.
28 Распределения вероятностей случайных величин [Гл. 1
Аппроксимация 17 [33]:
- -lnl-pU -Ьл/2 1-р
0,0455 > 1 - р > 1,244 • 10
Относительная погрешность ^ 0,6%.
Аппроксимация 18 [40]:
где 5 = -0,717; а = -0,416.
Аппроксимация 19 [40]:
~5;
0,
^ (-6 - Л/Ь2+4а1пA-р)), р > 0,5,
где Ь = -0,717; а = -0,416.
Относительная погрешность ^ 0,5%.
Аппроксимация 20 [114]:
F(z) = {1 + exp[^0,0725zB2 + z1'96)] }~\ z ^ 0;
при z < 0 F(z) = l-F(-2).
Точность при трех знаках абсолютная, в четвертом знаке максимальная погрень
ность 0,02%. Это одна из наиболее простых и весьма точных аппроксимаций.
Аппроксимация 21 [114]:
124 + 085Ж0;657
р ^ 0,5,
о,ооож3 + ^р'
где К = — In ( — — 1
\Р
Относительная погрешность 0,3%.
Для многих приложений требуется знание математического ожидания г-й поряд™
ковой статистики в выборке объема п из стандартного нормального распределения,
т. е. математического ожидания г-го по номеру члена выборки, упорядоченной по
возрастанию.
Известно, что математическое ожидание г-го по величине члена выборки из стан-
стандартного нормального распределения М(^) равно квантили ир>, где р' = -^- [40].
Таким образом, аппроксимации для квантилей могут быть использованы и для
аппроксимации математических ожиданий порядковых статистик, что позволяет
отказаться от применения громоздких таблиц.
Поясним применение предложенных аппроксимаций при решении практических
задач.
Задача 1. Вычислить значение функции распределения вероятностей в точке
х = 200, если случайная величина распределена нормально со средним ц = 100 и дис-
дисперсией а = 2500.
Значение нормированной переменной определим по формуле
_ х - fj, _ 200 - 100 _
Z ~~ a ~ 50 ~
Таким образом, смысл задачи состоит в нахождении значения F(z) = P(z ^ 2).
1.1] Непрерывные распределения 29
Для вычисления FB) воспользуемся приведенными ранее аппроксимациями. Для
контроля будем иметь в виду, что точное табличное значение FB) = 0,97725.
Аппроксимация 1. Вычисляем Л = = 0,60047798.
F щ 1 + 0,332567-2
Далее имеем (л/2тге~2~) = B, 506628275е2)~1 = 0,053990966.
з
Находим ]Г а»Л* = 0,436836 • 0,60047798 - 0,1201676 • @560047798J + ... = 0,421529962.
г=1
Вычисляем FB) = 1 - 0,053990966 • 0,421529962 = 0,97724119.
_ . 0,97725-0,97724119 _
Относительная погрешность о = = 0,0009%.
Аппроксимация 2. Вычисляем
Л = = 0,683394431 и л/2тгехр — = 0,053990966.
1 + 0,2316419-2 \ \2 J J
5
Вычисляем ]Г а{ • А* = 0, 31938153 • 0,683394431 - 0,35656378 • @,683394431J + ... =
= 0,421367913.
Находим FB) = 1 - 0,053990966 • 0,421367913 = 0,977249939.
0 97725 — 0 9772499
Относительная погрешность S = — = 0,000006%.
F 0,97725
Аппроксимация 3. Последовательно вычисляем 5,383 • 2 + 48,891 = 59,657; 59,657 • 2 +
+ 38,004 = 157,318; 157,318 • 2 + 3277,626 = 3592,262; 3592,262 • 2 + 21141,006 = 28325,53;
28325,5 • 2 + 49867,347 = 1065518,407; A + 10~6 • 2 • 1065518,407)~16 = 0,45500513.
Находим ФB) = 1 - 0,45500513 = 0,954499486 и окончательно
,_,, ч 1 + ФB) 1 + 0,954499486
FB) = — = - = 0,'
К J 2 2
Относительная погрешность S = 0,00003%.
Аппроксимация 4. Вычисляем
v^ {-lf'Z2i _ 22 24 -z-
^ 2* .г! • Ai + Л\ ~ ~ 2^ 22 • 2! • Б ~ 23 • .4! • 7
2*-г!-Bг + 1) 2-3 22 • 2! • 5 23 • 3! • 7 24 • 4! • 9
и находим
ФB) = \ - • 2 • 0,616931216 = 0,984479744; FB) = 1 + Ф^ = 0,992239892.
V тг 2
Относительная погрешность S = 1,5% велика.
2 • 2"
Аппроксимация 5. Вычисляем ФB) = Wl —ехр( 1 = у/1 — е™2'546479089 =
V v ж )
= 0,960022359.
Имеем FB) = 1 + Ф^ = 0,98011179.
Относительная погрешность S = 0,28% велика, так как аппроксимация применена
для z > 1,96; Ф(^) > 0,95, т.е. за пределами допустимого диапазона.
Аппроксимация 6. Вычисляем последовательно 1+0Д253-22 = 1,5012; ( 0,1253 1 х
х 22 = 2,045279089; е'045279089 = 0,129344086; 1 - °?129344086 = 0,913839537.
Далее имеем ФB) = ^0,913839537 = 0,955949547 и окончательно
= 0,977974773.
т
к J 2
Относительная погрешность S = 0,07%.
30 Распределения вероятностей случайных величин [Гл. 1
2
Аппроксимация 7. Вычисляем последовательно 0,27893 • —^ = 0,393707156; 0,23089 х
V2
4 23 24
х ~~ = 0,460778; 0,000972 . —= = 2,7492311 • 10~3; 0,078108 • — = 0,312432.
2 ' ' ' 2лД ' ' 4
Окончательно вычисляем
FB) = 1 - 0,5A + 0,393707156 + 0,460778 + 2,7492311 • 10~3 + 0,312432) =
= 1 - 0,5 • 2,169666387^4 = 0,977436931.
Относительная погрешность 8 = 0,02%.
+ :
^0637
2 + 1 5774 \ '
Аппроксимация 8. Вычисляем ( ;^ОУу ) = 3,623055577 и е-з,б23055577 =
= 0,026700965.
Окончательно находим FB) = 1 - 0,852 • 0,026706965 = 0,977250777.
Относительная погрешность 8 = 0,00007%.
Аппроксимация 18. Вычисляем ^0,717 • 2 - 0,416 • 22 = ^3,098; е'098 = 0,04513939.
Находим F{2) = 1 - 0,5 • 0,04513939 = 0,97743005.
Относительная погрешность 8 = 0,018%.
Аппроксимация 20. Вычисляем FB) = {l + exp [^0,0725 • 2 • B2 + 21'96)] j =
= 0,977115384.
Относительная погрешность S = 0,014%. Это одна из наиболее простых и точных
аппроксимаций.
Задача 2. Для случайной величины, имеющей стандартное нормальное распределение,
найти значение, вероятность превышения которого равна 0,05.
Другими словами, требуется найти значение ир: Р (х ^ ир) = 0,95, или Р (ж > ир) =
= 0,05. По определению ир —верхняя 95%-я квантиль случайной величины. Воспользуем-
Воспользуемся аппроксимациями для стандартного нормального распределения. Табличное значение
его квантили гхо,95 = 1,64485363.
Аппроксимация 9. Так как эта аппроксимация применима только для значений
р ^ 0,01, воспользуемся соотношением ир = ^и\^р и будем искать квантиль и\-р = 1^0,95,
ИМеЯ В ВИДУ, ЧТО 1l.o,95 = — ^0,05 •
Вычисляем
1 г
tio,o5 =-[-21п(у2тг-0,05)] 2 = - [-2 In0,125331413] 2 =-2,038035201.
Следовательно, ио,95 = 2,038035201.
Относительная погрешность 8 = 23,95% очень велика. Это объясняется тем, что
аппроксимация применена вне допустимых пределов (должно быть р ^ 0,01).
I 2
Аппроксимация 10. Вычисляем t = [-2 In A - 0,95)] 2 = 2,447746831 и ]Г а? =
i=0
= 2,515517 + 0,802853 • 2,447746831 + 0,010328 • 2,4477468312 = 4,542577732.
з
Далее J2 dit% = 1,432788-2,447746831+0,189269-2,4477468312+0,001308-2,4477468313 =
= 4,66028338.
Вычисляем —1 = 0,80253539 и окончательно и0 95 = 2,447746831 ~~
1 + 4,66028338 '
- 0,80253539 = 1,64521144.
Относительная погрешность 8 = 0,02%.
Аппроксимация 11. Вычисляем последовательно л/2жр = л/2ж • 0,05 = 0,125331413;
^/0,125331413 = 0,35402177; -2 In 0,35402177 = 2,07679374; лДж • 0,05 • 2,076679374 =
= 0,260287495; -2 • In 0,260287495 = 2,69193701; ^0,05 = -^2,69193701 = -1,64071235.
Следовательно, г^о,э5 = — tto,o5 = 1,64071235.
Относительная погрешность 8 = 0,25%.
1.1] Непрерывные распределения 31
Аппроксимация 12. В нашем случае = 0,95, откуда р = 0,9 и г^о,95 =
= J-- 1пA - 0,92) = 1,615137313.
Относительная погрешность S = 1,8%.
Аппроксимация 13. Имеем по аналогии = 0,95 и р = 0,9. Далее вычисля-
1
ем -In A - 0,91>898) = 1,707888074; 1,707888074^эв = 1,325793782. Окончательно имеем
^о,95 = у - ' 1,325793782 = 1,66163609.
Относительная погрешность 6=1%.
1 -\- р
Аппроксимация 14. По аналогии = 0,95 и р = 0,9. Далее вычисляем
- 1пA - 0,94) = 1,067404362; A,067404362I = 1,102791627; - In y/l - 0,92 = 0,830365603;
7т( — • 1,102791627 + 0,830365603 J = 2,693171017.
Окончательно имеем ио,95 = ^25693171017 = 1,641088363.
Относительная погрешность 6 = 0,2%.
Аппроксимация 15. Вычисляем 0,950'14 = 0,9922844661; A - 0,95H'14 = 0,65743951.
Следовательно, ио,95 = 4,91@,992844661 - 0,65743951) = 1,646839291.
Относительная погрешность 5 = 0,12%.
Аппроксимация 16. Вычисляем In 0,16 = 2,835732274; 2,8357322740'4274 =
1-0,95
= 1,561238015.
Окончательно имеем ио,95 = 2,0637 • 1,561238015 ~~ 1,5774 = 1,644526892.
Относительная погрешность 6 = 0,02%.
Аппроксимация 17. Вычисляем -1пA - 0,95L = 3,744665342; -1п-\/2A - 0,95) =
= 1,151292546; 3^744665342 + 1Д51292546 = 1,314104083.
/———————————————————
Окончательно вычисляем гхо,95 = V71" * 1,314104083 = 2,031841464.
Относительная погрешность S = 23,5% велика, так как значение р = 0,05 находится
вне области применения этой аппроксимации.
Аппроксимация 19. В нашем случае = 0,95 и р = 0,9.
Вычисляем 4- (-0,416) • 1пA - 0,9) = 3,831501595 и ^0,7172 + 3,831501595 = 2,084608019.
^ 0,717^2,084608019 „.__„
Окончательно имеем uq 95 = = 1,643759638.
—2 • 0,416
Относительная погрешность S = 0,066%.
Аппроксимация 21. Вычисляем i^ = — In f 1 1 = 2,944438979. Далее имеем
1,24 + 0,85 • 2,Э44438Э7Э
0'657
1 + 0,0001 • 2,9444389793 -\ :
' 2,944438979
Относительная погрешность S = 0,35%.
Задача 3. Найти математические ожидания 3-й, 7-й и 9-й порядковых статистик
в выборке объема п = 15 из стандартного нормального распределения.
Вычислим необходимые вероятности
о о /о
— для третьей порядковой статистики (г = 3) рз = т~ = 0,172131148;
у о /о
— для седьмой порядковой статистики (г = 7) р7 = у- = 0,434426230;
32 Распределения вероятностей случайных величин [Гл. 1
9 — 3/8
— для девятой порядковой статистики (г = 9) рд = у- = 0,565573770.
15 -f- 1/4
Далее воспользуемся простыми, но достаточно точными аппроксимациями 15 и 16.
В соответствии с аппроксимацией 15 находим
z3 = 4,91[0,1721311480'14 - A - 0Д72131147H'14] = -0,9438796;
z7 = 4,9l[0,4344262300'14 - A - 0,434426230H'14] = -0,1643847;
z9 = 4,9l[0,5655737700'14 - A - 0,565573770H'14] = 0,1643847.
При использовании аппроксимации 16 получаем (для z3 и z7 используем соответственно
формулы для р = 1 — рз и р = 1 — ру с заменой знака перед ир, так как ир = 1 — и\-р):
/ \ 0,4274
Z3 = 1X0,172131148 = -2,06371 In ni>7Oiqi1>ia - 0,16 1 + 1,5774 = -0,94508893;
\ 0,lizloll4o /
/ \ 0,4274
z7 = tto,43442623o = -2,0637 f In 0,16 J + 1,5774 = -0,16577582;
/ \ 0,4274
Z9 = tto,56557377o = 2,0637 ( In r-rrrrzrzzr - 0,16 ) - 1,5774 = 0,16577582.
Задача 4. Долговечность прибора подчиняется нормальному распределению со сред-
средним /i = 100 ч и стандартным отклонением а = 50 ч. Вычислить вероятность то-
го, что долговечность прибора будет больше 200 ч; меньше 50 ч; будет находиться
в интервале от 70 ч до 120 ч. Вычислить значение долговечности прибора, вероят-
вероятность превышения которого равна 0,01; 0,95. Вычислить математическое ожидание
2-й и П-й порядковых статистик в выборке из 20 испытываемых приборов.
х — 100
Переходим к нормированной переменной z = . При х = 200 ч имеем
ои
200 100
z = = 2. Вероятность того, что долговечность прибора будет превышать 200 ч,
50
равна (по определению)
Р(ж > 200) = 1 - Р(ж ^ 200) = 1 - F{z) = 1 - F{2).
Используя полученное в задаче 1 значение F{2) = 0,97725, получаем 1 — FB) = 0,02275.
Следовательно, вероятность того, что долговечность прибора превысит 200 ч, равна
0,02275.
При х = 50 имеем z = = — 1. Вероятность того, что долговечность прибора
5U
не превысит 50 ч, равна Р(ж < 50) = F(z) = F(—1) = 1 — ^A)- Используя простую ап™
проксимацию 18, вычисляем
F(l) = 1 - - ехр (-0,714 • 1 - 0,416 • 1) = 0,838967;
Р (х < 50) = 1 - 0,838967 = 0,16103.
Следовательно, вероятность того, что долговечность прибора будет меньше 50 ч, равна
0,16103.
Для вычисления вероятности попадания долговечности прибора в интервал G0; 120] ч
70 - 100 120 - 100
определим z\ = = —0,6 и Z2 = = 0,4.
50 50
Имеем РG0 < х ^ 120) = F@,4) - F(-0,6) = F@,4) + F@,6) - 1.
Воспользуемся аппроксимацией 8:
F@,6) = 1 - 0,852 ехр - (^Ж^) ' = 0,725795209;
1.1] Непрерывные распределения 33
Г /0 4 + 15774\2'341
F@,4) = 1 - 0,852 ехр - ( ? ; ] = 0,655128697.
|_ V / j
Находим
РG0 < х ^ 120) = 0,725795209 + 0,655286976 - 1 = 0,321082197.
Следовательно, вероятность того, что долговечность прибора будет находиться в ин-
интервале G0; 120] ч, равна 0,381.
Найдем теперь значение долговечности прибора, вероятность превышения которого
равна 0,01. Это значение равно квантили распределения при р = 0,99. Воспользуемся
аппроксимацией 16. При р = 0,01 имеем
/ г 4 0,4274
и0 99 = 2,0637 In 0,16 - 1,5774 = 2,3269978.
V 1 - 0,99 'у
Это квантиль стандартного (нормированного) нормального распределения, а искомая ве-
величина является квантилью исходного ненормированного распределения. Переход к нему
осуществляется по формуле
г^дэ = М + ио,99(т = ЮО + 50 • 2,3266997 = 216,35.
Следовательно, с вероятностью 0,01 можно утверждать, что долговечность прибора
превысит 216,35 ч.
Долговечность прибора, вероятность превышения которой 0,95, соответствует кван-
квантилю ио,о5 = ^^о,95- В соответствии с аппроксимацией 16 получим
/ \ 0,4247
и0 95 = 2,0637 [ In 0,16 ) - 1,5774 = 1,644527.
V 1 - 0,95 'у
В нашем случае искомая стандартизованная величина квантили есть tio,o5 = —1,644527,
или для исходного ненормированного распределения
^о)О5 = /л + и0}05а = 100 - 50 • 1,644527 = 17,77.
Таким образом, с вероятностью 0,95 долговечность прибора будет больше 17,8 ч.
Вычислим теперь математическое ожидание 2-й и 11-й порядковых статистик в вы-
выборке испытываемых приборов численностью п = 20. Имеем
3 3
2^8 И^8
для г = 2 р2 = у = °5°802469; Для i = И Ри = J" = 0,52469138.
20 + - 20 + -
4 4
Тогда с помощью аппроксимации 16 имеем
/ 4 0,4274
«2 = ио,о8О24б9 = -2,0637 I In 0,16 ] + 1,5774 = -1,402743931,
или для исходного распределения
жB) = 100 - 50 • 1,402743931 = 29,86 ч.
По аналогии для z\\ имеем
0,4274
211 = «0,52469136 = 2,0637 Ь -— - 0,16 - 1,5774 = -0,062226575,
у I — O,5z4oyi«3o J
или для исходного распределения
Ж(ц) = 100 - 50 • 0,062226575 = 96,89 ч.
Таким образом, при испытании 20 приборов с заданным распределением долговеч-
долговечности математические ожидания долговечности 2-го и 11-го приборов, ранжированных
в порядке возрастания долговечности, будут равны соответственно 29,9 ч и 96,9 ч.
2 А. И. Кобзарь
34 Распределения вероятностей случайных величин [Гл. 1
1.1.2. Равномерное распределение
Описание, применение. Находит широкое применение в непараметриче-
непараметрической статистике. Равномерному распределению подчиняются случайные величины,
имеющие одинаковую вероятность появления (например, погрешность измерений
с округлением).
Свойства
Обозначение .R(a, Ь)
Параметры а, Ь
Плотность /(ж; а, 6) = <
I 0, х < а; х > b
х ^ а;
Функция распределения F(x; а, Ь) = ^ , а < х < Ь;
Среднее М(ж) = ' ™
Дисперсия 13 (ж) = —
12
Коэффициент вариации г; = —=-
лДЬ + а
Коэффициент асимметрии «з = О
Коэффициент эксцесса «4 = 1,8
Ъ + а
Медиана Me = ^-^ = ЪА(х)
2
Мода не определена
Сумма п независимых равномерно распределенных случайных величин описы-
описывается нормальным распределением уже при п ^ 5. Функция распределения любой
случайной величины у — F(y) сама распределена равномерно на отрезке [0,1].
Задача 5. Погрешность измерения прибора распределена равномерно на интервале
[5; 10]. Найти вероятность того, что погрешность прибора не превышает 7 ед. Вычис-
Вычислить погрешность измерения, вероятность превышения которой равна 0,95. Вычис-
Вычислить вероятность того, что погрешность измерения будет находиться в интервале
6 -г- 8 ед.
Имеем равномерно распределенную случайную величину с параметрами распределен
ния а = 5 и Ъ = 10.
Вероятность того, что погрешность не превысит х = 7 единиц, равна FG) = =
Хи — о
= 0,4. Значение случайной величины, вероятность превышения которого равна 0,95, на-
находим из условия F(x) = = 1 — 0,95 = 0,05, откуда xq 95 = (Ю — 5) • 0,05 + 5 = 5,25.
о — а '
Вероятность того, что погрешность измерения будет находиться в интервале [6; 8], нахо™
дим из условия
РF ^ х < 8) = F(8) - FF) = ^- - ?=4- = 0,4.
1.1] Непрерывные распределения 35
1.1.3. Логарифмически нормальное распределение
Описание, применение. Если случайная величина Y распределена нормаль-
нормально, то случайная величина х = In У подчинена логарифмически нормальному (или
логнормальному) закону распределения. Часто используется для описания изно-
совых отказов. У многих невосстанавливаемых электронных приборов (некоторые
типы электронных ламп, полупроводниковые приборы) наработка на отказ распре-
распределена логарифмически нормально.
Свойства
Обозначение LN(/i, a)
Параметры /i, a
1 ( (] \21
Плотность f(x'j /^ а) = 1= ехР л — 2— м ж, сг > О
хау2тт [ 2а J
X
Функция распределения F(x; /i, a) = —-= ехр < — - ^— > dt; x > О
<ту2тг J [ 2а J
о
Среднее М(ж) = ехр< /z И—сг2 >
Дисперсия О(ж) = exp{2jti, + сг2}(е<7 — l)
Коэффициент вариации v = (еа — l) ^
2 ^ 2
Коэффициент асимметрии «з = (e<J ~~ l) 2 (е<т + 2)
Коэффициент эксцесса «4 = 3+ (е*7 — l) (е3<т + Зе2ст + б)
Мода Мо = ехр(/х — ст2)
Медиана Me =
Распределение имеет положительную асимметрию. Произведение независимых
случайных величин, подчиняющихся логарифмически нормальному распределе-
распределению, также распределено логарифмически нормально.
Логарифмически нормальное распределение иногда ошибочно принимается за
экспоненциальное [47]. При вычислениях, связанных с логарифмически нормаль™
ным распределением, пользуются приемами для нормального распределения, за™
меняя при этом значение случайной величины ее логарифмом. Подробный анализ
этого распределения приведен в [42].
Укажем приблизительные критерии проверки логнормальности распределе-
распределения [43]. Распределение случайной величины близко к логнормальному, если
—^ У\Ых-Ых\ = \ -= 0,79788
па\пх ^—^ у ^
или
lgMe = ln#, где In ж = - )• In ж^ и аых = 7 У.{^пх{ ~ 1пз^) .
71 П — 1
i=l
Задача 6. Предполоэюим, что время безотказной работы элемента прибора — случай-
случайная величина, подчиняющаяся логарифмически нормальному закону распределения ве-
вероятностей с медианой, равной 1000 ч, и модой, равной 400 ч. Вычислить вероятность
того, что элемент будет работать меньше 2000 ч.
Имеем Me = ем = 1000, или fi = In 1000 = 6,908; Mo = exp(/i - a2) = 400, или
fi-a2 = In400 = 5,991 ж a2 = 8,908 - 5,991 = 0,917 (a = 0,958).
36 Распределения вероятностей случайных величин [Гл. 1
Воспользуемся нормированной случайной величиной z = и для х = 2000
а
In 2000- 8,908 п _
имеем z = = 0,723. Применяя аппроксимацию 8 для нормального распре-
распределения, получим
Р(ж < 2000) = Viz < 0,723) = Fiz) = 1 - 0,852 exp \ - ( °'723 + 1>;
I у 2,063 <
5774\2'34
I \ 2,0637 )
= 1 - 0,852 ехрA - 1,289278973) = 0,76553.
1.1.4. Экспоненциальное распределение
Описание, применение. Одно из наиболее часто встречающихся распределе-
распределений в теории надежности и в теории массового обслуживания. Используется для
описания внезапных отказов, когда износом изделия можно пренебречь. Наработка
на отказ многих невосстанавливаемых изделий и наработка между соседними отка-
зами у восстанавливаемых изделий в случае простейшего потока отказов подчинены
экспоненциальному распределению. Наработка на отказ большой многокомпонент-
многокомпонентной системы может быть описана экспоненциальным распределением при любом
распределении наработки на отказ компонентов системы.
Свойства
Параметр Ь
1 / х \
Плотность f(x; b) = - expf — — 1, х ^ 0
Функция распределения F(x1b) = 1 — ехр( — — J, х ^ 0
Среднее М(ж) = b
Дисперсия 1}(х) = Ь2
Коэффициент вариации v = 1
Коэффициент асимметрии аз = 2
Коэффициент эксцесса «4 = 9
Мода Мо = 0
Медиана Me = bin 2 = 056931Ь
Экспоненциальное распределение является частным случаем гамма-распределе-
гамма-распределения (см. раздел 1.1.6) и распределения Вейбулла (см. раздел 1.1.5). Отличитель-
Отличительная особенность экспоненциального распределения — постоянство интенсивности
отказов 1/b = const — в теории надежности интерпретируется как независимость
вероятности отказа от наработки, что эквивалентно отсутствию износа.
Задача 7. Наработка на отказ прибора распределена экспоненциально с интенсивно-
интенсивностью отказов А = 1СР51 ч^1. Вычислить вероятность того^ что наработка на отказ
превысит 1000 ч. Найти вероятность того, что наработка на отказ будет находиться
в интервале от 1200 до 1500 ч. Вычислить значение наработки^ вероятность превы-
превышения которой 0,8. Определить^ как изменится наработка прибора при уменьшении
интенсивности отказов до X = 0,5 • 10~ ч~ .
Вероятность того, что наработка на отказ превысит 1000 ч, равна
Р(ж > 1000) = 1 - FA000) = 1 - 1 + е^1000'10™5 = е^10™2 = 0,99.
1.1]
Непрерывные распределения
37
Вероятность того, что наработка будет находиться в интервале от 1200 ч до 1500 ч,
определяем по формуле
РA200 < х < 1500) = FA500) - FA200) = 1 - е^1500-10™5 _ \ + e^i2oo-io™5 =
= е^0'012 - е^0'015 = 0,988071712 - 0,985111939 = 0,0029598.
БСаработку у, вероятность превышения которой равна 0,8, находим из соотношения
Р(ж >у) = 1- F(y) = 0,8. Отсюда имеем 1 - 1 + е^у'10^ = 0,8, или уЛ0~5 = 0,22314355.
Окончательно у = 2,23 • 104 ч.
При снижении интенсивности отказов до Л = 0,5-10™5 имеем у-0,5• 10" = 0,22314355,
или у = 4,46 • 104 ч.
1.1.5. Распределение Вейбулла
Описание, применение. Этому распределению подчиняется наработка на
отказ многих невосстанавливаемых электронных приборов (электроннвге лампы,
полупроводниковые приборы, некоторые приборы СВЧ). Характеризуется разно™
образием форм кривых распределения.
Свойства
Обозначение
Параметры
Плотность
Функция распределения
Среднее
Дисперсия
Коэффициент вариации
Коэффициент асимметрии
М(ж) = аГA + ^
' х\@
= 1-ехр|-(-
х ^ 0, а,/3>0
х ^ 0, а,/3>0
ш
v =
~~ 1
Коэффициент эксцесса
Мода
38 Распределения вероятностей случайных величин [Гл. 1
При /3 = 1 распределение Вейбулла переходит в экспоненциальное (см. раз™
дел 1.1.4) с параметром а, а при /3 = 2 — в распределение Рэлея (см. раздел 1.1.15).
Вычисление моментов распределения Вейбулла производится по таблицам гамма-
функции. Таблицы функции и моментов распределения Вейбулла приведены в [44].
Задача 8. Наработка прибора подчиняется распределению Вейбулла с параметрами
а = 2 и /3 = 3. Вычислить моду распределения и вероятность нахождения наработки
прибора в интервале между 5 и 6.
Находим моду распределения Мо = а( 1 — — 1 = 2A J = 1,74716.
Далее
РE ^ х ^ 6) = FF) - FE) = 1 - exp I - ( - ) ? - 1 + expi - f -
' ^exp<J^(") [> = 1,6373771 • 1(Г7 - 1,8795288 -1(Г12 = 1,637-10"
1.1.6. Гамма-распределение
Описание, применение. Широко используется в теории надежности и в тео™
рии массового обслуживания. Наработка между несмежными отказами подчиняет-
подчиняется гамма-распределению. Этому распределению (с параметром а = г — 1) подчиня-
подчиняется сумма г независимых случайных величин, каждая из которых имеет экспонен-
экспоненциальное распределение. Если наработка на отказ невосстанавливаемого прибора
распределена экспоненциально, то, при испытаниях на безотказность с заменой
отказавших приборов, момент г-го отказа подчиняется гамма-распределению с па-
параметром а = г — 1. Гамма-распределение с целочисленным значением параметра
называется также распределением Эрланга.
Свойства
Обозначение j(a^C)
Параметры а, /3
Плотность
/(ж;а,/3) = хтж" ехр( —— J, ж>0, /3>0, а>1
Функция распределения
г=0
где Т^(а + 1) —неполная гамма-функция, значения которой приведены, например,
в [45-47]
Среднее М(х) = /3(а + 1)
Дисперсия D(x) = /32(а + 1)
Коэффициент вариации v = (а + 1)~2
Коэффициент асимметрии аз = 2(а + 1)~^
Коэффициент эксцесса «4 = 3 + 6(а + I)™1
Мода Мо = а/3
1.1] Непрерывные распределения 39
При а = 0 гамма-распределение переходит в экспоненциальное (см. раздел 1.1.4).
При использовании в теории надежности интенсивность отказов убывает при а < О,
постоянна при а = 0 и возрастает при а > 0, что позволяет использовать гамма-
распределение при моделировании различных ситуаций, возникающих в процессе
анализа надежности изделий.
Гамма-распределение обладает свойством аддитивности, т. е. сумма независи-
независимых величин, подчиняющихся гамма-распределению с параметрами C и о^, имеет
также гамма-распределение с параметрами /3 и ]Р щ. Подробно гамма-распределе-
гамма-распределение исследовано в [48, 49].
При (а + 1) полуцелом (т. е. когда 2(а + 1) —целое число) гамма-распределение
можно рассматривать как частный случай распределения %2 (см. раздел 1.1.8)
с 2(а + 1) степенями свободы. Поэтому для расчетов, связанных с гамма-распре-
гамма-распределением, могут быть использованы таблицы и аппроксимации распределения %2.
Распределению х2 с / = 2(а + 1) степенями свободы подчинена случайная вели-
2х „ „
чина 7 = "~тг? т-е- квантиль случайной величины 7 может быть вычислена как
7р = 77Хр [2(« + 1)] > гДе Хр [2(а + 1)] ^р™квантиль %2-распределения с / = 2(а + 1)
степенями свободы.
Задача 9. Испытывающем четыре прибора, интенсивность отказов которых извест-
известна и равна X = 1CF5 ч~г. Вычислить вероятность того, что суммарная наработка
приборов не превысит 300 000 ч.
В нашем случае имеет место гамма-распределение с параметрами а = 4 — 1 = 3
и /3 = — = 105. Тогда искомая вероятность равна
А
Р(ж < 300 000) = FC00 000) = 1 - e~d 1 + 3 + 3 • - + 3 • - = 0,352768.
V 2 6/
1.1.7. Бета-распределение
Описание, применение. Часто используется в математической статистике,
так как через бета^распределение могут быть выражены практически все приме™
няемые распределения вероятностей, в том числе и дискретные. Доля дефектных
изделий в партии подчиняется бета-распределению. Особенно велико значение бета-
распределения в непараметрической статистике (т. е. при решении задач, не требу-
требующих знания закона распределения вероятностей случайной величины).
Свойства
Обозначение В(а,/3)
Параметры а, C
Плотность
Функция распределения
х
где Вж(а + 1,/3 + 1) = жаA — x)^dx — неполная бета-функция
40 Распределения вероятностей случайных величин [Гл. 1
Среднее М(х) = _ а Q , о
Дисперсия О(ж)
Коэффициент вариации v = <
v л,л, 2(/3-а) [ а
Коэффициент асимметрии «з =
(а + /3 + 2J(а + ^ + 3)
/5 + 1 1 ^
« + д + 4 [(« + 1)(/3 + 1)
Коэффициент эксцесса
+ 2)(-а + 2/3
« + /3 + 5 « + /3 + 2
Мода Мо =
и, т /J
Наиболее компактно функция бета-распределения может быть записана с ис-
использованием бета-функции Эйлера
Тогда
Распределение симметрично при а = /3 , «з > 0 ПРИ « < /5 и «з < 0 при а > /3.
Широкое применение бета-распределения вызвано чрезвычайным разнообразием
кривых распределения, порождаемых функцией бета-распределения при различ™
ных сочетаниях его параметров. При а = /3 = 0 бета™распределение превращается
в равномерное, а при а = /3 = —1/2 — в распределение арксинуса.Через бета-распре-
бета-распределение могут быть выражены функция распределения Фишера (i^-распределение,
см. раздел 1.1.10)
* \Х, /Ь J2) = J- fix
/2+/1
и функция биномиального распределения (см. раздел 1.2.1)
J2 С1пРгA -Р)п-1 = 1 - 1р(к,п-к + 1).
г=0
Из приведенных соотношений следует связь между бета™ и ^-распределениями:
Следовательно, случайная величина B(/i, /2) = -7 ^ j?f -р—FT имеет бета-расп-
бета-распределение, или (что эквивалентно) величина
FB/1J/2) = -
1.1]
Непрерывные распределения
41
имеет ^распределение с 2/i и 2/2 степенями свободы. Отметим также, что
1х(а,0) = 1 - (l-
г=0
Для расчетов используются таблицы неполной бета-функции [50]; таблицы функ-
функции и квантили бета-распределения приведены в [51].
Если х\ и Х2—случайные величины, подчиненные гамма-распределению (см.
раздел 1.1.6) с f\ и /2 степенями свободы, то случайная величина В = х\/{х\ + Х2)
имеет бета-распределение с параметрами f\ и /2. Поскольку /ж(а,/3) = \—I\—x(Ji, a),
таблицы бета-распределения составлены для 0 < а ^ C. Однако разнообразие задач
прикладного математико-статистического анализа в настоящее время не удовле-
удовлетворяется существующими таблицами бета-распределения. Поэтому на практике
применяются различные приближения, позволяющие вычислить бета-распределе-
бета-распределение с помощью таблиц или аппроксимаций нормального распределения. Приведем
некоторые аппроксимации.
Аппроксимация Кэдуэлла [52] (при а = C)
2(а- 1)Bа + 1
Dа - IL
где у — решение уравнения
и F(y)—функция стандартного нормального распределения.
Более удобна эквивалентная формула
У=<
\4a-
т)
где ир—р™квантиль стандартного нормального распределения (см. раздел 1.1.1) и
х-2
1
2
Наиболее употребляемые значения функции (р(у) приведены в табл. 2 [50].
Таблица 2
Значения
У
0
1
2
3
0
0,000
0,339
0,367
0,125
0,1
0,040
0,360
0,348
0,105
0,2
0,079
0,377
0,326
0,087
0,3
0,118
0,391
0,302
0,071
0,4
0,156
0,400
0,272
0,057
0,5
0,191
0,406
0,249
0,046
0,6
0,226
0,406
0,222
0,036
0,7
0,258
0,403
0,196
0,028
0,8
0,288
0,395
0,171
0,022
0,9
0,315
0,383
0,147
0,017
При а ^ 5 погрешность не более 1-10 5, при а ^ 4 /ж(а, а) = F(y) дает погреш-
погрешность не более 0,00045.
Приведем еще одну полезную формулу:
1х(а,а) = 21х.(а,а), где х' = | [l - A - х)Ц .
42 Распределения вероятностей случайных величин [Гл. 1
Аппроксимация Уайза [43]. При а ^ /3 позволяет выразить бета^распределение
через х2~РаспРеДеление:
¦-1)
А—-
\24TV'
где TV = a+ ——-; y = —Nlnx и х^ имеет х2тРаспРеДеление с 2C степенями
свободы (см. раздел 1.1.18).
Еще одна аппроксимация Уайза [54]
если
1 2г|^-°>5Iп^г^т + (а-°'5Iп
! ТЬ\ 1 X I
\Р-0,5-пA-Х/1 , 1 + ^_
6п
где п = а + /3 — 1.
Приведем эквивалентную формулу
а-0,5^ 2
где di = )8 - 0,5 + ^ - (n + i) A - ж) и g(x) =
о V о /
1 -х2 + 2ж1пж
(l^f
Лучший результат дает аппроксимация для Z2, получаемая заменой в формуле
для z\ параметра d\ на d2; где
50 [ /3 а а + /
Погрешность этой аппроксимации < 0,001 при а,/3 ^ 2,0 и < 0,1 при а,/3 ^ 1,0.
Аппроксимация Кемпа-Полсона [55]. Случайная величина у имеет стандартное
нормальное распределение TV(O; 1), если
где ж — случайная величина, имеющая бета-распределение с параметрами а и E.
1.1] Непрерывные распределения 43
Задача 10. Вычислить значение функции бета-распределения с параметрами а = 4
и /3 = 3 в точке х = 0,6.
Используем формулу для прямого точного вычисления
= l -1A - св)^4-1 >: ci+3_t (т^-\г = 1 - о,4 y: <
' / г=О
= 1 - 4,096 • 103 (Се + С\ • 1,5 + Cl • 2,25 + Cf • 3,75) = 0,54432.
Рассмотрим случай а = /3 = 3 и используем аппроксимацию Кэдуэлла. Будем искать
т / \ тт 0,6-0,5
1о,бC,3). Находим р = — —(-
утг/3
проксимацию 16 из раздела 1.1.1
/о,бC,3). Находим р = -^— —(-0,5 = 0,5977205. Для вычисления ир используем ап™
/тг/3
г„ = 2,0637 ( In 0,16 - 1,5574 = 0,26816878.
р \ 1 - 0,5977205 /
1
Тогда у = ир = 0,513504118.
Для вычисления F(y) воспользуемся аппроксимацией 18 из раздела 1.1.1
F{y) = 1 - i exp(-0,717|/ ~~ 0,416t/2) = 0,68995.
Из табл. 2 имеем ip(y) « 0,192.
Окончательно получаем
/о,бC,3) = 0,68995 + 2-C~1)-B-3 + 1) . 0д92 = 0;б903>
Задача 11. Вычислить значение /о,бE,4) с помощью аппроксимации Уайза.
Имеем х = 0,6; а = 5; C = 4. Находим п = 5 + 4—1 = 8.
Далее имеем а = 4 — 0,5 Н A4— 1 • 0,4 = - и
6 у Зу 3
= 1,09375; 2_ = ^^ = 0,9375.
п • ^i — х) о • и,4 " ~
1 _ 1 ПОЧТЕ;2 _L О . 1 flQQ
g(l,09375) =
п-A-ж) 8-0,4 ' ' п-х 8-0,6
Далее имеем
- 1.093752 + 2 ¦ 1,09375 In 1,09375
A- 1,09375J
= A - 1,19628906 + 0,196026597) • 113,7777 = -0,029862726;
= 1-0,9375^ + 2.0,93751n0,9375 =
61 ' ; A09375J
Вычисляем
1
1 [1 + 0,6 • (^0,029862726) + 0,4 • 0,021509854] 2
*1 = о '
+ - ) -0,4-0,6
6
Окончательно имеем
F(z) = 1-- ехр(^0,717 • 0,169274 - 0,416 • 0Д592742) = 0,562.
44 Распределения вероятностей случайных величин [Гл. 1
Точное значение /о,бE,4) = 0,6. Точность аппроксимации может быть повышена приме-
применением более точных аппроксимаций входящих величин (функции и квантилей стандарт-
стандартного нормального распределения).
Задача 12. Вычислить 1о,бE,4) с помощью аппроксимации Кемпа-Полсона.
Вычисляем
D . 0,6I • (l - -М - E ¦ 0,4M • (l -
( (
у = 3 ^ ^-±1 i !L_V = 0,239151678.
Используя аппроксимацию 15 (см. раздел 1.1.1) для ир, имеем
ир = -4,91 • [0,23Э151678ОД4 - A - 0,239151678H'14] = 0,7068,
что не очень близко к точному значению /о,вE,4).
1.1.8. Распределение %2 (распределение Пирсона)
Описание, применение. Распределение открыто и изучено Пирсоном в 1900 г.
Если #i, ..., х f—независимые случайные величины, имеющие стандартное нор-
нормальное распределение, то сумма их квадратов ^ ж2 подчиняется % -распреде-
-распределению. Распределение хи-квадрат широко используется в прикладных задачах
математической статистики. С его помощью проверяются гипотезы относительно
значений дисперсий, проверяется согласие экспериментальных данных с теорети-
теоретическими законами распределения. Распределение хи-квадрат широко применяется
в непараметрической статистике, являясь предельным для многих выборочных
статистик.
Свойства
Обозначение X2(f)
Параметр /
1 Lzl Г Y2 ]
Плотность (р(х2; f) = ——77V ЬB) 2 ехР1 —тг > , X2 ^ 0
Функция распределения ^f(x) = -Р{х2(/)?ж} = ~—/ г\ У^"~ ехр< — — > dy.
х > 0
Среднее М[Х2(/)] =/
Дисперсия Е»[х2(/)] = 2/
[2
Коэффициент вариации v = I —
2
Коэффициент асимметрии аз = 2 ( —
1.1]
Непрерывные распределения
45
Коэффициент эксцесса
Мода
Мо = /-
Распределение имеет один параметр / — число степеней свободы, определяемый
количеством независимых случайных величин, сумма квадратов которых соста-
составляет х2- Плотность распределения х2 асимметрична, унимодальна (т.е. имеет
единственную моду) и с ростом числа степеней свободы / становится более пологой
и симметричной.
X2-распределение обладает свойством аддитивности, т. е. сумма двух независи-
независимых величин x2(/i) и Х2(/2) имеет распределение x2(/i + /2)-
Таблицы х2™РаспРеДеления имеются во многих руководствах и сборниках та™
блиц [23-25, 29, 44, 56, 57]. Предложены номограммы для расчетов х2™распределе™
ния [58].
Большинство аппроксимаций квантилей х2™РаспРеДеления основано на преоб-
преобразовании исходной случайной величины в величину, имеющую распределение,
близкое к стандартному нормальному 7V@,1).
Рассмотрим известные аппроксимации. Везде будем рассматривать верхнюю
р-квантиль, т. е. величину х»? удовлетворяющую соотношению р = 1 — Р(х2 < Хр)-
Напомним, что ир — верхняя р™квантиль стандартного нормального распределе-
распределения (т. е. р = 1 — Р(ж < ир)).
Аппроксимация 1. При / > 200 Х«(/) = / + V^f'ир-
1
Аппроксимация 2 (Фишера) [59, 60]. При / > 100 xl(f) = «(
Аппроксимация 3 (Вчлсона-Хчлфертч) [61]:
1-
9/
30.
Аппроксимация 4 [62—64]. В [62] показано, что величина (х2L близка к нор-
нормальному распределению со средним /л = (/ — 1/2L и дисперсией а2 = (8/). По
сравнению с аппроксимацией 3, эта аппроксимация предпочтительнее для малых
значений / и уступает ей при больших значениях /.
В [63, 64] показано, что для
личных / и равно:
оптимальное значение А различно для раз-
раз/
А
1
0,2084
2
0,2654
3
0,2887
4
0,3006
6
0,3124
Аппроксимация 5 (Голдштейна) [65]:
2 4ж4 + 16ж2 - 28 ^ 8ж6
'9/+ ^^
720ж4 - 3216ж2 + 2904
1215/2 229635/3
;) Зж5 + 40ж3 + 45ж 301ж7 - 1519ж5 - 3269ж3 - 79349ж\
J) \ 162/
или в форме
xlU) = f
5832/2
Р ~П п^Ъ I
7873200/3
i=0
46
Распределения вероятностей случайных величин
[Гл. 1
где х = ир и
а0 = 1,0000886;
аг = 0,4713941;
а2 = 0,0001348028;
а3 = -0,008553069;
а4 = 0,00312558;
а5 = -0,0008426812;
а6 = 0,00009780499;
Ъо = -0,2237368;
Ьг = 0,02607083;
Ь2 = 0,01128186;
Ь3 = -0,01153761;
Ь4 = 0,005169654;
Ь5 = 0,00253001;
Ь6 = -0,001450117;
Аппроксимация 6 [66]. При / > 10
с0 = -0,01513904;
ci = -0,008986007;
с2 = 0,02277679;
с3 = -0,01323293;
с4 = -0,006950356;
с5 = 0,001060438;
с6 = 0,001565326.
1 3
9/
где
или в модифицированной форме
f
(9/ + 16)(ж3 - Зх) - 24(ж2 - l)y/2f
о •
486/2
Аппроксимация 7 (Хэлдена) [67]
4(f) = п
6 1-
18/
12/
Аппроксимация 8 (Корниша-Фишера) [68]. Упрощенная (ж = кр):
где
= У2х; С2(ж) = ^(Ж2-1); G3(x) =
6ж4 + 14ж2 - 32
9ж5 + 256ж3 - 433ж
Некоторые значения Gi(x) приведены в табл. 3.
Аппроксимация 9 (Гилберта) [69]. При / > 30
где п{—коэффициенты, приведенные в [69].
In /,
1.1]
Непрерывные распределения
47
Таблица 3
Значения функции Gi(x)
р
0,999
0,995
0,990
0,975
0,950
0,900
0,750
0,500
0,250
0,100
0,050
0,025
0,010
0,005
0,001
ир
-3,090232
-2,575829
-2,326347
-1,959964
-1,644854
-1,281551
-0,674490
0,000000
0,674490
1,281551
1,644854
1,959964
2,326347
2,575829
3,090232
Сг(х)
-4,370248
-3,642772
-3,289952
-2,771807
-2,326174
-1,812387
-0,953873
0,000000
0,953873
1,812387
2,326174
2,771807
3,289952
3,642772
4,370248
G2(x)
5,699689
3,756595
2,941261
1,894305
1,137029
0,428249
-0,363376
-0,666667
-0,353376
0,428249
1,137029
1,894305
2,941261
3,756595
5,699688
G3(x)
-0,619005
0,073889
0,290267
0,486317
0,554981
0,539450
0,346842
0,000000
-0,346842
-0,539450
-0,554981
-0,486317
-0,290267
-0,073889
0,619005
G4(x)
-1,602111
-0,802517
-0,541970
-0,272398
-0,122957
-0,017722
0,060220
0,079012
0,060220
-0,017722
-0,122957
-0,272398
-0,541970
-0,802517
-1,602111
G5(x)
-1,273497
-0,622767
-0,411565
-0,194832
-0,077898
-0,002186
0,030881
0,000000
-0,030881
0,002186
0,077898
0,194832
0,411565
0,622767
1,273497
Аппроксимация 10 (Хозяина) [70]. При р > 0,05 (/ ^ 30)
x2p(f) = |l,00991v7+l,9518[-lg(l-p)]^
Bp(f) = jl,06807v7 + 2,13161 lg(l - p)h - 0,04589v7[^
- 1,37266
При p sS 0,05 (/ ^ 30)
Xlif) = {l,14309v7 - 0,9459(- \gp)l -
xl(f) = {0,97657^ - l,46049(-
- 0,06198
} ;
0,5902б
} ;
Отличительной чертой этих аппроксимаций является то, что они не требуют знания
квантилей стандартного нормального распределения. Квантили Хр аппроксимиру-
аппроксимируются непосредственно по значениям / и р.
Аппроксимация 11 (Арояна) [71]
где Ъ\ и &2 — коэффициенты, приведенные в [71].
Аппроксимация 12 (Пейзера-Пратта) [72-74]
d\(f - 1) In
L
( 1г-
\xl(f),
- (/ - 1)
где d = xlif) ~ f + I ~ ^p X%f) Ф f ~ I-
48 Распределения вероятностей случайных величин [Гл. 1
Аппроксимация 13 [36]. Для р = 0,95 имеет место
Д95(/) = И2,6- ^о A47,4 -/J.
При 5 ^ / ^ 30 погрешность ^ 1%.
Аппроксимация 14 [114]. Является уточнением аппроксимации 3 (Вилсона™
Хилферти)
где tp(f)—р-квантиль распределения Стьюдента (см. раздел 1.1.9) и
_ (о,4(р - ОД) Для 0,7 ^ р ^ 0,825,
^ [0,3@,99 -р) для р> 0,825.
Из приведенных аппроксимаций наиболее точны аппроксимации 5, 6 и 8 (уже при
/ > 3 погрешность не превышает 0,05%) [75].
Отметим (ранее мы уже об этом говорили), что через функцию распределе-
распределения х2 могут быть выражены функции многих других распределений: гамма-
распределения (см. раздел 1.1.6), распределения Эрланга, экспоненциального рас™
пределения (см. раздел 1.1.4), распределения Вейбулла (см. раздел 1.1.5), рас-
распределения Пуассона (см. раздел 1.2.2), распределения Рэлея (см. раздел 1.1.15),
распределения Паскаля (см. раздел 1.2.4).
Задача 13. Вычислить различные аппроксимации квантилей Xp(f) пРи Р — 0,05 и
0,95 и f = 10 и оценить ошибку аппроксимации (табличные значения Хо,об(Ю) = 3,9403
и Xo,9sA0) = 18,307). Для вычислений понадобятся значения гхо,о5 = ™ 1,644854 и
и0?95 = 1,644854 (их можно аппроксимировать, пользуясь аппроксимациями для нор-
нормального распределения — см. раздел 1.1.1).
Аппроксимация 1. Имеем
Xo,osA0) = 10 + л/2-10 • (-1,644854) = 2,643989 (S = 32,8%);
Хо,9бA0) = 10 + л/2-10 • A,644854) = 17,356 E = 5,1%).
Большая погрешность объясняется тем, что аппроксимация 1 дает удовлетворительный
результат только при / > 200.
Аппроксимация 2:
Хо,об(Ю) = - • (-1,644854 + V20 - IJ = 3,683 (8 = 6,5%);
Хо,95(Ю) = \ • A,644854 + ^20^ТJ = 18,022 (S = 1,6%).
ЕСогрешность аппроксимации остается значительной, так как аппроксимация 2 удовле-
удовлетворительна только при / > 100.
Аппроксимация 3:
з
Хо,9б(Ю) = 10 11 - — + 1,644854А/ 7Г-^ | = 18,29178 (S = 0,08%).
Аппроксимация 4. Имеем
1.1] Непрерывные распределения 49
Тогда
A0 - 0,5) i - 1,644854 J—j= = A,755621543 - 0,327026059L = 4,16521;
Хо,95(Ю) = A,755621543 + 0,327026059L = 18,81322 (S = 2,7%).
Аппроксимация 5. Для р = 0,05 и х = г^о,5 = — 1, 644854 имеем
2 (т\ шГшпппяяй °-2237368 Q.Q1513904
Хо,обA0) = Ю 1,0000886 — — h
1 , ч / 0,02607083 0,08986007\
+ ^=(-1,644854) @,4713941 + -^— - -^55—J +
A,644854) @,0001348028 + °'°1128186 + °'°2277679
101 ' ; \ ' 10 100
1 ч3/ 0,01153761
{1M48Mf (-0,008553069 - ^— -
(-0,0
{1
(-1,644854)^0,00312558+ °-
^(
M,644854f( ^0,0008426812 +2,002^001
^(-1,644854)» @,00004780499 + °-^^1 + Ш^^ = 3,940420741
+ ^( (
(E = 0,003%).
При р = 0,95 и г^о,95 = 1,1644854 имеем
Хо,95(Ю) = @,977563529 + 0,52014855 • 0,473911322 + 0,27554468 • 1,4907559 • 1Q~3 -
- 0,40728579 • 9,8391593 • 10^3 +0,07319972 • 3,5730418 • 10^3 - 0,038074725 • 5,7907562 • 10^4 -
- 0,01980451 • 3,155345 • 10^5K = 18,30737 (S = 0,002%).
Аппроксимация 6. Для р = 0,05 имеем
= _J_ /2^A,644854^-1) _ (-1,644854K-3(-l>644854)\ = _2 s
27-10 V Зл/lO 4 )
Xo,osA0) = 10 3J^^
1 — + (-1,644854 + 2,8697122417 • 10^3)J^^ = 3,93481
\3 " _L\J У JLU I
(E = 0,047%).
Для Xo,9sA0) имеем
hw = ^7,4074074 • 10^3@,508495179 + 0,121084002) = ^4,6635494 • 10™3
и
Г f^l3
Xo 9sA0) = 10 0,977777+ A,644854 + 4,6635494- 10^3W = 18,3229961
L V 9 • 10 j
F = 0,087%).
В модифицированной форме для р = 0,05
. (9 ¦ 10)(-1,644854K ~~ 3(-1,644854) - 24A,6448542 ~~ 1)^20 п ^3
плп = о = —2,7102602 • 10 ;
486 • 102
50 Распределения вероятностей случайных величин [Гл. 1
г /—I3
Xo,osA0) = 10 1 - — + (-1,644854 + 2,7102602 • Ю^3)у — = 3,93802 (S = 0,058%).
I yu Y уи I
Для р = 0,95 получаем
, -51,33961699-183,0582646
Лю = ^^ = ^4,8230016,
Хо,95(Ю) = 10@,977777 + 0,24448138K = 18,25954 (S = 0,29%).
Аппроксимация 7:
12 • 10
Х5,О5(Ю) =
5(-1,644854) 5 / 7
48-10
18- 10/
+ 10
13
18
120(-0,308212739 + 1 - 0,02818287) 5 + 1Q
= 3,94758 (E = 0,18%);
±о
18
., 19fVf1 ЧПЯ9197ЗД О- 1 _ П П9«18987'| К _L 1 П
Хо,95(Ю) =
13
18
2 /1гЛ ±zu^u,ouoz±z/oy-|-1 - 0,02818287) 5 +10
13 ~~
Аппроксимация 8. Упрощенная формула:
Хо osA0) = Ю+ (-1,644854)^2 • 10+ -A,6448542 - 1) +
' 3
Н ^A,64485422 - 7- (-1,644854)) = 4,134 (S = 4,9%);
х§?95A0) = 10 + 7,356010714 + 1,137029788 + 0,353286881 = 18,846327 (S = 2,9%).
Точная формула (р = 0,05 и ир = —1,644854):
Gi(x) = -2,326174; G2(x) = 1,137029; С3(ж) = 0,554981;
G4(x) = -0,122957; G5(x) = -0,002186.
Хо,о5(Ю) = 10 - 2,326174^10 + 1,137029 + -^= 0,554981 ^= 0,002186 = 3,9441565
vlO lOvlO
(E = 0,01%).
При р = 0, 95 и ир = 1, 644854 имеем
Gi(z?) = 2,326174; С2(ж) = 1,137029; G3(x) = -0,554981;
G4(x) = -0,122957; G5(aj) = 0,077898
и
Xo,9sA0) = 10 + 2,326174^10 + 1,137029 ^0,554981 - ^0,122957 +
vlO 10
1 0,077898 = 18,30770 (S = 0,004%).
10л/Ш
Аппроксимация 10. Для р = 0,05
Хо
Г i— 1 , 1 I2
,обA0)= l,14309>/l0-0,9459(-lg0,05J - 0,13138>/l0(- lg0,05) 2 -0,06198 =
= 3,9999 (E=1,5%);
Г ^- I ]2
,osA0)= 0,9765V10-l,46049(-lg0,05J +0,59025 =4,04951 (E = 2,8%);
Г 1 2
Xo\o5A0)=K/l0-l,5(-lg0,05J =4,20798 (E = 6,8%).
Xo,(
1.1] Непрерывные распределения 51
Для р = 0,95
1,0099л/10 + 1,9518 [-lg10 A-0,95)] 5 I =29,37488 (? = 60%);
Хо,95@) = {l,06807>/l0 + 2,13161[-lglo(l-0,95)]5 -
- 0,0458Э7Т0[- lglo(l - 0,95]i - 1,97266 j2 = 21,06223;
Г 1 71 2
Xo,9sA0) = b0 + 2[-lglo(l-0,95)]2 --1 =21,435 E = 1,5%).
I 6J
Эти аппроксимации явно неточны для малого количества степеней свободы (их рекомен-
рекомендуется применять при / > 30).
Аппроксимация 12. Здесь, располагая точными значениями Хр(/)? можно проверить
их нормальную аппроксимацию.
Для р = 0,05 и / = 10 имеем
" 10 + f " ^f = -5,4010333;
/9
- 5,4010333 9 In \- 3,9403 - 9
\ 39403
и0 05 = — \ 3'9403| i- = -1,644725.
|3,9403 - 9|
Для р = 0,95 имеем
d = 18,307 - 10 + - - — = 8,965666;
о Хи
1
/9 \ 2
8,965666 ( 9 In h 18,307 - 9 1
^0,95 = V 188307^9 ^- = 1,6454169 (J = 0,02%).
Аппроксимация 13
xS,98A0) = П2,6 - {U7A2~0 10J = 18,2062 (S = 0,5%).
Аппроксимация 14. Будем использовать результаты, полученные при применении
аппроксимации 3, а именно Хо,об(Ю) = 3,93152 и Хо,9б(Ю) = 18,29178.
Вычислим корректирующий множитель для р = 0,95:
МЛ = гоМЩ = 1т =
Up Wo,95 1,645
ft fio)\0'012
и для (р = 0,3@,99 - 0,95) = 0,012 имеем I 0;951 j I = 1,00116.
V м0,95 /
Тогда
Хо,95(Ю) = 18,29178 • 1,100116 = 18,313,
что соответствует ошибке E = 0,03%, т.е. ошибка по сравнению с аппроксимацией
Вилсона—Хилферти снижается более чем в 2 раза.
1.1.9. Распределение Стьюдента (t-распределение)
Описание, применение. Впервые предложено английским статистиком Госсе-
Госсетом (псевдоним Стьюдент) в 1908 г. Если у — нормалвно распределенная случайная
величина с нулевым средним и единичной дисперсией, а независимая от нее слу™
чайная величина %2 имеет распределение хи-квадрат (см. раздел 1.1.8) с / степе-
_i
нями свободы, то случайная величина t = |/(х2//) 2 подчиняется распределению
Стьюдента с / степенями свободы. Распределение Стьюдента широко применяется
52
Распределения вероятностей случайных величин
[Гл. 1
в задачах обработки экспериментальных данных (например, при построении дове™
рительных интервалов и проверке гипотез относительно среднего при неизвестной
дисперсии). С помощью распределения Стьюдента описываются распределения
коэффициентов корреляции и регрессии.
Обозначение
Параметр
Плотность
Функция распределения
Среднее
Дисперсия
Коэффициент вариации
Коэффициент асимметрии
Коэффициент эксцесса
Медиана
Мода
Свойства
/ — число степеней свободы
ш
?>(*;/) =
F(t;f)=P[t(f)<t] =
M(t) = О
f+i
2
^ОО < t < ОО
1 — 2'
v = 0
Мо = 0
При / —>> оо t-распределение совпадает со стандартным нормальным (хорошая
аппроксимация достигается уже при / > 30). Таблицы распределения Стьюдента
можно найти во многих руководствах по математической статистике [7, 23, 24, 25,
56, 57]. График плотности ^-распределения напоминает по форме плотность нор™
мального распределения, но значительнее медленнее приближается к оси абсцисс.
Приведем аппроксимации для расчетов, связанных с ^-распределением.
Аппроксимация 1
tp(f) =up
при / > 30 (ир — квантиль стандартного нормального распределения).
Аппроксимация 2 (Корниша-Фишера) [76]
16и2р
15
4/
96/2
384f
При / ^ 5 погрешность ^10 3.
Аппроксимация 3 (Кёхлера) [77, 78]
0,81
_. , = I -0,0953 - ^ + "'"х + 0,076DРл//O
При / ^ 8 погрешность < 1,4%, при / ^ 50 погрешность < 0,6% для диапазона
0,00001 <р< 0,2.
Аппроксимация 4 (Нельсона) [79, 80]. Очень простая аппроксимация дляр = 0,95
: 2, или (что эквивалентно) ?0,975 (/) = ^
1.1]
Непрерывные распределения
53
Аппроксимация 5 [36]
Аппроксимация 6 [81]
^0,975 ~ 1,96 +
2,5
/-1,8"
г=0
, где а =
з=о
-, t^o,
аю = 0,09979441; а20 = 0,04431742; а30 = 0,009694901; а40 = -0,0000918228;
аи = -0,58121; a2i = -0,2206018; а31 = -0,1408854; а41 = 0,03789901;
а12 = 1,390993; а22 = 0,03317253; а32 = 1,88993; а42 = -1,280346;
а13 = -1,222452; а23 = 5,679969; а3з = -12,75532; а43 = 9,249528;
ам = 2,151185; а34 = -12,96519; а34 = 25,77532; а44 = -19,08115;
а50 = 0,000579602; Ъг1 = -5,537409; 532 = 14,3963;
аЪ1 = -0,02763334; Ь12 = 11,42343; Ь41 = -2,777816;
а52 = 0,4517029; Ъ2г = -5,166733; 542 = 16,461132;
«53 = -2,657967; Ь22 = 13,49862; Ъ51 = -0,5657187;
а54 = 5,127212; 631 = ^4,233736; ЬЪ2 = 21,83269.
При / ^ 5 погрешность ^ 10^4.
Аппроксимация 7 (Пейзера-Пратта) [72, 73]
== I / — — \
In 1 +
/
Аппроксимация 8 (Уоллиса) [74]
.. _8/ + 1
п 1 +
Аппроксимация 9 (Морана) [82, 84]
при / ^ 5.
4/
-1
При / ^ 5 погрешность не более 10~3.
Аппроксимация 10 (Даусона) [83]
= -0,5059 - l,261gBp) - 0,1093[lgBp)]2 + exp
При 0,005 ^ р ^ 0,1 и
1,994-2,7497lgBp)l
погрешность равна ±8%.
Аппроксимация 11 (Вонга) [85, 86]
/ I'
погрешность составляет ±5%, при 0,001 ^ р ^ 0,2
ехр
v 0,9975/~ 0,445
При р « 0,025 и 8 ^ / ^ 18 погрешность ^ 0,005.
- 1
54 Распределения вероятностей случайных величин [Гл. 1
Аппроксимация 12 (Локтева) [114]
{1 + In p(l - р) + 0,004 ^рЧ
1 - @,325 - 0,022In/) L J J
При / ^ 3 максимальная ошибка 0,3 для величины
Задача 14. Вычислить tp(f) и оценить ошибку аппроксимации при р = 0,05, / = 5
wp = 0,95, / = 10.
Точные табличные величины to,osE) = -—2,0150 и to,9sA0) = 1,8125. Вспомним, что
^0,95 :=: 1,644854 = —ti.o,o5-
Аппроксимация 2:
/ia\ 1 г л лохл \л 156448542 + 1 5- 1,6448544 + 16 • 1,6448542 + 3
to 05 (Ю) — —1,544854 • < 1 + Ь о Н~
[ 4-5 96 • 52
3 • 1,6448546 + 19 • 1,6448544 + 17 • 1,6448542 + 15 1 _АО с0/х
+ 5 / ^ —2,1I5о08 (о = 0,015 /о);
384- 53 J V ' ;'
*о,95(Ю) = 1,644854 • {1 + 0,092638617 + 8,6342265 • 10^3 + 6,757481 • 10^4} = 1,8125445
(8 = 0,0024%).
Аппроксимация 3:
Г 0 631 ! ! 1 ^1
to osE) = \ -0,0953™ +0,81- [- lnD • 0,05 • 0,95I" а + 0,076 • D • 0,5 • лД) 5 I =
I 6 J
= 2,0293 (E = 0,7%);
*o,9sA0) = I ^0,0953 - ^i + 0,81 • [- lnD • 0,95 • 0,5)]" 2 + 0,076 • D • 0,95 • л/W)To I =
= 1,761817 (8 = 2,8%)
Аппроксимация 4:
*o,9sA0) = 2- J у = 2,236.
Табличное значение to,975A0) — 2,228.
Аппроксимация 5:
*о,975(Ю) = 1,96 + 1п2;Б1 о = 2,2649.
10 — 1,8
Аппроксимация 6. Пусть ?рE) = 2,015. Требуется отыскать значение р, соответствую-
соответствующее этой квантили. Вычисляем
1 /1\2 /1\3 /1\4
0,09879441 - 0,58121 • - + 1,390993 • ( - ) - 1,222452 • ( ~ ) + 2,151185 ¦ ( - 1
1 - 5,537409 • - + 11,42343 • ( - )
5 \5/
По аналогии находим
с2 = 0, 0465169; с3 = -0, 00505661; с4 = -0, 000348176; с5 = 0, 00003584898.
Окончательно получаем
р=-A + 0,0936657 • 2,015 + 0,045169 • 2,0152 - 0,005661 • 2,0153 - 0,000348176 • 2,0154 +
+ 0,0000358489 • 2,0155) = 0,05055.
Точное значение р = 0,05.
1.1] Непрерывные распределения 55
Аппроксимация 7:
2,015^
2\ I \ 5
^0,05 =
R2\ \ 2
E--W—^ 5 ~\ =^1,6367697 (E = 0,5%);
^ 3/1 _ — — I
2,015^ ^ 2
In 1+-^—
1_
1,81252^ ^ 2
In 1 +
=,644324 E = 0,03%);
2\ | \ 10
^0,95 —
10~б
B \ I \ 1и / I
Ю--К — 5 \ =1,64300 (с5 = 0Д%);
In 1
1,8125* \ ^ 2
10
= A0 - ^ + —) I —^ 5 } = 1.64476 (S = 0,0056%).
ю- ю/ lcrg
Аппроксимация 8:
о с _|_ I Г / 2П1112\1'2
гбоо5 = 5In( 1 + ) = -1,6438427 (/ = 5; S = 0,06%);
8-5 + 3 [ у 5 /J
1
ио^95 = 8'1Q + 1 10In( 1+ 1?1825 ) 2 = 1,64480229 (/ =10; 6 = 0,003%).
8 • 10 —|— 3 I у 10 / I
Аппроксимация 9:
-1
to,O5E) = -1,644854 1 - 7 ^ = -2,0189125 (S = 0,2%);
У 4-5 /
to,95A0) = -1,644854 М- 1;644854 + г J = 1,812788 (E = 0,01%).
Аппроксимация 10:
*о,9бE) = -0,5059 - 1,26 lgB • 0,05) - 0,1093[lgB • 0,05)]2 +
' 1,1994- 2,7479 lgB ¦ 0,05)"
-г ехр'
Аппроксимация 11:
г
to osE) =J5|"exPf 1?6448542 ^ -l]}2 =-2,01758 E = 0,12%);
' W \ [ Fy0,9975-5-0,445/ J/ ' V ' ;'
l
to 95A0) =< 10 exp 7 -1 = 1,81189675 (E = 0,03%).
' V ; \ [ У 0,9975- 10-0,445/ J/ V > У
Аппроксимация 12:
/ 5-5
1 + In 0,95 • 0,05 + 0,004 •
*о,о5E) = -1,644854 I 1 - @,325 - 0,022 • In5) ^ —- } = -2,058;
56 Распределения вероятностей случайных величин [Гл. 1
1 + In @,95 ¦ 0,05 + 0,004 • ^^
= 1,644854 { 1 - @,325 - 0,022 • In 10) ^ —'- } = 1,8308.
Из рассмотренного примера видно, что наиболее просты и достаточно точны аппрокси-
аппроксимации 3, 4, 5, 7, 8, 9 и 11.
1.1.10. Распределение Фишера (.F-распределение)
Описание, применение. Если две независимые случайные величины %f и х|
распределены по закону хи-квадрат соответственно с Д и /2 степенями свободы,
то случайная величина F = —|— имеет распределение Фишера, .F-распределение
широко применяется при обработке данных (при сравнении дисперсий, анализе кор-
корреляций). С помощью ^распределения можно вычислять некоторые дискретные
распределения, например, биномиальное.
Свойства
Обозначение -^(/ъ/г)
Параметры Д, /2
Плотность
f(x;hj2)= x " f l Jlx
х 2
Функция распределения
S(x) = P{F<x}= A,2,LfhP K"" ¦ ""^
i г т
Среднее M[F(f1,f2)] = 1^, /2 > 2
h- *
Дисперсия D[F(/i,/2)l = 2f^h+2h~2) , /2 > 4
i_
Коэффициент вариации v = J~,.—2 , /2 > 4
L h (/2 - 4) J
v .л. 2/x + /2 - 2 [ 8(/2 - 4) ] *
Коэффициент асимметрии а3 = — —^- , /2 > о
/2-0 [/i +/2 - 2J
Мода Mo = ^"gj
В большинстве руководств по математической статистике, например, [24, 29, 87],
приводятся квантили .F-распределения. Для .F-распределения справедливо соот-
соотношение -Fp(/i,/2) = "^ 77—t\i что позволяет ограничиться только таблицами
для р < 0,5 или р > 0,5. При Д = 1 и /2 = оо или Д = оо и /2 = 1 распределение
1.1] Непрерывные распределения 57
совпадает с нормальным, а при /i = 1, /2 = 00 или /2 = 1, Д = оо — с распредели
нием квадрата случайной величины, имеющей t-распределение Стьюдента с /2 (Д)
степенями свободы. При /2 —» оо ^распределение совпадает с %2™распределением
при /i степенях свободы.
flFp(fi, f2) r / 1 1 ^7\
Величина — i^ подчиняется бета-распределению (см. раздел 1.1.7),
/2 + Jl^p(jl,/2J
поэтому функция ^-распределения может быть выражена через функцию бета-
распределения
В общем случае случайную величину i^ (/i, /2) ? подчиняющуюся распределению
- /271
Фишера, можно интерпретировать как отношение ——, где 71 и 72 — независи™
/172
мые случайные величины, подчиняющиеся гамма-распределению (см. раздел 1.1.6)
с параметрами /i/2 и /2/2. В связи с широким использованием ^-распределения
применяются различные его аппроксимации и нормализующие преобразования.
Аппроксимация 1
Аппроксимация 2 (при Д, Д > 30) [26]
где
ClB) = -7= ~ г;? = 2,1213203 -
V2 V3/iB) /1B)
Аппроксимация 3 [32]
Аппроксимация 4 (Полсона) [88]
2 j. 2 phf f
9K + W2 p{flj2
Отсюда следует, что
^ [(9Д - 2)(9/2 - 2) + Зир{2/г{9/2 - 2J -
(9/2 - 2J -
58
Распределения вероятностей случайных величин
[Гл. 1
Аппроксимация 5 (Пейзера-Пратта) [72, 73]
¦Qg
Up = di
fp
-Pg
fq
/+6 )РЯ
/2/5
;p =
2 '
-x) -2.
2 \2 2
+
JlpiJl, J2J + /2
При /i, /2 ^4 погрешность ^ 0,001.
Аппроксимация 6 (Воглера-Нортона)
,/2) =
Аппроксимация эффективна для /i, /2 ^ 30, если p — не на „хвосте" распределения.
Эта аппроксимация следует из нормализующего преобразования Полсона (аппрок-
(аппроксимация 4).
Аппроксимация 7 (Хейнса) [89]. Основана на аппроксимации Вилеона^Хилфер-
ти для х2 (см- раздел 1.1.8, аппроксимация 3) и аппроксимации Гастингса для
нормального распределения (см. раздел 1.1.1)
- 2аЬ - [Babf - Ц2х20с - a2)Bx20d - Ъ2)] "'
2Bжос - d
где
а3 , E-R
+ ;
«2
п1 = 0,278393; а2 = 0,230389; а3 = 0,000972; а4 = 0,078108;
, 1
= 51,21114354
1
3] 2
1
= -| - [(у)' + (у)'] 2
^A -р)]4
- 54,06887755;
с2 = -100,70032831|A -рI 4 +86,13944869.
Аппроксимация слишком сложена и применяется редко.
1.1]
Непрерывные распределения
59
Аппроксимация 8 (Картера) [90]
1
1
/i-l
2) = expBz), где
5 , 1/1
1,
/2-1 /l - 1
При /ь /2 ^ 30 и р ^ 0,0001 погрешность ^ 10^3.
Аппроксимация 9 [9, 91, 92]
lg ^р(/ъ/2) = a(h-b)~ 2 - eg, где /г =
Коэффициенты а, Ь и с приведены в таблице:
2Л/2
/l + /2 '
р
а
Ь
с
0,50
0
0,290
0,75
0,5859
0,58
0,355
0,90
1,1131
0,77
0,527
0,95
1,4287
0,95
0,681
0,975
1,7023
1,14
0,846
0,99
2,0206
1,40
1,073
0,995
2,2373
1,61
1,250
0,999
2,6841
2,09
1,672
0,9995
2,8580
2,30
1,857
Задача 15. Вычислить^ пользуясь аппроксимациями^ значение .Ро,э(Ю, 12).
Для справки — точное значение i<o,9 A0,12) = 2,1878.
Аппроксимация 6. Имеем табличное значение гхо,э = 1,281551.
2 2 2 2
Вычисляем 1 = 1 = 0,9777 и 1 = 1 = 9,98148. Окончательно
9/i 90 ' 9/2 108
находим
Fo,9A0,12) =
0,9777- 0,98148 + 1,28155 0,02222 • 0,981482 + 0,0185185 • 0,97772 -
81-10- 12
1,281155^
I 3
2
0,98148^ - 0,0185185 ¦ 1,281552
1,21140198 V
0,932891651/
= 2,189632439 (8 = 0,03%).
Аппроксимация 8. Имеем С/о,9 :=: 1,281551 и
9
h =
¦ +
-— = 9,9; Л = -A,2815512 - 3) = -0,226271172;
10-1
1,281551(9,9 - 0,226271172)^
9,9
— + -]-- 0,226271172 - - ( — + - ) =0,511656907;
11 9/ L6 3 V11 9/J
Fo,9A0,12) = expB • 0,511656907) = 2,782399.
Погрешность S = 27% велика, так как малы степени свободы Д и Д.
Аппроксимация 9. Имеем а = 1,1131; Ь = 0,77 и с = 0,527. Далее находим h =
2 *
10
12 + 10
= 10,90909 и g =
12- 10
= 0,016666. Тогда
lgjPo,9A0,12) = 1,1131A,90909 - 0,77)" 2 _ 0,527 • 0,016666 = 0,340787085
F0,9A0,12) = 2,19173 (8 = 0,18%).
60 Распределения вероятностей случайных величин [Гл. 1
Задача 16. Вычислить нормализующее преобразование для .Ро,э(Ю, 12) и оценить точ-
точность нормализации.
Для р = 0,9 имеем гло,э = 1,2811551.
Аппроксимация 2. Имеем .Ро,э(Ю,12) = 2,1878 и находим
а = 2,1213203 - °^471404521 = 2,074179848, с2 = 2,1213203 - °?47140452 = 2,08203659,
1
-2,074179848 + 2,08203659-2,1878 3 /г ^ч
d = up= — y2 = 1,28212 (ё = 0,01%);
11 \ 2
1 ¦ 2,18783
10 12
d' = 1,28212 ( 1 + 0,8- — • 1,2821224 ) = 1,282282 (S = 0,06%).
Аппроксимация 3:
ио,9 = — 1 = 1,259744 (S = 0,04%).
10 \ 2
Ц • 2,187^
Аппроксимация 4:
2,18783 [ 1 — ) - [ 1 —\
у 9-12У V 9-10У 9Й9199 /е пПЛо/л
1iO,9 = 1 = I,2o212z (О = U,U47o).
2 2
Н • 2,18783
ч9-10 9-12
Оценим квантиль .Ро,э(Ю, 12), пользуясь этой аппроксимацией. Имеем
(9/i - 2)(9/2 - 2) = (9 • 10 - 2)(9 • 12 - 2) = 9328;
[2/i(9/2 - 2J + 2/2(9/i - 2J - 36/2Мр] 2 = 635,2015025;
(9/2 - 2J - 18/2tXp - (9 • 12 - 2J - 18 • 12 • 1,2815512 = 10881,24744;
F ПП19^ [1,2(9328 + 3 • 1,281551 • 635,2015025I 3
^0,9A0,12) = ^ 10881,24744 J = 2'187013
Аппроксимация 5. Вычисляем
= °>354212173; в = 1 - Р = 0,645787826; 5 = ^-^ = 5,5;
Z А
10-2,1878 + 12 ' 7 " r 7 ' 2
10 — 1 10 4- 12 — 2 S T
T = = 4,5; / = — = 1; — = 1,552741557; — = 0,69682329;
2 2 fp fq
g(l,55271667) = -0,145733931; g@,69682329) = 0,119889378;
0,645787826 0,354212173 0,645787826 \ _
12 10 10 + 12 у ~~
= 2,007475058;
l
n лл^^глго # - '" 0,645787826(^0,145733931 + 0,3542121173 • 0,119988937)
uoy9 = 2,007475058 \ -p —, >
1 + - j • 0,354212173 • 0,645787826 I
Относительная погрешность S = 0,03%.
1.1] Непрерывные распределения 61
1.1.11. Усеченное нормальное распределение
Описание, применение. Если из генеральной совокупности, имеющей нор-
нормальное распределение iV(/x, <т), изъять все элементы, меньшие или большие опреде-
определенных граничных значений а\ и u2, to образуется совокупность, подчиненная усе-
усеченному нормальному распределению. Граничные значения называются точками
усечения. На практике могут возникнуть случаи двустороннего и одностороннего
усечения. Часто это распределение используется при анализе точности производ-
производства [93].
Свойства
Двустороннее усечение
Обозначение N1 (/х, а, а\, а 2)
Параметры /х, а, а\, п2
Плотность Lp'f(x) =
a J \ а
где (f(x) — плотность вероятностей стандартного нормального распределения iV@,1);
х п
1 г *_
Ф(ж) = —= е~ 2 dt — функция Лапласа; /i, a — параметры исходного нормального
V 2тг J
о
распределения; а\ < п2—точки усечения
Среднее М(ж) = /х — (А2 — Ai)cr,
Г^е Л1 - фЩтщ; Л2 - фF)фF); 6 - -^-; 6 - —г-
Дисперсия В(ж) = A + Ai^i - А26 - А2 + Ai)V2
В случае симметричного усечения, т.е. когда а\ — /i = п2 — \х = ^
имеет место
г 1
х е [ц — а\ < х < fji + а2\
1 I
Функция распределения F'(х) = — —-р—™ —, а\ < х <
Среднее (мода, медиана) М(ж) = Me = Mo =
Дисперсия Щх) = A - 2^AW2, где С = —; А =
2Ф —
Одностороннее усечение (а2 = оо)
Обозначение N/f (/i, сг, ai)
Параметры /i, сг, ai
Среднее М(х) = // - 7о-, где 7 = 0 5^
Дисперсия О(ж) = сг2A — ^7 ~ 72)
62 Распределения вероятностей случайных величин [Гл. 1
Вид кривых распределения разнообразен в зависимости от соотношения пара™
метров ад, ai, а^ и <т, но во многих случаях кривые будут образованы отрезками
нормальной кривой с соответственно увеличенными координатами. Кривые сим-
симметричны при а\ = —п2 и несимметричны в иных случаях.
Доля усечения определяется формулами — слева: 0,5 —Ф(?х) и справа: 0,5 — Ф(?г)•
Если заданы не границы, а доли усечения, то такие выборки называются не
полностью определенными (расчеты для них аналогичны).
Задача 17. Из нормальной выборки с параметрами /х = 100 и а = 30 изъяты члены
с х < 70 и х > 160 (а\ = 70, «22 = 160). Как изменятся параметры полученного распре-
распределения по сравнению с исходным нормальным?
Вспомним, что функция Лапласа Ф(ж) связана с функцией F(x) соотношением
Ф(х) 1
= F(x) (см. раздел 1.1.1). Для расчетов Ф(ж) воспользуемся аппроксимацией 5
из раздела 1.1.1, в соответствии с которой
Находим
Ф(х) = i|l-exp( -^
/160 - 100\ = = 1 Г / 8Л1 t =
V 30 / Ч \ *)\
ФB) - Ф(-1) = ФB) + ФA) = 0,48 + 0,3431 = 0,8231.
Вычисляем среднее:
A ^(Ci) д Ч>{&) * =70^Ю0= = 160 - 100 =
1 фF)фF)' 2 фF)-фF)' зо ' ^2 зо
Имеем
ФF) = ФB) = 0,48; ФF) = Ф(-1) = -0,3431; Ф(?2) - ФF) = 0,823118.
1 Г ж2 1
Вспомним, что (р(х) = exPi г5 в нашем случае
V2tt [ 2 J
<р(-1) = 0,398942ехрМ - - ) = 0,24197; <^B) = 0,398942expf -- J = 0,05399;
= 0,24197 = ^ = 0^5399 =
0,8231 0,8231
Итак,
М(ж) = // - (Л2 - Ai)a = 100 - @,06559 - 0,29396) • 30 = 106,851,
и
Щх) = A + AiCi - А26 - А2 + AiJ(j2 =
= A + 0,29396 • (-1) - 0,06559 • 2 - 0,06559 + 0,2939J • ЗО2 = 580,652; л/Щх) = 24,0967.
1.1.12. Распределение модуля случайной величины, распределенной нормально
Описание, применение. Если случайная величина х распределена нормально
7V(^, сг), то случайная величина у = \х\ будет иметь распределение модуля. Приме™
няется при анализе допусков на изготовление деталей машино- и приборостроения.
1.1] Непрерывные распределения 63
Свойства
Обозначение |7V|(//, сг)
Параметры /i, a
Плотность гЬ(у;и,,а) = - \<р(У~*1) + <р(У I , 2/ > О,
<7 [ \ <Т / V СГ / J
где <?>(ж)—плотность стандартного нормального распределения
Функция распределения F(y: /i, ст) = Ф ( 1 + Ф ( ), у > О,
\ a J \ a J
t 9
где Ф(?) = —= e~~ 2 с?ж — функция Лапласа
V 2тг J
о
Среднее МЫ = 2 \иФ(- ) +ст<р(-
(при /х = 0 М(з/) = J^a^ 0,7979(j)
Дисперсия D(y) = а2 + fi2 — [М(у)]2
(при /i = 0 D(y) = ^у^ а2 « 0,3634(т2)
Коэффициент асимметрии а3 = —^== ^ 0,99527
(тг — 2) • v тг — 2
Коэффициент эксцесса «4 = ^^ 2 ^ 0,8691772
(тг - 2)
Вид распределения определяется соотношением между параметрами исходного
распределения /л и а. При \х ^> а распределения N и \N\ практически совпадают.
Задача 18. Случайная величина х распределена нормально с параметрами ц = 10
и а = 5. Найти вероятность того, что модуль случайной величины х не превысит 3,
т. е. Р{|ж| < 3}. Вычислить параметры распределения случайной величины у = \х\.
1 Г / 2ж2\1 2
Воспользуемся аппроксимацией 5 — Ф(х) = - 1 — ехр( 1 (раздел 1.1.1) для
2 L V ж /J
вычисления Ф(ж) = ^(ж) — 0,5.
Имеем
Далее вычисляем
I
/З^МА =ф^_х^ = _фA?4) = ^iri^expf^^^I 2 = ^0,422154;
V 5 2L V J
= фB>в) = I [х _ ехр(_^!)] h = 0,496608;
Р(|ж < 3|) = -0,422154 + 0,496608 = 0,074454.
Находим
<рB) = -^= е~% = 0,053991; М(|ж|) = 2 • A0 • 0,48 + 5 • 0,053991) = 10,13991;
л/2тг
В(|ж|) = 102 + 52 - 10Д39912 = 22,18223; уЩ\х\) = 4,7098.
64 Распределения вероятностей случайных величин [Гл. 1
1.1.13. Распределение, порождаемое нормальной плотностью
с линейным дрейфом среднего
Описание, применение. Такое распределение возникает при смещении центра
группирования мгновенного нормального распределения и является композицией
нормального и равномерного распределений, описывая распределение вероятностей
за весь период наблюдения. Применяется при изучении износа режущего инстру™
мента, дрейфа параметров электронных приборов.
Свойства
Пусть дрейф среднего во времени описывается формулой
fi(t) = /jl0 + 2Acr0t,
где jLto, cfq — параметры исходного распределения (при t = 0):
A = B(j)^1[/i(t)max^/i(t)min]e
Параметры /х, и, t
Плотность <p(z, А) = — [Ф(гш + А) — Ф(гш — А)],
х - М(х)
где z = — , , — нормированное значение переменной;
ш = I 1 Н ] ; Ф(у) = e^^dt — функция Лапласа
v 7 о
Функция распределения
F(z, A) = ||l+ ^[(^ + А)Ф(^ш + АЬ(^ - A)#(zcj - А) + фш + А) - ^
где (р(у)—плотность стандартного нормального распределения
Среднее М(ж) = /xq + Actq
Дисперсия D(x) = а^ш2
Коэффициент вариации v = -
Коэффициент асимметрии «з = О
Коэффициент эксцесса «4 = —А4C + А2)^2
5
При <то —У 0 распределение стремится к равномерному (см. раздел 1.1.2), при
А —} 0 — к нормальному (см. раздел 1.1.1). Таблицы плотности <p(z,\) и функции
F(z,X) для А = 3, 6, 10 и 25 приведены в [93].
Задача 19. Начальное напряжение зажигания газоразрядного прибора распределено
нормально с параметрами /хо = 1000 В и сто = 150 В. В течение срока службы среднее
значение напряэюения зажигания увеличивается до 1500 В. Определить вероятность
того, что напряжение зажигания в течение срока службы будет находиться в ин-
интервале 900 -^ 1100 В.
Имеем 15оо - 1000
/i(t)max = 1500; /x(t)min = ЮОО; А = = 1,666;
.2 • 1<5и
/ А2\ 2
о; = 1 + — = 1,387; М(х) = ц0 + Ха0 = 1000 + 1,666 • 150 = 1249,9;
V 3 /
2 = 43284,802; у/Щх) = 208,05.
1.1] Непрерывные распределения 65
900 - 1249,9 1100 - 1249,9
208,5 = -1'6825 ?2 = 208,5 = ^^
Для вычисления значения Ф(ж) воспользуемся аппроксимацией из раздела 1.1.1
Л [
Ф(х) = i { 1 1
2 1 + 0Д253ж2
Имеем для z\ = —1,682
Ф(-1,682 • 1,387 + 1,666) = Ф(~0,666334) = -1\-
1
'2 \] \ 2
ехр|( 0Д253(~0,б66334J
2 | 1 +0,1253-0,6663342
= -0,247536883;
Ф(-1,682 • 1,387 ~~ 1,666) = Ф(-3,998934) = -0,4999766;
(^(-0,666334) = 0,3135136; (^(-3,998934) = 1,344 • 10^4.
Для ^2 = —0,72 имеем
Ф(-0,72 • 1,387 + 1,666) = Ф@,66796) = 0,248057;
Ф(-0,72 • 1,387 - 1,666) = Ф(-2,66524) = -0,41313076;
«^@,66796) = 0,3191724; (^(-2,66524) = 0,0114394.
Находим
F(zuX) = -\l-\ ^@,666334 • 0,247536283 + 3,998934 • 0,49997666 + ...) i = 0,0453049;
v ' ; 2\ l,666l ' ' ' ' /
F(z2,X) = -|l + ^^@,66796-0,248057-2,66524-0,41313076 + 0,
V ' ; 2\ 1,666V ' ' '
= 0,311692225.
Окончательно
P(-l,682 < z < -0,72) = F(-0,72) - F(-l,682) = 0,311692225 - 0,0453049 = 0,2663873.
Следовательно, при таком дрейфе вероятность того, что напряжение зажигания нахо-
находится в интервале 900 + 1000 В, равна р « 0,266.
Для сравнения найдем вероятность попадания в этот интервал напряжения зажига-
зажигания при отсутствии дрейфа, т. е. когда Л = 0.
900-1000 Л_ 1100-1000 Л^
В этом случае z\ = = —0,667: z2 = = 0,667,
J 150 ' 150 '
Р(-0,667 < z < 0,667) = 2F@,667) - 1.
Находим с помощью аппроксимации 18 из раздела 1.1.1
F@,667) = 1 - - ехр(-0,717 • 0,667 - 0,416 • 0,6672) = 0,7423.
Таким образом, Р(—0,667 < z < 0,667) = 0,4846. Следовательно, отсутствие дрейфа су-
существенно (почти в 2 раза) увеличивает вероятность нахождения напряжения зажигания
в интервале 900 + 1100 В.
1.1.14. Распределение, порождаемое нормальной плотностью
с линейным дрейфом среднеквадратического отклоненим
Описание, применение. Распределения такого типа встречаются при авто-
автоматическом изготовлении деталей, когда за время изготовления партии деталей
изменяется рассеяние начального нормального распределения (например, при за-
3 А. И. Кобзарь
66 Распределения вероятностей случайных величин [Гл. 1
туплении режущего инструмента, при изменении механических свойств заготовок).
Распределение погрешностей при измерениях близко к рассматриваемому, если
за время проведения измерений имеет место систематическое смещение точности
процесса измерения.
Свойства
Пусть дрейф среднеквадратического отклонения описывается формулой
a(i) = о"оA + 2At);
где а® — параметр исходного распределения (t = 0); А = ^а®)^1 [cr(t)max — cr(i)min].
Г / 2 2 \ / 22
Плотность (p(z: A) = —; < Е» ( — | — ЕЛ — -
б ; г\ 6(i +2A)
х - М{х) „ Г е"
где z = — —нормированное значение переменной; bi{z) = —сш — инте-
\/Т}(т,') I ^
тральная функция (табулирована); ш = C + 6А + 4А )
Функция распределения
0
Среднее М(ж) = /ig
Дисперсия О(ж) = -?- ш2
о
Здесь /jlq и сг0 — параметры исходного нормального распределения.
Коэффициент вариации v =
Коэффициент асимметрии а% = 0
Коэффициент эксцесса «4 = 12А2
Значения cp(z; X) и i^(z; А) табулированы в [93] для значений параметра А = 1,
3, 6 и 9. Значения F(z; А) для различных z и А приведены в табл. 4.
Задача 20. Начальная погрешность измерения подчинена нормальному распределению
с параметрами цо = 100 ед. и о~о = 20 ед. В процессе проведения измерений о~о линейно
увеличивается до 60 ед. Найти вероятность того, что при проведении измерений
погрешность не превысит 40 ед.
Имеем
А = ^t^. = i; ш= C + 6-1 + 4- I2)i = 3,60555; М(х) = ц0 = 100;
2 2\
/ 2
лУЩх) = \ — - 3,605552 = 41,6333; z = 4° ~ 10° = -1,44115.
v v ; V 3 41,6333
Необходимо найти Р(ж < 40) = F(-l,44; 1) = 1 - F(l,44; 1). По табл.4 для А = 1
и z = —1,44 находим, что 1^A,44; 1) та 0,93 и, следовательно, искомая вероятность равна
Р(ж < 40) = 1 - 0,93 = 0,07.
Если бы дрейфа стандартного отклонения не было, то Р(ж < 40) = Fl I =
= F(—3) = 1 — i^C). Здесь F(x) — функция стандартного нормального распределения.
Так как FC) = 0,9977, то Р(х < 40) = 1 - 0,9977 = 0,0023.
1.1]
Непрерывные распределения
67
Таблица 4
Z
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
1,25
1,30
1,35
1,40
1,45
1,50
1,55
1,60
1,65
1,70
1,75
1,80
1,85
1,90
1,95
2,00
2,05
2,10
2,15
2,20
2,25
2,30
2,35
2,40
2,45
Значения функции
Л
1
0,5000
0,5225
0,5453
0,5678
0,5900
0,6118
0,6332
0,6540
0,6742
0,6938
0,7126
0,7307
0,7481
0,7646
0,7803
0,7953
0,8094
0,8228
0,8354
0,8472
0,8583
0,8687
0,8784
0,8875
0,8960
0,9039
0,9113
0,9182
0,9246
0,9305
0,9360
0,9411
0,9459
0,9503
0,9543
0,9581
0,9616
0,9648
0,9678
0,9705
0,9730
0,9754
0,9775
0,9795
0,9813
0,9830
0,9845
0,9859
0,9872
0,9884
3
0,5000
0,5281
0,5560
0,5831
0,6094
0,6346
0,6585
0,6810
0,7022
0,7220
0,7405
0,7578
0,7739
0,7889
0,8029
0,8160
0,8282
0,8394
0,8503
0,8603
0,8697
0,8784
0,8866
0,8943
0,9015
0,9082
0,9145
0,9204
0,9259
0,9311
0,9359
0,9405
0,9447
0,9486
0,9528
0,9558
0,9590
0,9620
0,9648
0,9674
0,9699
0,9721
0,9743
0,9762
0,9781
0,9798
0,9813
0,9828
0,9842
0,9854
6
0,5000
0,5234
0,5653
0,5969
0,9624
0,7505
0,6745
0,6965
0,7168
0,7355
0,7527
0,7688
0,7837
0,7977
0,8107
0,8228
0,8342
0,8448
0,8548
0,8642
0,8729
0,8812
0,9889
0,8961
0,9029
0,9093
0,9153
0,9203
0,9262
0,9311
0,9358
0,9401
0,9442
0,9480
0,9516
0,9550
0,9581
0,9611
0,9638
0,9664
0,9668
0,9710
0,9713
0,9751
0,9769
0,9785
0,9802
0,9817
0,9831
0,9844
9
0,5000
0,5264
0,5711
0,6030
0,6317
0,6576
0,6810
0,7025
0,7221
0,7403
0,7571
0,7726
0,7872
0,8007
0,8134
0,8252
0,8363
0,8466
0,8564
0,8655
0,8741
0,8821
0,8897
0,8968
0,9034
0,9097
0,9156
0,9211
0,9263
0,9311
0,9357
0,9400
0,9400
0,9478
0,9514
0,9547
0,9578
0,9607
0,9635
0,9660
0,9684
0,9707
0,9727
0,9747
0,9765
0,9782
0,9798
0,9813
0,9827
0,9840
z
2,50
2,55
2,60
2,65
2,70
2,75
2,80
2,85
2,90
2,95
3,00
3,05
3,10
3,15
3,20
3,25
3,30
3,35
3,40
3,45
3,50
3,55
3,60
3,65
3,70
3,75
3,80
3,85
3,90
3,95
4,00
4,05
4,10
4,15
4,20
4,25
4,30
4,35
4,40
4,45
4,50
4,55
4,60
4,65
4,70
4,75
4,80
4,85
4,90
4,95
F(z;X)
X
1
0,9894
0,9904
0,9913
0,9922
0,9929
0,9936
0,9942
0,9948
0,9953
0,9958
0,9962
0,9966
0,9969
0,9972
0,9975
0,9978
0,9980
0,9982
0,9984
0,9986
0,9987
0,9989
0,9990
0,9991
0,9992
0,9993
0,9994
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9997
0,9998
0.9998
0,9998
0,9998
0,9999
3
0,9866
0,9877
0,9887
0,9896
0,9905
0,9913
0,9920
0,9927
0,9933
0,9939
0,9944
0,9949
0,9953
0,9958
0,9961
0,9965
0,9965
0,9971
0,9974
0,9976
0,9978
0,9980
0,9982
0,9984
0,9985
0,9987
0,9988
0,9989
0,9990
0,9991
0,9992
0,9993
0,9994
0,9994
0,9995
0,9996
0,9996
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9998
0,9998
0,9999
6
0,9856
0,9867
0,9877
0,9887
0,9896
0,9904
0,9912
0,9919
0,9925
0,9932
0,9937
0,9942
0,9947
0,9952
0,9956
0,9959
0,9963
0,9966
0,9969
0,9972
0,9974
0,9977
0,9979
0,9981
0,9981
0,9984
0,9985
0,9987
0,9988
0,9989
0,9990
0,9991
0,9992
0,9993
0,9993
0,9994
0,9995
0,9995
0,9996
0,9996
0,9997
0,9997
0,9997
0,9998
0,9998
0,9998
0,9998
0,9998
0,9998
0,9999
9
0,9852
0,9864
0,9874
0,9884
0,9893
0,9901
0,9909
0,9916
0,9923
0,9929
0,9935
0,9940
0,9945
0,9949
0,9954
0,9957
0,9961
0,9964
0,9967
0,9970
0,9973
0,9975
0,9977
0,9979
0,9981
0,9983
0,9984
0,9986
0,9987
0,9989
0,9989
0,9990
0,9991
0,9992
0,9993
0,9994
0,9994
0,9995
0,9995
0,9996
0,9996
0,9996
0,9997
0,9997
0,9997
0,9998
0,9998
0,9998
0,9998
0,9998
68 Распределения вероятностей случайных величин [Гл. 1
1.1.15. Распределение Рэлея
Описание, применение. Применяется для описания распределения неотри-
неотрицательных случайных величин, являющихся векторной суммой двух нормальных
случайных величин с равными дисперсиями. Ему подчиняются погрешности гео-
геометрической формы (овальность, конусообразность), ошибки взаимного расположе-
расположения поверхностей (эксцентриситет, разностенность). Распределение Рэлея широко
применяется в радиолокации при оценке погрешности обнаружения объектов.
Свойства
Обозначение
Параметр
Плотность
Функция распределения
Среднее
Дисперсия
Коэффициент вариации
Коэффициент асимметрии
Коэффициент эксцесса
Мода
Медиана
Ща)
а
/(*;<
F(x;
М(х
D(x)
v=\
а3-
МО:
Me:
ч X (
a) = — exp 1 -
a V
a) = 1 — exp |
) = Vl0Ssl
¦=B-5).
< 4 V-l
V4-7T/
2^тг(тг - 3)
л/D - тгK
V \ /
24тг - 16тг2 -
(А J
= а
= aB1n2)i =
2 \
X \
^ 2 \
,253a
= 0,429a2
913
= 0,631
16 П 9d^
1,177a
Для удобства табуляции на практике применяется нормирование случайной ве-
величины z = х/а. Векторная сумма двух нормальных случайных величин с нулевым
средним и одинаковым стандартным отклонением а имеет распределение Рэлея
с параметром а.
Задача 21. Случайная величина распределена по закону Рэлея с параметром а = 4.
Вычислить вероятность того, что случайная величина не превысит значения х = 3,
и вычислить 95%-ю квантиль распределения.
Имеем Р(ж < 3) = 1 — expj ^ 1 =0,24516. Для вычисления 95%-й квантили
/ \ г\ г\г- л ( Ж0,95 \ 1 гл глг- Ж0,Э5
(жо,9б) используем равенство 0,95 = 1 — ехр ¦— 1; 1п0,05 = ¦—, и окончательно
у 2 • 16 J 2-16
г
имеем жо,95 = (—2 • 16 • In 0,05) 2 = 9,790987, т. е. с вероятностью 0,95 случайная величина
не превысит значение 9,971.
1.1.16. Распределение Максвелла
Свойства, применение. Векторная сумма трех нормально распределенных
случайных величин с нулевыми средними и равными дисперсиями имеет распре™
деление Максвелла. Распределением Максвелла описывается абсолютная величина
скорости движения молекул.
1.1]
Непрерывные распределения
69
Обозначение
Параметр
Плотность
Функция распределения
где (p(z) =
Среднее
Дисперсия
О,
Свойства
М(х,а)
а
х2 B \ 2 Г х2 ]
/(*;a) = ?(-j expj-^j, * > О
F(x;a)=2[*(H)-?v(?)l,
v 7 [ \а/ а \а/J
>(z) = -p= e 2 dt
о
i
M(x) = 2аГ-^ 2 = 1,596a
В(ж) = а2 (з - ^1 = 0,454a2
i
2
Коэффициент вариации v = 21 о 1 = 2,369
\О7Г — 8/
Коэффициент асимметрии аз = — = 0,486
Коэффициент эксцесса
Медиана
Мода
1607Г - 12тг2 - 384
«4 = о = 0,108
9тг2 - 48тг + 64
Me = 1,538а
Мо = лДа = 1,414а
Обычно распределение Максвелла используется в нормированной форме
{z = x/a).
Задача 22. Вычислить вероятность того, что значение случайной величины, имею-
имеющей распределение Максвелла с параметром а = 10, превысит х = 11.
Имеем
Р(ж > 11) = 1 - F(ll; 10) = 1 - 2[ФA,1) - 1,1 • <рA,1)].
Для вычисления Ф(ж) воспользуемся аппроксимацией 6 из раздела 1.1.1, в соответствии
с которой
Г / Г) \
0Д253)(-ж2)
^ + 0,1253ж2
Тогда
Н^ =фA ,l) = ±<Jl
10у v ; 2 |
-0,1253- 1,1
i,i2
= 0,364784;
10/ —-' ЛИГ =°'217852-
Окончательно имеем Р(ж > 11) = 1 — 2 • @,364784 - 1,1 • 0,217852) = 0,749707.
70 Распределения вероятностей случайных величин [Гл. 1
1.1.17. Распределение экстремального значения
Описание, применение. Рассмотрим распределение вероятностей экстре-
экстремальных выборочных значений случайной величины х: у\ = min(#i, х^-, . ..,жп)
и уп = max(#i, X2, ..., хп). Различают распределения экстремальных значений по™
следовательности независимых случайных величин двух типов, когда распределе-
распределение самих случайных величин сосредоточено на конечном и бесконечном интер-
интервалах. Если распределение исходных случайных величин ограничено некоторым
интервалом [а, 6], то для экстремальных значений имеет место так называемое
распределение типа III с функцией
— для минимального значения
Г (Ха\\
, = 1-ехр -1—^—1 , х > а;
для максимального значения
Г /b-x\P]
Fm,n = ехр -(^—^—J > x<b.
Очевидно, что распределения этого типа совпадают с распределением Вейбулла
(см. раздел 1.1.5).
Наибольшее практическое применение находит закон распределения экстре-
экстремальных значений для выборки случайных величин, распределенных на беско-
бесконечном интервале. Этот закон принято называть двойным показательным, или
распределением типа I [12, 94]. Рассмотрим распределение минимального значения
(распределение максимального значения следует из него заменой знака перед х).
Свойства
тт ж( тл 1 (х-а\ Г (х-а
Плотность j(x; а, о) = - ехр{ —-— )ехр< — ехр
Функция распределения F(x;a,h) = 1 — ехр< — expf —^
Среднее М(х) = а- 0,577Ь
2
Дисперсия В(х) = —, Ь2 = 1,645Ь2
Коэффициент вариации v = «— = 0,608-^ ;—
1,64562 б2 Ь
Коэффициент асимметрии «з = —1,14
Коэффициент эксцесса а4 = 2,4
Мода Mo = a
Медиана Me = а + Ып1п2 = а^ 0,3666
Распределение неограничен© и несимметрично. Если случайная величина х име-
имеет распределение Вейбулла, то случайная величина у = In x имеет распределение
минимального значения. Поэтому необходимые расчеты и оценки, связанные с рас-
распределением экстремальных значений, могут быть получены из расчетов и оценок
распределения Вейбулла.
Если имеется последовательность п независимых случайных величин, имеющих
распределение минимального значения с параметрами а и 6, то наименьшая из них
имеет такое же распределение с параметрами а-61ппи 6.
1.1]
Непрерывные распределения
71
Задача 23. Известно, что распределение минимальной наработки электронного при-
прибора имеет среднее значение, равное 1000 ч, и стандартное отклонение, равное 750 ч.
Найти вероятность того, что значение наработки превысит 1500 ч, и вычислить
95%-ю квантиль распределения минимальной наработки.
Имеем а = 0,5776 = 1000 и л/1Щ)Ъ = 750.
Отсюда а = 1000 + 0,577 • 584,76 = 1337,41 и Ь =
750
/1,645
= 584,76.
Далее Р(ж > 1500) = 1 - Р(ж < 1500) =
р-квантиль находим из условия р = ]_ — ехр< —
I
/1500- 1337,41
ехр(^
584,76
= 0,266989.
( (хр~а\\
< — ехр( J >,
I V 6 /J
где
хр = а + Ь ln[- ln(l - р)] = 1337,41 + 584,76 ln(- In 0,05) = 1979,
т.е. вероятность того, что наработка превысит 1979 ч, равна 0,05.
1.1.18. Треугольное распределение (распределение Симпсона)
Описание, применение. Сумма двух независимых равномерно распределен™
ных случайных величин имеет треугольное распределение.
Свойства
Параметры
Плотность
а, Ъ
f(x;a,b) =
0,
4(ж - а)
(Ъ - аJ '
х ^ а;
а < х <
х > а.
Функция распределения F(x;a,b) =
о,
(Ъ-а? '
1 — ------------------
х ^ щ
а < х
U,
2
х > Ъ.
< х < Ь;
Среднее М(ж) =
Дисперсия О(ж) =
Коэффициент вариации г; =
а + i
24
Коэффициент асимметрии аз = 0
Коэффициент эксцесса а4 = 2,4
Мода
Медиана
Мо =
Ме =
2
Распределение применяется редко, чаще всего в демонстрационных целях.
72 Распределения вероятностей случайных величин [Гл. 1
Задача 24. Случайная величина х имеет треугольное распределение с дисперсией
ТУ(х) = 24 и со средним М(ж) = 8. Найти вероятность того, что значение случайной
величины будет находиться в интервале [0,5].
Имеем М(ж) = ^^ = 8 и D{x) = l^H^L = 24, отсюда 6 - а = 24 и b = 20, а = -4.
2 24
Далее Р@ < ж < 5) = FE) - F@) = 2 " E + 4\ - 2 ' (° + 4)9 = 0,22569.
V ; W V ; B0 + 4J B0+ 4J
1.1.19. Распределение Коши
Описание, применение. Описывает распределение отношения двух незави-
независимых нормально распределенных случайных величин. В прикладной статистике
используется редко.
Свойства
Параметры a, b
Плотность f(x; а, Ъ) = — ехр(—=—) +1
7ГО [ \ О / J
1 1 ( х —- а\
Функция распределения F{x\a,b) = —I— arctgf —-— J
Мода Mo = а
Медиана Me = b
У распределения Коши не существует ни среднего, ни дисперсии. Отношение двух
независимых случайных величин, имеющих стандартное нормальное распределение,
имеет распределение Коши с параметрами а = 0 и Ъ = 1. Распределение Коши сов™
падает с ^-распределением Стьюдента (см. раздел 1.1.9) при / = 1 степени свободы.
Сумма п независимых случайных величин, имеющих распределение Коши с па-
параметрами щ и bi, также имеет распределение Коши с параметрами ]Р щ и ]Р Ъ{.
Если случайная величина х имеет распределение Коши с параметрами а и Ь, то
обратная ей случайная величина у = 1/х будет иметь распределение Коши с пара-
параметрами а1 = а /(а2 + Ь2) и Ъ' = Ь/(а2 + Ь2).
Задача 25. Отношение энергии разряда W газоразрядного прибора к его предельной
энергии Wnp называется фактором нагрузки к. Известно^ что предельная энергия
прибора распределена нормально со средним 1000 Дэт и стандартным отклонением
150 Дою. Также нормально со средним 500 Дтс и стандартным отклонением 60 Дтс
распределена энергия разряда прибора во время работы. Необходимо вычислить веро-
вероятность того, что при энергии разряда 600 Дмс фактор нагрузки не превысит 0,7.
Вычислить вероятность того, что значение к будет лежать в интервале 0,4^0,5.
Запишем отношение двух нормированных нормально распределенных случайных
величин
600 - 500 600 - 500
У =
w пр — ±\j\jkj kjuxj
150 _к_
150
Очевидно, что требование fc^057 и 054^ifc^0,5 эквивалентно условиям у ^ —7/4 и
0,5 ^ у ^ 1,25. Случайная величина у имеет распределение Коши с параметрами а = 0,
Ь= 1, и
О -j) =1-P{y^ -j) =l-F(a;O,l) = l-i-iaxctg(-j) =0,83475.
Далее
Р@,5 ^ у ^ 1,25) = F(l,25) - F@,5) = - + - arctg 1,25 — i — — arctg0,5 = 0,137639.
2 7Г 2 7Г
60
Wnp - 1000
150
600
к
60
- 1000
5
4
3
к
-5k
1.1] Непрерывные распределения 73
1.1.20. Логистическое распределение
Описание, применение. Чаще всего используется в описательной статистике.
Может быть использовано как простейшая модель для приближения распределения
нормальной случайной величины.
Свойства
Параметры а, Ъ
Гтг(ж — а)
expl—-7
Плотность f(x:a,b) = —7= ¦
+ ехр -
_ 7-!/ I \ I -I К(Х ~ t
Функция распределения г (ж; а, о) = \ 1 + ехр |
Среднее М(ж) = а
Дисперсия О(ж) = Ь2
Коэффициент вариации v = —
Коэффициент асимметрии а3 = 0
Коэффициент эксцесса «4 = 4,2
Мода Mo = a
Медиана Me = a
Задача 26. Случайная величина имеет логистическое распределение со средним а = 15
и коэффициентом вариации v = 3,3. Вычислить вероятность того, что значение слу-
случайной величины не превысит 10. Найти 15%-ю квантиль распределения.
Имеем Ь=- = — = 4,2857 и
v 3,5
{г 1 ^ ~1
1 + ехр - 710 ~ 1Б^ I = 0,1075.
Далее из условия
1С V3-4,2857 0,85
= т 1 г\п имеем г^о is = 15In
Г 7Г(«О15 - 15I '
1 + е
niK г 1С V34,2857 0,85
0,15 = = т 1 г\п имеем г^о is = 15 In = 10,9.
Г 7Г(«О15 15I ' 7Г 015
2857 J
=т1 г\п имеем г^о is = 15In
Г 7Г(«О,15 - 15I ' 7Г 0,15
ехр —
L VS- 4,28
1.1.21. Распределение Парето
Описание, применение. Применяется в основном в описательной статисти-
статистике. Впервые рассмотрено при изучении распределения доходов населения. Иногда
используется как простейшая математическая модель изменения интенсивности
отказов приборов на этапе приработки.
Свойства
Параметр с
Плотность f(%]c) = сх~^с+1\ 1 ^ х ^ о©
Функция распределения F(x;c) = 1 — ж^с, 1^ж^оо
Среднее М(ж) = -, с > 1
74 Распределения вероятностей случайных величин [Гл. 1
с / с \ ^
Дисперсия D(x) = — ( ) , с > 2
С z! \ С I/
Коэффициент вариации v = 1 , с > 2
\ с J
Если случайная величина х распределена равномерно на интервале [0,1], то
случайная величина A/ж)с имеет распределение Парето с параметром с.
Задача 27. Случайная величина х имеет распределение Парето с параметром с = 2,4.
Вычислить вероятность того, что х ^ 5, и 95%-ю квантиль распределения.
Имеем Р(ж ^ 5) = FE; 2,4) = 1 - 5~2'4 = 0,979. Из условия 0,95 = 1 - щ2^ получаем
^о,95 =0505~2^ =3,484.
1.1.22. Композиции законов распределения вероятностей случайных величин,
возникающие при расчете надежности по схеме „нагрузка-напряжение"
Если х — прочность объекта испытаний, а у— действующая на него нагрузка, то
вероятность безотказной работы объекта испытаний равна
Л = Р(ж> у) = Р(х - у > 0).
В общем случае х ж у являются случайными величинами с плотностями распре™
деления вероятностей f(x) и f(y) соответственно. Легко видеть, что вероятность
безотказной работы равна Р(ж — у > 0) = 1 — F(x — г/), где F(x — у) — функция
распределения разности случайных величин х и у.
Рассмотрим соотношения для вероятности безотказной работы R при различных
законах распределения вероятностей значений прочности и напряжения.
Случай 1. Прочность и напряжение распределены нормально (см. раздел 1.1.1)
; f(y) =
аху~ш [ ^ v ux / j
Тогда
V2tt J
где F(z) — функция стандартного нормального распределения.
Случай 2. Прочность и напряжение распределены логарифмически нормально
(см. раздел 1.1.3):
(Ых ~
. 2a*
1 Г i
/Ы = -
где (i\n х, (i\n у, а\п х, <Jin у — параметры нормальных распределений величин In x
и \пу.
Случай 3. Прочность и напряжение распределены по экспоненциальному закону
(см. раздел 1.1.4)
f(x) = Хх ехр(^Ажж); f(y) = Ху ехр(-Ауу); R = -—^—.
1.1] Непрерывные распределения 75
Случай 4. Прочность распределена нормально (экспоненциально), а напряже™
ние экспоненциально (нормально):
X — Цх
Тогда [93]
При
f{x) = Ххещ>{-\хх}; f(y) = -±= ещ>[-\(у—>
ауу2ж { 1 V (Ту
Случай 5. Прочность и напряжение имеют гамма-распределение (см. раздел 1.1.6)
Вероятность безотказной работы имеет вид:
при ах ф 0 и ау ф О
р _ Г(аж + ау - 2) , _ ,
где Г(...) — гамма-функция, В7(а, Ь) —неполная бета-функция иг = -^;
Рх
при аж = ау = 0 (х и г/ имеют экспоненциальное распределение)
при аж = 0, ау т^ 0 (прочность распределена экспоненциально, а напряжение имеет
гамма-распределение)
при ах ф 0, о^ = 0 (прочность имеет гамма-распределение, а напряжение распре-
распределено экспоненциально)
R= 1-
Случай 6. Напряжение распределено нормально, а прочность по закону Вей™
булла (см. раздел 1.1.5):
1 Ру в -
-ihyv
Вероятность отказа равна
2тг ^ж
о
Таблицы значений интеграла приведены в [95] и в табл. 5.
76
Распределения вероятностей случайных величин
[Гл. 1
Таблица 5
А
Значения A -
- А), умноженные на
1СГ (А
= -Цх/сгх, С = <
С
10
20
30
40
50
60
70
80
90
100
/Зу = 1
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
-1,4
-1,8
-2,2
-2,6
-3,0
-3,4
-3,8
-4,2
-4,6
-5,0
-5,5
-6,0
-6,5
-7,0
-8,0
-9,0
-10,0
0001
0003
0004
0005
0008
ООН
0016
0022
0030
0041
0069
0111
0169
0247
0349
0475
0630
0815
1031
1279
1634
2037
2485
2973
4039
5265
6269
0000
0000
0000
0001
0001
0001
0002
0003
0005
0005
0009
0014
0022
0032
0045
0062
0082
0108
0138
0173
0255
0287
0360
0443
0645
0897
1202
0000
0000
0000
0000
0000
0000
0001
0001
0002
0002
0003
0004
0006
0009
0013
0018
0024
0032
0041
0052
0067
0086
0108
0134
0196
0276
0374
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0003
0004
0006
0008
0010
0014
0017
0022
0029
0036
0046
0057
0083
0117
0160
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0003
0004
0005
0007
0009
ООН
0015
0019
0023
0029
0043
0050
0082
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0004
0005
0006
0008
ООН
0014
0017
0025
0035
0048
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0001
0002
0003
0003
0004
0005
0007
0009
ООН
0016
0022
0030
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0004
0005
0006
0007
0010
0015
0020
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0003
0004
0005
0007
0010
0014
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0001
0002
0002
0003
0004
0005
0008
0010
Pv = 2
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
-1,4
-1,8
—2 2
-2^6
-3,0
-3,4
-3,8
-4,2
-4,6
ООН
0017
0025
0035
0049
0067
0089
0116
0149
0188
0284
0407
0557
0733
0935
1159
1406
1671
1954
0003
0004
0007
0009
0012
0017
0023
0030
0038
0048
0073
0105
0144
0191
0246
0308
0377
0453
0536
0001
0002
0003
0004
0006
0008
0010
0013
0017
0021
0032
0047
0065
0086
ОНО
0138
0170
0205
0243
0001
0001
0002
0002
0003
0004
0006
0007
0010
0012
0018
0026
0036
0048
0062
0078
0096
0116
0137
0000
0001
0001
0001
0002
0003
0004
0005
0006
0008
0012
0017
0023
0031
0040
0050
0062
0074
0088
0000
0000
0001
0001
0001
0002
0003
0003
0004
0005
0008
0012
0016
0022
0028
0035
0043
0052
0061
0000
0000
0001
0001
0001
0001
0002
0002
0003
0004
0006
0009
0012
0016
0020
0026
0031
0038
0045
0000
0000
0000
0001
0001
0001
0001
0002
0002
0003
0005
0007
0009
0012
0016
0020
0024
0029
0035
0000
0000
0000
0000
0001
0001
0001
0001
0002
0002
0004
0005
0007
0010
0012
0015
0019
0023
0027
0000
0000
0000
0000
0001
0001
0001
0001
0002
0002
0003
0004
0006
0008
0010
0013
0015
0019
0022
1.1]
Непрерывные распределения
77
А
п
р о д о л
жени
е та б л
ицы 5
С
10
20
30
40
50
60
70
80
90
100
f3y = 2
-5,0
-5,5
-6,0
-6,5
-7,0
-8,0
-9,0
-10,0
2251
2640
3043
3457
3876
4713
5525
6285
0626
0748
0879
1020
1170
1493
1845
2222
0284
0341
0402
0468
0539
0695
0969
1059
0161
0193
0228
0266
0307
0398
0499
0611
0103
0124
0147
0171
0198
0256
0322
0396
0072
0086
0102
0119
0138
0179
0225
0277
0053
0064
0076
0088
0101
0132
0166
0204
0041
0049
0058
0067
0078
0101
0127
0157
0032
0038
0046
0053
0062
0080
0101
0124
0026
0031
0037
0043
0050
0065
0082
0100
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
-1,4
-1,8
-2,2
-2,6
-3,0
-3,4
-3,8
-4,2
-4,6
-5,0
-5,5
-6,0
-6,5
-7,0
-8,0
-9,0
-10,0
0001
0003
0004
0005
0008
ООН
0016
0022
0030
0041
0069
0111
0169
0247
0349
0475
0630
0815
1031
1279
1634
2037
2485
2973
4039
5265
6269
0000
0000
0000
0001
0001
0001
0002
0003
0005
0005
0009
0014
0022
0032
0045
0062
0082
0108
0138
0173
0255
0287
0360
0443
0645
0897
1202
0000
0000
0000
0000
0000
0000
0001
0001
0002
0002
0003
0004
0006
0009
0013
0018
0024
0032
0041
0052
0067
0086
0108
0134
0196
0276
0374
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0003
0004
0006
0008
0010
0014
0017
0022
0029
0036
0046
0057
0083
0117
0160
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0003
0004
0005
0007
0009
ООН
0015
0019
0023
0029
0043
0050
0082
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0004
0005
0006
0008
ООН
0014
0017
0025
0035
0048
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0001
0002
0003
0003
0004
0005
0007
0009
ООН
0016
0022
0030
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0004
0005
0006
0007
0010
0015
0020
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0003
0004
0005
0007
0010
0014
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0001
0002
0002
0003
0004
0005
0008
0010
/Зу=4
0,8
0,6
0,4
0,2
0,0
-0,2
-0,4
-0,6
-0,8
-1,0
0000
0000
0001
0001
0001
0002
0003
0005
0007
0010
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
78
Распределения вероятностей случайных величин
[Гл. 1
А
Окончани
е та б л
ицы 5
С
10
20
30
40
50
60
70
80
90
100
-1,4
-1,8
— 2 2
-2,6
-3,0
-3,4
-3,8
-4,2
-4,6
-5,0
-5,5
-6,0
-6,5
-7,0
-8,0
-9,0
-10,0
0018
0033
0055
0088
0136
0201
0289
0404
0501
0732
1015
1366
1788
2282
3466
4838
6252
0001
0002
0003
0006
0009
0013
0019
0026
0036
0048
0068
0094
0126
0167
0275
0429
0638
0000
0000
0001
0001
0002
0003
0004
0005
0007
0010
0014
0019
0025
0033
0055
0087
0130
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0004
0006
0008
ООН
0017
0027
0041
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0004
0007
ООН
0017
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0002
0003
0005
0008
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
0002
0003
0004
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0002
0003
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0002
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0000
0001
0001
0001
Задача 28. Прочность элемента конструкции распределена нормально с парамет-
параметрами fix = 100 и ах = 50. Нагрузка^ действующая на элемент^ такэже распределена
нормально с параметрами \ху = 50 и ау = 25. Вычислить вероятность безотказной
работы элемента.
Имеем z= ^ 2 = — 0,89442. Далее, используя аппроксимацию 8 (см. раз-
раздел 1.1.1), получаем
2,34"
F(-0,89442) = l-F@,89442) = 1-0,852 expi - f °^89442 + 1>5774 ) К =0,185337;
I у 2,0637 J I
R = 1 - F(-0,89442) = F@,89442) = 0,814662.
Задача 29. Прочность элемента конструкции распределена логарифмически нормаль-
нормально с медианой 1000 ед. и модой 60 ед., а нагрузка распределена логарифмически нор-
нормально с медианой 80 ед. и модой 40 ед. Вычислить вероятность безотказной работы
элемента.
Имеем
exp(/iinJC) = 100; ехр(^1ПЖ - а?пх) = 60; ехр((цпу) = 80; exp(/iin2/ - (Тыу) = 40.
Тогда
jtxinx = 4,605; /Лпу = 4,382; afnx = fi\nx - In60 = 0,511; afny = fnny - In40 = 0,693.
Далее
^605 - 4,382
= _ 18521 Д= l^F(-0,18521) = 1-1 +F@,18521) =F@,18521).
0,511 + 0,693
Применив аппроксимацию из задачи 28, находим
R = F@,18521) = 1 - 0,
2,0637
= 0,573257.
1.1] Непрерывные распределения 79
Задача 30. Прочность элемента конструкции распределена экспоненциально
с Хх = 1CF3, а нагрузка также имеет экспоненциальное распределение с Ху = 1CF4.
Вычислить вероятность отказа элемента.
Вероятность отказа элемента равна
1 _ Л = 1 *»_ = _*?_ = 0,909.
«^Ж I Лу Л.х \ ^у
Задача 31. Прочность элемента конструкции распределена нормально с парамет-
параметрами fix = 200 и ах = 30, а нагрузка распределена экспоненциально с параметром
Ху = 10~2. Вычислить вероятность безотказной работы элемента.
Имеем
= 1 ~~ F(-6,6667) - ехр(-1,955){A - F(-6,6667)} = FF,6666) - 0,14156 • FF,6667).
Очевидно, что ,РF,6667) « 1, и окончательно получаем R = 1 — 0,14156 = 0,858. Легко
видеть, что если поменять местами прочность и нагрузку, то R = 0,142.
Задача 32. Прочность элемента конструкции имеет гамма-распределение с пара-
параметрами ах = 3 и j3x = 10^3, а нагрузка распределена экспоненциально с параметром
/Зу = 10~3. Вычислить вероятность безотказной работы элемента.
Имеем R=l- ( —^— ) = 0,75.
Задача 33. Прочность элемента конструкции распределена по закону Вейбулла с па-
параметрами ау = 800 и /Зу = 3, а нагрузка распределена нормально с параметрами
цх = 400 и ох =80. Вычислить вероятность безотказной работы элемента.
Имеем А = ^— = ^— = ^5; С = — = 10. Из табл. 5 для /3 = 3, А = ^5 и С = 10
<7Х 80 80
имеем 1 - Д = 0,1279 ий = 0,8721.
1.1.23. Нецентральное распределение Стьюдента
(нецентральное t-распределенме)
Описание, применение. Если случайная величина х имеет нормальное расп-
распределение со средним S и единичной дисперсией, а независимая от нее случайная
величина %2 имеет распределение хи-квадрат с / степенями свободы, то случайная
величина tf = х/х имеет нецентральное t-распределение с / степенями свободы
и параметром нецентральности S.
При S = 0 нецентральное i-раепределение совпадает с центральным (см. раз™
дел 1.1.9). Пусть 5(/,tg,p) — значение параметра нецентральности, при котором
случайная величина t7, имеющая нецентральное t-распределение с параметрами /
и <5, превышает значение to с вероятностью р, т. е. P{t;(/, S) > to} = p.
Очевидно, что
S(f,to,p) = -S(f,-to,p).
Таблицы, необходимые для расчетов в случае нецентрального ^распределения,
приведены в [24, 29, 96, 97].
80 Распределения вероятностей случайных величин [Гл. 1
При / > 30 применимо приближение
где U\—v—р-квантиль стандартного нормального распределения.
В [97] приведена достаточно простая аппроксимация, основанная на том, то
Arsh tW— имеет нормальное распределение
L V j J
где Arsh(x) = In (ж + л/х2 + l) —гиперболический арксинус, a t — случайная вели-
величина, имеющая распределение Стьюдента.
Нецентральное t-распределение используется при планировании эксперимента
и оценке мощности критериев проверки гипотез с помощью статистик, основанных
на ^критерии.
Задача 34. Вычислить значение параметра нецентральности 5, при котором слу-
случайная величина, имеющая нецентральное t-распределение с / = 10 степенями свободы,
превысит величину to = 2 с вероятностью р = 0,9.
Используя нормальную аппроксимацию, имеем
/ 22 \
5A0; 2; 0,9) = 2 - uo,i I 1 Н ) = 2 - uOjl • 1,095445.
Пользуясь аппроксимацией 15 из раздела 1.1.1, имеем
г*0,1 = 4,91 • (ОД0'14 - 0,90'14) = -1,2812615 и E = 2 + 1,2812615 • 1,095445 = 3,40356.
1.1.24. Нецентральное распределение Пирсона
(нецентральное распределение хи-квадрат)
Описание, применение. Сумма квадратов п независимых нормально распре™
деленных случайных величин с единичной дисперсией, среди которых по крайней
мере одна имеет ненулевое математическое ожидание, подчиняется нецентральному
Х! -распределению.
Нецентральному %' -распределению подчинена сумма
/v / j \ 1
где Х{ — независимые нормально распределенные величины с нулевым средним
^ п ^ п
и общей дисперсией а2 ; 7г — постоянные со средним j = ^^7i иж= — У^ Xj.
п f—' n
г=1 г=1
Величина \' подчиняется нецентральному х -распределению с / = п степенями
П 1
свободы и параметром нецентральности а = V^ ^"Gг — О7J-
Таблицы нецентрального х' ^распределения приведены в [24].
2а)
1.1] Непрерывные распределения 81
Пирсон предложил преобразование, позволяющее вычислить нецентральное
X2-распределение через центральное [98]:
а2
(п _i_ 2аK
где Х2(/;)—центральное х2тРасг[РеДеление с /' = 2 степенями свободы.
(п + За)
При а —> О Х2(/0 отличается от функции точного распределения хи-квадрат на
величину порядка а2, а при а —>¦ оо на величину порядка —.
а
Более простое, но менее точное преобразование предложено Патнайком [99]:
х" (/;/) = X2(fi а)ч гДе /;/ = . Полезно следующее преобразование [97]:
/ + 2а j + 2а
обычная величина сх2(/;) имеет то же распределение, что и нецентральная х' (/? а)?
/ + 2а , / + а2
если с = --—— и /' = - , о .
/ + а / + 2а
Нецентральное х2~РаспРеДеление применяется при планировании эксперимента
для проверки гипотез, когда используются статистики, основанные на случайных
величинах х2-
Задача 35. Вычислить 95%-ю квантиль случайной величины^ имеющей нецентраль-
нецентральное х2 -распределение с / = 30 степенями свободы и параметром нецентральности
а= 10.
Из соотношения
/ + За [
/ + За
2/ л ч 2//^/\/ +
апедует Х (/,а) = х (/ )уТ^ - jj^, или
'00,10) = /(Л ¦ ^^ - ^^ = 1,2х2(Л - 1,6667
v ' ; л u ; 30 + 20 30 + 30 v '
( f -4- *}п\^ ^П^
= 34,722.
(/ + ЗаJ 602
Найдем теперь верхнюю 95%-ю квантиль обычного х2~РаспРеДеления с / — 34,722 сте-
степенями свободы. Воспользуемся аппроксимацией 10 (Хоглина) из раздела 1.1.8:
Хр = \ 1,06807у? + 2,13161 [- lg(l - р)] 2 - 0,04589^/ • [- lg(l - р)] 2 - 1,37266 \ =
= < 1,06807^/34,722+ 2,13161-1,140627-0,04589^34,722-1,140627-1,37266^ =49,6168.
1.1.25. Нецентральное распределение Фишера
(нецентральное .F-распределенме)
Описание, применение. Если xi —случайная величина, имеющая нецен™
тральное распределение хи-квадрат с Д степенями свободы и параметром нецен-
нецентральности а, а х! —независимая от нее случайная величина, подчиняющаяся рас™
fry "V-,
пределению хи-квадрат с /2 степенями свободы, то случайная величина F* = j-
/1X2
имеет нецентральное ^-распределение.
82 Распределения вероятностей случайных величин [Гл. 1
Для проведения расчетов, связанных с нецентральным ^-распределением, могут
быть использованы графики, приведенные в [29, 100]. Нецентральное .F-распреде-
ление используется при планировании эксперимента и оценки мощности критериев
проверки гипотез, основанных на применении ^-распределения.
Табулирование нецентрального ^-распределения затруднено из-за большого ко-
количества независимых переменных (Д, /2, а), поэтому разработаны его аппроксима-
аппроксимации обычным (центральным) .F-распределением [101, 102]. Наиболее проста и точ-
F* + с
на аппроксимация М. Тику [101], в соответствии с которой величина F = —-—
имеет центральное ^-распределение с параметром Ъ и /2 степенями свободы, где
Ь 1 Н „ Н2
г^2К^ ^^К3'
= (/i+«J + (/2^2)(/! + 2a);
а)(/2^2) + (/1+За)(/2^2J.
В [97] предложена упрощенная формула для нецентрального ^-распределения.
Случайная величина F^ j2(«), имеющая нецентральное F-распределение со степе-
степенями свободы /i и /2 и параметром нецентральности а, распределена как величина
1 + т~ j-^X/i ?/2)? где /* = -Ц — и F{у 1,1/2)—обычная ^-величина с \/\ и щ
/1 / Ji + 2а
степенями свободы.
Более точные аппроксимации можно найти в [115].
Задача 36. Вычислить верхнюю 10%-ю точку нецентрального F1'-распределения с па-
параметрами /i = 10, /2 = 12 и а = 2.
Используем аппроксимацию Тику. Имеем
Н = 2 • A0 + 2K + 3 • A0 + 2) • A0 + 4) • A2 - 2) + A0 + 6) • A2 - 2J = 10096;
2
К = A0 + 2J + A2 - 2) • A0 + 4) = 284; Е = =- = 4,4498325;
284
h = ^^ I г™* = 1,212314;
10 2-10,72558 + 12-2 284 '
Ъ = ^—^ . [ /4-4498325 - 1 ) = 10,72558; с = ^^ • ( 1,212314 - ^^ ) = 0,0147768.
1 I V 0,4498325 / ' ' 12-2 \ ' 10 ' '
F* + с
Исходя из того, что случайная величина F = имеет центральное jF-распределение,
находим искомую величину, где F — обычная F-величина с Ь = 10,725933 и /2 = 12 сте-
степенями свободы. Для ее вычисления воспользуемся аппроксимацией 9 из раздела 1.1.10.
Для р = 0,9 (верхняя 10%-я точка; не путать h и Ь в этих обозначениях с обозначениями,
ранее применяемыми) имеем
о = 1,1131; 6 = 0,77; с = 0,527;
h=2HK = 2-10,72558.12 = = 12-10,72558 = . 3
fi + /2 10,72558 + 12 ' ' Б 10,72558 ¦ 12
Тогда
lgF0,9A0,72558; 12) = 1,1131 • A1,32705612 - 0,77) 2 - 0,527 • 9,901791 • 10^3 = 0,3373623
и Fo,9@,72558; 12) = 2,1745; F0*9 = 1,2123267 • 2,1745 - 0,014792021 = 2,621412.
1.1] Непрерывные распределения 83
A0 + 2J
Используем теперь второе приближение. Находим fl = = 10,285714 и вы-
вычисляем /о,э(Ю, 285714; 12) по аналогии (а = 1,1131; Ь = 0,77; с = 0,527)
2-10,285714.12 = 12 - 10,285714 =
10,285714+12 ' ' & 10,285714-12
lg10 Fo,9A0,285714; 12) = 1,1131 • A1,0769229 - 0,77) 2 - 0,527 • 0,01388889 = 0,339393;
Fo,9A0,285714; 12) = 2,184707 и F0*9A0; 12; 2) = ( Ц 1 • 2,184707 = 2,621648.
Видно, что погрешность аппроксимации вторым способом удовлетворительна, а сам
способ много проще в вычислительном отношении.
84 Распределения вероятностей случайных величин [Гл. 1
1.2. Дискретные распределения
1.2.1. Биномиальное распределение (распределение Бернулли)
Свойства, применение. Если событие осуществляется в единичном испытании
с некоторой постоянной вероятностью, то число появлений события в последо-
последовательности независимых испытаний подчинено распределению Бернулли. При
испытаниях невосстанавливаемых изделий на фиксированную наработку число
отказов подчиняется биномиальному распределению. Оно широко применяется при
выборочном приемном контроле качества продукции и статистическом предупреди-
предупредительном контроле технологических процессов в производстве.
Свойства
Распределение вероятностей
— вероятность появления события ровно х раз в серии из п испытаний, при условии,
что в единичном испытании вероятность его появления равна р.
Функция распределения
г=0
— вероятность появления событий ^ х раз в серии из п испытаний.
Среднее М(ж) = пр
Дисперсия D(x) = прA — р)
Коэффициент вариации v =
пр
Коэффициент асимметрии аз = A — 2р)[прA — р)] 2
Коэффициент эксцесса а^ = 3 \-
п прA — р)
Таблицы вероятностей биномиального распределения приведены в [16, 23, 29, 44].
Однако появление современных компактных и весьма мощных микрокалькулято-
микрокалькуляторов позволяют достаточно быстро производить расчеты без применения таблиц [30,
31, 33].
При п —>• оо, р —>¦ 0 и пр = const биномиальное распределение сводится к распре-
распределению Пуассона (см. раздел 1.2.2) с параметром А = пр (приближение приемлемо
при п>10ир<0,1). В силу взаимосвязи распределения Пуассона с распределе-
распределением хи-квадрат (см. раздел 1.1.8) функция биномиального распределения может
быть выражена через интеграл вероятностей % -распределения:
F(x; n,p) = Y^ ^r e~np = PX2Bnp, 2x + 2),
i=0
где РХ2 (г/, и) = 1 — Fx^{x) — интеграл вероятностей ^-распределения с v степенями
свободы, FX2 (ж) — функция распределения jq с у степенями свободы.
При п —^ оо биномиальное распределение стремится к нормальному со средним
/J, = пр и дисперсией а2 = прA — р). Сходимость удовлетворительна при
прA — р) > Б и 0,1 $С р ^ 0,9 или при прA — р) > 25 и любом р. Наилучшая схо-
сходимость обеспечивается при р = 0,5 и ухудшается при р < ир> -.
1.2] Дискретные распределения 85
Таким образом, в указанных диапазонах имеет место
1
- пр + -
F(x;n,p) = Ф
л/прA - р) 1
где Ф(...) —функция стандартного нормального распределения.
Биномиальное распределение может быть выражено через функцию бета™рас™
преде ления (см. раздел 1.1.7)
F(x;n,p) = 1 — /р(ж1,п — х) = Ii-P(n - х,х + 1),
где 1р(а,Ъ)—неполная бета-функция, и через функцию F-раепределения (см. раз™
дел 1.1.10)
F(x;n,p) = с\^^^;2(п - х),2(х + 1I ,
I fh Ju tj I
где G(y; fi, /2) — функция ^распределения относительно переменной у с Д и /2
степенями свободы.
Приведенные соотношения позволяют использовать таблицы и аппроксимации
бета™ и ^распределений для расчетов при биномиальном распределении.
Пуассоновские и нормальные приближения, рассмотренные выше, относительно
грубы. Поэтому был предложен ряд точных приближений, например, в [104]:
где при у = у* = — погрешность ^ —~ при р < 0,2 и п ^ 300 [17], а при
2 — р п
y = y**=y*{l + [x(x + 2) + xy*-2y*]2l6Bn-x2)~1]y1 погрешность ^\ (при
р ^ 0,12 и п ^ 300 [17]).
Моленаром [55] предложены весьма точные аппроксимации биномиального рас-
распределения нормальным:
— для „хвостов" распределения @,005 ^ р ^ 0,05 и 0,93 ^ р ^ 0,995)
F(x;n,p) =
— для распределения между „хвостами"
ж + 2,5)A ^р)з - [Dп - 4ж -
при этом должны выполняться приблизительно следующие соотношения между
пир:
п = 3; 0,25 ^р^ 0,75;
п = 30; 0,40 ^ р ^ 0,60;
п = 300; 0,46 ^ р ^ 0,54.
Для более точной аппроксимации используется формула [105]
F(x; п,р) = ф[[А(х, А)] а - [А{п - х - 1, -А)] 2 } ,
\\ 15 + 12Л + 5Л2 , C + 6Л + 7Л2)Bж + 1+пЛ)
A)+А = 1-
где
Л2 C + 6Л + 7Л2
_
86 Распределения вероятностей случайных величин [Гл. 1
При табулировании биномиального распределения возникают трудности из™за
того, что его параметр р одновременно входит в выражения для среднего и для
дисперсии. Специальные преобразования исходной биномиально распределенной
случайной величины позволяют устранить эти трудности. В [106] показано, что
случайная величина z = 2 aresin у/х/п, где х — биномиально распределенная слу-
случайная величина, имеет при п > 50 нормальное распределение с математическим
ожиданием /л = 2arcslnv/p и дисперсией а2 = 1/п. При умеренных п (п < 50) Ан™
скомбом [107] предложено уточненное преобразование
z* = aresin
\
аппроксимирующееся
2 1
иг = -.
X
n
3
+ 8
3'
+ 4
нормальным
удовлетворительно аппроксимирующееся нормальным распределением
/л = aresin
3
I 2 !
. 2"
4n
Характеристическим свойством биномиального распределения — дисперсия
меньше среднего — можно руководствоваться при выборе между ним и отрица-
отрицательно-биномиальным (см. раздел 1.2.3), для которого дисперсия больше среднего,
и распределением Пуассона (см. раздел 1.2.2), у которого дисперсия равна среднему.
Задача 37. Вероятность появления дефектного изделия в производстве равна ОД.
Вычислить вероятность появления в партии из 60 изделий не более 10 дефектных.
Имеем р = ОД; п = 60; ж = 10 и пр = 6. Необходимо вычислить величину
FA0] 0,1; 60). Непосредственный расчет (точное решение) дает
ю
; ОД; 60) = ]Г Сг60 • 0,1* • 0,960~* = Cq0 • 0,960 + С\о • ОД • 0,959 + Cq0 • ОД2 • 0,958 =
г=0
= О630 • ОД3 • 0,957 + О640 • ОД4 • 0,956 + О650 • ОД5 • 0,955 + О660 • ОД6 • 0,954 + О670 • ОД7 • 0,953 +
+ Оео • ОД8 • 0,952 + Оео ' ОД9 • 0,951 + С&? • ОД10 • 0,950 = 0,96570865.
Аппроксимация с помощью распределения Пуассона:
ю i
FA0; 60; ОД) = ]Г — • е = 2,478752 • 10 х
г=0 %
( 36 216 1296 7776 46656 279936 1679616 10077696 60466176"
X 1 + 6 Ч 1 1 1 1 1 1 1 1
\ 2 6 24 120 720 5040 40320 362880 3628800
= 0,9573799 (E = 0,87%).
Если воспользоваться соотношением между распределением Пуассона и х2™распреде™
10 gi
лением ^ — е^6 = Р%2 B • 6; 20 + 2) = РХ2 A2,22) и применить аппроксимацию 3 (см. раз™
г=0 1'
дел 1.1.8), то получим из соотношения Xp = /(l \-ир\ — 1 , имея в виду, что
\ 9/ V 9/ /
2 ( 2 Г^\3
Хз :=: 12 и / = 22, уравнение 12 = 221 1 Ь ир\ 1 , решением которого явля-
является величина нормальной квантили ир = 1,719747.
1.2]
Дискретные распределения
87
Используем аппроксимацию 8 из раздела 1.1.1:
2,0637
= 0,957302.
Полученное значение вероятности РХ2 A2,22) = 1 — F(x2 < 12) « 0,957302 очень близко
к точной величине 0,95778.
Используем теперь нормальное приближение
F(x;n,p) = Ф
- пр + -
= Ф
10-6 + 0,5
л/6 • 0,9
= ФA,93649).
С помощью аппроксимации 18 из раздела 1.1.1 получаем
ФA,93649) = 1-- ехр(-0,717 • 1,93649 - 0,416 • 1,936492) = 0,97378 (S = 0,
С помощью приближения бета-распределением имеем
F(x;n,p) = в(^ • ^; 100,22^ = G(l,98; 100,22).
Применим аппроксимацию 4 (см. раздел 1.1.10):
I / 2
1,983 • 1 -
9-22
-(г-
9- 100 )
= 1,820406.
v9-100 9-22
Далее, используя аппроксимацию 8 из раздела 1.1.1, получаем:
FK) = ^A,820406) = 1 - 0,852еХр [- {^Щ^)^
что очень близко к точному значению 0,96579.
Рассмотрим нормализующие преобразования
= 0,96567,
z = 2 aresin ( — ) = 0,84106867; и = 2 arcsin ^ОД = 0,643501;
а = I- = 0,1290994; ир = "^^867-0,643501 =
60 р 0,1290994
Далее
F(up) = 1 - 0,852 exp -
1,5303518 + 1,5774
2,0637
= 0,9371266.
Для уточненного преобразования имеем
= 0,426028; // = arcsin
z = arcsin
60+ -
0,1-
1 +
4
3
^¦60
3
¦60
/4-60 + 2
^0,0642824; ир =
0,0642824
Окончательно
F(l,49551) = 1-0,852 exp
1,49551 + 1,5774
2,0637
44-
= 0,3298829;
= 1,49551.
= 0,93271.
'8 Распределения вероятностей случайных величин [Гл. 1
Задача 38. Имеем р = 0,5 и п = Ъ. Вычислить FC; 0, 5, 5), используя аппроксимацию
Моленара.
Имеем Ах + 2,5 = 1545; An - Ах - 1 = 20 - 12 - 1 = 7 и
FC; О55, 5) = Ф{^14,5-О55- у/7 • 0,5} = Ф@,8217537) = 0,793382.
Для сравнения найдем точное значение:
з
FC; 0,5, 5) = J2 С5 * °^ * О?5^ = °^5 • A + 5 + 10 + 10) = 0,8125 (S = 2,3%).
г=0
1.2.2. Распределение Пуассона
Описание, применение. Если вероятность появления независимых событий
в малом промежутке времени At пропорциональна At, то число их появлений имеет
распределение Пуассона. Распределение Пуассона широко применяется в теории
массового обслуживания. Часто оно используется для аппроксимации биномиаль-
биномиального, так как легче табулируется (имеет только один параметр). Распределению
Пуассона подчинено число отказов невосстанавливаемых электронных приборов
в течение периода приработки. Если наработка на отказ изделия является случай-
случайной величиной, распределенной экспоненциально с параметром А, то число отказов
в интервале времени t подчиняется распределению Пуассона с параметром tX.
Свойства
Распределение вероятностей
/(ж; А) = —¦ , х = 0,1, 2, ...; А > 0;
/(ж; A) = max при х = [А] (наибольшее целое число ^ А)
Функция распределения F(x; X) = 2_^ .f
г=0
Среднее М(ж) = А
Дисперсия D(x) = A
Коэффициент вариации v = A~2
1
Коэффициент асимметрии аз = А~ 2
Коэффициент эксцесса а^ = 3 + -т-
А
При А > 9 распределение Пуассона можно аппроксимировать нормальным
/ 1
I X ~т~ — /\ (
с ц = А и а = уА, т.е. Ф I ™= = F(x] А) A/2 — поправка Йэтса на непре-
1 v A
рывность).
Распределение Пуассона является предельной формой биномиального распре-
распределения (см. раздел 1.2.1), т.е.
lim ^2 ^пРг(^ — Р)П^г = ~J e^X-
пр—*\ г=0
1.2]
Дискретные распределения
89
Функция распределения Пуассона может быть выражена через функцию %2™
пределения
г=0
где -РBА, 2х + 2)—функция ^-распределения относительно переменной 2Л
с/ = 2(ж + 1) степенями свободы.
По аналогии с биномиальным распределением Анскомб [107] показал, что
случайная величина 2л/х при Л —>> оо распределена асимптотически нормально
с /х = 2уЛ и сг = 1.
С учетом поправки на непрерывность можно для прикидочных расчетов исполь-
использовать формулы
Аге
ж + 1 — 2А) —на „хвостах" распределения;
+ 0,75 — 2А) —между „хвостами" распределения.
Высокой точностью обладает аппроксимация
г=0
9
36
где 7 = [x =
(здесь Ф(...)—функция стандартного нормального распределения, обозначенная
в разделе 1.1.1 как F(z)).
Учитывая связь ме^ду распределением Пуассона и х2™распределением, для его
аппроксимации можно использовать аппроксимации для распределения хи™квадрат.
Сумма случайных величин, распределенных по закону Пуассона, также будет
иметь распределение Пуассона с параметром, равным сумме параметров слагаемых.
Существуют обширные таблицы распределения Пуассона, например, в [23-25, 57].
Характеристической особенностью распределения Пуассона является равенство
среднего и дисперсии.
Задача 39. Случайная величина имеет распределение Пуассона с параметром А = 5.
Вычислить вероятность того^ что случайная величина не превысит значение 3.
Прямой расчет по формуле распределения:
FC; 5) =
A + 5 + 12,5 + 20,833) = 0,265023669.
Грубая нормальная аппроксимация (см. аппроксимацию для Ф(ж) в разделе 1.1.1):
3+5
= 1^0,852 ехр| -
Нормальная аппроксимация между „хвостами":
FC; 5) = Ф{2^3 + 0,75 - 2^5} = Ф(-0,5991526) =
= 0,26367.
= 1 - 0,852 ехр< -
1
2,0637
90 Распределения вероятностей случайных величин [Гл. 1
Уточненная нормальная аппроксимация:
X±i J ( Х^ ]
7 = — = 0,67222; х + ^— = 1,8759359; Л + = 2,19008;
5 \ 9 / \ 36 /
Далее
FC; 5) = ФB • 1,8759359 - 2 • 2,19008) = Ф(^0,6282882) =
= 1 - 0,852еХр|-(-°'628228086з7+1'5774J'34} = °'27573 <* = 3'8%)-
Погрешность аппроксимации достаточно высока, даже с учетом примененной простой
аппроксимации для стандартного нормального распределения.
1.2.3. Отрицательное биномиальное распределение
Описание, применение. Если р — вероятность появления события в единич-
единичном испытании, то случайное число х неудачных испытаний до появления га-го
успеха подчиняется отрицательному биномиальному распределению. Распределе-
Распределение используется при планировании запуска изделий в производство для получения
требуемого количества годных изделий при известном проценте выхода годных, при
планировании объема испытаний до получения заданного числа отказов.
Свойства
Распределение вероятностей
f(x;m,P) = C™+m_lPm(l-p)x, m = 0,1,2,...; х = 0,1,2,...
т
-рУ
Функция распределения
Среднее
Дисперсия
Коэффициент
Коэффициент
Коэффициент
вариации
асимметрии
эксцесса
F(x;
М(х
Т>(х)
V
а3 =
т,р) =
) —
тA
г
1
\/тA-
г=1
1 -р)
Р
-Р)
2
7
B-p)[m(l-
з+ 6
т
4- Р
mil
р)]-5
2
-р)
В отличие от биномиального (см. раздел 1.2.1), при отрицательном биномиаль-
биномиальном распределении множество возможных значений случайной величины не ограни-
ограничено сверху. Функция распределения отрицательного биномиального распределе™
ния может быть вычислена с помощью таблиц для биномиального распределе-
распределения [108].
Известны аппроксимации отрицательного биномиального распределения поло-
положительным биномиальным [109] и гамма-распределением [110]. Характеристиче-
Характеристической особенностью отрицательного биномиального распределения является то, что
его дисперсия больше среднего (у обычного биномиального — наоборот).
1.2] Дискретные распределения 91
Задача 40. Вероятность получения дефектного изделия равна 0,1. Вычислить веро-
вероятность того, что будут произведены 50 годных изделий до появления 10-го дефектного
изделия (т = 10; р = 0,1; х = 50). Вычислить вероятность того, что до появления 2-го
дефектного изделия будут произведены не менее 5 годных изделий.
Вычисляем /(ж; т,р) = С50+10-1 • ОД10 • 0,950 = Cl9 • ОД10 • 0,950 = 0,03238 ^такова
вероятность того, что потребуется произвести 50 изделий до появления 10-го дефектного
изделия.
Вероятность того, что до появления 2-го дефектного изделия будет произведено не
более 5 годных изделий, равна
F(x;m,p) = E^2+»-i • ОД2 • 0,9* =
г=1
= ОД2 • {Cl • 0,9 + Cl • 0,92 + ... + <?!• 0,94 + Cq • 0,95) = 0,13969.
1.2.4. Распределение Паскаля
Описание, применение. Если в схеме, рассмотренной выше (см. раздел 1.2.3)
для отрицательного биномиального распределения, в качестве случайной величины
принять число удачных испытаний до появления т-го успеха (включая и этот
успех), то она будет подчинена распределению Паскаля.
Свойства
Распределение вероятностей
/(ж; m,p) = C™-fpm(l - p)*~m, х = т, m + 1, ...
— это вероятность того,что в х испытаниях наблюдаемое событие произойдет рав-
равно т раз, если вероятность появления его в каждом испытании равна р.
Функция распределения
— это вероятность появления т успехов не более, чем за х испытаний.
Среднее М(ж) = —
Дисперсия U(x) =
Р
1
Коэффициент вариации v =
Задача 41. Если вероятность отказа изделия в одном испытании равна ОД, то какова
вероятность того, что понадобятся 50 испытаний до появления 5 отказов (р = ОД;
т = 5; х = 50)? Вычислить вероятность того, что не более, чем за 8 испытаний,
будут зафиксированы 2 отказа (ж = 50; т = 2; р = ОД).
Вероятность того, что понадобятся 50 испытаний до появления 5 отказов:
/(ж; 5; ОД) = С% • ОД5 • 0,945 = 211876 • 10~5 • 8,72796 • 10~3 = 0,01849.
Вероятность того, что не более, чем за 8 испытаний, будут зафиксированы 2 отказа,
равна
8 8
F(x; т,р) = J2 Ci-iP^1 ~ рУ^2 = J2 С^ ' °'9^ ' °^2 = 0,011224.
г=2 г=2
92 Распределения вероятностей случайных величин [Гл. 1
1.2.5. Геометрическое распределение (распределение Фарри)
Описание, применение. Если р— вероятность появления события в одном
испытании, то число испытаний до появления события подчинено геометрическому
распределению, с помощью которого можно определить объем выборки, необходи-
необходимой для получения одного отказа по заданной вероятности отказа одного прибора.
Свойства
Распределение вероятностей f(x;p) = рA — р)х^г, ж = 1, 2, ...; O^p^l
ж
Функция распределения F(x;p) = ^рA — р)г~г = 1 — A — р)х
Среднее
Дисперсия
Коэффициент вариации
Коэффициент асимметрии
Коэффициент эксцесса щ = ~ ¦
1 -р
Очевидно, что геометрическое распределение следует из распределения Паскаля
(см. раздел 1.2.4) при т = 1. При р —> 0 геометрическое распределение переходит
в экспоненциальное (см. раздел 1.1.4).
Задача 42. Вероятность безотказной работы изделия равна 0,95. Вычислить вероят-
вероятность того, что для получения одного отказа необходимо испытать выборку изделий
из 10 приборов (х = 10; р = 0,05). Вычислить вероятность тогоу что для получения
первого отказа понадобится испытать не более 5 приборов.
Вероятность того, что для получения одного отказа необходимо испытать 10 прибо-
приборов, равна f(x; 0,05) = 0,05 • 0,959 = 0,031.
Вероятность того, что для получения первого отказа понадобится испытать не более
5 приборов, равна F(x; 0,05) = 1 - A - 0,05)9 = 0,3697.
1.2.6. Гипергеометрическое распределение
Описание, применение. Если в партии из N изделий находится D дефектных,
то вероятноств появления х дефектных изделий в выборке объема п изделий
без возвращения будет подчинена гипергеометрическому распределению. Гипергео-
Гипергеометрическое распределение широко применяется в задачах выборочного контроля
качества продукции.
Свойства
Распределение вероятностей /(ж;7?, n,D) =
X i
Функция распределения F(x; JV, n, D) = Л, —
Среднее М(ж) = ^г^
тт r^f \ nD (л D^ (N ^п
Дисперсия Б(ж) = — I 1 - —
1.2] Дискретные распределения 93
Коэффициент вариации v =
nD N ~~
1
I / N — 1 \ 2 7V — 2п
Коэффициент асимметрии а3 = GV — 2D)[nD(N — D)]~2 I vr ) —г;—тг
Коэффициент эксцесса
f 7V(TV + 1) - 6N(N - n) 3n(TV-n)(TV + 6) \
~n) \ D(N~D) + Jp J
Таблицы гипергеометрического распределения приведены в [23-25]. Наиболее
полные таблицы опубликованы в [111, 112].
При расчетах полезны следующие рекуррентные формулы
l;N,D,n) = f(x;N,D,n)[ п ~
f(x;N,D,n) = f(x;N,n,D) = f(D - x;N,D,N - п) = f(n- x;N,N - D,n) =
= /(TV - n - D + x; TV, TV - D, TV - n);
F(x; TV, Д n) = F(x; TV, n, D) = 1 - F(n - x - 1; TV, TV - Д n) =
= 1 - F(D - я - 1; TV, Д TV - n) = F(TV - n - D + x; TV, TV - D, TV - n).
Поскольку таблицы гипергеометрического распределения громоздки, а при боль-
больших значениях параметров TV, n и D они отсутствуют, применяются различные
аппроксимации этого распределения.
п Г)
При ^-чоои D(z) > 9 [52]
F(x;N,n,D) =
где Ф(...) —функция стандартного нормального распределения.
При п < ОДЛГ и D < 0,17V [51] гипергеометрическое распределение аппрокси™
nD
мируется распределением Пуассона (см. раздел 1.2.2) с параметром Л = ——. При
п < 0,17V, TV —^ оо и фиксированном — гипергеометрическое распределение аппрок-
аппроксимируется биномиальным (см. раздел 1.2.1) с параметрами п ж р = —. Указанные
аппроксимации действуют в различных диапазонах изменения параметров и не
заменяют друг друга.
В [25] приведена аппроксимация с помощью бета-распределения (см. раздел 1.1.7),
удовлетворительная при всех 7V ^ 25 (независимо от D и 7V),
F{x;N,n,D) = Ii-X*(nr - ж + с,ж - с+ 1),
где /1_ж(а, Ь)—функция бета-распределения;
, _ N(n + D - 1) - 2nD _ _ nD(D - Щп - 1)
п =
N(N -2) ' (TV ¦
(TV - 2J nD(N - n)(N - D)
N - 1 [(TV - D)(N -n) + nD^ N][N{n + D - 1) - 2тШ]#
94
Распределения вероятностей случайных величин
[Гл. 1
2п — х
Укажем более точные приближения:
— биномиальным распределением с параметрами D, p = 9rJ'" П^ или (для
более точной аппроксимации)
р =
2п - х
BD-x)Bn-x)
— распределением Пуассона с параметром А = , =™ ^
2BN-D-n
при
D n
- нормальным распределением
2
Ф
Ф<
/N-1
- D
при 0,005 ^ р ^ 0,05 и 0,95 ^ р ^ 0,995;
"ж4 rj4
при 0,05 ^ р ^ 0,95.
Сравнительная точность различных аппроксимаций гипергеометрического рас™
пределения изучена в [113].
Задача 43. Дано: N = 20, ж = 3, D = 10 и п = 10. Вычислить значение F(x]N,n,D).
Точное значение:
FC; 20,10,10) = V Cl°C11n° = —-—A + 100 + 2025 + 14400) = 0,0894477.
Биномиальное приближение:
FC; 20,10,10) = J2 °
Ошибка велика, так как при р = 0,5 биномиальная аппроксимация наименее удачна.
Более точное биномиальное приближение:
FC;20,10,10) =
A^/
20-3
40-10 +
1-
20-3
40-10 + 1
= 0,10387.
Ошибка еще велика, несмотря на уточнение.
Еще более точное приближение:
Р =
2-10-3
2-20-10 +
/1 10
2 ¦ 10- ЗН 10- —
V 2 20
3- B-20- 10 + IJ
= 0,53798117;
FC; 20,10,10) = J2 Clo ' 0,53798117* • 0,46201882710^г = 0,1166096.
г=0
Точность недостаточна, так как диапазон аппроксимации не подходит для биномиального
распределения.
1.2] Дискретные распределения 95
Пуассоновское приближение:
10-10
Л = = 5 и
20
FC; 20,10,10) = Ve-- = 6,737947 • 10^3 -|1 + 5+^ + — ) = 0,265025.
Ы il V 2 6 /
Приближение очень грубо.
Так как — = — > 0,1, применим уточненную аппроксимацию:
10-10 1 /10- 10 Л / 1Л 10•10-10
Л + Л3J010+
FC; 20,10,10) = ]Г е^7 • ^ = е^7 Yl + 7 + у + — \ = 0,0817654 (S = 8,6%).
г=0 г- V /
Это уже достаточно близко к точному значению.
Нормальное приближение:
FC; 20,10,10) = Ф 2 = Ф(-1,307) =
= 1 - 0,852 • ехр [- ( -М07-1,5774\ 2
Р \ 2,0637 /
Более точное нормальное приблилсение:
FC;20,10,10) = Ф< -^= .
10 - 3 - -Д 10 - 3 - -J >= Ф(-1,3416) = 0,090 (S = 1,1%).
/ V / J J
Бета-прибл ижение:
, _ 20A0 + 10^1)^2-10-10 _ _ 10 • 10 • 9 • 9
Х ~ 20^15 " ' ; С " 19.A0.10 + 100-20) " ' ;
/ = 18^ 10 • 10 • B0 - 10) ¦ B0 - 10) = 2бз>
19 * [B0 - 10) • B0 - 10) = 10 • 10 - 20] • [20 ¦ A0 + 10 - 1) - 2 • 10 ¦ 10] ' '
FC; 20,10,10) = /о,5E,263 - 3 + 2,368; 3 - 2,368 + 1) = /0,5D,631; 1,632) = 0,0938
ГЛАВА 2
ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ
Общие положения. В первой главе, посвященной анализу различных распре™
делений вероятностей случайных величин, мы рассмотрели множество примеров
применения математической статистики к решению практических задач. Однако
в реальной жизни практически никогда не бывает так, чтобы исследователь распо-
располагал точным знанием закона распределения вероятностей наблюдаемых случай™
ных величин. Ему в общем случае неизвестны как сам закон распределения вероят-
вероятностей, так и его параметры. В распоряжении исследователя имеется лишь совокуп™
ность результатов наблюдений, и, основываясь только на них, он должен сделать
выводы о параметрах распределения, если вид закона распределения вероятностей
ему известен. Если же нет, то и сам закон распределения вероятностей ему придется
выбирать на основании выборочных результатов наблюдений. В настоящей главе
мы рассмотрим методы оценки параметров различных, заранее определенных по
форме, распределений вероятностей случайных величин.
Различают два вида оценок параметров — точечные и интервальные. Предпо-
Предположим, оценке подлежит параметр j некоторого распределения вероятностей по
выборочным данным #i,#2? • • • > хп некоторой случайной величины X. Точечной
оценкой параметра 7 по выборочным данным является некоторый функционал
jn = <??(#!, #2, • • •; %п)ч позволяющий получить наилучшую оценку в принятых кри-
критериях.
В качестве критериев, характеризующих пригодность оценки параметра распре-
распределения, используются такие ее свойства, как состоятельность, несмещенность,
эффективность и достаточность.
Оценка jn параметра j является:
— состоятельной, если при п -^ оо 7п ~^ 7?
— несмещенной, если М (jn) = 7 (т- е- математическое ожидание оценки совпа™
дает с ее истинным значением);
— достаточной, если оценка jn извлекает максимальную информацию из выборки;
— эффективной, если D (jn) = min (т.е. когда дисперсия оценки минимальна).
Под интервальной оценкой параметра 7 понимается интервал, границы кото-
которого 7п (°0 и 7п (а) являются функционалами от выборочных значений случайной
величины, и который с заданной вероятностью а содержит оцениваемый параметр:
Р{7^(«) < 7 < 1п(а)} = а- Вероятность а называется доверительной вероятно-
вероятностью, а оценки 7п(а) и 7п(а) — соответственно нижней и верхней доверительными
границами. Интервал [j^(a), j^(a)] называется доверительным интервалом. Если
длина доверительного интервала 1(а) = 7п(°0 ~~ 7п(°0 = const, то для состоятель-
состоятельных и несмещенных оценок а —>• 1 при п —>• оо. При фиксированном объеме выборки
п, а будет тем больше, чем больше I.
Различают два вида интервальных оценок: одно- и двусторонние. При двусто-
двусторонней оценке задаются обе границы доверительного интервала, так что
= а и Л7<7 а =«; г 7 > 1"[а = а'
Оценка параметров распределений вероятностей 97
1 — а
где а1' + а/; = 1 —а. Если а; = а" = —-—, то двусторонний доверительный интервал
называется симметричным. Для него справедливы соотношения
При односторонних доверительных интервалах границы интервалов задаются
так, чтобы
7п(«)} = « или
Величина A — а) —дополнение доверительной вероятности до единицы — назы-
называется уровнем значимости. Этим термином обозначается вероятность появления
события, которую исследователь связывает с неслучайным (значимым) событием.
Очевидно, что двусторонний интервал для симметричных распределений аналоги™
чен одностороннему при удвоенном уровне значимости.
Перед изложением конкретных методов оценки приведем ряд практических
соображений. Наиболее существенной характеристикой оценки параметра распре-
распределения является ее эффективность. Именно эта характеристика обычно исполь-
используется для сравнения методов оценки параметров распределения между собой. Как
правило, эффективность оценки сравнивается с эффективностью оценки параметра
распределения методом максимального правдоподобия (т. е. с наиболее эффектив™
ной оценкой). Легко видеть, что применение менее эффективных оценок (требу-
(требующих, как правило, меньшего объема вычислений) может быть скомпенсировано
соответствующим увеличением объема выборки.
И, наконец, поясним практический смысл процедуры оценки параметров распре-
распределения вероятностей. Так как само распределение наблюдаемых случайных вели™
чин является для исследователя той совокупностью данных, которой он располагает
относительно наблюдаемого процесса, то и параметры распределения позволяют
судить об основных чертах этого процесса. Например, когда мы спрашиваем, какова
долговечность прибора, мы, по сути, ставим задачу оценки среднего значения (или
математического ожидания) наблюдаемого распределения показателей долговеч-
долговечности. Если нас интересует, насколько стабилен наблюдаемый технологический
процесс, то ответ на этот вопрос требует оценки разброса (рассеяния) наблюдаемых
случайных величин, характеризующих качество технологического процесса.
4 А. И. Кобзарь
98 Оценка параметров распределений вероятностей [Гл. 2
2.1. Оценжа параметров нормального распределения
Напомним, что плотность вероятностей нормально распределенной случайной
величины описывается формулой
2az
где /j, и а — параметры распределения, совпадающие со средним значением и сред-
неквадратическим отклонением.
2.1.1. Оценка среднего значения (/х)
2.1.1.1. Точечные оценки
2.1.1.1.1. Оценка максимального правдоподобия
Вычисляется по формуле ж=—^а^. Оценка — состоятельная, несмещенная,
п *=i
эффективная, достаточная и распределена как случайная величина также нормаль™
но со средним М (ж) = /л и дисперсией D (х) = —. Оценка максимального правдо-
правдоподобия для случая выборок малого объема (п ^ 10) может быть модифицирована
в форме [116]
п _ п
X / J п ~ 5 гДе di / j \xj ~ хг) •
1 \—"^ ¦ 1
Эта форма позволяет несколько стабилизировать оценку в области центра груп™
пирования данных.
2.1.1.1.2. Оценка с помощью медианы
В качестве оценки /л может быть использована выборочная медиана
" 1 / \ п
если — —целое;
-целое,
где хщ — к-я порядковая статистика, равная k-му по величине значению выборочно™
го ряда х\ ^ Х2 ^ ... ^ жп, ранжированного по возрастанию (будьте внимательны
к тексту! — иногда квадратные скобки опускаются и х^ обозначает к~ю порядковую
статистику).
Эффективность этой оценки при п —Ь- оо равна 2/тг = 0,637, т. е. для того, чтобы
эта оценка не уступала оценке максимального правдоподобия (см. раздел 2.1.1.1.1),
необходим в тг/2 ~ 1,6 раза больший объем выборки.
2.1.1.1.3. Оценки с помощью порядковых статистик
Поясним сначала смысл понятия „порядковая статистика". Как только лю-
любому члену наблюдаемого выборочного ряда ставится в соответствие его номер
в упорядоченном по возрастанию ряду выборочных значений — этот член выборки
становится порядковой статистикой. Для полного координирования порядковой
статистики необходимо указать объем выборки и номер статистики. Впредь для
того, чтобы отличить просто член выборки х от порядковой статистики, будем при-
2.1] Оценка параметров нормального распределения 99
менять для ее обозначения символ Ж[^п] —т. е. г-я порядковая статистика в выборке
объема п.
Теперь рассмотрим оценки среднего значения с помощью порядковых статистик.
Предельным случаем такой оценки является оценка максимального правдоподо-
правдоподобия (см. раздел 2.1.1.1.1), когда в оценке участвуют все члены выборки. Вторым
предельным случаем является оценка с помощью медианы (см. раздел 2.1.1.1.2),
т. е. с помощью только одной порядковой статистики. Естественно, что в этот
диапазон эффективности возможных оценок (от 1 до 0,637) будут укладываться
все остальные возможные оценки, использующие порядковые статистики.
Эти оценки будут уступать по эффективности оценке максимального правдо™
подобия. Однако в большинстве случаев соответствующим увеличением объема
выборки, а также подбором порядковых статистик, используемых для оценки, и их
весового вклада в общую оценку можно обеспечить достаточно высокую эффек-
эффективность таких оценок. При этом сохраняются основные достоинства оценок по
порядковым статистикам — простота, легкость вычислений, возможность получения
оценок при отсутствии некоторых выборочных значений и, что особенно важно,
устойчивость таких оценок к отклонению от нормальности распределения, от засо-
засорения выборки аномальными наблюдениями.
Среди широко применяемых порядковых статистик напомним хщ, Ж[п] —экстре™
мальные значения; ш = хщ — хщ —выборочный размах; х — медиана; выборочные
квантили (ж[пд]_|_1—выборочная А-квантиль).
Предварительно рассмотрим способы вычисления математических ожиданий
порядковых статистик из стандартного нормального распределения.
.Ьсли р = , то р-квантиль стандартного нормального распределения бу-
п + 0,250
дет аппроксимировать математическое ожидание г-й порядковой статистики в вы™
борке объема п из JV@,1), т.е. М(хщ) = и г~о,з75 . Поэтому необходимые аппрок-
п+0,250
симации могут быть получены из соответствующих аппроксимаций для квантилей
стандартного нормального распределения.
Приведем некоторые полезные аппроксимации, полученные из аппроксимаций
нормальных квантилей.
Из аппроксимации 5 раздела 1.1.1 [32]
1
2
1 — ехр — ^^
имеем
= {-2,177586 + 3,14159 In (n + 0,25) - l,570796[ln (n + 0,625 - г) + In (г - 0,375)]}
при ^-^ ^ г ^ 0,Э75в + 0,68175.
Погрешность аппроксимации не более 0,114.
Из аппроксимации 15 раздела 1.1.1 [39] получаем
из чего следует
М{хщ) = 4,91(п + 0,25H'14 Г(г - 0,375H'14 + (п - г + 0,625H'14
100
Оценка параметров распределений вероятностей
[Гл. 2
Из аппроксимации 16 раздела 1.1.1 [36] имеем
0,4274
- 0,16 \ - 1,5774.
М(Х[г]) = 2,0637 ( In
- % + 0,625
Ошибка этой аппроксимации не более 0,0008 при г
И, наконец, из аппроксимации 19 раздела 1.1.1 [40]
ир = ^- \-Ь - \/Ь2 - Аас\ , где а = ^0,416; Ь = -0,717; с = - In Bр)
ACL L J
получаем
М(х[{]) = -0,86178 + 1,2019 2 + 1,664In
п - г + 0,625
Отметим, что во всех случаях при г <
п + 0,250
абсолютное значение
сохра-
няется (изменяется только знак).
Всегда
М{хщ) = 0 при г =
л) > 0 при
(п — нечетное) и г = — (п — четное);
А
П + 1 / Пч щ ж/ ч _ . П -
г > —-— (или -); М(хщ) < 0 при г < —;
(или ^)-
2 v 2J -
Рассмотрим теперь разные оценки среднего нормального распределения с помо-
помощью порядковых статистик.
2.1.1.1.3.1. Простые оценки Диксона [117]
Диксон предложил две простые оценки:
— среднее из двух наилучших наблюдений
1
+ хи]);
— среднее из всех наблюдений, кроме двух крайних
В табл. 6 приведены рекомендуемые номера оптимальных статистик (г и j) для
га= 1AJ0.
Таблица 6
Оптимальные порядковые статистики Диксона [117]
п
г
Э
п
г
3
2
1
2
12
4
9
3
1
3
13
4
10
4
2
3
14
4
11
5
2
4
15
4
12
6
2
5
16
5
12
7
2
6
17
5
13
8
3
6
18
5
14
9
3
7
19
6
14
10
3
8
20
6
15
11
3
9
оо
0,27п
0,73п
Относительная эффективность первой оценки стремится к 0,81 при п —>¦ оо,
вторая практически не уступает оценке максимального правдоподобия (> 0,99).
2.1]
Оценка параметров нормального распределения
101
2.1.1.1.3.2. Оценка Огавы [118, 119]
Вычисляется по формуле
хо = ]Гж[пЛ.+1],
г=1
где т — число наблюдений (га < п), по которым проводится оценка /i; [n\i + 1] —
целое число, ближайшее справа к (п\ + 1) (определяет номера порядковых стати-
статистик, используемых для оценки); А^, Л^ —числовые коэффициенты, табулированные
в [119] (приведены в табл. 7).
Таблица 7
Значения коэффициентов оценки Огавы
для различного числа оптимально расположенных порядковых статистик
(Лг—верхняя строка; ki—нижняя строка)
т
2
3
4
5
6
7
8
9
10
1
0,270
0,500
0,163
0,297
0,107
0,197
0,074
0,133
0,055
0,099
0,040
0,071
0,031
0,049
0,024
0,044
0,020
0,036
2
0,730
0,500
0,500
0,407
0,351
0,308
0,255
0,233
0,195
0,181
0,147
0,140
0,115
0,111
0,092
0,091
0,076
0,075
3
0,837
0,297
0,649
0,308
0,500
0,269
0,395
0,220
0,308
0,186
0,247
0,155
0,202
0,130
0,167
0,109
4
0,893
0,197
0,745
0,233
0,605
0,220
0,500
0,203
0,412
0,178
0,343
0,155
0,288
0,133
5
0,926
0,133
0,805
0,181
0,692
0,186
0,588
0,178
0,500
0,163
0,427
0,147
6
0,945
0,099
0,853
0,140
0,753
0,155
0,657
0,155
0,573
0,147
7
0,960
0,071
0,885
0,111
0,798
0,130
0,712
0,133
8
0,969
0,049
0,908
0,091
0,833
0,109
9
0,976
0,044
0,924
0,175
10
0,980
0,136
Оценка Огавы используется для нахождения /л по выборке большого объема
с помощью нескольких (га < п), оптимальным образом отобранных порядковых
статистик. При п ^ 5 эффективность оценки не уступает оценке х.
2.1.1.1.3.3. Оценка Пирсона-Тьюки
В [120] предложены упрощенные оценки, основанные на расстоянии между
процентными точками частотных кривых распределений. Отметим, что р™точка
кривой равна порядковой статистике хуп\/\, где Л^ = р.
Для /I Пирсоном и Тьюки [120], в частности, предложена оценка
А = ff[0,5n] + 0Д85Д, где А = x[0j95n] + ж[о,о5п] - 2ж[0}5п]-
2.1.1.1.3.4. Быстрые оценки Кенум [121]
Среднеквартильный размах
102
Оценка параметров распределений вероятностей
[Гл. 2
Эффективность оценки « 1,21/п, предельная эффективность равна 0,64. Метод
достаточно груб и может рекомендоваться как быстрый приближенный способ.
Быстрая оценка по трем квантилям
X = О,2ЖГЛ] + OfiXfn] + 0,2жП5п1 •
L i6 j L 2 J [T^J
Эффективность оценки « 83%, метод достаточно устойчив к отклонениям от нор™
мальности.
Быстрая оценка по пяти квантилям
X = -\X\ni +X\ni + 2х\пл + Хгзп] + ЖГ15п"
6 L L16 J L 4 J L 2 J [Т\ [Т^
Эффективность оценки « 0,93, метод нечувствителен к отклонениям от нормаль-
нормальности.
2.1.1.1.3.5. Оптимальные комплексные оценки,
использующие общий набор порядковых статистик
По набору порядковых статистик может быть проведена оценка и стандартного
отклонения (а). Однако для этого требуется иной, отличный от используемого
при оценке /л, набор порядковых статистик. Представляется полезным рассмотреть
вопрос об использовании общего набора порядковых статистик для совместной
оценки /л и а. При этом должен быть удовлетворен некий комплексный критерий
оптимальности такого набора. Такие оценки рассмотрены в [122, 123].
Укажем оценку по двум порядковым статистикам (напомним, одинаковым
при оценке и /л и сг), которая минимизирует линейную комбинацию дисперсий
D(/i) + cD(a) (см. табл. 8). Оценка имеет вид
\Л = гС(Ж[ап] + Х[рп]).
Аналогичная оценка по четырем порядковым статистикам имеет вид
Она минимизирует сумму дисперсий D(/jl) + D{a). Необходимые константы оценок
приведены в табл. 9.
Таблица 8
Оценка /л по двум статистикам [122]
с
1
2
3
к
0,5
0,5
0,5
а
0,1525
0,1274
0,1174
Ь
0,8475
0,8726
0,8853
Эффективность
0,729
0,683
0,594
Таблица 9
Вариант
оценки
1
2
0
0
Оценка
кг
,1414
,1097
0
0
/х по четырем
к2
,3586
,4029
а
0,0688
0,0389
совместным квантилям
0
0
а'
,2912
,2160
0
0
Р
9332
9611
Cf
0,7088
0,7840
[122]
Эффективность
0,9080
0,8570
2.1] Оценка параметров нормального распределения 103
2.1.1.1.3.6. Устойчивая (робастнам) оценка Ходжеса-Лемана по средним Уолша
гл с- г п(п + !) Xi + хз
Определим в выборке х\, ...,хп набор из — средних вида Zij = -
(г ^ j), называемых средними Уолша [124].
Оценка Ходжеса^Лемана [124] определяется как медиана средних Уолша, т. е.
медиана ряда Z\ ^ Z2 ^ ... ^ zn(n+i) • Следует отметить высокую устойчивость этой
2
оценки к отклонениям от нормальности распределения и засоренности выборки
аномальными наблюдениями.
2.1.1.1.4. Упрощенная оценка по шаблону [125]
Произвольно, но симметрично относительно предполагаемого среднего значе-
значения, выберем два числа а и Ь, определяющих размер шаблона (а < Ь). Подсчитаем
количество значений т, для которых х ^ а, и количество значений I, для которых
ж О-
Для величин pi = — и »2 ~ " находим по табл. 10 значение коэффициента
п п
k(pi1p2)- Искомая оценка определяется по формуле
х = а — (Ь — a)k(pi,p2).
Задача 44. В результате испытаний 30 приборов получены следующие значения ре-
ресурсной наработки:
Xi = 721, 741, 752, 761, 763, 780, 794, 840, 890, 911, 944, 960, 961, 967, 1010, 1011,
1012, 040, 1090, 1096, 1111, 1120, 1240, 1340, 1341, 1390, 1411, 1420, 1445, 1512.
Вычислить различными методами среднее значение ресурсной наработки.
Оценка максимального правдоподобия
г п г зо
x=-"pxi = ^y"xi = 1045,8.
п 4-Г 30 Аг
г=1 г=1
Оценка с помощью медианы
»=15;П±2=16 и .= «[1
2 ' 2
Простые оценки Диксона B.1.1.1.3.1)
Имеем 0,27п = 8,1 и 0,73?г = 21,9. Следовательно, оценку будем проводить по 9-й
и 22-й порядковым статистикам, т. е.
_ ж[9]+ж[22] 890 + 1120 _ 1 ^ типтк
^1 = 1005 и х = > ж^ = 1040,75.
те 2 ^
х 1005 и х
2 2 те - 2 ^
Оценки Огавы B.1.1.1.3.2)
— по двум статистикам:
[nAi + 1] = [30 • 0,27 + 1] = Ю; [п\2 + 1] = [30 • 0,73 + 1] = 23;
хо = 0,5(ж[ю] + Ж[2з]) = = 1075,5;
— по трем статистикам:
[п • Ai + 1] = [30 • 0,163 + 1] = 9; [п • А2 + 1] = [30 • 0,50 + 1] = 16;
[п • Аз + 1] = [30 • 0,837 + 1] = 27;
хо = 0,297 • (х[9] + х[27]) + 0,407 • х[Щ = 0,297 • (890 + 1411) + 0,407 • 1011 = 1094,874;
104 Оценка параметров распределений вероятностей [Гл. 2
— по десяти статистикам:
[п • Ai + 1] = [30 • 0,020 + 1] = 2; [п • Л6 + 1] = [30 • 0,573 + 1] = 19;
[п • А2 + 1] = [30 • 0,076 + 1] = 4; [гс • Л7 + 1] = [30 • 0,712 + 1] = 23;
[п • Аз + 1] = [30 • 0,167 + 1] = 7; [п • А8 + 1] = [30 • 0,833 = 1] = 26;
[п • А4 + 1] = [30 • 0,288 + 1] = 10; [п • А9 + 1] = [30 • 0,924 + 1] = 29;
[п • А5 + 1] = [30 • 0,427 + 1] = 14; [п • Х10 + 1] = [30 • 0,98 + 1] = 30.
Воспользовавшись коэффициентами из табл. 7, вычисляем
хо = 0,03б(ж2 + ж30) + 0,075(ж4 + ж29) + 0,109(ж7 + ж26) + 0,133(жю + ж23) +
+ 0,147(ж14 + х19) = 0,036 • G41 + 1512) + 0,075 • G61 + 1445) + 0,109 • G94 + 1390) +
+ 0,133 • (911 + 1240) + 0,147 • (967 + 1090) = 1073,076.
Оценка Пирсона-Тьюки B.1.1.1.3.3)
Имеем [0,5гс] = [0,5 • 30] = 15.
Далее А = ж[28] + х{2] - 2 • х[15] = 1420 + 741 - 2 • 1010 = 141.
Окончательно имеем jl = х[15] + 0,185 • 141 = 1010 + 0,185 • 141 = 1036,085.
Быстрые оценки Кенуя B.1.1.1.3.4)
— оценка по двум квантилям:
[0,25 • п] = [0,25 • 30] = 8; [0,75 • п] = [0,75 • 30] = 23;
z х8 + ж23 840 + 1240
2
- оценка по трем квантилям:
= 1040;
жгл.1 — жгзсп — ж2; ж го 5-ni — Ж155 Жг15-п] — ж29;
L16J [Те] L"™T6™~J
I = 0,2 • 741 + 0,6 • 1010 + 0,2 • 1445 = 1043,2;
— оценка по пяти квантилям:
5 = - • (х2 + х8 + 2 • х15 + ж23 + ж29) = ^ • G41 + 840 + 2 • 1010 + 1240 + 1445) = 1047,67.
6 6
Оптимальные комплексные оценки B.1.1.1.3.5)
— оценка по двум статистикам (с = 1):
[0,1525 • п] = [0,1525 • 30] = 5; [0,8475 • п] = [0,8475 • 30] = 26;
Д = 0,5 • (х5 + ж26) = 0,5 • G63 + 1390) = 1076,5;
— оценка по четырем статистикам (с = 1):
(вариант 1)
[0,0668 • п] = [0,0668 • 30] = 2; [0,9332 • п] = [0,9332 • 30] = 28;
[0,2912 • п] = [0,2912 • 30] = 9; [0,7088 • п] = [0,7088 • 30] = 22;
/х = 0,1414 • (х2 + ж28) + 0,3586 • (х9 + ж22) =
= 0,1414 • G4 + 1420) + 0,3586 • (890 + 1120) = 1026,35;
(вариант 2)
[0,0389 • п] = [0,0389 • 30] = 2; [0,9611 • п] = [0,9611 • 30] = 29;
[0,2160 • п] = [0,2160 • 30] = 7; [0,784 • п] = [0,784 • 30] = 24;
А = 0,0971 • [х2 + ж29) + 0,4029 • (х7 + ж24) =
= 0,0971 • G41 + 1445) + 0,4929 • G94 + 1340) = 1072,049.
2.1]
Оценка параметров нормального распределения
105
Оценка Ходжеса-Лемана B.1.1.1.3.5)
Продемонстрируем вычисление оценки на примере пяти выборочных значений (пол-
п(п + 1) 30 ¦ 29
ная оценка должна быть получена по
= 435 средним Уолша). Выберем
2 2
для примера пять выборочных значений (вблизи среднего): х%: 1012, 1040, 1090, 1096,
(ft _|_ ~\\ К . А
= = 10 средних Уолша:
1111. Вычислим
Zi = 1026; 1051; 1054; 1061,5; 1065; 1068; 1075,5; 1093; 1100,5; 1103,5.
Далее вычисляем медиану значений z%
z5+z6 1065 + 1068
р, =
= 1066,5.
к tf 2 2
Упрощенная оценка по шаблону
Выбираем границы шаблона а = 785 и Ь = 1115. Имеем т = 6 и I = 21, откуда
pi = — = 0,2 и р2 = — = 0,7.
F 30 F 30
Из табл. 10 находим fc@,2;0,7) = -0,62.
Следовательно, х = 785 - A115 - 785) • (-0,62) = 989,6.
Для уточнения оценки попытаемся применить более узкий шаблон а = 960,5;
Ъ = 1060.
Тогда т = 12 (Рг = 0,4); I = 18 (Р2 = 0,6) и fc@,4; 0,6) = -0,50.
Окончательно имеем х = 960,5 - A060 - 960,5) • (-0,50) = 1010,25.
Таблица 10
Значения коэффициентов
Р1
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,10
4,33
1,91
1,10
0,68
0,44
0,24
0,11
0,00
-0,09
-0,16
-0,23
-0,28
-0,34
-0,40
-0,45
-0,50
0,15
-5,33
—
4,20
1,81
1,00
0,60
0,32
0,14
0,00
-0,11
-0,19
-0,27
-0,33
-0,39
-0,45
-0,50
-0,55
0,20
-2,91
-5,20
—
3,94
1,62
0,87
0,42
0,18
0,00
-0,13
-0,23
-0,32
-0,38
-0,44
-0,50
-0,55
-0,60
0,25
-2,10
-2,81
-4,94
—
3,46
1,39
0,60
0,24
0,00
-0,16
-0,27
-0,37
-0,44
-0,50
-0,56
-0,61
-0,66
0,30
-1,68
-2,00
-2,62
-4,47
—
3,00
0,93
0,33
0,00
-0,20
-0,32
-0,43
-0,50
-0,56
-0,62
-0,67
-0,71
0,35
-1,44
-1,60
-1,87
-2,39
-4,00
—
1,79
0,50
0,00
-0,25
-0,39
-0,50
-0,57
-0,63
-0,68
-0,73
-0,77
0,40
-1,24
-1,32
-1,42
-1,60
-1,92
-2,79
—
1,08
0,00
-0,34
-0,50
-0,61
-0,68
-0,73
-0,77
-0,81
-0,84
0,45
-1,11
-1,14
-1,18
-1,24
-1,33
-1,00
-2,08
—
0,00
-0,50
-0,66
-0,75
-0,80
-0,84
-0,87
-0,89
-0,91
0,50
-1,00
-1,00
-1,00
-1,00
-1,00
-1,00
-1,00
-1,00
—
-1,00
-1,00
-1,00
-1,00
-1,00
-1,00
-1,00
-1,00
Примечание. Для определения значений коэффициентов за пределами табличных
значений р\ и pi следует пользоваться соотношением fc(pi,p2) + k(p2jPi) = — 1.
2.1.1.2. Интервальные оценки
2.1.1.2.1. Оценка /х при известной дисперсии <т2
Интервальная оценка с доверительной вероятностью а:
= х-
= х
106
Оценка параметров распределений вероятностей
[Гл. 2
где и7 — 7"квантиль стандартного нормального распределения;
сторонней оценки, j = а для односторонней оценки.
2.1.1.2.2. Оценка /л при неизвестной дисперсии
для дву-
где try — 7™квантиль распределения Стьюдента с / = п — 1 степенями свободы;
¦л П -л П -I,
2 1 v^/ -\2 - 1^ 1 + О
s = 2^(ж^ — х) ; ж = — 2^ я^; 7 = —«— Для двусторонней оценки, j = а для
i=l г=1
односторонней оценки.
Для квантилей стандартного нормального распределения и распределения Стью-
Стьюдента рекомендуется использовать аппроксимации, приведенные в разделе 1.1.9:
/ - ч 0,4274
и7 = 4,91[70'14 - A - 7)°'14]; % = 2,0637f In - - 0,16 j - 1,5774;
_ 0,717 - [0,7172 - 40,8116 In 2A -7)]^ _
Uj ~ -20,416 ~
= -0,8617788 + l,20192[0,846758 - 1,664 In 2A - 7)] 2 ;
1
4/
2,5
r; ^0,975 = 2
0,9975/ - 0,445
7
-1
2.1.1.2.3. Оценка по выборочному размаху
/4 (а) = х- G7u; цъп (а) = х + C7w,
где ш = жтах — xmin — выборочный размах; G7 — 7~квантиль распределения разма-
размаха; 7 = Для двусторонней И7 = а для односторонней оценки. Значения G1
табулированы, например, в [24, 119]. Оценку рекомендуется применять при п ^ 20
(при дальнейшем росте объема выборки эффективность оценки резко падает).
Некоторые критические значения G1 приведены в табл. 11.
Критические значения Gy [119]
Таблица 11
п
2
3
4
5
6
7
8
9
10
11
7
0,95
3,157
0,885
0,529
0,388
0,312
0,263
0,230
0,205
0,186
0,170
0,975
6,353
1,304
0,717
0,507
0,399
0,333
0,288
0,255
0,230
0,210
0,99
15,910
2,111
1,023
0,685
0,523
0,429
0,366
0,322
0,288
0,263
0,995
31,000
8,800
1,316
0,843
0,628
0,507
0,429
0,374
0,333
0,302
п
12
13
14
15
16
17
18
19
20
7
0,95
0,158
0,147
0,138
0,131
0,124
0,118
0,113
0,108
0,104
0,975
0,194
0,181
0,170
0,160
0,151
0,144
0,137
0,131
0,126
0,99
0,241
0,224
0,209
0,197
0,186
0,177
0,168
0,161
0,154
0,995
0,277
0,256
0,239
0,224
0,212
0,201
0,191
0,182
0,175
2.1]
Оценка параметров нормального распределения
107
2.1.1.2.4. Оценка по интерквартильной широте
Дэвид и Джонсон [119] предложили интервальную оценку /х, основанную на
выборочной медиане х (см раздел 2.1.1.1.2) и интерквартильной широте I, равной
разности между верхним и нижним выборочными квартилями, которые для выбо™
рок объема п = 3 + 41с определяются порядковыми статистиками с номерами
И Хп+1
—Х
Оценка имеет вид
где I — интерквартильная широта; 1г7—7™квантиль распределения I; 7= для
двусторонней оценки, 7 = а Для односторонней оценки. Значения Щ приведены
в табл. 12.
Таблица 12
Значения
[119]
п
11
15
19
23
27
31
7
0,95
0,470
0,400
0,354
0,321
0,296
0,276
0,975
0,623
0,514
0,448
0,402
0,367
0,341
0,99
0,876
0,676
0,573
0,506
0,458
0,422
п
35
39
43
47
51
7
0,95
0,260
0,246
0,234
0,224
0,215
0,975
0,319
0,301
0,286
0,273
0,261
0,99
0,393
0,369
0,349
0,332
0,317
2.1.1.2.5. Оценка по среднему абсолютному отклонению
Если С = - У
г=1
—среднее абсолютное отклонение, то интервальная оцен™
ка для среднего может быть определена, как
где К^ — 7~квантиль распределения С (табулирована в [9, 127, 128]). Значения
для 7 = 0,975 приведены в табл. 13.
Таблица 13
Значения
п
2
3
4
5
6
7
8
^0,975
12,71
3,45
2,16
1,66
1,40
1,21
1,09
п
9
10
11
12
13
14
^0,975
1,00
0,93
0,87
0,82
0,78
0,75
п
20
25
30
40
60
120
^0,975
0,71
0,60
0,48
0,41
0,33
0,23
108
Оценка параметров распределений вероятностей
[Гл. 2
2.1.1.2.6. Оценка 50%-го доверительного интервала по вероятному отклонению
1
_ 1
г=1
= х- 0,84535
-lAf1 *
<@,5) = ж+ 0,84535
Используется при п ^ 7 [129].
2.1.1.2.7. Интервальная оценка длм медианы
При п > 50 доверительный интервал для медианы ж определяется порядковыми
статистиками
где
Хк ^ X
fe = -(n - 1,64л/п - 1) при а = 0,9;
к = hn - l,96>/n - 1) при а = 0,95;
fc = i(n - 2,58л/п - 1) при a = 0,99.
Для значений п ^ 50 номера порядковых статистик, заключающих в себе
медиану, при а = 0,95 и а = 0,99 (двусторонние интервалы) приведены в табл. 14,
заимствованной из [9].
Таблица 14
Доверительный интервал для медианы
(номера порядковых статистик) [9]
п
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
а
0,95
0
1
1
1
2
2
2
3
3
3
4
4
5
5
5
6
5
5
6
7
7
8
9
9
10
11
11
12
12
13
14
14
0
0
0
0
1
1
1
1
2
2
2
3
3
3
4
4
4
,99
5
6
7
7
8
9
10
10
11
12
12
12
14
14
14
16
п
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
0
6
6
7
7
8
8
8
9
9
10
10
10
11
11
12
а
,95
15
16
16
17
17
18
19
19
20
20
21
22
22
23
23
0
5
5
5
6
6
7
7
7
8
8
8
9
9
10
10
,99
16
17
18
18
19
19
20
21
21
22
23
23
24
24
25
п
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0
12
13
13
13
14
14
15
15
16
16
16
17
17
18
18
а
,95
24
24
25
26
26
27
27
28
28
29
30
30
31
31
32
0,99
1
11
11
12
12
12
13
13
14
14
14
15
15
16
16
26
26
27
27
28
29
29
30
30
31
32
32
33
33
34
При симметричном непрерывном распределении, каковым является нормальное,
справедливы предложенные в [119] формулы односторонних доверительных интер™
валов для медианы:
2.1] Оценка параметров нормального распределения 109
fe-i
2
— при доверительной вероятности а = 1 :
2 71
1/ \ ~ 1/
х < -{хп + xn+i^fe); х > -{x
— при доверительной вероятности а = 1 — —:
ATI
~ ^ \ Жп+Жп + i^fc] ,. .Г
ж < max\хп-г, ; х > mm ж2,
— при доверительной вероятности а = 1 (к > 1):
^ [жп1+Жп2 Жп+Жп + ifc] ^ .
< max ; ; х > mm
1 +
— при доверительной вероятности а = 1
2 ' 2
j
1
:-3)
~ ^ [ Жп+Жп + i^fc] ^^ .Г
х < max жп_4; ^ ; х > mm ж5;
— при доверительной вероятности
, (fc-!)(&-2)
\ 6 + 120
а = 1
2п
х < max жп^5 5
ж > mm
— при доверительной вероятности а = 1
2n
x < max I ' """•* ^ ""Т1"л I ; x > min I ' '*
i+ 2
— при доверительной вероятности а = 1 —
2
fe(fe-l)
х < max I Жз; ; х > mm
2п
хп
5
3n
Оценки эффективны при к ^ — в случае нормального распределения (при
п < 20).
Задача 45. В результате наблюдений был получен следующий ряд данных:
хц 2,4; 3,2; 4,1; 4,2; 4,8; 5,1; 6,2; 7,0; 9,0; 9,6 (га = 10).
Найти двустороннюю интервальную оценку среднего при доверительной вероятности
а = 0,95.
Оценка при неизвестной дисперсии
1
1 п \ 1 п „]2 1+«
Находим х = — У^ Х{ = 5,56 и s = УЧжг ~~ жJ = 2,3796. Далее j = =
°79Б = 0,975; / = га-1 = 10-1 = 9; to,975 « 2i/^ = 2,267.
110 Оценка параметров распределений вероятностей [Гл. 2
Окончательно имеем
2 3796
/4(а) = /iiO@,95) = 5,56 - 2,267 • ' = 3,854;
v 10
2 3796
fj,l(a) = /xiO@,95) = 5,56 + 2,267 • -?-=- = 7,266.
vlO
Таким образом, с вероятностью 0,95 значение параметра (среднего значения) нахо-
находится в интервале 3,854 ^ \х ^ 7,266.
Если бы интервалы были односторонними G = а = 0,95), то следовало бы использо-
использовать to,95 ВМеСТО to,975 И, ИМСЯ В ВИДУ, ЧТО Но,95 = 1,645,
^95 = ^0,95 ( 1 - "^ 1 = !'834'
Тогда получаем
/?@,95) = 5,56 - 1'834^!796 = 3,938; д* @,95) = 5,56 + "'"*"рГ" = 6,94.
vlO л/Ю
С вероятностью 0,95 имеем односторонние интервалы /л ^ 6,94 или \х ^ 3,938.
Оценка по выборочному размаху B.1.1.2.3)
Вычисляем размах выборки ш = жтах — Жтт = 9,6 — 2,4 = 7,2.
Для 7 = ^-^ = 0,975 и п = 10 находим из табл. 11 G0,975A0) = 0,23. Тогда
V* (а) = х - G1 • ш = 5,56 - 0,23 • 7,2 = 3,904;
(j,l (а) = х + G1 • ш = 5,56 + 0,23 • 7,2 = 7,216.
Следовательно, с вероятностью 0,95 имеем 3,904 ^ \х ^ 7,216.
Оценка по интерквартилъной широте B.1.1.2.4)
Для удобства демонстрации добавим еще один член выборки жц=10,0.
3-(п + 1) 3-12 п + 1 11 + 1
Имеем —v ; = = 9; —— = —— = 3; I = х9 - х3 = 9 - 4,1 = 4,9;
4 4 4 4
Медиана равна xn+i = xq = 5,1. Для 7 :=: 0,975 (а = 0,95) из табл. 12 находим
#0,975A1) =0,623.
Окончательно получаем
jtC (а) = 5,1 ~~ 0,623 • 4,9 = 2,047; /г* (а) = 5,1 + 0,623 • 4,9 = 8,153;
2,047 ^ [л ^ 8,153.
Оценка по среднему абсолютному отклонению B.1.1.2.5)
Находим
г ю
C=I5-E|xi-x| =
= — • C,16 + 2,36 + 1,46 + 1,36 + 0,76 + 0,46 + 0,64 + 1,44 + 3,44 + 4,04) = 1,912.
Из табл. 13 для п = 10 имеем JiTo,975A0) = 0,93 и далее
fin(a) = 5,56 - 0,93 • 1,912 = 3,782; /?(а) = 5,56 + 0,93 • 1,912 = 7,338.
Следовательно, доверительный интервал равен 3,782 ^ /i ^ 7,338.
Оценка 50%™го доверительного интервала B.1.1.2.6)
тг
Имеем ^2 \хг — х\ = 19,12 и
г=1
*( \ кка 0?84535 • 19,12 Ъ( , к ^ , 0,84535 • 19,12
fjbn{a) = 5,56 ^ = 5,021; /in(a) — 5,56 -\ -= = 6,0987.
10 • у 9 10 • v 9
2.1] Оценка параметров нормального распределения 111
Интервальная оценка для медианы B.1.1.2.7)
Из табл. 14 для п = 10 (а = 0,95) находим, что медиана лежит между 2-й и 8-й
порядковыми статистиками, т. е. между Х2 = 3,2 и xs = 7,0. Следовательно, 3,2 ^ х ^ 7,0.
Для приближенного подсчета имеем
п-1,96-л/п-1 10-1,96-V10-1
А; = = = 1,4.
2 2
Следовательно, [fc] = 2; [гг — к + 1] = 10, т.е. необходимо использовать статистики хч
и жю, что приводит к результату 3,2 ^ х ^ 9,6.
Приведем примеры вычисления односторонних приближенных оценок для медианы:
к = 1 (а=1- — = 0,95)
х < хю = 9,6; х > хг = 2,4;
fc = 2 (а=1- — = 0,9)
1 2n ' ;
[ж9+ж8 ж9+жю] [9 + 7 9,6 + 9]
ж < max ; = max —; —-— = 9,3;
~ . [ж2+жз хг+х2} . [3,2 + 4,1 3,2 + 2,4]
ж > mm ; = mm ; = 2,,
2.1.2. Оценка дисперсии о*2 и стандартного отклонения а
2.1.2.1. Точечные оценки
2.1.2.1.1. Оценка максимального правдоподобия
I n 1
Подсчитывается по формуле s2 = —
Для расчетов удобна формула s2 = — J^ х2 — ж2, из которой следует, что оценка
ъ=1
максимального правдоподобия а2 является разностью между среднеарифметиче™
ским квадратом результатов наблюдений и квадратом среднего арифметического.
Оценка — состоятельная, достаточная, эффективная, но при малых п не являю-
являющаяся несмещенной. При п < 30 рекомендуется использовать несмещенную оценку
s2 =
n_l ^ v-* ~> tv
%=1 \ъ=1
Если вместо оценки х используется параметр /л (когда он известен заранее), то
во всех случаях используется оценка с п в знаменателе.
2.1.2.1.2. Оценка <т по выборочной дисперсии s
2
Оценка s = vs^, где s2 — оценка максимального правдоподобия для дисперсии
(см. раздел 2.1.2.1.1), является смещенной. Несмещенной оценкой для а являет™
ся [25]
V
s = ^? гДе ^=\ —о /^—V^' ^( • • •)—гамма-функция.
2
При п > 30 Л « 1 — -. Значения Л при n ^ 45 приведены в табл. 15.
112
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 15
Значения Л [25]
п
1
2
3
4
5
Л
0,7979
0,8862
0,9213
0,9400
0,9515
п
6
7
8
9
10
Л
0,9594
0,9650
0,9693
0,9727
0,9753
п
11
12
13
14
15
Л
0,9776
0,9794
0,9810
0,9823
0,9835
п
16
17
18
19
20
Л
0,9845
0,9540
0,9862
0,9869
0,9876
п
25
30
35
40
45
Л
0,9900
0,9917
0,9929
0,9938
0,9945
2.1.2.1.3. Оценка <т по среднему абсолютному отклонению
Вычисляется по формуле
= -?
Xi - Х\
При п ¦
ОО С :
тг V 2га - 1
где
з 0,79788 •
20.
c-\l
7Г
X
. В силу невысокой эффектив™
ности оценка используется при п
2.1.2.1.4. Оценка о* по выборочному размаху
Подсчитывается по формуле sp = —, где ш = жтах — хш-1П — размах выборки; d —
коэффициент, зависящий от п (его значения табулированы в [25]), фрагмент этой
таблицы содержится в табл. 16.
Таблица 16
Значения 1/cf
п
2
3
4
5
6
1/d
0,8862
0,5908
0,4857
0,4299
0,3946
п
7
8
9
10
11
1/d
0,3698
0,3562
0,3367
0,3249
0,3152
п
12
13
14
15
16
1/d
0,3069
0,2998
0,2935
0,2880
0,2831
п
17
18
19
20
1/d
0,2787
0,2747
0,2711
0,2677
При п < 20 эффективность оценки sp практически не отличается от эффектив™
ности оценки s (см. раздел 2.1.2.1.2), поэтому эта оценка предпочтительнее при
малых выборках.
С помощью размаха можно быстро оценить верхнюю границу стандартного отк-
отклонения: а ^ — [130]. При п ^ 200 в качестве грубой оценки а можно использовать
оценку 5 = -.
2.1.2.1.5. Упрощенная оценка а по шаблону
По аналогии с оценкой ц для быстрой, но грубой оценки а можно исполь-
использовать метод шаблонов [125]. При этом оценка имеет вид лш = (б?2 — ^i)/(pi,P2M
где U2 > d\—размеры шаблона; pi, P2—доля ж, меньших d\ и d^ соответственно;
Pz) —коэффициент, зависящий от р\ и р2 (табулирован в табл. 17).
2.1]
Оценка параметров нормального распределения
113
Таблица 17
Значения коэффициента
рг
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
рг
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,10
—
-4,16
-2,27
-1,64
-1,32
-1,12
-0,97
-0,87
-0,78
-0,71
-0,65
-0,60
-0,56
-0,51
-0,47
-0,43
-0,39
0,15
4,17
—
-5,00
-2,70
-1,92
-1,54
-1,26
-1,10
-0,96
-0,85
-0,78
-0,70
-0,64
-0,58
-0,53
-0,48
-0,43
0,20
2,27
5,00
—
-5,88
-3,12
-2,22
-1,69
-1,41
-1,19
-1,03
-0,92
-0,81
-0,74
-0,66
-0,60
-0,53
-0,47
0,25
1,64
2,70
5,08
—
-5,67
-3,57
-2,38
-1,85
-1,49
-1,25
-1,09
-0,94
-0,84
-0,75
-0,66
-0,58
-0,51
0,30
1,32
1,92
3,12
6,67
—
-7,69
-3,70
-2,56
-1,92
-1,54
-1,30
-1,10
-0,96
-0,84
-0,75
-0,64
-0,56
0,35
1,12
1,54
2,22
3,57
7,70
—
-7,14
-3,85
-2,56
-1,92
-1,56
-1,28
-1,10
-0,94
-0,81
-0,70
-0,60
0,40
0,97
1,27
1,68
2,38
3,70
7,14
—
-8,33
-4,00
-2,63
-2,00
-1,56
-1,30
-1,09
-0,92
-0,73
-0,65
0,45
0,87
1,10
1,41
1,85
2,56
3,85
8,33
—
-7,69
-3,85
-2,63
-1,92
-1,54
-1,25
-1,03
-0,85
-0,71
0,50
0,78
0,96
1,19
1,49
1,92
2,56
4,00
7,69
—
-7,69
-4,00
-2,56
-1,92
-1,49
-1,19
-0,96
-0,78
0,55
0,71
0,85
1,03
1,25
1,53
1,92
2,63
3,85
7,69
—
-8,33
-3,85
-2,56
-1,85
-1,41
-1,10
-0,87
0,60
0,65
0,78
0,92
1,09
1,30
1,56
2,00
2,63
4,00
8,33
—
-7,14
-3,70
-2,38
-1,69
-1,27
-0,97
0,65
0,60
0,70
0,81
0,94
1,10
1,28
1,56
1,92
2,56
3,85
7,14
—
-7,69
-3,57
-2,22
-1,54
-1,12
0,70
0,56
0,64
0,74
0,84
0,96
1,10
1,30
1,54
1,92
2,56
3,70
7,69
—
-6,67
-3,12
-1,92
-1,32
0,75
0,51
0,58
0,66
0,75
0,84
0,94
1,09
1,25
1,49
1,85
2,38
3,57
6,67
—
-5,88
-2,70
-1,32
0,80
0,47
0,53
0,60
0,66
0,74
0,81
0,92
1,03
1,19
1,41
1,69
2,22
3,12
5,88
—
-5,00
-2,20
0,90
0,39
0,43
0,47
0,51
0,56
0,60
0,65
0,71
0,78
0,87
0,97
1,12
1,32
1,64
2,27
4,17
—
2.1.2.1.6. Оценка с помощью порядковых статистик
2.1.2.1.6.1. Оптимальная линейная оценка [24, 25, 118, 119]
Находится по формуле <т =
где
г-я порядковая статистика;
г=1
коэффициенты оценки (табулированы в [24, 118, 119]).
Значения коэффициентов ki приведены в табл. 18. Учитвгоая, что kn+i = 0,
2
ki = — kn^i^i, в таблице приведены значения для членов выборки от 1 до в/2 (п —
четное) или (п — нечетное).
114
Оценка параметров распределений вероятностей
[Гл. 2
Значения
Таблица 18
для оптимальной линейной оценки и [119]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
кг
8862
5908
4539
3724
3175
2778
2476
2237
2044
1883
1748
1632
1532
1444
1366
1297
1235
1178
1128
к2
0
1102
1352
1386
1352
1294
1233
1172
1115
1061
1013
0968
0927
0899
0854
0822
0792
0765
к3
0
0432
0625
0713
0751
0763
0760
0749
0735
0717
0699
0681
0663
0645
0628
0611
к4
0
0230
0360
0436
0481
0506
0520
0526
0526
0524
0519
0512
0525
0497
0
0142
0234
0294
0335
0362
0379
0391
0398
0401
0402
0402
к6
0
0087
0164
0212
0247
0272
0290
0302
0312
0318
к7
0
0070
0122
0160
0189
0211
0228
0241
к8
0
0530
0094
0125
0150
0169
kg
0
0041
0074
0101
кю
0
0033
Эффективность оценки практически не уступает оценке максимального правдо-
правдоподобия (см. раздел 2.1.2.1.2).
2.1.2.1.6.2. Оценка Огавы [118, 119]
Аналогична оптимальной линейной оценке, но вычисляется по га < п порядко-
порядковым статистикам, выбранным исходя из получения максимальной эффективности
оценок в больших выборках без увеличения объема вычислений.
Вычисляется по формуле а =
ь ГДе т — число выборочных поряд™
г=1
ковых статистик, по которым производится оценка; Л^ — коэффициенты, определя-
определяющие номера порядковых статистик, участвующих в оценке; @i —весовые коэффи-
коэффициенты оценки.
Коэффициенты Л^ и /% табулированы в [118, 119] и приведены в табл. 19 {\n\j\ —
целое число, ближайшее справа к пЛ^, и [n\i] + 1 — порядковый номер наблюдения).
Таблица 19
Значения Лг (верхняя строка) и /Зг (нижняя строка)
для оценки Огавы [119]
т
2
4
6
1
0,069
-0,674
0,023
-0,115
0,011
-0,056
2
0,931
0,674
0,127
-0,237
0,056
-0,126
г
3
0,873
0,237
0,171
-0,181
4
0,977
0,115
0,829
0,181
5
0,944
0,126
6
0,990
0,056
2.1]
Оценка параметров нормального распределения
115
2.1.2.1.6.3. Линейная оценка Даутона
Даутон [131] предложил простую, но весьма эффективную оценку для а в виде
1,77245 " о. 1Х
а =
п(п - 1)
При п ^ 10 эффективность оценки равна 0,94 по сравнению с оценкой максималь™
ного правдоподобия.
2.1.2.1.6.4. Оценка по сумме подразмахов (оценка Диксона) [117]
Вычисляется по формуле
г
где Ui = xn+i—i — xi —г-й подразмах; kn — коэффициент оценки. Значения кп и но-
номера используемых в оценке подразмахов табулированы в [118, 119] и приведены
в табл. 20 (очевидно, что ш\ = ш — обычный размах). Там же приведены коэффи-
коэффициенты к оценки а по размаху {а = кш, см. табл. 16).
Таблица 20
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
к
(по размаху)
0,886
0,591
0,486
0,430
0,395
0,370
0,351
0,337
0,325
0,315
0,307
0,300
0,294
0,288
0,283
0,279
0,275
0,271
0,268
Оценки &
Эффективность
оценки
по размаху
1,000
0,992
0,975
0,955
0,933
0,911
0,890
0,869
0,850
0,831
0,814
0,797
0,781
0,766
0,751
0,738
0,725
0,712
0,700
по подразмахам
Оценка по сумме
подразмахов
(оценка Диксона)
0,8862ш
0,5908а;
0,4857а;
0,4299ш
0,2916(а; + а;2)
0,2370(ш + ш2)
0,2197(ш + ш2)
0,2068(а; + а;2)
0,1968(ш + а;2)
О,16О8(С47 + Ш2 +О74)
0,1524(а; + а;2 + О74)
0,1456(ш + ш2 +ш4)
0,1399(а; + а;2 + ш4)
0,1352(а; + а;2 + ш4)
О,1311(Ш + Ш2 +Ш4)
0,1050(а; + а;2 + а;3 + а;5)
0,1020(ш + ш2 + ш3 + ш5)
0,0993(ш + ш2 + ш3 + ш5)
0,10446(ш + ш2 + ш4 + ш6)
Эффективность
оценки
по подразмахам
1,000
0,992
0,975
0,955
0,957
0,967
0,970
0,968
0,964
0,967
0,972
0,975
0,977
0,977
0,975
0,978
0,978
0,979
0,980
2.1.2.1.6.5. Оценка Джини [122]
Используется как быстрая оценка для а и подсчитывается по формуле
. п — 2г -
г=1
п(п — 1)
где Ш{ — г-й подразмах.
Оценка не уступает оценке Даутона (см. 2.1.2.1.6.3).
116
Оценка параметров распределений вероятностей
[Гл. 2
2.1.2.1.6.6. Оптимальные комплексные оценки, использующие общий набор
порядковых статистик
Подробнее о сути оценки ем. в разделе 2.1.1.1.3.5. Укажем оценку по двум поряд-
порядковым статистикам (напомним, одинаковым при оценке /л и а), минимизирующую
линейную комбинацию дисперсий D(/i) + cD(a) (табл. 21):
о- = к(х[ап] -Х[рп]).
Аналогичные оценки по четырем порядковым статистикам имеют вид (с = 1)
~ х[0,0668п]) + 0>2051(Ж[0,7088п] ~~ ж[0,2Э12п])
Эффективности оценок равны соответственно 0,735 и 0,792.
Таблица 21
с
1
2
3
Оценка
к
0,4875
0,4391
0,4160
(Т по двум статистикам [117]
а
0,8475
0,8726
0,8853
Р
0,1525
0,1274
0,1174
Эффективность
0,552
0,594
0,614
Задача 46. Имеется набор результатов измерений
хц 1,4; 2,1; 2,9; 3,1; 3,8; 4,1; 4,3; 4,6; 5,1; 6,1.
Необходимо вычислить оценку дисперсии и среднеквадратического отклонения различ-
различными способами.
Оценка максимального правдоподобия B.1.2.1.1)
s2 = -
{ - xf = -
n
= — • 158,51 - C,75J = 1,7885
10
или s2 =
ixi ~~
= 1,9872 (с использованием поправки на смещение).
Следует помнить, что при малых п смещение оценки может быть значительным.
Оценка по среднему абсолютному отклонению B.1.2.1.3)
1 "
\Xi-x\, где с= \ -
. = 0,75694.
10/
Имеем
= 11 и s* =
1
¦ 11 = 1,4181.
10 • 0,75694
Оценка по выборочному размаху B.1.2.1.4)
Имеем со = жтах — xmin = 6,1 — 1,4 = 4,7. Для п = 10 из табл. 16 получаем - = 0,3249
и sp = 4,7 • 0,3249 = 1,529.
Упрощенная оценка по шаблону B.1.2.1.5)
Выбираем d,2 = 4,5 и d\ = 2,5, тогда pi = 0,2 и pi = 0,8. Из табл. 17 имеем /@,2; 0,8) =
= 0,60 и 5Ш = D,5 - 2,5) • 0,6 = 1,20.
2.1] Оценка параметров нормального распределения 117
Оптимальная линейная оценка B.1.2.1.6.1)
Находим с помощью табл. 18
a = J2ki' Щг] = 0,2044 • F,1 - 1,4) + 0,1172 • E,1 - 2,1) + 0,0763 • D,6 - 2,9) +
г=1
+ 0,0436 • D,3 - 3,1) + 0,0142 • D,1 ~~ 3,8) = 1,49857.
Оценка Огавы B.1.2.1.6.2)
Выполним оценку по четырем порядковым статистикам. В соответствии с табл. 19 их
номера будут
[п • Ai] + 1 = [10 • 0,023] + 1 = 1; [п • Л2] + 1 = [10 • 0,127] + 1 = 2;
[п • Аз] + 1 = [10 • 0,873] + 1 = 9; [п • А4] + 1 = [10 • 0,977] + 1 = 10.
Тогда имеем, используя коэффициенты из табл. 19,
а = -0,115 • хг - 0,237 • х2 + 0,237 • х9 + 0,115 • х10 =
= 0,115 • F,1 - 1,4) + 0,237 • E,1 - 2,1) = 1,2515.
Линейная оценка Даутона B.1.2.1.6.3)
1,77245
а =
• ]Р Bг - п - 1) • хг = 0,01Э694-(-9 • 1,4 - 7 • 2,1 ~~ 5 • 2,9 - 3 • 3,1 ~~
-(Ю-1) ^
- 1 • 3,8 + 1 • 4,1 + 3 • 4,3 + 5 • 4,6 + 7 • 5,1 + 9 • 6,1) = 1,49083.
Оценка по сумме подразмахов B.1.2.1.6.4)
Из табл. 20 (для п = 10) следует, что
а = 0,1968 • (ш + ш2) = 0,1968 • (жю - ал + ж9 - х2) =
= 0,1968 • F,1 - 1,4 + 5,1 - 2,1) = 1,51536.
Оценка Джини B.1.2.1.6.5)
Имеем
Г-1
п L2 J
J2 \хг - хА = 1С (п ~~2i + *) • ^ = (п -1)'Ш1 + (w -3) •Ш2 + (п -5) • Шз+
i,j = l г=1
+ (п - 7) • ш4 + (п - 9) • ш5 = 75,7 и <т = • 75,7 = 0,842.
Из результата видно, что оценка очень груба.
Оценки, использующие общий набор порядковых статистик B.1.2.1.6.6)
Имеем для двух статистик (пусть с = 1)
а = 0,4875 • (ж[0,8475.ю] - ^0,1525.10]) = 0,4875 • (х8 ~~ хг) = 0,4875 • D,6 - 1,4) = 1,56;
оценка по четырем статистикам:
вариант 1
а = 0,2581 • (X[O;9332-1O] — Ж[0,0688-10]) + 0,2051 • (Ж[О,7О88-Ю] — Ж[о, 2912-10]) =
= 0,2581 • (х9 - хг) + 0,2051 • (х7 - х3) = 0,2581 • E,1 - 1,4) + 0,2051 • D,3 - 2,9) = 1,2421.
вариант 2
«7 = 0,1787 • (#[0,9611.10] ~~ Ж[0,0389-10]) + 0,2353 • (Ж[О,784О-1О] — #[0,2160-10]) =
= 0,1787 • (жю - хг) + 0,2353 • (ж8 - х2) = 0,1787 • F,1 - 1,4) + 0,2353 • D,6 - 2,1) = 1,428.
118
Оценка параметров распределений вероятностей
[Гл. 2
2.1.2.2. Интервальные оценки
2.1.2.2.1. Интервальные оценки дисперсии и2
Интервальные оценки при доверительной вероятности а равны
1 п 1
_ V (т- — тJ- (^2)в —
тJ
где x^f —7™квантиль распределения %2 с / = в—1 степенями свободы (если параметр
/л известен, то / = n); jf =
¦ для двусторонней оценки wjf = a для односто™
ронней оценки; jf/ =
оценки.
1-а
для двусторонней оценки иУ' = 1 — « для односторонней
Для аппроксимации Xj рекомендуется использовать формулу Вилсона—Хил™
ферти [61]
xW =
где и7 — 7™квантиль стандартного нормального распределения.
Для практически применяемых уровней достоверности а = 0,9; 0,95 и 0,99 зна™
чения и^ приведены в табл. 22.
Таблица 22
Значения
а
0,90
0,95
0,99
Односторонние границы
У
0,90
0,95
0,99
1"
0,10
0,05
0,01
*v
1,28255
1,64485
2,32635
-1,28255
-1,64485
-2,32635
Двусторонние границы
У
0,950
0,975
0,995
1"
0,050
0,025
0,005
wy
1,64485
1,95996
2,57582
ну'
-1,64485
-1,95996
-2,57582
2.1.2.2.2. Интервальная оценка а по размаху
Оценка находится по формулам
где а; G)—7™квантиль распределения размаха выборки объема п из стандартного
нормального распределения (табулированы в [25, 29]); jf = —-— для двусторонней
ш jf = а для односторонней оценки; jf/ =
1-а
для двусторонней, j/f = 1 — а для
односторонней оценки. Оценка применяется при п ^ 20. Для обычно применяемых
величин а = 0,90; 0,95 и 0,99 необходимые значения о;G) для п = 1AJ0 приведены
в табл. 23.
2.1.2.2.3. Оценка по среднему абсолютному отклонению
Вычисляется по формулам
1
Xi — х ;
1
2.1]
Оценка параметров нормального распределения
119
Таблица 23
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Значения
квантилей распределения размаха из("у) [25]
Односторонние оценки
а =
1
0,90
2,90
3,24
3,48
3,66
3,81
3,93
4,04
4,13
4,21
4,29
4,35
4,41
4,47
4,52
4,57
4,61
4,65
4,69
0,90
1"
0,10
0,62
0,98
1,26
1,49
1,68
1,83
1,97
2,09
2,20
2,30
2,39
2,47
2,54
2,61
2,67
2,73
2,79
2,84
а =
V
0,95
3,31
3,63
3,86
4,03
4,17
4,29
4,39
4,47
4,55
4,62
4,68
4,74
4,80
4,85
4,89
4,93
4,97
5,01
0,95
V
0,05
0,43
0,76
1,03
1,25
1,44
1,60
1,74
1,86
1,97
2,07
2,16
2,24
2'32
2,39
2,45
2,51
2,57
2,62
а =
i
0,99
4,12
4,40
4,60
4,76
4,88
4,99
5,08
5,16
5,23
5,29
5,35
5,40
5,45
5,49
5,54
5,57
5,61
5,65
0,99
l"
0,01
0,19
0,43
0,66
0,87
1,05
1,20
1,34
1,47
1,58
1,68
1,77
1,86
1,93
2,01
2,07
2,14
2,20
2,25
Двусторонние оценки
а =
i
0,95
3,31
3,63
3,86
4,03
4,17
4,29
4,39
4,47
4,55
4,62
4,68
4,74
4,80
4,85
4,89
4,93
4,97
5,01
0,90
i1
0,05
0,43
0,76
1,03
1,25
1,44
1,60
1,74
1,86
1,97
2,07
2,16
2,24
2,32
2,39
2,45
2,51
2,57
2,62
а = 0,95
V
0,975
3,68
3,98
4,20
4,36
4,49
4,61
4,70
4,79
4,86
4,92
4,99
5,04
5,09
5,14
5,18
5,22
5,26
5,30
0,025
0,30
0,59
0,85
1,06
1,25
1,41
1,55
1,67
1,78
1,88
1,97
2,06
2,14
2,21
2,27
2,34
2,39
2,45
а =
V
0,995
4,42
4,69
4,89
5,03
5,15
5,26
5,34
5,42
5,49
5,54
5,60
5,65
5,70
5,74
5,78
5,82
5,85
5,89
0,99
l"
0,005
0,13
0,34
0,55
0,75
0,92
1,08
1,21
1,33
1,45
1,55
1,64
1,72
1,80
1,88
1,94
2,01
2,07
2,12
Таблица 24
Значения квантилей распределения среднего абсолютного отклонения m(j) [25]
2
3
4
5
6
7
8
9
10
Односторонние оценки
а =
7
0,90
1,163
1,117
1,089
1,069
1,052
1,038
1,026
1,016
1,007
0,90
1"
0,10
0,088
0,238
0,328
0,386
0,428
0,459
0,484
0,504
0,521
а =
i
0,95
1,386
1,276
1,224
1,187
1,158
1,135
1,116
1,100
1,086
0,95
i'
0,05
0,044
0,166
0,254
0,315
0,360
0,394
0,422
0,445
0,464
а =
i
0,99
1,821
1,586
1,489
1,419
1,366
1,325
1,292
1,264
1,240
0,99
7"
0,01
0,009
0,073
0,145
0,203
0,250
0,287
0,318
0,344
0,366
Двусторонние оценки
а =
i
0,95
1,386
1,276
1,224
1,187
1,158
1,135
1,116
1,100
1,086
0,90
l"
0,05
0,044
0,166
0,254
0,305
0,360
0,394
0,422
0,445
0,464
а =
У
0,975
1,585
1,417
1,344
1,292
1,253
1,222
1,196
1,175
1,156
0,95
i1
0,025
0,022
0,116
0,199
0,260
0,306
0,342
0,372
0,396
0,417
а =
У
0,995
1,985
1,703
1,59
1,507
1,445
1,397
1,358
1,326
1,299
0,99
7;/
0,005
0,004
0,073
0,145
0,203
0,25
0,287
0,318
0,344
0,366
где m(j) — 7~квантиль распределения среднего абсолютного отклонения; jf= A + ol)/2,
г)" = A + а)/2 Для двусторонней оценки и jf = a, jff = 1 — а для односторонней
оценки.
Для п = 1AI00 и а = 0,90; 0,95 и 0,99 значения 772G) приведены в табл. 24.
2.1.2.2.4. Интервальная оценка и, основанная на ее точечной оценке s
Оценка вычисляется по формулам
120
Оценка параметров распределений вероятностей
[Гл. 2
где s =
7™квантиль распределения
с / = п — 1 сте™
1 + о
пенями свободы; 7/= {l' = °0 Для двусторонней (односторонней) оценки;
7//= —-— (jff = 1 — а) для двусторонней (односторонней) оценки. Значения w——
2 V Х7
табулированы в [25, 46] и приведены в табл. 25.
В [36] для а = 0,95 приведены достаточно простые и точные эмпирические
формулы:
Значения
Таблица 25
для интервальной (двусторонней) оценки и
ft 1
П I
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
35
40
45
50
55
60
70
80
90
100
а =
i = 0,95
0,578
0,620
0,649
0,672
0,690
0,705
0,718
0,729
0,739
0,748
0,755
0,762
0,769
0,775
0,780
0,785
0,790
0,794
0,798
0,805
0,812
0,818
0,823
0,828
0,838
0,847
0,854
0,861
0,866
0,871
0,879
0,886
0,892
0,897
0,90
7/; = 0,05
4,42
2,92
2,37
2,09
1,92
1,80
1,71
1,65
1,59
1,55
1,52
1,49
1,46
1,44
1,42
1,40
1,39
1,37
1,36
1,34
1,32
1,30
1,29
1,27
1,25
1,23
1,21
1,20
1,19
1,18
1,16
1,15
1,14
1,13
а =
У = 0,975
0,521
0,566
0,599
0,624
0,644
0,661
0,675
0,688
0,699
0,708
0,717
0,725
0,732
0,739
0,745
0,750
0,756
0,760
0,765
0,773
0,781
0,788
0,794
0,799
0,811
0,821
0,829
0,837
0,843
0,849
0,858
0,866
0,873
0,879
0,95
7/; = 0,025
6,28
3,73
2,87
2,45
2,20
2,04
1,92
1,83
1,75
1,70
1,65
1,61
1,58
1,55
1,52
1,50
1,48
1,46
1,44
1,42
1,39
1,37
1,35
1,34
1,30
1,28
1,26
1,24
1,23
1,22
1,20
1,18
1,17
1,16
а =
У = 0,995
0,434
0,483
0,519
0,546
0,569
0,588
0,604
0,618
0,630
0,641
0,651
0,660
0,669
0,676
0,683
0,690
0,696
0,702
0,707
0,717
0,726
0,734
0,741
0,748
0,762
0,774
0,784
0,793
0,801
0,808
0,820
0,829
0,838
0,845
0,99
7;/ = 0,005
14,12
6,47
4,40
3,48
2,98
2,66
2,44
2,28
2,15
2,06
1,98
1,91
1,85
1,81
1,76
1,73
1,70
1,67
1,64
1,60
1,56
1,53
1,50
1,48
1,43
1,39
1,36
1,34
1,32
1,30
1,27
1,25
1,23
1,22
2.1]
Оценка параметров нормального распределения
121
— для нижней границы
— для верхней границы
1п-1
- 1,74
1 < 96 + \/2п - 2 '
11,54(п-3,61J + 1,Э8; 2
х/2п - 0,47
4;
п > 5.
/2п - 0,8 - 1,96
Оценки улучшаются, если вместо s использовать несмещенную оценку s* = fcs,
где к = 1 + ^^ [36].
Отметим, что в нашем случае рассматриваются симметричные квантили jf = 0,95
и 7;/ = 0,05, 7; = 0,975 и г)!1 = 0,025. Интервалы такого типа называются централь™
ными [132]. Однако они не являются кратчайшими при одной и той же дове™
рительной вероятности. Более того, в силу несимметричности распределения s,
центральные интервалы не могут быть кратчайшими [133].
В табл. 26 приведены кратчайшие доверительные интервалы для <т, равные
zis ^ 0" ^ Z2S Для заданных доверительных вероятностей. При п ^ 70 разница меж-
между кратчайшими и центральными интервалами становится менее 1%, поэтому
кратчайшими интервалами рекомендуется пользоваться при п ^ 70. Полное срав™
нительное исследование оценок дисперсии и стандартного отклонения нормального
распределения приведено в [134].
Задача 47. Для данных задачи 46 (ж«: 1,4; 2,1; 2,9; 3,1; 3,8; 4,1; 4,3; 4,6; 5,1; 6,1) найти
двустороннюю интервальную оценку для стандартного отклонения при доверительной
вероятности а = 0,95.
Интервальная оценка дисперсии B.1.2.2.1)
I ю ю
Находим S2 = J2(xi ~ xf = 1,9872, или J^(xi - xf = 17,885.
Для а = 0,95 (двусторонние границы) из табл. 22 имеем tio,975 = 1,95996 и tio,o25 =
= -1,95996.
Отсюда при / = п — 1 = 9
Х0,975 = 9 '
Х0,025 —
1 -
1-
9- 10
2
+ 1,95996 •
- 1,95996 •
Далее
• 17,885 = 0,97025;
= 18,4333;
= 2,9004.
• 17,885 = 6,1664.
18,4333
Следовательно, с вероятностью 0,95 имеем 0,97025 ^ о ^ 6,1664.
Интервальная оценка а по размаху B.1.2.2.2)
Имеем жтах — xmin = 6,1 — 1,4 = 4,7. Из табл. 23 для п = 10 и а = 0,95 имеем
ало @,975) = 4,79 и ало @,025) = 1,67. Следовательно,
si = — = 0,9457; si = — = 2,8144,
4,97 1,67
и с вероятностью 0,95 имеем 0,9457 ^ а ^ 2,8144.
122
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 26
Коэффициенты z\ и z^ кратчайших
доверительных интервалов [133]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
а =
21
0,272
0,400
0,478
0,531
0,571
0,601
0,627
0,647
0,664
0,679
0,692
0,704
0,714
0,724
0,732
0,740
0,747
0,753
0,759
0,765
0,770
0,775
0,779
0,783
0,788
0,791
0,795
0,798
0,802
0,816
0,827
0,837
0,844
0,857
0,868
0,90
Z2
7,944
3,112
2,304
1,980
1,805
1,693
1,616
1,558
1,512
1,476
1,447
1,421
1,400
1,381
1,365
1,350
1,337
1,326
1,315
1,306
1,297
1,288
1,281
1,274
1,267
1,261
1,256
1,250
1,245
1,224
1,207
1,193
1,182
1,164
1,151
а =
z\
0,246
0,364
0,439
0,491
0,531
0,562
0,587
0,609
0,627
0,642
0,656
0,668
0,679
0,689
0,698
0,706
0,714
0,721
0,727
0,733
0,739
0,744
0,749
0,754
0,758
0,762
0,766
0,770
0,773
0,789
0,801
0,812
0,821
0,835
0,847
0,95
16,004
4,434
2,949
2,405
2,124
1,950
1,832
1,746
1,680
1,628
1,585
1,550
1,520
1,494
1,461
1,451
1,433
1,417
1,402
1,389
1,377
1,366
1,356
1,347
1,338
1,330
1,322
1,315
1,308
1,280
1,258
1,241
1,226
1,203
1,186
а =
z\
0,220
0,310
0,378
0,428
0,467
0,497
0,523
0,544
0,563
0,580
0,594
0,607
0,619
0,629
0,639
0,648
0,656
0,664
0,671
0,678
0,684
0,690
0,695
0,701
0,705
0,710
0,715
0,719
0,723
0,741
0,755
0,767
0,778
0,795
0,808
0,99
Z2
80,062
9,990
5,131
3,691
3,027
2,647
2,402
2,229
2,101
2,002
1,982
1,858
1,804
1,758
1,718
1,683
1,653
1,625
1,601
1,579
1,559
1,541
1,525
1,509
1,495
1,482
1,470
1,458
1,448
1,403
1,369
1,342
1,320
1,285
1,260
Оценка а по среднему абсолютному отклонению B.1.2.2.3)
ю ю
Находим ]Р \х% — х\ = ]Р \xi ~ ^-^Щ = 11- Из табл. 24 для а = 0,95 и п = 10 имеем
г=1 г=1
,975 = 1Д56 и то,025 = 0,47, тогда
1 = 2,3404.
s" = 1^мй •n = °'9515; s"
Окончательно имеем 0,9515 ^ а ^ 2,3404.
10 • 0,47
Интервальная оценка а, основанная на ее точечной оценке B.1.2.2.4)
J1 ю
~ 2 (Xi ~ хJ = 1,40969. Из табл. 25 для а = 0,95 ип-1 = 9 имеем
2.1]
Оценка параметров нормального распределения
123
= 0,688;
= 1,83.
Тогда
si = 0,688 • 1,40969 = 0,96986; si = 1,83 • 1,40969 = 2,57973.
Если воспользоваться аппроксимациями, то
Хо,975 1,96 + V20 - 2
что очень близко к табличным значениям.
Теперь воспользуемся кратчайшим доверительным интервалом. Из табл. 26 имеем
для а = 0,95 и п = 10: z\ = 0,642 и Z2 = 1,628, откуда
S* = 0,642 • 1,40969 = 0,90502 и s* = 1,628 • 1,40969 = 2,29497,
0,90502 <С а <: 2,29497.
Видим, что в этом случае длина доверительного интервала равна 2,29497^ 0,90502 =
= 1,38995 по сравнению с 2,57973 — 0,969986 = 1,60974 в случае центрального интервала
(т.е. меньше на « 14%).
2.1.3. Оценки в усеченных и цензурированных выборках
На практике встречаются ситуации, когда некоторые выборочные значения слу-
случайной величины отсутствуют. Например, при испытаниях электронных приборов
на гарантийную наработку для части приборов фиксируются значения наработки,
а для остальных известно только, что их наработка не меньше некоторой таранти™
руемой величины.
Выборки, в которых отсутствуют значения случайной величины, большие (или
меньшие) некоторого граничного значения, называются усеченными. Если степень
усечения известна заранее, то имеет место так называемая не полностью опре-
определенная выборка. Выборки, в которых часть членов отбрасывается, называются
цензурированными (например, при измерениях отбрасываются крайние значения,
как наиболее грубые).
2.1.3.1. Оценки максимального правдоподобия
2.1.3.1.1. Оценки в усеченных выборках
Оценка параметров усеченного нормального распределения производится по
формулам
где z = f(y) — функция аргумента у =
Е2
(z) — функция аргумента
табулированы в [29], часть этих таблиц
Значения функций z = f(y) и
воспроизведена в табл. 27 и 28.
Сначала по выборочным данным подсчитывается у, затем по табл. 27 и 28 — z
и g(z) (при необходимости используется интерполяция). В приведенных формулах
предполагается, что точка усечения ху известна и равна 0 (если ху ф 0, то формулы
справедливы для переменной х* = xi — ху).
124
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 27
Значения функции z = f{y) [29]
У
0,550
0,555
0,560
0,565
0,570
0,575
0,580
0,585
0,590
0,595
0,600
0,605
0,610
0,615
0,620
0,625
0,630
0,635
0,640
0,645
0,650
0,655
0,660
0,665
z
-3,145
-2,990
-2,851
-2,777
-2,613
-2,508
-2,410
-2,319
-2,232
-2,151
-2,073
-1,999
-1,928
-1,859
-1,792
-1,728
-1,665
-1,604
-1,545
-1,486
-1,429
-1,373
-1,318
-1,263
У
0,670
0,675
0,680
0,685
0,690
0,695
0,700
0,705
0,710
0,715
0,720
0,725
0,730
0,735
0,740
0,745
0,750
0,755
0,760
0,765
0,770
0,775
0,780
0,785
-1,209
-1,158
-1,103
-1,051
-0,999
-0,947
-0,896
-0,845
-0,894
-0,743
-0,692
-0,641
-0,589
-0,538
0,487
-0,435
-0,383
-0,330
-0,277
-0,224
-0,170
-0,116
-0,060
-0,040
У
0,790
0,795
0,800
0,805
0,810
0,815
0,820
0,825
0,830
0,835
0,840
0,845
0,850
0,855
0,860
0,865
0,870
0,875
0,880
0,885
0,890
0,895
0,900
0,905
z
0,052
0,110
0,168
0,228
0,289
0,351
0,414
0,479
0,545
0,613
0,683
0,754
0,829
0,905
0,984
1,066
1,151
1,240
1,332
1,428
1,530
1,636
1,749
1,868
Таблица 28
Значения функции g(z) [29]
2
-3,0
-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
-2,0
-1,9
s(z)
0,3328
0,3341
0,3561
0,3689
0,3826
0,3977
0,4128
0,4294
0,4472
0,4662
0,4866
0,5082
z
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1,0
-0,9
-0,8
-0,7
g{z)
0,5314
0,5560
0,5823
0,6102
0,6398
0,6713
0,7045
0,7396
0,7766
0,8156
0,8565
0,8993
z
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
0,0
0,1
0,2
0,3
0,4
0,5
0,9442
0,9909
1,0396
1,0902
1,1428
1,1917
1,2533
1,3113
1,4323
1,4953
1,5599
1,6259
z
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
g(z)
1,6935
1,7624
1,8327
1,9043
1,9771
2,0511
2,2024
2,2796
2,3578
2,4369
2,5169
2,5978
2.1.3.1.2. Оценки в неполностью определенных выборках
Неполностью определенная выборка имеет место, когда о части членов выборки
известно только, что они не больше (не меньше) некоторого граничного значения.
Предположим, что имеется выборка объема п из нормального распределения.
Для (п — По) членов выборки известны точные значения Xi {х\1Х21х% ... ,жп^По).
2.1]
Оценка параметров нормального распределения
125
Таблица 29
У
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,62
0,64
0,66
0,68
0,70
0,72
0,74
0,76
0,78
0,80
0,85
0,90
0,95
1,00
1,30
1,50
У
0,50
0,51
0,52
0,53
0,54
0,55
0,56
0,57
0,58
0,59
0,60
0,62
0,64
0,66
0,68
0,70
0,72
0,74
0,76
0,78
0,80
0,90
1,00
1,30
1,50
Значения функции ,
* = /О,!
/) Р9]
h
0,05
-2,786
-2,562
-2,384
-2,239
-2,117
-2,013
-1,923
-1,844
-1,710
-1,602
-1,512
-1,435
-1,369
-1,311
-1,260
-1,214
-1,173
-1,135
-1,055
-0,989
-0,934
-0,887
-0,702
-0,626
0,10
-2,680
-2,445
-2,263
-2,115
-1,992
-1,889
-1,800
-1,722
-1,653
-1,591
-1,536
-1,441
-1,360
-1,292
-1,233
-1,180
-1,134
-1,092
-1,055
-1,021
-0,990
-0,922
-0,866
-0,819
-0,778
-0,613
-0,545
0,15
-0,985
-1,862
-1,759
-1,671
-1,595
-1,528
-1,468
-1,415
-1,366
-1,322
-1,282
-1,211
-1,150
-1,097
-1,050
-1,009
-0,971
-0,937
-0,906
-0,878
-0,852
-0,795
-0,747
-0,706
-0,671
-0,525
-0,463
0,20
-1,537
-1,463
-1,398
-1,340
-1,289
-1,242
-1,200
-1,162
-1,127
-1,094
-1,064
-1,010
-0,963
-0,921
-0,884
-0,850
-0,819
-0,792
-0,766
-0,742
-0,721
-0,673
-0,631
-0,596
-0,565
-0,436
-0,381
0,25
-1,207
-1,158
-1,114
-1,074
-1,037
-1,004
-0,973
-0,945
-0,919
-0,894
-0,871
-0,829
-0,792
-0,759
-0,729
-0,702
-0,677
-0,654
-0,632
-0,613
-0,594
-0,553
-0,518
-0,488
-0,461
-0,347
-0,297
0,30
-0,943
-0,909
-0,877
-0,849
-0,822
-0,797
-0,774
-0,753
-0,733
-0,714
-0,696
-0,663
-0,634
-0,607
-0,583
-0,561
-0,540
-0,521
-0,503
-0,487
-0,471
-0,437
-0,407
-0,380
-0,357
-0,257
-0,212
0,35
-0,720
-0,695
-0,672
-0,651
-0,631
-0,612
-0,595
-0,579
-0,563
-0,548
-0,534
-0,508
-0,485
-0,463
-0,444
-0,425
-0,408
-0,393
-0,378
-0,364
-0,351
-0,322
-0,296
-0,273
-0,253
-0,165
-0,125
0,40
-0,523
-0,505
-0,488
-0,472
-0,457
-0,443
-0,429
-0,416
-0,404
-0,393
-0,382
-0,361
-0,343
-0,325
-0,309
0,294
-0,280
-0,267
-0,255
-0,243
-0,232
-0,207
-0,186
-0,166
-0,149
-0,072
-0,036
h
0,45
-0,345
-0,331
-0,318
-0,306
-0,295
-0,284
-0,273
-0,263
-0,254
-0,245
-0,236
-0,220
-0,204
-0,190
-0,177
-0,166
-0,154
-0,143
-0,133
-0,123
-0,114
-0,074
-0,043
0,025
0,056
0,50
-0,178
-0,168
-0,158
-0,149
-0,140
-0,132
-0,124
-0,116
-0,108
-0,101
-0,094
-0,081
-0,069
-0,058
-0,047
-0,037
-0,027
-0,019
-0,010
-0,002
0,006
0,039
0,066
0,124
0,151
0,55
-0,019
-0,017
-0,004
0,003
0,010
0,016
0,023
0,029
0,035
0,040
0,046
0,056
0,066
0,075
0,084
0,092
0,100
0,107
0,114
0,121
0,127
0,154
0,177
0,237
0,251
0,60
0,136
0,142
0,147
0,153
0,158
0,163
0,168
0,173
0,177
0,182
0,186
0,194
0,202
0,210
0,216
0,223
0,229
0,235
0,241
0,246
0,252
0,275
0,294
0,336
0,357
0,65
0,291
0,295
0,300
0,304
0,308
0,312
0,315
0,319
0,323
0,326
0,330
0,336
0,342
0,348
0,353
0,359
0,364
0,368
0,373
0,377
0,382
0,401
0,416
0,452
0,470
0,70
0,449
0,453
0,456
0,459
0,462
0,465
0,468
0,471
0,473
0,476
0,479
0,484
0,488
0,493
0,497
0,501
0,505
0,509
0,513
0,516
0,520
0,535
0,548
0,578
0,593
0,75
0,616
0,619
0,621
0,623
0,625
0,628
0,630
0,632
0,634
0,636
0,638
0,642
0,645
0,649
0,652
0,655
0,658
0,661
0,664
0,667
0,670
0,681
0,692
0,716
0,728
0,80
0,797
0,799
0,801
0,802
0,804
0,806
0,807
0,809
0,810
0,812
0,813
0,816
0,818
0,821
0,823
0,826
0,828
0,830
0,833
0,835
0,837
0,846
0,854
0,873
0,883
126
Оценка параметров распределений вероятностей
[Гл. 2
Оценки параметров /л и а тогда подсчитываются по формулам [29]
n-no
1 v^
x = — zs: s = У Х{
п — п0
г=1
где /г = —; z = /(/i, y) —функция аргументов /г и у = (п — '
п—по
v—л
г=1 о
значения табулированы в [29]; i/j(z)— функция аргумента z (значения приведены
в [29]).
Таблица 30
z
-3,0
-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
2,0
-1,9
-1,8
-1Д
-1,6
-1,5
-1,4
Значения функции ф
tjj(z)
3,2831
3,1903
3,0979
3,0058
2,9141
1,8227
2,7318
2,6414
2,5515
2,4621
2,3732
2,2849
2,1973
2,1103
2,0241
1,9387
1,8541
z
— 1,3
-1,2
-1,1
-1,0
-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
0,0
0,1
0,2
0,3
1,7704
1,6876
1,6058
1,5251
1,4456
1,3674
1,2905
1,2150
1,1411
1,0688
0,9982
0,9294
0,8626
0,7979
0,7353
0,6751
0,6172
[z) [29]
z
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
0,5619
0,5092
0,4591
0,4119
0,3676
0,3251
0,2876
0,2520
0,2194
0,1897
0,1629
0,1388
0,1173
0,0984
0,0819
0,0676
0,0552
Значения функций z = /(/г, у) и ip(z) воспроизведены в табл. 29 и 30. Сначала по
выборочным значениям Х{ вычисляются у и /г, затем по табл. 29 и 30 определяются
соответствующие им значения z = f(h,y) и tp(z).
2.1.3.1.3. Оценки в цензурированных выборках
2.1.3.1.3.1. Оценка максимального правдоподобия
Наиболее полно оценки такого типа рассмотрены в [135, 136]. Пусть из выборки
объема п известны только г первых членов. Это, кстати, классическая ситуация,
возникающая при проведении испытаний приборов на долговечность, когда из
п испытываемых приборов наблюдаются г отказов.
Итак, наблюдаются значения х\ ^ Х2 ^ . •. ^ хГ1 а для всех оставшихся (п — г)
приборов примем одно значение жд, равное хг.
Для первых г членов выборки имеем
x = -
,2 = i
-*)¦
г=1
Th V
Далее находим параметры h = ^^^ и 7 =
— x)
2.1]
Оценка параметров нормального распределения
127
Оценки для /л и а будут иметь вид [136]
где Aj(/i,7)—коэффициенты, приведенные в табл. 31.
Таблица 31
7
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
Значения
k(h,j) [
136]
h
ОД
0,1102
0,1180
0,1247
0,1306
0,1386
0,1409
0,1455
0,1499
0,1540
0,1579
0,1617
0,1932
0,2182
0,2395
0,2585
0,2757
0,2916
0,3065
0,3205
0,3337
0,2
0,2426
0,2574
0,2703
0,2819
0,2926
0,3025
0,3118
0,3207
0,3290
0,3370
0,3447
0,4093
0,4609
0,5052
0,5450
0,5803
0,6134
0,6442
0,6733
0,7009
0,3
0,4021
0,4233
0,4422
0,4595
0,4755
0,4904
0,5045
0,5180
0,5308
0,5340
0,5548
0,6547
0,7349
0,8038
0,8653
0,8912
0,9729
1,0210
1,0670
1,1100
0,4
0,5961
0,6234
0,6483
0,6713
0,6927
057129
0,7320
0,7502
057676
0,7844
0,8005
0,9382
1,0490
1,1460
1,2310
1,3090
1,3820
1,4400
1,5130
1,5730
0,5
0,8368
0,8703
0,9012
0,9300
0,9570
0,9826
1,0070
1,0300
1,0530
1,0740
1,0950
1,2740
1,4200
1,5460
1,6590
1,7620
1,8570
1,9460
2,0310
2,1100
0,6
1,1450
1,1850
1,2220
1,2570
1,2900
1,3210
1,3510
1,3800
1,4080
1,4350
1,4610
1,6860
1,8700
2,0310
2,1750
2,3070
2,4280
2,5430
2,6500
2,7530
0,7
1,5610
1,6080
1,6510
1,6930
1,7320
1,7700
1,8060
1,8410
1,8750
1,9080
1,9400
2,2170
2,4470
2,6490
2,8290
2,9950
3,1490
3,2930
3,4300
3,5590
0,8
2,1760
2,2290
2,2800
2,3290
2,3760
2,4210
2,4650
2,5070
2,5480
2,5880
2,6260
2,9680
3,2550
3,5080
3,7360
3,9450
4,1400
4,3220
4,4950
4,6600
0,9
3,2830
3,3450
3,4050
3,4640
3,5200
3,5750
3,6280
3,6790
3,7300
3,7790
3,8270
4,2580
4,6250
4,9520
5,2490
5,5220
5,7880
6,0180
6,2450
4,4620
Двусторонние доверительные интервалы с доверительной вероятностью а нахо-
находятся по формулам [136]
(а, п, г);
, п, г),
где %'(«, п, г), х/;(а, п, г)—коэффициенты, приведенные в табл. 32. При г = п (от-
(отсутствие цензурирования) оценки превращаются в обычные.
Двусторонний доверительный интервал для /л имеет вид [136]
, n, г)а; ?° (а) = А - t/;(
, n,
где tf(a,n,r), t"{a,n,r) — коэффициенты, приведенные в табл. 33.
Отметим основные особенности рассмотренных оценок:
— точная длина доверительного интервала в большей степени зависит от г
п — г
и в меньшей степени от п = :
п
— при фиксированном значении г длина доверительного интервала для /л оста-
остается практически постоянной при 0 ^ /i ^ 0,7 и увеличивается при h > 0,7;
— при г = const доверительный интервал для а медленно увеличивается с ро-
ростом п (или h);
— при п = const длина доверительного интервала уменьшается с ростом г.
128
Оценка параметров распределений вероятностей
[Гл. 2
Коэффициенты %'{
(верхняя строка) и
Таблица 32
, то, г) (нижняя строка) [119]
г
2
3
4
5
6
п
4,5
10
50
4
5
20
5
10
20
6
10
20
50
100
7
а = 0,90
0,7187
27,7780
0,7143
31,2500
0,7092
34,4830
0,7042
5,8820
0,7042
6,2500
0,6849
7,1430
0,7092
3,5710
0,6993
4,1660
0,6896
4,1660
0,7194
2,7780
0,7092
3,0300
0,7042
3,1250
0,6896
3,2260
0,6803
3,3330
0,7299
2,3810
а = 0,95
0,6097
58,8230
0,6024
66,1670
0,5952
66,1670
0,6329
8,3330
0,6211
9,0900
0,6060
10,0000
0,6452
4,5450
0,6289
5,2630
0,6173
5,5550
0,6622
3,4480
0,6452
3,7100
0,6329
4,0000
0,6250
4,0000
0,6135
4,1660
0,6803
2,7780
г
6
7
8
10
12
п
10
20
8
10
20
9
10
20
50
12
20
50
100
15
20
50
а = 0,90
0,7194
2,5190
0,7143
2,6310
0,7407
2,1280
0,7299
2,2220
0,7246
2,3250
0,7519
1,9610
0,7463
2,0410
0,7353
2,1280
0,7194
2,2220
0,7633
1,7860
0,7519
1,8520
0,7407
1,9230
0,7799
2,0000
0,7752
1,6660
0,7692
1,6950
0,7519
1,7540
а = 0,95
0,6622
2,9250
0,6536
3,1250
0,6896
2,4390
0,6803
2,6310
0,6667
2,7030
0,7042
2,2220
0,6944
2,3250
0,6944
3,4390
0,6666
2,5640
0,7143
2,0000
0,7042
2,0830
0,6896
2,1740
0,6803
2,2220
0,7299
1,8180
0,7246
1,8870
0,7042
1,9610
г
15
20
25
30
50
70
90
п
20
50
100
30
50
100
30
50
100
50
100
70
100
100
100
а = 0,90
0,7874
1,5620
0,7752
1,6130
0,7575
1,6670
0,8064
1,3500
0,8000
1,4920
0,7874
1,5150
0,8196
1,3510
0,8130
1,3890
0,8064
1,4280
0,8624
1,3330
0,8817
1,3700
0,8620
1,2340
0,8547
1,2500
0,8771
1,1900
0,8928
1,1490
а = 0,95
0,7463
1,6950
0,7299
1,7540
0,7143
1,8180
0,7633
1,5850
0,7576
1,6130
0,7463
1,6390
0,7936
1,4490
0,7752
1,4700
0,7692
1,5150
0,7692
1,4080
0,7874
1,4490
0,8333
1,2820
0,8264
1,2990
0,8547
1,2190
0,8772
1,1760
2.1.3.1.3.2. Оценки с помощью порядковых статистик
Предположим, что цензурирование заключается в отбрасывании из выбор-
выборки ri наименьших и г2 наибольших членов, а параметры /л и а оцениваются по
оставшимся (п — Г\ — г^) наблюдениям.
Наиболее просты в вычислительном отношении оптимальные линейные оцен-
оценки [118, 119]. Они находятся по формулам
где Xi — г~я порядковая статистика в выборке, упорядоченной по убыванию
(х\ ^ Х2 ^ • • • ^ хп); hi, k[ — коэффициенты оценки, табулированные в [118, 119].
Коэффициенты ki и к[ для выборки объема п = 10 приведены в табл. 34.
Очевидно, что таблицы для ki и к[ при различных сочетаниях п, 7*1 (гг) очень
громоздки и практически неприменимы. Поэтому рекомендуется использовать так
2.1]
Оценка параметров нормального распределения
129
Таблица 33
Коэффициенты 4#(о:, тг, г) (верхняя строка) и (— 1) • 4/#(о:, то, г) (нижняя строка) [119]
г
2
3
4
п
5
6
7
8
10
12
15
20
30
50
5
6
7
8
10
12
15
20
5
6
7
8
10
а
0,90
1,08
19,60
0,79
23,90
0,65
26,40
0,60
30,50
0,53
34,30
0,50
37,80
0,50
40,30
0,48
48,20
0,49
54,80
0,56
64,10
1,10
3,38
0,89
3,71
0,75
4,31
0,65
4,58
0,57
5,55
0,51
6,43
0,49
7,05
0,50
7,92
1,12
1,56
0,91
1,81
0,79
1,95
0,68
2,21
0,58
2,60
0,95
1,75
41,20
1,22
51,70
0,90
55,10
0,79
60,60
0,68
70,60
0,66
75,60
0,65
85,80
0,65
100,00
0,70
112,00
0,78
123,00
1,55
5,11
1,25
5,61
1,01
6,51
0,85
7,10
0,71
8,21
0,64
9,82
0,60
10,70
0,61
1,27
1,47
2,16
1,20
2,51
1,03
1,95
0,88
3,01
0,73
3,59
г
4
5
6
7
п
12
15
20
6
7
8
10
12
20
30
50
70
90
100
7
8
10
12
15
20
8
10
12
а
0,90
0,52
2,78
0,48
3,29
0,47
3,68
0,90
1,17
0,80
1,26
0,69
1,35
0,59
1,56
0,51
1,72
0544
2,31
0,46
2,80
0,50
3,40
0,52
3,84
0,57
4,11
0558
4,21
0,80
0,94
0570
0,98
0,60
1,11
0,52
1,20
0,46
1,42
0,43
1,65
0,71
0,81
0,61
0,88
0,53
0,96
0,95
0,64
3,86
0,53
4,61
0,57
5,10
1,16
1,54
1,03
1,67
0,90
1,85
0,75
2,11
0,63
2,33
0,53
3,19
0,55
3,78
0,59
4,62
0,64
5,21
0,69
5,47
0,70
5,66
1,02
1,21
0,89
1,28
0,75
1,46
0,65
1,58
0,56
1,86
0,51
2,17
0,88
1,04
0,76
1,12
0,66
1,12
г
7
8
10
12
15
п
15
20
10
12
15
20
30
50
12
15
20
30
50
70
90
100
15
20
30
25
35
50
70
а
0,90
0,46
1,09
0,41
1,25
0,61
0,74
0,53
0,80
0,46
0,88
0,41
1,03
0,38
1,25
0,40
1,56
0,53
0,62
0,47
0,66
0,39
0,75
0,36
0,89
0,36
1,11
0,39
1,30
0,41
1,44
0,42
1,45
0,46
0,55
0,39
0,60
0,33
0,68
0,34
0,49
0,31
0,55
0,38
0,66
0,32
0,75
0,95
0,56
1,40
0,49
1,63
0,77
0,94
0,66
1,12
0,56
1,13
0,49
1,35
0,45
1,63
0,47
2,00
0,67
0,78
0,57
0,83
0,47
0,95
0,42
1,12
0,43
1,41
0,47
1,65
0,49
1,80
0,50
1,90
0,57
0,68
0,47
0,75
0,40
0,86
0,41
0,62
0,37
0,69
0,35
0,81
0,37
0,94
г
15
20
25
30
40
50
п
90
100
40
50
70
90
100
35
50
70
90
100
50
70
90
100
50
70
90
100
70
90
100
а
0,90
0,33
0,85
0,34
0,89
0,28
0,42
0,27
0,47
0,27
0,54
0,28
0,59
0,29
0,61
0,29
0,34
0,25
0,37
0,24
0,42
0,25
0,46
0,25
0,48
0,24
0,31
0,23
0,34
0,23
0,37
0,24
0,39
0,24
0,26
0,21
0,27
0,20
0,28
0,20
0,29
0,20
0,23
0,19
0,23
0,18
0,24
0,95
0,40
1,05
0,40
1,12
0,34
0,52
0,32
0,59
0,32
0,66
0,34
0,73
0,34
0,76
0,35
0,41
0,36
0,45
0,28
0,51
0,29
0,57
0,30
0,59
0,28
0,38
0,27
0,42
0,27
0,45
0,28
0,47
0,28
0,32
0,25
0,32
0,24
0,34
0,24
0,35
0,24
0,27
0,22
0,28
0,22
0,29
5 А. И. Кобзарь
130
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 34
Коэффициенты ki (верхняя строка) и к[ (нижняя строка) для п = 10
7*1
' 1
0
1
2
3
4
0
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
2
3
4
5
6
3
4
5
4
i
1
0,1000
-0,2044
0,0843
-0,2364
0,0605
-0,2753
0,0244
-0,3252
-0,0316
-0,3930
-0,1240
-0,4919
-0,2923
-0,6520
-0,6598
-0,9625
-1,8634
-1,8608
-0,5877
-1,4678
-1,9000
-2,8960
2
0,1000
-0,1172
0,0921
-0,1314
0,0804
-0,1523
0,0636
-0,1758
0,0383
-0,2063
-0,0016
-0,2491
-0,0709
-0,3150
-0,2138
-0,4357
2,8634
1,8608
0,1884
-0,4034
0,7525
-0,4803
0,0942
-0,5842
-0,0043
-0,7959
-0,1866
-1,0120
-0,2918
2,9000
2,8960
3
0,1000
-0,0763
0,0957
-0,0851
0,0898
-0,0947
0,0818
-0,1058
0,0707
-0,1192
0,0549
-0,1362
0,0305
-0,1593
1,8734
1,3981
0,1036
-0,1074
0,0961
-0,1235
0,0846
-0,1440
0,0665
-0,1719
0,0351
-0,2145
1,6166
1,7595
0,2798
-0,7021
0,2050
-0,8898
0,0706
-1,1952
-0,2648
-1,7947
-1,3406
-3,5677
4
0,1000
-0,0436
0,0986
-0,0465
0,0972
-0,0488
0,0962
-0,0502
0,0962
-0,0501
0,0990
-0,0472
1,3327
1,1263
0,1040
-0,0616
0,1013
-0,0674
0,0979
-0,0734
0,0938
-0,0797
0,0892
-0,0859
0,1099
-0,0947
0,1038
-0,1101
0,0935
-0,1318
0,0735
-0,1688
2,3406
3,5677
0,3807
-1,2832
0,1871
-1,9791
-0,4747
-3,9511
5
0,1000
-0,0142
0,1011
-0,0110
0,1037
-0,0077
0,1089
-0,0006
0,1185
0,0111
0,9718
0,9243
0,1041
-0,0201
0,1057
-0,0166
0,1095
-0,0097
0,1179
0,0031
1,0623
1,2835
0,1103
-0,0310
0,1122
-0,0262
0,1178
-0,0144
1,1914
1,9635
0,1193
-0,0589
0,1198
0,0553
1,4847
3,9511
0,5000
-4,0761
6
0,1000
0,0142
0,1036
0,0215
0,1099
0,0319
0,1207
0,0469
0,7078
0,7576
0,1041
0,0201
0,1098
0,0325
0,1204
0,0514
0,7261
0,9844
0,1103
0,0310
0,1198
0,0549
0,7281
1,3415
0,1193
0,0559
0,6930
2,0344
0,5000
4,0761
7
0,1000
0,0436
0,1060
0,0559
0,1161
0,0722
0,5045
0,6107
0,1040
0,0616
0,1138
0,0827
0,4933
0,7599
0,1099
0,0947
0,4592
0,9711
0,3807
1,2832
8
0,1000
0,0763
0,1085
0,0937
0,3424
0,4746
0,1036
0,1074
0,3209
0,0572
0,2798
0,7021
9
0,1000
0,1172
0,2101
0,3423
0,1884
0,4034
10
0,1000
0,2044
2.1] Оценка параметров нормального распределения 131
называемые альтернативные оценки Гупты [137, 138], вычисляемые по формулам
где щ и bi —весовые коэффициенты, вычисляемые по формулам
_ ! &(ui -U) _ Ui-U
J2 (Ui - uf J2 (Ui - uf
Щ — математическое ожидание г-й порядковой статистики из стандартного нор-
нормального распределения;
Эффективность этой оценки составляет 0,96 -т- 0,98 от оптимальной линейной
при п > 10. Напомним, что для Щ может быть использована полезная аппроксима™
ция
Щ = 4,91(п + 0,25)^0'14 [(г - 0,375H'14 - (п - г + 0,625H'14].
В заключение приведем простую оценку для /i, предложенную Диксоном [139]:
"*П Г /V -I- IVt i 1 -I- т ^
^r -t- ij^r+i +жп^г;
i=2
где г = max(ri,r2).
Эффективность этой оценки не уступает эффективности оптимальной линейной
оценки.
Задача 48. Испытаны 15 приборов. При этом значения параметра — критерия годно-
годности зафиксированы у 10 приборов:
Xi: 1,1; 2,1; 2,4; 3,1; 3,5; 3,7; 4,2; 4,8; 5,9; 6,3,
а для остальных известно, что их наработка имеет большее значение. Необходимо
вычислить оценки максимального правдоподобия для /i и а.
ю ю
10 162 11
Находим Yxi = 37,1; Y xi = 162,11 иу= ^ и 0,59.
г^ ^1 2 - C7,1J
Для г/ = 0,59 из табл. 27 имеем z = —2?232, а из табл. 28 (интерполируя) имеем
g(z) ~ 0,439. Окончательно оценки равны
ю 10
s = 5^ ~ ' S(z) = ^^ * J2 Xi = 0^0439 * 37,1 = 1,628; х = 2,232 • 1,628 = 3,635.
Задача 49. Решить задачу 48, исходя из того, что степень усечения известна (пред-
полоэюим, она равна оценке h = по/п).
Пользуемся формулами для неполностью определенной выборки (см. раз™
10
10 J2 ж?
дел 2.1.3.1.2). Имеем у = — ^ = °'59-
132 Оценка параметров распределений вероятностей [Гл. 2
Оценку нормированной точки усечения z = f{h^y) находим из табл.29 (h = 0,333
и у = 0,59): z = /@,333; 0,59) = -0,631.
Далее из табл. 30 имеем ф(г) = 0,4355 и находим
l~h 1333 =1,17918.
h • ф(г) - A - /i) ¦ z 0,333 • 0,4355 + 0,6666 • 0,631
Окончательно, s = — • 37,1 • 1,17918 = 4,374; x = 0,631 • 4,374 = 2,756.
Разница в оценках является следствием отклонения истинной степени усечения от ее
оценки, полученной по малой выборке.
Задача 50. Для данных задачи 48 найти оценки /х и ст, исходя из того, что в выборке
объема п = 10 два наибольших наблюдения цензурированы.
Из условия задачи следует, что известны 8 значений:
Xi: 1,1; 2,1; 2,4; 3,1;; 3,53,7; 4,2; 4,8,
а два наибольших члена выборки E,9 и 6,3) из нее исключены (цензурированы).
Оценка максимального правдоподобия B.1.3.1.3.1)
1 8 24 5 1 8
Имеем п = 10, г = 8 и х = - • ]Г хг = —^- = 3,0625; s2 = - • ]Г(з^ - xf = 1,3523.
г=1 i=l
Далее h = ^—^ = 0,2 и 7 = о = ^^^ о = 0,4479.
10 ' ' (Жо _ жJ D,8 - 3,0625J
Из табл. 31 для 7 « 0,45 и /i = 0,2 имеем ifc@,2; 0,45) « 0,2872.
Тогда окончательно
Д = 3,0625 + D,8 - 3,0625) • 0,2875 = 0,5615;
а = [1,3523 + D,8 - 3,0625J • 0,2872] \ = 1,4897.
Найдем теперь двусторонний доверительный интервал при а = 0,95 для ц и а. Из табл. 32
находим значения х;@,95; 10,8) = 0,6944 и х/;@,95; 10,8) = 2,325 и далее вычисляем:
<т* = а • х = 1,4897 • 0,6944 = 1,0344; <т? = а • х" = 1,4897 • 2,325 = 3,4635,
т.е. 1,0344 ^ <т ^ 3,4635 с доверительной вероятностью 0,95.
Теперь из табл. 33 имеем ?;@,95; 10,8) = 0,77 и ?;/@,95; 10,8) = 0,94.
Следовательно,
(а1 = 3,5615 - 0,77 • 1,4897 = 2,414; /^ = 3,5615 + 0,94 • 1,4897 = 4,962,
и доверительный интервал равен 2,414 ^ /j, ^ 4,692 с вероятностью а, = 0,95.
Оценка с помощью порядковых статистик B.1.3.1.3.2)
В нашем случае Гг = 0;г2 = 2ип = 10. Из табл. 34 находим
кг = 0,0605; к2 = 0,0804; к3 = 0,0898; к4 = 0,0972;
к5 = 0,1037; к6 = 0,1099; к7 = 0,1161; к8 = 0,3224;
к'г = -0,2753; к'2 = ^0,1523; к'3 = -0,0947; к'А = -0,0488;
к'Б = -0,0077; к'6 = 0,0319; к'7 = 0,0722; к8 = 0,4746.
Далее имеем
8
fin = J2ki'Xi = °5°605 ' 1Д + 0,0804 • 2,1 + 0,0898 • 2,4 + 0,0972 • 3,1 + 0,1037 • 3,5 +
i=1 + 0,1099 • 3,7 + 0,1161 • 4,2 + 0,3424 • 4,8 = 3,6529;
(тп = -0,2753 • 1,1 - 0,1523 • 2,1 - 0,0947 • 2,4 - 0,0488 • 3,1 - 0,0077 • 3,5 +
+ 0,0319 • 3,7 + 0,0722 • 4,2 + 0,4746 • 4,8 = 1,671.
2.1] Оценка параметров нормального распределения 133
Рассмотрим простую оценку Диксона для /i (r = 2)
В заключение рассмотрим вычисление необходимых оценок с помощью оценок Гупты.
Предварительно вычислим математические ожидания необходимых порядковых стати-
статистик:
11г = 4,91 • A0,25H'14 • [A - 0,375H'14 - (п - 1 + 0,625H'14] =
= 3,5447-[A - 0,375H'14 - A0 - 1 + 0,625H'14] = 355447-@,6250'14 - 9,6250'14) = -1,54797;
U2 = -0,99874; U3 = -0,65329; U4 = -0,37392; U5 = 0,122032;
UQ = 0,122033; U7 = 0,37392; Us = 0,65329.
Далее вычисляем:
8
U = ^0,3833875; J2 (Ui ~ ^f = 29,967746.
i=l
Вычисляем коэффициенты оценки:
1 (-0,31833875) • (-1,54797 + 0,31833875) ПЛЛЛЛА
ai = 8 ^^S = °'1П94;
a2 = 0,11772293; a3 = 0,1214419; a4 = 0,1244092; a5 = 0,127085;
a6 = 0,1296779; a7 = 0,1323536; a8 = 0,1353213.
Таким образом, оценка равна
fin = 0,11194 • 1,1 + 0,11777 • 2,1 + 0,12144 • 2,4 + 0,124409 • 3,1 + 0,127085 • 3,5 +
+ 0,12968 • 3,7 + 0,132354 • 4,2 + 0,13532 • 4,8 = 3,17746.
134 Оценка параметров распределений вероятностей [Гл. 2
2.2. Оценка параметров экспоненциального распределения
Напомним, что плотность экспоненциального распределения вероятностей слу-
случайной величины описывается формулой
1 / х\
f(x;u) = -exp^--J, x ^ О,
где v — параметр распределения.
Экспоненциальное распределение широко применяется при анализе надежности
технических устройств. Поэтому представляет интерес оценка параметра экспо-
экспоненциального распределения применительно к различным планам испытаний на
надежность. В качестве оцениваемого параметра в этом случае рассматривается,
Л 1
как принято в теории наделености, интенсивность отказов А = —.
Для обозначения планов испытаний применяется 3-позиционный код, предло-
предложенный авторами работы [140]. Первая позиция кода обозначает число испытывав™
мых изделий (объем выборки). Вторая позиция — буква, указывающая, заменяются
ли при испытаниях отказавшие приборы или нет (В — заменяются; Б — не заменя-
заменяются). Третья позиция кодирует условия проведения испытаний (Т — испытания
ведутся в течение заданного времени Т; г — испытания ведутся до получения г
отказов). Например, код [15, Б, 2] означает, что оценка Л проводится по результатам
испытаний 15 приборов, без замены отказавших в процессе испытаний, до получения
двух отказов. Иногда используются смешанные планы. Например, [7V, В,(г,Т)] —
план, при котором N приборов испытываются с заменой отказавших до появления г
отказов, но не более времени Т.
2.2.1. Точечные оценки
2.2.1.1. Оценка максимального правдоподобия
Обозначим через d число изделий, отказавших за время проведения испыта-
испытаний Т. Тогда оценки параметра Л находятся по формулам [140]:
1 d л г-1 d
—, если tr > Т;
где tr — время наступления г~го отказа; t{ — наработка г-ro прибора до отказа.
Справедливы аппроксимации
при — ^ 0,1 и d ^ 10;
при 0,2 <^ 0,8.
Оценка параметров экспоненциального распределения
135
Далее
А
М,з,(г7Т)
если tr > T:
r-1
если tr
T.
-r)tr
2.2.1.2. Уточненная двухстадийная оценка
В [141] предлагается эффективная оценка параметра z/, основанная на двух-
стадийной процедуре. Оценка исходит из того факта, что величина
2пх
имеет
распределение х2 с / = 2п степенями свободы (п — объем выборки, х = —
г=1
Суть процедуры оценки заключается в следующем. На первой стадии рассма-
рассматривается предполагаемое значение щ. Далее, устанавливая приемлемый уровень
достоверности а, проверяем справедливость неравенства
X
2
2пх
<Х
где Х2(Р) ~~ /^^квантиль распределения %2 с / = 2п степенями свободы.
Если неравенство не отклоняется, то принимаются более точные оценки
2пх
Эффективность первой оценки в 2 + 2,5 раз выше обычной, второй — в 2 + 3,5 раз
(обычная оценка v = х).
2.2.1.3. Оценкм, основанные на порядковых статистиках
2.2.1.3.1. Оптимальная линейная оценка
Предположим, что имеет место двустороннее цензурирование, т. е. неизвестны
значения г\ наименьших и г2 наибольших членов выборки объема п. При г\ = г2 = О
будем иметь случай полной (нецензурированной) выборки.
Оптимальная линейная оценка находится по формуле [119]
жГ1+1+г2жп_Г2 +
где
n - ri - r2 - 1; m=
г=1
г=1
_ • ¦ i •
136
Оценка параметров распределений вероятностей
[Гл. 2
Здесь Xi—г-я порядковая статистика выборки (г-й по величине член выборки,
ранжированной по возрастанию х\ ^ х^ ^ . •. ^ хп); 7*1,7*2 —количества цензуриро™
к
ванных соответственно наименьших и наибольших наблюдений в выборке; ^ сц —
г=1
математическое ожидание к-й порядковой статистики в выборке объема п из нор-
нормированного экспоненциального распределения.
При п = Г2 = 0 оценка щ совпадает с оценкой максимального правдоподобия
г=1
При ri = 0 имеем щ =
+
, что совпадает с оценкой для
V )
плана испытаний [7V, Б, г] (при r^ = ^V — г, см. раздел 2.1.1). Иногда в выборке от-
отсутствует (цензурирована) часть центральных (средних по величине) выборочных
значений. Если известны только s наименьших и г наибольших членов выборки, то
оценка для v имеет вид [119]
щ =
где
/
s-l
г=1
п-г+1
\
n-r+l
i=s+l
ui
— г ¦
Е
г=1
г-г+1+г
n-r+l
Е-
i=s + l
л- - ¦ • - ¦ n-r+l
i=s+l
2.2.1.3.2. Оценка по одной порядковой статистике
Хартер [142] и Эпштейн [119] предложили оценку г/, основанную на одной
порядковой статистике хг (т.е. на одном r-м по величине наблюдении). Оценка
находится по формуле
Хг
Эпштейн показал, что эффективность этой оценки по сравнению с оценкой щ
г 2 г 1
больше 0,96 при — ^ - и 0,98 при — ^ -.
2.2.1.3.3. Оценка Эпштейна [119]
Если в выборке цензурированы (s — 1) наименьших членов, то оценка находится
по формуле
\
1
V = —
п
- s — п
L \ г=1
i=s+l
Оценка параметров экспоненциального распределения
137
При цензурировании (s — 1) наименьших и (г — 1) наибольших по величине
наблюдений оценка Эпштейна имеет вид
\
п — г + 1
1
+ s — п
+ У2 Xi + хп^г+\
2.2.1.3.4. Оценка Огавы [119]
Оценка Огавы позволяет произвести оценку параметра Л = 1/и экспоненциала
ного распределения по ограниченному числу порядковых статистик. Оценки рас™
к
смотрены в [142-151] и имеют вид i/0 = ]Р 6^Ж[пе.]+1, где к— количество порядковых
статистик, по которым производится оценка ([...]—целая часть числа); bi,ei —
коэффициенты оценки, приведенные в табл. 35.
Двумя наилучшими наблюдениями, по которым при к = 2 следует находить
оценку z/°, являются:
xn—i,xn при 4
п^45 ^п ПРИ 15 ^
п ^ 2; хп^2^хп при 7 ^ п ^ 5; жп^з5жп ПРИ 11 ^ тг ^ 8;
^ 12; xn^Q^ xn^i при 18 ^ п ^ 16; жп„7? хп-1 ПРИ 21 ^ n ^ 19.
Задача 51. Партия изделий объема N = 100 испытана на надежность с заме-
ной отказавших приборов в течение времени Т = 1000 ч, при этом наблюдались
d = 10 отказов. Найти оценку интенсивности отказов X.
Для плана испытаний [100, Л, Т = 1000] имеем
_ d _ 10
Aiv,B,T = ^^ = 100.1000
Задача 52. Найти оценку интенсивности отказов в условиях задачи 51, приняв, что
100 ч — это момент отказа 10-го изделия.
Имеем г = 10, tr = 1000 ч. Для плана [100, В, г = 10] получаем
у, ^
N -U
10-
100 • 1000
=9-10
Задача 53. Партия изделий объема N = 10 шт. была испытана на надежность в те-
течение 1000 ч без замены отказавших изделий. При этом были зафиксированы 5 отказов
в моменты времени (ч)
ti = 120, t2 = 170, t3 = 210, U = 250, t5 = 600.
Вычислить оценку интенсивности отказов.
Имеем план [10, Б, Т = 1000] и d = 5. Для него получаем
5
A20 + 170 + 210 + 250 + 600) + A0 - 5) • 1000
= 7,874-
Задача 54. Найти оценку интенсивности отказов в условиях задачи 53, если испы-
испытания приборов были завершены после получения Б-го отказа.
Находим
Xn б г = т ^—^ ч ; ч = 9,195 • 10^4 ч.
' ' A20 +170 + 210 + 250 + 600) + A0-5)-600
138
Оценка параметров распределений вероятностей
[Гл. 2
Я"
н
VD
Е-"
я
со
ю
со
см
о
оо
t>
СО
ю
со
см
т-Н
о
т-Н
г-
о
00
о
00
т—1
о
СМ
О)
т-Н
о
Is-
ю
о
СМ
о
г-
о
см
см
о
т-Н
Of)
СО
СМ
о
00
00
ю
СМ
о
Is-
см
00
СМ
о
Т-Ч
СМ
т-Н
СО
О
СЮ
Is-
СО
О
т—I
СО
СЛ
0О
О
т—I
ю
о
СО
О)
см
ю
о
со
00
СО
ю
о
on
СО
СЛ
Is-
о
т—1
СО
т-Ч
СО
т-Ч
О
СО
О
Is-
т-Ч
О
Is-
о
00
1—1
о
СО
СМ
СЪ
т—1
О
СО
Ю
О
СМ
О
ч—|
О
см
см
о
ю
Is-
СО
см
о
ел
Is-
ю
см
о
СЛ
т-Ч
Of)
см
о
00
о
т-Ч
СО
о
СО
CD
СО
О
Is-
о
СЛ
СО
О
I4-
Is-
О
см
00
см
ю
о
ю
Is-
см
СО
о
00
о
СМ
СО
о
00
СО
СО
О
ю
Of)
Ю
СО
О
О
1—1
0Г")
СО
О
со
СО
О
О
со
со
о
о
СО
т-Н
ю
ю
о
со
со
о
ю
о
СО
1—1
ю
Ю
о
см
о
со
о
о
ь-
со
СО
о
СЛ
т-Ч
t-
о
о
о
СО
00
о
со
со
см
СЛ
о
см
см
т-Ч
т-Ч
о
О)
Is-
т-Ч
о
т—1
ю
ю
т-Ч
о
Is-
см
СО
т-Ч
о
т-Ч
т-Ч
Is-
т—1
о
О)
о
о
см
о
СЛ
т-Ч
т-Ч
см
о
СЛ
о
о
см
о
СЛ
т-Ч
т-Ч
см
о
00
см
см
см
о
о
см
СО
см
о
т-Ч
со
СО
см
о
со
со
см
см
о
о
СЛ
Is-
т—1
о
Ю ^ СО
т—1 CM Tt
Ю (М СО
^ т-Ч Ю
о о о
Ю GO Ю
\ff CD О
t- СМ СЛ
^ т-Ч Ю
о о о
т-Ч СМ т-Ч
О т-Ч О)
О СО т-Ч
Ю т-Н СО
о о о
^ СО СМ
00 Ю О
СМ СО Ю
Ю т-Ч СО
о о о
СО (М т-Ч
О) О ^
Ю ^ 00
Ю т-Ч СО
о о о
СО СО СМ
^ ^ т-Ч
О) ^ СМ
Ю т-Ч Ь-
о о о
О СО СО
^ GO H
СО ^ CD
со т-ч ь-
о о о
СМ т-Ч СО
00 т-Ч т-Ч
ь- ю со
сонь
о о о
Ь Q Ь-
t- т-Ч ""ЧН
см ю о
Ь- т-ч оо
о о о
00 СМ 00
CM CJ Ь-
оо ^ as
Ь н оо
о о о
^ см ^
СО О СО
"чН ^ ^
00 т-Ч Си
о о о
ь- ю о
СО СЛ т-Ч
О т-Ч 00
ОН©
о о о
ю ю
ю ь-
СО Ь-
СЛ О
о о
СО Tf
т-Ч
ю
о
о
СО
Is-
о
т-Ч
о
СО
СЪ
о
т-Ч
о
т_н
т-Ч
т-Ч
т-Ч
о
см
т-Ч
т-Н
о
Is-
см
т-Ч
тН
о
ю
т-Ч
т-Ч
о
CD
т-Ч
т-Ч
т-Ч
о
см
Of)
о
т-Ч
о
см
о
О)
о
о
О)
о
Is-
о
о
О5
о
3
о
ю
о
СО
со
о
о
Of)
Of)
со
о
ю
т—1
It-
CD
т-Ч
О)
о
см
00
t-
о
т-Ч
Of)
т-Ч
00
о
т-Ч
ю
ю
00
о
00
см
ел
00
о
ь-
см
ел
о
т—1
со
со
ел
о
ю
00
Of)
О)
о
ю
О)
00
оо
о
о
ю
О)
00
о
о
со
СЪ
00
о
о
т-Ч
О)
0Г")
о
о
ю
Is-
00
о
о
Is-
00
о
о
ел
О)
Is-
о
о
ю
см
1^-
о
о
ю
т-Ч
со
о
о
со
ю
о
о
СО
см
о
о
СО
т-Ч
t-
о
CD
Of)
CD
t-
o
Is-
Oi
t-
o
Is-
CM
GO
о
CO
00
Ю
00
о
CD
Q)
00
GO
О
Ю
о
CM
о
CD
О)
О
CD
Is-
O5
О
Ю
CM
Oi
O5
о
CD
т-Ч
Is-
О
о
CO
CO
Is-
o
о
00
т-Ч
Is-
o
о
О)
CO
О
о
СЪ
ю
со
о
о
Is-
о
СО
о
о
со
СО
ю
о
о
00
СО
о
о
т-Ч
т-Ч
СО
О
о
со
ю
т-Ч
о
о
т-Ч
00
о
00
О
о
СО
00
О
СО
О
СО
00
о
Is-
(X)
00
О
о
т—|
CD
о
ев
ОО
О5
О
со
см
со
о
о
00
тН
00
о»
о
00
СИ
ел
о
1>
Is-
о
СО
о
о
Is-
00
ю
о
о
о
СО
ю
о
о
см
см
ю
о
о
см
Is-
о
о
Is-
о
о
о
см
СО
о
о
см
см
см
о
о
Is-
о
т-Ч
о
о
см
со
00
о
00
ю
00
00
о
т—1
СЪ
о
ел
о
Is-
1—1
со
О)
о
оо
см
ю
О)
о
ю
т-Ч
Is-
о
ю
со
00
О)
о
СО
со
О)
О)
о
00
со
00
о
о
00
ю
о
о
т—1
см
о
о
со
о
о
СО
т-Ч
СО
О
О
СО
см
о
о
со
т-Ч
о
о
со
Is-
о
о
о
СО
ю
о
ел
о
LO
ю
см
Oi
о
00
ел
о
ю
см
СО
ел
о
оо
Is-
Is-
О5
о
Is-
сл
00
ел
о
СО
г-
сл
ел
о
О)
о
00
со
о
о
СО
о
о
т-Ч
о
00
о
о
о
ю
см
о
о
т-Ч
О)
т-Ч
о
о
см
т-Ч
о
о
ю
ю
о
о
о
СО
00
со
ел
о
00
^t*
ю
CD
о
Is-
съ
со
ел
о
см
Of)
О)
о
о
см
(Л
ел
о
ел
Is-
сл
О)
о
о
ю
00
см
о
о
Is-
см
о
о
см
о
см
о
о
т-Ч
ю
1—1
о
о
Is-
сл
о
о
о
см
о
о
о
ю
см
СО
ел
о
см
ю
Is-
сл
о
00
ю
00
C7i
о
со
СО
СЪ
ел
о
сю
ел
ел
о
т-Ч
о
см
о
о
ю
со
т-Н
о
о
см
см
т-Ч
о
о
Is-
Is-
о
о
о
со
СО
о
о
о
ел
Is-
О)
о
ОО
Of)
00
ел
о
ел
ел
ел
о
Is-
00
СЪ
ел
о
см
ел
00
т-Ч
о
о
о
о
т-Ч
о
о
см
СО
о
о
о
со
см
о
о
о
СО
о
СЪ
ел
о
00
ю
ел
CD
о
о
СЪ
ел
ел
о
СО
СО
00
о
о
о
т—1
ю
о
о
о
т—|
см
о
о
о
ю
СО
СЪ
ел
о
т-Ч
ел
О)
ел
о
см
о
о
о
Is-
т—1
о
о
о
СО "^
ел т-ч
ел о
ел о
о о
ю
2.2] Оценка параметров экспоненциального распределения 139
Задача 55. Получена выборка значений экспоненциально распределенных величин xf.
10,1; 10,6; 11,2; 12,6; 13,4; 14,8; 15,9; 17,1; 19,1. Необходимо найти уточненную двухста-
дийную оценку параметра v = 1/Л (см. раздел 2.2.1.2).
Пусть предполагаемым значением и является щ = 15. Выбираем уровень достовер-
достоверности а = 0,95. Находим по табл. 55 или с помощью апппроксимаций (см. 1.1.8) при
/ = 2 • 10 = 20: х2 ( г ~ °?95 ) = Х2@,025) = 9,59 и Х2@,Э75) = 34,2.
Далее вычисляем
х=±±х> = 13,66 и ^ = 2013'66 = 18,2133.
Убеждаемся, что 9,59 < = 18,2133 < 34,2. Так как неравенство выполняется, вы™
числяем уточненные оценки:
Задача 56. Используя данные задачи 55, найти оценки параметра экспоненциального
распределения с помощью порядковых статистик.
Оптимальная линейная оценка B.2.1.3.2)
Рассматриваем вариант отсутствия цензурирования, т. е. когда п = г2 = 0. В этом
случае вычисляем:
1 1 2 1 /1
тп = а,\ = = —; I = п\ = —7?; с = I —
71 — 1 + 1 71 П \П
Следовательно,
1 Г/^2 \ п 1 1 п
xi + V хА = - • У" Xi = 13,66,
i^l \ n i^l
т. е. оценка совпадает с обычной оценкой максимального правдоподобия.
Предположим, что п = 2 первых и Г2 = 1 последних членов выборки цензурированы.
В этом случае имеем
™ = 2>; ' = ?«?; ^ = = ;
г=1 г=1
Тогда
Предположим теперь, что цензурированы (исключены из выборки) центральные ее
члены — известны только s = 3 первых члена и г = 4 наибольших члена. Для вычисления
оценки в этом случае найдем
,-r+l
?4 (?«*
У^ а2
140
Оценка параметров распределений вероятностей
[Гл. 2
Последовательно вычисляя, получаем
11 11
а4 =
п-4+ 1 7'
2
a4 =0,576876; ]Г а* = 0,1506859;
г=4 / г=4
0,576876
= 0,759523;
0,1506859
= 9,82833343
и окончательно
1
щ =
0,82833343
2
г=1
0,75952
= 20546177.
Оценка по одной порядковой статистике B.2.1.3.2)
Предположим, что оценка производится по 7-й порядковой статистике Х7.
Имеем
Ещ = V = — + - + ... + - = 1,09563492; i/7 = — = 13,508149.
^ n ~ i + 1 10 9 4 ' ' 1,09563492
г=1 г=1
Оценка Эпштейна B.2.1.3.3)
Предполож:им, что в выборке цензурированы 2 наименьших наблюдения (s — 1 = 2;
s = 3). Тогда получаем
X
3-10
= 0,1 х
111
. 10 + 9 + 8
- 7 • 11,2 + 11,8 + 12,6 + 13,4 + 14,8 + 15,9 + 17,1 + 19,1
= 12,626694.
Предположим, что в выборке цензурировано s — 1 = 2 наименьших и г — 1 = 2 наи-
наибольших наблюдений. Тогда оценка будет равна
п- 2
\
3- 10
¦Е--
г=4
• жз + 2^ жг + 3 •
= 15,120867.
Оценка Огавы B.2.1.3.4)
Будем искать оценку по четырем, оптимальным образом выбранным, порядковым
статистикам. Из табл. 35 для к = 4 находим:
?1 = 0,4514; е2 = 0,7419; е3 = 0,9067; е4 = 0,9810;
bi = 053907; Ь2 = 0,2361; Ь3 = 0,1195; Ь4 = 0, 0409.
Тогда для оценки отбираем порядковые статистики с номерами
[п • 0,4514] + 1 = 5; [п • 0,7419] + 1 = 7; [п • 0,9067] + 1 = 9; [п • 0,9810] + 1 = 10.
Оценка параметров экспоненциального распределения
141
Вычисляем оценку
и0 = 0,3907 • х5 + 0,2361 • х7 + 0,1195 • х9 + 0,0409 • х10 =
= 0,3907 • 12,6 + 0,2361 • 14,8 + 0,1195 • 17,1 + 0,0409 • 19,1 = 11,2417.
Если бы мы хотели произвести оценку по двум оптимально выбранным порядковым
статистикам, то ими должны быть х7 и %, для которых Ь\ = 0,5232 и 62 = 0,1790.
Тогда оценка равна и0 = 0,5232 • 14,8 + 0,1790 • 19,1 = 11,16226.
2.2.2. Интервальные оценки
Интервальная оценка параметра v (средняя наработка между отказами) при
доверительной вероятности а подсчитывается по формулам
2
Ху
2
ХУ
где х^—7™квантиль распределения хи^квадрат с f = 2п степенями свободы;
для двусторонней оценки и jf = a, jff = 1 — а для односто™
7 =
1 + а
-, 7 =
1-а
2 ' ' 2
ронней оценки.
На практике интервальные оценки записываются в форме
2пх
2пх
Xj/f
_
где ж =
1
Обычно используются табулированные коэффициенты оценок
2пх
Значения коэффициентов кш и кв для двусторонней интервальной оценки при
а = 0,90 и а = 0,95 приведены в табл. 36, заимствованной из [16].
Таблица 36
п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
а =
К
0,333
0,422
0,476
0,515
0,546
0,568
0,592
0,610
0,625
0,637
0,650
0,660
0,662
0,675
0,685
Значения коэффициентов кш ш
0,90
19,20
5,62
3,68
2,92
2,54
2,30
2,13
2,01
1,92
1,84
1,78
1,73
1,69
1,65
1,62
а =
К
0,270
0,360
0,420
0,455
0,480
0,515
0,535
0,555
0,575
0,585
0,598
0,610
0,620
0,630
0,640
0,95
К
28,60
9,20
4,80
3,70
3,00
2,73
2,50
2,32
2,19
2,09
2,00
1,93
1,88
1,82
1,79
п
16
17
18
19
20
25
30
40
50
70
100
200
300
500
а =
К
0,690
0,700
0,710
0,715
0,719
0,740
0,756
0,787
0,806
0,830
0,852
0,890
0,910
0,930
кш [16]
0,90
К
1,59
1,57
1,54
1,52
1,51
1,44
1,39
1,31
1,28
1,23
1,19
1,13
1,10
1,08
а =
К
0,645
0,655
0,660
0,665
0,675
0,700
0,720
0,750
0,770
0,800
0,830
0,870
0,895
0,915
0,95
К
1,75
1,71
1,69
1,66
1,64
1,55
1,48
1,40
1,35
1,28
1,23
1,16
1,12
1,09
142
Оценка параметров распределений вероятностей
[Гл. 2
По аналогии с точечными оценками интенсивности отказов (А = l/i/) для раз™
личных планов испытаний на надежность (см. раздел 2.2.1.1), приведем формулы
для интервальных оценок.
план[ЛМ?,Т]: AJ = Щ^; К = Ш>
NT
NT
где cfaJ c'^—коэффициенты, выражающиеся через квантили распределения Пуас-
Пуассона.
Значения коэффициентов cfa{d) и
Таблица 37
для « = 0,90 [140]
d
0
1
2
3
4
5
cf
0,05129
0535536
0,81769
1536632
1,87015
2,61301
с"
2,99573
4,74386
6,29579
7,75366
9,15352
10,51300
d
6
7
8
9
10
11
с'
3,28532
3,98082
4,69523
5,42541
6,16901
6,92421
с"
11,84240
13,14810
14,43460
15,70520
16,99220
18,20750
d
12
13
14
15
16
с1
7,68958
8,46394
9,24633
10,03590
10,83210
с"
19,44260
20,66860
21,88650
23,09710
24,30120
Значения коэффициентов cfa(d) и cf^(d) для доверительной вероятности а = 0,90
в зависимости от числа отказов d приведены в табл. 37, заимствованной из [140].
, г]:
А» = Щ
Значения коэффициентов с'а{г — 1) и с'^{г — 1) для а = 0,90 находятся по табл. 37
при d = г — 1.
[N,E,r]: XI = -г-^
"> Лп — Т
са(г-1)
где bfa(d) и bf^(d)—коэффициенты оценки, приведенные в табл.38 для а = 0,95
и различных N.
Для плана [N^ В^ (г^Т)] интервальные оценки А аналогичны оценкам плана
[N.B.T], если tr > Т, и плана [N,B,r], если tr < Т.
план [Ж, Б, (г, Т)]: А^ = ^^; А^ = ^^, tr > Т,
где bfa(d) и 6^(d)—коэффициенты, тождественные коэффициентам для плана
[N,B,T\.
При ^- < ОД планы [N,B,(r,T)] и [Ж, Б, (г, Г)], [N,B,r] и [TV, Б, г] практически
совпадают [140]. При < ОД практически совпадают планы [JV, Б, Т] и [7V, Б, Т].
В указанных условиях мо^но использовать одинаковые оценки для таких планов.
Для оценок, основанных на порядковых статистиках, укажем один результат —
величина Irv имеет распределение %2 с / = 2г степенями свободы. Если в выборке
объема п известны г младших наблюдений, а (п — г) старших наблюдений цензу™
Оценка параметров экспоненциального распределения
143
Таблица 38
Значения коэффициентов bfa{d) (нижняя строка)
и ba(d) (верхняя строка) для ос = 0,95 [140]
d
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
N
50
0,0733
0,0000
0,1126
0,0005
0,1475
0,0049
0,1809
0,0126
0,2136
0,0225
0,2461
0,0338
0,2785
0,0464
0,3111
0,0599
0,3441
0,0744
0,3774
0,0896
0,4130
0,1057
0,4457
0,1225
0,4808
0,1399
0,5166
0,1582
0,5532
0,1771
0,5907
0,1968
0,6292
0,2172
0,6687
0,1383
0,7094
0,2603
0,7513
0,2830
60
0,0615
0,0000
0,0936
0,0004
0,1225
0,0041
0,1499
0,0105
0,1767
0,0186
0,2032
0,0280
0,2295
0,0383
0,2558
0,0494
0,2823
0,0612
0,3089
0,0736
0,3358
0,0866
0,3630
0,1001
0,3905
0,1141
0,4185
0,1286
0,4469
0,1437
0,4758
0,1592
0,5052
0,1752
0,5352
0,1918
0,5658
0,2088
0,5970
0,2264
80
0,0461
0,0000
0,0701
0,0003
0,0915
0,0031
0,1117
0,0078
0,1314
0,0139
0,1507
0,0208
0,1697
0,0284
0,1887
0,0366
0,2077
0,0452
0,2267
0,0542
0,2458
0,0636
0,2649
0,0733
0,2842
0,0834
0,3036
0,0937
0,3232
0,1044
0,3429
0,1153
0,3629
0,1265
0,3831
0,1380
0,4036
0,1498
0,4243
0,1619
100
0,0369
0,0000
0,0560
0,0003
0,0730
0,0024
0,0890
0,0063
0,1045
0,0111
0,1197
0,0166
0,1347
0,0226
0,1496
0,0290
0,1643
0,0358
0,1791
0,0429
0,1938
0,0502
0,2085
0,0578
0,2234
0,0657
0,2383
0,0737
0,2536
0,0820
0,2683
0,0904
0,2834
0,0991
0,2986
0,1079
0,3140
0,1169
0,3295
0,1261
150
0,0246
0,0000
0,0373
0,0002
0,0485
0,0016
0,0590
0,0041
0,0692
0,0073
0,0791
0,0110
0,0889
0,0149
0,0985
0,0191
0,1080
0,0236
0,1175
0,0282
0,1269
0,0330
0,1361
0,0379
0,1457
0,0429
0,1551
0,0481
0,1644
0,0534
0,1738
0,0587
0,1832
0,0642
0,1927
0,0698
0,2021
0,0755
0,2116
0,0812
200
0,0184
0,0000
0,0279
0,0001
0,0363
0,0012
0,0422
0,0031
0,0517
0,0055
0,0591
0,0082
0,0663
0,0111
0,0734
0,0143
0,0804
0,0176
0,0874
0,0210
0,0943
0,0245
0,1012
0,0282
0,1081
0,0319
0,1149
0,0357
0,1218
0,0396
0,1286
0,0435
0,1354
0,0475
0,1423
0,0516
0,1491
0,0557
0,1559
0,0599
рированы, то оптимальная линейная оценка (см. раздел 2.2.1.3.1) имеет вид
\Xi + (n-r) хг
1
г/ = —
г
г=1
а интервальные оценки равны 0% = кш • г); i/^ = кв • ?, где кш и fcB — коэффициенты,
приведенные в табл. 36 (здесь вместо п в таблицу следует входить со значением г).
144 Оценка параметров распределений вероятностей [Гл. 2
Задача 57. Имеются результаты наблюдений над экспоненциально распределенной
величиной Xii 12,13,16,17,21,24,29,31,42,45,54 (п=11). Необходимо найти двусто-
двусторонний доверительный интервал для параметра v при доверительной вероятности
а = 0,95.
•^ п
Имеем х = - • J2 хг = 27,63636. В табл. 36 для п = 11 и а = 0,95 находим fcH = 0,598
и ks = 2,00. Тогда
ul = 0,598 • 27,63636 = 16,526; ifn = 2,00 • 27,63636 = 55,2727.
Следовательно, 95%-й доверительный интервал для параметра v равен
16,526 ^ v ^ 55,2727.
Задача 58. Партия электронных приборов объемом N = 100 шт. была испытана на
надежность с заменой отказавших приборов в течение 200 ч. При этом наблюдалось
d = 5 отказов. Необходимо найти двустороннюю 90%-ю оценку для интенсивности
отказов приборов.
Имеем план [100, .В, Т = 200]. По таблице 37 находим
c(d - 1) = с D) = 1,97015 и c'(d) = с/;E) = 10,5130.
Окончательно имеем
1,97015 5 10,51303 4
Л^ = = 9,8507 • 1и ; Л„ = = o.zooo • ill
100 -200 100 • 200
Следовательно, 90%-й доверительный интервал для интенсивности отказов равен
9,8507 • 10^5 ^ Л ^ 5,2565 • 10^4 ч^1.
Задача 59. Испытаны на надеэюность 100 приборов с заменой отказавших приборов.
При этом наблюдались 5 отказов и момент наступления последнего отказа равен
212 ч. Найти 90%-г! доверительный интервал для интенсивности отказов приборов.
Имеем план [100, В, г = 5] при tr = 212. Из табл. 37 получаем
с (г- 1) = с'D) = 1,97015 и с"(г- 1) = с'{А) = 9,15352.
Тогда
= 2,9701! = 16 . . = ^1535^ = 4
100-212 ' ' п 100-212
Следовательно, 9,29316 • 10^5 ^ А ^ 4,13698 • 10^4.
Задача 60. Решить задачу 59 при условии, что испытания проводились без заме-
замены отказавших приборов и моменты наступления отказов были (ч): t\ = 50, ?2 = 80,
t3 = НО, ?4 = 190 и U = 212.
Имеем из табл. 37 с {г - 1) = с D) = 1,97015 и с"(г - 1) = с"(А) = 9,15352.
Тогда
5
J2 U = 50 + 80 + 110 + 190 + 212 = 642;
= 9,4800 • КГ"; К = ^^ = 4,4045 ¦
' ' 642 + A00 5) 212 '
^9,4800 КГ; К ^^
642 + A00 - 5) ¦ 212 ' ' 642 + A00 - 5) ¦ 212
9,4800 ^ Л^ 4,4045 •
2.2] Оценка параметров экспоненциального распределения 145
Задача 61. Решить задачу 59 при условии, что испытания проводились без замены
отказавших приборов.
Находим для d = 5 и N = 100 из табл. 38: Ь'E) = 0,0166 и Ь" (Ъ) = 0,1197. Тогда
¦л-4
^ = 8,3.10-; Л- 2^1 = 5,985.10
8,3-10 ^ А ^ 5,985 • 10~4.
Задача 62. Были проведены испытания на безотказность десяти приборов. В ре-
результате были получены 7 отказов в моменты времени t%\ 10, 11, 13, 16, 18, 21, 29.
Необходимо найти 95%-й доверительный интервал для наработки на отказ.
1 \г 1
Имеем г = 7, п = 10 и ?> = - • ]Г ж» + A0 - 7) • 29 = 26,71428.
|_г= J
Далее из табл. 36 для п = г = 7 имеем fcH = 0,592 и fcB = 2,13.
Тогда
ul = 0,592 • 26,71428 = 15,8148; i/* = 2,13 • 26,71428 = 56,9014;
15,8148 <: и <С 56,9014.
146 Оценка параметров распределений вероятностей [Гл. 2
2.3. Оценка параметров распределения Вейбулла
Напомним основные формы распределения Вейбулла. Закон распределения слу-
случайной величины запиевшается либо в двухпараметрической форме
либо в трехпараметрической
Fix) = 1-ехр< - -
Оценке подлежат либо два параметра: а — параметр масштаба и /3 — параметр
формы, либо три, включая /i — параметр сдвига.
Известно, что случайная величина у = \пх имеет распределение наименьших
значений с функцией
F(y) = 1 — ехр < — ехр
Оценки параметров й и Ъ связаны с оценками а и /3 соотношениями /3 = —
Ъ
Поэтому на практике часто используется следующий прием. Обработкой ряда
величин \nxi оцениваются параметры й и Ь, а затем переходят к оценкам а и /3.
Особенность распределения Вейбулла — чрезвычайно богатое разнообразие форм
кривых распределения — обуславливает его широкое распространение в практике,
поэтому совершенствование методов оценки его параметров актуально. Обширный
обзор методов оценки параметров распределения Вейбулла приведен в [152].
2.3.1. Точечные оценки
2.3.1.1. Оценка максимального правдоподобия
При известном параметре формы /3 оценка для а имеет вид
Легко видеть, что при /3 = 1 имеем оценку a = —^2xii T-e- оценка совпадает
с оценкой для параметра экспоненциального распределения, что следует из факта
перехода распределения Вейбулла в экспоненциальное при /3 = 1 (см. раздел 1.1.5).
При неизвестном /3 совместные оценки максимального правдоподобия парамет-
параметров а и /3 являются решением системы уравнений
п
пар — 2_^ xi = О?
г=1
п ~| п
~о ~1~ 5^ "^П Xi ~~ ^0 5Z i ^П Xi = ^*
^ г=1 ° г=1
2.8]
Оценка параметров распределения Вейбулла
147
В общем случае эта система решается методом последовательных приближений.
Интересный метод ускоренного решения приведенной системы уравнений предло-
предложен в [153]. Система сводится к
Р п *
= 0.
г=1
Существование и единственность решения этой системы уравнений показаны в [152].
Система решается методом символических операторов [154] с начальным прибли™
жением /30, исходя из зависимости коэффициента вариации v от C. Точная завися™
мость f (/3), определяемая формулой
v =
±
- 1
достаточно просто аппроксимируется соотношением v = /3 °'93 или Cg = v 1'075 [155]
(при 1 ^ /3 ^ 50 ошибка менее 3%, при 1 ^ /3 ^ 25 — не более 0,4%).
В работе [153] предлагается оценка
где
г=1
^ - ± ) А - 1
г=1
г=1
г=1
г=1
По оценке p вычисляется оценка параметра а: а = — > a:^ .
2.3.1.2. Метод моментов
Метод моментов основан на приравнивании эмпирических моментов статисти-
статистического ряда их теоретическим значениям, являющимся функциями параметров
распределения. Зависимость моментов распределения Вейбулла от его параметров
очень сложна (включает в себя комбинацию гамма-функций). Поэтому чаще всего
пользуются заранее подготовленными таблицами. Одна из них воспроизведена
в табл. 39.
Порядок вычисления оценок а и /3 включает в себя последовательное вычисле™
1
ние x,s,v,/3 = v
- „-1,075
148
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 39
Зависимость параметра /3 распределеним Вейбулла
от коэффициента вариации v = s/x [44, 46]
V
3,14
2,93
2,75
2,57
2,40
2,24
2,08
1,94
Р
0,400
0,417
0,435
0,455
0,476
0,500
0,526
0,556
V
1,80
1,67
1,55
1,43
1,32
1,21
1,10
1,00
Р
0,588
0,625
0,667
0,714
0,769
0,833
0,909
1,000
V
0,910
0,837
0,775
0,723
0,681
0,640
0,605
0,575
1,10
1,20
1,30
1,40
1,50
1,60
1,70
1,80
V
0,547
0,523
0,496
0,480
0,461
0,444
0,428
0,365
1,90
2,00
2,10
2,20
2,30
2,40
2,50
3,00
Для трехпараметрического распределения оценка параметров а, /5 и ц методом
моментов рассмотрена в [156]. Авторами рассматривается система трех уравнений,
связывающих моменты распределения (аз — коэффициент асимметрии, s— средне™
квадратическое отклонение и х— среднее значение) с параметрами а, /3 и \х этого
распределения. Система имеет вид
«з =
¦ = a|l
Исполвзуются оценки
a = —-
n
S =
x = - T
Из зависимости а3 = f{f3) и можно найти оценку а3 и вычислить оценку J3. Распо™
лагая зависимостью s = /(а,/?) и зная /3, находим оценку а. Располагая значения-
значениями а и s, находим оценку /i. Значения необходимых для расчета величин «з? Р,
Ь и с приведены в табл. 40. Схема ввшислений включает в себя вычисление «з
по выборочным данным и определение по табл. 40 соответствующей оценки /3,
а также коэффициентов Ъ и с. Параметрвх аи \i оцениваются по формулам а = s • Ь;
/J, = X — SC.
Однако этот метод применим только при значительном объеме выборки, так
как при п ^ 30 точность выборочной оценки коэффициента вариации v мала, что
приводит к большим погрешностям при оценке параметров распределения. Более
точную оценку можно получить, воспользовавшись характеристической порядко-
порядковой статистикой, как методом моментного сравнения. Очевидно, что для х = ц:
F(x) = 1--= 0,632.
2.8]
Оценка параметров распределения Вейбулла
149
Таблица 40
Значения «з? /3, I/ и с, используемые при оценке параметров
распределения Вейбулла [156]
«3
-1,0
-0,9
^0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-ОД
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
Р
40,818
22,922
15,626
11,664
9,185
7,493
6,271
5,350
4,634
4,064
3,602
3,222
2,905
2,637
2,410
2,216
2,048
1,802
1,774
1,662
1,564
1,477
1,399
1,329
Ь1
32,827
18,858
13,153
10,046
8,094
6,755
5,780
5,039
4,456
3,986
3,599
3,274
2,997
2,759
2,551
2,368
2,206
2,060
1,929
1,811
1,703
1,605
1,515
1,432
с
32,381
18,417
12,717
9,617
7,672
6,341
5,375
4,464
4,073
3,616
3,243
2,933
2,673
2,452
2,262
2,097
1,954
1,828
1,717
1,618
1,530
1,452
1,381
1,316
«3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
1,267
1,211
1,160
1,115
1,073
1,035
1,000
0,968
0,939
0,911
0,886
0,863
0,841
0,821
0,803
0,785
0,769
0,753
0,739
0,725
0,712
0,700
0,688
0,677
У
1,355
1,284
1,219
1,158
1,102
1,049
1,000
0,954
0,911
0,871
0,833
0,798
0,765
0,734
0,704
0,677
0,650
0,626
0,603
0,581
0,559
0,540
0,521
0,503
с
1,258
1,205
1,157
1,113
1,072
1,035
1,000
0,968
0,938
0,911
0,884
0,860
0,837
0,816
0,796
0,787
0,759
0,743
0,727
0,712
0,697
0,684
0,671
0,658
Пусть Жо,б32п —порядковая статистика и г1 = 0,632(в + 1).
Тогда xr =
где г < г'. Рассмотрим систему
xR = а + /х,
откуда, приравнивая
G =
Xr- X
находим оценку /3, а затем а. = sbf и /х = хц — а.
Необходимые значения G, /5, b и Ь' приведены в табл. 41, заимствованной из ра™
боты [156]. Вычисляя выборочное значение G, находим по табл. 41 соответствующие
ему значения C и Ь;, затем вычисляем оценки а = sb' и /х = xr — а. Такая оценка
вдвое точнее, чем рассмотренная ранее.
150
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 41
Значения G, /3 и Ь' длм оценки параметров распределении Вейбулла [156]
G
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
1,000
1,024
1,049
1,074
1,101
1,127
1,155
1,184
1,214
1,245
1,278
Ъ'
1,000
1,034
1,068
1,103
1,139
1,175
1,212
1,250
1,288
1,328
1,368
G
0,11
0,12
0,13
0,14
0,15
0,16
0,17
0,18
0,19
0,20
0,21
Р
1,311
1,347
1,384
1,422
1,463
1,506
1,551
1,599
1,649
1,703
1,760
Ъ1
1,410
1,453
1,497
1,542
1,589
1,638
1,689
1,741
1,797
1,854
1,915
G
0,22
0,23
0,24
0,25
0,26
0,27
0,28
0,29
0,30
0,31
0,32
Р
1,821
1,887
1,958
2,034
2,117
2,208
2,307
2,417
2,539
2,675
2,829
У
1,978
2,045
2,117
2,193
2,274
2,361
2,455
2,557
2,669
2,793
2,931
G
0,33
0,34
0,35
0,36
0,37
0,38
0,39
0,40
0,41
0,42
0,43
3,005
3,207
3,445
3,728
4,072
4,502
5,057
5,808
6,895
8,636
11,966
Ъ'
3,085
3,262
3,365
3,705
3,992
4,347
4,801
5,409
6,279
7,660
10,283
2.3.1.3. Метод наименьших квадратов
Метод рассмотрен в [157]. Идея метода заключается в следующем. Если два ра-
раза прологарифмировать плотность распределения Вейбулла f(i) = ехр
то получим линейную зависимость вида у = с + Ъх. Оценки плотности вероятно-
вероятностей f(ti) получаются из выборочной гистограммы
где wij —частоты разрядов гистограммы; N — объем выборки.
Для рассматриваемого случая имеют место соотношения
j/ = lg[-lg/(*<)> x = kt; с =-0,3622-biga.
Число таких уравнений равно числу разбиений выборочной гистограммы (предпо-
(предположим, в нашем случае оно равно п). Для отыскания параметров с и b методом
наименьших квадратов необходимо решить систему уравнений
г=1
г=1
г=1
Искомые оценки определяются по формулам
г=1 i=l
г=1
г=1 г=1
Этот метод позволяет находить параметры распределения Вейбулла непосред-
непосредственно по статистической гистограмме, не затрачивая время на вычисление его
параметров по выборке. Отметим, что можно использовать и графические мето™
2.3] Оценка параметров распределения Вейбулла 151
ды, идея которых — графическая линеаризация функции распределения Вейбулла
путем введения логарифмической шкалв! аргумента и двойной логарифмической
шкалы функции:
lnx, -/ЗЫа, где F(xt) = ——-.
F(Xi)
Угловой коэффициент такой прямой является оценкой /3. Однако графический ме-
метод требует точных графических построений (особенно для значений /3 = 0,2 ^ 1,5).
Для устранения таких трудностей в [158] предложен графоаналитический метод,
однако и он может использоваться только для грубой оценки параметров распре-
распределения.
В [36] предложена еще одна простая, но достаточно эффективная оценка пара™
метров распределения Вейбулла. Как и ранее, имеем оценки коэффициента асим™
1
л п -п. 2
метрии и стандартного отклонения «з = —з /С (xi ~ •
~3 " ч " ' ' п
Оценки основанв! на аппроксимации
1=1
G = ГМ + -И « 1 - 0,427(/3 - l)^'9.
При /3^1 ошибка аппроксимации ^ 0,2%.
Оценки вв1числяются по формулам
/3 « 4,8(а3 + 1.23)-1-4; /3 = |; Д = ж - «5; <5 « fo,5 + 0,784/3 - 2^) s.
При 1,5 ^ /3 ^ 20 ошибка аппроксимации ^ 0,7% для /3 и < 0,2% для 5.
Для двухпараметрического распределения Вейбулла (когда заранее известно,
что /i = 0) оценки параметров /3 и а имеют вид
f 0,465^ + 1,282- - 0,7^ ; а = ^.
Р « f 0,465 + 1,282 0,7^ ; а = ^
Ошибка аппроксимации /5 в этом случае ^ 0,25% для /3 ^ 1,5.
2.3.1.4. Оценка с помощью квантилей
Обозначим через хр и xq соответственно р- и g-квантили распределения Вейбул™
ла (т. е. F(xp) = p и F(xq) = g). Тогда оценки параметров распределения Вейбулла
имеют вид [159]
^1?i a exp<
iHXp — iflXq I ill ttp — III Uq
где dp = — ln(l -р)ис!д=:- ln(l — g).
В [159] показано, что наиболвшая эффективноств оценки а достигается при
р = 0,398 и q = 0,821 (dp = 0,5074 ш dq = 1,7203), а /З^при р = 0,167 и q = 0,974
(dp = 0,1827 и dg = 3,6496).
Рекомендуется для совместной оценки параметров а и /3 использовать квантили
уровней р = 0,2 и 0,95 (в этом случае эффективность оценок не менее 60% по сравне-
сравнению с оценками максимального правдоподобия (см. раздел 2.3.1.1) при всех оси. р).
152 Оценка параметров распределений вероятностей [Гл. 2
Окончательно рекомендуемые оценки имеют вид
/3 = -2,5973In ^^; а = ехр@,42241пж0 95).
Жо,2 '
Квантиль жо,95 оценивается порядковой статистикой Ж[о,о5п]+ь а жо,2 — соответ-
соответственно Ж[0;8п]+ъ гДе [• • •] —целая часть числа, заключенного в скобках.
2.3.1.5. Оценки, основанные на порядковых статистиках
Такие оценки наиболее эффективны в обычной практике оценки надежности
изделий по данным о наработке первых г отказавших приборов из общего числа п
испытываемых. В прикладной математической статистике такая задача формули-
формулируется как задача оценки параметров распределения вероятностей по цензуриро-
ванной сверху выборке (при оценке не учитываются (п — г) наибольших по величине
членов выборки).
Оценки для цензурированных выборок, основанные на линейной комбинации
порядковых статистик (простые линейные оценки), рассмотрены в [160—164]. В [165]
рассмотрена задача оценки параметров распределения Вейбулла при прогрессив™
ном цензурировании, когда часть изделий снимается с испытаний после каждого
отказа.
Мы рассмотрим наиболее простые для практического применения и достаточно
эффективные наилучшие линейные оценки.
Напомним, что если случайная величина х имеет двухпараметрическое распре™
деление Вейбулла с функцией F(x) = 1 — ехр< — | — J >, то случайная величина
у = In х будет иметь распределение наименьших значений с функцией
Суть метода заключается в поиске параметров распределения величины In х (й и Ъ)
в форме
с последующим переходом к оценке параметров распределения исходной величи-
величины х (не следует забывать, что оценка проводится по первым г наблюдениям из
выборки объема п).
Оценки й и Ь являются смещенными, и для исключения смещения используются
поправки, с учетом которых несмещенные оценки равны
u*=u + b*fci; S* = ^—.
1
Значения коэффициентов a,i,Ci,ki и &2 приведены в табл. 42 и 43, заимствованных
из [95].
2.3.1.6. Оценка параметров распределения Рэлем
(частный случай распределения Вейбулла)
Распределение Рэлея (см. раздел 1.1.15) является частным случаем распределе-
распределения Вейбулла при /3 = 2. Значение /3 = 2 является граничным между регулярным
и нерегулярным случаями распределения Вейбулла и заслуживает отдельного рас™
смотрения. Достаточно полно это сделано в [166].
2.3]
Оценка параметров распределения Вейбулла
153
Таблица 42
п
2
3
3
4
4
4
5
5
5
5
6
6
6
6
6
7
г
2
2
3
2
3
4
2
3
4
5
2
3
4
5
6
2
i
1
2
1
2
1
2
3
1
2
1
2
3
1
2
3
4
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
Значения коэффициентов
щ
0,110731
0,889269
-0,166001
1,166001
0,081063
0,251001
0,667936
-0,346974
1,346974
-0,044975
0,088057
0,956918
0,064336
0,147340
0,261510
0,526813
-0,481434
1,481434
-0,137958
-0,025510
1,164680
-0,006983
0,059652
0,156664
0,790668
0,052975
0,103531
0,163808
0,246092
0,433593
-0,588298
1,588298
-0,211474
-0,112994
1,324468
-0,063569
-0,006726
0,079882
0,990412
0,007521
0,048328
0,101608
0,172859
0,669685
0,048826
0,079377
0,117541
0,163591
0,226486
0,368179
-0,676874
1,676874
Ci
-0,421383
0,421383
-0,452110
0,452110
-0,278666
-0,190239
0,468904
-0,465455
0,465455
-0,297651
-0,234054
0,531705
-0,203052
-0,182749
-0,070109
0,455910
-0,472962
0,472962
-0,306562
-0,257087
0,563650
-0,217766
-0,199351
-0,118927
0,536044
-0,158131
-0,155707
-0,111820
-0,005600
0,431259
-0,477782
0,477782
-0,311847
-0,271381
0,583229
-0,225141
-0,209083
-0,146386
0,580610
-0,169920
-0,166319
-0,129510
-0,054453
0,520201
-0,128810
-0,132102
-0,111951
-0,064666
0,031796
0,405733
-0,481140
0,481140
п
7
7
7
7
7
8
8
8
8
8
8
г
3
4
5
6
7
2
3
4
5
6
7
ai и
г
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
Ci [95]
щ
-0,272195
-0,184061
1,456255
-0,110274
-0,060226
0,018671
1,151829
-0,030368
0,004333
0,052957
0,117599
0,855480
0,013524
0,041588
0,075499
0,117461
0,172092
0,579835
0,038743
0,064086
0,090785
0,120971
0,157657
0,207825
0,319934
-0,752513
1,752513
-0,323875
-0,243808
1,566830
-0,149973
-0,105015
-0,032257
1,287245
-0,062656
-0,032248
0,012767
0,072446
1,009691
-0,013509
0,010292
0,041357
0,080475
0,130327
0,751058
0,015973
0,036729
0,060439
0,088239
0,122062
0,165529
0,511030
Ci
-0,315369
-0,281139
0,596507
-0,229691
-0,215611
-0,164168
0,609472
-0,176203
-0,172398
-0,141218
-0,082820
0,572640
-0,138436
-0,140342
-0,121821
-0,082994
-0,015394
0,498931
-0,108323
-0,113479
-0,103569
-0,078748
-0,032632
0,054727
0,382022
-0,483616
0,483616
-0,317890
-0,288231
0,606120
-0,232805
-0,220324
-0,176675
0,629805
-0,180231
-0,176510
-0,149566
-0,101642
0,607948
-0,143834
-0,145006
-0,128393
-0,095696
-0,043280
0,556209
-0,116317
-0,120331
-0,110582
-0,088450
-0,050995
0,009700
0,476975
154
Оценка параметров распределений вероятностей
[Гл. 2
Продолжение таблицы 42
п
8
9
9
9
9
9
9
9
9
'Г
8
2
3
4
5
6
7
8
9
г
1
2
3
4
5
6
7
8
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
0,034052
0,053552
0,073452
0,095062
0,119768
0,149934
0,191236
0,282943
-0,818444
1,818444
-0,368833
-0,296280
1,664113
-0,184461
-0,143505
-0,075815
1,403781
-0,907260
-0,063541
-0,021495
0,034259
1,141604
-0,037118
-0,016377
0,012499
0,049305
0,095614
0,896078
-0,004220
0,013386
0,035068
0,061198
0,093013
0,153879
0,647676
0,016797
0,032919
0,050582
0,070497
0,093635
0,121560
0,157175
0,456836
0,030338
0,048720
0,061368
0,077742
0,095769
0,116517
0,141932
0,176764
0,253697
-0,093270
-0,098886
-0,093994
0,079752
-0,053918
-0,010179
0,069325
0,360675
-0,485517
0,485517
-0,319786
-0,293621
0,613407
-0,235080
-0,223891
-0,185970
0,644941
-0,183061
-0,179515
-0,155825
-0,115133
0,633534
-0,147411
-0,148150
-0,133219
-0,105060
-0,062073
0,595913
-0,120988
-0,124245
-0,115091
-0,095508
-0,064162
-0,038125
0,558119
-0,100011
-0,104750
-0,099608
-0,086226
-0,063541
-0,028346
0,026525
0,455956
-0,081777
-0,087308
-0,085084
-0,076470
-0,060667
-0,035136
0,006001
0,078828
0,341614
п
10
10
10
10
10
10
10
10
10
г
2
3
4
5
6
7
8
9
10
г
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
щ
-0,876869
1,876869
-0,408602
-0,340443
1,749045
-0,214930
-0,177223
-0,113820
1,505973
0,115524
-0,090868
-0,511341
0,000925
1,256809
-0,058017
-0,039595
-0,012513
0,022314
0,065750
1,022062
-0,022198
-0,006900
0,013224
0,037994
0,068153
0,105164
0,804572
0,001179
0,014889
0,030998
0,049734
0,071745
0,096114
0,130649
0,602692
0,016841
0,029807
0,043570
0,058640
0,075576
0,095169
0,118707
0,148575
0,413116
0,027331
0,040034
0,052496
0,065408
0,079263
0,094638
0,112414
0,134239
Ci
-0,487022
0,487022
-0,321265
-0,297858
0,619124
-0,236817
-0,226688
-0,193159
0,656663
-0,185169
-0,181821
-0,160698
-0,125311
0,652997
-0,149985
-0,150451
-0,136941
-0,112224
-0,075721
0,625321
-0,124170
-0,126894
-0,118392
-0,100924
-0,073988
-0,035501
0,579868
-0,104082
-0,108163
-0,103119
-0,090835
-0,070902
-0,041560
-0,000799
0,517864
-0,087358
-0,092405
-0,089839
-0,081428
-0,066855
-0,044670
-0,011816
0,038159
0,436394
-0,072734
-0,077971
-0,077242
-0,071876
-0,061652
-0,045420
-0,020698
0,017927
2.3]
Оценка параметров распределения Вейбулла
155
г?
10
11
11
11
11
11
11
11
11
11
г
10
2
3
4
5
6
7
8
9
10
7
9
10
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
а2
0,164178
0,230001
-0,929310
1,920310
-0,444245
-0,380642
1,824887
-0,242206
-0,207204
-0,147490
1,596900
-0,137718
-0,115110
-0,077762
-0,028411
1,359000
-0,076739
-0,060142
-0,034581
-0,001490
0,039518
1,133434
-0,038349
-0,024842
-0,005964
0,017632
0,046354
0,081182
0,923987
-0,012943
-0,001050
0,013869
0,031661
0,052723
0,077815
0,108161
0,729765
0,004425
0,015498
0,028023
0,042178
0,058340
0,077093
0,099349
0,126592
0,548502
0,016502
0,027205
0,038291
0,050160
0,063170
0,077772
с?
0,085070
0,324597
-0,488243
0,488243
-0,322452
-0,301277
0,623620
-0,238188
-0,228941
-0,198888
0,666017
-0,186803
-0,183651
-0,164597
-0,133278
0,668329
-0,151936
-0,152221
-0,139907
-0,117886
-0,086131
0,648081
-0,126507
-0,128838
-0,120951
-0,105219
-0,081602
-0,048929
0,612047
-0,106922
-0,110498
-0,105662
-0,094405
-0,076693
-0,051525
-0,016860
0,562564
-0,091115
-0,095437
-0,092780
-0,084833
-0,071581
-0,052182
-0,024880
0,013606
0,499202
-0,077717
-0,082449
-0,081388
-0,075977
-0,066222
-0,051429
п
11
11
12
12
12
12
12
12
12
12
П]
г
10
11
2
3
4
5
6
7
8
9
зодолжение таблицы 42
г
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
0,094625
0,114811
0,140333
0,377130
0,024850
0,035456
0,045727
0,056215
0,067261
0,079220
0,092560
0,108034
0,127068
0,153197
0,210412
-0,976872
1,976872
-0,476530
-0,416836
1,893367
-0,266888
-0,234180
-0,177681
1,678749
-0,157792
-0,136684
-0,101445
-0,054640
1,450761
-0,093679
-0,078561
-0,054320
-0,022769
0,016136
1,233193
-0,052987
-0,040893
-0,023072
-0,000515
0,026930
0,059918
1,030620
-0,025785
-0,015312
-0,001353
0,015634
0,035853
0,059835
0,088444
0,842684
-0,006944
0,002669
-0,030120
0,000537
0,044638
0,418384
-0,065444
-0,070318
-0,070456
-0,067076
-0,060207
-0,049300
-0,033156
-0,009427
0,026879
0,089148
0,309357
-0,489254
0,489254
-0,323426
-0,304093
0,617519
-0,239300
-0,230796
-0,203562
0,673657
-0,188109
-0,185012
-0,167790
-0,136930
0,680734
-0,053471
-0,153632
-0,142329
-0,122474
-0,094355
0,666261
-0,128308
-0,130339
-0,123007
-0,108712
-0,087681
-0,059256
0,637304
-0,109045
-0,112224
-0,107627
-0,097276
-0,081361
-0,059315
-0,029900
0,596748
-0,093658
-0,097540
156
Оценка параметров распределений вероятностей
[Гл. 2
т?
12
12
12
12
13
13
13
13
г
9
10
11
12
2
3
4
5
7
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
12
1
2
1
2
3
1
2
3
4
1
2
3
0,014239
0,027669
0,043189
0,061225
0,082441
0,107856
0,667655
0,006411
0,015598
0,025675
0,036799
0,049211
0,063256
0,079438
0,098522
0,121752
0,503338
0,015982
0,024997
0,034156
0,043790
0,054149
0,065515
0,078264
0,092958
0,110521
0,132666
0,347003
0,022771
0,031776
0,040408
0,049122
0,058175
0,067800
0,078281
0,090017
0,103664
0,120475
0,143566
0,193947
-1,020378
2,020378
-0,506031
-0,449735
1,955765
-0,289420
-0,258687
-0,205024
1,753131
-0,176109
-0,156637
-0,122893
с?
-0,094893
-0,087448
-0,075374
-0,058180
-0,034802
-0,003342
0,545234
-0,080881
-0,085171
-0,083952
-0,078714
-0,067610
-0,056237
-0,037675
-0,012272
0,022956
0,481555
-0,069798
-0,074285
-0,074131
-0,070617
-0,063891
-0,053621
-0,039034
-0,018715
0,009948
0,052280
0,401864
-0,059449
-0,063952
-0,064601
-0,062489
-0,037754
-0,050137
-0,039010
-0,023199
-0,000505
0,033696
0,091751
0,295648
-0,490105
0,490105
-0,324239
-0,306454
0,630694
-0,240219
-0,232349
-0,207450
0,630018
-0,189177
-0,186381
-0,170454
п
13
13
13
13
13
13
13
П]
г
5
6
7
8
9
10
11
зодолжение таблицы 42
г
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
-0,078337
1,533976
-0,109187
-0,092014
-0,076615
-0,041997
-0,004940
1,323488
-0,066358
-0,055414
-0,038503
-0,016879
0,009416
0,040810
1,126930
-0,037540
-0,028206
-0,015049
-0,001123
0,020686
0,043677
0,070830
0,944372
-0,017389
-0,008934
0,001863
0,014684
0,029637
0,047027
0,067346
0,091328
0,774437
-0,002927
0,005067
0,014356
0,024891
0,036816
0,050389
0,065995
0,084201
0,105863
0,615348
0,007628
0,015408
0,023732
0,032743
0,042611
0,053556
0,065876
0,080005
0,096594
0,116703
-0,144971
0,690983
-0,172412
-0,168148
-0,144215
-0,101104
-0,001512
0,711124
-0,129743
-0,131538
-0,124701
-0,111609
-0,092649
-0,067475
0,657714
-0,110704
-0,113563
-0,109206
-0,099644
-0,085204
-0,065581
-0,039995
0,623896
-0,095590
-0,099109
-0,096521
-0,089554
-0,078490
-0,063068
-0,046607
-0,015928
0,580865
-0,083170
-0,087085
-0,085792
-0,080789
-0,072325
-0,060181
-0,043768
-0,022048
0,006715
0,528441
-0,072617
-0,076746
-0,076418
-0,072938
-0,066531
-0,057014
-0,043886
-0,026244
-0,002552
0,029910
2.3]
Оценка параметров распределения Вейбулла
157
п
13
13
13
14
14
14
14
14
14
г
11
12
13
2
3
4
5
6
7
г
11
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
щ
0,465143
0,015382
0,023100
0,030818
0,038824
0,047302
0,056444
0,066482
0,077739
0,090699
0,106166
0,125627
0,321416
0,021005
0,028757
0,036127
0,043501
0,051078
0,059028
0,067533
0,076831
0,087274
0,099441
0,114446
0,135068
0,179913
-1,060461
2,060461
-0,533185
-0,479874
2,013059
-0,310144
-0,281132
-0,229990
1,821266
-0,192947
-0,174709
-0,142478
-0,099930
1,610065
-0,123352
-0,110490
-0,088443
-0,059523
-0,024111
1,405919
-0,078656
-0,068666
-0,052554
-0,031776
-0,006522
0,023467
0,465037
-0,063288
-0,067492
-0,067892
-0,065622
-0,060887
-0,053540
-0,043158
-0,028970
-0,009644
0,017233
0,056547
0,386713
-0,054436
-0,058585
-0,059535
-0,058259
-0,054942
-0,049472
-0,041504
-0,030980
-0,015037
0,006644
0,038943
0,093324
0,283257
-0,490831
0,490831
-0,324929
-0,308462
0,633391
-0,240982
-0,233670
-0,210735
0,685397
-0,190068
-0,187427
-0,172710
-0,149393
0,699598
-0,155736
-0,155747
-0,146054
-0,120460
-0,106556
0,693553
-0,130915
-0,132521
-0,126123
-0,114051
-0,096788
-0,074184
п
14
14
14
14
14
14
14
П
г
7
8
9
10
11
12
13
родолжение таблицы 42
г
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
12
1
ai
1,214708
-0,048365
-0,039964
-0,027495
-0,011849
0,006905
0,029002
0,054897
1,036868
-0,027030
-0,019516
-0,009363
0,002928
0,017368
0,034165
0,053685
0,076476
0,871287
-0,011580
-0,004548
-0,004548
0,014100
0,025647
0,038794
0,053879
0,071335
0,091783
0,716445
-0,000170
0,006622
0,014283
0,022800
0,032273
0,042866
0,054817
0,068463
0,084290
0,103025
0,570731
0,008361
0,015058
0,022076
0,029552
0,037615
0,046411
0,056132
0,067039
0,079506
0,094096
0,111723
0,432431
0,014760
Ci
0,674581
-0,112041
-0,114637
-0,110509
-0,101635
-0,088422
-0,088422
-0,048074
0,640520
-0,097117
-0,100334
-0,097827
-0,091298
-0,081103
-0,067124
-0,048921
-0,025720
0,609445
-0,084931
-0,088528
-0,087207
-0,082451
-0,074573
-0,063473
^0,048768
-0,029776
-0,005398
0,565101
-0,074686
-0,078499
-0,078064
-0,074680
-0,068624
-0,059816
-0,047926
-0,032355
-0,012126
0,014349
0,512429
-0,065816
-0,069728
-0,099620
-0,067659
-0,063070
-0,056130
-0,046558
-0,033834
-0,017101
0,005064
0,035156
0,449638
-0,057849
158
Оценка параметров распределений вероятностей
[Гл. 2
т?
14
14
16
16
16
16
16
16
г
13
14
2
3
4
5
6
7
7
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
а2
0,021453
0,028054
0,034842
0,041933
0,049474
0,057619
0,066569
0,076605
0,088151
0,101914
0,119200
0,299416
0,019487
0,026238
0,032614
0,038941
0,045399
0,052097
0,059168
0,066767
0,075102
0,084482
0,095428
0,108942
0,127523
0,167807
-1,123243
2,132243
-0,581757
-0,533457
2,115214
-0,347172
-0,321026
-0,274186
1,942384
-0,223015
-0,206788
-0,177158
-0,138048
1,745009
-0,148725
-0,137508
-0,117232
-0,090481
-0,057883
1,551828
-0,100621
-0,092121
-0,077354
-0,058057
-0,034624
-0,007020
с?
-0,061764
-0,062506
-0,061704
-0,057693
-0,052317
-0,044707
-0,034420
-0,020713
-0,002338
0,022943
0,059643
0,372795
-0,050186
-0,054008
-0,055130
-0,054419
-0,052075
-0,048606
-0,042197
-0,034099
-0,022315
-0,008285
0,012430
0,043015
0,094166
0,272004
-0,492005
0,492005
-0,326035
-0,311694
0,637730
-0,242220
-0,235794
-0,215984
0,693998
-0,191470
-0,189099
-0,176323
-0,156390
0,713282
-0,157331
-0,157263
-0,148785
-0,134532
-0,115196
0,713108
-0,132718
-0,134040
-0,128381
-0,117942
-0,103296
-0,084506
п
16
16
16
16
16
16
16
П
г
7
8
9
10
11
12
13
родолжение таблицы 42
г
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
12
1
1,369798
-0,067719
-0,060754
-0,049415
-0,034868
-0,011736
0,003178
0,026973
1,199963
-0,044303
-0,038218
-0,029094
-0,017697
-0,004166
0,011570
0,028712
0,050576
1,041619
-0,027135
-0,021550
-0,013895
-0,004646
0,006132
0,018515
0,032675
0,048869
0,067459
0,893576
-0,014263
-0,008950
-0,002286
-0,002286
0,005469
0,014703
0,024296
0,035593
0,048404
0,063020
0,079847
-0,004450
0,000732
0,006721
0,013424
0,020868
0,029314
0,038344
0,048668
0,060342
0,073692
0,089173
0,623351
0,003118
0,700883
-0,114069
-0,116260
-0,112545
-0,104798
-0,093508
-0,078726
-0,060251
0,680158
-0,099396
-0,102138
-0,099811
-0,094037
-0,085242
^0,073467
-0,058535
^0,040084
0,652711
-0,087496
-0,090585
-0,089277
-0,084992
-0,078105
-0,068653
-0,056482
-0,041268
-0,022503
0,619360
-0,077597
-0,080895
-0,080349
-0,077313
-0,071820
-0,064207
-0,054237
-0,041635
-0,025917
-0,006432
0,580293
-0,069172
-0,072584
-0,072615
-0,070383
-0,066184
-0,060054
-0,051876
-0,041398
-0,028216
-0,011716
-0,009035
0,535164
-0,061843
2.3]
Оценка параметров распределения Вейбулла
159
п
16
16
16
16
г
13
14
15
16
г
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
щ
0,008356
0,013789
0,019747
0,026189
0,033196
0,040872
0,049357
0,058836
0,069568
0,081920
0,096438
0,498713
0,008992
0,014141
0,019370
0,024804
0,030525
0,036615
0,043164
0,050284
0,058124
0,066884
0,076854
0,088469
0,102433
0,379341
0,013547
0,018743
0,023778
0,028849
0,034060
0,039489
0,045218
0,051338
0,057965
0,065253
0,074425
0,082818
0,093994
0,107995
0,263528
0,017016
0,022284
0,027208
0,032046
0,036918
0,041887
0,047042
0,052455
0,058216
0,064444
0,071304
Ci
-0,065297
-0,065770
-0,064259
-0,061031
-0,056120
-0,049427
-0,040731
-0,029675
-0,015710
0,002010
0,024833
0,483018
-0,055309
-0,058750
-0,059563
-0,058635
-0,056208
-0,052317
-0,046867
-0,039699
-0,030467
-0,018695
-0,003625
-0,015969
0,042224
0,421953
-0,049291
-0,052670
-0,053739
-0,053290
-0,051538
-0,048520
-0,044164
-0,038307
-0,030678
-0,020850
-0,008156
0,008503
0,031075
0,063476
0,348149
-0,043375
-0,046633
-0,047890
-0,047839
-0,046675
-0,044432
-0,041053
-0,036402
-0,030249
-0,022230
-0,011772
п
16
18
18
18
18
18
18
18
18
18
П]
г
16
2
3
4
5
6
7
8
9
10
зодолжение таблицы 42
г
12
13
14
15
16
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
щ
0,079051
0,088111
0,099315
0,114733
0,147977
-1,195128
2,195128
-0,624252
-0,580008
2,204260
-0,379529
-0,355679
-0,312382
2,047590
-0,249266
-0,234618
-0,207148
-0,170883
1,861914
-0,170868
-0,160910
-0,142100
-0,117175
-0,086906
1,677960
-0,119793
-0,112406
-0,098738
-0,080698
-0,058807
-0,033165
1,503605
-0,084626
-0,078711
-0,068272
-0,054656
-0,038217
-0,019006
0,003084
1,340405
-0,059414
-0,054359
-0,046030
-0,035375
-0,022631
-0,007819
0,009161
0,028495
1,187973
-0,040776
-0,036223
-0,029314
Ci
0,002079
0,021044
0,048675
0,094419
0,252333
-0,492912
0,492912
-0,326884
-0,314183
0,641066
-0,243153
-0,237429
-0,219992
0,700574
-0,192523
-0,190376
-0,179091
-0,161679
0,723670
-0,158516
-0,158405
-0,150876
-0,138383
-0,121647
0,727829
-0,134044
-0,135163
-0,130098
-0,120904
-0,108183
-0,092095
0,720486
-0,115541
-0,117434
-0,114068
-0,107202
-0,097349
-0,084645
-0,069301
0,705270
-0,101022
-0,103411
-0,101260
-0,096099
-0,088374
-0,078203
-0,065532
-0,050186
0,684087
-0,089291
-0,091997
-0,090739
160
Оценка параметров распределений вероятностей
[Гл. 2
п
18
18
18
18
18
г
10
11
12
13
14
г
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
-0,020701
-0,010540
-0,001172
0,014523
0,029671
0,046841
1,045347
-0,026669
-0,022402
-0,016466
-0,009294
-0,000979
0,008496
0,019212
0,031300
0,044847
0,060404
0,911490
-0,015793
-0,011677
-0,006416
-0,000278
0,006695
0,014529
0,023297
0,033110
0,044122
0,056540
0,070367
0,785235
-0,007289
-0,003238
0,001550
0,006940
0,012925
0,019540
0,026851
0,034951
0,043969
0,054072
0,065486
0,078516
0,665728
0,000568
0,003471
0,007930
0,012775
0,018027
0,023730
0,029942
0,036744
0,044239
Ci
-0,086863
-0,080764
-0,072544
-0,062157
-0,049445
-0,034147
0,657947
-0,079582
-0,082484
-0,081896
-0,079012
-0,074183
-0,067503
-0,058930
-0,048324
-0,035451
-0,019962
0,627325
-0,071378
-0,074393
-0,074315
-0,072211
-0,068395
-0,062952
-0,055848
-0,046959
-0,036073
-0,022877
-0,006924
0,592326
-0,064317
-0,067387
-0,067701
0,066218
-0,063222
-0,058792
-0,052898
-0,045430
-0,036200
-0,024926
-0,011201
0,005561
0,552731
-0,058133
-0,061213
-0,061830
-0,060849
-0,058527
-0,054936
-0,050053
-0,043781
-0,035952
п
18
18
18
18
Продол
г
14
15
16
17
г
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
жение таблицы 42
ai
0,052564
0,061904
0,072509
0,084730
0,552004
0,004780
0,008843
0,013074
0,017522
0,022232
0,027249
0,032630
0,038443
0,044772
0,051728
0,059460
0,068169
0,078145
0,089813
0,443142
0,009048
0,013157
0,017235
0,021396
0,025706
0,030212
0,034966
0,040027
0,045465
0,051368
0,057855
0,065087
0,073294
0,082827
0,094248
0,338109
0,012444
0,016611
0,020593
0,024555
0,028573
0,032702
0,036990
0,041487
0,046252
0,051355
0,056889
0,062980
0,069810
0,077655
0,086979
0,098636
Ci
-0,026314
-0,014497
0,000034
0,018080
0,507970
-0,052617
-0,055674
-0,056526
-0,055995
-0,054191
-0,051331
-0,047281
-0,042029
-0,035403
-0,027176
-0,017018
-0,004442
-0,011289
0,031340
0,456986
-0,047594
-0,050597
-0,051629
-0,051393
-0,050102
-0,047820
-0,044532
-0,040165
-0,034587
-0,027599
-0,028906
-0,008069
0,005581
0,023119
0,046408
0,397887
-0,042879
-0,045800
-0,046965
-0,047008
-0,046121
-0,044362
-0,041722
-0,038137
-0,033494
-0,027618
-0,020248
-0,010994
-0,000742
0,015937
0,036313
0,065331
2.3]
Оценка параметров распределения Вейбулла
161
п
18
18
20
20
20
20
20
20
20
г
17
18
2
3
4
5
6
7
8
г
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
щ
0,235490
0,015092
0,019328
0,023258
0,027089
0,030909
0,034773
0,038728
0,042820
0,047095
0,051612
0,056443
0,061685
0,067477
0,074032
0,081713
0,091221
0,109314
0,132411
-1,251068
2,251068
-0,662014
-0,621129
2,283144
-0,408252
-0,386289
-0,345972
2,140513
-0,272551
-0,259179
-0,233536
-0,199675
1,964941
-0,190502
-0,181539
-0,163969
-0,140605
-0,112303
1,788917
-0,136790
-0,130201
-0,117518
-0,100561
-0,079995
-0,056007
1,621135
-0,099621
-0,094504
-0,084808
-0,071993
-0,056488
-0,038416
0,327023
-0,098116
-0,038165
-0,042221
-0,042947
-0,041963
^0,040676
-0,038627
-0,035765
-0,031992
-0,027160
-0,021041
-0,013300
-0,003410
-0,009488
0,026940
0,052132
0,093529
0,235693
-0,493634
0,493634
-0,327555
-0,316157
0,643712
-0,243885
-0,238726
-0,223155
0,705766
-0,193344
-0,191335
-0,181278
-0,165821
0,731828
-0,159435
-0,159298
-0,152528
-0,141408
-0,126651
0,739321
-0,135060
-0,136029
-0,131448
-0,123236
-0,111990
-0,097918
0,735681
-0,116659
-0,118326
-0,115235
-0,109093
-0,100352
-0,089210
п
20
20
20
20
20
20
П
г
8
9
10
11
12
13
родолжение таблицы 42
г
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
ai
-0,017755
1,463585
-0,072826
-0,068644
-0,060858
-0,050834
-0,038781
-0,024779
-0,008798
0,009270
1,316151
-0,052900
-0,049115
-0,042792
-0,034710
-0,025087
-0,013973
-0,001335
0,012921
0,028939
1,178052
-0,037716
-0,034222
-0,028845
-0,022146
-0,014276
-0,005262
0,004930
0,016382
0,029216
0,043593
1,048347
-0,025922
-0,022589
-0,017879
-0,012183
-0,005600
0,001858
0,010227
0,019578
0,030012
0,041668
0,054724
0,926107
-0,016619
-0,013364
-0,009129
-0,004170
0,001453
0,007742
0,014732
0,022485
Ci
-0,075681
0,724575
-0,102246
-0,104362
-0,102371
-0,097711
-0,090828
-0,081874
-0,070863
-0,057714
0,707969
-0,090626
-0,093031
-0,091837
-0,088309
-0,082842
-0,075573
-0,077511
-0,055584
-0,042651
0,686964
-0,081036
-0,083625
-0,083028
-0,076014
-0,076014
-0,070070
-0,062554
-0,053398
-0,042476
-0,029594
0,662168
-0,072964
-0,075662
-0,075522
-0,073554
-0,070076
-0,065197
-0,058928
-0,051211
-0,041931
-0,030912
-0,017911
0,633868
-0,066052
-0,068809
-0,069021
-0,067601
-0,064335
-0,060825
-0,055581
-0,049051
6 А. И. Кобзарь
162
Оценка параметров распределений вероятностей
[Гл. 2
п
20
20
20
20
20
г
13
14
15
16
17
г
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
о*
0,031087
0,040654
0,051333
0,063321
0,810474
-0,009191
-0,005961
-0,002065
0,002348
0,007248
0,012649
0,018585
0,025109
0,032297
0,040241
0,049069
0,058941
0,070007
0,700660
-0,003203
0,000035
0,003690
0,007695
0,012048
0,016769
0,021892
0,027467
0,033552
0,040230
0,047602
0,055804
0,065012
0,075467
0,595940
0,001656
0,004926
0,008410
0,012111
0,016046
0,020247
0,024742
0,029575
0,034801
0,040482
0,046707
0,053585
0,061262
0,069938
0,079893
0,495616
0,005617
0,008931
Ci
-0,041132
-0,031666
-0,020429
-0,007116
0,602120
-0,060043
-0,062821
-0,063307
-0,062329
-0,060148
-0,056856
-0,052465
-0,046929
-0,040154
-0,031999
-0,022261
-0,011999
-0,003196
0,566775
-0,054744
-0,575130
-0,058213
-0,057596
-0,055899
-0,053209
-0,049537
-0,044884
-0,039043
-0,032010
-0,023560
-0,013436
-0,001280
0,013416
0,527466
-0,050002
-0,052742
-0,053608
-0,053287
-0,051997
-0,049816
-0,046757
-0,042785
-0,037825
-0,031763
-0,024342
-0,015601
-0,004939
-0,008023
0,023984
0,483548
-0,045695
-0,048385
п
20
20
20
Продол
г
17
18
19
г
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
жение таблицы 42
ai
0,012297
0,015773
0,019394
0,023192
0,027201
0,031459
0,036010
0,040910
0,046228
0,052055
0,058509
0,065756
0,074029
0,089671
0,398968
0,008847
0,012215
0,015502
0,018813
0,022197
0,025690
0,029324
0,033136
0,037162
0,041450
0,046055
0,051050
0,056532
0,062634
0,069547
0,077558
0,087131
0,305157
0,011469
0,014895
0,018135
0,021329
0,024554
0,027802
0,031153
0,034624
0,038247
0,042061
0,046112
0,050458
0,055176
0,060372
0,066198
0,072887
0,080830
0,090746
0,212971
Ci
-0,049380
-0,049304
-0,048357
-0,046613
-0,044083
-0,040736
-0,036510
-0,031298
-0,024954
-0,017265
-0,007934
0,003474
0,017606
0,035486
0,433947
-0,041706
-0,044331
-0,045422
^0,045550
-0,044896
-0,043529
-0,041460
-0,038666
-0,035086
-0,030632
-0,025168
-0,018506
-0,010374
-0,000381
0,012071
0,027938
0,048871
0,376826
-0,037905
-0,040446
-0,041607
-0,041903
-0,041503
-0,040467
-0,038810
-0,036509
-0,033514
-0,029746
-0,025085
-0,019364
-0,012340
-0,003660
0,007217
0,021167
0,039737
0,066024
0,308714
2.3]
Оценка параметров распределения Вейбулла
163
Окончание таблицы 42
п
20
г
20
г
1
2
3
4
5
6
7
8
9
10
щ
0,013555
0,017039
0,020257
0,023370
0,026464
0,029565
0,032711
0,035932
0,039258
0,042720
Ci
-0,034055
-0,036484
-0,037686
-0,098123
-0,037945
-0,037211
-0,035932
-0,034091
-0,031016
-0,028527
п
20
г
20
г
11
12
13
14
15
16
17
18
19
20
щ
0,046357
0,050215
0,054354
0,058856
0,063842
0,069496
0,076128
0,084346
0,095669
0,119862
Сг
-0,024632
-0,019814
-0,013860
-0,006460
0,002866
0,014902
0,031052
0,054203
0,092028
0,221415
Таблица 43
п
2
3
4
5
6
7
8
9
г
2
2
3
2
3
4
2
3
4
5
2
3
4
5
6
2
3
4
5
6
7
2
3
4
5
6
7
8
2
3
4
5
6
7
8
9
Значения коэффициентов к
кг
0,037574
0,257509
-0,018421
0,413509
0,084775
-0,028312
0,533791
0,166129
0,030763
-0,029135
0,631490
0,232697
0,080351
0,008881
-0,027716
0,713665
0,288854
0,122608
0,042126
-0,001300
-0,025789
0,784533
0,337341
0,159281
0,071292
0,022472
-0,006413
-0,023866
0,846604
0,379959
0,191609
0,097153
0,043783
0,011395
-0,009069
-0,022094
к2
0,415839
0,450055
0,256346
0,464388
0,281729
0,183862
0,472308
0,294192
0,202419
0,142830
0,477340
0,301732
0,212422
0,156905
0,116577
0,480082
0,306813
0,218847
0,164973
0,127606
0,098365
0,483377
0,310476
0,223358
0,170378
0,134224
0,107264
0,025017
0,485329
0,313246
0,226712
0,174294
0,138801
0,112788
0,092365
0,074824
п
10
11
12
13
г
2
3
4
5
6
7
СХ)
9
10
2
3
4
5
6
7
8
9
10
11
2
3
4
5
6
7
8
9
10
11
12
2
3
4
5
6
7
1 и к2 [95]
кг
0,902322
0,417951
0,229478
0,120330
0,062998
0,027627
0,004749
-0,010438
-0,020508
0,952399
0,452207
0,246536
0,141299
0,080450
0,042460
0,017512
0,000584
-0,011097
-0,019101
0,997998
0,483387
0,270268
0,160246
0,096410
0,056079
0,029301
0,010873
-0,002107
-0,011349
-0,017385
1,039851
0,511988
0,292046
0,177997
0,111099
0,068047
к2
0,486871
0,315415
0,229309
0,177275
0,142198
0,116706
0,097048
0,081004
0,066792
0,488120
0,317159
0,231380
0,179627
0,144834
0,116760
0,100437
0,085031
0,060304
0,060304
0,489151
0,318593
0,233072
0,181531
0,146945
0,122006
0,103043
0,087994
0,075575
0,064873
0,054954
0,490018
0,319794
0,234480
0,183107
0,148677
0,123901
164
Оценка параметров распределений вероятностей
[Гл. 2
Окончание таблицы 43
п
13
14
16
18
г
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
14
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2
кг
0,040225
0,020463
0,006357
-0,003882
-0,011361
-0,016749
1,078521
0,538401
0,312161
0,194239
0,124694
0,080302
0,050382
0,029469
0,014307
0,003200
-0,005064
-0,011233
-0,015764
1,480153
0,585828
0,348282
0,223426
0,149158
0,101317
0,068748
0,045666
0,028811
0,016221
0,006658
-0,000690
-0,006373
-0,010762
-0,014090
1,209127
к2
0,105124
0,090302
0,078188
0,067951
0,058952
0,050470
0,490757
0,320813
0,235672
0,184433
0,150126
0,025473
0,106830
0,092166
0,080248
0,070275
0,061682
0,053001
0,046657
0,491948
0,322450
0,237577
0,186541
0,152413
0,127935
0,109474
0,095010
0,083327
0,073645
0,065435
0,058318
0,051997
0,046198
0,040524
0,492867
п
18
20
г
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
кг
0,627488
0,308007
0,249075
0,170681
0,119838
0,084973
0,060068
0,041720
0,027876
0,017236
0,008940
0,002403
-0,002784
-0,006912
-0,010185
-0,012727
1,263654
0,664622
0,408277
0,271937
0,189878
0,136375
0,099482
0,072972
0,053316
0,038380
0,026809
0,017704
0,010451
0,004619
-0,000103
-0,003943
-0,007067
-0,009596
-0,011599
к2
0,323709
0,239034
0,188145
0,154141
0,129778
0,111433
0,097092
0,085544
0,076015
0,067989
0,061101
0,055086
0,049739
0,044879
0,040334
0,035808
0,493598
0,324060
0,240184
0,189405
0,155492
0,131212
0,112948
0,098688
0,087226
0,077792
0,069871
0,063107
0,057241
0,052208
0,047471
0,043295
0,039437
0,035771
0,032070
Запишем функцию распределения Рэлея в двухпараметрической форме:
x\il) = 1 -ехр
Оценки параметров \х и а методом моментов имеют вид
Их дисперсии равны:
D{aM) =
D + 2тг-тг2)
4пD-тг) ;
= к2 + j
а2D-тг)
2.3] Оценка параметров распределения Вейбулла 165
Оптимальные квантильные оценки имеют вид [166]
л Хр-, ^vo ^ О1\Хр~ СХ2Хр-,
ак = ; II к =
где xPi—выборочные квантили уровня pi\ щ = — 1пA — pi), г = 1,2; pi = 0,93
и р2 = 0,07.
Дисперсии таких оценок равны
2 2
?>(йк) = 0,7681^; D(p,K) = 1,7506 — .
Эффективность моментных и квантильных оценок по сравнению с оценками мак™
симального правдоподобия равны « 0,45 для ам и « 0,33 для а^.
2.3.2. Интервальные оценки
2.3.2.1. Оценка а при известном /3
Интервальные оценки имеют вид
где х^ — 7"квантиль распределения хи-квадрат с / = 2п (п — объем выборки) степе-
г г 1 -\- а П 1 — a f и л
нями свободы; 7 = ? 7 = Для двусторонних оценок 17 =ft, 7 = 1 — а
для односторонних оценок (а — доверительная вероятность, которую не следует
путать с а — параметром распределения).
Для нахождения этих оценок можно использовать результаты, полученные ра™
нее для оценки параметра экспоненциального распределения (см. раздел 2.2). По
аналогии искомые оценки можно записать в форме
где кн и кв — коэффициенты оценок, табулированные в табл. 36;
х = - V хр- .
п ^^ %
В [36] предложены достаточно точные и простые аппроксимации для нахожде-
нахождения интервальных оценок параметров распределения Вейбулла при доверительной
вероятности а = 0,95:
— ^ р ^ pA:n; agi ^ a ^ ag2?
где /3, а — точечные оценки соответственно параметров /3 и а,
2 05
fen = 1 + ? 0;55 (при n ^ 6 ошибка не более 0,2%);
1 1
И 1,659 /з 3,01 /з
= I1 ~ , , ^0,4675 5 «2= U+7 ч ^40,5623 (ошибка МСНЬШС 1 %).
(п + 3) ' J [ (w ~ ЗД5) ' J
166 Оценка параметров распределений вероятностей [Гл. 2
2.3.2.2. Совместная интервальная оценка параметров о и /3
Манн и Фертиг [95, 162, 167] предложили оценки для а и /3, основанные на
их точечных линейных оценках по цензурированием сверху выборкам (см. раз™
дел 2.3.1.5). Оценки имеют вид
/QH _ / о. ОВ _ Пп
где /3 — точечная линейная оценка параметра /3, а с'а и с^ —коэффициенты оценки;
а — доверительная вероятность.
Значения коэффициентов cfa и ё'а для различных доверительных вероятностей а
приведены в табл. 44.
Интервальные оценки для параметра а находятся по формулам
&l = exp(U - ScQ; o? = exp(U - Sd?),
где й, Ь — оценки параметров распределения наименьших значений (напомним,
п п
что й = ^ а^ 1нж^, Ь = ^ Ci Inxi с коэффициентами оц и С{ из табл. 42); d'a, d!^ —
коэффициенты оценок, а — доверительная вероятность. Значения коэффициентов
d'a и d'^ приведены в табл. 45.
Для распределения Вейбулла представляют интерес оценки, связанные с его
широким применением при исследовании надежности технических компонентов
и систем. Например, в практике часто возникает задача, которую можно сфор-
сформулировать следующим образом: найти значение наработки t? компонента (или
системы), при котором вероятность безотказной работы компонента (или системы)
равна заданной величине е.
1
Точечная оценка подсчитывается по формуле t? = — a(lne)^, где d, J3 — точеч-
точечные оценки параметров распределения.
Интервальная оценка находится по формуле ехр[й — bkf(?^a)] ^ t? ^
г г
^ ехр [й — bkrf(e, а)], где й = ^ а^ In t^, b = ^ Ci In t^ — линейные оценки параметров
i=l г=1
гх и Ь с коэффициентами а^ и q из табл.42; fc;(e,a) и fc/;(e,a)—коэффициенты
оценки и а — доверительная вероятность. Значения коэффициентов fc;(e,a)
и fc;/(e, а) приведены в табл. 46.
Учитывая чрезвычайно широкое применение распределения Вейбулла и его
частного случая — экспоненциального распределения — при планировании и оценке
результатов испытаний на надежность, в заключение попытаемся ответить еще на
один интересный в практическом отношении вопрос: зачем ставить на испытания
п > г изделий, если оценка параметров производится по результатам первых г
отказов? Ответ прост (хотя и не тривиален)—для экономии времени. Не вдаваясь
в математические тонкости (о них желающий может узнать из [95]), приведем
известные результаты расчетов показателя ц = —. ™, где t\r,n) — ожидаемая про™
t(r,r)
должительность испытаний п изделий до появления г™го отказа и t(r^r)—ожи-
t(r^r)—ожидаемая продолжительность испытаний, когда на испытания ставятся г изделий
и испытания проводятся до отказа всех изделий.
Значения 7] для разных г шп приведены в табл. 47 для случая экспоненциального
распределения (таблица заимствована из [95]). Табл. 47 применима и при оценках,
связанных с распределением Вейбулла (при известном заранее параметре /3). В этом
i_
случае следует найденную по табл. 47 величину rj заменить величиной г/ = г]@ .
2.3]
Оценка параметров распределения Вейбулла
167
Таблица 44
п
3
4
5
6
7
8
9
10
11
12
Т
3
3
4
3
4
5
3
4
5
6
3
4
5
6
7
3
4
5
6
7
8
3
4
5
6
7
8
9
3
4
5
6
7
8
9
10
3
4
5
6
7
8
9
10
11
3
4
5
6
а =
с'
0,17
0,15
0,28
0,14
0,26
0,36
0,14
0,25
0,33
0,41
0,14
0,24
0,32
0,39
0,46
0,13
0,23
0,31
0,38
0,44
0,50
0,13
0,23
0,31
0,38
0,43
0,48
0,53
0,13
0,23
0,30
0,37
0,42
0,47
0,51
0,55
0,13
0,22
0,30
0,36
0,41
0,46
0,50
0,54
0,57
0,13
0,22
0,30
0,36
Значения коэффициентов cfa
0,90
с"
1,56
1,56
1,53
1,59
1,55
1,50
1,59
1,55
1,51
1,46
1,56
1,54
1,52
1,48
1,48
1,58
1,55
1,52
1,49
1,45
1,41
1,58
1,55
1,52
1,48
1,46
1,42
1,39
1,59
1,57
1,53
1,49
1,46
1,43
1,40
1,38
1,60
1,58
1,54
1,52
1,48
1,45
1,42
1,38
1,36
1,56
1,55
1,53
1,49
а =
с1
0,11
0,10
0,20
0,09
0,18
0,28
0,09
0,18
0,25
0,33
0,08
0,17
0,25
0,32
0,38
0,03
0,16
0,23
0,30
0,36
0,42
0,08
0,16
0,23
0,30
0,35
0,40
0,45
0,08
0,16
0,23
0,29
0,36
0,39
0,43
0,48
0,08
0,15
0,22
0,28
0,33
0,38
0,42
0,46
0,50
0,08
0,16
0,23
0,29
0,95
с"
1,86
1,90
1,77
1,93
1,82
1,70
1,92
1,84
1,73
1,64
1,92
1,82
1,75
1,67
1,60
1,95
1,83
1,76
1,69
1,62
1,56
1,92
1,84
1,76
1,70
1,65
1,59
1,53
1,92
1,86
1,77
1,71
1,66
1,60
1,55
1,51
1,97
1,87
1,82
1,73
1,67
1,62
1,58
1,53
1,49
1,87
1,82
1,78
1,72
п
12
13
14
15
16
т
7
8
9
10
11
12
3
4
5
6
7
8
9
10
11
12
13
3
4
5
6
7
8
9
10
11
12
13
14
3
4
5
6
7
8
9
10
11
12
13
14
15
3
4
5
6
7
8
9
и с« [95]
а = 0,90
с'
0,41
0,46
0,50
0,53
0,56
0,60
0,13
0,22
0,30
0,36
0,40
0,45
0,49
0,52
0,55
0,58
0,61
0,13
0,22
0,30
0,35
0,40
0,45
0,49
0,52
0,55
0,57
0,60
0,63
0,13
0,22
0,29
0,35
0,41
0,45
0,49
0,52
0,54
0,57
0,59
0,62
0,64
0,13
0,22
0,29
0,35
0,40
0,44
0,48
с"
1,47
1,45
1,43
1,40
1,37
1,35
1,58
1,57
1,55
1,51
1,48
1,42
1,40
1,38
1,36
1,33
1,58
1,57
1,54
1,51
1,48
1,45
1,42
1,40
1,38
1,36
1,34
1,32
1,57
1,56
1,53
1,50
1,48
1,45
1,43
1,41
1,39
1,37
1,35
1,33
1,32
1,58
1,56
1,54
1,51
1,47
1,45
1,43
1,41
а =
с'
0,34
0,38
0,42
0,45
0,49
0,53
0,08
0,15
0,22
0,28
0,33
0,37
0,42
0,44
0,48
0,51
0,54
0,08
0,16
0,22
0,28
0,33
0,38
0,41
0,45
0,48
0,50
0,53
0,57
0,08
0,16
0,22
0,28
0,33
0,37
0,41
0,42
0,48
0,50
0,52
0,55
0,58
0,08
0,15
0,22
0,27
0,31
0,36
0,40
0,95
с"
1,66
1,61
1,58
1,55
1,51
1,46
1,95
1,86
1,79
1,72
1,67
1,62
1,58
1,55
1,51
1,47
1,44
1,94
1,86
1,77
1,71
1,67
1,63
1,59
1,56
1,52
1,49
1,46
1,43
1,92
1,85
1,79
1,71
1,67
1,63
1,59
1,56
1,54
1,50
1,47
1,45
1,42
1,94
1,86
1,78
1,74
1,69
1,64
1,60
168
Оценка параметров распределений вероятностей
[Гл. 2
ТЬ
16
18
10
11
12
13
14
15
16
3
4
5
6
7
8
9
10
11
12
13
14
15
16
а =
с'
0,51
0,53
0,56
0,59
0,61
0,63
0,65
0,12
0,22
0,29
0,35
0,40
0,44
0,47
0,51
0,53
0,56
0,58
0,60
0,62
0,64
0,90
с11
1,39
1,38
1,36
1,34
1,34
1,32
1,29
1,59
1,58
1,54
1,51
1,48
1,46
1,43
1,41
1,39
1,38
1,36
1,35
1,33
1,31
а =
с'
0,43
0,46
0,49
0,51
0,54
0,56
0,59
0,07
0,15
0,22
0,27
0,33
0,37
0,40
0,43
0,46
0,49
0,51
0,54
0,56
0,57
0,95
с"
1,57
1,54
1,50
1,48
1,46
1,43
1,40
1,93
1,87
1,79
1,73
1,68
1,63
1,59
1,56
1,54
1,52
1,48
1,46
1,44
1,42
ть
18
20
О
17
18
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
ко н ч
а =
с'
0,65
0,67
0,12
0,22
0,29
0,35
0,40
0,43
0,47
0,50
0,53
0,55
0,57
0,60
0,61
0,63
0,65
0,66
0,68
0,70
ание
0,90
с"
1,30
1,28
1,60
1,57
1,55
1,52
1,49
1,46
1,44
1,42
1,40
1,38
1,36
1,35
1,34
1,33
1,31
1,30
1,28
1,27
та б л \
[цы 44
а = 0,95
с1
0,59
0,61
0,07
0,15
0,22
0,27
0,32
0,35
0,39
0,43
0,45
0,48
0,50
0,52
0,54
0,56
0,58
0,60
0,62
0,64
с"
1,39
1,37
1,97
1,89
1,81
1,75
1,70
1,65
1,61
1,58
1,54
1,52
1,50
1,48
1,46
1,44
1,42
1,40
1,37
1,36
Таблица 45
п
3
4
5
6
7
8
9
V
3
3
4
3
4
5
3
4
5
6
3
4
5
6
7
3
4
5
6
7
8
3
а =
d'
2,12
1,55
1,49
1,20
1,22
1,20
1,02
1,03
1,04
1,04
0,90
0,89
0,89
0,90
0,90
0,88
0,83
0,82
0,82
0,82
0,82
0,86
Значеним коэффициентов dfa и d^
:0,90
d"
-2,54
-3,85
-1,50
-5,22
-1,94
-1,08
-6,12
-2,39
-1,36
-0,91
-7,39
-2,95
-1,59
-1,04
-0,79
-8,15
-3,30
-1,86
-1,20
-0,88
-0,70
-9,12
а = 0,95
в!
3,39
2,43
2,15
1,76
1,74
1,64
1,39
1,42
1,41
1,39
1,20
1,20
1,21
1,20
1,18
1,72
1,07
1,07
1,08
1,08
1,07
1,06
d"
-4,47
-6,92
-2,37
-9,35
-3,13
-1,63
-10,54
-3,69
-2,05
-1,29
-13,00
-4,67
-2,48
-1,54
-1,09
-14,26
-5,34
-2,78
-1,81
-1,28
-0,97
-15,68
ть
9
10
11
т
4
5
6
7
8
9
3
4
5
6
7
8
9
10
3
4
5
6
7
8
9
10
а -
в!
0,79
0,76
0,76
0,76
0,76
0,76
0,87
0,77
0,72
0,71
0,70
0,71
0,71
0,71
0,87
0,75
0,69
0,66
0,65
0,65
0,65
0,65
[95]
= 0,90
d"
-3,78
-2,10
-1,38
-0,99
-0,76
-0,64
-9,98
-4,17
-2,37
-1,51
-1,08
-0,86
-0,70
-0,60
-10,68
-4,57
-2,58
-1,67
-1,21
-0,92
-0,76
-0,63
а -
d'
1,00
0,98
0,99
0,99
0,99
0,98
1,07
0,96
0,93
0,92
0,93
0,93
0,93
0,92
1,07
0,92
0,88
0,85
0,86
0,86
0,86
0,86
= 0,95
d"
-6,31
-3,19
-2,01
-1,43
-1,08
-0,87
-17,45
-6,54
-3,56
-2,21
-1,56
-1,20
-0,97
-0,80
-18,52
-7,26
-4,00
-2,45
-1,70
-1,30
-1,06
-0,87
2.3]
Оценка параметров распределения Вейбулла
169
п
11
12
13
14
15
16
г
11
3
4
5
6
7
8
9
10
11
12
3
4
5
6
7
8
9
10
11
12
13
3
4
5
6
7
8
9
10
11
12
13
14
3
4
5
6
7
8
9
10
11
12
13
14
15
3
4
5
а -
d!
0,65
0,88
0,75
0,68
0,64
0,62
0,62
0,62
0,62
0,62
0,62
0,88
0,76
0,68
0,64
0,61
0,59
0,58
0,58
0,58
0,59
0,59
0,90
0,77
0,69
0,63
0,60
0,58
0,56
0,56
0,56
0,56
0,56
0,56
0,89
0,78
0,70
0,64
0,59
0,57
0,56
0,55
0,54
0,54
0,54
0,54
0,54
0,92
0,79
0,70
= 0,90
d"
-0,55
-11,23
-4,81
-2,72
-1,83
-1,32
-1,00
-0,80
-0,67
-0,58
-0,53
-11,66
-5,21
-2,95
-1,94
-1,40
-1,06
-0,86
-0,72
-0,63
-0,56
-0,51
-12,49
-5,38
-3,13
-2,10
-1,50
-1,15
-0,93
-0,76
-0,65
-0,57
-0,51
-0,47
-13,14
-5,55
-3,35
-2,21
-1,56
-1,20
-0,96
-0,82
-0,70
-0,62
-0,55
-0,50
-0,46
-13,55
-5,89
-3,45
а -
d1
0,85
1,10
0,92
0,84
0,81
0,80
0,79
0,80
0,80
0,80
0,79
1,09
0,93
0,84
0,79
0,77
0,75
0,74
0,74
0,75
0,75
0,75
1,11
0,94
0,84
0,79
0,75
0,73
0,72
0,72
0,72
0,72
0,72
0,72
1,12
0,95
0,85
0,78
0,74
0,71
0,69
0,68
0,68
0,68
0,68
0,68
0,68
1,13
0,97
0,85
= 0,95
d"
-0,75
-19,08
-7,44
-4,17
-2,63
-1,91
-1,41
-1,15
-0,91
-0,78
-0,69
-19,77
-8,22
-4,44
-2,86
-2,04
-1,52
-1,18
-1,00
-0,85
-0,74
-0,67
-21,43
-8,30
-4,72
-3,07
-2,16
-1,67
-1,30
-1,07
-0,89
-0,76
-0,68
-0,63
-23,14
-8,79
-4,88
-3,21
-2,29
-1,72
-1,35
-1,10
-0,96
-0,83
-0,73
-0,66
-0,59
-22,72
-9,38
-5,17
п
16
18
20
г
6
7
8
9
10
11
12
13
14
15
16
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Оке
а -
d!
0,63
0,59
0,56
0,54
0,53
0,52
0,52
0,52
0,52
0,52
0,52
0,97
0,83
0,72
0,65
0,60
0,55
0,52
0,50
0,49
0,48
0,48
0,48
0,48
0,48
0,48
0,48
0,99
0,83
0,73
0,65
0,59
0,55
0,52
0,49
0,47
0,46
0,45
0,45
0,45
0,45
0,45
0,45
0,45
0,45
>нчани(
= 0,90
d"
-2,34
-1,68
-1,30
-1,05
-0,86
-0,72
-0,64
-0,56
-0,51
-0,46
-0,44
-14,29
-6,23
-3,74
-2,56
-1,87
-1,42
-1,16
-0,95
-0,81
-0,69
-0,61
-0,55
-0,50
-0,46
-0,44
-0,41
-15,33
-6,64
-4,00
-2,73
-2,04
-1,55
-1,26
-1,03
-0,88
-0,76
-0,67
-0,59
-0,53
-0,49
-0,46
-0,43
-0,41
-0,40
э таблицы 45
а = 0,95
d1
0,77
0,73
0,70
0,68
0,67
0,66
0,66
0,66
0,66
0,66
0,66
1,21
1,00
0,87
0,78
0,72
0,68
0,65
0,63
0,62
0,61
0,61
0,60
0,61
0,60
0,61
0,61
1,25
1,02
0,89
0,79
0,72
0,68
0,63
0,60
0,59
0,59
0,58
0,57
0,57
0,57
0,57
0,57
0,57
0,57
d"
-3,34
-2,42
-1,81
-1,44
-1,18
-1,00
-0,87
-0,76
-0,68
-0,61
-0,56
-25,90
-9,67
-5,55
-3,67
-2,64
-2,02
-1,62
-1,33
-1,13
-0,95
-0,84
-0,74
-0,67
-0,61
-0,57
-0,54
-26,67
-10,49
-5,99
-3,95
-2,91
-2,20
-1,72
-1,42
-1,19
-1,02
-0,89
-0,80
-0,70
-0,65
-0,60
-0,56
-0,53
-0,53
170
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 46
п
т
а = (
к1
Коэффициенты fc'i
3,90
к"
а =
к'
0,95
к"
и к"(е,а) [95]
т
а = 0,90
к1
к"
а =
к'
0,95
к"
е = 0,90
3
4
5
6
7
8
9
10
11
12
3
3
4
3
4
5
3
4
5
6
3
4
5
6
7
3
4
5
6
7
8
3
4
5
6
7
8
9
3
4
5
6
7
8
9
10
3
4
5
6
7
8
9
10
11
3
4
5
13,16
13,07
8,39
12,58
8,48
6,73
11,74
8,18
6,73
5,83
11,12
7,89
6,68
5,82
5,25
10,67
7,79
6,50
5,83
5,31
4,90
10,21
7,39
6,34
5,67
5,28
4,95
4,66
9,36
7,17
6,13
5,59
5,18
4,91
4,63
4,41
9,11
7,04
6,07
5,52
4,96
4,87
4,63
4,44
4,26
8,40
6,60
5,79
1,10
1,16
1,16
1,18
1,23
1,23
1,18
1,28
1,29
1,27
1,18
1,31
1,33
1,32
1,32
1,13
1,33
1,36
1,36
1,36
1,36
1,12
1,36
1,41
1,41
1,41
1,40
1,40
0,99
1,34
1,42
1,43
1,43
1,43
1,42
1,42
0,90
1,35
1,43
1,45
1,45
1,45
1,44
1,44
1,45
0,75
1,34
1,11
20,93
20,93
11,66
20,38
11,73
8,66
18,65
11,39
8,89
7,31
17,54
10,90
8,44
7,23
6,37
16,36
10,76
8,62
7,18
6,40
5,84
15,61
10,26
8,13
7,06
6,46
5,94
5,50
14,88
9,60
8,02
6,99
6,29
5,83
5,51
5,16
14,47
9,98
7,83
6,96
6,34
5,82
5,54
5,23
4,94
12,96
9,07
7,35
0,75
0,75
0,87
0,78
0,97
0,97
0,73
1,00
1,02
1,02
0,64
1,04
1,08
1,08
1,08
0,49
1,04
1,11
1,13
1,12
1,12
0,42
1,06
1,17
1,19
1,19
1,19
1,19
0,09
0,99
1,17
1,20
1,21
1,21
1,21
1,21
-0,09
0,97
1,18
1,24
1,25
1,25
1,25
1,25
1,25
-0,38
0,95
1,20
12
13
14
15
16
6
7
8
9
10
11
12
3
4
5
6
7
8
9
10
11
12
13
3
4
5
6
7
8
9
10
11
12
13
14
3
4
5
6
7
8
9
10
11
12
13
14
15
3
4
5
6
7
5,31
4,98
4,75
4,53
4,37
4,23
4,07
8,16
6,45
5,75
5,30
4,96
4,73
4,55
4,37
4,23
4,09
3,96
7,69
6,17
5,54
5,12
4,82
4,61
4,45
4,30
4,20
4,09
3,98
3,85
7,23
5,95
5,36
4,97
4,72
4,57
4,40
4,26
4,15
4,08
3,98
3,89
3,77
7,07
5,90
5,33
4,98
4,74
1,46
1,47
1,47
1,46
1,47
1,46
1,47
0,72
1,31
1,45
1,48
1,49
1,49
1,49
1,49
1,49
1,49
1,49
0,57
1,29
1,46
1,51
1,52
1,52
1,52
1,51
1,51
1,51
1,51
1,51
0,43
1,26
1,44
1,50
1,52
1,52
1,52
1,52
1,52
1,52
1,52
1,51
1,52
0,25
1,23
1,45
1,52
1,53
6,61
6,09
5,71
5,40
5,11
4,88
4,68
12,45
8,82
7,32
6,49
6,02
5,63
5,32
5,11
4,90
4,73
4,51
11,56
8,28
6,96
6,27
5,75
5,47
5,18
4,94
4,79
4,67
4,51
4,36
10,78
7,94
6,85
6,19
5,77
5,40
5,16
4,95
4,76
4,62
4,51
4,39
4,23
10,49
7,94
6,73
6,18
5,81
1,26
1,28
1,28
1,27
1,27
1,27
1,28
-0,45
0,88
1,20
1,27
1,30
1,30
1,30
1,30
1,30
1,30
1,30
-0,81
0,83
1,18
1,28
1,32
1,33
1,33
1,33
1,33
1,33
1,33
1,33
-1,05
0,77
1,15
1,29
1,33
1,34
1,35
1,35
1,35
1,34
1,35
1,35
1,35
-1,38
0,74
1,17
1,30
1,35
2.3]
Оценка параметров распределения Вейбулла
171
а = (
к'
3,90
к"
а =
к1
0,95
к"
Продолжени
а = 0,90
к1
к11
е та б л
а =
к1
и ц ы 46
0,95
к"
е = 0,90
16
18
8
9
10
11
12
13
14
15
16
3
4
5
6
7
8
9
10
11
12
13
14
15
4,56
4,38
4,24
4,13
4,05
3,94
3,87
3,79
3,71
6,43
5,52
5,04
4,73
4,55
4,39
4,25
4,14
4,05
3,97
3,91
3,84
3,75
1,54
1,54
1,54
1,54
1,54
1,54
1,54
1,54
1,54
0,11
1,19
1,45
1,53
1,56
1,57
1,58
1,58
1,58
1,58
1,57
1,57
1,57
5,38
5,17
4,97
4,79
4,65
4,49
4,38
4,26
4,16
9,64
7,38
6,40
5,79
5,41
5,15
4,99
4,80
4,63
4,51
4,40
4,30
4,21
1,37
1,37
1,37
1,37
1,37
1,37
1,37
1,37
1,37
-1,61
0,66
1,10
1,30
1,37
1,40
1,41
1,41
1,41
1,41
1,41
1,41
1,41
18
20
16
17
18
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
3,71
3,66
3,59
6,04
5,24
4,82
4,55
4,41
4,29
4,15
4,05
3,97
3,92
3,84
3,77
3,72
3,67
3,61
3,57
3,52
3,47
1,57
1,58
1,58
-0,19
1,10
1,42
1,54
1,58
1,59
1,60
1,60
1,60
1,60
1,60
1,60
1,60
1,60
1,60
1,60
1,60
1,60
4,14
4,04
3,97
9,01
7,00
6,16
5,68
5,33
5,06
4,85
4,71
4,57
4,46
4,39
4,29
4,20
4,12
4,04
3,97
3,92
3,84
1,41
1,41
1,42
-2,27
0,46
1,07
1,30
1,38
1,42
1,43
1,44
1,44
1,44
1,44
1,44
1,44
1,44
1,44
1,44
1,44
1,44
е = 0,95
3
4
5
6
7
8
9
3
3
4
3
4
5
3
4
5
6
3
4
5
6
7
3
4
5
6
7
8
3
4
5
6
17,21
17,55
10,88
17,36
11,14
8,68
16,66
10,95
8,82
7,53
16,07
10,80
8,84
7,61
6,73
15,76
10,74
8,78
7,67
6,91
6,29
15,33
10,40
8,59
7,51
1,64
1,73
1,69
1,79
1,76
1,74
1,83
1,83
1,81
1,80
1,87
1,88
1,86
1,84
1,85
1,90
1,91
1,90
1,89
1,89
1,89
1,93
1,96
1,95
1,95
27,32
27,54
15,06
28,30
15,51
11,14
26,85
15,32
11,58
9,39
25,31
14,80
11,18
9,40
8,19
24,57
15,22
11,57
9,43
8,38
7,50
23,80
14,41
11,05
9,46
1,26
1,38
1,36
1,44
1,45
1,44
1,48
1,52
1,51
1,50
1,52
1,59
1,59
1,57
1,58
1,53
1,63
1,63
1,62
1,62
1,62
1,55
1,67
1,69
1,68
9
10
11
12
7
8
9
3
4
5
6
7
8
9
10
3
4
5
6
7
8
9
10
11
3
4
5
6
7
6,91
6,39
6,00
14,50
10,12
8,39
7,50
6,83
6,40
6,01
5,67
14,11
10,03
8,34
7,42
6,83
6,38
6,04
5,75
5,49
13,40
9,56
8,08
7,22
6,66
1,94
1,94
1,95
1,91
1,98
1,97
1,97
1,96
1,96
1,96
1,96
1,93
2,01
2,01
2,00
1,99
1,99
1,98
2,00
2,00
1,91
2,02
2,03
2,02
2,02
8,40
7,73
7,09
23,00
13,69
11,00
9,42
8,29
7,61
7,12
6,65
22,60
14,44
10,39
9,39
8,42
7,65
7,23
6,73
6,35
21,39
13,27
10,40
9,00
8,08
1,67
1,68
1,69
1,51
1,70
1,72
1,71
1,71
1,70
1,71
1,72
1,48
1,73
1,75
1,75
1,75
1,75
1,75
1,76
1,77
1,42
1,74
1,79
1,79
1,79
172
Оценка параметров распределений вероятностей
[Гл. 2
п
Т
а = (
к'
3,90
к"
а = (
У
3,95
к"
п
т
Окон
а = (
к'
чание
3,90
к"
таблицы 46
а = 0,95
к'
к"
е = 0,95
12
13
14
15
16
8
9
10
11
12
3
4
5
6
7
8
9
10
11
12
13
3
4
5
6
7
8
9
10
11
12
13
14
3
4
5
6
7
8
9
10
11
12
13
14
15
3
4
5
6
7
8
9
10
6,27
5,95
5,67
5,47
5,26
13,11
9,47
8,04
7,24
6,68
6,29
6,00
5,70
5,50
5,30
5,12
12,73
9,10
7,82
7,07
6,53
6,16
5,88
5,65
5,48
5,31
5,14
4,97
12,22
8,90
7,64
6,91
6,41
6,10
5,81
5,61
5,43
5,31
5,17
5,02
4,88
11,98
8,88
7,67
6,92
6,47
6,12
5,84
5,60
2,01
2,00
2,01
2,01
2,02
1,92
2,05
2,06
2,05
2,05
2,04
2,04
2,04
2,04
2,04
2,05
1,92
2,06
2,08
2,08
2,07
2,07
2,07
2,06
2,07
2,07
2,07
2,08
1,88
2,06
2,09
2,09
2,08
2,08
2,07
2,07
2,07
2,07
2,07
2,07
2,08
1,85
2,06
2,11
2,11
2,11
2,10
2,10
2,09
7,49
7,06
6,63
6,29
6,00
20,76
13,09
10,25
8,89
8,10
7,43
7,83
6,99
6,66
6,36
5,80
19,14
12,45
9,93
8,71
7,78
7,30
6,92
6,49
6,26
6,06
5,80
5,60
18,38
11,93
9,79
8,55
7,90
7,26
6,87
6,50
6,22
6,00
5,88
5,66
5,46
18,76
12,30
9,72
8,63
7,98
7,27
6,92
6,60
1,79
1,78
1,77
1,78
1,80
1,44
1,78
1,82
1,82
1,82
1,81
1,81
1,81
1,81
1,81
1,83
1,39
1,77
1,84
1,85
1,85
1,85
1,84
1,85
1,85
1,85
1,85
1,85
1,24
1,77
1,84
1,87
1,87
1,86
1,86
1,85
1,85
1,86
1,87
1,87
1,89
1,13
1,77
1,87
1,89
1,89
1,89
1,88
1,88
16
18
20
11
12
13
14
15
16
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
5,44
5,30
5,14
5,02
4,91
4,80
11,18
8,46
7,32
6,61
6,23
5,95
5,72
5,51
5,35
5,23
5,12
5,01
4,88
4,83
4,74
4,65
10,78
8,16
7,09
6,49
6,11
5,88
5,62
5,43
5,29
5,18
5,07
4,96
4,86
4,78
4,70
4,64
4,57
4,49
2,09
2,09
2,09
2,10
2,11
2,12
1,83
2,09
2,14
2,14
2,14
2,14
2,14
2,13
2,13
2,14
2,14
2,13
2,14
2,14
2,15
2,17
1,75
2,09
2,15
2,17
2,17
2,17
2,16
2,16
2,16
2,16
2,16
2,16
2,16
2,16
2,17
2,18
2,18
2,19
6,30
6,06
5,87
5,68
5,53
5,35
17,89
11,66
9,43
8,27
7,45
6,97
6,71
6,38
6,15
5,96
5,75
5,60
5,46
5,36
5,22
5,11
16,96
11,03
9,12
8,11
7,42
6,97
6,56
6,30
6,09
5,92
5,79
5,63
5,49
5,37
5,23
5,14
5,06
4,95
1,89
1,88
1,89
1,90
1,90
1,92
1,11
1,81
1,90
1,93
1,94
1,94
1,94
1,93
1,93
1,93
1,92
1,93
1,94
1,94
1,95
1,97
0,94
1,79
1,92
1,94
1,95
1,96
1,96
1,95
1,95
1,95
1,96
1,96
1,96
1,97
1,98
1,98
1,99
2,00
2.3]
Оценка параметров распределения Вейбулла
173
Таблица 47
г
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
г
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Значения г\
= t(r,n)/t(r,r)
к
1
1,000
0,500
0,333
0,250
0,200
0,167
0,143
0,125
0,111
0,100
0,091
0,083
0,077
0,071
0,067
2
1,000
0,556
0,389
0,300
0,244
0,206
0,179
0,157
0,141
0,127
0,116
0,107
0,099
0,092
3
1,000
0,590
0,427
0,336
0,278
0,237
0,207
0,183
0,165
0,150
0,137
0,126
0,117
4
1,
0,
о,
о,
о5
0,
о,
0,
о,
о,
о,
о,
000
616
450
365
365
262
230
205
185
169
155
143
5
1,000
0,635
0,479
0,387
0,327
0,283
0,250
0,224
0,202
0,185
0,170
6
1,000
0,650
0,497
0,406
0,345
0,301
0,267
0,240
0,218
0,200
7
1,000
0,663
0,513
0,423
0,361
0,316
0,282
0,254
0,232
8
1,000
0,673
0,526
0,437
0,375
0,330
0,295
0,267
к
9
1,000
0,682
0,537
0,449
0,388
0,342
0,307
10
1,000
0,690
0,547
0,460
0,399
0,353
11
1,000
0,696
0,536
0,470
0,409
12
1,000
0,703
0,564
0,479
13
1,000
0,708
0,572
14
;
(
1,000
3,713
15
1,000
Задача 63. Получена выборка из распределения Вейбулла с параметром f3 = 3,1:
Xi\ 0,74; 0,78; 0,94; 1,26; 1,39; 2,17; 2,19; 3,18; 5,16; 6,12.
Необходимо найти оценку максимального правдоподобия параметра а.
Имеем
а= \ -
п •
_1_
/3 Г -,
10 V
зд
0,78
зд
¦6Д23'1'
1
зд
= 3,53601.
Задача 64. Найти совместные точечные оценки параметров распределения Вейбулла
по выборке данных задачи 63.
Используем метод ускоренного решения системы уравнений максимального правдо-
правдоподобия. Вычислим оценки среднего и стандартного отклонения
•=-4yXi = 2,393;
п *-—'
174 Оценка параметров распределений вероятностей [Гл. 2
s =
1
= 1,88539
g
и найдем оценку коэффициента вариации и = — = 0,78777.
ж
Из соотношения /Зо ~ i/~1?075 находим приближение
/Зо = @,787877)^l!075 = 1,292.
Далее вычисляем
ю
si = ]Г х1г2Ш = 0Д41'292 + • • • + 6Д21'292 = 33,85538;
ю
S2 = J2lnXi = Ы °'74 + • • • + Ь 6,12 = 6,11698;
г=1
10
= Y, х\'292 •ln Xi = 0,741>292 • In 0,74 + ... + 6Д21'292 • In 6,12 = 42,26807;
г=1
tf = 0,74х'292 • AпО,74J + ... + 6Д21'292 • Aп6Д2J = 66,16118.
Вычисляем оценки:
- [42,26807 611698 ^ ОЛО 42,268072 - 33,85538 • 66,16118
в = { — Ь 1,292 • —' ъ х
[33,85538 10 33,855382
х \(*Ш!. tbll^) . 1>292 - ll Г= 1,37481;
LV 33,85538 10 ) J/
1
1 10 \ 1,37481
: = I — J2 ^'3?481 I = 2,58882.
Задача 65. Имеется выборка из распределения Вейбулла:
хц 12, 14, 21, 38, 42, 44, 46, 59, 61, 72.
Вычислить оценки параметров а и C методом моментов.
Воспользуемся простейшим методом (оценка по коэффициенту вариации). Вычисля-
Вычисляем последовательно
1
»ffc~rf =19,208; |/=з =0,4708.
n ,ti J *
Имеем /3 = 0,4708^l!°75 = 2,247 или из табл. 39 /3 « 2,19.
Оценку а ищем в форме
1
/in \ 2,247
а= ^Еж?'247 =46,0656.
Воспользовавшись близостью /3^2, продемонстрируем оценку параметров распределе-
распределения Рэлея (см. раздел 2.3.1.6). В нашем случае s = 19,208 и х = 40,8.
Тогда имеем
2^= = 41,46; Ам = 40,8 - 19f!^ = 4,05.
4 — тг V 4 — тг
«1 • X\
X9 ~
«1 -
- a2
- x\
- OL2
¦ X2
= 10,626.
2.3] Оценка параметров распределения Вейбулла 175
Дисперсии этих оценок приближенно равны (hi = 20,745; k2 = 36,8886; fe = 11,6404):
D(aM) = J^fci = 96,478 (y/D(aM) = 9,82);
D(jim) = k2 H fci ^^= = 88,829
4 — 7Г V4 — 7Г
Полагая (весьма условно — только для демонстрации техники вычислений), что
L == жо,93-ю ~ жд и хР2 = Жо,07-ю ~ #1, имеем для квантильных оценок
l = - ln(l ~~ pi) = 2,659; а2 = - 1пA - р2) = 0,0725):
61^ 12 = 18,94;
2,659 - 0,0725
12 • 2,659 - 61 • 0,0725
«1 • а2 2,659 • 0,0725
Дисперсии их равны:
D(ak) = 0,7681 • ^ = 27,55
D(uk) = 1,7506 • ^ = 62,79 (х/В(ак) = 7,92).
те
Не следует приходить в отчаяние от несовпадения оценок ам и а&. Это является след-
следствием того, что квантильные оценки применимы при п > 50 (у нас, вспомните, речь
шла только о демонстрации техники вычислений).
Рассмотрим теперь оценку параметров распределения Вейбулла с помощью коэф-
коэффициента асимметрии. Отметим сразу, что достаточно точные оценки коэффициента
асимметрии требуют объема выборки п > 100. Мы преследуем цель продемонстрировать
только технику вычислений, поэтому следует помнить, что приведенный пример позво-
позволит понять суть метода, но для получения точных оценок с его помощью необходимо
располагать значительно большим объемом данных. Имеем
аз = —^ ' У" (хг - xf = ч * К12 - 40,81K + ... + G2 - 4,81K1 = -0,0707.
10 ¦ s3 fr[ V ; 10 ¦ 19,2083 LV ; V ; J
Примечание. Отличие в оценках от предыдущего метода не должно вводить в за-
заблуждение. Ведь когда мы говорим, что имеем выборку из распределения Вейбулла —
это не более, чем гипотеза (мы не знаем даже, сколько в нем значимых параметров). Как
узнать, каково же истинное распределение — это самостоятельная задача, рассматрива-
рассматриваемая в главе 3 настоящей книги.
Задача 66. Для данных задачи 65 найти оценки параметров по одной характеристи-
характеристической порядковой статистике.
Имеем г1 = 0,632 • (п + 10) = 0,632 • 11 = 6,252; xR = ^x6 • х7 = л/М • 46 = 44,989.
Вычисляем G = XR^X = —1— . D4,9889 - 40,8) = 0,218086.
s 19,208 v ;
Из табл. 41 имеем /3 ~ 1,821 и Ь1 = 1,978, и окончательно
а = s • У = 19,208 • 1,978 = 37,993; Д = xR - а = 44,989 - 37,993 = 6,996.
Задача 67. Имеется гистограмма выборочных данных по наработке приборов
U: 0^5 5^10 10-=-15 15^20 20^25 25^30 30^35 35^40
тц 21 24 12 10 5 13 9 6
(wii — количество данных, попавших в г-й интервал, JV=100). Найти оценку пара-
метров распределения наработки приборов методом наименьших квадратов {см. раз-
дел 2.3.1.3).
176
Оценка параметров распределений вероятностей
[Гл. 2
Вычисления сведем в таблицу (здесь т* = — I ]P rriij — 0,5 ]):
и
0-5
5-10
10-15
15-20
20-25
25-30
30-35
35-40
mi
21
24
12
10
5
13
9
6
mi
0,205
0,445
0,565
0,665
0,715
0,845
0,935
0,995
Рс
0,795
0,555
0,435
0,335
0,285
0,155
0,065
0,005
^igPc
0,0996
0,2557
0,3615
0,4749
0,5451
0,8097
1,1871
2,3010
У
-1,0016
-0,5922
-0,4419
-0,3233
-0,2635
-0,0917
0,0745
0,3619
X
0,6990
1,0000
1,1761
1,3010
1,3979
1,4771
1,5441
1,6020
х2
0,4886
1,0000
1,3832
1,6927
1,9541
2,1819
2,3841
2,5666
ху
-0,70010
-0,59220
-0,51970
-0,42060
-0,36847
-0,13540
0,11503
0,57980
100
-2,2778 10,1972 13,6512 -2,04154
Находим (п = 8 — число интервалов гистограммы):
¦О2^
Xil =8-13,6512-10,1972=5,2267;
t
Dc = J2 У*' Л xi ~ J2 Xi' 12 Xi ' Vi = (~ 252778) • 13,6512 - 10,1972 • (- 2,04154) = - 1,2767;
n n n
Db = n • J2 xi ' Vi ~ JZ xi • Y, Vi = 8 * (^2,04154) - 10,1972 • (-2,2778) = 6,89486;
D* 10,2767 Db 6,89486
с = — = = —1,9661; b = — = = 1,3192.
Do 5,2267 ' ' Do 5,2267
Параметр b является искомой оценкой /3 = b = 1,3192. Параметр а является искомой
оценкой а. Находим ее из условия с = 0,3622blga, откуда имеем
lga = -
с+ 0,3622
- 1,9661 + 0,3622
1,3192
= 1,215813 и & = 16,4366.
Задача 68. В условиях задачи 65 найти оценку параметров распределения методом
аппроксимации (см. [36]).
Имеем а3 = -0,0707 и оценку $ и 48 • (-0,0707 + 1,23)~м = 3,9027.
Далее
1 - 0,427 • C,9027 - 1) • 3,9027~1>9 = 0,6824;
¦ = 8 • 0,5 + 0,784 • /3 - ^^ = 19,208 ¦ 0,5 + 0,784 . 3,9027 - ^^
1 J3 ) \ 3,9027
= 66,874.
Окончательно получаем
= 97,998; Д = 40,8 - 66,874 = -26,074.
5 5^' ? ^
a
0,6824
Если принять в качестве исходного двухпараметрическое распределение Вейбулла,
то оценки будут равны
10
о,465 •
40,8
1,282 •
19,208
= 2,0178; а =
0,6824
= 59,79.
Напомним, что мы решаем задачу, исходя из того, что закон распределения вероят-
вероятностей случайной величины нам известен заранее.
2.3] Оценка параметров распределения Вейбулла 177
Задача 69. В условиях задачи 67 найти оценки параметров с помощью квантилей.
Нам потребуются квантили жо,95 и жо,2-
Имеем Жо,95 = Ж[0?05-100] + 1 = #5i; Ж[о,8О-1ОО] + 1 = #81-
В нашем Р^ДУ данных xsi ~ 27 и хы ~ 11, и окончательно получаем
а = ехр@,4224 • In 27 + 0,5776 • In 11) = 16,073.
Задача 70. Но данным задачи 65 найти оценки с помощью порядковых статистик
(см. раздел 2.3.1.5), если а) цензурированы 5 больших членов выборки; б) выборка не
цензурирована.
Для варианта а) имеем п = 10, г = 5 и из табл. 42 находим
oi = -0,115524; а2 = -0,090668; а3 = -0,051341; а4 = 0,000925; а5 = 1,256809;
а = -0,185169; с2 = -0,181821; с3 = -0,160697; с4 = -0,125311; с5 = 0,625997.
Из табл. 43 находим к\ = 0,120330 и къ = 0,177275. Далее оценки находятся по фор-
формулам
й= ]Гщ >yi = -0,115524-In 12...+ 1,256809-In 42 = 4,01772;
г=1
Ь = J2 ci ' Vi = ^0185169 • In 12 ... + 0,652997 • In 42 = 0,555648.
г=1
л 1
Искомые оценки равны /3 = - = 1,800; а = ехрD,01772) = 55,574 или (с учетом смеще»
b
ния)
U Ь 0,555648 п^гЛ а 1 , AQa
Ь = = = 0,6754: /3 = ^ = 1,480;
1-к2 1 - 0,177275 ' Ь*
и* = и + S* • кг = 4,01772 + 0,6754 • 0,12033 = 4,099; а* = ехр D,099) = 60,279.
Для случая б) по аналогии с помощью табл. 42 и 43 имеем
и = 0,02331 • In 12 + ... 0,230001 • In 72 = 3,8619;
b = ^0,072734 • In 12 - ... + 0,324597 • In 72 = 0,446372.
Из табл. 43 имеем кг = -0,020508 и к2 = 0,06692. Тогда
Ы °?446372
1 - 0,06692
Окончательно получаем
= 0,4784; й* = 3,8619 + 0,4784 • (-0,020508) = 3,852.
= 2,090; а = ехр(й*) = ехрC,8520) = 47,087.
5* 0,4784
Задача 71. Имеется выборка данных из распределения Вейбулла с параметром
P = 2,l-Xi\ 4,2; 5,2; 6,1; 8,9; 10,1; 12,4; 13,9; 16,1; 17,2; 21,0.
Найти интервальную оценку параметра а при доверительной вероятности а = 0,90
(Не путать! Разный смысл вкладывается в а — это и параметр распределения и дове-
доверительная вероятность. Необходимо следить за указаниями в тексте).
Имеем из табл. 36 для а = 0,90 и п = 10: кн = 0,637 и кв = 1,84.
Далее х = - jr xf = — • D,22Д + 5,22Д + ... + 212'1) = 210,64941.
Окончательно
_L_ JL- 1 1
al = @,637) 2Д • B10,64941) 2,1 = 10,30338; авп = A,84) 2Д • B10,64941) 2Д = 17,08287.
Следовательно, с вероятностью 0,90 значение параметра а находится в диапазоне
10,30838 ^ а ^ 17,08287.
178 Оценка параметров распределений вероятностей [Гл. 2
Задача 72. В условиях задачи 65 с учетом точечных оценок параметров, полученных
в задаче 70, найти интервальные оценки параметров а и /3 при доверительной вероят-
вероятности а = 0,90.
Точечные оценки: /3 = 1,800, а = 455,574 при п = 10 и г = 5 (т. е. когда оценка выпол-
выполняется по пяти порядковым статистикам) и /3 = 2,090, /3 = 47,087, если оценка ведется
по всем п = г наблюдениям. Ищем оценки при г = 5ип = 10(а = 0,90). Из табл. 44
находим с = 0,30 и с" = 1,53. Тогда /3^ = 0,30 • 1,8 = 0,54; /3^ = 1,53 • 1,8 = 2,54.
Следовательно, 0,54 ^ /3 ^ 2,754.
Для вычисления интервальной оценки а воспользуемся результатами решения зада-
задачи 70, из которых следуют оценки й* = 4,099 и Ь* = 0,6754. Из табл. 45 для г = 5, п = 10
и а = 0,90 находим d! = 0,72 и d" = -2,37.
Тогда
а? = ехр D,099 - 0,6754 • 0,72) = 37,066; а? = ехр D,099 - 0,6754 • (-2,37)) = 298,777
и 37,066 ^ а ^ 298,777.
По аналогии для случая г = п имеем
/3 = 2,090; а = 0,71; с' = 0,55; с' = 1,38; и* = 3,8520; S* = 0,4784;
d1 = 0,71; d/; = -0,60.
Тогда
PI = 0,55 • 2,090 = 1,149; J3l = 1,38 • 2,090 = 2,884;
сС = ехрC,852 - 0,4784 • 0,71) = 33,526; сТп = ехрC,852 - 0,4784 • (-0,60)) = 62,742.
Легко видеть,что увеличение количества наблюдений, участвующих в оценке, повьь
шает ее точность.
Задача 73. В условиях задачи 65 с учетом точечных оценок, полученных в задаче 70,
найти интервальную оценку 95%-й квантили случайной вейбулловской величины х при
доверительной вероятности а = 0,90 для случая г = 5, п = 10.
Для случая г = 5, п = 10 точечные оценки й* = 4,099, Ь* = 0,6754.
Из табл. 46 находим к1 @,95; 0,90) = 8,39 и fc/;@,95; 0,90) = 1,97.
Тогда имеем
ехрD,099 - 0,6754 • 8,39) ^ жО)95 ^ ехрD,099 - 0,6754 • 1,97); 0,208 ^ жо,95 ^ 15,934.
Задача 74. Решить задачу 73 d/ш случая г = п = 10.
Для случая г = гг = 10 имеем
Ь* = 0,4784; й* = 3,852; А;'@,95; 0,90) = 5,67; fc;/@,95; 0,90) = 1,96.
Тогда
ехрC,852 - 0,4784 • 5,67) ^ жо,95 ^ ехрD,099 - 0,4784 • 1,96);
3,125 ^ жо,95 ^ 18,436.
Задача 75. Оценить для г = 3,5 ti 7 при п = 10 ожидаемую экономию в продолжи-
тельности испытаний изделий, если распределение контролируемого параметра подчи-
подчиняется а) экспоненциальному распределению, б) распределению Вейбулла с параметром
/3 = 3,8.
Из табл. 47 для случая а) имеем rj = 0,183 (г = 3); rj = 0,283 (г = 5) и rj = 0,423 (г = 7).
Таким образом, ожидаемая продолжительность испытаний составит соответственно
18,3%, 28,3% и 42,3% от времени, необходимого при испытаниях в варианте г = п. Для
1 1
случая б) эти величины будут равны ц = 0,1833'8 = 0,639(г = 3), ц = 0,2833'8 = 0,717
(г = 5); 7]1 = 0,4233^ = 0,797 (г = 7).
2.4]
Оценка параметров гамма-распределения
179
2.4. Оценка параметров гамма-распределения
Плотность гамма-распределения имеет вид (см. раздел 1.1.6)
-^р х,/3>0, а>1,
где а и /3 — параметры распределения, подлежащие оценке по выборочным данным.
2.4.1. Точечные оценки
2.4.1.1. Оценка /3 при известном а
» * _ 1 "
1 — — Г ЯР Т — — > Т •
Р-а, где х-п^хг.
г=1
2.4.1.2. Совместная оценка параметров
2.4.1.2.1. Оценка максимального правдоподобия
Оценки максимального правдоподобия а и C по выборке объема п являются
решением системы уравнений
1 с?[1пГ(аI "
—птв — п ~ + >
= О,
^
+
= 0.
Система мож:ет быть решена методом последовательных прибли^кений. Когда а
не слишком мало, можно использовать приближение [16]
Интересный метод решения системы уравнений максимального правдоподобия
предложен в [168—170]. Запишем систему уравнений максимального правдоподобия
в виде
i ~ nf3a = 0,
где ф(а) — логарифм производной гамма™функции.
Предлагается решение системы с помощью параметра
п
п | ||ж,
основанное на аппроксимации зависимости а от А [171].
180 Оценка параметров распределений вероятностей [Гл. 2
Из системы уравнений следует Ыа — ф(а) = А. В диапазоне значений
0,025 ^ А ^ 8,2 (что соответствует 0,10 ^ а ^ 20) применима аппроксимация
0,9885
ехр[^0,187(С - А)}, А < С;
а =
где С = 0,5772 — постоянная Эйлера (относительная погрешность аппроксимации
не превышает 0,8%).
1 п
Параметр /3 оценивается, как и ранее, по формуле /3 = ~™г ^ Х{.
i=i
Оценка для а может быть упрощена:
Л _ |о,521143А^'09885 ехр @Д87А) при А < 0,5772;
\о,61998А^0'8699 при А ^ 0,5772.
Еще одна оценка, основанная на аппроксимации гамма-функции, рассмотрена
в [172]. Предлагается разложение гамма-функции по формуле Стирлинга
Г(а) = е^ааа^
+ + Ц
12а 288а2
При использовании первых трех членов разложения приходим к оценке
— = —3 + \/9 + 12 (lnsi — s2), где si = -^^, 52-^г
г=1 г=1
Оценка для /5 в этом случае, как и ранее, определяется по формуле /3 = ^т = ^т-
2.4.1.2.2. Несмещенная оценка для малых выборок
В [173] предложена оценка
1 1 1
в = — \^ Х4 \ПХ4 \^ Х4 - — \^ In Xi.
%=1 %=1 %=1
Ее точность, несмотря на простоту вычислений, вполне удовлетворительна.
2.4.1.2.3. Оценка методом моментов
Метод применим при п ^ 50. Оценки имеют вид
2
; ^ = ?' где x=n^Xl" s =п
2.4.2. Интервальная оценка параметра /3
При известном параметре а интервальная оценка для /3 имеет вид
кшх ^ /3 ^ квх,
где кШ1 кв — коэффициенты, которые могут быть взяты из табл. 36 с заменой п
на па.
2.4] Оценка параметров гамма-распределения 181
Задача 76. Имеется ряд выборочных значений случайной величины, имеющей гамма-
распределение
Xi: 144, 216, 816, 71,1147, 2120, 912,150, 50,1450, 3500,189, 21, 914,1500,1700,300, 650.
Необходимо найти оценки параметров а и /3.
Оценка /3 при известном а B.4.1.1)
Пусть а = 0,8. Тогда оценка равна
J3 =- = — • V" xi = — • 15850 = 1100,69.
а п ^ 18
Оценка максимального правдоподобия (ускоренный метод) B.4.1.2.1)
Имеем
±.?> = 880,555; А = In 88°'555 = 0,71217.
г=1 \г=1 / П 1=1 431,9807
Так как А > 0?5772, то п
а = 0,61998 • 0,71217^0'8699 = 0,8329; /3 = ^— = 1057,163.
п • а
Оценка с разложением по формуле Стирлинга B.4.1.2.1)
Имеем 8-1 = - -Y\xi- 880,555; s2 = - . УЧпж* = 6,06838.
П г=1 П г=1
Далее вычисляем
= 0,84118; J3 = 880?Б55 = 1046,809.
-3 + i/9 + 12 ¦ (In 880,555 - 6,06838) 0,84118
Несмещенная оценка B.4.1.2.2)
Имеем
-•irxi-\nxi = 6392,798; - • Y" Xi = 880,555; - • Y In Xi = 6,06838.
г=1 г=1 г=1
Тогда
P = 6392,798 - 880,555 • 6,06838 = 1049,225; a = % = S80'555 = 0,8392.
P '
Оценка методом моментов B.4.1.2.3)
Имеем
х = - • У" Xi - 880,555; s2 = - • Y (xi ~ xf = 795821,914; s = 892,0885.
n f—f n f—'
Находим
^551] =0,974; p =
892,0885/ 880,555
= 9о3,77з,
Отметим, что полученные оценки грубы (существенно отличаются от полученных
ранее), так как мал объем выборки (а оценки методом моментов применимы при п > 50).
Интервальная оценка /3 при известном а
Примем, что а = 0,8 и доверительная вероятность равна 0,95. Имеем х = 880,555,
и из табл. 36 для п • а = 18 • 0,8 = 4,4, интерполируя, получаем кш « 0,635 и кв рз 1,805;
окончательно
0,635 • 880,555 ^ /3 ^ 1,805 • 880,555, или 559,152 <С /3 ^ 1589,393.
182 Оценка параметров распределений вероятностей [Гл. 2
2.5. Оценка параметров биномиального распределения
2.5.1. Точечная оценка
Если имеется реализация из п испытаний, в которых событие наблюдалось т
раз, то несмещенной точечной оценкой максимального правдоподобия параметра р
является величина рп = —. Напомним, что плотность вероятностей биномиального
п
распределения имеет вид
Распределение имеет единственный параметр р.
2.5.2. Интервальные оценки
Интервальные оценки параметра р с доверительной вероятностью а являются
решениями уравнений Клоппера-Пирсона [174]
JT C*pl{l-pHy-x = Ц^{1 - а); ? ЩA -рв)п-* = f (а).
х=т х=0
В скобках приведены вероятности, соответствующие границам рн и рв одно™
сторонних доверительных интервалов. Значения рш и рв, соответствующие различ™
ным п и а, приведены в [16, 24, 25, 29].
Известно (см. раздел 1.2.1), что биномиальное распределение может быть ап™
проксимировано с помощью бета™ и i^-распределений, нормального распределения
и распределения Пуассона. Поэтому значения рн и рв для двусторонней интерваль-
интервальной оценки можно выразить через квантили этих распределений.
2.5.2.1. Аппроксимация бета-распределением
где B(j^kJ) —7™квантиль бета-распределения с параметрами к и I.
2.5.2.2. Аппроксимация .F-распределением
Рн (п - х + l)Fi±a [2(га - ж + 1), 2х]' Рв гс - х + (ж + l)Fi+a [2(ж + 1); 2(п - ж)]'
2 2
где F*f(k,l) —7"квантиль ^-распределения с /i = Aj и /2 = I степенями свободы.
2.5.2.3. Аппроксимация распределением Пуассона
В данном случае используется связь между распределением Пуассона и распре™
делением хи-квадрат.
1 о 1 о
-1- Z (ел \ zl ГО/' I I M
2П 2 ^^ 2
где х^—7"квантиль распределения хи~квадрат с / = к степенями свободы.
2.5]
Оценка параметров биномиального распределения
183
Более точные результаты дает приближение
Ры =
Рв =
2п - х + 1 + -х i+a ± 2ж
1 2
При ж = 0 имеем р = 0 и рв = 1 - \
Значения ж ( 2п — ж + 1 + ™Х
V 2
пХ
х [ 2в — ж + ™
V 2
Для разных п, ж и
табулированы в [46]. Точностные характеристики этих аппроксимаций исследованы
в [175], где показано, что при 1 ^ п — ж ^ 40, п ^ 40, при 25 ^ п — х ^ 40, х ^ 25 или
при п — ж ^ 40 (х — любое) относительная погрешность не превышает 0,01.
2.5.2.4. Аппроксимация биномиальной суммы распределением хи-квадрат
В [182] предлагается численное решение задачи аппроксимации доверительных
границ параметра биномиального распределения, основанное на аппроксимации
биномиальной суммы
J2 Clnq\\ - q)n-% « 1 - Р2х [2%), Цп, х)},
г=0
где P2d(x) —значение функции ^-распределения с 2d степенями свободы в точке ж;
k(q) = In ^—; k(n, ж) = ^^——
У —
Отсюда следует
Рн =
Рв =
1 — ехр —
ехр
1 -ехр{ -
ехр<
ж ^ 0,5п;
, ж > 0,5п;
, ж ^ 0,5в;
ж > 0,5п.
Это наиболее точная аппроксимация из известных. Если п и ж достаточно
велики, можно использовать приближение
I
, / ч А л (п — х +1
^(п,ж) ^ _ ? где
Погрешность этого приближения равна 0,1% при п = 10 и ж = 5; 0,12% при п = 20
и ж = 10; 0,06% при п = 40 и ж = 20.
184
Оценка параметров распределений вероятностей
[Гл. 2
2.5.2.5. Аппроксимация нормальным распределением
Для упрощения записи впредь вместо ui+a , , будем использовать обозначе-
2 \а)
^квантиль (для двустороннего интервала)
или а-квантиль (для односторонних интервалов) стандартного нормального рас-
распределения (напомним, что а — это доверительная вероятность, с которой опреде-
определяются интервалы оценки параметра р).
Аппроксимация 1:
ние и, т.е. помнить, что и — это
Рн =
1 2 /Ж , 1 .
ж + -и — аду — (п — ж) + -ад2
ж + -ад2 + аду — (п — ж) + -и2
I У п 4
п + ад п + ад
Эта аппроксимация рекомендуется [2] при ж^4ип-жL.
Аппроксимация 2 (arcsln):
если биномиальное распределение нормализуется с помощью преобразования
arcsln, то
= Sin2
arcsin \ -=и
; рв = sin
arcsln \ —
V
Аппроксимация 3 [176]:
Рн =
х ^0,5 и х ^0,5 / х ^0,
1 1
/п \ п
х + 0,5 и х + 0,5 Л ж+ 0,5
Рв = + -^W I 1 -
/П П
Аппроксимация 4 [176]:
Рн =
Рв =
ж
ж
-
+
о,
о,
54
,5 4
~ 2U
+ и\
п -
х 4
-0,5-
¦f и2
-0,5-
п
1
п
-0.
+ 0
,5)М
,5JН
-ад2
п + и
Аппроксимация 5 (при р « 0,5) [175]:
ж-0,5 ад /ж-0,5 / ж-0,5
Рн= — , 4/ I 1-
ж + 0,5 ад /ж+ 0,5 Л ж+ 0,5
Рв = ^^+ ; А/ I 1-
Аппроксимация 6 (Холла):
Рн =
ж/-| ж \
г* + 0,5 / ^ 2ж
ж , и /ж / ж\ ад +0,5 / ж
V^ у п \ п) Зп I п
2.5]
Оценка параметров биномиального распределения
185
Более точная аппроксимация с поправкой 0,5 на непрерывность:
_ж-0,5 и /ж-0,5 / ж-0,5\ ti +0,5
Рш ~ ""га" 7^\ ^^ \ п"
.ж-0,5
Рв =
0,5
гг х/п \ п
ж+ 0,5 / ж + 0,5\ , nz+0,5
Аппроксимация 7 (Моленара):
Рш =
Згг / 3
2 + ^
Рв =
1-и\ 2 + w
+
7-ti2
) 18п
2 +и
Большей точностью обладает аппроксимация
18n
Рв =
1 — гх \ 2 + и 1 - '
18n
1)-
18n
Аппроксимация 8
Рн =
2 + г?
ж 1 I 3
— гг
[(-
7 2 N
п +
-ж +
7 2
18
1-
7-^2\1
18 )
1
2
2 + ii
П + 2--5--1
Рв =
Ж + 1 -
18
7-'
18
п + 11.^-4
186
Оценка параметров распределений вероятностей
[Гл. 2
Аппроксимация 9 (Полсона-Кэмпа-Пратта)
Полсон [178], используя преобразование Вилсона—Хилферти [61] для распреде-
распределения хи-квадрат, показал, что
9/х
2 2
' 3 + 9/х
где .F — квантиль распределения Фишера с Д = /л и /2 = ^ степенями свободы
(см. раздел 1.1.10).
Кэмп [179] использовал этот факт для аппроксимации биномиального распреде-
распределения, а Пратт [180] применил для получения доверительных интервалов параметра
биномиального распределения
Рв =
81 (ж + 1)(га - ж) - 9п - 8 -
+ 1)(гс - х)(9п + 5 - и2) + п +
У
-1
81 (ж + IJ - 9(ж + 1)(?г - х){2 + и2) + 1
При замене ж + 1 на ж и и на -и получаем выражение для рн.
2.5.2.6. Аппроксимация Титенко [181]
В [181] сделана попытка найти более точные, чем нормальные, аппроксимации
где р =
(l-dp2)J/'
1 = (n-x)(n + l)r f =
(х + 1) (х + 2) ' J
Cl
или более точно:
где
н = P* = +
4A-dp2J :
(п - xf{x + 1) + (Зп - х + 4)(ж + IJ
Используя упрощенную запись, получим
Ч> W
¦ + т 2\~ г 5 гДе ^ = 1 + р
Аналогично для рв
Iff 7i; о; = —.
п
V
<?_
A-/3,7
2\2
2.5] Оценка параметров биномиального распределения 187
где
/3 =
п-х + Г
lgrc; а; = -.
Эти результаты следуют непосредственно из решения уравнения Клоппера—
Пирсона.
Достаточно подробный обзор и анализ интервальных оценок параметра би-
биномиального распределения приведены в [176]. Различные методы графического
решения аппроксимационных задач приведены в [2, 126].
Задача 77. При п = 20 испытаниях имели место 6 событий. Найти 95%-й двусто-
двусторонний доверительный интервал для вероятности появления события в серии незави-
независимых испытаний.
Точечная оценка вероятности равна т = — = 0,3. Имеем а = 0,95, или = 0,025;
= 0,975. Точные табличные значения искомых вероятностей равны рн = 0,119
и рв = 0,543 (приводятся для последующего сравнения с аппроксимациями).
Рн =
Аппроксимация F-распределением B.5.2.2)
6 6
B0 - 6 + 1) • F0,975[2 ¦ B0 - 6 + 1); 2 ¦ 6] 15 • F0,975C0,12)"
Из таблиц или аппроксимаций (см. раздел 1.1.10) находим Fo,97sC0,12) = 2,963.
Тогда
* = 15^963 = 0Д35'
.F0,975[2-F + l);B0-6)] _ 7-^0,975A4,28)
20 - 6 + F + 1) • Fo,975[2 • F + 1); B0 -6)] 14 + 7 • Fo,9y5A4,28)'
7-23
Имеем (из таблиц или аппроксимаций) -Fo,975 = 2,3 и рв = = 0,535.
Окончательно получаем 0,135 ^J p ^ 0,535.
Аппроксимация распределением Пуассона B.5.2.3)
Имеем табличные значения Хо,э7бB • 6 = 12) = 4,4 и Хо,о2бB • 7 = 14) = 26,1.
Тогда
4,4 = 0,11; рв = — = 0,652;
40
*- 2-20 ' ' ' * 40
0,11 ^р^ 0,652.
Более точная аппроксимация:
= 0,118; рв = ^Ц = 0,555;
2 • 20 - 6 + - • 4,4+1 2 • 20 - 6 + - • 26,1
2 2
0,118 ^р^ 0,555.
Аппроксимация биномиальной суммы распределением хи~квадрат B.5.2.4)
1
/ 20 ¦— б 4- 1 \ 6 Л
Имеем А = — = 0,9454647; ifcB0,6) = = 17,336747; Ш0,7) = 16,762.
Находим из таблиц Хо97бA2) = 4,4 и Xo,o2sA4) = 26,1.
188 Оценка параметров распределений вероятностей [Гл. 2
Окончательно получаем
/ 4,4
{ 2 • 17,3
= 1 - exp <J — 1 = 0,119; рв = 1 - exp J —— } = 0,541;
1 ° ^,336] [ 2-16,762/
0,119 ^р ^ 0,541.
Аппроксимация нормальным распределением B.5.2.5)
Аппроксимация 1:
Имеем C/i+a = С/0,975 = 1,96.
2
Тогда
6 + 0,5 • 1,Э62 - 1,96 • у ^ • B0 - 6) + \ ¦ 1,96* ^ _ 6 +1,9208 +1,96-уЧ2 +0,9604.
~ 20 + 1,962 ' Рв ~~ 23,8416 '
0,145 ^р ^ 0,519.
Аппроксимация 2 (arcsin):
1г I—
= 0,124: рв = sin2 arcsin\ 1 ¦== • 1,96 I =0,513:
V 20 2.V20 '
0,124 ^р^ 0,513.
Аппроксимация 3:
6-0,5 1,96 / 6 - 0,5 Л 6 - 0,5
0,5 1,96 /6 + 0,5 / 6 + 0,5 \ пк._
+ ^ ' ( " ^^ ' = °'530;
р- ^ + 15
0,079 ^ р ^ 0,530.
Аппроксимация 4:
6 - 0,5 + - • 1,962 - 1,96 ¦ W6 - 0,5 - — ¦ F - 0,5J + ^ - 1,962
20 + 1,962
6 + 0,5 + 1,9208 - 1,96 • 1/6,5 • 6,52 + 0,9604
рв = ¦ ^ ^^ ¦ = 0,543;
23,8416
0,128 ^ р ^ 0,543.
Аппроксимация 5:
20 ^20 - 1,962 У 20 ^ 20
_
6,5 1,96 /6,5 Л 6,5.
рв = ^ + . J _!_ . ( 1 !_ = 0,533;
20 ^/20 - 1,962 V 20 \ 20/
0,057 ^ р <: 0,533.
Аппроксимация 6 (Холла):
6 1,96 /6 Л б\ 1,962+0,5 Л 2-6
рв = 0,3 + 0,43827 • 0?45826 + 0,07236 • 0,4 = 0,530;
0,128 ^р^ 0,530.
2.5]
Оценка параметров биномиального распределения
189
Более точная аппроксимация:
20 V20
6-0,5 1,96 /6-0,5 / 6 - 0,5
Рн = —-г 1= • 4 / ._ -(I-
20
20
3-20
i_2.?zM)=0>ii2
20 f
М
= М + 0,43827 М/М . ( 1 _ М ) + 0,07236 • A - 2 • М) = 0,555;
20 \/ 20 V 20 / V 20 / ' '
0,112 ^р ^ 0,555.
Аппроксимация 7 (Моленара):
5- 1
Рн =
3-20
¦ 1,96J
- 1,96 ¦
6- 15
20
¦• 1
7- 1,962
18- 20
-21 •
7- 1,96^
18-20
20 +
2 + 1,96"
2
= 0,1194;
/7 • 14
6 • 0,95264 + 1,9472 + 1,96 • \l • 1,00877 - 0,18424
Pb ~~ 21,9472
0,119 ^p ^ 0,544.
Или более точная аппроксимация:
= 0,544;
5-
1-1,962\ 2 + 1,962 1-1,962
3- 20
6- 20
6- 15
20
¦ A
7-1,96^
18-20
-21-
7-1,962
18-20
20+ ¦
6 • 0,95264 + 1,9472 - 0,02368 + 1,96 •
2 + 1,96'
2
= 0,1183;
1,00877 - 0,18477 - 0,18424
21,9472
0,1183 ^ р ^ 0,5429.
Аппроксимация 8 (Закса):
6-1-
1,962
- 1,96-
Рн =
6-
7 - 1,962
18
15-
7- 1,9
18
20 + ц.IZ^__4
2 + 1,96^
20 + 2 • ¦ 1
= 0,5429;
= 0,116:
6 + 1,9472 + 1,96-
Рв =
6,82453 • 13,8253
17,93013
22,8944
0,116 ^р^ 0,5435.
Аппроксимация 9 (Полсона-Кэмпа-Пратта):
= 0,5435;
Рв =
81-7-14
- 9 • 20 - 8 - 3 • 1,96 ¦ ^/9 • 7 • 13 • A80 + 5 + 1,96J + 21
81-72 -9-7- B + 1,962)
= 0,5428;
190 Оценка параметров распределений вероятностей [Гл. 2
рн = 1 + 0,16 • I 102 + Б?88'383;0918 I = 0,1185; 0,1185 ^ р ^ 0,5428.
L ^ ' J J
Аппроксимация Титенко B.5.2.6)
Имеем
' 1 - 0,95 \ б
On = С20 = 38760; / = I 2 = 0,092707; d = Ш^ = 5,25;
20 ' J ' 38760 I ' ' 7-8
р = °'°92707 = 0,113809;
1 - - ¦ 0,092707
pi = 0,113809 • 11 + - • 5,25 • 0Д138092 • 1 + ^ 1 = 0,118.
[ 4 L (^5,25-0,1138092JJ J
Более точные оценки равны:
"=2,6; рн= 0,118+ 5,26-2,6.0,113809* =
7-10-21 ^ 4- A-5,25 -0Д138092)
В случае упрощенной формы записи имеем
/i _1_ 0 3\ 1>3
ш=-= 0,3; <р = 1 + 0,113809 • [ ' | • lg 20 = 1,40457;
n ^ 2 • 0,3 у
1 - 0,95 \ 14
2 = 0,37960; ^ = 6 ' 21 = 0,525; <т = 0;37960 = 0,44756;
38760 I 15'16 1-^-0,37960
^ = 1 + 0,44756 • A + 0,3) • [1,8 + A - 2,2 • 0,3) • lg 0,3] • lg 20 = 2,48535.
Окончательно получаем
рш = 0,113809 -{1 + -- 5,25 • 0Д138092 • 1 + ->--¦ i i = 0Ц887;
1 4 [ A~5,25-0Д1380Э242 ' '
рв = 1 - 0,44756 • ^ 1 + - • 0,525 • 0,447562 • Ц ^48535 . . =
1 4 ' ' [ A-0,525-0,447562JJ f
0,1189 ^р^ 0,504.
2.6] Оценка параметров гипергеометрического распределения 191
2.6. Оценка параметров гипергеометрического распределения
Случайной величиной ж, имеющей гипергеометрическое распределение, являет™
ся число дефектных изделий в выборке объема п из партии изделий объема JV,
содержащей D дефектных изделий. Практический интерес представляет оценка по
выборочному контролю числа дефектных изделий в партии.
Доверительный «-интервал для D определяется границами DH и DB, являющи-
являющимися целочисленными решениями неравенств
Р(х - 1, ?>н, п) ^ а; ?(х - 1, Д* + 1, п) < а;
Р(ж, DB; п) ^ 1 - а; Р(ж, Ds-l,n)>l-a.
где Р(ж, .D,n)— вероятность появления в выборке объема п ровно х дефектных
изделий, если в партии изделий их количество равно D.
Так как Р(ж, DB, п) = 1 — Р(в — ж — 1, iV — DB, n), то N — DB является нижним
доверительным пределом для N — D, построенным по случайной величине п — ж,
и тогда достаточно иметь решение неравенств для DH при различных a, iV, n и ж.
Таблицы таких решений для различных о;, n, iV - п и ж приведены в [25]. Они
составлены для в, удовлетворяющих неравенству 2п ^ N. При 2п < N таблицей
молено пользоваться со следующей заменой переменных:
п = N — щ N — щ Z)H — х = п — х.
Для заданных h,N — n по таблицам [25] находится значение, соответствующее
значению Z)H — х = п — ж, а затем и сама оценка Dn = xJrN — п — х.
Верхний а • 100%™й доверительный интервал для D по выборке объема п из
партии изделий объема N при х = О
где [у] —целая часть числа у.
Задача 78. В выборке объема п = 10 из партии объема N = 200 изделий не обнару-
обнаружено дефектных изделий (ж = 0). Найти верхнюю доверительную границу количества
дефектных изделий в партии (D) при доверительной вероятности а = 0,95.
Имеем
D ^ jl- A-0,95)То I . 200- i^—Ч =0,258865-195 = 50.
192 Оценка параметров распределений вероятностей [Гл. 2
2.7. Оценки при неизвестном законе
распределения вероятностей
2.7.1. Оценки для центра распределения
В качестве первичных (достаточно грубых) оценок центра группирования значе-
значений случайных величин при неизвестном законе распределения вероятностей могут
быть использованы различные предельные неравенства.
2.7.1.1. Неравенства чебышевского типа
2.7.1.1.1. Неравенство Чебышева
Неравенство Чебышева имеет вид
^ к2'
где \х и а — соответственно среднее значение и стандартное отклонение.
Из неравенства Чебышева следует, что
X — , ^ /JL ^ X + , ,
V 1 — OL V 1 — OL
где а — доверительная вероятность.
Если вместо значения случайной величины х используется выборочное среднее
х = — \^ Х{. то имеет место неравенство
х —
/пA - а) у/п{1 - а)
Если известно, что распределение симметрично относительно центра /i, то до-
доверительный интервал равен
» ^ х + о п— или х - „ / ,. ^ М
3V^(l-«)
Отсюда легко видеть, что только знание того факта, что распределение случай™
ной величины симметрично, уже позволяет построить более узкий доверительный
интервал для центра распределения.
2.7.1.1.2. Неравенство Кантелли
P(x^fi^X)^ / 2, А^О.
Отсюда следует /j, ^ х — а
2.7.1.1.3. Неравенство Мейделя
Если распределение х имеет единственный максимум в точке /io, причем
т = а2 + (/i — /jLq) , s = -, то имеет место неравенство
P(\x-w,\
2.7] Оценки при неизвестном законе распределения вероятностей 193
откуда
3 3
ИЛИ Ж — -OLT ^ /X ^ X + Г «Г.
2.7.1.2. Оценка Нётера
Нётер [183] показал, что с коэффициентом доверия
доверительный интервал для центра симметричного распределения определяется
неравенствами
1 1
где Х{ — i-я порядковая статистика.
Значения а для различных g и h табулированы в [183].
При g + h > 12 имеет место аппроксимация
а « 1 — 2Ф
где Ф(ж) — функция стандартного нормального распределения.
Для распределений нормального типа оптимальная величина g ~ 0,27тг.
Задача 79. Имеются результаты наблюдений над случайной величиной с неизвест-
неизвестным законом распределения вероятностей (известна только дисперсия а2 = 75):
хц 1,2; 3,4; 6,1; 8,3; 12,1; 13,1; 14,8; 16,7; 21,9; 23,7; 24,5; 28,4.
Найти доверительный интервал для центра распределения при а = 0,95.
Неравенство Чебышева B.7.1.1.1)
Имеем
х = 14,516; 14,516 . ^ /i ^ 14,516 +
/12 A 095)
^ /i ^ 14,516 + . =;
A - 0,95) ^/12 • A - 0,95)
3,336 ^ fi ^ 25,696.
Если бы мы располагали информацией о том, что распределение вероятностей слу-
случайной величины х симметрично, то имело бы место
14,516 ^ II <С 14,516 + ; 7,062 ^ д ^ 21,96,
3 • v/12 • 0,05 3- ^12-0,05
т. е. доверительный интервал длины 25,696 — 3,336 = 22,36 уменьшался бы в 1,5 раза до
21,96 - 7,062 = 14,898.
Оценка Нётера B.7.1.2)
Находим g ^0,27- 12 = 3. Будем использовать для оценки величины g = 3 и h = 5.
Тогда центр распределения находится в интервале
I - (х3 + х8) < fji < I • (х5 + жю); \ • F,1 + 14,8) < // < i • A2,1 + 23,7);
10,45 < -—- < 17,9.
7 А. И. Кобзарь
194 Оценка параметров распределений вероятностей [Гл. 2
Вероятность попадания /х в этот интервал равна
• A + 7 + 21) ^0,55.
\ А I
2.7.2. Оценка рассеяним распределения
Некоторое представление о степени рассеяния непрерывного распределения
дают его выборочные квантили. В общем случае доверительный интервал для
р-квантили ограничен элементами упорядоченной по возрастанию выборки с но-
номерами г и s, так как доверительная вероятность равна [5]
s-1
i=r
где /р(а, Ь) — функция бета-распределения с параметрами а жЬ.
п — г
Если s = п — г + 1 (случай симметричного интервала), то а = ^ СгпргA — р)п~г.
Значения г и s при р = 0,25 и р = 0,75 (т. е. для 25%- и 75%-х квантилей — кварти-
квартилей) для различных п и а приведены в [46].
Разность между Жо,75 и жо,257 называемая интерквартильной широтой, является
характеристикой степени рассеяния распределения относительно его центра.
Задача 80. В условиях задачи 79 найти доверительный интервал для 25%-й квантили
распределения.
Предположим, что г = 3 и s = п ~ г + 1 = 10. Тогда доверительная вероятность
того, что в интервале [жз — жю] находится 25%-я квантиль (р = 0,25), равна
9
а = ]Г С{2 - 0,25* • A - 0,25I2^ = 0,5521664.
2.8] Некоторые специальные практические задачи 195
2.8. Некоторые специальные практические задачи
В этом разделе мы рассмотрим ряд задач, встречающихся в практике оценки
надежности технических систем. Эти задачи носят специфический характер и не
рассматриваются в широко распространенных учебных и рекомендательных посо-
биях.
2.8.1. Оценка интенсивности отказов с периодом приработки
Известно, что в классическом варианте экспоненциального распределения
f(x) = Аехр(^Аж) его параметр А = const. На практике обычно интенсивность
отказов А не является постоянной. Начальный этап работы изделия, характери-
зующийся увеличением интенсивности отказов, называется периодом приработки.
Будем анализировать следующую модель изменения интенсивности отказов во
времени:
Если время приработки мало (а это обычная практическая ситуация), т.е. когда
7o?7i ^ а? то Для случая, когда п изделий испытываются в течении времени tn,
оценки параметров a, 7i и 7© имеют вид [184]
1 , г 1 - г2 л 1 ГгГз — rl л (п — г2K
а = — т ; 7о = т г 5 7i = а
i r r t щг 2г + г)
ti г2^г3' /u tin(n-2r2+r3)' ' n(n -2r2+r3J '
где ti = —?n; r^ — количество отказов изделия в промежутки времени t\ = i^ =
1
- *з - з*п-
Эффективность таких оценок по отношению к оценкам максимального правдо™
подобия « 0,90 для 7о « 0,95, 71 ~ 0,90 -г- 0,95 и а « 0,90 -г- 0,99.
Задача 81. 20 изделий были испытаны в течение 900 ч. При этом в первые 300 ч
получены 4 отказа^ во вторые 300 ч — 1 отказ^ в последние 300 ч отказов не было.
Найти оценку интенсивности отказов с учетом ее изменения во времени.
Имеем tn = 900; ?i = ?2 = ^з = 300; п = 4; г2 = 1; гз = 0. Вычислим оценки а = х
300
х In -^—^ = 3,662 • 10^3; 7о = — • 4°°^г— = 1 66 • 10; 71 = 9 = 6,75.
1-0 300 4-2-1 + 0 D-2 + 0J
Имеем A(t) = 1,666 • 10~3 + 6,75 • е^3'662-10™3^ = 15б66 • 10~3 + 6,75 • @,0134)*.
2.8.2. Прогнозирование для экспоненциальных выборок
Для практики представляет интерес следующая задача. Имеются данные по
моментам отказов т изделий. Необходимо найти нижний доверительный предел
с вероятностью а для среднего времени наработки до отказа для к будущих выборок
объема п.
-I m
Предположим, что ti, ^2, ..., tm — наблюдаемые моменты отказа и i = — У^ tj.
Отберем к выборок объема п. Тогда а • 100%-я доверительная нижняя граница для
средних наработок до отказа будущих к выборок есть
, 2n, 2m, 1 — a),
где ш{к^ 2n, 2m, 1 — a) —коэффициенты оценки.
196
Оценка параметров распределений вероятностей
[Гл. 2
В [185] для коэффициентов ш(...) предложена аппроксимация
FBm,2n;ak)
Значения коэффициентов V = FBm, 2щ afc) приведенв! в табл. 48.
Таблица 48
п
3
5
10
20
Значения /' =
п = 2
к
2
0,8
0,5
0,2
0,1
3
1,1
0,7
0,4
0,2
5
1,4
0,9
0,4
0,2
8
1,5
0,8
0,4
0,3
12
1,7
0,9
0,5
0,2
= F{2
m,2r
ца*)
для
а =
п = Ъ
к
2
1,9
1,1
0,5
0,3
3
2,8
1,6
0,8
0,4
5
3,6
2,1
1,0
0,5
8
4,0
2,5
1,1
0,5
12
4,7
2,7
1,3
0,6
0,95
185]
п = 10
к
2
3,3
2,0
1,0
0,5
3
4,9
3,0
1,5
0,7
5
6,5
4,1
2,0
0,9
8
7,9
4,9
2,3
1,0
12
9,0
5,6
2,6
1,2
а • 100%~ая нижняя граница наработки на отказ к будущих выборок объема п
по данным i и т равна [186]
111111 kFBm, 2щ а)'
где FBm^ 2щ а) — «-квантиль i^-раепределения с Д = 2т и /2 = 2п степенями сво-
свободы.
Задача 82. В результате испытаний получены отказы изделий в моменты време-
времени (ч): t\ = 26, ?2 = 38, ?3 = НО, ?4 = 250, ?5 = 300. Необходимо найти нижнюю 95%-ю
границу средних наработок на отказ в пяти будущих выборках изделий объема п = 10
каждая.
1 5
Имеем t = - • ]Р U = 144,8. Из табл. 48 для fc = 5, п=10ит = 5 находим I1 = 4,1.
5 i=i
Следовательно, искомая величина равна tmin =
144,8
4,1
= 35,31 ч.
Для нижней 95%-й границы наработки на отказ имеем (!*о,95A0,20) = 2,35):
t 144,8
5 -^0,95A0,20) 5- 2,35
= 12,32 ч.
2.9] Планирование экспериментов для оценки параметров распределений 197
2.9. Планирование экспериментов
для оценки параметров распределений
2.9.1. Нормальное распределение
2.9.1.1. Оценка среднего при известной дисперсии
Объем выборки, необходимый для оценки среднего /л с заданной предельной аб-
абсолютной ошибкой е и доверительной вероятностью а при известной дисперсии а2,
определяется соотношением
( иао~
Можно использовать аппроксимацию иа « 4,91 [а0'14 — A — аH'14].
Тогда имеем
га = 24,1081 I- L°'14 ^ -Л°'14
Задача 83. Напряжение зажигания газоразрядного прибора распределено нормально
со стандартным отклонением а = 50 В. Найти объем выборки, позволяющий оце-
оценить среднее значение напряжения зажигания с предельной абсолютной ошибкой
е = 20 В при доверительной вероятности а = 0,95.
Имеем
п = 24,1081 • |~ [0,950'14 - A - 0,95H'14] V = 17.
Следовательно, желаемая точность оценки с вероятностью ^ 0,95 достигается при
объеме выборки п ^ 17.
2.9.1.2. Оценка среднего при неизвестной дисперсии
Необходимый объем выборки определяется из соотношения
я — ? — ta s
X л/пХ^
где ta — а-квантиль распределения Стьюдента при / = п степенях свободы; s и х —
выборочные оценки соответственно стандартного отклонения и среднего значения.
Необходимые значения приведены в табл. 49.
Определение объема выборки происходит в следующей последовательности.
Сначала по заданным величинам 5 = — и а и предполагаемому значению коэффи-
s r Л(Л ta(n)
циента вариации v = — по табл. 49 находим значение —)=+ и по нему определяем
х у/п
искомое значение п.
Если для найденного объема выборки п выборочное значение окажется больше
предполагавшегося, то эксперимент должен быть продолжен.
Укажем один частный случай, основанный на чрезвычайно простой аппрокси™
мации ta(n) для а = 0,975:
= 2 / ^ (Ц)
В этом случае по заданной абсолютной ошибке е и предполагаемому стандарт™
ному отклонению s может быть непосредственно определен объем необходимой
198
Оценка параметров распределений вероятностей
[Гл. 2
Таблица 49
ть
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
а
0,90
0,899
0,739
0,715
0,657
0,611
0,574
0,541
0,515
0,491
0,471
0,453
0,436
0,422
0,410
0,396
0,386
0,376
0,366
0,357
0,349
0,95
1,150
1,000
0,890
0,816
0,754
0,706
0,663
0,630
0,598
0,572
0,550
0,530
0,512
0,495
0,479
0,466
0,454
0,442
0,431
0,421
0,99
1,800
1,510
1,320
1,190
1,080
1,000
0,936
0,881
0,833
0,797
0,762
0,730
0,704
0,679
0,655
0,637
0,618
0,601
0,585
0,571
Значение
ть
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
[ ta(n)f
а
0,90
0,342
0,334
0,328
0,322
0,316
0,310
0,304
0,295
0,290
0,288
0,286
0,282
0,278
0,274
0,270
0,266
0,264
0,260
0,256
0,253
0,95
0,412
0,403
0,394
0,387
0,380
0,372
0,366
0,354
0,349
0,347
0,346
0,344
0,333
0,329
0,324
0,320
0,316
0,312
0,308
0,304
0,99
0,558
0,545
0,532
0,521
0,513
0,502
0,492
0,475
0,468
0,463
0,461
0,459
0,447
0,441
0,434
0,428
0,422
0,417
0,411
0,406
ть
45
46
47
48
49
50
55
60
65
70
75
80
90
100
120
150
200
250
300
400
а
0,90
0,250
0,248
0,245
0,242
0,240
0,237
0,226
0,216
0,207
0,199
0,192
0,186
0,175
0,166
0,151
0,135
0,117
0,104
0,095
0,082
0,95
0,300
0,297
0,294
0,290
0,287
0,284
0,270
0,258
0,248
0,238
0,230
0,222
0,209
0,198
0,181
0,161
0,139
0,124
0,114
0,098
0,99
0,401
0,396
0,392
0,388
0,383
0,379
0,360
0,343
0,329
0,316
0,305
0,295
0,277
0,263
0,239
0,213
0,184
0,164
0,150
0,129
выборки п. Как и ранее, если значение s в эксперименте окажется больше пред™
полагавшегося, то эксперимент должен быть продолжен.
Задача 84. Определить необходимый объем выборки для оценки среднего значения
с предельной относительной ошибкой S = 0,4 при доверительной вероятности а = 0,95,
если предполагаемое значение коэффициента вариации равно v = 0,1.
Имеем —'—=— = 5 = 0,4. Тогда из табл. 49 для а = 0,95 непосредственно находим
Необходимый объем выборки для оценки среднего значения с относительной точно-
точностью - = 0,4 при а = 0,975 равен п = [ 2 • — ) + 2 = 27.
з V 0,4/
2.9.2. Распределение Вейбулла
Значения необходимых объемов выборок для оценки среднего значения случай™
ной величины, имеющей распределение Вейбулла с известным параметром /3, при
S S
различных значениях 6 = —,аиу= — приведены в табл. 50, заимствованной из [44].
Зависимость /3 от v приведена в табл. 39, из которой по заданному значе-
значению /3 может быть оценено v. Может быть также использована аппроксимация
Задача 85. Определить для распределения Вейбулла с параметром /3 = 1,8 объем
выборки, необходимый для оценки среднего значения с относительной погрешностью
S = 0,15 при а = 0,95.
Имеем и w 1,8~ ' = 0,58. Из табл. 50 интерполяцией находим п = 52. Следователь-
Следовательно, необходимо испытать 52 прибора.
2.9]
Планирование экспериментов для оценки параметров распределений
199
Таблица 50
V
0,40
0?45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
Значеним п
для распределения Вейбулла
а = 0,95
S
0,05
175
225
250
300
400
500
600
600
800
800
800
1000
0,10
45
60
75
90
113
138
150
175
200
225
250
250
0,15
25
30
37
45
54
60
75
80
100
113
125
138
0,20
15
19
23
28
33
38
45
50
57
65
75
80
0,25
10
13
17
20
23
27
32
36
38
45
50
54
Q
= 0,975
S
0,05
250
300
400
450
500
600
800
800
1000
1000
1000
1000
0,10
64
87
110
130
150
200
225
250
275
300
400
400
0,15
33
42
53
64
76
87
110
120
140
150
175
200
0,20
20
26
32
39
46
55
64
72
80
94
110
120
0,25
14
19
23
28
32
38
44
50
55
64
72
76
2.9.3. Биномиальное распределение
Предположим, что задано некоторое значение параметра биномиального рас-
распределения— ро. Тогда наименьший объем ьыборки, необходимый для того, чтобы
подтвердить с вероятностью а, что р ^ ро, равен
п =
1пA - а)
ln(l-po)'
Если среди п испытанных приборов не будет ни одного отказа, то с вероятно-
вероятностью а можно утверждать, что р ^ ро-
Рассмотрим еще одну практическую задачу. Имеем совокупность из N приборов
с г дефектными приборами (доля дефектных приборов равна ро). Необходимо для
предполагаемой величины доли дефектных приборов ро найти объем выборки п, ко-
который с заданной достоверностью а обеспечивает заданную длину доверительного
интервала I для оценки ро- Необходимый объем выборки п в этом случае равен [187]
-1
п =
ui+app(l — ро)
Для квантили нормального распределения можно использовать аппроксимацию
uj+a = 24,1081
2
0,14
1 - а
0,14'
Приведем еще один результат. Если необходимо найти такой объем выборки п,
для которого, при числе дефектных изделий в ней х = 0, с вероятностью а можно
утверждать, что в партии размера N число дефектных изделий будет не более к,
то можно использовать неравенство
" к-1
где [... ] — целая часть числа в скобках.
200
Оценка параметров распределений вероятностей
[Гл. 2
Задача 86. Найти объем выборки, позволяющий с достоверностью а = 0,90 уста-
установить, что доля дефектных изделий в партии не превышает заданную величину
Ро = 0,05.
ln(l -a) _ In0,1
Имеем п =
ln(l-po) In 0,95
i 45.
Задача 87. Необходимо найти объем выборки, при котором для заданной доли дефект-
дефектных приборов Ро = 0,1 в партии из N = 200 приборов будет с вероятностью а = 0,95
получен доверительный интервал для оценки Ро длиной I = 0,2.
Имеем
I °5°4
a = Uq 975 = 1,96 И П = < 5
2^ [1,962-0,1-0,9
1
200
^ «9.
Задача 88. Найти объем выборки п, для которого, при отсутствии в выборке дефект-
дефектных приборов, с достоверностью а = 0,95 можно утверждать, что в партии N = 1000
приборов будет не более 100 дефектных приборов.
Имеем га = 1 - A - 0,95) ioo • 1000 =28.
100
2.9.4. Экспоненциальное распределение
Предположим, что в течение некоторого времени tm испытывается п приборов
и при испытаниях обнаруживается г отказов. Необходимо определить значения п
и г, обеспечивающие оценку интенсивности отказов Л с заданной относительной
предельной ошибкой 8 при доверительной вероятности а.
При испытаниях невосстанавливаемых приборов требуемый объем выборки ра-
равен
П =
где Ад — предполагаемое значение интенсивности отказов; а — коэффициент, зави™
сящий от г и а.
Значения коэффициента а^г^а) приведены в табл. 51. Значения г находятся из
соотношения A + <5) х = Ь, где Ь — коэффициент, зависящий от г и а (его значения
приведены в табл. 52). По заданным значениям а и 8 сначала определяется Ь,
затем по заданному значению а и вычисленному Ь из табл. 52 находится г. Далее
Таблица 51
Значения о (г, а)
1
2
3
4
5
6
8
10
15
а
0,90
0,43
0,51
0,57
0,60
0,62
0,65
0,68
0,70
0,74
0,95
0,33
0,42
0,48
0,52
0,55
0,57
0,61
0,64
0,68
0,99
0,22
0,30
0,36
0,40
0,43
0,46
0,50
0,53
0,59
20
25
30
40
50
60
80
100
150
а
0,90
0,77
0,79
0,80
0,83
0,84
0,86
0,87
0,88
0,90
0,95
0,72
0,74
0,76
0,78
0,80
0,82
0,84
0,86
0,88
0,99
0,63
0,66
0,68
0,71
0,74
0,76
0,78
0,80
0,84
200
250
300
400
500
600
800
1000
а
0,90
0,92
0,92
0,93
0,94
0,94
0,95
0,96
0,96
0,95
0,89
0,90
0,91
0,92
0,93
0,94
0,94
0,95
0,99
0,86
0,87
0,88
0,89
0,90
0,91
0,92
0,93
2.9]
Планирование экспериментов для оценки параметров распределений
201
Таблица 52
Значения Ь(г, ск)
1
2
3
4
5
6
7
8
9
10
а
0,90
0,26
0,38
0,45
0,50
0,54
0,57
0,59
0,62
0,63
0,65
0,95
0,21
0,32
0,39
0,44
0,48
0,51
0,53
0,55
0,57
0,59
0,99
0,15
0,24
0,30
0,35
0,38
0,40
0,44
0,46
0,48
0,50
11
12
13
14
15
20
25
30
40
50
а
0,90
0,66
0,67
0,68
0,69
0,70
0,74
0,76
0,78
0,81
0,83
0,95
0,60
0,62
0,63
0,64
0,65
0,69
0,72
0,74
0,77
0,79
0,99
0,51
0,53
0,54
0,55
0,56
0,60
0,64
0,66
0,70
0,73
60
80
100
150
200
250
300
400
500
600
а
0,90
0,84
0,86
0,88
0,90
0,91
0,92
0,93
0,94
0,94
0,95
0,95
0,81
0,83
0,85
0,87
0,89
0,90
0,91
0,92
0,93
0,94
0,99
0,75
0,78
0,80
0,83
0,85
0,86
0,88
0,89
0,90
0,91
для найденного значения г и заданного а по табл. 51 находится значение а(г,а),
и по заданному im и предполагаемому значению Aq вычисляется требуемый объем
выборки п. В случае испытаний восстанавливаемых приборов может быть получена
оценка необходимого времени испытаний
То,
а(г,а)
где Tq — ожидаемое время наработки на отказ.
Задача 89. Найти требуемый объем испытаний для оценки интенсивности отка-
отказов невосстанавливаемого прибора^ если заданы время испытаний tu = 1000 ч, предель-
предельная относительная ошибка S = 0,2, предполагаемое значение интенсивности отказов
Ло = Ю™3, доверительная вероятность а = 0,95.
Находим
1
= 0,833. Из табл. 52 для Ь(г, а) = 0,833 и а = 0,95 находим
5 1 + 0,2
г = 80. Из табл. 51 для г = 80 и а = 0,95 находим а(г^а) = 0,84. Тогда искомый объем
выборки п = 5 =95.
10~3 • 1000 • 0,84
2.9.5. Гамма-распределение
Для оценки среднего значения случайной величины, имеющей гамма-распреде-
гамма-распределение с параметром а1 с предельной относительной ошибкой S при доверительной
вероятности 7? объем выборки должен быть не менее
где
""" (а + 1)^'
- 7-квантиль стандартного нормального распределения.
Задача 90. Определить объем выборки^ позволяющей найти с предельной относи-
относительной ошибкой S = 0,05 при доверительной вероятности 7 = 0,95 среднее значение
случайной величины, имеющей гамма-распределение с параметром а = 2.
Имеем искомый объем выборки
«0,95 1,6452 1Q
п = г = = 18.
B + 1)-0,05 0,15
ГЛАВА 3
МЕТОДЫ АНАЛИЗА ЗАКОНОВ РАСПРЕДЕЛЕНИЯ
ВЕРОЯТНОСТЕЙ СЛУЧАЙНЫХ ВЕЛИЧИН
Общие положения. Для практического применения методов теории вероят-
ностей и математической статистики знание закона распределения вероятностей
чрезвычайно важно. По существу, сама изучаемая случайная величина для иссле-
исследователя представлена только законом распределения вероятностей реализации ее
значений.
Зная закон распределения вероятностей наблюдаемой случайной величины, ис-
исследователь или инженер в состоянии решать многие практические задачи, свя-
связанные с планированием производства, обеспечением качества продукции, оценкой
эффективности и стабильности производства.
Попытка применить методы анализа результатов наблюдений, разработанные
для конкретных законов распределения вероятностей, в условиях, когда реальное
распределение отличается от гипотетического, является самой распространенной
на практике ошибкой, приводящей к неверным выводам и, в конечном итоге,
к существенным материальным потерям и затратам времени.
Именно поэтому любая обработка результатов наблюдений должна неизменно
начинаться с ответа на главный вопрос: каково распределение вероятностей обраба-
обрабатываемого ряда случайных величин? На практике эта проблема обычно формули-
формулируется следующим образом. Выдвигается гипотеза — „наблюдаемое распределение
случайных величин описывается некоторым конкретным законом (нормальным,
экспоненциальным, Вейбулла, ...)". Задача первичного исследования — принять
или отклонить выдвинутую гипотезу.
Если ни одна из гипотез, связанных с формой закона распределения вероятно-
вероятностей, не принимается, то может быть сформулирована более мягкая гипотеза — на-
например, „наблюдаемое распределение симметрично относительно какой-то точки".
Даже установление только этого факта дает в руки исследователя более эффек-
эффективные методы анализа наблюдений, чем полное незнание закона распределения
вероятностей. И, наконец, если исследователь не получил достаточных оснований
для выбора вида распределения, то возникает задача подбора формы распреде-
распределения непосредственно по экспериментальным данным. При этом распределение
вероятностей должно быть подобрано так, чтобы оно удовлетворительно описывало
имеющийся экспериментальный материал.
Мы встречаемся здесь с понятием статистической гипотезы. Статистической
гипотезой называется предположение, выдвигаемое относительно особенностей
распределения вероятностей случайной величины, которое проверяется по резуль-
результатам наблюдений над ней.
Проверка любой статистической гипотезы сводится к следующему. По выбороч-
выборочным значениям случайной величины подсчитывается некоторая величина — стати-
статистический критерий (статистика критерия). При допущении, что распределение
вероятностей используемой статистики критерия в условиях справедливости про-
проверяемой гипотезы известно, определяется вероятность появления вычисленного
Методы анализа законов распределения вероятностей случайных величин 203
значения статистики. На основе так называемого принципа значимости устанав-
устанавливается уровень значимости — наибольшее значение вероятности, несовместимое
с признанием случайности экспериментально вычисленного значения статистики
критерия. Событие называется значимым (а не случайным), если теоретическая
вероятность его случайного появления меньше, чем принятый уровень значимости.
Уровнем значимости определяется критическое значение статистики критерия. Как
правило, если значение статистики критерия, вычисленное по экспериментальным
данным, больше критического, то гипотеза отклоняется на выбранном уровне
значимости. В противном случае она признается не противоречащей результатам
наблюдений. Дополнение до единицы уровня значимости называется уровнем до-
достоверности (достоверностью).
Поскольку статистика критерия для проверки гипотезы вычисляется по вы-
выборочным реализациям случайной величины, то и сама она является случайной
величиной. Поэтому суждения по гипотезе на основе статистики критерия могут
носить только вероятностный характер. При этом различают ошибки первого рода,
заключающиеся в отклонении верной гипотезы, и ошибки второго рода^ заключа-
заключающиеся в принятии ложной гипотезы. Вероятность ошибки первого рода совпадает
(по крайней мере не выше) с уровнем значимости и обозначается в литературе через
а. Ошибка второго рода обозначается через C. Эффективность статистического
критерия проверки гипотезы оценивается его мощностью 1 — /3, равной вероятности
отклонения ложной гипотезы.
Выбор значений а и /3 определяется условиями эксперимента и требованиями,
предъявляемыми к достоверности суждения по проверяемой гипотезе. Обычно на
практике используются значения а, /3, равные ОД; 0,05; 0,01.
Проверяемая гипотеза называется нулевой и обозначается символом Но. Напри™
мер, запись Но '• F(x) = G(x) означает, что проверяется нулевая гипотеза о совпаде-
совпадении функций распределения F(x) и G(x). Подробно теория статистических гипотез
изложена в [1, 132, 188-192].
В классификации статистических критериев проверки гипотез о законе рас-
распределения вероятностей принята определенная терминология. Такие критерии
подразделяются на два класса — общие критерии согласия и специальные критерии
согласия. Общие критерии согласия применимы к самой общей формулировке
гипотезы, как гипотезы о согласии наблюдаемых результатов с любым априорно
предполагаемым распределением вероятностей. Специальные критерии согласия
предполагают специальные нулевые гипотезы, формулирующие согласие с опре-
определенной формой распределения вероятностей — нормальной, экспоненциальной,
Вейбулла и т. д. Такие критерии носят соответствующие названия — критерии нор-
нормальности, критерии экспоненциальности и т. п.
Естественно, что при формулировании специфических требований общие крите-
критерии согласия могут быть трансформированы в специальные критерии. Следует от-
отметить, что многообразие возможных альтернатив, противостоящих нулевой гипо-
гипотезе, порождает и чрезвычайное многообразие статистических критериев, имеющих
различную мощность по отношению к различным альтернативам. Поэтому далее
приведена весьма большая гамма известных статистических критериев, впервые
собранная в одной книге.
204 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.1. Общие критерии согласия
Нулевая гипотеза при применении общих критериев согласия записывается
в форме
Но: Fn(x) = F(x),
где Fn(x)—эмпирическая функция распределения вероятностей; F{x)—гипотети-
F{x)—гипотетическая функция распределения вероятностей.
Все известные общие критерии согласия можно разбить на три основные группы:
— критерии, основанные на изучении разницы между теоретической плотностью
распределения и эмпирической гистограммой;
— критерии, основанные на расстоянии между теоретической и эмпирической
функциями распределения вероятностей;
— корреляционно™регрессионные критерии, основанные на изучении корреляци™
онных и регрессионных связей между эмпирическими и теоретическими порядко-
порядковыми статистиками.
Кроме критериев, входящих в перечисленные группы, известен ряд критериев,
использующих специфичные характеристические свойства различных распределе-
распределений, и они будут представлены в книге в разделах, посвященных специальным
критериям согласия, ориентированным на фиксированные нулевые гипотезы.
3.1.1. Критерии, основанные на сравнении теоретической плотности
распределения и эмпирической гистограммы
3.1.1.1. Критерий согласим %2
Критерий основан на сравнении эмпирической гистограммы распределения слу-
случайной величины с ее теоретической плотностью. Диапазон изменения эксперимен-
экспериментальных данных разбивается на к интервалов, и подсчитывается статистика
2
х ~
2^, nPi
i=t
где щ — количество значений случайной величины, попавших в г-й интервал;
к
п = ^2,пг — объем выборки; F{x) — гипотетический теоретический закон распре™
деления вероятностей случайной величины; щ = F{xi+\) — F{xi)—теоретическая
вероятность попадания случайной величины в г-й интервал.
Дисперсия статистики критерия х2 равна [193]
к
Если 2_^ — < п и fe < п, то D(%2) = 2(к — 1), т. е. совпадает с дисперсией случай™
г=1
ной величины, имеющей %2™распределение. На этой основе принято считать, что
статистика %2 имеет распределение, близкое к распределению хи-квадрат (см. раз-
раздел 1.1.8).
На мощность статистического критерия %2 сильное влияние оказывает чис™
ло интервалов разбиения гистограммы (к) и порядок ее разбиения (т. е. выбор
длин интервалов внутри диапазона изменения значений случайной величины). На
практике принято считать, что статистику х2 можно использовать, когда npi ^ 5.
3.1] Общие критерии согласия 205
В [194, 195] показано, что такое приближение допустимо и тогда, когда не бо™
лее, чем в 20% интервалов имеет место 1 ^ npi ^ 5 (для гладких унимодальных
альтернатив). В [196, 197] рекомендуется при в ^ 200 выбирать к из условия
I 2
к = 4 {0,75(в ^ IJ}5 ~ 3,78(в ^ 1) 5. Можно рекомендовать еще одно простое пра-
правило— нужно выбирать как можно большее Aj, но не превышающее в/5. Исчер-
Исчерпывающие рекомендации по методологии выбора числа к приведены в проекте
методических рекомендаций „Прикладная статистика. Правила проверки согласия
опытного распределения с теоретическим. Часть 1. Критерии типа %2. Госстандарт
России, 2000 г.", разработанном Лемешко Б.Ю., Денисовым В. И. и Постовало-
вым С. Н. из Новосибиского государственного технического университета. Границы
интервалов рекомендуется выбирать случайно, исходя из условия pi = — = const.
Однако в [198] показано, что мощность критерия х2 с увеличением числа классов
разбиения снижается, и оптимальная мощность соответствует к ~ 10.
Укажем также на следующие правила выбора к:
Jfe = 1+ 3,32lgn [314]; k = b{^n~1)V [11],
где а, /3 — ошибки первого и второго рода; Ь — коэффициент из диапазона 2^4 (для
простой гипотезы и /3 ~ 0,05 рекомендуется Ь = 4 [194]); и7 —7гаКвантиль стандарт-
стандартного нормального распределения.
Так или иначе, статистика %2 имеет распределение хи™квадрат с / = п — 1 сте™
пенями свободы в том случае, когда проверяется простая нулевая гипотеза .Hq,
т.е., когда гипотетическое распределение, на соответствие которому проверяется
эмпирический ряд данных, известно с точностью до значения своих параметров.
Если гипотеза сложная и параметры гипотетического распределения оцениваются
по самой выборке, то число степеней свободы уменьшается на число оцениваемых
параметров т и равно f = к — 1 — т.
Правило проверки гипотезы просто: если
^^ npi
г=1
то на уровне значимости а, т. е. с достоверностью A — а) гипотеза Hq отклоняется.
Вопрос о выборе к с учетом частных альтернатив рассмотрен в [196, 199-201].
Например, в [196] показано, что против альтернативных распределений с „тяжелы-
„тяжелыми хвостами" необходимо выбирать к сравнительно большим. В [202] рассмотрена
частная задача построения х2-критерия со случайными интервалами разбиения для
проверки нормальности распределения, когда параметры распределения оценива-
1 п ( 1 п V
ются не по группированной выборке (х = — V^ xi\ s = < — У^(ж^ — хJ > ). Подроб-
Пг=1 [Пг=1 J
но такой подход рассмотрен в разделе 3.2, посвященном критериям нормальности
распределения.
Аппроксимация статистики %2 для малых значений pi и ее поведение изучались
в [203, 204] в сравнении с двумя другими критериями максимального правдоподобия
к ш к
Y2 = 2У^пЛп—L; Т2 = У^(лАг7+ \/щ+1 — \/4гш* + 1).
r-J npi -л
г=1 г=1
(в этом случае разница будет ощущаться на „хвостах" распределений).
206 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Показано, что критерий %2 предпочтительнее указанных критериев. Для случая
малых pi в [205] предложено правило: если k ^ 3 и число попаданий (ожидаемых)
г < 5, то можно использовать соотношение (пр{)ш-ш = 5™.
к
Если — N — велико (р{ мало), то дисперсия D(X2) > D(x2), т. е. в этом случае
П ^~i Pi
г=1
разница будет ощущаться на „хвостах" распределения. Поэтому в [203] предложена
аппроксимация х2-критерия с помощью двухпараметрического логарифмически
нормального распределения (см. раздел 1.1.3), как это предложено в [206]. Ап-
Аппроксимация имеет вид Р(х > z) « Р(^ > z), где z — логнормальная случайная
величина с параметрами распределения вероятностей /л и а:
Если иа — а-квантиль стандартного нормального распределения, то
Х^ = ехр(/х + aua). Мощность %2™критерия снижается в связи с тем, что он не
учитывает знака разностей (щ — npi)- Эту информацию использует критерий
серий. Его статистикой является число подряд следующих групп „плюсовых"
и „минусовых" значений (щ — npi). Например, для последовательности знаков
разностей (щ — пр^ „ ... + Н 1 Ы 1— ..." число плюсовых серий равно
М = 4, а число минусовых серий N = 4, общее число серий равно R = М + N = 8.
Известно, что
c\f~lX — 1 s~iX — 1 fiX — 2 s~iX — 1 i^ flX — 1 s~iX — 2
= 2x)= Cm-JCn-1; Р(Д = 2x - 1) = Cm-i0n_1+ Cu_xCn_1 ;
2MN . nrm 2MiVBMiV -M-N)
Случайная величина — распределена приблизительно нормально. Хотя
этот критерий имеет мощность меньше, чем %2-критерий, но он от него не зависит
и поэтому их можно использовать совместно.
Следует помнить, что при сложной гипотезе (т.е., когда параметры гипотети-
гипотетического распределения оцениваются по имеющейся единственной выборке) кри-
критерий х2 еЩе асимптотически независим от критерия серий, но в этом случае
распределение х2 известно лишь приближенно, а распределение критерия серий
совсем неизвестно. Таким образом, критерий, комбинирующий критерии %2 и се-
серий, применим только для полностью определенного (с точностью до параметров)
гипотетического распределения.
Если ol\ — уровень значимости для х -критерия, а а,2 — уровень значимости для
критерия серий, то уровень значимости комбинированного критерия будет равен
а = а1а2A - 1пага2).
Следует иметь в виду, что величина a = ^lnai«2 имеет распределение х2
с / = 4 степенями свободы, что и является, по существу, основанием для построения
комбинированного критерия.
3.1] Общие критерии согласия 207
В заключение приведем простые (хотя и не менее чувствительные) правила
проверки нулевой гипотезы (приближенные критерии):
— если х2 > /, то Hq отклоняется;
I 2 f I
— если R = -— ^ 3, то Hq отклоняется (критерий Романовского [207]).
V2/
Задача 91. Имеем ряд выборочных значений случайной величины (п = 100):
43
54
56
57
61
64
67
73
74
76
76
77
77
78
78
79
79
82
82
83
84
84
85
85
86
87
87
87
88
89
91
91
91
91
92
92
93
93
93
95
95
96
96
96
97
97
98
98
99
101
101
101
101
103
103
104
104
104
104
105
105
106
107
107
107
108
111
112
113
114
114
114
115
116
116
116
117
118
118
119
122
122
122
123
124
124
125
125
125
126
129
132
134
136
136
138
143
143
145
150
Необходимо проверить критерием %2 гипотезу о том^ что распределение случайной
величины не противоречит нормальному закону с параметрами /i=101 и а = 16 на
уровне значимости а = 0,1.
Сначала примем решение, на какое количество классов следует разбить гистограмму
эмпирического распределения. Различные рекомендации дают следующие результаты
(примем а = 0,1 и /3 = 0,2):
1 1
к = 4- [0,75- (?г-1J]5 =4- @,75 • 0,992) 5 =24; к = 1 + 3,321п?г = 1 + 3,32 In 100 = 8.
Учитывая, что первая рекомендация эффективна при п ^ 200, и исходя из огра-
ограничения к ^ — = 20, примем к = 8. Продемонстрируем теперь технику вычисления
5
теоретических вероятностей pi. Пусть х% и Жг+i—границы г-ro класса разбиения.
Тогда теоретическая вероятность попадания случайной величины в этот интервал
равна F ( —^ ) — F I — ) = pi, где F(x) —функция стандартного нормального
распределения.
Для нахождения F(x) можно использовать либо таблицы, либо аппроксимации.
Приведем одну аппроксимацию [36]
При х < 0 используется соотношение F(—x) = 1 —- F(x).
Вероятность попадания случайной величины в интервал Xi < х ^ жг+i, где хг = 90
и Жг+i = 100, равна
16 ) \ 16 ) \ 16 у V 16
Выберем границы классов разбиения из условия равномерного разбиения диапазона
изменения случайной величины на 8 классов, с условием попадания в крайние классы не
менее 5 наблюдений. Результаты сведем в таблицу:
208 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
i
1
2
3
4
5
6
7
8
Xi
< 70
70-80
80-90
90-100
100-110
110-120
120-130
> 130
щ
7
10
13
18
17
14
12
9
F(xi+1)
0,0263
0,0945
0,2458
0,4751
0,7131
0,8827
0,9650
1,0000
F(xi)
0,0000
0,0263
0,0945
0,2458
0,0475
0,7131
0,8827
0,9650
Pi
0,0263
0,0682
0,1513
0,2293
0,2380
0,1696
0,0824
0,0350
npi
2,6300
6,8200
15,1300
22,9300
23,8000
16,9600
8,2400
3,5000
(щ npiJ
19,0969
10,1124
4,5369
24,3049
46,2400
8,7616
14,1317
30,2500
{rii - npiJ
npi
7,2610
1,4830
0,2998
1,0600
1,9428
0,5166
1,7157
8,6428
100
1,0 10,1972 13,6512
= 22,9217
Итак, мы получили значение статистики критерия %2 = 22,9217. Теперь необходимо
найти критическое значение статистики, равное Xi_a (f = k — 1).
В нашем случае число степеней свободы равно / = ,fc — 1 = 8 — 1 = 7. Используем для
вычисления критического значения аппроксимацию Вилсона-Хилферти
где и а. — а-квантиль стандартного нормального распределения. В нашем случае для
1 — а = 1 — 0,1 = 0,9 имеем
Так как % = 22,92 > 11,98, нулевая гипотеза отклоняется, т.е. утверждение о том,
что исследуемая выборка взята из нормального распределения с параметрами ц = 101
и а = 16, не подтверждается.
Проверим возможность использования логнормальной аппроксимации для %2- Нахо-
Находим
1 = 114,4613; M = 21n7-llnG2-l+114'4613-7 ~2 7 + 2j> = 1,95068.
Pi ' ' ^ 2 I 100 ' '
Далее
2 , I.. Л
сг = In 149 - Ц
114,4613-49-14
¦
- 2 In 7 < 0.
Видим, что аппроксимация в нашем случае неприменима, так как > — & п.
i=lPi
Теперь применим комбинированный критерий знаков разности (щ — npi) с учетом
критерия серий. Последовательность знаков разности (jii —- npi) в нашем случае имеет
вид + + ++.
Таким образом, всего имеется R = 3 серии знаков, в том числе положительных М = 2
и отрицательных N = 1. Тогда имеем
М(Д) = 1+^ = 2,33; В(Д)=2?.-1;5Г!8:1:2:1) =0,222;
R-M(R) 302,33
B + 1J-(^
= 1,415.
Находим F(l,415) = 1 - 0,852 • ехр ( -
2,0637
Следовательно, уровень значимости ol\ = 1 — 0,9216 = 0,0784.
1,415 + 1,5774
2,34
= 0,9216.
3.1]
Общие критерии согласия
209
Для критерия Х2G) уровень значимости равен «2 ~ 0,0005 и а = ^2 In 0,0784 х
х 0,0005 = 20,29, что также отклоняет нулевую гипотезу, так как Хо,9бD) = 9,49 < 20,29.
Теперь приведем другой вариант решения задачи, чтобы продемонстрировать техни-
технику применения критерия %2- Предположим, что параметры распределения неизвестны
и определяются по выборке. Примем то же самое число классов разбиения — 8, од-
однако границы классов разбиения будем определять из условия щ = - = 0,125 = const.
к
Тогда, например, для первого класса должно быть F
= 0,125; — = wo,i2s;
s
х\ = х + s - и 1 . Для второго класса ж 2 = х + s • ito,255 и в общем виде х% = х + s • и i .
~k ' fc
Оценки параметров распределения по выборке равны
ж = -
п
= 100,77; s =
хг -х)\ = 21,691.
Для иа будем использовать аппроксимацию
л rki f 0,14 /-, \0,14l
иа Ра 4,91 • {а ' — A — а) ' ) .
Результаты расчетов сведены в таблицу:
г
1
2
3
4
5
6
7
8
< 75,84
75,84^86,18
86,18^99,37
99,37^100,77
100,77^102,17
102,17-103,74
103,74^105,85
> 105,85
щ
9
16
24
0
4
2
6
39
Pi
0,125
0,125
0,125
0,125
0,125
0,125
0,125
0,125
npi
12,5
12,5
12,5
12,5
12,5
12,5
12,5
12,5
(щ npiJ
12,25
12,25
132,25
156,25
72,25
110,25
42,25
702,25
(Пг - npiJ
npi
1,00
1,00
10,58
12,50
5,78
8,82
3,38
56,18
100 1,0
X
2 = 99,24
22 9217 — 7
Со всей очевидностью критерий отклоняет гипотезу нормальности распределения,
что видно по совершенно неестественному для нормального распределения правому
„хвосту" эмпирического распределения, делающего его явно несимметричным. Кри-
Критическое значение статистики в этом случае при / = ^^1^2 = 8^1^2 = 5 равно
/ I \ 3
/ 2 / 2 \
Xoj9 = 5-1 Ь 1,28 • 4/ = 9,2. Явное неравенство х2 = 99,24 > Хо,эE) = 9,2
отклоняет нулевую гипотезу.
Применение упрощенного критерия Романовского R =
отклоняет гипотезу.
3.1.1.2. Критерий числа пустых интервалов
Этот не очень мощный, но простой для применения критерий рассмотрен в [11].
Имеем выборку a?i, ..., хП1 разделенную на к интервалов в соответствии с гипотети™
ческим распределением. Обозначим через ад число оставшихся пустыми интервалов
(щ = 0). Тогда имеет место
= 4,25 > 3 также
= 7) = -гп
г=0
где
= с, с + 1, ..., к — 1; с = тах@, к — п).
210 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Математическое ожидание и стандартное отклонение числа пустых интервалов
равны соответственно
ТЬ
При 1с,в ^ ос, р = — >0 распределение ag асимптотически нормально с пара-
параметрами
М(а0) = fee"*, D(a0) = k [е~р - е~2рA + р)] .
Рекомендуется выбирать р = 1,255 или Aj « 0,8в (наилучшая сходимость к нор-
нормальному распределению). Тогда можно утверждать, что величина
и ао - ке~р
имеет стандартное нормальное распределение и, следовательно, критическое зна-
значение статистики равно
ао(а) = 0,285^ + ^«
Если эмпирическое значение числа пустых интервалов превысит ао(ск) {pt —
уровень достоверности), то с вероятностью а можно утверждать, что нулевая
гипотеза отклоняется.
Возможна модификация этого критерия для проверки совпадения двух эмпири-
эмпирических распределений, т. е. для проверки гипотезы Но: Fn(x) = Gn{x). Рассмотрим
выборку х\ ^ Х2 ^ ... ^ хП1 упорядоченную по возрастанию. На этой совокупности
определим интервалы 1\ —>• (—оо, Жх), /2 —>- (жх, Жг)? • • • > 4+i(^n) °°)- Предположим,
что имеется вторая выборка данных объема га, из которой г^ членов попадает
в 7^-й интервал разбиения первой выборки. Обозначим через uq число оставшихся
пустыми ячеек. Тогда
РD = а) = °прпСт^\ где а = с,с+1, ...,п; с = max@, n + 1 - га).
В пределе
а/г/ /\ гг + 1 —., ,ч (гг + 1I2 т
M(ao) = ^TT; D(ao) = ^T]^; / = -
, п+1
Следовательно, критическая величина af0(a) равна
где wa — a-квантиль стандартного нормального распределения.
3.1] Общие критерии согласия 211
Задача 92. Имеются выборки данных:
xf. 1, 3, 5, 7, 9, 11, 13, 18, 21, 23, 25, 30, 32, 34, 35, 37
уп -8, -7, 4, 5, 6, 7, 8, 12, 14, 15, 18, 19, 20, 21, 23, 25
Необходимо проверить критерием числа пустых интервалов при достоверности
а = 0,90 гипотезу о том, что случайная величина х подчиняется экспоненциальному
распределению с параметром — = 20. Проверить гипотезу о совпадении распределений
А
случайных величин х и у.
х
Имеем теоретическое распределение F(x) = 1 — е"~ 20 .
Находим fc^0,8-n = 0,8-16=12. Примем для упрощения расчетов к = 10
и pi = 0,1 в каждом интервале. Тогда для границ интервалов имеем уравнение
-20-1п[0,1- (г- 1)] =Xi.
Например, для Х2 имеем Х2 = ^20 • 1п[1 — 0,1 • B — 1)] = 2,1.
Получаем 10 интервалов:
0-=-2,1; 2,1^4,46; 4,46^7,13; 7,13-=-10,2; 0,2^13,86;
0,86^18,3; 18,3-=-24,1; 24,1^32,19; 32,19^46,05; 46,05 -=- оо.
Очевидно, что пустым остался один последний интервал, т.е. ао = 1.
Вычисляем
\ 16
- - — ) = 1,85;
D(a0) = 10 • 9 • I 1 1 + 10 • I 1 1-100
Следовательно, и = — 7 = —0,87. Критическое значение статистики при а = 0,90
(^о,эо = 1,28) равно
ао@,9) = 1,85 + 1,28 • ^0,952 = 3,1.
Так как ао = 1 < ао@,9) = 3,1, нулевая гипотеза отклоняется.
Теперь разобьем элементы первой выборки на 16 интервалов и проверим попадание
в них элементов второй выборки. Видим, что незаполненными остаются 7 интервалов,
. е. ад = 7. Тогда при I = — = 1 имеем
п
а{,@,9) = — + ! 28 . — . А/^±1 = ю,366.
ov , ; 1 + 1т ' 1 + 1 V 1 + 1
Так как ад @,90) = 10,366 > а0 = 7, нулевая гипотеза не отклоняется.
3.1.1.3. Квартильный критерий Барнетта-Эйсена
В [208] предложен простой непараметрический критерий проверки согласия
двух эмпирических распределений. Если разница в эмпирических распределениях
является следствием разницы в параметрах положения и дисперсиях, то квартиль™
ный критерий может быть более эффективным, чем другие известные критерии.
Предположим, имеются две выборки х\, ..., хш и t/i, ..., уп и (га + п) делит™
ся на 4. Объединим обе выборки в одну объема (га + п). Обозначим через сц
(г = 1,2,3,4) — число членов выборки х в г-й квартили объединенной выборки. Если
обе выборки принадлежат одному распределению, то щ имеет гипергеометрическое
распределение и
Р(«. = ^) = ^; М(аг) = -; D(a<)= ; Q = —.
212 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Введем обозначения
si = «1 + а4; d0 = а4 - «i; di = аз — а2.
Тогда имеют место соотношения:
M()
v f 4(m~
Введем обозначения
s =
В качестве критерия согласия предлагается статистика
имеющая при т, п —>• оо распределение хи-квадрат с / = 3 степенями свободы. Если
D > Ха(^)? то гипотеза Н® отклоняется.
Задача 93. Имеются две выборки объема га = п = 16 каждая:
Xii 1, 3, 5, 7, 9, 11, 13, 18, 21, 23, 25, 30, 32, 34, 35, 37
уц -8, -7, 4, 5, 6, 7, 8, 12, 14, 15, 18, 19, 20, 21, 23, 25
Необходимо проверить гипотезу о согласии эмпирических распределений в выборках
критерием Барнетта-Эйсена.
Составим объединенную выборку, отмечая в ней элементы обеих выборок с их по-
порядковыми номерами
^8 ^7 1 3 4 5 5 6 7 7 8 9 11 12 13 14
2/1 2/2 х\ х2 2/з хз 2/4 2/5 ж4 2/6 2/7 ж5 ж6 2/8 ж7 2/9
15 18 18 19 20 21 21 23 23 25 25 30 32 34 35 37
2/10 2/И Х8 2/12 2/13 2/14 Ж9 2/15 Ж10 Жц 2/16 #12 Ж13 #14 #15 #16
Имеем Q = = 8. В первой квартили (первых 8 членах объединенной выборки)
находятся а\ = 3 элемента выборки ж, во второй п2 = 4; далее «з = 2 и а4 = 7.
Имеем
5 = ai + 04 = 10; do = «4 — а = 4; d = аз — а = —2;
M(s) = - = 8; M(d0) = M(di) = 0; D(s) = ^^ = 2,0645 (\/D(s) = 1,4368);
D(d0) =
10 — 8 9 4 9
S = 1.39198 (S2 = 1,9376); d0 = —- = 1,9686 (d02 = 3,875);
= -0,9842 {di = 0,9687); D = s + dS + d? = 6,7813.
Для a = 0,90 и / = 3 имеем %о,эоC) = 6,251.
Так как D = 6,7813 > Хо,эоC)? нулевая гипотеза отклоняется.
3.1] Общие критерии согласия 213
3.1.2. Критерии, основанные на сравнении теоретической
и эмпирической функций распределения вероятностей
Обозначим через F{x) (х^ < Жг+i) эмпирическую функцию распределения вероят-
вероятностей, а через Ф(х) — теоретическую функцию распределения (xi = Ф™1 ( — )).
\ ТЬ /
Расстояние между эмпирической и теоретической функциями распределения
вероятностей является весьма эффективной статистикой для проверки гипотез
о виде закона распределения вероятностей случайной величины.
Среди известных критериев согласия такого типа отметим серию критериев,
использующих различные варианты анализа расстояния между F{x) и Ф(ж):
— критерий Джини A941 г.)
7(х)-Ф(х)\с1х;
— критерий Крамера-фон Мизеса A928 г.)
f г , ч , „9
I | Л. I JU I jbr I du I j Ll/Ju «
— критерий Колмогорова—Смирнова A933 г.)
sup \F\X] — Ф(ж) *
— оо<ж<оо
— критерий Смирнова-Крамера-фон Мизеса A936 г.)
{F(x) - Ф(х)}2
— критерий Андерсона-Дарлинга A952 г.)
Ф(х){1 - Ф(х)}
— критерий Купера A960 г.)
sup {F(x) - Ф(х)} + sup {Ф(х) -
— оо<ж<схэ —оо<ж<оо
— критерий Ватсона A961 г.)
[ {F(x) - Ф(х) - I [F(x) -
— критерий Фроцини A978 г.)
\F(x) -Ф(х)\AФ(х).
Из приведенного перечня видно, что исследователи весьма изобретательны,
конструируя мыслимые и немыслимые варианты критериев. Однако не только из
любви к собственно математической статистике они делают это. Разные критерии
имеют различную мощность по отношению к различным альтернативам, т. е. пред-
пол ожениям, противостоящим выдвинутой (нулевой) гипотезе. Для того, чтобы
наилучшим способом противостоять наиболее „опасной" альтернативе, необходим
достаточно широкий арсенал статистических инструментов. Проблема выдвижения
альтернатив и оценка их „нежелательности" не является задачей математической
статистики, это проблема иных наук, занимающих исследователя.
214 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Еще несколько важных замечаний, после чего приступим к изложению и иллю-
страции основных практических критериев.
Если случайная величина имеет функцию распределения Ф(ж), определенную
с точностью до параметров, то случайная величина Ф(а^) распределена равно-
равномерно на интервале [0,1]. Таким образом, критерий согласия трансформируется
в критерий проверки равномерности распределения случайной величины Ф(а^) на
интервале [0,1]. В этом смысле все критерии согласия являются также критериями
проверки равномерности распределения.
Следует избегать основной ошибки, совершаемой, к сожалению, подавляющей
массой исследователей и инженеров. Общие критерии согласия, которые мы будем
рассматривать далее, предполагают знание теоретического закона распределения
с точностью до параметров. Так как это бывает редко в реальных ситуациях,
исследователь мгновенно разрешает возникшую проблему простейшим способом —
он проводит оценку параметров по самой выборке. Этого делать нельзя, так как
достоверность полученных таким образом статистических выводов может быть
сильно искажена [209]. Возможные варианты разрешения проблем, возникающих
в случае отсутствия надежной информации о параметрах распределения, приведе-
приведены в разделах, посвященных специальным критериям нормальности и экспонен™
циальности распределения. Поэтому, если вам необходимо проверить, нормально
ли распределение полученных выборочных данных, а параметры гипотетического
нормального распределения вы собираетесь также оценивать по выборке, не спеши™
те воспользоваться общим критерием согласия из раздела 3.2.1. Пропустите этот
раздел и обратитесь к разделу 3.2.2, в котором вы найдете квалифицированные
рекомендации для такой ситуации.
3.1.2.1. Критерий Колмогорова-Смирнова
Пусть Fn(x) — эмпирическая функция распределения случайной величины ж,
представленной выборкой х\ ^ х^ ^ . • • ^ хп:
0, х < х\\
Fn(x) = { - Xi ^ х < жг+ь 1 < г ^ га - 1;
1 п
1, X ^ Хп.
Для проверки нулевой гипотезы Hq: Fn(x) = Ф(ж), где Ф(ж)—полностью опреде-
определенная (с точностью до параметров) теоретическая функция распределения, рас™
сматривается расстояние между эмпирической и теоретической функциями распре-
распределения
?>„ = sup \Fn(x) - Ф{х)\- D+^ sup (Fn(x) - Ф(х));
|ж|<оо |ж|<оо
d- = - inf сад-Ф(ж)).
(ж|<оо
Здесь sup, Inf — точные верхняя и нижняя границы соответствующих разностей.
Для практического применения используются формулы
D+ = max (j- - ФОг)) ; D~ = ш (ф(я) - l-^j ; Dn = (+ )
Колмогоров [210] нашел предельное распределение статистики л/пПп (при п -^ ос).
Смирнов [211] развил результаты Колмогорова на случай статистик D^ , D~. Точ-
Точные распределения статистик D^ D~, Dn приведены в [24, 25, 29, 57].
3.1]
Общие критерии согласия
215
Между критическими значениями Dn и D+(Dn) существует соотношение
D+ (a)(D~ (a)) = DnBa) (а— уровень значимости).
В качестве первого приближения можно использовать соотношение
Если Dn > Dn(a), гипотеза согласия (Но) отклоняется на уровне значимости а.
При п ^ 20 полезна аппроксимация [25]
распределение которой удовлетворительно описывается распределением хи^ква™
драт с / = 2 степенями свободы.
При п ^ 10 необходимо использовать более точное приближение
2п
у ¦
2у -— 4у -—
18га
где у = ^lna для Dn и у = —\п(а/2) для Dn, при 0,01 ^ а ^ 0,2 и 0,005 ^ а.
Наиболее просты в приложениях результаты Стефенса [212], который предложил
преобразования статистик Dn , Dn, устраняющие зависимость их процентных
точек Dn, Dn от объема выборки п:
0,275 -
0,04
-0,12-
0,11
-0,12-
0,11
Первые две аппроксимации используются соответственно для нижних и верхних
процентных точек. Критические значения статистик Стефенса приведены в табл. 53.
Таблица 53
Процентные точки статистик Dn и
D
[215]
а
Dt(^
0,150
0,973
1,138
0,100
1,073
1,224
0,050
1,224
1,358
0,025
1,358
1,480
0,010
1,518
1,628
Модифицированные статистики критерия Колмогорова^Смирнова, позволяю™
щие применять их в некоторых частных случаях и для ситуаций с неизвестными
параметрами гипотетических распределений, рассмотрены в [209, 213] и будут
подробно проанализированы нами ниже в разделах, посвященных специальным
критериям согласия. Ситуация, когда выборка усечена или цензурирована, рассмо-
рассмотрена в [214], в которой приведены и процентные точки критерия Колмогорова^
Смирнова для разных степеней цензурирования.
Задача 94. Проверить на уровне значимости а = 0,10 нормальность распределения
выборки х%: 4, 7, 8, 12, 18, 19, 21, 25, 30 при условии что Ф(х) = АГA0; 5) (т. е. гипоте-
гипотетическим распределением является нормальное распределение с параметрами /i = 10
и а = 5).
Задача является демонстрационной — на практике критерий Колмогорова—Смирнова
применяется при п ^ 50. Для вычисления значений функции нормального распреде-
216 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
ления Ф(ж) можно использовать либо таблицы, либо аппроксимации (см. раздел 1.1.1).
Необходимо выбирать аппроксимации повышенной точности, что позволит избежать
накопления погрешностей аппроксимации. Результаты расчетов сведем в таблицу; на-
напомним, ЧТО Ф( — Zi) = 1 —- Ф(^г).
г
1
2
3
4
5
6
7
8
9
10
Xi
4
7
8
9
12
18
19
21
25
30
z%
-1,20
-0,60
-0,40
-0,20
0,40
1,60
1,80
2,20
3,00
4,00
Ф(**)
0,1151
0,2743
0,3446
0,4207
0,6554
0,9452
0,9641
0,9866
0,9986
0,9996
г
п
0,10
0,12
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
i - 1
п
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
-0,0151
-0,0743
-0,0446
-0,0207
-0,1554
-0,3452
-0,2641
-0,1866
-0,0986
0,00005
ФЫ ^
0,11510
0,17430
0,14460
0,12070
0,25540
0,44520
0,36410
0,18660
0,19860
0,09996
г- 1
= 0,4452;
Из таблицы следует, что
-+- fi , Л
DT0 = max ФЫ) = 0,0005: D10 = max
\п J
Dw = max(Di,D^0) = 0,4452.
Критическое значение равно Dio@,l) = J • In — = 0,1998.
у 2L " Wj U.У
Так как D\o = 0,4452 > Dig (о) =::: 0,1998, гипотеза нормальности отклоняется
на уровне значимости =0,1. Более точное приближение вычисляется по формуле
A0 - 0,4453 + 1J=8536,
9-10
Критическое значение х2A ~~ а) ПРИ / — 2 степенях свободы равно 1,8856.
Так как %2 = 8,536 > %2A — а) = %2@,90) = 1,8856, гипотеза Но отклоняется. Рассмо-
Рассмотрим более точную аппроксимацию
= -100,1 = 2,302;
' = ,/^. B,302-
%1 20 \
18-10
1
6- 10
= 0,3224.
Так как Dn = 0,4453 > Dn(a) = 0,3224, Но отклоняется. Далее находим статисти-
статистику Dn = 0,4453 ( л/10 + 0,12 '-= ) = 1,477. Ее критическое значение равно 1,224 (см.
табл. 53 при а = 0,1). Так как D~ = 0,4453 > D~(a) = 1,224, гипотеза Но отклоняется.
3.1.2.2. Критерий Смирнова-Крамера-фон Мизеса
Статистика критерия имеет вид [216-218]
1
2
Yin
г=1
Fixi
\
2п
где F{xi)—теоретическая функция распределения.
Необходимо помнить, что теоретическая функция распределения должна быть
известна с точностью до параметров. Распространенная ошибка — использование
в качестве F{x) функции распределения с параметрами, оцениваемыми по выбор™
3.1]
Общие критерии согласия
217
ке [209]—приводит к уменьшению величины критического значения статистики,
т. е. к увеличению количества ошибок второго рода.
При объеме выборки п > 40 можно использовать приведенные в табл. 54 кван-
квантили распределения во;2, которые следуют из его предельного распределения [218]
(а — уровень значимости, принятый для проверки Hq).
Таблица 54
а
ш2(
а)
Квантили распределения
0,900
0,3473
0,950
0,4614
0,990
0,7435
пш
0
0,
' I218J
,995
8694
0
1,
,999
1679
При п < 40 таблицей можно пользоваться [215, 218] с заменой пш2
(по;2)' =
на
п п ) \ п /
Известна аппроксимация распределения пш^ с помощью х2™РаспРеДеления [220]
пш\ = а + Ь%2, где х2—случайная величина, имеющая распределение хи^квадрат
с / степенями свободы;
ЗЗбп - 959тг + 609
210C2п2 -61п + 30)'
ь =
32п - 61га + 30
84ггDтг - 3) '
пDп - ЗK
5 {Шп -
Исследования авторов работы [221] позволяют сделать вывод о том, что на
уровне значимости а > 0,01 квантили точной и предельной функций распреде-
распределения пш2 практически неразличимы уже при объеме выборки п ^ 4. При таких
(пш2)
вместо пш не дает
уровнях значимости использование преобразования
существенных преимуществ.
Необходимо отметить, что и критерий пш2 и критерий Колмогорова—Смирнова
(см. раздел 3.1.2.1) подсчитываются по негруппированным выборкам (в отличие от
критерия х2 —см- раздел 3.1.1.1). В [226] приведен анализ модификаций критериев
типа пш2 для группированных данных и показано, что группировка приводит
к потере мощности критерия на 5-15%.
Задача 95. В условиях задачи 94 проверить нулевую гипотезу нормальности распре-
распределения случайных величин критерием пш .
Вычисления сводим в таблицу:
г
1
2
3
4
5
6
7
8
9
10
Xi
4
7
8
9
12
18
19
21
25
30
Zi
-1,2
^0,6
~054
-0,2
0,4
1,6
1,8
2,2
3,0
4,0
0,1151
0,2743
0,3446
0,4207
0,6554
0,9452
0,9641
0,9866
0,9986
0,9996
2г - 1
п
ОД
0,3
0,5
0,7
0,9
1,1
1,3
1,5
1,7
1,9
г(-) 2%~х
1 Ы
0,0151
^0,0257
-0,1554
-0,2793
-0,2446
-0,1548
-0,3359
-0,5134
-0,7014
-0,9000
\rW п J
2,28-10
6,60 • 10~4
0,02415
0,0780
0,0598
0,0240
0,1183
0,2636
0,4919
0,8100
1,8706
218 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Имеем пш2 = \- 1,8706 = 1,8789. При а = 0?9 критическое значение равно
пш2 @,9) = 0,3473. Так как пш2@,Э) = 0,3473 < 1,8789, гипотеза нормальности отклоня-
отклоняется. Вычислим более точный критерий
(пс2)' = A,8789 - ^ + MV A + ±-) = 2,029.
1 ; V ю юо/ \ 10/
Видим, что результат тот же— Но отклоняется,
айдем %2™ аппроксимацию критерия
336-100^959-10 + 609 ааАЛ^Л , 32 ¦ 100 - 61 • 10 + 30
°°4474 Ь
Теперь найдем %2™ аппроксимацию критерия пш2 и оценим ее точность. Вычисляем
210 ¦ C2 ¦ 100 -61-10 + 30) ' ' 84 ¦ 10 ¦ D - 10 - 3)
QQ in (Л in q\3
/ = — • { j 2 = 1,446; пш2 @,9) = 0,04474 + 0,0843 • Xl 9 A,446).
5 C2 • 100 - 61 • 10 + 30J '
Из таблиц имеем
Xo,9A,446) « 3,65 и пш2@,9) = 0,04474 + 0,0843 • 3,65 = 0,352.
Видим, что это значение близко к предельной квантили пш2@,Э) = 0,3473, т.е. аппрок-
аппроксимация удовлетворительна.
Небольшое отступление: для удобства приведем квантили распределения %
(табл. 55).
3.1.2.3. Критерий Реньи (М-критерий)
Отклонения на правом конце эмпирического распределения являются суммой
многих отклонений, в том числе и расположенных на левом конце. Поэтому воз-
возможно, что эти отклонения будут принимать большие значения. Реньи [220] пред-
предложил критерий согласия, основанный на взвешивании статистики Колмогорова-
Смирнова (см. раздел 3.1.2.1) обратным значением гипотетической теоретической
функции распределения вероятностей F(x). Статистики критерия Реньи имеют вид
%
о+ Fn(x)-F(x) n~F^
i —- 1
D_ . - Fn{x)~F(x) F(Xi) ~ ^T
Rn = - inf EV ч = maX t?( ч
F(x)^a F(x) F(Xi)^a F(Xi)
Rn = sup J ' , , = max
Для больших n (n —> oo) [220]
" -Д+ < x } = 2Ф(ж) - 1,
где Ф(ж) — функция распределения iV@,1) (см. раздел 1.1.1), т.е.
+ (а) =
п v 7
3.1]
Общие критерии согласия
219
Таблица 55
Квантили распределения %2 (/ — число степеней свободы) [25]
/
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
а
0,01
0,0001
0,0201
0,1150
0,2970
0,5540
0,8720
1,2390
1,6460
2,0880
2,5580
3,0530
3,5710
4,1070
4,6600
5,2290
5,8120
6,4080
7,0150
7,6330
8,2600
8,8970
9,5420
10,1960
10,8560
11,5240
12,1980
12,8790
13,5650
14,2560
14,9530
0,025
0,0010
0,0506
0,2160
0,4840
0,8310
1,2370
1,6900
2,1800
2,7000
3,2470
3,8160
4,4040
5,0090
5,6290
6,2620
6,9080
7,5640
8,2310
8,9070
9,5910
10,2830
10,9820
11,6880
12,4010
13,1200
13,8440
14,5730
15,3080
16,0470
16,7910
0,05
0,0039
0,1030
0,3520
0,7110
1,1450
1,6350
2,1670
2,7330
3,3250
3,9400
4,5750
5,2260
5,8920
6,5710
7,2610
7,9620
8,6720
9,3900
10,1170
10,8510
11,5910
12,3380
13,0910
13,8480
14,6110
15,3790
16,1510
16,9280
17,7080
18,4930
0,10
0,0158
0,2110
0,5840
1,0640
1,6100
2,2040
2,8330
3,4900
4,1680
4,8650
5,5780
6,3040
7,0420
7,7900
8,5470
9,3120
10,0850
10,8650
11,6510
12,4430
13,2400
14,0410
14,8480
15,6590
16,4730
17,2920
18,1140
18,9390
19,7680
20,5990
0,90
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
0,95
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
0,975
5,024
7,378
9,348
11,143
12,832
14,449
16,013
17,535
19,023
20,483
21,920
23,336
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,194
44,461
45,722
46,979
0,99
6,6350
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,232
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
Отметим, что R^(a) = RnBa). При малых п имеет место соотношение [222]
г —1
г=0
г
1 + .Г
где х > 0, к = п — [паA + х)} — 1; [... ] — целая часть числа.
При а = 0 имеем P(-R:[" ^ х) = z •
4 п 7 1 + х
Задача 96. В условиях задачи 94 проверить нулевую гипотезу нормальности распре-
распределения критерием Реньи.
Вычисления сводим в таблицу.
Положим, что а = 0,5. Тогда из таблицы следует: R% = 0,0005; R~ = 0,4710
ш Rn = 0,4710. Далее ^^_
^ - ^^ 0,4710 = 1,489;
220 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
г
1
2
3
4
5
6
7
8
9
10
4
7
8
9
12
18
19
21
25
30
Zi
-1,2
-0,6
-0,4
-0,2
0,4
1,6
1,8
2,2
3,0
4,0
*«>
0,11510
0,27430
0,34460
0,42070
0,65540
0,94520
0,96410
0,98660
0,99860
0,99996
i
п
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
п
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
п
-0,0151
-0,0743
-0,0446
-0,0270
-0,1554
-0,3452
-0,2641
-0,2866
-0,0986
0,0005
-0,1312
-0,2709
-0,1294
-0,0642
-0,2371
-0,3652
-0,2739
-0,2905
-0,0969
0,0005
F, ч *~1
п
0,11510
0,17430
0,14460
0,12070
0,25540
0,44520
0,36410
0,28660
0,19860
0,09996
п
1,00000
0,63540
0,41960
0,28690
-0,38970
0,47100
0,37760
0,29050
0,19890
0,09996
R~ < 1,4897 = 2A,4897) - 1 = 0,864;
R~ > 1,4897 = 1 - 0,864 = 0,136;
O,95 = 0,521.
Rn (a = 0,1) = \ -иЛ_а = -1=
У na 2 VI0
Так как
• Rn = 1,489 > 0,521, нулевая гипотеза отклоняется.
3.1.2.4. Критерий Андерсона-Дарлинга (критерий пО2)
По аналогии с критерием Реньи (см. раздел 3.1.2.3) Андерсон и Дарлинг [223]
предложили критерий, использующий нормирование статистики критерия пш2
(см. раздел 3.1.2.2) обратным значением теоретической функции распределения.
Статистика Андерсона—Дарлинга имеет вид
пп2 = -п-2
г=1
i- 1){ЫР(хг)
Предельное распределение статистики пО2 (при п -^ оо) табулировано в
[25, 218, 224]. В табл 56 приведены некоторые квантили предельного распределения
nft2 (приближение приемлемо при п > 50).
Таблица 56
Квантили предельного распределения
статистики nft2
а
nU2(a)
0,90
1,94
0,95
2,50
0,975
3,08
0,99
3,88
Сходимость к предельному распределению становится лучше, если использовать
вместо статистики пп2 ее модифицированную форму [226]
/ О2\; п (п^ ) + п + 1
(nil 1 = 9
V 7 п2 + п + 1
3.1]
Общие критерии согласия
221
В [227] предложена модификация статистики Андерсона-Дарлинга в форме
U2 = nU2(U)^nU2(LI
где пО2(С7) — версия критерия вО2 для правого (верхнего) „хвоста"; nQ2(L) — версия
критерия nQ2 для левого (нижнего) „хвоста".
Значения вП2(С/) и nQ2(L) вычисляются по формулам
г=1
= -^+2
- ± 53 Bг - 1) lnF(Xl).
г=1
г=1
Распределение величины nO2(t/) может быть вычислено по формуле [227]
где п02(С/)оо—предельное распределение, для которого справедлива аппроксима-
аппроксимация
где
(а) = 0,1170 - 0,03791?/ + 0,06318z + 0,09878t/z + 0,009184|/2z - 0,0000742/z;
у = ln
1-а'
z= 1
0,3
-l
Значения nO2(L) могут быть вычислены из условия симметрии. Модифициро-
Модифицированный критерий Андерсона—Дарлинга более чувствителен к поведению функции
распределения вероятностей на ее хвостах.
Задача 97. В условиях задачи 94 проверить нулевую гипотезу нормальности распре-
распределения вероятностей критерием Андерсона-Дарлинга.
Вычисления сведем в таблицу (используем обозначение ф = Bг —
[()]})
г
1
2
3
4
5
6
7
8
9
10
Xi
4
7
8
9
12
18
19
21
25
30
Zi
-1,2
-0,6
-0,4
-0,2
0,4
1,6
1,8
2,2
з'о
4,0
0,1151
0,2743
0,3446
0,4207
0,6554
0,9452
0,9641
0,9866
0,9986
0,9999
Хп-г+1
30
25
21
19
18
12
9
8
7
4
Zn-i+l
4,0
3,0
2,2
1,8
1,6
0,4
-0,2
-0,4
-0,6
-1,2
F{zn^i+1)
0,9999
0,9986
0,9866
0,9641
0,9452
0,6554
0,4207
0,3446
0,2743
0,1151
lnF(Zi)
-2,1619
-1,2935
-1,0653
-0,0658
-0,4225
-0,0563
-0,0366
-0,0135
-0,0014
-4-10^5
ln[l-F(*n_i+i)]
-10,1266
-6,5713
-4,3125
-3,3210
-2,9041
-1,0653
-0,5459
-0,4225
-0,3206
-0,1223
#
-12,2885
-27,9716
-26,8890
-29,9394
-29,9394
-12,3376
-7,5725
-6,5400
-5,4740
-2,3245
-161,2765
На основании данных таблицы имеем
пп2 = -10 - — • (-161,2765) = 6,127; (пп2)' =
6,127- 100 + 10 + 1
100 + 10 + 1
= 5,619.
222 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Из табл. 56 имеем nl^2@,9) = 1,94.
Так как (nQ2)f = 5?619 > nQ2@,9) = 1,94, нулевая гипотеза нормальности распреде-
распределения Но отклоняется.
3.1.2.5. Критерий Ватсона
Так как у^ = F(xi) имеет равномерное распределение на единичном интервале
[0,1], то проверка гипотезы равномерности распределения yi равносильна проверке
нулевой гипотезы о подчинении выборочных данных распределению F(x). Поэтому
предложенный Ватсоном [225] критерий для проверки таких гипотез в литературе
чаще всего представлен как критерий равномерности распределения. Статистика
критерия Ватсона имеет вид
U2n=n
Fn(x) - F(x) - | [Fn(y) - F(y)} dF(y) I dF(x),
или в форме, удобной для расчетов:
г=1
Необходимо помнить, что yi = F{xi).
Приведем эквивалентную форму
г=1
г=1
Между критерием пш Смирнова—Крамера—фон Мизеса (см. раздел 3.1.2.2)
и критерием Ватсона существует простое соотношение
Ul = гш2 - ¦
Для практических расчетов рекомендуется формула
п 2 n п
n~tiVi ny nhi%Vl+ n+ у+12'
Статистика
при п ^ 10 имеет предельное распределение, критические нижние точки кото™
рого приведены в табл. 57 (а — уровень значимости).
Таблица 57
Нижние критические точки
статистики Ватсона U^ [228]
а
{UIY
0,10
0,152
0,05
0,187
0,025
0,221
0,01
0,267
Нулевая гипотеза отклоняется, если
)f <
3.1] Общие критерии согласия 223
Процентные точки и полную функцию распределения U% можно найти в [218].
Там лее, как и для распределения пш2 (см. раздел 3.1.2.2), для U% предложена
аппроксимация с помощью х2~распределения [219]
где
21п-56 , 1 / з\ , 49п(п-1)
а = ; Ь=(п); / =
Задача 98. Проверить гипотезу нормальности распределения вероятностей в усло-
условиях задачи 94 критерием Ватсона.
Имеем
(^^) F(-l,2) = 0,1151;
2/2 = F(x2) = ^(-0,6) = 0,2743; у3 = F(x3) = F(-0,4) = 0,3446;
2/4 = F(x4) = F(-0,2) = 0,4207; y5 = FE) = F@,4) = 0,6554;
2/6 = ^(ж6) = ^A,6) = 0,9452; y7 = F{x7) = F(l,8) = 0,9641;
2/8 = F(x8) = FB,2) = 0,9866; y9 = F(x9) = FC,0) = 0,9986;
yi0 = F(xio) = FD,0) = 0,99996.
Тогда у = 0,670456 и
Уг - ^—^ - 0,670456 + 0,5 ) + — = 0,1290.
n ) 120
Вычисляем модифицированную форму критерия
№)' = f0,129 - М + ^liV f! + MU 0,1296.
1 n; \ ' io iooy \ io/
Из табл. 57 при а = 0,1 находим 17^@,1) = 0,152.
Так как {U^)' = 0,1296 < (L^@,l)); = 0,152, гипотеза нормальности распределения
случайных величин отклоняется.
Воспользуемся теперь х2™аппроксимацией:
21-10-56 = = _J_ / _ 3\ =
4210 V 2^
= =
мо.(ю-|) 42'10
49 Ю-9
20
Из табл. 55 находим Хо,эC) = 6,251 и вычисляем
С/п@Д) = 0,02157 + 0,02029 • 6,251 = 0,148,
что очень близко к табличной величине f/n@,l) = 0,152.
3.1.2.6. Критерий Купера
Купер [229] предложил расширенную статистику критерия типа Колмогорова-
Смирнова (см. раздел 3.1.2.1)
Vn= sup {Fn(x) - F{x)} - inf {Fn{x)-F(x)}, или Vn
оо<ж<оо
224 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
где
Г A I Г А _ 1
D+ = тах^ - - Fix) \ и D^ = тах^ F(a) - -—-
n [n V 7J П [ V 7 П
— статистики Колмогорова-Смирнова.
Верхние квантили предельного распределения Vn приведены в [230].
fi \ ( г-1\
Если А = тах| у^ I, _В = max! у^ ), где у^ = F(xi), to расчетная фор-
мула может быть записана в простейшей форме
Vn = A + B.
К предельному распределению быстро сходится модифицированная форма ста-
статистики критерия
— для верхних процентных точек VI = [ х/п + 0,155 -\—"*-= 1 Vn:
\ VnJ
— для нижних процентных точек У' = ( л/п + 0,41 "*-=¦ 1 Vn.
Критические значения для верхних процентных точек приведены в табл. 58.
Таблица 58
Критические значения V^(a)
для верхних процентных точек
статистики Купера [212]
а
0,10
1,62
0,05
1,747
0,025
1,862
0,01
2,001
Если V^ < V^(a), то нулевая гипотеза принимается. Подробно применение кри™
терия Купера и расширенные таблицы его квантилей приведены в [231]. Применение
критерия Купера в частном случае проверки соответствия эмпирического распре-
распределения распределению Вейбулла рассмотрено в [212].
Задача 99. В условиях задачи 94 проверить гипотезу нормальности распределения
критерием Купера.
При решении задачи 94 было получено D^ = 0,00005 и D™ = 0,4452, откуда
Уп = ?)+ + Вп = 0,44525, или в модифицированной форме
V^ = 0,44525 • ( л/10 + 0,155 - ^ ) = 1,443.
V V10/
Из табл. 58 имеем К @,1) = 1,62. Так как К = 1,443 < К @,1) = 1,62, нулевая гипоте-
гипотеза нормальности исходного распределения случайных величин не отклоняется (делать из
этого вывода трагедию не стоит — критерий Купера хорошо работает только при п ^ 20).
3.1.2.7. Критерий согласим Дарбина
Наиболее известный критерий согласия — критерий %2 (см. раздел 3.1.1.1) ги-
гибок, легко используется, но имеет элемент произвола в выборе границ группи-
группирования экспериментальных данных. Критерий Колмогорова-Смирнова (см. раз-
раздел 3.1.2.1) [232] свободен от этих недостатков и имеет хорошую асимптотическую
мощность по сравнению с альтернативами, определенными в терминах расстояния
между функциями распределения. Однако исследования показывают [233], что
на практике для выборок среднего объема он часто непригоден, в отличие от
критерия х2 •
3.1] Общие критерии согласия 225
Критерии типа Колмогорова-Смирнова хороши, когда альтернативное распре™
деление таково, что разница между ним и исходным (например, разница в сред-
средних) велика. Однако если разница между средними и дисперсиями невелика, но
две частотные функции заметно отличаются формой, то критерий Колмогорова—
Смирнова не будет мощным критерием.
В [233] предлагаются новые критерии, свободные от распределения, более могц™
ные, чем критерий Колмогорова—Смирнова.
Пусть F{x) — гипотетическая теоретическая функция распределения вероятно™
стей, определенная с точностью до параметров. Обозначим Uj = F(xj), j = 1, ..., п.
При справедливости гипотезы Щ величина Uj должна быть распределена равно-
равномерно на единичном интервале [0,1].
Пусть U\ ^ U2 ^ • • • ^ Un — порядковые статистики ряда Uj. Сформируем но-
новую последовательность
d = U- С, = Uj - Uj-!, (j = 2, ..., n); Cn+1 = 1 - Un;
где C(j) —порядковая статистика ряда Cj, т.е. j-e по величине значение Cj в упо-
упорядоченном по возрастанию ряду значений Cj.
n+l
Введем переменную шг = J^ gj. Очевидно, что
n+l n+l
^2ej = Yl c(j) = 1; Vj = C(i) + • • • + c{j-i) + (n + 2 - j) . C(j),j = 1, ..., щ
C(l) ^ CB) ^ . . . ^ C(n+1).
Сутью предлагаемых критериев является проверка равномерности распределе-
распределения ujj на интервале [0,1].
Рассмотрим различные варианты критериев проверки равномерности распреде-
распределения o;j, предложенные в [233].
3.1.2.7.1. Модифицированный медианный критерий
Статистика критерия
п + 1 — г шг
п +1 / \ п ( \
где г = (в— нечетное] иг=- (п — четное).
При справедливости нулевой гипотезы статистика Мг распределена как
F2(n+i^rM2r5 т-е- как случайная величина, имеющая ^-распределение Фишера
с Д = 2(в + 1 — г) и /2 = 2г степенями свободы.
Гипотеза f/o отклоняется с достоверностью а, если Мг > F(a), где F(a) —
критическое значение i^-распределения.
3.1.2.7.2. Модифицированный критерий Колмогорова-Смирнова
Статистика критерия
Кт = max ш7
г=1, ...,п\П
Нулевая гипотеза отклоняется, если Кт превышает критическое значение стати-
статистики Колмогорова—Смирнова (см. раздел 3.1.2.2).
8 А. И. Кобзарь
226 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.1.2.7.3. Модифицированный вероятностный критерий
п ( 1 \
В [234] показано, что \\ Uj —> expf ~-\2 ) ? гДе X2 —хи~квадрат~распределенная
случайная величина с / = 2п степенями свободы (см. раздел 1.1.8). Тогда случайная
величина
п
рт = ^2 In Л ujj
i=i
имеет ^-распределение с / = 2п степенями свободы.
Если рт > %2Bп), то гипотеза Hq отклоняется с достоверностью а.
Мощность этого критерия исследована в [235], где показано, что этот критерий
может иметь большую мощность для широкого класса альтернатив. Однако сле-
следует помнить, что статистика рт сильно зависит от ошибок округления величин
C/i, ..., Un и расчеты следует вести с максимально возможной точностью.
Сравнительный анализ рассмотренных критериев показывает, что:
— критерий Колмогорова—Смирнова уступает критерию % ;
— критерий Мг лучше критерия Колмогорова-Смирнова, но хуже критерия %2;
— критерий Кт мощнее, чем критерий Колмогорова—Смирнова, и не уступает
критерию х2-
Задача 100. В условиях задачи 94 проверить гипотезу нормальности распределения
случайной величины критерием Дарбина.
Имеем
иг = Ф(-1,2) = 0,1151; U6 = ФA,6) = 0,9452;
U2 = Ф(-0,6) = 0,2743; U7 = ФA,8) = 0,9641;
U3 = Ф(-0,4) = 0,3446; U8 = ФB,2) = 0,9866;
U4 = Ф(-0,2) = 0,4207; U9 = ФC,0) = 0,9986;
U5 = Ф@,4) = 0,6554; U10 = D,0) = 0,99996.
Сформируем новую последовательность
C1 = U1 = 0,1151; C2 = U2 — t/i = 0,1592; С7 = U7 - U6 = 0,0189;
С3 = U3 - U2 = 0,0703; С8 = U8 - U7 = 0,0255; С4 = U4 - U3 = 0,0761;
С9 = U9 - U8 = 0,0120; C5 = U5 - U4 = 0,2347; do = U10 - U9 = 0,00136;
C6 = U6-U5= 0,2898; Сц = 1 - Uw = 0,00004.
Ранжируем ряд Cj по возрастанию величины:
C(i) = 0,00004; CB) = 0,00136; CC) = 0,0120; CD) = 0,0189;
GE) = 0,0225; CF) = 0,0703; CG) = 0,0761; C(8) = 0,1151;
C(9) = 0,1592; G(ю) = 0,2347; C{11) = 0,2898.
Формируем ряд значений gj:
gi = (n + 2 - 1) • (C(i) - 0) = 0,00044;
g2 = 10 • (CB) - CA)) = 0,0132; g3 = 9 • (CC) - CB)) = 0,09576;
g4 = 8 • (CD) - CC)) = 0,0552; g5 = 7 • (CE) - CD)) = 0,0252;
g6 = 6 - (CF) - CE)) = 0,2868; g7 = 5 - (CG) - CF)) = 0,0290;
g8 = 4 - (C(8) - CG)) = 0,1560; g9 = 3 - (C(9) - C(8)) = 0,1323;
gio = 2 • (C(io) - C(9)) = 0,1510; gu = 1 • (CA1) - Cm) = 0,0591.
3.1] Общие критерии согласия 227
Окончательно имеем ряд значений шг:
ал = g = 0,00044;
ш2 = 0,00044 + 0,09576 = 0,01324; ш3 = 0,01324 + 0,09576 = 0,10890;
ш4 = 0,1090 + 0,0552 = 0,1652; ш5 = 0,1642 + 0,0252 = 0,1894;
ш6 = 0,1894 + 0,2868 = 0,4762; ш7 = 0,4762 + 0,0290 = 0,5052;
ш8 = 0,5052 + 0,1560 = 0,6612; ш9 = 0,6612 + 0,1323 = 0,7935;
ало = 0,7935 + 0,1510 = 0,9445; ал = 0,9445 + 0,0551 = 0,9996.
Модифицированный медианный критерий
ш 10 к пж 5 1-W5 5 1-0,1894
Имеем г = — = 5, М = • = - • = 3,5665.
2 ' 10+1-5 ш5 6 0,1894
Для степеней свободы Д = 2 • (п + 1 — г) = 12 и /г = 10 (а = 0,90) имеем из таблиц
^-распределения (или аппроксимаций из раздела 1.1.10) i<i2,io@,9) = 2,284.
Так как Ms = 3,5665 > .?12,10@,9) = 2,284, нулевая гипотеза отклоняется.
Модифицированный критерий Колмогорова-Смирнова
Имеем разности
ол = 0,09956; ш2 = 0,1868; о;3 = 0,1910; ш4 = 0,2358;
71 71 71 71
- - ш5 = 0,3106; - - о;6 = 0,1238; - - ш7 = 0,1948; - - о;8 = 0,1388;
п п тг п
9 10
ш9 = 0,1065; ало = 0,0555.
п п
Отсюда Кт = 0,3106 и из раздела 3.1.2.1 находим критическое значение статистики
Колмогорова—Смирнова (при а = 0,10). Оно равно для модифицированной статистики
1)п@,1) = 1,073. Тогда имеем
Кт = Кт (у/й + 0,275 - ^ ) = 1,0715.
Значение Кт = 1,0715 очень близко к критическому .К"ш@,1) = 1,073, поэтому гипо-
гипотезу нормальности следует отклонить.
Модифицированный вероятностный критерий
п + 1
рт = ^2 In Yl ujj = 39,633.
3=1
Из табл. 55 для / = 2п = 20 имеем Х2о@?Э) — 28,412 (а = 0,90, т. е. берется верхняя 10%-я
точка распределения).
Так как рт = 39,693 > Х2о@?Э) — 28,412, нулевая гипотеза отклоняется.
3.1.2.8. Двухвыборочные критерии согласим
3.1.2.8.1. Двухвыборочный критерий Колмогорова-Смирнова
Рассматриваются выборки случайных величин
х: хг,х2, .. .,Хщ и У' У1,У2, • • • ,Уп2-
Перед исследователем стоит вопрос: обе выборки извлечены из совокупности с од™
ним и тем же законом распределения вероятностей? Говоря языком математиче™
ской статистики, ему необходимо проверить нулевую гипотезу Hq : Fni (x) = Fn2 (у)
о совпадении функций распределения вероятностей в двух выборках. Статистики
228 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
критерия имеют вид [211]
Dn = max \Fni(x) - Fn2(y)\; D*n = max[Fni(z) - Fn2(y)]
и определяются разностью двух эмпирических функций распределения вероятностей.
Распределение статистик Dn и D* приведено в [25, 29]. Предельное распределен
ние (п*\_,П2 —Ь оо) табулировано в [29]. Критерием рекомендуется пользоваться для
выборок объема п ^ 100. В этом случае справедливо соотношение
max[Fni (х) - Fn2 (у)} < z ) « 1 - e^2z".
Задача 101. В результате сравнения двух выборок случайных величин X uY, объемом
Гц = 100 и П2 = 300 соответственно, получено максимальное расхождение их функций
распределения вероятностей, равное 0,252. На уровне значимости а = 0,1 проверить
гипотезу о неразличимости функций распределения вероятностей в обеих выборках.
Находим вероятность
— • max [Fioo (x) - F300 (y)] < 0,252 = 1 - exp (-2 • 0,2522) = 0,119.
Так как полученная величина 0,119 превышает а = 0,1, нулевая гипотеза отклоняется.
3.1.2.8.2. Критерий Катценбайссера-Хакля
В [236] предложен новый критерий, основанный на сравнении эмпирических
функций распределения вероятностей, более мощный, чем критерий Колмогорова—
Смирнова. Статистика критерия (Т) определяется числом точек, в которых эмпи™
рические функции распределения совпадают. Рассмотрим две выборки случайных
величин равного объема х: х\, Х2, • • •, хп и у: t/i, t/2 5 • • • •> Уп •
Составляем из них новую, упорядоченную по bosj астан-по, выборку {zi} объема
N = 2п. Определим сравниваемые эмпирические фун ц распределения следую-
следующим образом: Fn(zi) = (Gn(zi) = ), где пх(г) (пу(г)) — количество ж™ов
(у-ов), меньших или равных Z{.
В [236] показано, что
Математическое ожидание и дисперсия числа совпадающих точек равны
Для больших выборок (п —>- оо)
М(Т) = лДп2 + -л/^П^2 + _^П^2;
ЩТ) = D - тг) п - V^J + ^2 - | V ^
е 4
где М = —-— и х =
3.1]
Общие критерии согласия
229
Приближение удовлетворительно, когда п ^ 5. Если для полученного значе™
ния Т вероятность Р(Т ^ t) будет меньше уровня значимости а, то нулевая ги-
гипотеза отклоняется и функции распределения не признаются совпадающими.
Задача 102. Даны две выборки случайных величин:
хц 10 12 14 14 18 21 27 28 35 36
уц 1 8 10 14 26 27 28 30 31 40
Проверить совпадение законов распределения вероятностей двухвыборочным кри-
критерием Катценбайссера-Хакля на уровне значимости а = 0,1.
Имеем ряд:
z(i): 1(г/), 8(j/), 10B;), 10B/), 12(х), 14(х), 14(х), 14B/), 18(х), 21(х),
26B/), 27(ж), 27B/), 28(х), 28(у), 30(у), 31(у), 35(х), 36(х), 40(у).
В скобках указана принадлежность значения первоначальным выборкам х и у. Вы-
Вычисляем выборочное распределение. Результаты вычислений приведены в таблице:
г
1
2
3
4
5
6
7
*Vi (*(*))
0,0
0,0
0,1
0,1
0,2
0,4
0,4
0,1
0,2
0,3
0,3
0,3
0,4
0,4
г
8
9
10
11
12
13
14
Fn(z{t))
0,4
0,5
0,6
0,6
0,7
0,7
0,8
0,4
0,4
0,4
0,5
0,6
0,6
0,7
i
15
16
17
18
19
20
Fn[z{%))
0,8
0,8
0,8
0,9
1,0
1,0
Gn(z(l))
0,7
0,8
0,8
0,9
0,9
1,0
Из табл. видим, что функции распределения вероятностей совпадают в точках 0,4
(г = 6, 7, 8); 0,8 (г = 16); 0,9 (г = 18) и 1,0 (г = 20), т. е. Г = 5.
Вычисляем
м(г) = V5^+o-V-
, — • \- = 5,605 + 0,0700 + 4,379 • 1G~4 = 5,675;
п 128п V п
В(Т) = D-.).п-^+B-^-^.1-^^ =
= 8,584 - 5,605 + 1,2146 - 0,0700 - 0,0098 = 4,1138 (-/D(T) = 2,028).
Видим, что значение Г близко к М(Т). Следовательно, можно ожидать принятия
нулевой гипотезы. Вычисляем
Р(Г > 5) = J— • 1 — • A,46064 - 12 • 1,46062 + 12)
1 ; V 7,5 [ 96-7,5 V ' ' J
7,5
12I х
1
80
\ _
-1-е
1,46062
= 0,6938.
128-100/
Отсюда Р(Т ^ 4) = 1 — 0,6938 « 0,3, что существенно превышает уровень значимости
а = 0,1. Следовательно, нулевая гипотеза (совпадение эмпирических функций распреде-
распределения вероятностей) не отклоняется.
3.1.2.8.3. Двухвыборочный критерий Андерсона
Поступим по аналогии с рассмотренным выше критерием (имеем выборку х
объема п и выборку у объема га). Составим объединенную выборку и упорядочим
ее по возрастанию. Обозначим через RXi и Ry.—ранги элементов выборки х и у
230 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
в общем упорядоченном ряду (ранг — номер элемента, полученный им в упорядо™
ченном ряду).
Статистика Андерсона имеет вид [237]
Т =
1
mn(m + п)
г=1
4тпп — 1
6(т + п)'
При n, m —> оо и — = const статистика Т распределена как статистика Смирно™
п
ва-Крамера-фон Мизеса (см. раздел 3.1.2.2).
Напомним, что можно использовать критические точки из табл. 54.
Задача 103. В условиях задачи 102 проверить нулевую гипотезу критерием Андерсо-
Андерсона.
Находим ранги RXi и Ryi в общей выборке
Rx\ = 3,5; RX2 :=: 5; RX3 = 7; RX4 = 7; RX5 = 9; RX6 = 10; RX7 = 12,5;
RXg = 14,5; RXq = 18; Rx10 = 19; Ryi = 1; i?y2 = 2; It^ = 3,5; i?y4 = 7;
#y5 = ii; Rve = 12& Ry7 = u& Rvs = 16; RV9 = 17; Rvm =20-
Если значения ж-ов и у-ов совпадают, им присваиваются средние ранги. Например,
значениям хз = Ж4 = 2/4 = 14 присваивается одинаковый средний ранг
Дс3 — Rx4 ^ Ry4 — —
По аналогии определяются все остальные ранги.
Вычисляем статистику критерия
Т =
= 7.
10-10- A0 + 10)
4-10-10-1
6- A0 + 10)
= 0,0675.
Из табл. 54 находим критическое значение (для а = 0,90) па;2 (а) = 0,3473. Так как
Т = 0,0675 < 0,3473, нулевая гипотеза не отклоняется.
3.21
Критерии нормальности распределения
231
3.2. Критерии нормальности распределения
Нормальный закон распределения вероятностей получил наибольшее распро-
распространение в практических задачах обработки экспериментальных данных. Боль™
шинство прикладных методов математической статистики исходит из предположе-
предположения нормальности распределения вероятностей изучаемых случайных величин.
Широкое распространение этого распределения вызвало необходимость разра-
разработки специальных критериев согласия эмпирических распределений с нормаль™
3.2.1. Общие критерии согласия, модифицированные для проверки
нормальности распределения
3.2.1.1. Модифицированный критерий %2
В [199] предложена и исследована форма критерия согласия %2, модифициро™
ванная применительно к проверке нормальности распределения, когда параметры
распределения оцениваются по негруппированной выборке. После оценки парамет™
ров распределения совокупность выборочных данных разбивается на к равнове-
равновероятных интервалов (pi = - = const) и статистика критерия подсчитывается по
к
формуле
2
X = -
2
Ш7- — П,
%
г=1
где п — объем выборки; mi — количество членов выборки, попавшее в г-й интервал.
Границы интервалов определяются как
+ CiSi (г = 0, ...,&), где х =
1 ,
х = —
п
s = < -
~xf
г=1
Значения коэффициентов С{ приведены в табл. 59. Следует помнить, что Cq = ^
и Ck = оо. Так как С{ симметричны относительно нуля, то недостающие значения
Таблица 59
Значения коэффициентов Ci модифицированного %2-критерия
нормальности для к = 3 -?- 15 [199]
к
3
4
5
6
7
8
9
10
11
12
13
14
15
с\
-0,4307
^0,6745
-0,8416
-0,9674
-1,0676
-1,1503
-1,2206
-1,2816
-1,3352
-1,3830
-1,4261
-1,4652
-1,5011
0
-0,2533
-0,4307
-0,5659
-0,6745
-0,7647
-0,8416
-0,9085
-0,9674
-1,0201
-1,0676
-1,1108
сз
0
-0,1800
-053186
-0,4307
-055244
-0,6046
-0,6745
-0,7363
-0,7916
-0,8416
0
-0,1397
-0,2533
-0,3488
-0,4307
-0,5024
-0,5660
-0,6229
0
-0,1142
-0,2194
-0,2934
-0,3661
-0,4307
се
0
-0,0966
-0,1800
-0,2533
0
-0,0837
232 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
можно найти из соотношений
(¦ 1 к-Л и
с\ п лЛ . = —ci п л, . I г = 1, ..., —-— —для нечетных /с;
тт (к — 1)+г оЧ"' — J-/ — * \ 2 1
Z Z \ /
= —ci.
• 1
г = 1, ...,
—для четных к.
Если %2 > dfc(a), ГДе ^fc(a) — критическое значение статистики критерия на
уровне значимости а, то гипотеза нормальности отклоняется. Критические зна-
значения dk(ct) приведены в табл. 60.
Таблица 60
Критические значения dk(ct)
модифицированного х2-критерия нормальности
к
3
4
5
6
7
8
9
а
0,10
25371
3,928
5,442
6,905
8,322
9,703
11,055
0,05
3,248
5,107
6,844
8,479
10,038
11,543
13,007
0,01
5,418
7,917
10,075
12,021
13,837
15,567
17,234
к
10
11
12
13
14
15
а
0,10
12,384
13,694
14,988
16,267
17,535
18,792
0,05
14,438
15,843
17,226
19,589
19,937
21,270
0,01
18,852
20,431
21,977
23,495
24,990
26,464
Задача 104. Для данных задачи 91 проверить модифицированным критерием %2 на
уровне значимости а = 0,1 гипотезу нормальности распределения при оценке его пара-
параметров по негруппированным данным.
1
[
Имеем х = — • ? ^ = Ю0,77; s = I — • ^ (хг ^ хJ \ = 21,5827.
[ J
—
г=1 ^ """ г=1
Из табл. 59 находим коэффициенты разбиения (принимаем к = 10):
d = -1,2816; с4 = ^0,2533; с7 = 0,5244;
с2 = -0,8416; с5 =0; с8 = 0,8416;
сз = ^0,5244; с6 = 0,2533; с9 = 1,2816.
Результаты расчетов сведем в таблицу:
i
1
2
3
4
5
6
7
8
9
10
Границы интервалов
^оо -
72,79-
82,40-
89,32-
95,24-
100,77-
106,30-
112,22-
119,14-
128,40-
-72,79
-82,40
-89,32
-95,24
-100,77
-106,30
-112,22
-119,14
-128,40
- сю
гщ
7
12
11
11
8
13
6
12
10
10
о
49
144
121
121
64
169
36
144
100
100
100 1048
3.21
Критерии нормальности распределения
233
Статистика критерия равна
9 10
1? - п = • 1048 - 100 = 4,8.
100
Из табл. 60 находим критическое значение статистики для к = 10 и а = 0,1: ^ю(ОД) =
= 12,384. Так как %2 = 4,8 < dio@,l) = 12,384, гипотеза нормальности исходного распре-
распределения вероятностей не отклоняется.
3.2.1.2. Критерии типа Колмогорова-Смирнова
Применение критерия согласия пи (см. раздел 1.2.2) для задачи проверки ги-
гипотезы нормальности распределения вероятностей случайных величин рассмотрено
в [218]. Алгоритм вычисления статистики критерия в этом случае не меняется — меня-
меняются только критические значения статистики проверки гипотезы. Для различных си-
ситуаций, когда параметры гипотетического распределения оцениваются непосредствен-
непосредственно по самой выборке, критические значения статистики пш2 приведены в табл. 61.
По аналогии в [209, 215] рассмотрено применение критерия Колмогорова-Смир-
Колмогорова-Смирнова (см. раздел 3.1.2.1) для проверки нормальности распределения в ситуации,
когда оба его параметра оцениваются по выборке. Алгоритм проверки нулевой гипо-
гипотезы Н® и для этого случая сохраняется, меняются только критические значения —
используется модифицированная статистика
: = a
критические значения которой
(a — уровень значимости) приведены в табл. 62.
Таблица 61
Критические значения статистики пш2 для проверки
нормальности распределения A — а — уровень значимости) [218]
Исходные условия
Параметры (/i и а) известны заранее
Параметр а известен, а параметр /j,
оценивается по выборке
Параметр \х известен, а параметр а
оценивается по выборке
Параметры ц и о оцениваются по вы-
выборке
а
0,90
0,3473
0,1344
0,2370
0,1035
0,95
0,4614
0,1653
0,4418
0,1260
0,99
0,7435
0,2380
0,7245
0,1788
0,995
0,8694
0,2698
0,8506
0,2018
0,999
1,1679
0,3443
1,1490
0,2559
Таблица 62
Критические значения статистики
Колмогорова^Смирнова, модифицированной
для проверки нормальности распределения [209]
а
0,15
0,775
0,10
0,819
0,05
0,895
0,03
0,955
0,01
1,035
234 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Задача 105. Для данных задачи 94 проверить гипотезу нормальности распределения
случайных величин критерием типа Колмогорова-Смирнова с оценкой параметров
распределения по выборке.
1
Находим х = —
п
I I
Xi = 15,3; s = < — •
\n
— хJ
= 8,149.
Имеем Zi =
i ~ 15'3
8,149
Критерий Колмогорова-Смирнова
. Результаты расчетов сведем в таблицу:
г
1
2
3
4
5
6
7
8
9
10
х-
4
7
8
9
12
18
19
21
25
30
zi
-1,386
-1,018
-0,896
-0,773
-0,405
0,331
0,454
0,699
1,190
1,804
0,0823
0,1535
0,1841
0,2207
0,3446
0,6293
0,6753
0,7580
0,8830
0,9640
i
п
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
i - 1
п
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
- - ф(*0
п
0,0179
0,0465
0,1159
0,1793
0,1554
0,0293
0,0247
0,0420
0,0170
0,0360
ф(*0 - —
п
0,0823
0,0535
-0,0159
-0,0793
-0,0554
-0,1293
-0,1293
-0,0420
-0,0170
-0,0360
Из таблицы следует, что
= max [ - - Ф(гЛ J = 0,1793;
\п J
г - 1
= 0,1293;
Dn =
= 0,1793.
Далее DI = 0,1793 - [ у/п - 0,01 + -у= = 0,613. Из табл. 62 имеем D*(a) = 0,819. Так
V vlO,
как DI = 0,613 < DI
= 0,819, гипотеза нормальности распределения не отклоняется.
Критерий пш2
Результаты работы сведены в таблицу:
г
1
2
3
4
5
6
7
8
9
10
21
7
8
9
12
18
19
21
25
30
z%
-1,386
-1,018
-0,896
-0,773
-0,405
0,331
0,454
0,699
1,190
1,804
F(*i)
0,0823
0,1535
0,1841
0,2207
0,3446
0,6293
0,6753
0,7580
0,8830
0,9640
F(z-) 2г~г
-0,0177
-0,1465
-0,3159
-0,4793
-0,5554
-0,4707
-0,6247
-0,7420
-0,8170
-0,9360
h(z-) *-Ч2
Г^ и )
3,13-Ю^4
0,0214
0,0998
0,2297
0,3085
0,2215
0,3902
0,5506
0,6675
0,8761
Находим пш2 =
- 3,3656 = 3,374.
12 • 10
Так как пш2 = 3,374 > пш2@,1) = 0,1035 (см. табл. 61 при 1 - а = 1 - 0,1 = 0,9), ну-
нулевая гипотеза нормальности распределения отклоняется.
3.21
Критерии нормальности распределения
235
3.2.1.3. Критерий Фроцини
В [238, 239] Фроцини предложил простой, но достаточно мощный критерий
нормальности с параметрами, оцениваемыми по выборке, основанный на статистике
/ \ г-0,5
Xi-X _ 1 ,
где 2* = ;я=-
~ Функция распределения 7V@,l).
г=1
Критические значения статистики Вп приведены в табл. 63.
Таблица 63
Критические значения статистики Фроцини Вп
для проверки нормальности распределения
(а — уровень значимости) [239]
п
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
сю
а
0,80
0,2115
0,2132
0,2143
0,2175
0,2186
0,2179
0,2191
0,2212
0,2207
0,2204
0,2226
0,2226
0,2228
0,2233
0,2232
0,2257
0,2250
0,85
0,2245
0,2265
0,2276
0,2303
0,2314
0,2304
0,2332
0,2335
0,2336
0,2335
0,2354
0,2356
0,2362
0,2363
0,2367
0,2385
0,2390
0,90
0,2422
0,2434
0,2448
0,2477
0,2491
0,2485
0,2500
0,2508
0,2525
0,2518
0,2530
0,2519
0,2551
0,2536
0,2533
0,2556
0,2560
0,95
0,2666
0,2698
0,2702
0,2756
0,2753
0,2789
0,2774
0,2795
0,2784
0,2791
0,2820
0,2804
0,2812
0,2822
0,2830
0,2839
0,2840
0,99
0,3120
0,3148
0,3224
0,3286
0,3331
0,3332
0,3317
0,3356
0,3385
0,3367
0,3370
0,3376
0,3376
0,3374
0,3413
0,3363
0,3410
Задача 106. В условиях задачи 94 проверить гипотезу нормальности распределения
случайных величин критерием Фроцини.
Воспользуемся данными из таблицы расчета критерия Колмогорова—Смирнова и по-
получим
1
Вп =
/10
• @,0323 + 0,0035 + 0,0659 -
+ 0,1293 + 0,1054 + 0,0793 + 0,0253 + 0,008 + 0,033 + 0,014) = 0,1558.
Из табл. 63 находим критическое значение Вп(а = 0,1) = 0,2485.
Так как Вп = 0,1568 < Вп@,1) = 0,2485, гипотеза нормальности распределения слу-
случайных величин не отклоняется.
3.2.2. Специальные критерии нормальности
Учитывая чрезвычайно широкое распространение нормалвного распределения,
предложено множество критериев проверки нормалвности, использующих раз™
личные характеризации нормального распределения и направленные на защиту
236 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Коэффициенты an—i-\-i
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
1
7071
6872
6646
6431
6233
6052
5888
5739
5601
5475
5359
5251
5150
5056
4968
4886
4808
4734
4634
4590
4542
4493
4450
4407
4366
4328
4291
4254
4220
4188
4156
4127
4096
4068
4040
4015
3989
3964
3940
3917
3894
3872
3850
3830
3808
3789
3770
3751
2
1677
2413
2806
3031
3164
3244
3291
3315
3325
3325
3318
3306
3290
3273
3253
3232
3211
3185
3156
3126
3098
3069
3043
3018
2992
2968
2944
2921
2898
2876
2854
2834
2813
2794
2774
2755
2737
2719
2701
2684
2667
2651
2635
2620
2604
2589
2574
3
0875
1401
1743
1976
2141
2260
2347
2412
2460
2495
2521
2540
2553
2561
2565
2578
2571
2563
2554
2543
2533
2522
2510
2499
2487
2475
2463
2451
2439
2427
2415
2403
2391
2380
2368
2357
2345
2334
2323
2313
2302
2291
2281
2271
2260
4
0561
0947
1224
1429
1586
1707
1802
1878
1939
1988
2027
2059
2085
2119
2131
2139
2124
2148
2151
2152
2151
2150
2148
2145
2141
2137
2132
2127
2121
2116
2110
2104
2098
2091
2085
2078
2072
2065
2058
2052
2045
2038
2032
5
0399
0695
0922
1099
1240
1353
1447
1524
1587
1641
1686
1736
1764
1787
1807
1822
1836
1848
1857
1864
1870
1874
1878
1880
1882
1883
1883
1883
1881
1880
1878
1876
1874
1871
1868
1865
1862
1859
1855
1851
1847
6
0303
0539
0727
0880
1005
1109
1197
1271
1334
1399
143
1480
1512
1539
1563
1584
1601
1616
1630
1641
1651
1660
1667
1673
1678
1683
1686
1689
1691
1693
1694
1695
1695
1695
1695
1695
1693
1692
1691
7
0240
0433
0593
0725
0837
0932
1013
1092
1150
1201
1245
1283
1316
1346
1372
1395
1415
1433
1449
1463
1475
1487
1496
1505
1513
1520
1526
1531
1535
1539
1542
1545
1548
1550
1551
1553
1554
8
0196
0359
0496
0612
0711
0804
0878
0941
0997
1046
1089
1128
1162
1192
1219
1243
1265
1284
1301
1317
1331
1344
1356
1366
1376
1384
1392
1398
1405
1410
1415
1420
1423
1427
1430
9
0173
0303
0422
0530
0618
0696
0764
0823
0876
0923
0965
1002
1036
1066
1093
1118
1140
1160
1179
1196
1211
1225
1237
1249
1259
1269
1278
1286
1293
1300
1306
1312
1317
10
0140
0263
0368
0459
0539
0610
0672
0728
0778
0822
0862
0899
0931
0961
0988
1013
1036
1056
1075
1092
1108
1123
1136
1149
1160
1170
1180
1189
1197
1205
1212
11
0122
0228
0321
0403
0476
0540
0598
0650
0697
0739
0777
0812
0844
0873
0900
0924
0947
0967
0986
1004
1020
1035
1049
1062
1073
1085
1095
1105
1113
12
0107
0200
0284
0358
0424
0483
0537
0585
0629
0669
0706
0739
0770
0798
0824
0848
0870
0891
0909
0927
0943
0959
0972
0986
0998
1010
1020
3.21
Критерии нормальности распределения
237
Таблица 64
критерия Шапиро^Уилка [13,
240]
г
13
0094
0178
0253
0320
0381
0435
0485
0530
0572
0610
0645
0677
0706
0733
0759
0782
0804
0824
0842
0860
0876
0892
0906
0919
0932
14
0084
0159
0227
0289
0344
0395
0441
0484
0523
0559
0592
0622
0651
0677
0701
0724
0745
0765
0783
0801
0817
0832
0846
15
0076
0144
0206
0262
0314
0361
0404
0444
0481
0515
0546
0575
0602
0628
0651
0673
0694
0713
0731
0748
0764
16
0068
0131
0187
0239
0287
0331
0372
0409
0444
0476
0506
0534
0560
0584
0607
0628
0648
0667
0685
17
0062
0119
0172
0220
0264
0305
0343
0379
0411
0442
0471
0497
0522
0546
0568
0588
0608
18
0057
ОНО
0158
0203
0244
0283
0318
0352
0383
0412
0439
0465
0489
0511
0532
19
0053
0101
0146
0188
0227
0263
0296
0328
0357
0385
0411
0436
0459
20
0049
0094
0136
0175
0211
0245
0277
0307
0335
0361
0386
21
0045
0087
0126
0163
0197
0229
0259
0288
0314
22
0042
0081
0118
0153
0185
0215
0244
23
0039
0076
0111
0143
0174
24
0037
0071
0104
25
0035
238 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
нулевой гипотезы нормальности распределения от всевозможных альтернатив. Мы
попытались (насколько это возможно) сгруппировать эти критерии в относительно
однородные группы.
3.2.2.1. Критерий Шапиро—Ушжа
Критерий Шапиро-Уилка [240] основан на отношении оптимальной линейной
несмещенной оценки дисперсии (см. раздел 2.1.2.1.6.6) к ее обычной оценке методом
максимального правдоподобия (см. раздел 2.1.2.1.1). Статистика критерия имеет
вид
к п -1 п
2 ^^ / »х2 _ I
/ \ G>n-i+l\xn-i+l — xi
г=1
где s" =y [Xi-x) ; х = -
п
Числитель является квадратом оценки среднеквадратического отклонения Ллой-
да [241].
Коэффициенты an—i+i приведены в табл. 64, заимствованной из [13, 240]. Крити™
ческие значения статистики FF(a) приведены в табл. 66, заимствованной из [13, 240].
Если W < W(a)^ то нулевая гипотеза нормальности распределения отклоняется
на уровне значимости а. Приближенную вероятность получения эмпирического
значения W при Hq можно вычислить по формуле [242]
где 7? V и Е — коэффициенты, приведенные в табл. 65.
Изучение мощности критерия Шапиро^Уилка [243] показало, что это — один из
наиболее эффективных критериев проверки нормальности распределения случай-
случайных величин. Для больших п таблицы коэффициентов an^+i становятся неудобны-
неудобными, поэтому была предложена модификация критерия Шапиро-Уилка — критерий
Шапиро—Франчиа [244].
Его статистика имеет вид
1 2
к
г=1
где
и mi1n —математическое ожидание г-й порядковой статистики из стандартного нор-
нормального распределения. Аппроксимация mi = Ф™1'
не искажает существенно критерий W1 [245].
Используя аппроксимацию для квантили стандартного нормального распреде-
распределения (см. раздел 1.1.1), можно записать
.3
и для р = 1- имеем тг = 4,91
п+- i\/ V
В [36] приведена полезная аппроксимация, позволяющая применить критерий
Шапиро—Уилка без помощи таблиц.
3.21
Критерии нормальности распределения
239
Таблица 65
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
7
-0,6250
-1,1070
-1,5300
-2,0100
-2,3560
-2,6960
-2,9680
-3,2620
-3,4850
-3,7310
-3,9360
-4,1550
-4,3730
-4,5670
-4,7130
-4,8850
-5,0180
-5,1840
-5,2910
-5,4130
-5,5080
-5,6050
-5,7040
-5,8030
Коэффициенты ту5
п
0,3860
0,7140
0,9350
1,1380
1,2450
1,3330
1,4000
1,4710
1,5150
1,5710
1,6130
1,6550
1,6950
1,7240
1,7390
1,7700
1,7860
1,7980
1,8180
1,8350
1,8480
1,8620
1,8760
1,8900
е
0,7500
0,6297
0,5521
0,4963
0,4533
0,4186
0,3900
0,3660
0,3451
0,3270
0,3111
0,2969
0,2842
0,2727
0,2622
0,2528
0,2440
0,2375
0,2264
0,2207
0,2157
0,2106
0,2063
0,2020
п
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
7 и е [13]
7
-5,9050
-5,9880
-6,0740
-6,1600
-6,2480
-6,3240
-6,4020
-6,4800
-6,5590
-6,6400
-6,7210
-6,8030
-6,8870
-6,9610
-7,0350
-7,1110
-7,1880
-7,2120
-7,2660
-7,3450
-7,4140
-7,5550
-7,6150
-7,6770
7]
1,9050
1,9150
1,9340
1,9490
1,9650
1,9760
1,9880
2,0000
2,0120
2,0240
2,0370
2,0490
2,0620
2,0750
2,0880
2,1010
2,1140
2,1190
2,1280
2,1410
2,1550
2,1830
2,1980
2,2120
е
0,1980
0,1943
0,1907
0,1872
0,1840
0,1811
0,1781
0,1755
0,1727
0,1702
0,1677
0,1656
0,1633
0,1612
0,1591
0,1572
0,1552
0,1548
0,1534
0,1526
0,1499
0,1466
0,1451
0,1436
Для а = 0,05 предлагается статистика
/ 0,6695 W
1 ~ V п0'6518 / В1
где
В=
а0 =
0,899
(п - 2,4H'4162
= п - 2 j + 1
Z^ n-0,5
- 0,02;
Если W\ < 1, то нулевая гипотеза нормальности распределения случайных вели™
чин отклоняется. Модификация критерия Шапиро—Уилка для случая группирован-
группированных данных (что существенно при наличии совпадающих наблюдений) рассмотрена
в [246].
Задача 107. Имеется выборка данных
х: -1, 0, 1, 2, 3, 5, 6, 7, 10, 15.
Проверить гипотезу нормальности распределения случайной величины х критерием
Шапиро-Уилка на уровне значимости а = 0,05.
240 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 66
Процентные точки критерия W(ct) (a — уровень значимости) [13, 240]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
а
0,01
0,737
0,687
0,686
0,713
0,730
0,749
0,764
0,781
0,792
0,805
0,814
0,825
0,835
0,844
0,851
0,858
0,863
0,868
0,873
0,878
0,881
0,884
0,888
0,891
0,02
0,756
0,707
0,715
0,743
0,760
0,778
0,791
0,806
0,817
0,828
0,837
0,846
0,855
0,863
0,869
0,874
0,879
0,884
0,888
0,892
0,895
0,889
0,901
0,904
0,05
0,767
0,748
0,762
0,788
0,803
0,818
0,829
0,842
0,850
0,859
0,866
0,974
0,881
0,887
0,892
0,897
0,901
0,905
0,908
0,911
0,914
0,916
0,918
0,920
0,10
0,789
0,792
0,806
0,826
0,838
0,851
0,859
0,869
0,876
0,883
0,889
0,895
0,901
0,906
0,910
0,914
0,917
0,920
0,923
0,926
0,928
0,930
0,931
0,933
0,50
0,959
0,935
0,927
0,927
0,928
0,932
0,935
0,938
0,940
0,943
0,945
0,947
0,950
0,952
0,954
0,956
0,957
0,959
0,960
0,961
0,962
0,963
0,964
0,965
п
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
а
0,01
0,894
0,896
0,898
0,900
0,902
0,904
0,906
0,908
0,910
0,912
0,914
0,916
0,917
0,919
0,920
0,922
0,923
0,924
0,926
0,927
0,928
0,929
0,929
0,930
0,02
0,906
0,908
0,910
0,912
0,914
0,915
0,917
0,919
0,920
0,922
0,924
0,925
0,927
0,928
0,929
0,930
0,932
0,933
0,934
0,935
0,936
0,937
0,937
0,938
0,05
0,923
0,924
0,926
0,927
0,929
0,930
0,931
0,933
0,934
0,935
0,936
0,938
0,939
0,940
0,941
0,942
0,943
0,944
0,945
0,945
0,946
0,947
0,947
0,947
0,10
0,935
0,936
0,937
0,939
0,940
0,941
0,942
0,943
0,944
0,945
0,946
0,947
0,948
0,949
0,950
0,951
0,951
0,952
0,953
0,953
0,954
0,954
0,955
0,955
0,50
0,965
0,966
0,966
0,967
0,967
0,968
0,968
0,969
0,969
0,970
0,970
0,970
0,971
0,971
0,972
0,972
0,972
0,973
0,973
0,973
0,974
0,974
0,974
0,974
Имеем s = J^ {x% — x) = 219,6. Используя коэффициенты ап—г+i из табл. 64 для
г=1
п = 10 (fc = — = 5), находим
5
J] Оп-г+1 • (xn-i+i - Xi) = 0,5739 • A5 + 1) + 0,3291 • A0 - 0) + 0,2141 • G - 1) +
г=1
+ 0,1224 • F - 2) + 0,0399 • E - 3) = 14,3274;
I 2
= 205,27439; W = 205;27439 = 0,935.
Из табл. 66 находим И^о@,1) = 0,869.
Так как W = 0,935 > Wio@,l) = 0,869, гипотеза нормальности распределения не от-
отклоняется.
Вычислим точную вероятность получения значения W = 0,935 при условии справед-
справедливости нулевой гипотезы Hq.
Из табл. 65 для п = 10 находим j = -3,262, 77 = 1,471 и е = 0,3660.
Далее получаем z = —3,262 + 1,471 • In I — J = —0,07076. Соответствующая
этой квантили стандартного нормального распределения вероятность Ф(—0,07067) « 0,47
(см. табл. 1). Эта вероятность существенно превышает принятый уровень значимости
а = 0,1, что позволяет уверенно принять нулевую гипотезу нормальности.
3.2] Критерии нормальности распределения 241
Используем теперь критерий W\ для чего предварительно вычислим (по табл. 1 или
с помощью аппроксимаций)
5\ о,14х
10- 10+ -
г = 1, тю = 4,91 • [ | f | - [ —^ | | = 1,5479; i = 2, ш9 = 0,998;
10+ -
г = 3, 7П8 =::: 0,655; г = 4, 7717 = 0,374; г = 5, т® = 0,122; 7717 = --ТП4', тп% =
T7i9 = —-TT12] тпго = —-mi;
mTO^+i тю 1,5479 = 0^48д. ^ = 0?3539; с3 = 0,2323;
5 205 36
С4 = 0,132; С5 = 0,0433; ]Г сп^г+1 • {хп^1+1 - хг) = 14,3322; W' = ^^ = 0,935,
i=i '
что очень близко к точному значению критерия.
В заключение используем приближенный критерий, не требующий применения та-
таблиц. Имеем
«о = A0_°2849)9о,4162 - 0,02 = 0,3665138; z3 = 10 "^ + Х ;
zi = 0,94737; z2 = 0,73684; z3 = 0,52616; z4 = 0,31579; z5 = 0,105263;
[1ДОО IJ-I ?} 10""^^ 1
0,94737 + Штщг + '— —, = 0,584074;
C - 0,94737I0'845 A,1 - 0,94737)8'26 J
a2 = 0,3474026; a3 = 0,2222972; a4 = 0,1278953; a5 = 0,0439392;
В = [0,5847074 • A5 + 1) + 0,347026 • A0 - 0) + 0,2222972 . G - 1) + 0,1278953 • F - 2) +
+ 0,0439392 • E - 3)]2 = 217,934;
(л 0,6695 \ 219,6
W\=\\ n«r;ig * l— = 0,857.
V 100'6518/ 217,934
V 10/ 217,934
Так как W\ = 0,857 < 1, то нулевая гипотеза отклоняется на уровне значимости
= 0,1.
3.2.2.2. Энтропийный критерий нормальности (критерий Васичека)
Критерий основан на том, что энтропия нормального распределения превышает
энтропию любого другого распределения с той же дисперсией.
Энтропия распределения вероятностей с плотностью f(x) равна
оо
Н=- | /(я) log/(ж) da;,
а ее оценка по выборочным данным
п ( л
^ log < J^(Xi+m - Xi-m) >,
п
где Xi = х\ при i < 1; Xi = хп при г > п (xi —г-я порядковая статистика), т — целое
положительное число, меньшее, чем п/2.
242 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Статистика критерия Васичека имеет вид [247]
2ms
ll V^i
где s = —
n -
Если Kmn < Kmn(a), где Kmn(a) — критическое значение статистики, то нуле™
вая гипотеза нормальности распределения отклоняется на уровне значимости а.
Значения Ктп(а) для а = 0,05 приведены в табл. 67. При n, m —^ оо, т/п —>• оо
и справедливости гипотезы Но Ктп —ь л/2тт • е = 4,133 и всегда 0 ^ Kmn ^ 4,133.
Таблица 67
п
3
4
5
6
7
8
9
т
1
1
1
2
1
2
1
2
3
1
2
3
1
2
Значения Kmn(ot)
0,99
1,05
1,19
1,70
1,33
1,77
1,46
1,87
1,87
1,57
1,97
2,05
1,67
2,06
п
9
10
12
14
16
18
т
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2,13
1,76
2,15
2,21
1,90
2,31
2,36
2,01
2,43
2,49
2,11
2,54
2,60
2,18
для
п
18
20
25
30
« =
т
2
3
4
1
2
3
4
2
3
4
5
2
3
4
0,05 [247]
2,62
2,69
2,67
2,25
2,69
2,77
2,76
2,83
2,93
2,93
2,91
2,93
3,04
3,06
п
30
35
40
45
50
т
5
2
3
4
5
3
4
5
3
4
5
3
4
5
Ктп
3,05
3,00
3,13
3,16
3,16
3,19
3,24
3,24
3,25
3,29
3,30
3,29
3,34
3,35
Критерий прост, не нуждается в таблице коэффициентов, как критерий Ша-
пиро^Уилки (см. раздел 3.2.2.1), его асимптотическая эффективность удовлетво-
удовлетворительна. Наиболее эффективен критерий Васичека при проверке нормальности
распределения против альтернатив равномерности и экспоненциальности.
Исследования показали [248], что этот критерий чувствительнее к выбросам
случайных величин, чем критерий Шапиро—Уилка.
Задача 108. В условиях задачи 107 проверить нормальность распределения случайных
величин критерием Васичека на уровне значимости
а = 0,05.
Для примера используем критерий при т = 1 и т = 2. Имеем
1
I
п
г=1
и при т = 1 (п = 10) получаем
Ю
2 • 1 • 4,686
(xi+1 -Xi-г)
= 1,067 • {(ж2 - xi) - (х3 - xi) • (х4 - х2) ... (хю - х8) - (хю - х9)}10 =
= 1,067 • {@ + 1) • A + 1) • B - 0)... A5 - 7) • A5 - 10)} 10 = 2,913.
3.21
Критерии нормальности распределения
243
Из табл. 67 находим !^до@,05) = 1,76.
Так как Kitw = 2,913 > i^i,io@,05) = 1,76, нулевая гипотеза нормальности распреде-
ления не отклоняется.
По аналогии имеем -Ж~2,ю = 2,694 и Ж~2,ю@,05) = 2,15.
Следовательно, и при т = 2 приходим к такому же результату.
3.2.2.3. Критерий Хегази—Грина
Хегази и Грин [249] рассмотрели серию критериев, основанных на статистиках
1 П 1 П
где г/г л =
— \2 —
= Ф (га7-); !%• =
+1
г=1 г=1
Напомним (см. раздел 1.1.1), что квантили uPi могут быть аппроксимированы
по формуле
,= 4,91 р°'14-A-Рг)°Д4 =4,91
0,14
п + 1 — г
0,14'
Критические значения величин Ti(a) и Т2(а) приведены в табл 68. Для а = 0,01
и а = 0,05 имеются весьма точные аппроксимации [249]:
2,8736 8,2894 я
п п2 '
1,9227 5,00677
Ti@,01) = 0,7195 ~~ 0,1751 Inn + 0,0108AптгJ; Г2@,01) = 0,0178 -
Ti@,05) = 0,6027 - 0,1481 Inn + 0,0090(lnnJ; T2@,05) = 0,0126 -
п п
Этот критерий превосходит по мощности критерий Шапиро-Уилка (см. раз™
дел 3.2.2.1) при альтернативах Коши и экспоненциального распределения, но усту-
уступает ему при равномерной альтернативе.
Таблица 68
Критические величины Ti(o) и Тг(а) (а — уровень значимости) [249]
п
5
10
20
40
80
а
0,01
П(а)
0,4563
0,3648
0,2850
0,2090
0,1520
Т2(а)
0,2616
0,2180
0,1462
0,0873
0,0476
0,025
П(а)
0,4212
0,3377
0,2608
0,1912
0,1377
Т2(а)
0,2285
0,1834
0,1181
0,0712
0,0392
0,05
Ща)
0,3871
0,3101
0,2399
0,1770
0,1265
Т2 (а)
0,1974
0,1529
0,0988
0,0599
0,0322
0,10
Ща)
0,3514
0,2822
0,2176
0,1609
0,1159
Т2(а)
0,1683
0,1278
0,0819
0,0490
0,0274
0,50
Ща)
0,3304
0,2683
0,2035
0,1513
0,1091
Т2(а)
0,1509
0,1129
0,0718
0,0429
0,0239
Задача 109. В условиях задачи 107 проверить гипотезу нормальности распределения
критерием Хегази-Грина при а = 0,05.
Имеем
х = 4,8; s = 4,3996; уг =
1
х\ — х
-1-4,8
= -1,17418;
гц = UP1 = 4,91
s 4,9396
0Д4 /io + i^i\0'14]
_ i^Li—i = -1,33508.
V lo + i ' '
Результаты расчетов сведем в таблицу:
244 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
г
1
2
3
4
5
6
7
8
9
10
Xi
-1
0
1
2
3
5
6
7
10
15
Уг
-1,17418
-0,97170
-0,76930
-0,56680
-0,36440
0,04050
0,24290
0,44540
1,05270
2,06490
Pi
0,90900
0,18180
0,27270
0,36360
0,45450
0,54540
0,63630
0,72720
0,81820
0,90910
т
-1,33508
-0,90647
-0,60250
-0,34730
-0,11370
-0,11370
0,34370
0,60250
0,90650
1,33510
Vi—ilil
0,16090
0,06523
0,16680
0,21950
0,25070
0,07320
0,10080
0,15710
0,14620
0,72980
(уг-тJ
0,02589
4,2559- 10~3
0,02780
0,04818
0,06285
5,3589 • 10
0,01016
0,02468
0,02370
0,53260
Получаем Тг =
= 0,2657 и Г2 =
0,2657 и Г2
10 10
Из табл. 68 для а = 0,05 и п = 10 находим
= 0,0763.
Ti@,05) = 0,3101; Т2@,05) = 0,1529.
Так как Тг = 0,2657 < Ti@,05) = 0,3101 и Т2 = 0,0763 < Т2@,05) = 0,1529, гипотеза
нормальности не отклоняется обоими критериями.
Проверим аппроксимацию для критических точек Ti@,05) и Г2@,05).
Имеем
Ti @,05) = 0,6027 - 0,1481 • In 10 + 0,0090 • (In 10J = 0,3094;
Г2@,05) = 0,0126 +
1,9227 5,0067
10
100
= 0,1548.
Видим, что аппроксимации дают достаточно точные приближения к табличным
значениям даже при относительно небольших объемах выборок п.
3.2.2.4. Критерий Али—Чёрго—Ревеса
Али, Чёрго и Ревес [250^252] предложили семейство статистик для проверки
нормалвности распределения случайнвхх величин, основаннв1х на взвешеннвш ква-
квадратах спейсингов (спейсинг — расстояние между соседними порядковыми стати-
статистиками) .
Таблица 69
Критические значения Мп(а)
критерия нормальности Али—Чёрго—Ревеса [252]
к
3
4
5
6
7
8
9
10
11
12
13
14
15
а
0,10
0,182
0,231
0,268
0,291
0,312
0,317
0,329
0,327
0,333
0,339
0,350
0,350
0,348
0,05
0,195
0,268
0,313
0,336
0,370
0,374
0,394
0,378
0,387
0,397
0,417
0,407
0,414
0,01
0,206
0,336
0,407
0,436
0,502
0,487
0,535
0,521
0,510
0,553
0,538
0,544
0,582
к
16
17
18
19
20
30
40
50
60
70
80
90
100
а
0,10
0,348
0,357
0,355
0,352
0,351
0,362
0,363
0,351
0,355
0,357
0,364
0,363
0,359
0,05
0,420
0,417
0,423
0,422
0,414
0,427
0,425
0,426
0,420
0,424
0,429
0,423
0,424
0,01
0,580
0,551
0,580
0,584
0,545
0,561
0,593
0,561
0,598
0,567
0,611
0,604
0,599
3.21
Критерии нормальности распределения
245
Если xi, ..., хп — порядковые статистики наблюдаемого ряда случайных вели™
чин, то статистика критерия записывается в форме
мп = >; {=—- - ф-1 (-^) \ v|ф-
где Ф^1(р)=ир—р™квантиль стандартного нормального распределения;
х = —
s2n =
г=1
i — жJ —оценки соответственно среднего значения
г=1
1 _?
/2тг
и дисперсии; ip(t) =
Критические значения Мп{а) для а = 0,01; 0,05 и 0,10 приведены в табл. 69.
Если Мп < Мп(аI то гипотеза нормальности распределения отклоняется. Мощ-
Мощность М"п~критерия для большинства возможных альтернатив не уступает мощно-
мощности критериев Шапиро^Уилка (см. раздел 3.2.2.1) и Андерсона™Дарлинга (см. раз-
раздел 3.1.2.4).
Задача 110. В условиях задачи 107 проверить гипотезу нормальности распределения
случайных величин Мп критерием Али-Чёрго-Ревеса при а = 0,05.
Вычисления сведем в таблицу:
г
1
2
3
4
5
6
7
8
9
10
Xi
-1
0
1
2
3
5
6
7
10
15
-1,158
^0,955
-0,751
-0,548
-0,142
0,061
0,264
0,467
1,076
2,092
г
п + 1
0,091
0,182
0,273
0,364
0,454
0,545
0,636
0,727
0,818
0,909
-1,33
-0,91
-0,60
-0,35
-0,11
0,11
0,35
0,60
0,91
1,33
0,1647
0,2637
0,3332
0,3752
0,3965
0,3965
0,3572
0,3332
0,2637
0,1647
0,0296
0,00202
0,0228
0,0392
1,02-Ю
2,40 • 10~3
7,396 • 10~3
0,0177
0,0275
0,5806
(*?-фг>.-
4,875 • 10~3
5,34 • 10~4
7,597- 10~3
0,0147
4,06 • 10~4
9,52 • 10
2,774 • 10
5,894 • 10~3
7,266 • 10
0,0956
0,1406
В таблице для удобства записи приняты обозначения
Ф"
Из табл. 69 для п = 10 и а = 0,05 имеем Мю @,05) = 0,378.
Так как Мп = 0,1406 < Мю@,05) = 0,378, гипотеза нормальности распределения слу-
случайных величин отклоняется.
3.2.2.5. Корреляционный критерий Филлибена
Филлибен [253] предложил критерий для проверки сложной гипотезы нормаль-
нормальности (когда параметры распределения не определены), статистикой которого явля-
является коэффициент корреляции г между порядковыми статистиками эмпирического
ряда наблюдений Х{ и медианами порядковых статистик стандартного нормального
распределения (Mi)
- x)(Mi - М)
s) (
г=1
246 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
где Mi = Ф^1 (га^) (Ф — функция Лапласа); ГП{ — медиана г-й порядковой статистики
из равномерного распределения на интервале [0,1].
Так как М = 0 и Щ = —Мп_^+1, то
1
1 ~2
-\2 I
г=1 ^г=-1 г=1 J
Более проста для вычислений статистики критерия формула
г =
Для вычисления тп{ рекомендуется формула [253]
г — mn, г = 1;
г - 0,375
0,365'
г = 2,
В [254] показано, что использование при г = 2, ..., п — 1 упрощенной формулы
г - 0,3
?п,^ = не изменяет существенно результаты. Критические значения крите-
критерия г (а) приведены в табл. 70.
Нулевая гипотеза принимается, если г (а) < г < гA — а). Критерий г имеет вы-
высокую мощность против симметричных альтернатив с длинными „хвостами", по
мощности сравним с критерием Шапиро^Уилка (см. раздел 3.2.2.1). Основные до-
достоинства критерия — возможность проверки сложных гипотез, простота, легкость
вычислений (нет необходимости иметь таблицу коэффициентов), достаточно высо-
высокая мощность. Критерий может быть распространен и на распределения, отлич-
отличные от нормального (тогда Mi = F^1(m^); где F — гипотетическое распределение),
и в этом смысле является общим критерием согласия (см. раздел 3.1). Проверка
гипотезы производится так же, как и для критерия Шапиро^Уилка.
Задача 111. Проверить гипотезу нормальности распределения в условиях задачи 107
критерием Филлибена при а = 0,05.
Вычисляем
% °375 Х °37Б = 0,0603; т2 = 0,15678; т3 = 0,25326;
?г + 0,365 10 + 0,365
т4 = 0,34973; т5 = 0,44621; т6 = 0,54269; т7 = 0,63917; т8 = 0,73565;
т9 = 0,83213; т10 = 0,92860.
Используя аппроксимацию
Mi = ф-\пц) = Umt = 4,91 • К'14 - A - т*H-14] ,
имеем
Mi = 4,91 • @,0603ОД4 - 0,93970'14) = -1,55363; М2 = -1,0061;
М3 = ^0,66213; М4 = ^0,38448; М5 = ^0,13464; М6 = 0,10673;
М7 = 0,35477; М8 = 0,62788; М9 = 0,96076; М10 = 1,46622.
3.21
Критерии нормальности распределения
247
иг
н
ю
Е-"
СО
Ю
й
ш
ю
s
Ч
S
©
S
ш
НИЗ
ш
й
я
ш
И
S
н
а
И
со
СЛ
о
CD
СЛ
О
СО
СЛ
сл
о
см
Is-
сл
о
со
со
сл
о
сл
сл
о
см
СО
о
о
о
т-Н
о
о
о
т-Ч
сл
сл
сл
о
т-Н
сл
00
о
сл
Is-
00
о
сл
со
00
о
СО
СО
сл
as
о
CD
сл
о
СО
сл
сл
о
СП
ь-
сл
о
Is-
OS
о
о
ю
сл
о
СО
00
CD
сл
сл
о
со
CD
сл
о
см
сл
сл
о
сл
00
о
00
CD
00
о
см
см
00
о
СО
сл
сл
о
CD
сл
о
СО
сл
сл
о
со
Is-
сл
о
Is-
со
сл
о
т-Н
>п
сл
о
00
Is-
сл
сл
о
см
CD
сл
о
00
00
сл
о
см
о
о
сл
Is-
00
о
см
см
00
о
ю
со
сл
о
ю
CD
о
СО
as
сл
о
сл
о
on
CD
сл
о
см
m
сл
о
ю
СО
СО
сл
о
о
CD
сл
о
CD
00
сл
о
т-Н
т-Н
сл
о
о
сл
00
о
»о
00
00
о
CD
СО
сл
сл
о
ю
гл
сл
о
сл
сл
о
Is-
сл
о
оо
со
сл
о
00
)П
сл
о
СО
00
ю
сл
сл
о
о
гл
сл
о
со
ОС)
сл
о
СО
т-Н
сл
о
сл
сл
00
о
Is-
00
о
t-
со
сл
сл
о
ю
CD
сл
о
сл
сл
о
ю
г-
сл
о
съ
со
сл
о
ю
ш
сл
о
t-
СО
ю
сл
сл
о
о
CD
сл
о
со
00
сл
о
см
сл
о
ю
о
сл
о
сл
ю
00
о
00
СО
сл
о
со
CD
ел
о
сл
сл
о
Is-
сл
о
о
г-
Os
о
со
ю
сл
о
00
00
^
OS
Os
о
о
CD
ел
о
00
сл
о
CD
см
сл
о
см
т-Н
as
о
00
CD
00
о
сл
со
сл
сл
о
ю
CD
сл
о
сл
сл
о
СО
Is-
сл
о
т—1
Is-
сл
о
Is-
ю
сл
о
сл
СО
^
сл
сл
о
о
CD
сл
о
Is-
00
сл
о
СО
сл
о
Is-
т—1
сл
о
со
JN-
00
о
о
со
сл
сл
о
ю
CD
as
о
сл
сл
о
Is-
Is-
сл
о
ГМ
Is-
сл
о
00
сл
о
о
сл
сл
о
о
CD
as
о
00
00
сл
о
00
00
сл
о
см
см
сл
о
СО
00
00
о
т-Ч
СО
сл
сл
о
ю
CD
ел
о
сл
сл
о
Is-
Is-
сл
о
гм
сл
о
00
>п
сл
о
т-Н
сл
сл
о
о
CD
ел
о
00
00
сл
о
т-Н
сл
о
со
см
сл
о
сл
00
00
о
см
Is-
сл
сл
о
ю
CD
сл
о
сл
сл
о
оо
Is-
сл
о
со
Is-
сл
о
00
in
сл
о
см
сл
сл
о
т-Н
CD
сл
о
00
оо
сл
о
сл
о
т—1
СО
сл
о
ю
00
00
о
СО
Is-
сл
сл
о
ю
CD
сл
о
сл
сл
о
оо
ь-
сл
о
со
Is-
OS
о
as
ю
сл
о
СО
сл
ел
о
т-Н
CD
сл
о
сл
00
сл
о
Is-
ел
о
^
сл
о
т-Н
о
сл
о
Is-
сл
сл
о
ю
CD
сл
о
сл
сл
о
оо
г-
сл
о
со
Is-
сл
о
о
со
сл
о
сл
сл
о
т-Н
CD
сл
о
сл
00
сл
о
о
ю
сл
о
Is-
СО
сл
о
г-
о
сл
о
ю
Is-
сл
сл
о
ю
CD
сл
о
as
сл
о
оо
Is-
Os
о
Is-
сл
о
т-Н
со
сл
о
ю
сл
сл
о
т-Н
CD
сл
о
сл
00
сл
о
см
ю
сл
о
о
сл
о
см
т-Н
сл
о
CD
Is-
сл
сл
о
ю
гл
сл
о
ю
сл
сл
о
Is-
сл
о
Is-
сл
о
см
СО
сл
о
со
сл
сл
о
см
гл
сл
о
о
сл
сл
о
ю
сл
о
см
сл
о
со
т-Н
сл
о
t-
Is-
сл
сл
о
ю
CD
as
о
ю
сл
сл
о
гл
Is-
сл
о
сл
о
00
со
сл
о
ю
сл
сл
о
см
CD
as
о
о
сл
сл
о
СО
ю
сл
о
ю
сл
о
сл
т-Н
сл
о
00
Is-
as
о
со
CD
сл
о
ю
сл
сл
о
о
00
сл
о
г-
Os
о
ОО
СО
сл
о
00
ю
о
см
CD
ел
о
о
сл
сл
о
оо
ю
о
ь-
Os
о
00
см
сл
о
сл
Is-
сл
сл
о
со
CD
сл
о
ю
сл
сл
о
о
сю
сл
о
Is-
Is-
сл
о
со
сл
о
сл
ю
сл
сл
о
см
CD
сл
о
т-Н
сл
сл
о
о
со
сл
о
о
ю
сл
о
ю
см
сл
о
о
I4-
сл
сл
о
со
CD
сл
о
ю
сл
сл
о
т-Н
00
сл
о
Is-
Is-
OS
о
ю
СО
сл
о
о
ю
ю
сл
ел
о
00
CD
сл
о
т—1
сл
сл
о
т-Н
со
ел
о
см
ю
сл
о
00
см
сл
о
т-Ч
Is-
сл
сл
о
со
CD
ел
о
ю
сл
сл
о
см
00
сл
о
оо
сл
о
Is-
СО
сл
о
ю
ю
ю
сл
сл
о
00
CD
ел
о
т-Н
сл
сл
о
т-Н
со
сл
о
см
ю
сл
о
о
СО
сл
о
см
Is-
сл
сл
о
СО
CD
сл
о
ю
as
сл
о
00
сл
о
о
00
сл
о
о
Is-
сл
о
о
CD
»о
сл
сл
о
СО
CD
сл
о
т-Ч
as
сл
о
СО
сл
о
ю
ю
сл
о
СО
00
сл
о
СО
Is-
сл
сл
о
со
гл
сл
о
со
сл
сл
о
00
сл
о
^—I
00
сл
о
см
Is-
сл
о
ю
со
ю
сл
сл
о
00
гл
сл
о
см
сл
сл
о
ю
со
сл
о
Is-
ю
сл
о
со
00
сл
о
оо
сл
сл
о
г-
CD
сл
о
со
сл
сл
о
ю
00
сл
о
гм
00
сл
о
Is-
сл
о
о
Is-
ю
сл
сл
о
СО
CD
сл
о
см
сл
сл
о
СО
со
сл
о
00
ю
сл
о
Is-
СО
сл
о
ю
оо
сл
сл
о
Is-
CD
сл
о
CD
as
сл
о
СО
00
сл
о
со
00
сл
о
LO
Is-
сл
о
ю
Is-
»о
сл
сл
о
СО
CD
сл
о
см
as
сл
о
Is-
СО
сл
о
сл
ю
сл
о
сл
00
сл
о
CD
on
сл
сл
о
ь-
CD
сл
о
CD
сл
сл
о
Is-
00
сл
о
00
сл
о
CD
Is-
сл
о
о
00
ю
сл
ел
о
CD
сл
о
см
сл
сл
о
оо
со
ел
о
о
CD
сл
о
т-Н
сл
о
оо
сл
сл
о
г-
CD
сл
о
Is-
сл
сл
о
Is-
00
сл
о
>п
00
сл
о
г-
сл
о
ю
00
ю
сл
сл
о
CD
сл
о
см
сл
сл
о
гл
со
сл
о
см
со
сл
о
СО
сл
о
00
оо
сл
о
Is-
CD
сл
о
г-
сл
сл
о
оо
00
Os
о
1О
00
сл
о
00
I4-
сл
о
о
сл
ю
о
CD
ел
о
см
сл
сл
о
CD
со
Os
о
см
CD
сл
о
ю
сл
о
сл
оо
сл
сл
о
00
гл
сл
о
Is-
сл
сл
о
гл
00
сл
о
Is-
00
сл
о
т-Н
оо
сл
о
о
о
т-Н
СО
сл
сл
о
гл
сл
о
СО
сл
сл
о
о
Is-
сл
о
3
сл
о
Is-
сл
о
о
СО
сл
сл
о
CD
as
о
СО
сл
сл
о
т-Н
Is-
сл
о
ю
CD
сл
о
00
сл
о
т-Ч
248 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Далее вычисляем
п 10 п
х = 4,8; ]Г (Xi - xf = 219,6; ]Г М? = 7,63472; ^ ж» • М* = 38,37695; г = 0,93725.
г=1 г=1 г=1
Из табл. 70 находим для а = 0,05 г@,05) = 0,917 и г@,95) = 0,99.
Так как г@,95) = 0,99 > г = 0,937 > г@,05) = 0,917, гипотеза нормальности не
отклоняется.
3.2.2.6. Регрессионный критерий нормальности Л а Брека
В [255] Ла Брек рассмотрел серию критериев, основанных на оценке отклонения
от линейности зависимости М(х{) = /л + aM(yi)^ где Х{—порядковая статистика
эмпирического распределения, yi = — порядковая статистика стандартного
нормального распределения.
Критерий позволяет проверять сложные гипотезы нормальности (когда знание
/J, и а не требуется).
Статистики критерия имеют вид
. = 2,4, ...,2k;
s | i=i |
, п = 1, 3, ..., 2k — 1;
r^- -^l H~ ^2 9 1 \r™^ / -\2
K3 = , где s = —j 2^ {Xi - x) .
Необходимо помнить, что щ = an^^+i и bi = 6n_^_|_i.
Критерий со статистикой К\ более чувствителен к асимметричным альтерната™
вам (К\ — это, по существу, квадратичное отклонение от гипотетической линейной
зависимости). Критерий со статистикой К2 более чувствителен к симметричным
альтернативам (он построен на анализе кубических отклонений от линейной зависи™
мости). Комбинированный критерий К% является комбинацией К\ и К^ и применим
при промежуточных альтернативах.
Коэффициенты щ и bi и критические значения статистик Ki(a), K2{o) и К%(а)
приведены соответственно в табл. 71 и 72.
При п > 12 применимы аппроксимации для критических значений статистик:
#i@,90)= 2,682+ 5^5; Кг@,95) = 3,822 - ^2^; ^@,99) = 6,900 - Щ^-;
л/п \/п \/п
ЛГ2@,90) = 2,667 - ^1^1. К2@,95) = 3,815 - ^^; К2@,99) = 6,893 - ^-;
\/П \/П у/П
= 2,331 - 54^; ^з@,95) = 2,992-^^; ^3@,99) = 4,618 -
3.21
Критерии нормальности распределения
249
Мощность критериев Ki, K2j K% не уступает мощности критерия Шапиро-
Уилка (см. раздел 3.2.2.1), превосходя его в среднем. Критерии являются односто-
односторонними, т.е. нулевая гипотеза нормальности отклоняется, если Ki > Ki(a). Более
мощен критерий К%.
Таблица 71
Коэффициенты а% и bi для вычисления статистик Ж°1, Ж°2? -К~з [255]
п
4
5
6
7
8
9
10
11
12
13
г
1
2
1
2
3
1
2
3
1
2
3
4
1
2
3
4
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
7
щ
1,1387
-1,1387
1,2002
-0,7570
-0,9689
1,2266
-0,4545
-0,7721
1,2367
-0,2768
-0,6095
-0,7009
1,2385
-0,1483
-0,4796
-0,6106
1,2298
-0,0512
-0,3753
-0,5245
-0,5691
1,2298
0,0245
-0,2902
-0,4478
-0,5164
1,2225
0,0852
-0,2198
-0,3807
-0,4629
-0,4886
1,2143
0,1346
-0,1606
-0,3222
-0,4125
-0,4536
1,2956
0,1756
-0,1104
-0,2710
-0,3660
-0,4171
-0,4333
к
-0,6261
2,1699
-0,8403
1,9742
0
-0,9701
1,7195
0,6243
-1,0574
1,4962
0,8410
0
-1,1196
1,3092
0,9090
0,3174
-1,1196
1,1527
0,9145
0,4864
0
-1,2010
1,0205
0,8919
0,5771
0,1979
-1,2284
0,9075
0,8564
0,6236
0,3239
0
-1,2501
0,8100
0,8157
0,6441
0,4048
0,1375
-1,2674
0,7249
0,7733
0,6489
0,4566
0,2342
0
п
14
15
16
17
18
19
г
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
1
2
3
4
щ
1,1966
0,2100
-0,6730
-0,2261
-0,3237
-0,3813
-0,4082
1,1875
0,2393
-0,0299
-0,1865
-0,2854
-0,3473
-0,3815
-0,3925
1,1785
0,2645
0,0027
-0,1513
-0,2507
-0,3154
-0,3548
-0,3736
1,1685
0,2863
0,0315
-0,1199
-0,2192
-0,2858
-0,3289
-0,3532
-0,3611
1,1607
0,3053
0,0571
-0,0917
-0,1905
-0,2583
-0,3040
-0,3324
-0,3461
1,1521
0,3220
0,0798
-0,0663
к
-1,2814
0,6499
0,7313
0,6438
0,4888
0,3027
0,1023
-1,2927
0,5834
0,6906
0,6327
0,5079
0,3512
0,1789
0
-1,3020
0,5240
0,6517
0,6178
0,5177
0,3854
0,2366
0,0797
-1,3095
0,4705
0,6147
0,6006
0,5210
0,4092
0,2802
0,1421
0
-1,3156
0,4222
0,5797
0,5822
0,5198
0,4252
0,3130
0,1911
0,0642
-1,3206
0,3782
0,5467
0,5630
п
19
20
20
21
22
23
ъ
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
щ
-0,1644
-0,2329
-0,0281
-0,3119
-0,3300
-0,3358
1,1436
0,3367
0,1002
-0,0433
-0,1406
-0,2093
-0,2583
-0,2920
-0,3134
-0,3237
1,1363
0,3447
0,1223
-0,0216
-0,1184
-0,1876
-0,2376
-0,2730
-0,2696
-0,3107
-0,3152
1,1283
0,3561
0,1390
-0,0023
-0,0984
-0,1673
-0,2179
-0,2548
-0,2805
-0,2971
-0,3051
1,2050
0,3663
0,1543
0,0151
-0,0798
-0,1485
-0,1995
к
0,5153
0,4354
0,3377
0,2298
0,1162
0
-1,3246
0,3380
0,5156
0,5437
0,5085
0,4413
0,3560
0,2603
0,1583
0,0531
-1,3283
0,3041
0,4834
0,5242
0,5002
0,4440
0,3695
0,2844
0,1926
0,0972
0
-1,3309
0,2705
0,4556
0,5051
0,4906
0,4439
0,3791
0,3031
0,2207
0,1336
0,0451
-1,3329
0,2395
0,4292
0,4864
0,4801
0,4419
0,3854
250 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Продолжение таблицы 71
п
23
24
25
26
27
г
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
a-i
-0,2373
-0,2648
-0,2833
-0,2942
-0,2977
1,1129
0,3754
0,1681
0,0312
-0,0626
-0,1310
-0,1822
-0,2208
-0,2494
-0,2698
-0,2828
-0,2891
1,1056
0,3836
0,1808
0,0460
-0,0466
-0,1147
-0,1661
-0,2050
-0,2347
-0,2563
-0,2713
-0,2798
-0,2875
1,0984
0,3910
0,1926
0,0596
-0,0318
-0,0995
-0,1506
-0,1904
-0,2205
-0,2434
-0,2597
-0,2702
-0,2754
1,0914
0,3977
0,2031
0,0723
-0,0181
-0,0851
-0,1365
-0,1762
к
0,3178
0,2432
0,1644
0,0827
0
-1,3345
0,2107
0,4044
0,4682
0,4692
0,4384
0,3893
0,3291
0,2618
0,1896
0,1148
0,0386
-1,3356
0,1840
0,3809
0,4505
0,4579
0,4337
0,3913
0,3377
0,2766
0,2111
0,1420
0,0715
0
-1,3363
0,1591
0,3586
0,4334
0,4464
0,4282
0,3918
0,3438
0,2888
0,2286
0,1653
0,1000
0,0335
-1,3367
0,1358
0,3376
0,4168
0,4349
0,4220
0,3908
0,3483
п
27
28
29
30
32
г
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
щ
-0,2071
-0,2307
-0,2483
-0,2603
-0,2674
-0,2697
1,0845
0,4038
0,2130
0,0841
-0,0054
-0,0717
-0,1229
-0,1628
-0,1941
-0,2186
-0,2371
-0,2503
-0,2591
-0,2633
1,0779
0,4093
0,2221
0,0949
0,0068
-0,0593
-0,1102
-0,1501
-0,1820
-0,2067
-0,2263
-0,2406
-0,2505
-0,2564
-0,2583
1,0714
0,4144
0,2305
0,1052
0,0180
-0,0474
-0,0980
-0,1382
-0,1701
-0,1955
-0,2156
-0,2308
-0,2419
-0,2491
-0,2527
1,0589
к
0,2984
0,2434
0,1849
0,1246
0,0625
0
-1,3369
0,1140
0,3176
0,4007
0,4235
0,4152
0,3888
0,3512
0,3060
0,2556
0,2017
0,1459
0,0878
0,0295
-1,3367
0,0935
0,2985
0,3853
0,4120
0,4081
0,3861
0,3528
0,3117
0,2659
0,2159
0,1639
0,1103
0,0553
0
-1,3364
0,0743
0,2805
0,3703
0,4008
0,4008
0,3827
0,3533
0,3163
0,2741
0,2281
0,1799
0,1294
0,0783
0,0261
-1,3352
п
32
34
36
38
г
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
a-i
0,4232
0,2456
0,1237
0,0384
-0,0259
-0,0759
-0,1159
-0,1483
-0,1743
-0,1953
-0,2220
-0,2247
-0,2341
-0,2402
-0,2432
1,0469
0,4305
0,2587
0,1399
0,0565
-0,0066
-0,5600
-0,0957
-0,1284
-0,1547
-0,1765
-0,1941
-0,2082
-0,2189
-0,2269
-0,2321
-0,2347
1,0356
0,4367
0,2702
0,1543
0,0724
0,0108
-0,0382
-0,0775
-0,1099
-0,1368
-0,1589
-0,1772
-0,1921
-0,2042
-0,2134
-0,2202
-0,2247
-0,2269
1,0248
к
0,0390
0,2468
0,3420
0,3789
0,3855
0,2744
0,3519
0,3217
0,2863
0,2471
0,2051
0,1614
0,1161
0,0701
0,0231
-1,3335
0,0075
0,2162
0,3156
0,3577
0,3701
0,3647
0,3481
0,3236
0,2940
0,2604
0,2241
0,1855
0,1459
0,1048
0,0632
0,0210
-1,3313
-0,0209
0,1881
0,2910
0,3376
0,3545
0,3541
0,3424
0,3230
0,2982
0,2996
0,2379
0,2043
0,1689
0,1326
0,0953
0,0573
0,0193
-1,3287
3.21
Критерии нормальности распределения
251
Окончание таблицы 71
7?
38
40
42
i
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
2
3
4
5
6
7
8
9
10
11
12
13
а,
0,4420
0,2803
0,1669
0,0870
0,0264
-0,0219
-0,0609
-0,0934
-0,1199
-0,1425
-0,1615
-0,1769
-0,1897
-0,2003
-0,2081
-0,2142
-0,2180
-0,2199
1,0144
0,4465
0,2890
0,1784
0,1001
0,0402
-0,0071
-0,0457
0,0780
-0,1046
-0,1276
-0,1463
-0,1629
-0,1760
-0,1873
-0,1962
-0,2033
-0,2084
-0,2118
-0,2135
1,0045
0,4501
0,2971
0,1885
0,1118
0,0530
0,0064
-0,0319
-0,0638
-0,0905
-0,1134
-0,1326
-0,1492
h
-0,0465
0,1624
0,2681
0,3182
0,3393
0,3431
0,3356
0,3204
0,3000
0,2755
0,2479
0,2185
0,1874
0,1543
0,1213
0,0868
0,0524
0,1178
-1,3259
-0,0699
0,1388
0,2466
0,2999
0,3245
0,3318
0,3280
0,3166
0,2998
0,2788
0,2553
0,2288
0,2015
0,1721
0,1422
0,1110
0,0800
0,0480
0,0164
-1,3229
-0,0911
0,1167
0,2266
0,2825
0,3100
0,3205
0,3199
0,3117
0,2981
0,2804
0,2599
0,2369
77
42
44
46
г
14
15
16
17
18
19
20
21
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
а{
-0,1632
-0,1746
-0,1847
-0,1923
-0,1986
-0,2031
-0,2061
-0,2076
0,9949
0,4534
0,3040
0,1978
0,1224
0,0648
0,0186
-0,0189
-0,0509
-0,0774
-0,1001
-0,1195
-0,1367
-0,1506
-0,1631
0,1731
-0,1817
-0,1887
-0,1941
-0,1982
-0,2008
-0,2021
0,9858
0,4560
0,3103
0,2062
0,1321
0,0754
0,0301
-0,0074
-0,0387
-0,0651
-0,0881
-0,1074
-0,1245
-0,1390
-0,1516
-0,1624
-0,1713
-0,1789
-0,1852
-0,1899
-0,1935
h
0,2121
0,1865
0,1588
0,1315
0,1025
0,0736
0,0442
0,0150
-1,3197
-0,1107
0,0965
0,2078
0,2660
0,2960
0,3093
0,3115
0,3061
0,2953
0,2805
0,2629
0,2424
0,2208
0,1971
0,1730
0,1476
0,1215
0,0951
0,0681
0,0409
0,0141
-1,3163
-0,1286
0,0775
0,1901
0,2502
0,2825
0,2981
0,3029
0,3000
0,2918
0,2794
0,2642
0,2464
0,2270
0,2061
0,1838
0,1610
0,1373
0,1128
0,0885
0,0633
п
46
48
50
г
22
23
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
а,
-0,1959
-0,1971
0,9770
0,4853
0,3160
0,2137
0,1410
0,0854
0,0403
0,0035
-0,0275
-0,0537
-0,0767
-0,0962
-0,1129
-0,1281
-0,1408
-0,1520
-0,1611
-0,1695
-0,1762
-0,1817
-0,1859
-0,1891
-0,1914
-0,1924
0,9686
0,4602
0,3209
0,2207
0,1490
0,0943
0,0500
0,0138
0,0043
-0,0431
-0,0660
-0,0853
-0,1027
-0,1175
-0,1303
-0,1419
-0,1517
-0,1601
-0,1673
-0,1734
-0,1784
-0,1823
-0,1851
-0,1870
-0,1880
к
0,0381
0,0127
-1,3129
-0,1451
0,0599
0,1735
0,2352
0,2695
0,2873
0,2942
0,2935
0,2875
0,2774
0,2643
0,2491
0,2150
0,2128
0,1926
0,1724
0,1502
0,1280
0,1053
0,0825
0,0594
0,0352
0,0115
-1,3094
-0,1605
0,0435
0,1577
0,2211
0,2570
0,2767
0,2855
0,2869
0,2828
0,2747
0,2637
0,2501
0,2347
0,2182
0,1999
0,1809
0,1613
0,1409
0,1200
0,0985
0,0767
0,0555
0,0331
0,0112
252 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Критические точки критериев
Таблица 72
(a), Ж~2(ок) и Жз(ок) [255]
4
5
6
7
8
9
10
11
12
а = 0,90
Кг
2,730
2,739
2,739
2,736
2,733
2,730
2,726
2,723
2,724
к2
3,419
3,562
3,638
3,684
3,713
3,732
3,745
3,755
3,770
к3
4,379
5,008
5,367
5,594
5,748
5,859
5,941
6,005
6,049
а = 0,95
Кг
2,274
2,490
2,581
2,621
2,638
2,664
2,644
2,641
2,612
к2
3,373
3,425
3,475
3,518
3,554
3,583
3,608
3,628
3,673
к3
5,215
5,247
5,430
5,635
5,825
5,990
6,130
6,249
6,579
а = 0,99
Кг
2,029
2,080
2,109
2,128
2,131
2,142
2,152
2,160
2,167
К2
2,405
2,652
2,769
2,829
2,865
2,872
2,879
2,884
2,889
к3
2,939
3,731
4,165
4,424
4,995
4,974
4,955
4,940
4,296
Задача 112. Проверить гипотезу нормальности распределения случайных величин
в условиях задачи 107 регрессионным критерием Ла Брека на уровне достоверности
а = 0,95.
Используя коэффициенты (ц и bi из табл. 71, имеем
5
]Г <ц • (xi + Жп-i+i) = 1,2298 • (-1 + 15) + 0,0245 • @ + 10) - 0,2902 • A + 7) -
- 0,4478 • B + 6) - 0,5164 . C + 5) = 7,427;
ai ' (Xi + xn-i+i) } = 55,1603;
J
h • {x% + xn-i+1) = -1,201 • (-1 + 15) + 1,0205 • @ + 10) + 0,8919 • A + 7)
+ 0,5771 • B + 6) + 0,1979 • C + 5) = 6,7262; <j ]P h • (Xi + xn^i+1) [> = 45,241;
55,1603 45,241 2,26 + 1,854
Кг = ^^ = 2,260; K2 = ^^ = 1,854; K3 = ^ = 2,057.
Из табл. 72 для а = 0,95ип=10 находим критические значения
lfi@,95) = 3,745; 1^@,95) = 3,608 и i^3@,95) = 2,879.
Так как Кг = 2,26 < #i@,95) = 3,745; К2 = 1,854 < К2@,95) = 3,608 и К3 = 2,057 <
< Ж~з@,95) = 2,879, гипотеза нормальности распределения случайных величин не откло-
отклоняется.
Если бы мы воспользовались аппроксимациями, то получили бы
= 3,822 - ^^ = 3,764; #2@,95) = 3,815 - ^=^ = 3,659;
л/10 л/Ш
К3 = 2,922 - -
л/10 '
Видим, что даж:е при п = 10 аппроксимации достаточно удовлетворительны.
3.2.2.7. Критерий нормальности Лсжка—Спуръе
Весьма эффективный критерий нормальности против асимметричных альтер-
альтернатив предложен в [256]. Его статистики имеют вид
3.21
Критерии нормальности распределения
253
где
Uln =
2n = Л У"
п
-, п
-j n — 1 n
— — V V V--(
где
шг = С?_г - 2(n -
= г
- га -
^ — г~я порядковая статистика.
Математические ожидания и дисперсии статистик равны:
М(Т1п) = 0; D(Tln) = -^з {1,03804 + 0,6Э714(в - 3) + 0,0890805(п - 3)(га - 4)};
М(Т2п) = 0; D(T2n) = ^з {7,03804 + 5,32251(в - 3) + 0,74412(в - 3)(га - 4)}.
При п ^ 5 случайная величина
щ - М(Тш)
распределена как нор™
VD(Tln)
мальная случайная величина и, следовательно, ее критические значения равны
Т\п = M(Tin) + уD(Tin)ua, где гла— «-квантиль стандартного нормального
распределения.
По аналогии, нормальное приближение для Т^п применимо при п ^ 10 и имеет
вид Г2„(а) = М(Г2и) + у/Т>(Т2п)иа.
Критерий Т2п более эффективен для несимметричных альтернатив с „мягкими"
хвостами. Развитие этих критериев для альтернатив с обоими „хвостами", отлича-
отличающимися от нормального распределения, представлено в [257].
Гипотеза нормальности распределения вероятностей случайной величины от™
клоняется, если Tin(T2n) > Tin(a)(T2n(a)), где A — а)—уровень значимости.
Задача 113. Проверить гипотезу нормальности распределения случайных величин
в условиях задачи 107 критерием Локка-Спурье на уровне значимости а = 0,05.
Имеем s2 = 24,4 и s = 4,9396. Используем статистику Т\п.
Предварительно необходимо найти совокупность значений (xk — %Xj + Xi) для всех
возможных сочетаний i,j, к, отвечающих соотношению l^i<Cj<k^.n (всего их
Сп = Сю = 120). Порядок вычислений иллюстрируется в таблице (в ней принято
обозначение Хка = хь — 2xj + хЛ:
г
1
1
1
1
1
1
1
1
1
1
1
1
3
2
2
2
2
2
2
2
2
3
3
3
3
к
3
4
5
6
7
8
9
10
4
5
6
7
хк
1
2
3
5
6
7
10
15
2
3
5
б
Xj
0
0
0
0
0
0
0
0
1
1
1
1
Xi
-1
-1
— 1
-1
-1
-1
-1
— 1
-1
— 1
-1
-1
0
1
2
4
5
б
9
14
-1
0
2
3
г
1
1
1
1
1
1
1
1
1
1
1
1
3
3
3
3
4
4
4
4
4
4
5
5
5
к
8
9
10
5
б
7
8
9
10
6
7
8
Хк
7
10
15
3
5
6
7
10
15
5
6
7
ж,-
1
1
1
CNI
2
2
2
2
CNI
3
3
3
Xi
-1
-1
— 1
-1
-1
-1
-1
— 1
-1
— 1
-1
-1
Xkji
4
7
12
^2
0
-1
2
5
10
-2
-1
0
i
1
1
1
1
1
1
1
1
1
1
1
1
3
5
5
6
6
б
6
7
7
7
8
8
9
к
9
10
7
8
9
10
8
9
10
9
10
10
Хк
10
15
6
7
10
15
7
10
15
10
15
15
Xj
3
3
5
5
5
5
6
6
6
7
7
10
Xi
-1
-1
— 1
-1
-1
-1
-1
— 1
-1
— 1
-1
-1
3
8
-5
-4
-1
4
-6
-3
CNI
-5
0
-6
254 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Окончание
г
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
5
6
6
б
6
7
7
7
8
8
9
4
5
6
7
8
9
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
Xk
2
3
5
6
7
10
15
3
15
6
7
10
15
5
6
7
10
15
6
7
10
15
7
10
15
10
15
15
Xj
1
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
5
5
5
5
6
6
6
7
7
10
X"
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Xkji
0
1
3
4
5
8
13
-1
1
2
3
б
11
-1
0
1
4
9
-4
-3
0
5
^5
-2
3
-4
1
^5
г
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
3
4
4
4
4
4
4
5
5
5
5
5
б
6
6
б
7
7
7
8
8
9
5
5
5
5
5
6
6
к
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
6
7
8
9
10
7
8
Хк
3
5
6
7
10
15
5
6
7
10
15
6
7
10
15
7
10
15
10
15
15
5
6
7
10
15
6
7
Xj
2
2
2
2
2
2
3
3
3
3
3
5
5
5
5
6
6
6
7
7
10
3
3
3
3
3
5
5
Xi
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
Xkji
0
2
3
4
7
12
0
1
2
5
10
-3
^2
1
6
^4
-1
4
^3
2
-4
1
2
3
б
11
^2
-1
г
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
7
7
7
8
3
6
6
7
7
7
8
8
9
6
6
б
6
7
7
7
8
8
9
7
7
7
8
8
9
8
8
9
9
к
9
10
8
9
10
9
10
10
7
8
9
10
8
9
10
9
10
10
8
9
10
9
10
10
9
10
10
10
Хк
10
15
7
10
15
10
15
15
6
7
10
15
7
10
15
10
15
15
7
10
15
10
15
15
10
15
15
15
Xj
5
5
6
б
6
7
7
10
5
5
5
5
6
6
6
7
7
10
6
6
б
7
7
10
7
7
10
10
Xi
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
5
5
5
5
5
5
6
6
6
7
Xkji
2
7
^3
0
5
^2
3
^3
-1
0
3
8
^2
1
6
-1
4
-2
0
3
8
1
6
0
2
7
1
2
Имеем
= 234;
Используем аппроксимации:
244 I (Ж
•234= - = 1,95; Г1п = ^
= 0,3948.
М(Тт) = 0; D(Tm) = • A,03804 + 0,69714 • 7 + 0,0890805 • 7 • 6) = 0,080495
Для гхо,95 = 1,645 получаем Tin@,05) « 0,2837 • 1,645 = 0,466.
Так как Т\п = 0,3948 < Tin@,05) = 0,466, нормальность распределения вероятностей
случайных величин не отклоняется. К аналогичному выводу (читатель может сам убе-
убедиться) приводит и использование статистики Т2П-
3.2.2.8. Критерий нормальности Ом
Критерий, аналогичный рассмотренному выше (см. раздел 3.2.2.7), использую™
щий анализ комбинаций порядковых статистик, рассмотрен в работах Оя [258—260].
Статистиками критерия являются
#fc - ;
Хк ~
3.21
Критерии нормальности распределения
255
Статистика Т\ эффективна против альтернатив, отличающихся от нормального
распределения коэффициентом асимметрии, а Т2 — коэффициентом эксцесса. При
справедливости нулевой гипотезы М{Т\) = 0,5 и M(T2) = 0,298746 [259], дисперсии
приведены в табл. 73.
Таблица 73
Дисперсии статистик Ом [259]
п
5
6
7
8
9
D(Ti)
0,01512
0,01045
0,00740
0,00575
0,00457
D(T2)
0,01549
0,00800
0,00473
0,00350
0,00248
п
10
15
20
30
оо
D(Ti)
0,00358
0,00218
0,00144
0,00089
0,0214/п
D(T2)
0,00196
0,00098
0,00058
0,00032
0,0026/п
Статистики
т =
Тг - 0,5
Т2 - 0,298746
распределены приближенно нормально, и их критические значения могут быть
вычислены по формулам
fi(a) = 0,5 + >/D(Ti)ua и Т2(а) = 0,298746 + у/Т>(Т2)иа,
где иа — «^квантиль стандартного нормального распределения.
Учитывая независимость статистик Т\, Т2, можно рекомендовать комбинирован™
ный критерий
„2 _ ф2 , f,2
X — il + i2^
имеющий распределение %2 с / = 2 степенями свободы.
Более просты в вычислительном отношении модифицированные критерии [260]
Т[ =
И Т2=
где a,ij = -^(i+j -тг- 1); % = —4 [2(гс - j)(i - 1) - C%_j - С?_х].
При справедливости нулевой гипотезы
М(Т[) = 0; М(Г^) = 0,4523;
D(T[) = А(°'07478СГз + 0,03963С|С^_3 + 2,8979) =
= А [0,11217(п - 4)(п - 3)),0,11889(п - 3) + 2,8979];
= А [0,0874(п - 6)(в - Б)(п - 4) + 0,0435(в - Б)(п - 4) + 5,342(п - 4) + 8,8552].
Как и прежде, Т[(а) = yD(T[)wa, ^(^O = 0^4523 -
256 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Нормальная аппроксимация статистик Т{ и Т'2 несколько хуже, чем Т\ и Т^. По™
прежнему можно использовать критерий
Задача 114. В условиях задачи 107 проверить гипотезу нормальности распределения
вероятностей критерием Оя на уровне значимости а = 0,05 (доверительная вероят-
вероятность 0,95).
Воспользовавшись данными таблицы задачи 113, получим ряд значений Xkji =
Xk - Xj
. Результаты расчетов сведены в таблицу:
XI
г
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
3
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
г
к
3
4
5
6
7
8
9
10
4
5
6
7
8
9
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
Xkji
1/2
2/3
3/4
5/6
6/7
7/8
10/11
15/16
1/3
2/4
4/6
5/7
6/8
9/11
14/16
1/4
3/6
4/7
5/8
8/11
13/16
2/6
3/7
4/8
7/11
12/16
1/7
2/8
5/11
10/16
г
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
7
7
7
8
8
9
3
3
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7
к
8
9
10
9
10
10
4
5
6
7
8
9
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
Xkji
1/8
4/11
9/16
3/11
8/16
5/16
1/2
2/3
4/5
5/6
6/7
9/10
14/15
1/3
3/5
4/6
5/7
8/10
13/15
2/5
3/6
4/7
7/10
12/15
1/6
2/7
5/10
10/15
1/7
4/10
г
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
3
7
8
8
9
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7
7
8
8
9
5
5
5
5
5
к
10
9
10
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
6
7
8
9
10
Xkji
9/15
3/10
8/15
5/15
1/2
3/4
4/5
5/6
8/9
13/14
2/4
3/5
4/6
7/9
12/14
1/5
2/6
5/9
10/14
1/6
4/9
10/14
3/9
8/14
5/14
2/3
3/4
4/5
7/8
12/13
г
4
4
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
7
7
7
8
3
6
6
6
6
7
7
7
8
8
9
6
6
6
6
7
7
7
8
8
9
7
7
7
8
8
9
8
8
9
9
к
7
8
9
10
8
9
10
9
10
10
7
8
9
10
8
9
10
9
10
10
8
9
10
9
10
10
9
10
10
10
Xkji
1/4
2/5
5/8
10/13
1/5
4/8
9/13
3/8
8/13
5/13
1/3
2/4
5/7
10/12
1/4
4/7
9/12
3/7
8/12
5/12
1/2
4/5
9/10
3/5
8/10
5/10
3/4
8/9
5/9
5/8
Из таблицы находим
хк - '.
= 70,6029 и
• 70,6029 = 0,58836.
Далее МA\) = 0,5 и D(Ti) = 0,00358 (см. табл. 73).
Окончательно (г^эб = 1,645): Ti@,95) = 0,5 + ^ДЩШШ • 1,645 = 0,5984.
Так как Ti = 0,58836 < Ti@,95) = 0,5984, гипотеза нормальности распределения слу-
случайных величин не отклоняется. К аналогичному результату приводят другие критерии
(читатель может это проверить самостоятельно).
3.21
Критерии нормальности распределения
257
3.2.2.9. Критерий среднего абсолютного отклонения (критерий Гири)
Гири [261—263] рассмотрел критерий нормальности распределения случайных
величин, основанный на статистике
1
ns
являющейся отношением среднего абсолютного отклонения — Y1
рочному стандартному отклонению
— X
к выбо™
Статистика Гири распределена асимптотически нормально при п ^ 50 со сред™
M(d) =
-A
тг V ' 8п - 9
0,79788
п ~~ 0,875
га-1,125
и дисперсией
¦ arcsm
n-1
га- 1
n- 1
-i)-J-l«lfo,O45O7-°^V
Более точные аппроксимации приведены в [262]:
M(d) = 0,797885 +
I* П П
0,045070 0,124648 0,084859 0,006323
^— ~ 2 + з + 4 .
гс п п п
п
Для практических расчетов рекомендуется формула Yl \xi ~~ %
г=1
где ^2 х' — сумма значений ж-ов, превышающих ж; п' — количество значений ж-ов,
превышающих ж.
Критерий двусторонний. При п ^ 50 вычисляются квантили
где ua
мости.
-Ьсли d[—
^\ = M(d) +
а-квантиль стандартного нормального распределения; а — уровень значи-
значи- f) = M(d)
то гипотеза нормальности распределения случаи™
ных величин не отклоняется.
Некоторые критические значения d-статистики приведены в табл. 74 (в таблице
приняты обозначения d\(a) и d2(a), соответствующие неравенству d\(a) ^ d ^ ^(сО?
которые удовлетворяются при справедливости нулевой гипотезы).
А. И. Кобзарь
258 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 74
Критические значения cfi(a) и d^fjcx) критерия Гири
(а — уровень значимости) [262]
ТЪ
11
16
21
26
31
36
41
46
51
61
71
81
91
101
а =
0,1175
0,6829
0,6950
0,7040
0,7110
0,7167
0,7215
0,7256
0,7291
0,7347
0,7393
0,7430
0,7460
0,7487
0,01
d2
0,9359
0,9137
0,9001
0,8901
0,8827
0,8769
0,8722
0,8682
0,8648
0,8592
0,8549
0,8515
0,8484
0,8460
а =
dt
0,7153
0,7236
0,7304
0,7360
0,7404
0,7440
0,7470
0,7496
0,7518
0,7554
0,7583
0,7607
0,7626
0,7644
0,05
d2
0,9073
0,8884
0,8768
0,8686
0,8625
0,8578
0,8540
0,8508
0,8481
0,8434
0,8403
0,8376
0,8353
0,8344
а =
dt
0,7409
0,7452
0,7495
0,7530
0,7559
0,7583
0,7604
0,7621
0,7636
0,7662
0,7683
0,7700
0,7714
0,7726
0,10
d2
0,8899
0,8733
0,8631
0,8570
0,8511
0,8468
0,8436
0,8409
0,8385
0,8349
0,8321
0,8298
0,8279
0,8264
Задача 115. В условиях задачи 107 проверить гипотезу нормальности распределения
случайных величин критерием Гири на уровне значимости а = 0,05.
Имеем
х = 4,8; s =< -
i=l
|0-4,8|-
= 4,686;
-4,8| + ... + |15 -4,8| = 38.
По упрощенной формуле (п = 5 значений превышают х = 4,8; их сумма равна
^ ж; = 5 + 6 + 7 + 10 + 15 = 43) получаем ]Г
Статистика критерия равна d = тт—. • 38 = 0,8109.
= 2- D3-4,8-5) = 38.
Далее
10- 1,686
M(d) = 0,79788
™ 1,125
= 0,8203;
D(d) = 1-
1 ; ю
0,04507 -
ю
= 3,711 . ИГ
/D(d) =0,0609).
Из табл. 74 находим для п = 10 и а = 0,05: d\ « 0,715 и d2 « 0,907.
Так как 0,715 < d = 0,8109 < 0,907, нулевая гипотеза нормальности не отклоняется.
Воспользуемся нормальным приближением (wo,95 = 1,645 и гг,о,о5 = —1,645),
di@,05) = M(d) = +y/T>(d) - С/0,95 = 0,8203 - 1,645 • 0,0609 = 0,720;
d2@,05) = 0,8202 + 1,645 • 0,0609 = 0,920.
Так как 0,720 < d = 0,8109 < 0,920, нулевая гипотеза нормальности не отклоняется.
3.2.2.10. Критерий Дэвида-Хартли-Пирсона
В [264] предложен критерий нормальности распределения вероятностей случай™
ной величины, основанный на распределении отношения размаха к стандартному
отклонению.
3.21
Критерии нормальности распределения
259
Статистика критерия имеет вид
где R = жтах — Жщщ (или {хп — х\) для упорядоченного по возрастанию ряда выбо™
рочных значений)—размах выборки; s — стандартное отклонение.
Таблица 75
Критические границы Ui{ol) и U%(ol)
критерия Дэвида—Хартли—Пиреона
(а — уровень значимости) [9]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
а =
иг
1,737
1,870
2,020
2,150
2,260
2,350
2,440
2,510
2,580
2,640
2,700
2,750
2,800
2,840
2,880
2,920
2,960
2,990
3,150
3,270
3,380
3,470
3,550
3,620
3,690
3,750
3,800
3,850
3,900
3,940
3,990
4,020
4,060
4,100
0,01
и2
2,000
2,445
2,803
3,095
3,338
3,543
3,720
3,875
4,012
4,134
4,244
4,340
4,440
4,520
4,600
4,670
4,740
4,800
5,060
5,260
5,420
5,560
5,670
5,770
5,860
5,940
6,010
6,070
6,130
6,180
6,230
6,270
6,320
6,360
а =
иг
1,758
1,980
2,150
2,200
2,400
2,500
2,590
2,670
2,740
2,800
2,860
2,920
2,970
3,010
3,060
3,100
3,140
3,180
3,340
3,470
3,580
3,670
3,750
3,830
3,900
3,960
4,010
4,060
4,130
4,150
4,200
4,240
4,270
4,310
0,05
и2
1,999
2,429
2,753
3,012
3,222
3,399
3,552
3,685
3,800
3,910
4,000
4,090
4,170
4,240
4,310
4,370
4,430
4,490
4,710
4,890
5,040
5,160
5,260
5,350
5,430
5,510
5,570
5,630
5,680
5,730
5,780
5,820
5,860
5,900
а =
иг
1,782
2,040
2,220
2,370
2,490
2,590
2,680
2,760
2,840
2,900
2,960
3,020
3,070
3,120
3,170
3,210
3,250
3,290
3,450
3,590
3,700
3,790
3,880
3,950
4,020
4,080
4,140
4,190
4,240
4,280
4,330
4,360
4,400
4,440
0,10
и2
1,997
2,409
2,712
2,949
3,143
3,308
3,449
3,570
3,680
3,780
3,870
3,950
4,020
4,090
4,150
4,210
4,270
4,320
4,530
4,700
4,840
4,960
5,060
5,140
5,220
5,290
5,350
5,410
5,460
5,510
5,560
5,600
5,640
5,680
Гипотеза нормальности принимается, если U\(ql) < U < U(a) (a — уровень зна™
чимости). Наиболее полные таблицы критических значений Ui(a) приведены
в [9, 256] (в табл. 75 приведены некоторые значения U\[a) и ^(а)).
260 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
При п —» оо имеют место соотношения [266]
In- 1
при п = 2,4, ..., 2к;
при п= 1,3, . ..,2fc- 1.
Задача 116. Л условиях задачи 107 проверить гипотезу нормальности распределения
вероятностей случайных величин критерием Дэвида-Хартли-Пирсона при а = 0,05.
Имеем R = жтах - xmin = 15 -(-1) = 16; s = 4,686; U = — = —^- = 3,414.
s 4,686
Из табл. 75 для п = 10 и а = 0,05 имеем иг = 2,67 ш U2 = 3,522.
Так как 2,67 < 17 = 3,414 < 3,552, гипотеза нормальности распределения случайных
величин не отклоняется на уровне значимости 0,05.
3.2.2.11. Комбинированный критерий Шпигельхальтера
В [267, 268] рассмотрен комбинированный критерий нормальности против сим-
симметричных альтернатив с неизвестными средним и дисперсией. Критерий основан
на комбинации двух критериев — критерия Гири (см. раздел 3.2.2.9) и критерия
Дэвида-Хартли-Пирсона (см. раздел 3.2.2.10).
Статистика критерия имеет вид
г = {(cnu)-(n-v + g-(n~v
п
У\хг^х\
1 1 R ^
r-y -1 / i\ 7 тт -"- г=1
где Сп = —(n!)"-i; U =—\g= ,
2п s s^fn(n - 1)
Нулевая гипотеза нормальности испытываемого распределения принимается, ес-
если Т1 < Т'{а). Критические значения Т1'(а) на уровнях значимости а = 0,05 и 0,10,
а также значения коэффициента Сп приведены в табл. 76.
Таблица 76
Критические значения Т1 (ol)
критерия Шпигельхальтера [267]
п
5
10
15
20
50
100
а
0,05
1,532
1,453
1,423
1,403
1,337
1,308
0,10
1,512
1,417
1,387
1,369
1,317
1,294
Сп
0,3310
0,2678
0,2445
0,2321
0,2070
0,1971
Критерий обладает хорошей мощностью против симметричных альтернатив.
Задача 117. В условиях задачи 107 проверить гипотезу нормальности распределения
вероятностей случайной величины критерием Шпигельхальтера при а = 0,05.
Имеем R = 15 - (-1) = 16 и s = 4,686.
3.21
Критерии нормальности распределения
261
Из табл. 76 находим Сп = 0,2678 и вычисляем
1
= 0,8548; Т' = {@,2678 • 3,414)^9 + 0,8548^9} 9 = 1,228.
тт R 38
U = —; g = ,
s 4,686 • л/Ю-9
Из табл. 76 для а = 0,05 имеем Г;@,05) = 1,453.
Так как Т' = 1,228 < Т;@,05) = 1,453, гипотеза нормальности не отклоняется.
3.2.2.12. Критерий нормальности Саркади
Саркади [269] предложил критерий нормальности, более совершенный, чем дру-
другие. Предположим, имеется выборка значений случайной величины х\ ^ ж 2 ^ ... ^ хп.
Критерий Саркади строится следующим образом.
Образуем статистику
= Уэ
где
Jn
j = 1,2, ...,n-2),
= m, . ..,n- 1);
77i — произвольное фиксированное число A ^ m ^ n).
Если слохсная гипотеза нормальности верна, то переменные Zj взаимно незави-
независимы и имеют t-распределение (см. раздел 1.1.9) с / = п — j — 1 степенями свободы.
Тогда случайные величины
распределены равномерно на интервале [0,1] (Ff(z) — функция распределения Стью-
дента с / степенями свободы).
Таким образом, задача сводится к проверке равномерности распределения ве™
личин rj по одному из критериев согласия (см. раздел 3.4). Если проверяется
только факт нормальности распределения, то следует выбирать m = п или га = 1,
в ином случае (например, тренд в среднем, изменение дисперсии в альтернативе)
используются другие значения га.
В [270] предлагается использовать для проверки равномерности распределе-
распределения rj „гладкий критерий" Неймана, статистика которого имеет вид
р2_ 1
П ~ п - 2
4 п-2
Е
где
(рг(у) = л/12 f 2/ - 2
ip3(y) = л/7
Ы») = 210B,-1) -45(у-^) +1
— полиномы Лежандра, ортогональные на отрезке [0,1].
Распределение статистики Р| близко к распределению %2 с / = 4 степенями
свободы. Следовательно, если Р^ < X2f(a)i TO на уровне значимости а гипотеза
нормальности не отклоняется.
Функция распределения Стьюдента достаточно полно табулирована в
[25, табл. 3.1а, с. 236]. В связи с большим объемом этой таблицы она здесь не
262 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
приводится, читатель может легко найти ее в [25]. При необходимости можно
воспользоваться аппроксимациями раздела 1.1.9.
Задача 118. Проверить гипотезу нормальности распределения случайных величин
критерием Саркади при а = 0,05.
Выбираем т = п = 10 (^ х% = 48) и вычисляем для j = 1,2, ..., 9
Уз = хз ;—7= 'Y,Xi г- , 1 ' Ж1° = хз - 7,25031;
2/i = -8,25031; у2 = -7,25031; у3 = -6,02531; у4 = -5,02531; у5 = -4,02531;
2/6 = -2,2531; у7 = -1,2531; у8 = -0,2531; у9 = 2,74969.
Далее находим
2 = -1,89577;
1
^2 = 2/2 • | - • (уз + • • • + у1) \ 2 = -1,92842;
z3 = -1,97848; z4 = -2,0652; z5 = -2,2519;
z6 = -1,2859; z7 = -0,6404; z8 = -0,09103.
Переменные rj находим, пользуясь таблицей [25, табл. 3.1а, с. 236] функции t-pacnpe™
деления Стьюдента
т-1 = F8(-l,896) = 1 - F8(l,896) « 1 - 0,956 = 0,044; r2 = F7(-l,928) = 0,049;
гз = F6(-l,978) = 0,046; r4 = F5(-2,065) = 0,048; r5 = F4(-2,252) = 0,044;
r6 = F3(-l,286) = 0,150; r7 = F2(-0,540) = 0,317; r8 = Fi(-0,091) = 0,469.
Теперь вычислим статистику „гладкого критерия" Неймана.
Находим
(fi(n) = л/12 • @,044 - 0,5) = -1,5796; (р2(п) = лД • [@,044 - 0,5J - 0,5] = 1,6717;
ср3(п) = л/7 • [20 • @,044 - 0,5K - 3 • @,044 - 0,5)] = -1,3979;
ip4(n) = 210 • @,044 - 0,5L - 45 • @,044 - 0,5J + - = 0,8477;
8
(fi(r2) = -1,5623; (р2(г2) = 1,61087; (рз(г2) = -1,2744; (f4(r2) = 0,6601;
Vi(r3) = -1,5727; ^2(r3) = 1,6473; (p3(r3) = -1,3480; ^4(r3) = 0,7714;
y?x(r4) = -1,5638; (f2(r4) = 1,6230; (p3(r4) = -1,2988; ^4(r4) = 0,6967;
<Pi(rs) = -1,3979; (р2(г5) = 1,6717; (рз(г5) = -1,3979; (p4(r5) = 0,8477;
<Pi(r6) = -1,2124; <p2(r6) = 0,5255; (p3(r6) = 0,5093; (p4(r6) = -1,2362;
<pi(r7) = -0,6339; <p2{r7) = -0,6687; <p3(r7) = 1,1282; (p4(r7) = -0,1465;
<pi(r8) = -0,1074; (p2{r8) = -1,1051; (рз(г8) = 0,2445; (f4(r8) = 1,0819.
Окончательно получаем
8 8
JZimirj)]2 = 14,2394; УЧ^т,-)]2 = 12,68176;
JZlMrj)]2 = 10,6257; X>4fa)]2 = 5,8756; ?l = \jl Т,Ы{г3)]2 = 5,4278.
3=1 3=1 i=lj=l
Критические значения х4A — а) находим из табл. 55: %4@,95) = 9,488.
Так как Р| = 5,4278 < х4@,95) = 9,488, гипотеза нормальности распределения слу-
случайных величин не отклоняется.
3.2] Критерии нормальности распределения 263
3.2.2.13. Критерий нормальности Лина-Мудхолкара
В [271-273] показано, что если ж1? ..., хп (п ^ 2)—выборка из распределения
1 п
с функцией F{x), то х и s2 = — Yl (xi ~ х>2) независимы тогда и только тогда, когда
п г=1
F(x) —функция распределения нормального закона. Эта характеризация использо-
вана в [274] для построения критерия проверки нормальности распределения про-
против асимметричных альтернатив. Критерий позволяет проверить сложную гипотезу
нормальности распределения с неизвестными средним и (или) дисперсией.
Применение этого критерия не требует ни упорядочения, ни преобразования
переменных, ни выборочной оценки параметров распределения. Распределение ста-
статистики этого критерия при Hq очень близко к нормальному в малых выборках
(тогда как в других критериях это имеет место, как правило, только в асимптотике).
Критерий основан на анализе п средних и дисперсий, рассчитанных по п выбор-
выборкам, образуемым исключением каждый раз одного наблюдения. Хотя полученные
пары значений (ж^> s2) не будут независимыми, их можно использовать для постро-
построения критерия.
Одно из распределений — распределение s2 не является нормальным, а критерий
предполагает использование коэффициента корреляции в нормальной двумерной
совокупности. Поэтому для дисперсии применяется нормализующее преобразова-
преобразование Вилсона—Хилферти
, г = 1, ...,n.
Величину yi можно рассматривать как нормально распределенную случайную ве-
величину.
Таким образом, исследуется корреляция между величинами ги^, оцениваемая
коэффициентом корреляции
Г =
J2(Xi - x)bji -у)
г=1
= \2 \Г^ / -\2
* / / .у \Уг У)
I *
2
i=l г=1
Для построения статистики критерия используется нормализующее преобразование
z = — In . Дисперсия cr2(z) и коэффициент эксцесса (хЦ^) величины z равны
2, _ 3 7,324 53,005 _ 11,7 55,06
гс п2 п3 п п2
Критические значения z(a) могут быть вырахсены через квантили стандартного
нормального распределения иа следующим образом:
z(a) = o-(z)< ui+a + —¦
где а — уровень значимости.
Если х и s2 — среднее и дисперсия полной выборки, то а^, s| — среднее и диспер-
дисперсия по всем наблюдениям, исключая г-е:
1 / _ ч 2 l[/i\2 ГС , х2
264 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Программа расчета и некоторые практические рекомендации по применению этого
критерия рассмотрены в [275, 276].
В конечном итоге статистикой критерия является коэффициент корреляции
между Xi и (sf)^. Если \z\ < z(—-—), то гипотеза нормальности распределения
\ 2i J
случайных величин отклоняется.
В [277] предпринята попытка использовать вместо обычного коэффициента кор-
корреляции коэффициент ранговой корреляции Спирмена (см. раздел 5.2.2.2.2).
Задача 119. Проверить гипотезу нормальности распределения вероятностей случай-
случайных величин в условиях задачи 107 критерием Лина-Мудхолкара при достоверности
а = 0,95.
Имеем х = 4,8; s2 = ^— ?(xi - xf = 24,4.
Вычислим для примера значения х\ и s\:
хг = —!— • [10 • 4,8 —(—1I = 5,444;
10 — 1 L v п
s\ = —!— • A0 - 1) • 24,4 - — .(-l- 4,8J = 22,778.
10 — 2 [ ; ' 9 V ' ; J
Далее по аналогии вычисляем пары значений Xi(si) 3 . Вычисления сводим в таблицу:
г
1
2
3
4
5
6
7
8
9
10
Xi
-1
0
1
2
3
5
6
7
10
15
Xi
5,444
5,333
5,222
5,111
5,000
4,777
4,666
4,585
4,222
3,666
22,778
24,250
25,440
26,361
27,000
27,444
27,250
26,777
23,694
13,000
W = (*?)*
2,835
2,894
2,941
2,976
3,000
3,016
3,009
2,992
2,872
2,351
(Xi -x{yi- у))
^0,03440
0,00286
0,02200
0,02690
0,02200
^0,00326
-0,01644
-0,02250
0,00960
0,61103
48,026
Вычисляем
28,886
г
0,596768 • 1,64265
Далее находим
Ъг= 4,8026; y=-.YtVi = Z'
= 0,596768;
= 0,63995;
= 1 ¦ 1п ' +
2 1 - 0,63995
0,62733
:)з =2,
= 1,64265;
= 0,75809.
а>{х) = А _ L324 53,005 = = _ 11Д 55,06 =
v ; ю юо юоо ' v ; ю юо
Имеем при а = 0595 (критерий двусторонний): ui+a = tio,975 = 1,96.
2
Тогда z@,95) = 0,52893 • j 1,96 + — • (l,963 - 3 • 1,96) • (-0,6194) 1 = 1,01418.
Так как \z\ = 0,75809 < z(a) = 1,01418, нулевая гипотеза нормальности не отклоня™
ется.
3.2] Критерии нормальности распределения 265
3.2.2.14. Критерий нормальности Мартинеса-Мглевича
Критерий применяется против симметричных альтернатив, отличающихся от
нормального распределения „хвостами" или эксцессом. Критерий основан на отно™
шении двух оценок дисперсии — обычной и так называемой „робастной" (устойчи™
вой), двухвесовой.
„Робастная", устойчивая к выбросам, оценка дисперсии имеет вид [278]
I n л\ ~ •> ПРИ
где Zi = < 9med|xi - ж|'
< 1;
x — выборочная медиана, med(...) — медиана ряда в скобках.
В качестве статистики используется отношение дисперсий [278]
При справедливости нулевой гипотезы Hq имеет место МA) = 0,982. Критические
значения статистики для уровней достоверности а = 0,90 и 0,95 могут быть найдены
из соотношений
Г @,9) = 0,6376 - 1Д535п* + 0,126бв*2;
Т*,п п_. _ /1,9065 - 2,5465в* + 0,5652n*2, n > 50;
[0,7824 - 1,1021п* + 0,1021n*2, n < 50;
где п* = lg(n - 1); Г» = lg[I(a) - 0,982].
Этот критерий более мощен для альтернатив с длинными „хвостами", чем многие
другие критерии.
Задача 120. Проверить гипотезу нормальности распределения случайных величин
в условиях задачи 107 критерием Мартинеса-Иглевича при доверительной вероятно-
вероятности а = 0,95.
Для ряда 1, 0, 1, 2, 3, 5, 6, 7, 10, 15 медианой является
х5 + х6 3 + 5
х = = = 4.
2 2
Составляем и ранжируем по величине ряд значений величин
х{ -х\ : 1, 1, 2, 2, 3, 3, 4, 5, 6, 11.
Вычисляем
л л ~ 3+3
А = med|a?i — х = = 3.
Результаты расчетов сводим в таблицу (для упрощения записи приняты обозначения
# = A - z\t) ¦ A - 5zf) и ## = (Xi - i) ¦ A - zlf):
266 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
г
1
2
3
4
5
6
7
8
9
10
Zi
-5/27
-4/27
-3/27
-2/27
-1/27
1/27
2/27
3/27
6/27
11/27
0,0343
0,0220
0,0123
0,0055
0,0014
0,0014
0,0055
0,0123
0,0494
0,1660
(WL
0,8697
0,9150
0,9515
0,9782
0,9945
0,9945
0,9782
0,9515
0,8353
0,4838
#
0,8001
0,8707
0,9267
0,9672
0,9918
0,9918
0,9672
0,9267
0,7200
0,1419
(Xi - xf
25
16
9
4
1
1
4
9
36
121
##
21,7420
14,6400
8,5630
3,9130
0,9945
0,9945
3,9130
8,5630
30,0710
58,5400
Имеем
п
(xi -жJ = 219,6;
г=1 Ы\<1
2\4 / ~ч2
A -ZiL-(xi- xf = 151,934; 1=
1-4) -A-54) = 8,3041;
219,6-8,30412
= 1.107;
10 • 9 151,934
/*@,95) = 1,9065 - 2,5465 • 0,95424 + 0,5652 • @,95424) = -8,8157 • 10" ;
1@,95) = ю"8'8157'10 + 0,982 = 1,962.
Так как I = 1,107 < /@,95) = 1,962, нулевая гипотеза нормальности не отклоняется.
3.2.2.15. Критерий нормальности Д'Агостино
Д'Агостино [279, 280] предложил в качестве статистики для проверки нормаль™
ности распределения использовать отношение оценки Даутона для стандартного
отклонения [281] (см. раздел 2.1.2.1.6.3) к выборочному стандартному отклонению,
оцененному методом максимального правдоподобия,
D =
Г
2 '
п s
где
s = —
Очевидно, что а = —; гт является несмещенной оценкой стандартного откло™
нения а.
Показано, что
п(п — 1)
M(D) =
п-1
Цп - 1) Щп - if 128(п - IK _
1 = 0,28209479;
0,02998598
8,463
л/п
коэффициент ассиметрии;
гг>\ 107'9 л,л,
a4{JJ) = коэффициент эксцесса.
3.21
Критерии нормальности распределения
267
В качестве статистики критерия Д'Агостино используется величина
¦ D - 0,28209479
Y =
0,02998598
критические значения которой приведены в [279, 280] и частично воспроизведены
в табл. 77. Гипотеза нормальности принимается, если Y\{ot) ^ Y ^ Y2{pt), где Yi{a)
и Yi (ol) —критические значения статистики Y при достоверности а.
Таблица 77
Критические значения критерия Д'Агостино [279, 280]
10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
60
70
80
90
100
150
200
250
300
350
400
450
500
600
700
800
900
1000
а =
Гг
-2,62
-2,58
-2,53
-2,50
-2,47
-2,44
-2,41
-2,39
-2,37
-2,35
-2,33
-2,32
-2,30
-2,29
-2,28
-2,26
-2,25
-2,24
-2,23
-2,22
-2,21
-2,17
-2,14
-2,11
-2,09
-2,07
-2,00
-1,96
-1,93
-1,91
-1,89
-1,87
-1,86
-1,85
-1,83
-1,82
-1,81
-1,80
-1,79
0,90
Y2
0,235
0,329
0,399
0,459
0,515
0,565
0,609
0,648
0,682
0,714
0,743
0,770
0,794
0,816
0,837
0,857
0,875
0,892
0,908
0,923
0,937
0,997
1,050
1,080
1,120
1,140
1,230
1,290
1,330
1,360
1,380
1,400
1,410
1,420
1,440
1,460
1,470
1,480
1,490
а =
Y1
-3,25
-3,20
-3,16
-3,12
-3,08
-3,04
-3,01
-2,98
-2,96
-2,93
-2,91
-2,88
-2,86
-2,85
-2,83
-2,81
-2,80
-2,78
-2,77
-2,75
-2,74
-2,68
-2,64
-2,60
-2,57
-2,54
-2,45
-2,39
-2,35
-2,32
-2,29
-2,27
-2,25
-2,24
-2,21
-2,20
-2,18
-2,17
-2,16
0,95
Y2
0,299
0,381
0,460
0,526
0,574
0,628
0,677
0,720
0,760
0,797
0,830
0,862
0,891
0,917
0,941
0,964
0,986
1,010
1,020
1,040
1,060
1,130
1,190
1,240
1,280
1,310
1,420
1,500
1,540
1,570
1,610
1,630
1,650
1,676
1,690
1,710
1,730
1,740
1,750
а =
-4,66
-4,63
-4,57
-4,52
-4,47
-4,41
-4,36
-4,32
-4,27
-4,23
-4,19
-4,16
-4,12
-4,09
-4,06
-4,03
-4,00
-3,98
-3,95
-3,93
-3,91
-3,81
-3,73
-3,67
-3,61
-3,57
-3,41
-3,30
-3,23
-3,17
-3,13
-3,09
-3,06
-3,04
-3,00
-2,97
-2,94
-2,92
-2,91
0,99
Y2
0,385
0,479
0,555
0,613
0,667
0,720
0,775
0,822
0,867
0,910
0,941
0,983
1,020
1,050
1,080
1,110
1,140
1,170
1,190
1,220
1,240
1,340
1,420
1,480
1,540
1,590
1,750
1,850
1,930
1,980
2,030
2,060
2,090
2,110
2,150
2,180
2,210
2,310
2,350
268 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Критерий Д'Агостино следует применять, когда нет сведений об альтернатив™
ном распределении. Он показывает хорошую мощность против большого спектра
альтернатив, по мощности немного уступая критерию Шапиро—Yилка [282].
Задача 121. В условиях задачи 107 проверить гипотезу нормальности распределения
вероятностей случайных величин критерием Д^Агостино при достоверности а = 0,95
(s = 4,686).
Вычисляем Г = 5^{г - ^tij . Хг = (\ - —\ .(_!) + ...+ (9 - —\ -15 = 129.
4=1 ^ J \ / \ /
Далее получаем
2-^.129 = 129 =
10-9 100-4,686
0.275288-0,28209479
0,02998598
= _
Из табл. 77 для п = 10 и а = 0,95 находим yi@,95) = -3,25 и у2@,95) = 0,299. Так как
2/1 @,95) = —3,25 < Y = —0,71783 < 2/г@,95) = 0,299, гипотеза нормальности распределе-
распределения случайных величин не отклоняется.
3.2.2.16. Критерии асимметрии и эксцесса
Если распределение случайных величин нормально, то его коэффициент асим-
асимметрии «з = 0 и коэффициент эксцесса «4 = 3. Напомним, что выборочные оценки
коэффициентов асимметрии и эксцесса равны
з
г=1 г=1 г=1
Так как значения «з = 0 и а4 = 3 могут иметь место и для распределений, отличных
от нормального, то критерии этого раздела следует воспринимать как критерии
установления отклонения от нормальности распределения (но не установления
нормальности).
Известно [25], что М(а3) = 0; D(a3) = , ^J2}^ « - (l -
(n + l)(fi + 3) ny ^
В [283] показано, что распределение аз достаточно быстро стремится к нормаль™
ному. Для «4 справедливы соотношения
24n(n-2)(n-3) =24Л_ 225
( ) \ 15 + 2
п
Распределение «4 медленно стремится к нормальному [283].
Рассмотрим использование критерия а% для установления отклонения эмпири-
эмпирического распределения от нормального. Таблицы процентных точек распределе-
распределения «з приведены в [25]. При п > 200 может быть рекомендован грубый критерий:
если
П г,
) >
г=1
то нормальность распределения отклоняется.
На практике применяются нормализующие преобразования для «з • Рассмотрим
некоторые из них. В [284] предложена аппроксимация ? = 5\п(х-\- \/х2 + l) , где
х = —, которая при п —>• со распределена как стандартная нормальная величина
Л
(<5, А — коэффициенты, приведенные в табл. 78).
3.21
Критерии нормальности распределения
269
Таблица 78
п
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
8
5,563
4,260
3,734
3,447
3,270
3,151
3,069
3,010
2,968
2,937
2,915
2,900
2,890
2,870
2,882
2,882
2,884
2,889
2,895
2,902
2,910
2,920
2,930
2,941
2,952
2,964
2,977
2,990
3,003
3,016
3,030
3,044
3,058
3,073
3,087
3,102
Значения коэффициентов S
1/А
0,3030
0,4080
0,4794
0,5839
0,5781
0,6153
0,6743
0,6753
0,7001
0,7224
0,7426
0,7610
0,7779
0,7940
0,8078
0,8211
0,8336
0,8452
0,8561
0,8664
0,8760
0,8851
0,8938
0,9020
0,9097
0,9171
0,9241
0,9308
0,9372
0,9433
0,9492
0,9548
0,9601
0,9653
0,9702
0,9750
п
44
45
46
47
48
49
50
52
54
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
100
105
110
115
120
8
3,117
3,131
3,160
3,161
3,176
3,192
3,207
3,237
3,268
3,298
3,329
3,359
3,389
3,420
3,450
3,480
3,510
3,540
3,569
3,599
3,628
3,657
3,686
3,715
3,744
3,772
3,801
3,829
3,857
3,885
3,913
3,940
4,009
4,076
4,142
4,207
1/А
0,9795
0,9840
0,9882
0,9923
0,9963
1,0001
1,0038
1,0108
1,0174
1,0235
1,0293
1,0348
1,0400
1,0449
1,0459
1,0540
1,0581
1,0621
1,0659
1,0695
1,0730
1,0763
1,0795
1,0825
1,0854
1,0882
1,0909
1,0934
1,0959
1,0983
1,1006
1,1028
1,1080
1,1128
1,1172
1,1212
и - [284]
п
125
130
135
140
145
150
155
160
165
170
175
180
185
190
195
200
210
220
230
240
250
260
270
280
290
300
350
400
450
500
600
700
800
900
1000
8
4,272
4,336
4,398
4,460
4,521
4,582
4,641
4,700
4,758
4,816
4,873
4,929
4,985
5,040
5,094
5,148
5,255
5,359
5,461
5,561
5,660
5,757
5,853
5,946
6,039
6,130
6,567
6,976
7,363
7,731
8,149
9,054
9,649
10,271
10,738
1/А
1,1250
1,1285
1,1318
1,1348
1,1377
1,1403
1,1428
1,1452
1,1474
1,1496
1,1516
1,1535
1,1553
1,1570
1,1586
1,1602
1,1631
1,1657
1,1681
1,1704
1,1724
1,1744
1,1761
1,1779
1,1793
1,1808
1,1868
1,1914
1,1950
1,1979
1,2023
1,2058
1,2078
1,2096
1,2111
В [285] предложена следующая нормализующая аппроксимация. Если
t+1H + 3) 3(п2 + 27п-70)(п-
3)
6(n-2)
ш2 = -
а =
тo величина z = <51п< —\-
а
уже при п > 25 может быть аппроксими-
аппроксимирована стандартным нормальным распределением.
270 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Рассмотрим теперь преобразование для коэффициента эксцесса а^ [286]. Рас™
пределение «4 может быть аппроксимировано распределением X2 с / степенями
свободы при
Г ЯР Г =
Д
д /
(гс + 7)(п + 9) V гс(п - 2)(п - 3) *
В [286] предложено весьма эффективное нормализующее преобразование для
коэффициента эксцесса «4- Алгоритм его построения заключается в следующем.
а4 - М(а4)
.Ьсли ж = -; то случайная величина
1
2
9/ '
1-
1 —
VxJ
2
1
Г
f
2
-
>
4 J
11
3
>
B
d =
аппроксимируется стандартным нормальным распределением АГ@,1) у^ке при п > 20.
Нормализующие преобразования позволяют использовать таблицы (или аппрок™
симации) стандартного нормального распределения для проверки отклонения от
нормальности.
Мощность критерия проверки отклонения от нормальности может быть повы-
повышена применением так называемого комбинированного Ж2™критерия [284, 289]
К2 = Х2(а3)+Х2(а4),
где Х(«з) и Х{а.4) — стандартные нормальные эквиваленты распределений «з и«4-
Статистика К2 имеет ^^распределение с / = 2 степенями свободы. Другая
форма комбинированного критерия исследована в [287, 288]. Если q\ = 2р («з < аз)
и q2 = 2р («4 < «4) («з и бц — выборочные оценки параметров «з и «4 соответствен-
соответственно), то статистика q = ^21ngi^2 имеет %2~распределение с / = 4.
Задача 122. В условиях задачи 107 проверить гипотезу нормальности распределе-
распределения случайных величин критериями асимметрии и эксцесса на уровне достоверности
а = 0,90.
Отметим, что задача носит демонстрационный характер, так как применение крите-
критериев такого типа требует объемов выборки не менее 50.
Имеем
х = 4,8; s2 = 21,96 (s = 4,686) ;
ж» ~~ xf = 8,25,84;
г=1
1
(ж* - жL = 13523,952; a3 = т • 825,84 = 0,80258;
V ; 10-4,6863
a4 =
10-21,
—^ • 13523,452 = 2,
804393.
Вычисляем далее
Ща3) =
11 • 13
= 0,33566
М(а4) = 3 - — = 2,4545; D(a4) =
n2il3.15
= 0,56961 (VD(a4) = 0,75473).
3.21
Критерии нормальности распределения
271
Грубый критерий аз = 0,8025 > y/D(oL$) = 0,579 отклоняет гипотезу нормальности
(это применимо для п > 200, поэтому в нашем случае применение критерия некорректно;
однако наша цель — демонстрация техники вычисления — достигается).
Вычислим нормализующие преобразования. Рассмотрим сначала ^-преобразование.
Из табл. 78 для п = 10 находим 8 = 3,734 и - = 0,4794.
А
Далее имеем
х = а3 - 0,4794 = 0,80258 • 0,4794 = 0,384757; С = 3,734 • 1п@,384757 + 1,071465) = 1,4034.
Рассмотрим теперь ^-преобразование:
!° " 70)
у = 0,80258 •
= 1,38527416; /3 =
i • 15 ¦ 17 • 19
• 3,3204334;
ш2 = -1 + у/2 • 3,3204334 = 1,5769879; 6 = (in д/1,5769879) 2 = 2,0953804;
1
2
а =
0,5769879
= 1,8617941;
1,38527416V
1,8617941 )
+ 1 > = 1,4424244.
Теперь рассмотрим преобразование для «4- Сначала вычислим %2-преобразование.
Имеем
6- A00^50 +
17- 19
= 1,3962;
= 6-
1,3962
1,3962
1 +
—V
1,3962/
= 25,47.
Следовательно, величина а^ мо^кет быть аппроксимирована х2~РаспРеДелением
с / та 25,5 степенями свободы.
Наконец, рассмотрим нормализующее преобразование для ос±. Имеем
М(а4) = 2,4545; D(a4) = 0,569161
= 0,75473); х = 2^804393 ~ 2^4545 = 0;4636;
U, 154 (о
d =
9 • 25,47
1 -
9 • 25,47
1 -
25,47
- 0,4636 •
21,47
= 0,644.
Используем нормализующие преобразования для «з и «4 для оценки отклонения
эмпирического распределения отнормального (ito,95 = 1,645 — 95%-я квантиль стандарт-
стандартного нормального распределения. Так как критерий двустронний, при а = 0,90 следует
ПрИМеНЯТЬ Ul + g = U 1+0,90 = 1Ао,95).
2 2
Имеем z = 1,442 < г^о,95 = 1,645. Следовательно, гипотеза нормальности по коэффи-
коэффициенту асимметрии не отклоняется.
По коэффициенту эксцесса имеем d = 0,664 < 11,0,95 = 1,645 и гипотеза нормальности
также не отклоняется.
Рассмотрим теперь комбинированный критерий. Нормализующие преобразования
дают: Х2(а3) = A,403J = 1,9684; Х2(а4) = @,6498J = 0,4222 и К2 = Х2(а3) +
+Х2(«4) = 2,3906. Из табл. 55 для / = 2 имеем критическое значение Хо,эB) = 4,605. Так
как К2 = 2,39 < Хо,э(/ = 2) = 4,605, гипотеза нормальности распределения случайных
величин не отклоняется.
272 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.2.2.17. Критерий характеристической функции (критерий Муроты-Такеучи)
Если Xi (г = 1, ..., п) —выборка из распределения с характеристической функ™
цией c(t), то эмпирическая характеристическая функция определяется как
1 п
cn(i) = -]Texp(itei).
п i=i
В [290^292] исследована возможность применения характеристической функции
для проверки различных гипотез согласия. Для проверки сложной гипотезы нор™
мальности (когда параметры распределения не известны заранее) Мурота и Таке™
учи [293] предложили использовать „стьюдентизированную" форму
=Сп[-
где
-\2
г=1
Введем обозначения a(t) = \c(i)\ и an(t) = \cn(t)\ . В общем случае модуль
характеристической функции \c(i)\ не определяет форму распределения, но для
нормального распределения есть исключение. Распределение с характеристической
функцией c(t) нормально тогда и только тогда, когда величина yj — log |c(t)|2 ли™
нейна при любом t ^ 0 [293].
Для оценки „стьюдентизированного" модуля характеристической функции ис™
пользуется соотношение [293]
1
п
Распределения величин an(t) и an(t) медленно нормализуются с ростом п. Лучшее
приближение к нормальному распределению реализуется при t = 1 -г- 1,5.
Гипотеза нормальности не отклоняется, если а\ ^ an(t) ^ а^ где а\ и а2 —
граничные значения, зависящие от объема выборки и принятого уровня значимости
(приведены в табл. 79).
Таблица 79
Критические значения а\ и аг критерия Муроты^Такеучи
на уровне значимости a = 0,10 [293]
п
10
15
20
35
50
t = 0,5
at
0,7934
0,7871
0,7841
0,7805
0,7793
а2
0,8022
0,7966
0,7935
0,7888
0,7866
t = 1,0
ai
0,3604
0,3512
0,3475
0,3462
0,3466
0,4527
0,4440
0,4365
0,4192
0,4094
t = 1,5
а\
0,0540
0,0545
0,0555
0,0619
0,0660
0,2792
0,2544
0,2349
0,1945
0,1760
t = 2,0
а\
0,0027
0,0022
0,0022
0,0025
0,0024
«2
0,2684
0,1968
0,1640
0,1072
0,0842
Против асимметричных альтернатив критерий лучше, чем критерии асиммет-
рии и эксцесса (см. раздел 3.2.2.16). Критерий демонстрирует результаты не хуже,
чем критерий Шапиро-Уилка (см. раздел 3.2.2.1), но он может быть использован
против более широкого круга альтернатив.
Задача 123. Проверить гипотезу нормальности распределения случайных величин
для данных задачи 107 критерием Муроты-Такеучи на уровне значимости а = 0,1.
Имеем s2 = 24,4 (s = 4,3996); х = 4,8.
3.21
Критерии нормальности распределения
273
Будем использовать значение t = 1. Результаты расчетов сведены в таблицу:
3
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
к
2
3
4
5
6
7
8
9
10
3
4
5
6
7
8
9
10
4
5
6
7
8
9
iCj - Хк
s
-0,20244
-0,4049
-0,6073
-0,8098
-1,2146
-1,4171
-1,6195
-2,2269
-3,2391
-0,2024
-0,4049
-0,6073
-1,0122
-1,2147
-1,4171
-2,0244
-3,0366
-0,2024
-0,4049
-0,8098
-1,0122
-1,2146
-1,8220
(х- — xk \
COS{ s )
0,9796
0,9191
0,8212
0,6896
0,3486
0,0308
-0,0487
-0,6100
-0,9952
0,9796
0,9191
0,8212
0,5300
0,3486
0,1531
-0,4382
-0,9945
0,9796
0,9191
0,6897
0,5300
0,3486
-0,2485
3
3
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7
7
8
8
9
к
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
Xj — Xk
s
-2,8342
-0,2024
-0,6073
-0,8098
-1,1022
-1,6195
-2,6318
-0,4049
-0,6073
-0,8098
-1,4171
-2,4293
-0,2024
-0,4049
-1,0122
-2,0244
-0,2024
-0,8098
-1,8220
-0,6073
-1,6195
-1,0122
( x- - xi \
rn-f 3 1
COS I 1
V s J
-0,9531
0,9796
0,8212
0,6897
0,5300
-0,0487
-0,8728
0,9191
0,8212
0,6897
0,1531
-0,7569
0,9796
0,9191
0,5300
-0,4382
0,9796
0,6896
-0,2486
0,8212
-0,0487
0,5300
7,6724
Суммируя, находим у
3<к
Окончательно получаем
1 9
о„A) = - + —
п п
cos
7,6857
= 15,3581.
^—— ) = — + — • 15,3581 = 0,40716.
з I 10 100
Из табл. 79 для t = 1 и п = 10 имеем аг = 0,3604 и а2 = 0,4527.
Так как <ц = 0,3604 < апA) = 0,40716 < а^ = 0,4527, гипотеза нормальности распре-
распределения вероятностей случайных величин не отклоняется.
3.2.2.18. Критерии проверки нормальности распределения
по совокупности независимых выборок малого объема
Исследователь или испытатель чаще всего встречается на практике с ситуацией,
когда в его распоряжении находится совокупность малых выборок, поступающих
последовательно в течение длительного промежутка времени наблюдений или не™
пытаний, например, результаты испытаний малых партий изделий по мере их
изготовления. В этом случае появляется необходимость проверки нормальности
распределения случайной величины по совокупности выборок малого объема, в ко-
которых средние и дисперсии в общем случае могут быть разными. Различные методы
установления нормальности распределения наблюдаемой случайной величины в та-
такой ситуации рассматриваются в настоящем разделе.
274 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.2.2.18.1. Применение критерия Шапиро-Уилкаг)
Пусть имеется к независимых выборок объема щ каждая (г = 1, ...,&) и
хи ^ xi2 ^ • • • ^ %im Для каждой г-й выборки. Для каждой выборки вычислим
статистику
Здесь [ •.. ] — наибольшее целое число.
Пусть оц = F(Wi) —уровень значимости W^-статистики; uai —«-квантиль стан-
г к
дартного нормального распределения; U = -^=z y^ uai; q = —21nai—верхняя
к
а^точка распределения %2 с / = 2 степенями свободы и с = ^ Q.
г=1
Идея проверки нормальности распределения заключается в том, что все uai и U
имеют стандартное нормальное распределение, а с имеет распределение %2 с / = 2к
степенями свободы [294].
Ранее [242] была найдена аппроксимация
uai =
коэффициенты которой приведены в табл. 65.
г к
Статистика U = —^= \^ uai имеет стандартное нормальное распределение. От™
клонение распределения от нормального приводит к уменьшению значений W{.
Сдвиг значений uai к малым отрицательным величинам сигнализирует об этом.
Поэтому статистика критерия должна быть интерпретирована в терминах односто™
роннего критерия, т.е. если U < иа, то на уровне значимости а гипотеза нормаль™
ности должна быть отклонена.
к
Во втором варианте критерия вычисляются значения с^ = — 21па^ и с = У^ Cj.
г=1
Если с > x^Bfc), то гипотеза нормальности распределения не отклоняется (с > х2B1с),
критическое значение %2™статистики на уровне значимости ас/ степенями
свободы).
3.2.2.18.2. Применение критерия Саркади2)
В [295] предложено применение модифицированного критерия Саркади для
проверки нормальности распределения случайных величин по совокупности вы-
выборок малого объема. Алгоритм вычисления статистики критерия включает в себя
) См. раздел 3.2.2.1 — основной критерий.
) См. раздел 3.2.2.12 — основной критерий.
3.2]
Критерии нормальности распределения
275
вычисление для каждой г-й выборки величин
1
ч + VfTi^
xik
j = 1, 2, ..., га - 1;
= m, ...,
Пъ - J -
Величины z*- имеют ^-распределение Стьюдента с функцией распределения ве-
вероятностей Fni—j—i(z).
Находим величины гг- = Fni—j—i \zlA и затем объединяем все величины г%- в одну
выборку объема ^(п^ — 2). К ней применяется „гладкий" критерий Неймана для
проверки равномерности распределения величин Tji на отрезке [0,1] со статистикой
pi = -
4 г=1
Е Е
где
= V7 ¦
Если Pi < х^,D), то гипотеза нормальности распределения не отклоняется.
3.2.2.18.3. Критерий Смирнова [12]
Критерий основан на статистике
т =
где Xij—j-e наблюдение г-й вв1борки; Xi,Si—соответственно среднее значение
и стандартное отклонение г-й выборки.
Распределение статистики табулировано в [297]. При щ = п = 4 т имеет
равномерное распределение, а при п ^ 4 статистика t = . имеет
уп — 1 — т2
t-распределение Стьюдента с / = тг — 2 степенями свободы. Проверкой соот-
соответствия распределения величины t распределению Стьюдента и устанавливается
нормальность распределения случайной величины в исходных выборках. Идея
алгоритма такая лее, как и в предыдущем критерии Саркади — проверяется
равномерность распределения величин т (п = 4) или согласие с распределением
Стьюдента величин t (п ф 4).
276 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Задача 124. Имеются 5 выборок по 4 наблюдения в каждой.
Необходимо проверить гипотезу нормальности распределения случайных величин по
приведенной совокупности выборок при достоверности а = 0,95.
#11 = —1, #21 = 6, Ж31 = 7, Ж41 = 0, Ж51 = —3,
#12 — 0? Ж22 = 9, Ж32 = 11, Ж42 = 1, ^52 = —1,
#13 = 1, Ж23 = 11, Жзз = 15, Ж43 = 4, Ж53 = 0,
#14 = 2, Ж24 = 13, Ж34 = 16, Ж44 = 5, Ж54 = 1.
Критерий Шапиро-Уилка C.2.2.18.1)
4
Для 1-й выборки находим х\ = 0,5; ^(#ij — х\) = 5. Из табл. 63 для п = 4 находим
ai = 0,6872 и а2 = 0,1677. Тогда имеем
т = {0,6872.^14-хп)+ 0,1677.(gi3-gia)}a =
Из табл. 65 для п = 4 имеем j = -1,107, 77 = 0,714 и е = 0,6297.
Далее вычисляем
Из табл. 1 находим ai, соответствующее квантили стандартного нормального распре-
распределения ttai = 1,8128 — это ai = 0,965.
Далее по аналогии находим
х2 = 9,75; W2 = 0,9899; иа2 = 1,445; а2 = 0,926;
х3 = 12,25; W3 = 0,9261; гхаз = -0,1152; а3 = 0,460;
Х4 = 2,5; W4 = 0,9127; иа4 = ^0,267; а4 = 0,394;
х5 = -0,75; W5 = 0,9721; wa5 = 0,6832; а5 = 0,751
¦V5 г=1
Из табл. 1 для a = 0,95 находим по,95 = 1,645.
Так как U = 1,5915 < по,95 = 1,645, гипотеза нормальности распределения случайных
величин не отклоняется.
Далее вычисляем
с= ]Г(-21под) = -2- (In0,965 + ... + In0,751) =4,213.
Из табл. 55 находим Хо,9б(/ = 10) = 18,307.
Так как с = 4,213 < Хо,9б(Ю) — 18,307, гипотеза нормальности не отклоняется.
Критерий Саркади C.2.2.18.2)
Выбираем т = п = 4 ш для первой выборки имеем
I
2/2
I 1 f П
2 = -1; 2/з = 0-
3.2] Критерии нормальности распределения 277
Вычисляем
Г 1 (О
[4—1—1 V2
2|/2
+ Уз
Воспользовавшись функцией распределения Отьюдента, имеем (см. табл. 3.1а из [25])
ri = F2 (-2,828) = 0,053 и г2 = 0. Далее по аналогии имеем
1 4 1
2/? = Ж21 - - • ?>2fc - - • Ж24 = -4,833; у2 = -1,833; у\ = 0,1667;
5 fc=i Л
z\ = -3,7131; zl = -11; г2 = 0,032; г2 « 0;
у? = -6,5; г/з = -2,333; у| = 0,6667; z\ = -3,5; v\ = 0,094; ^ = 0,089;
yl = -3,8333; 2/2 = ^0,8333; zl = -2,6919; 4 = -2,20; г\ = 0,06; г\ = 0,136.
Получаем ряд величин:
г\ = 0,053; г\ =0; г? = 0,032; Гз = 0,0444; г| = 0,175;
т\ = 0,084; гз = 0,089; г\ = 0,060; Гз = 0,136.
Находим
<Pi (rl) = -1,548; <р! (гг2) = -1,732; с^ (г?) = -1,621; <рг (г22) = -1,580;
^i (rl) = -1,126; (^i (r-i) = -1,406; (рг (г$) = -1,424; (рг (г5г) = -1,524;
(fi(r2) = —1,261 и ^^ (ft = ^2(^1) = 1,563;
<р2 (rl) = 2,236; (^2 (г2г) = 1,820; ^ (г^) = 2,236; <р2 (г?) = 1,672;
с/?2 (г|) = 0,299; у>2 (г?) = 1,093; ^ D) = 1,148; ^2 (п) = 1,479;
ср2 (rl) = 0,659 и J2 "А = 23,774;
^з (rj) = -1,178; <р3 (гг2) = -2,645; (^3 (rl) = -1,709; ^3 (r-f) = -2,645;
<Рз(г1) = -1,398; у?з(г|) = 0,763; ^3(ri) = -0,319; (f3(rt) = -0,411;
(^3(ri) =-1,015; 993G2)= 0,337 и ^ ^з = 22,251.
Окончательно получаем
1 4
F42 = — • У" У? = 8,527.
Из табл. 55 имеем Хо,9бD) = 9,488.
Так как Р| — 8,527 < Хо,9бD) = 9,488, гипотеза нормальности распределения случай-
случайных величин не отклоняется.
3.2.2.19. Сравнительная мощность различных критериев нормальности
В этом разделе представлены результаты исследования сравнительной мощно-
мощности критериев нормальности распределения вероятностей случайных величин [243]
для различных альтернативных распределений. В табл. 80 представлено ранжиро-
ранжирование 21 критерия нормальности. Критерии по каждой альтернативе представлены
в порядке предпочтения — от наибольшего A) до наименьшего B1). В последней
графе приведено общее ранжирование, соответствующее набранной сумме рангов.
Табл. 80 может быть полезной ориентировкой для пользователя при выборе кри™
терия проверки нормальности распределения вероятностей изучаемой случайной
величины.
278 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 80
Сравнение критериев проверки
нормальности распределения случайных величин
Наименование критерия (раздел)
Критерий Шапиро-Уилка C.2.2.1)
Критерий К2 C.2.2.16)
Критерий Дарбина C.1.2.7)
Критерий Д'Агостино C.2.2.14)
Критерий «4 C.2.2.16)
Критерий Васичека C.2.2.2)
Критерий Дэвида-Хартли-Пирсоыа
C.2.2.10)
Критерий х2 C.1.1.1)
Критерий Андерсона™Дарлинга C.1.2.4)
Критерий Филлибена C.2.2.5)
Критерий Колмогорова-Смирнова
C.1.2.1)
Критерий Мартинеса—Иглевича
C.2.2.14)
Критерий Лина—Мудхолкара C.2.2.13)
Критерий а3 C.2.2.16)
Критерий Шпигельхальтера C.2.2.11)
Критерий Саркади C.2.2.12)
Критерий Смирнова—Крамера—фон Ми-
зеса C.1.2.2)
Критерий Локка-Спурье C.2.2.7)
Критерий Оя C.2.2.8)
Критерий Хегази-Грина C.2.2.3)
Критерий Муроты—Такеучи C.2.2.17)
Характер альтернативного распределения
асимметричное
а4 < 3
1
7
11
12
14
2
21
9
18
3
16
10
4
8
19
5
17
13
20
6
15
«4 > 3
1
8
7
9
5
14
2
20
3
12
10
16
15
6
13
18
11
4
17
19
21
симметричное
а4 < 3
3
10
7
4
2
8
1
9
5
18
6
13
12
21
11
15
20
19
14
16
17
а4 > 3
2
6
15
5
4
10
9
8
18
1
16
3
12
7
11
14
17
21
13
19
20
я^ нор-
нормальное
«4 ~ 3
2
4
1
12
18
10
1
3
7
9
5
15
16
19
8
13
6
17
14
21
20
Ранг
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
3.3] Критерии проверки экспоненциальности распределения 279
3.3. Критерии проверки экспоненциальности распределения
Экспоненциальный закон распределения вероятностей является базовым зако-
законом, используемым в теории надежности. Его аналитическая простота делает его
привлекательным для инженеров и исследователей. Однако всегда следует пред-
предварительно убедиться в том, что вероятностное поведение случайной величины
(например, моментов отказов изделий) подчиняется „желательному" экспоненци-
экспоненциальному закону. В ином случае выигрыш от простоты расчетов будет многократ-
многократно „скомпенсирован" потерями от ошибочных выводов и заключений, вызванных
отклонением реального распределения вероятностей случайной величины от экспо-
экспоненциального закона.
По-видимому, желанием предостеречь пользователя от таких ошибок объясняет-
объясняется многообразие разработанных на сегодняшний день математиками-статистиками
критериев экспоненциальности, основные из которых представлены в настоящем
разделе.
3.3.1. Критерий Шапиро-Уилка
Критерий предложен Шапиро и Уилком [298]. Предположим, имеется выборка
%\ ^ %2 ^ • • • ^ %nj причем начальная точка распределения неизвестна, т. е. рассма-
рассматривается плотность вероятностей
1 ( х ¦
f(x) = -ехр
v \ v
с неизвестным параметром /л.
Тогда статистика критерия имеет вид
WE =
или при п —У оо (п > 50)
wE= i
Гипотеза экспоненциальности наблюдаемого распределения не отклоняется с до-
достоверностью а, если W\(a) ^ We ^ W^l»), где W\{a) и М^(«) —критические зна™
чения, приведенные в табл. 81.
Для случая цензурированной выборки, когда отсутствуют г\ наименьших и г2
наибольших членов выборки, модификация критерия Шапиро^Уилка рассмотрена
в [299]. Его статистика в этом случае имеет вид
W, =
\ГЬ — Г\—Г2)гр гр
СХ-- -*• ri_i_i-*¦ П + 7
1 = 1
где
Тг = (п-г + 1)(^-^_1), г = 2, ...,п;
(п) _ г — 1 / (п) _ (п). • • _ 9
280 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 81
Критические значения
критерия экспоненциальности We Шапиро^Уилка [13, 298]
п
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
а =
Шг(а)
0,071
0,062
0,058
0,056
0,052
0,050
0,046
0,043
0,040
0,038
0,034
0,031
0,029
0,028
0,027
0,90
W2(a)
0,358
0,301
0,261
0,231
0,208
0,191
0,173
0,159
0,145
0,134
0,120
0,109
0,102
0,095
0,091
а =
0,062
0,054
0,050
0,049
0,046
0,044
0,040
0,038
0,036
0,034
0,030
0,028
0,026
0,025
0,024
0,95
W2(a)
0,404
0,342
0,301
0,261
0,234
0,215
0,195
0,178
0,163
0,150
0,135
0,123
0,114
0,106
0,101
п
22
23
24
25
26
27
28
29
30
31
32
33
34
35
а =
Шг{а)
0,026
0,025
0,024
0,023
0,022
0,022
0,021
0,021
0,020
0,019
0,019
0,018
0,018
0,018
0,90
W2(a)
0,084
0,078
0,074
0,070
0,066
0,063
0,061
0,058
0,054
0,052
0,050
0,048
0,047
0,045
а =
Wt(a)
0,023
0,022
0,021
0,021
0,020
0,020
0,019
0,019
0,018
0,017
0,017
0,017
0,017
0,016
0,95
W2(a)
0,094
0,087
0,082
0,078
0,073
0,070
0,067
0,064
0,060
0,057
0,055
0,053
0,051
0,049
Критические значения статистики W\ находятся из табл. 81 с заменой п на
п — Г\ — Г2, т. е. гипотеза экспоненциальности не отклоняется, если
W1(n_ri_r2)(a) ^W^ W2(n_ri_r2)(a).
Если начальная точка известна (предположим, /л = 0, что всегда можно сделать
заменой Х{ на Х{ — /i), то статистика Шапиро^Уилка имеет вид
Гипотеза экспоненциальности не отклоняется, если
где Wi(a), W2(a)—критические значения, приведенные в табл. 82.
Вместо статистики We0 можно воспользоваться статистикой [300]
У^ Xi
критические значения которой совпадают с Wi(a) и W~2(a) (см. табл. 81, в которой п
следует заменить на (п + 1)).
Для случая цезурирования справа статистика заменяется на
'if1 г,
Е Е 4Г2
%=2 j=2
8.8]
Критерии проверки экспоненциальности распределения
281
Таблица 82
Критические значения
критерия экспоненциальности We0 Шапиро^Уилка [13, 298]
п
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
а =
Шг(а)
0,033
0,032
0,031
0,030
0,030
0,029
0,028
0,027
0,026
0,025
0,024
0,024
0,023
0,023
0,022
0,90
W2 (a)
0,225
0,200
0,177
0,159
0,145
0,134
0,124
0,115
0,106
0,098
0,093
0,087
0,083
0,077
0,074
а =
0,025
0,025
0,025
0,025
0,025
0,025
0,025
0,024
0,024
0,023
0,023
0,022
0,022
0,021
0,020
0,95
W2(a)
0,260
0,230
0,205
0,184
0,166
0,153
0,140
0,128
0,119
0,113
0,107
0,101
0,096
0,090
0,085
п
22
23
24
25
26
27
28
29
30
31
32
33
34
35
а =
Шг{а)
0,022
0,021
0,021
0,020
0,020
0,020
0,019
0,019
0,019
0,018
0,018
0,018
0,017
0,017
0,90
W2 (a)
0,069
0,065
0,062
0,058
0,056
0,054
0,052
0,050
0,048
0,047
0,045
0,044
0,043
0,041
а =
Wt(a)
0,020
0,019
0,019
0,018
0,018
0,017
0,017
0,016
0,016
0,016
0,015
0,015
0,014
0,014
0,95
W2(a)
0,080
0,075
0,069
0,065
0,062
0,058
0,056
0,054
0,053
0,051
0,050
0,048
0,046
0,045
Ее критические значения совпадают с критическими значениями статистики We0
(см. табл. 82 с заменой п на (п — г2 + 1)).
Задача 125. Имеется ряд наблюдений
хц 1, 2, 4, 5, 9, 11, 18, 21, 29, 35.
Проверить соответствие распределения вероятностей случайной величины^ представ-
представленной этой выборкой^ экспоненциальному распределению при достоверности а = 0,95.
Рассмотреть случаи неизвестного начала распределения (ji неизвестно) и известного
значения fi = 1.
Случай 1 (fi неизвестно)
Вычисляем х = 13,5; (ж - хгJ = C,5 - IJ = 156,25;
10 56?25
Тогда WE =
Xi ~ *) = 1256,5.
5 = 0,138. Из табл. 81 для а = 0,95 и п = 10 находим И^@,95) =
9- 1256,5
= 0,049 и W2@,95) = 0,261.
Так как Wi@,95) < We < W2@,95), гипотеза экспоненциальности распределения не
отклоняется.
Случай 2 (/i = 1)
Находим эквивалентный ряд Х{ — /1 = Х{ — 1:0, 1, 3, 4, 8, 10, 17, 20, 28, 34, для которого
имеем х = 12,5; J2(xi ~ xf = 1256,5 и CExif = 156,25.
1256 5 ~
Тогда WEq = = 0,08. Из табл. 82 для а = 0,95 и п = 10 находим Wt(a) = 0,025
15625
и W2(a) =0,184.
Так как #i@,95) = 0,025 < WEo = 0,08 < #2@,95) = 0,184, гипотеза экспоненциала
ности не отклоняется.
1 КЯ9Я
= 0,101.
IU • ^11 • Z5iy — HOb'ZZ))
Из табл. 81 для п
Вычисляем статистику We^ = ;
J ° 10 • A1 • 2819 - 15625)
= 11 и а = 0,95 имеем Wi@,95) = 0,046 и VF2@,95) = 0,234, что
также не позволяет отклонить гипотезу экспоненциальности, так как We0 не выходит за
пределы критического диапазона.
282 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Задача 126. Проверить гипотезу экспоненциальности для ряда наблюдений, пред-
представленного в задаче 125, при условии, что первое и два последних наблюдения цен-
зурированы (для случая, когда fi неизвестно и а = 0,95).
Имеем п = 1 и гч = 2 (п — г\ — гч = 7). Находим
Т3 = 8 • (х3 - х2) = 8 • 2 = 16; Т4 = 7 • (ж4 - ж3) = 7; Г5 = 6 • (хъ - х4) = 24;
Т6 = 5 • (х6 - хъ) = Ю; Т7 = 4 • (ж7 - ж6) = 28; Г8 = 3 • (х8 - х7) = 9.
Вычисляем
(п-п-^) _ G) _
^~ 1
7 - j + 1 8 - j
a43 = ^5 a53 = ^5 a63 = g? a73 = ^5 a44 = j5 a54 = ^5 a64 = j5
G) 6 G) 4 G) 5 G) 6 G) 5 G) 6 G) 6
a74 — л •) a55 — о ' 5 — о ' 5 ~ о ? a66 ~ r, 5 a76 ~ o ? a77 ~ -, •
4 о о О А А I
Далее получаем
/l 2 3 5 5 6 \
6 . I - . Гз . Гз + - . Гз . T4 + - ¦ T3 . T5 + ... + - . T6 . T7 + - ¦ T7 . T7 + - . T7 . T8 I =
Находим (Г3 + Т4 + ... + Т7 + Т8J = A6 + 7 + ... + 28 + ЭJ = 8836.
Окончательно получаем W\ = = 0,220. Из табл. 81 для П — Г1—Г2 = 7 и а = 0,95
J 40056 '
находим Wi@,95) = 0,062 и W2@,95) = 0,404.
Так как Wi@,95) = 0,062 < WE = 0,220 < W2@,95) = 0,404, гипотеза экспоненциаль-
экспоненциальности распределения вероятностей случайных величин не отклоняется.
3.3.2. Критерии типа Колмогорова—Смирнова
Модификации известных критериев типа Колмогорова^Смирнова для приме-
применения их при проверке экспоненциальности закона распределения вероятностей
(с неизвестными параметрами) наиболее полно представлены в [301, 302].
Предположим, имеет место гипотетический закон распределения вероятностей
F(x) = 1 — ехр| — 1, где \х и v — неизвестные параметры, оценки которых по
выборке могут быть найдены из формул (отметим, что выборка упорядочена, т. е.
хг ^ х2 <* ... ^ хп)
nix — xi) л и
v = — —L\ /л = хг .
п—\ п
Обозначив Wi = ^-^—, переходим к нормированному экспоненциальному рас-
распределению Zi = 1 — exp(^ti^), для которого имеем аналоги известных статистик
критериев согласия
— критерий Колмогорова-Смирнова (см. раздел 3.1.2.1):
\ i 1 Г г- ll
J9+ = max Zi\; D^ = max zi ; Dn = max(J9+, D~) ;
1 ln \ % L n 1
— критерий Андерсона-Дарлинга (см. раздел 3.1.2.4):
А2
.... i-i)l — n;
3.3]
Критерии проверки экспоненциальности распределения
283
— критерий Смирнова-Крамера-фон Мизеса (см. раздел 3.1.2.2):
— критерий Ватсона (см. раздел 3.1.2.5):
2
Yin'
где z = -
— критерий Купера (см. раздел 3.1.2.6):
V = D++D-.
Для случая проверки экспоненциальности распределения с неизвестными пара-
параметрами критические значения перечисленных статистик для различных уровней
значимости приведены в табл. 83.
Таблица 83
Критические значения статистик
критериев согласия типа Колмогорова^Смирнова
для проверки экспоненциальности распределения
с неизвестными параметрами [301]
п
5
10
15
20
25
50
100
оо
5
10
15
20
25
50
100
оо
5
10
15
20
25
50
100
оо
0,25
Уровень значимости
(верхние процентные то
0,15
0,10
0,05
а
чки)
0,025
0,01
Статистика л/пВп
0,683
0,753
0,771
0,786
0,792
0,813
0,824
0,840
0,749
0,833
0,865
0,872
0,878
0,879
0,911
0,927
0,793
0,889
0,912
0,927
0,936
0,960
0,972
0,995
0,865
0,977
1,002
1,021
1,033
1,061
1,072
1,094
0,921
1,048
1,079
1,099
1,115
1,149
1,171
1,184
0,992
1,119
1,163
1,198
1,215
1,257
1,278
1,298
Статистика V
1,098
1,194
1,225
1,245
1,260
1,292
1,310
1,334
1,186
1,294
1,325
1,346
1,366
1,400
1,419
1,444
1,234
1,363
1,392
1,419
1,438
1,481
1,502
1,532
1,314
1,461
1,504
1,536
1,559
1,600
1,647
1,656
1,400
1,556
1,596
1,635
1,658
1,701
1,740
1,770
1,494
1,662
1,701
1,769
1,796
1,847
1,897
1,910
Статистика W
0,083
0,097
0,103
0,106
0,107
0,111
0,113
0,116
0,102
0,122
0,130
0,133
0,135
0,141
0,144
0,148
0,117
0,142
0,151
0,157
0,160
0,166
0,170
0,175
0,141
0,176
0,188
0,195
0,199
0,209
0,215
0,222
0,166
0,211
0,229
0,237
0,247
0,256
0,263
0,271
0,197
0,259
0,281
0,293
0,301
0,319
0,328
0,338
284 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
те
5
10
15
20
25
50
100
оо
5
10
15
20
25
50
100
оо
0,25
Око
нчани
Уровень значимости
е т а б л
и ц ы 83
а
(верхние процентные точки)
0,15
0,10
0,05
0,025
0,01
Статистика U2
0,068
0,075
0,080
0,082
0,083
0,087
0,089
0,090
0,083
0,094
0,099
0,102
0,104
0,108
0,110
0,112
0,093
0,108
0,114
0,117
0,119
0,124
0,126
0,129
0,113
0,131
0,139
0,143
0,146
0,152
0,155
0,159
0,131
0,155
0,165
0,170
0,173
0,180
0,184
0,189
0,153
0,187
0,200
0,207
0,212
0,223
0,229
0,236
Статистика А2
0,460
0,545
0,575
0,608
0,625
0,680
0,710
0,736
0,555
0,660
0,720
0,757
0,784
0,838
0,875
0,910
0,621
0,747
0,816
0,861
0,890
0,965
1,008
1,062
0,725
0,920
1,009
1,062
1,097
1,197
1,250
1,321
0,848
1,068
1,198
1,267
1,317
1,440
1,510
1,591
0,989
1,352
1,495
1,580
1,635
1,775
1,865
1,959
Для п ^ 5 верхние процентные точки распределения статистик вполне удо™
влетворительно совпадают с предельными распределениями при использовании
модификаций, приведенных в табл. 84.
Таблица 84
Процентные точки модифицированных критериев типа
Колмогорова—Смирнова длм проверки экспоненциальности распределения
Статистика
w2
и2
А2
Модификация
/ 9 о о \
W2 | 1 _|_ ' 1
^ + 7"?j
/ 2 3 3 \
V+ ~п~ ~ г?/
\ п тг2/
0,25
0,116
0,090
0,736
Уровень значимости
0,15
0,148
0,112
0,916
0,10
0,175
0,129
1,062
0,05
0,222
0,159
1,321
а
0,025
0,271
0,189
1,591
0,01
0,338
0,230
1,959
Задача 127. Проверить гипотезу экспоненциальности распределения вероятностей
случайных величин в условиях задачи 125 на уровне значимости а = 0,05 критериями
типа Колмогорова-Смирнова.
Имеем х = 13,5; v =
Далее вычисляем
10- A3,5™ 1)
9
= 13,889; Д = 1 -
13,889
10
= -0,3889.
- Д 1 + 0,3889
= 0,1; Zi = 1-е'1 =0,0952;
i> 13,889
W2 = 0,172; z2 = 0,1580; W3 = 0,136; z3 = 0,2709; W4 = 0,388; z4 = 0,3216;
W5 = 0,676; z5 = 0,4913; W6 = 0,820; z6 = 0,5596; FF7 = 1,324; z7 = 0,7339;
W8 = 1,540; z8 = 0,7856; W9 = 2,116; z9 = 0,8795; Wio = 2,548; z10 = 0,9218.
3.3]
Критерии проверки экспоненциальности распределения
285
Критерий Колмогорова-Смирнова
Результаты расчетов представлены в таблице:
г
1
2
3
4
5
6
7
8
9
10
г
п
ОД
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0952
0,1580
0,2709
0,3216
0,4913
0,5596
0,7339
0,7856
0,8795
0,9218
г
%г
п
0,0048
0,0420
0,0291
0,0784
0,0087
0,0404
-0,0339
0,0144
0,0205
0,0782
ъ - 1
п
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
i - 1
п
0,0952
0,0580
0,0709
0,0216
0,0913
0,0956
0,1339
0,0856
0,0795
0,0218
Из таблицы видим, что
D+ max | zA = 0,0784; D~ = max Zi -
Dn = max(D+,D~) = 0,1339.
i- 1
= 0,1339;
Значение статистики критерия равно у/п • Dn = \/Тб • 0,1339 = 0,423.
Из табл. 83 для а = 0,05 и п = 10 находим, что критическое значение статистики
равно 0,97. Так как ^/п • Dn = 0,423 < 0,97, гипотеза экспоненциальное™ распределения
вероятностей случайных величин не отклоняется.
Критерий Купера
Статистика критерия равна
y^-Vn = л/п- (D+ + D~) = \/l0 • @,0784 + 0,1339) = 0,671.
Из табл. 83 для а = 0,05 и п = 10 находим критическое значение, равное 1,461.
Так каку^гг • Vn = 0,671 < 1,461, гипотеза экспоненциальности не отклоняется.
Вычисляем
Критерий Андерсона--Дарлинга
А2 = -— • |l • [1п0,0952 + ln(l - 0,9218)] + 3 • [In0,158 + ln(l - 0,8795)] +
+ 5 • [In 0,2709 + ln(l - 0,8756)] + 7 • [In 0,3216 + ln(l - 0,7339)] +
+ 9 • [In 0,4913 + ln(l ~~ 0,3216)] + 11 • [In 0,5596 + ln(l - 0,4913)] +
+ 13 • [In 0,7339 + ln(l - 0,3216)] + 15 • [In 0,7856 + ln(l - 0,2709)] +
+ 17 • [In 0,8795 + ln(l - 0,158)] + 19 • [In 0,9218 + ln(l - 0,0952)]} - 10 = 0,17988.
Из табл. 83 для п = 10 и а = 0,05 находим критическое значение А2 @,05) = 0,920 или
для модифицированного критерия
(А2У = А2 . A + ** - ^] = 0,17988 . Л + М _ iL) = 0,257,
1 ; V п п2) \ Ю 100/
критическое значение которого из табл. 84 равно 1,321. Далее имеем
А2 = 0,17988 < А2@,05) = 0,920; (А2)' = 0,257 < (А2@,05)); = 1,321,
и гипотеза экспоненциальности не отклоняется.
286 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Критерий Смирнова-Крамера-фон Мизеса
Вычисляем статистики критерия
1 =@,0952-^) +@,158- — ) + @,2709 —^ ) + @,3216-^-
V 20/1 20/1 20/1 20
0,4913-—] + f 0,5596 — — J + f 0,7839 ^ — J + @,7856 - —
2 ( 1 +
+ f 0,8795 1 + f 0,9218 1 + =0,0234
и (W2)' =W2 • [ 1 + — - -^ ) = 0,0234 • A + 0,28 - 0,03) = 0,0295.
V n n ZJ
Из табл. 84 имеем критическое значение статистики
(W2(a))f = 0,222 (для п = 10 ш а = 0,05).
Так как {W2)' = 0,0292 < (М^2@,05)); = 0,222, гипотеза экспоненциальности не отклоня-
отклоняется.
Критерий Ватсона
z=--J2zi =0,52174;
U2 = W2 - п > (z - - ] = 0,0234 - 10 • @,52174 - 0,5J = 0,01877;
(U2)' = U2 • ( 1 + — - АЛ = 0,01877 • A + 0т23 - 0,03) = 0,0255.
х J у п пА)
Из табл. 84 для п = 10 и а = 0,05 имеем критическое значение (U2(a))' = 0,159. Так
как {U2)' = 0,0225 < (С/2(а))' = 0,159, гипотеза экспоненциальности распределения не
отклоняется.
3.3.3. Критерии типа Смирнова-Крамера-фон Мизеса
для пензурированных данных
Рассматривается выборка, в которой все наблюдения, большие, чем некоторая
величина хр, цензурированы, т. е. в распоряжении наблюдателя есть только г на™
блюдений из выборки объема п, удовлетворяющих условию 0^Xi^X2^...^%.
Необходимо проверить гипотезу о том, что ряд наблюдений извлечен из выборки
с функцией распределения вероятностей
F(x) = 1-ехр( -- ] .
Оценкой v по выборке является
1
и = -
г
i + (п ^ г) 2
Оценкой степени цезурирования р является величина
/ j
Применение критерия Смирнова—Крамера—фон Мизеса (см. раздел 3.1.2.2) для
цензурированных выборок рассмотрено в [304]. Полагая, что Zi = 1 ^expj — — 1,
3.3]
Критерии проверки экспоненциалъности распределения
287
запишем статистику критерия в виде
г=1
2г -
1
127*
Критические значения статистики Wjj для выборок со степенью цензурирова™
ния р для различных уровней значимости приведены в табл. 85.
Таблица 85
Критические значения статистики
(а — уровень значимости) [304]
а
0,15
0,10
0,05
0,025
0,01
Степень цензурирования р
0,5
0,0531
0,0635
0,0821
0,1015
0,1279
0,6
0,0720
0,0857
0,1103
0,1359
0,1710
0,7
0,0921
0,1093
0,1401
0,1721
0,2160
0,8
0,1126
0,1333
0,1702
0,2087
0,2613
0,9
0,1321
0,1561
0,1986
0,2433
0,3033
1,0
0,1480
0,1745
0,2216
0,2706
0,3376
Рекомендуется использовать модифицированную форму критерия
2,8 3
\VVp) — Wp \ L + „ 2 '
Естественно, при р = 1 (отсутствие цензурирования) критические значения стати-
статистики совпадают с приведенными в табл. 84.
Задача 128. Проверить гипотезу экспоненциалъности распределения случайных ве-
величин в условиях задачи 125 на уровне значимости а = 0,05 критериями Смирнова-
Крамера-фон Мизеса и Колмогорова-Смирнова при условии, что все наблюдения,
большие хр = 20, цензурированы.
Имеем г = 7 и хр = 20. Вычисляем
v=\
+ (Ю - 7) • 20 =15,71428; р = 1 - ехр(-
Д°
) =
= 1 — exp f —
15,71428/
= 0,06165; z2 = 0,1195; z3 = 0,22473;
0,72;
15,71428
z4 = 0,2725; z5 = 0,4360; z6 = 0,5034; z7 = 0,6819.
Далее
=( 0,06165 - ±
-^] + [0,22473-^
2
0,2775
20
0,4360 - -
0,5034 - g
0,6819 - Н
1
12 -7
- = 0,023
Из табл. 85 для а = 0,05 и р = 0,72 экстраполяцией получаем (Wp @,05)); = 0,15. Так
как (WpY = 0,0308 < (Wp(a))' = 0,15, гипотеза экспоненциальное™ не отклоняется.
288 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.3.4. Критерий Фроцини
В [239] рассмотрен критерий экспоненциальности, основанный на статистике
г -0,5
г=1
l-exp -— -
критические значения которой Вп(а) приведены в табл. 86.
Таблица 86
Критические значения Вп(а) критерия экспоненциальности
Фроцини (а — доверительная вероятность)
п
5
6
7
8
9
10
11
12
13
а
0,90
0,3261
0,3241
0,3292
0,3289
0,3365
0,3377
0,3334
0,3318
0,3313
0,95
0,3687
0,3666
0,3742
0,3740
0,3800
0,3820
0,3790
0,3784
0,3768
0,99
0,4499
0,4495
0,4584
0,4609
0,4660
0,4753
0,4710
0,4641
0,4631
п
14
15
16
17
18
19
20
оо
а
0,90
0,3373
0,3364
0,3345
0,3387
0,3360
0,3370
0,3351
0,3380
0,95
0,3821
0,3837
0,3777
0,3806
0,3814
0,3844
0,3795
0,3840
0,99
0,4656
0,4747
0,4693
0,4716
0,4730
0,4796
0,4738
0,4760
Мощность критерия не уступает всем известным до п ^ 20 и превосходит их при
п > 50.
Задача 129. В условиях задачи 125 проверить гипотезу экспоненциальности рас-
распределения вероятностей случайных величин критерием Фроцини при доверительной
вероятности а = 0,95.
Находим при х = 13,5
10
П ?\
В = ^^ • ( 1 — ехр
13,5
10
1 , - , 1,5
1 — ехр
1 \ 1 q к I in
13,5
10
9 к
¦^1 1 О С I 1П
13,5
10
= 0,0974.
Из табл. 86 для п = 10 находим Бп@,95) = 0,38.
Так как Вп = 0,097 < Вп@,95) = 0,38, гипотеза экспоненциальности распределения
не отклоняется.
3.3.5. Корреляционный критерий экспоненциальности
Рассмотрим функцию распределения
х — .
F(x) = l-exp( -
параметры которой оцениваются по формулам
т(х — х\)
v =
п-1
и IX = Х\ ,
В [301] рассмотрен критерий экспоненциалвности, аналогичнвш корреляционно™
му критерию Филлибена проверки нормальности распределения (см. раздел 3.2.2.4).
3.3]
Критерии проверки экспоненциальности распределения
289
Статистика критерия основана на коэффициенте корреляции г между нормирован™
ной переменной zi = —^т— и математическим ожиданием г-й порядковой етатисти-
ки из экспоненциального распределения, представленного выборкой объема п [303]:
m<j =
Если вместо точного значения mi используется (при п > 20) его аппроксимация
Ы = -1п[ 1
, то соответствующий коэффициент корреляции будем обо-
обозначать r(z,m). Статистика критерия используется в форме
K(z,m) = n[l — r2(z,m)] или K(z,m) = n[l — r2(z,m)] .
Критические значения статистик приведены в табл. 87.
Таблица 87
Критические значения K(zj m, о) и K(z^ m, a)
корреляционного критерия экспоненциальности
(а — уровень значимости) [303]
5
10
15
20
25
50
100
K(z, га, а)
а = 0,10
1,005
1,560
1,935
2,260
2,425
3,350
4,300
а = 0,05
1,305
1,920
2,445
2,820
3,075
4,250
5,700
а = 0,01
1,960
2,720
3,480
4,200
4,725
7,150
10,500
K(z,rh, a)
а = 0,10
0,960
1,540
1,980
2,320
2,550
3,650
5,000
а = 0,05
1,175
1,990
2,550
3,040
3,375
5,050
6,900
а = 0,01
1,760
2,850
3,885
4,820
5,575
8,800
12,900
Задача 130. Проверить гипотезу экспоненциальности распределения в условиях за-
задачи 125 корреляционным критерием на уровне значимости а = 0,10.
Имеем 0 = Ю-A3,5-1) = 13>889; д = ! _ 13^9 = _
Получаем ряд нормированных переменных
zn 0,1; 0,172; 0,316; 0,388; 0,676; 0,820; 1,324; 1,540; 2,116; 2,548.
Вычисляем
10
= — + - =0,2111; ш3 = 0,33611; т4 = 0,47897; т5 = 0,64563;
m6 = 0,84563; m7 = 1,09563;
Тогда
J2(zi ^zf =6,513696;
т8 = 1,42897; т9 = 1,92897; т10 = 2,92897.
(Zi ^z) = 6,66388;
г=1
r(z,m) = 6,66388- F,513696-7,07104)^2 =0,98191;
K(z,m) = 10 • A - 0,981912) = 0,358.
10 А. И. Кобзарь
290 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Из табл. 87 для а = 0,10 и п = 10 находим критическое значение K(z,m,a) = 1,56,
и так как полученное значение K(z, га) = 0,358 меньше критического 1,56, гипотеза
экспоненциальности не отклоняется.
( i \
Если бы мы вместо rrii использовали аппроксимацию тхц = — In I 1 1, то полу-
V п + 1)
чили бы
- — )= 0,0953; m2 = 0,20067;
m3 = 0,31834; m4 = 0,4520; m5 = 0,6061; m6 = 0,7884;
m7 = 1,0116; m8 = 1,2993; m9 = 1,7047; m10 = 2,3979;
-шJ= 4,836; m = 0,887428; ^{Zi - z) • (пц - m) = 5,55767;
г=1 г=1
r(z, m) = 5,55767 • F,513693 • 4,836)" 2 = 0,99023; K(z, m) = 10 • (l - 0,990232) = 0,194,
что меньшее, чем критическое значение K^z,rh,a) = 1,99 (см. табл. 87).
Следовательно, и в этом случае гипотеза экспоненциальности не отклоняется.
3.3.6. Регрессионный критерий Брейна-Шапиро
Если Ж]_, ..., хп — порядковые статистики из экспоненциального распределения
с плотностью
f{x) = Аехр{^А(ж — /i)} ,
то случайные величины у^ = (п — г + 1) (х{ — Xi—\) являются независимыми и иден-
идентично распределенными экспоненциальными величинами.
В [305] предложен весьма эффективный критерий экспоненциальности, основан™
ный на наклоне линии регрессии взвешенных спейсингов у± (т. е. разности смежных
членов выборки) на их порядковые номера г. Так как интенсивность отказов для
экспоненциального распределения А = const, то проверка экспоненциальности эк™
вивалентна проверке равенства нулю угла наклона регрессии у^ = /(г) (о регрессии
можно прочитать в главе 5).
Для общего случая цензурированной выборки, когда отсутствуют s наименьших
и г наибольших наблюдений (га = п — г — s), статистика критерия имеет вид
El ¦ llh \ ( -\
( г - "Т ) (У^+г+1 - У)
-i m — 1
где у = \^ T/S_|_^_|_i, или в более компактной форме
771—1 Z—'
3.3] Критерии проверки экспоненциальности распределения 291
Если ввести обозначения
1 U
^ = Цу*+*+ь (* = 1, •••jra-1); Щ = %_ , (г = 1,...,ш- 2),
J=i *™
то z = у/\2{т - 2) ( U - — 1, где U = ^^ •
Если s = 0 и \л известно, то m = в ^ г + 1 и t{ = ^ t/j (j = 1, ..., га — 1), т. е.
добавляется спейсинг n(#i — /л).
Гипотеза экспоненциальности отклоняется на уровне значимости а, если|^| > и& ,
где и а —( 1 -квантиль стандартного нормального распределения.
2 \ 2 /
z-критерий используется против альтернативы, утверждающей, что интенсив-
интенсивность отказов (параметр Л) монотонно изменяется в выборке.
Для альтернативы, утверждающей, что интенсивность отказов меняется моно-
монотонно, предложена статистика
т — 1 т — 1
12 У o?ys+*+i - т(т - 2) V ye+»+i
Э I i=l г=1
4(m + l)(m - 2)(ife - 3)
где щ = г ——, г = 1, ... ,га — 1, или
I f
2
5^ 2/s+i+i
5(^^2) 14 Q , я, 1WT 12
(m+l)(m-3)
Статистика имеет стандартное нормальное распределение. Если априорные све-
сведения о возможном характере альтернативы отсутствуют, рекомендуется исполь-
использовать комплексную статистику z* = z2 + z2, критические значения которой при
доверительной вероятности а можно вычислить по формулам
4,605 - —, при а = 0,90;
1 2е!
5,991^ —, при а = 0,95:
т
ч ччч
7,378 + , при а = 0,99.
Исследования авторов работы [305] позволяют сделать вывод о высокой мощности
этого критерия.
Задача 131. Для данных задачи 125 проверить гипотезу экспоненциальности ре-
регрессионным критерием Брейна—Шапиро при доверительной вероятности а = 0,95.
Известно, что цензурированию подверглось первое (х\ = 11; s = 1) и два наибольших
(xq = 29 и хю = 35) значения (г = 2).
Имеем т = 10 ^1^2 = 7. Находим ys+i+i = У2+% и для г = 1, ..., 6 получаем:
уз = (Ю - 3 + 1) • (хз - х2) = 8 • D - 2) = 16; у4 = (Ю - 4 + 1) • (х4 - х3) = 7;
2/5 = 24; 2/6 = 10; у7 = 28; у8 = 9;
ю*
292 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
= 2/з = 16; t2 = J2 2/2+i = 2/3 + 2/4 = 23; t3 = ^ y2+j = 23 + t/5 = 47;
t4 = 57; t5 = 85; t6 = 94;
г = — = — = 0,17023; U2 = — = 0,2447; U3 = 0,5; U4 = 0,6064; l/5 = 0,9042;
te 94 94
17 = 0,4851.
Далее вычисляем
z ={12 • G - 2)}i • @,4851 - 0,5) = -0,11541; z2 = 0,01332;
5
Y,i'Ui = 0,1702 + 2 • 0,2447 + ... + 5 • 0,9042 = 9,1062;
7-3 + 6.6.0,4851-у .
= 0,88388 • B1,4636 - 2,4 • 9,1062) = ^0,34584; z* = 0,0133 + 0,1196 = 0,13229.
Так как z* = 0,13229 < z* = 5,991
1 25
= 5,812, гипотеза экспоненциальное™ не откло-
откло3.3.7. Критерий Кимбера—Мичела
Кимбер [306] рассмотрел еще один критерий, основанный на линейной зависи-
зависимости между теоретической F(x) и эмпирической Fn(x) = — функциями распре-
распределения вероятностей случайных величин. Для того, чтобы стабилизировать эту
зависимость и ослабить влияние неравных дисперсий F(x) и Fn(x), Мичел [307]
предложил стабилизирующие преобразования
Si = — arcsln \/F(xi);
При п —)> оо и > р асимптотическая дисперсия
П Si
Статистика критерия имеет вид
D = max Wj ~~ S
j, т. е. не зависит от р.
в т.ч. для случая F(z) = 1 — exp(^z), где z = -г—стандартизированная случай™
ная экспоненциальная величина (у = — ^ xi). Критические значения D-статистики
приведены в табл. 88.
Таблица 88
Критические значения D{ol)
статистики Кимбера—Мичела [307]
п
3
4
5
6
8
10
14
Уровень значимости а.
0,10
0,240
0,232
0,222
0,216
0,198
0,185
0,166
0,05
0,265
0,265
0,251
0,244
0,223
0,208
0,185
0,01
0,301
0,310
0,301
0,296
0,272
0,253
0,226
п
20
30
40
60
80
100
Уровень значимости а
0,10
0,147
0,126
0,113
0,096
0,085
0,077
0,05
0,163
0,140
0,125
0,106
0,094
0,085
0,01
0,199
0,171
0,152
0,129
0,114
0,103
3.3] Критерии проверки экспоненциальности распределения 293
Мощность этого критерия для многих альтернатив выше, чем мощность крите™
риев Колмогорова-Смирнова (см. раздел 3.3.2) и Шапиро-Уилка (см. раздел 3.3.1).
Применение критерия подобного типа для построения критерия согласия с двухпа-
раметрическим распределением Вейбулла рассмотрено в [308].
Задача 132. Проверить гипотезу экспоненциальности распределения случайных вели-
величин для данных задачи 125 критерием Кимбера-Мичела на уровне значимости а = 0,05.
Находим
2 Г / 1 М i
si = - • arcsin 1 - exp = 0,172198;
7Г [ V 13'5Л
s2 = 0,24202; s3 = 0,33804; s4 = 0,37559; s5 = 0,49146;
s7 = 0,65676; s8 = 0,69611; s9 = 0,77805; sio = 0,823609;
n = - • arcsIn@,05J = 0,143564; r2 = 0,253183; r3 = 0,3333; r4 = 0,4030;
7Г
r5 = 0,4681; r6 = 0,5319; r7 = 0,5970; r8 = 0,6666; r9 = 0,7468; no = 0,8564.
Получаем ряд значений
г{-8{\: 0,0286; 0,0112; 0,00471; 0,0274; 0,0404; 0,00464; 0,05976; 0,0295;
0,03125; 0,03279.
Тогда D = max|ri — Si\ = 0,05976. Из табл. 88 для п = 10 и а = 0,05 находим
i
D(pt) = 0,208. Так как D = 0,05976 < D(ot) = 0,208, гипотеза экспоненциальности не от-
отклоняется.
3.3.8. Критерий Фишера
Если мы имеем ряд #i, #2, • • • ? хт то статистика критерия имеет вид
F =
(п -
Эта статистика при справедливости нулевой гипотезы (т. е. экспоненциальности
распределения) имеет ^распределение Фишера с /i = 2n ™ 2 и /2 = 2 степенями
свободы. Если
г=1
(п — 1) xi
где Fa(/i,/2) — а • 100%-е критическое значение F-статистики с /i и /2 степенями
свободы, то нулевая гипотеза экспоненциальности отклоняется.
Критические значения F-статистики могут быть определены по таблицам рас™
пределения Фишера, например, в [24, 25, 29, 57] или с помощью аппроксимаций,
приведенных в разделе 1.1.10.
Задача 133. Проверить гипотезу экспоненциальности критерием Фишера для данных
задачи 125 при уровне достоверности а = 0,95.
135
Имеем п = 10, х\ = 1 и ^ а?г = 135, F = = 15. Из таблиц распределения Фише-
Фишера [25] для Fo,95A8,2) находим Fo,95A8,2) = 19,3.
Так как F = 15 < Fo,95 A8,2) = 19,3, гипотеза экспоненциальности не отклоняется.
294 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.3.9. Критерий Бартлетта-Морана
Статистика критерия, вычисляемая по ряду значений #i,#2> • • • ->хпч имеет вид
[309, 310]
В =
1 +
12n
TnTT
При n ^ 20 распределение статистики В удовлетворительно аппроксимируется
Х2™распределением с f = n — l степенями свободы [95]. Поэтому нулевая гипо™
теза экспоненциальности отклоняется, если В > Х^(п ~ 1) на уровне значимости
()
Задача 134. В условиях задачи 125 проверить гипотезу экспоненциальности крите-
критерием Бартлетта-Морана при а = 0,95.
Имеем
1 п 2 • 100
х = 13,5; In ж = 2,6027; - • ^ 1пж* = 2,1141; В = • B,6027 + 2,1141) = 357867.
Из табл. 55 для / = w- 1 = 9и а = 0,95 находим Хо,9б(9) = 16,919.
Так как В = 13,2867 < %о,95(9) = 16,919, гипотеза экспоненциальности не откло™
няется.
3.3.10. Критерий Климко-Антла-Радемакера-Рокетта
В [311] рассмотрен критерий экспоненциальности, основанный на проверке ра™
венства единице коэффициента формы /3 в распределении Вейбулла с функцией
= 1 - exp j-
Известно (см. раздел 1.1.5), что при /3 = 1 распределение Вейбулла переходит
в экспоненциальное распределение. Поэтому проверка гипотезы Hq : C = 1 про-
против альтернативы Нi: /3 > 1 эквивалентна проверке гипотезы экспоненциальности
распределения против альтернативы, утверждающей, что распределение является
вейбул л овским.
Для оценки параметра C может быть использована аппроксимация [312] с ~ г/'075,
где v = — —коэффициент вариации. В общем виде для трехпараметрического рас-
х
пределения Вейбулла имеем
Критические значения статистики с = -у/n (с — 1) приведены в табл. 89. Если с >
то гипотеза C = 1 (гипотеза экспоненциальности) отклоняется.
3.3]
Критерии проверки экспоненциальности распределения
295
Таблица 89
Критические значения статистики
с = у/гь (с — 1)
(а — уровень значимости) [311]
10
20
30
40
50
100
а
0,20
1,14
1,00
0,94
0,90
0,86
0,81
0,10
1,59
1,41
1,34
1,28
1,24
1,19
0,05
2,05
1,80
1,68
1,60
1,58
1,51
0,02
2,68
2,26
2,09
1,97
1,96
1,87
Задача 135. В условиях задачи 125 проверить гипотезу экспоненциалъности рас-
распределения вероятностей случайных величин критерием Климко-Антла-Радемакера-
Рокетта на уровне значимости а = 0,05.
Имеем
= 11,8157; A=1-
- 'J2(Xi - А) = 13ДШ; с =
_ /ll,8157\
10-9
с_\ -1,075
¦@-
- 28 + 34) = ^0,3889;
13,1111/
= 1,1183; с = 10 • (с - 1) = 0,3741.
Из табл. 89 для п = 10 и а = 0,05 находим co,9sA0) = 2,05. Так как с = 0,3741 <
< со,95(Ю) = 2,05, гипотеза /3 = 1 (гипотеза экспоненциальности) не отклоняется.
3.3.11. Критерий Холлендера—Прошана
В задачах теории надежности экспоненциальное распределение наработки на
отказ f(x) = Аехр(^Аж) характеризуется значением параметра А = const, т.е. по™
стоянством интенсивности отказов изделия во времени. Отсюда следует, что ве™
роятность безотказной работы изделия за время At —> exp(^AAt) определяется
только промежутком времени At и не зависит от того, работало ли изделие раньше
или нет. Другими словами, вероятность безотказной работы нового изделия и из-
изделия, проработавшего часть времени, должна быть одинакова. Проверка этого
обстоятельства и является целью критерия Холлендера^Прошана, рассмотренного
в [313, 314].
Процедура вычисления статистики критерия Холлендера^Прошана включает
в себя вычисление для ряда случайных величин х\ ^ Х2 ^ ... ^ хп статистики
где (p(a,b) =
1 при а > Ь;
Суммирование проводится по всем тройкам г, j, /с, для которых
о
г > j > к.
На уровне значимости а гипотеза экспоненциальности принимается, если
ti(a) ^ Т ^ ^2(а), где t\{ot) и ^(ог)—граничные значения для заданных п и а,
приведенные в табл. 90.
296 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 90
Граничные значения ti(o) и t^iot)
критерия Холлендера^Прошана [313]
п
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
Уровень значимости а.
0,01
2
7
15
27
42
63
89
122
162
209
260
330
405
490
594
1250
2320
3850
5947
8665
12170
35
55
81
114
155
205
264
334
415
508
613
732
866
1015
2018
3521
5625
8418
12012
16519
0,025
ti
1
5
11
21
34
52
176
405
141
185
236
298
368
446
538
642
1351
2463
4064
6214
9040
12661
t2
2
7
14
54
80
112
152
201
260
328
408
499
603
720
852
998
1986
3461
5546
8301
11864
16310
0,05
ti
25
40
60
86
117
157
204
259
323
397
480
577
685
1427
2574
4215
6434
9341
13020
t2
20
34
53
78
110
150
198
255
322
401
491
593
709
838
982
1956
3411
5464
8189
11709
16085
0,
ti
1
4
9
18
30
47
69
97
131
174
223
282
350
429
518
619
732
1507
2704
4394
6700
9686
13439
10
t2
10
19
33
52
76
107
146
193
249
315
392
480
580
693
820
961
1918
3349
5359
8049
11502
15823
Для случаев совпадения X{ = Xj
(xi,Xj +xk), где
используется замена ip(xi,Xj-\-x^) на
1 при а > 6;
{
i при а = b;
0 при a < b.
Для п > 20 может быть использована аппроксимация
где
Т* =
М(Т) =
Т - М(Т)
=
2592
7(п - 3) J_
432 48
Случайная величина Т* распределена при п ^ 20 как стандартная нормальная
случайная величина, и гипотеза экспоненциальности в этом случае принимается на
уровне значимости а, если |Т*| < и1_& , где и7 —7™квантиль стандартного нормаль™
ного распределения.
8.8]
Критерии проверки экспоненциалъности распределения
297
Задача 136. Для данных задачи 125 проверить гипотезу экспоненциалъности крите-
критерием Холлендера-Прошана на уровне значимости а = 0,05.
Результаты вычислений представлены в таблице, из которой находим
Т= J2 <p(xi,Xj+xk) = 102.
Из табл. 90 имеем ti@,05) = 60 и ?2@,05) = НО.
Так как i\ = 60 < Т = 102 < ti = 110, гипотеза экспоненциальности не отклоняется.
%
3
4
5
6
7
8
9
10
4
5
6
7
8
9
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
4
5
6
7
8
9
10
3
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7
7
8
8
9
3
3
3
3
3
3
3
к
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
Xi
4
5
9
11
18
21
29
35
5
9
11
18
21
29
35
9
11
18
21
29
35
11
18
21
29
35
18
21
29
35
21
29
35
29
35
35
5
9
11
18
21
29
35
Xi +a?fc
3
3
3
3
3
3
3
3
5
5
5
5
5
5
5
6
6
6
6
6
6
10
10
10
10
10
12
12
12
12
19
19
19
22
22
30
6
6
6
6
6
6
6
1
1
1
1
1
1
1
1
1/2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
г
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
5
6
7
8
9
10
6
7
8
9
10
7
8
9
10
8
9
10
9
10
10
6
3
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7
7
8
8
9
4
4
4
4
4
4
5
5
5
5
5
6
6
6
6
7
7
7
8
8
9
5
к
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
Xi
9
11
18
21
29
35
11
18
21
29
35
18
21
29
35
21
29
35
29
35
35
9
11
18
21
29
35
11
18
21
29
35
18
21
29
25
21
29
35
29
35
35
11
Xi + Хк
7
7
7
7
7
7
11
11
11
11
11
13
13
13
13
20
20
20
23
23
31
9
9
9
9
9
9
13
13
13
13
13
15
15
15
15
22
22
22
25
25
33
14
1/2
1
1
1
1
1
1/2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1/2
1
1
1
1
1
0
1
1
1
1
1
1
1
1
0
1
1
1
1
1
0
298 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
г
7
8
9
10
7
8
9
10
8
9
10
9
10
10
7
8
9
3
5
5
5
5
6
6
6
6
7
7
7
8
8
9
6
6
6
к
4
4
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
Xi
18
21
29
35
18
21
29
35
21
29
35
29
35
35
18
21
29
Xi +a?fc
14
14
14
14
16
16
16
16
23
23
23
26
26
34
20
20
20
1
1
1
1
1
1
1
1
0
1
1
1
1
1
0
1
1
г
10
8
9
10
9
10
10
8
9
10
9
10
10
9
10
10
10
3
6
7
7
7
8
8
9
7
7
7
8
8
9
8
8
9
9
к
5
5
5
5
5
5
5
6
6
6
6
6
6
7
7
7
8
Xi
35
21
29
35
29
35
35
21
29
35
29
35
35
29
35
35
35
Окон
Xi +Хк
20
27
27
27
30
30
34
29
29
29
32
32
40
39
39
47
50
чание
<р(<Р*)
1
0
1
1
0
1
1
0
1ж2
1
0
1
0
0
0
0
0
Для нормального приближения имеем
М(Г) = -
ЩТ) =
3 ¦ 10 • 9 ¦ *
2
2592 432 48
1^= 0,787.
15,248
Из табл. 1 имеем и о,р5 = tio,975 = 1?96.
1 — 2
Так как |Т* = 0,852 < 1,96, гипотеза экспоненциальности не отклоняется.
3.3.12. Критерий Кочара
Критерий, предложешгый Кочаром [315], применяется для проверки постоян-
постоянства интенсивности отказов против альтернативы монотонного увеличения интен™
сивности отказов (т.е. „старения", износа изделия). Статистика критерия (имеется
в виду упорядоченный по возрастанию ряд х\ ^ Х2 ^ • • • ^ хп) имеет вид
-1-71.
где J
= 9
п + 1 — г
п + 1 — г
- 1.
п + 1 ) f V п + 1
При п ^ 20 распределение Тп удовлетворительно аппроксимируется стандарт™
нормалвным распределением. Если Тп ^ Тп(а), то гипотеза экспоненциалв-
ности отклоняется (Тп(а) — критические значения, приведенные для различных
уровней значимости а в табл. 91).
Критерий Кочара обладает высокой мощностью против альтернатив износа
среди критериев подобного типа, рассмотренных в [316—321].
8.8]
Критерии проверки экспоненциалъности распределения
299
Таблица 91
Критические значения Tn(ct) критерия
Кочара (а — уровень значимости) [315]
2
3
4
5
6
7
8
9
10
11
а
0,01
2,2604
2,5321
2,6628
2,7347
2,7814
2,8128
2,8338
2,8481
2,8577
2,8640
0,05
2,2265
2,3923
2,4536
2,4863
2,5006
2,5046
2,5029
2,4976
2,4903
2,4817
п
12
13
14
15
16
17
18
19
20
а
0,01
2,8678
2,8698
2,8705
2,8703
2,8692
2,8676
2,8566
2,8631
2,8604
0,05
2,4724
2,4627
2,4528
2,4429
2,4332
2,4235
2,4141
2,4049
2,3559
Задача 137. Проверить экспоненциальность распределения для данных задачи 125
критерием Кочара на уровне значимости а = 0,05.
Имеем
- \ =4 •
11
J
11
J
J f ^ J = 0,91775; J ( — J = 0,84798; J ( — J = 0,75215;
— J = 0,25415; j(—j= ^0,01645;
— \= 0,62588;
^) = ^0,38220;
—j = 0,46298;
J[ ^— 1 -xi = 0,99147-1 + 0,96473-2 + ...
... + 0,25415 • 21 - 0,01645 • 29 - 0,38220 • 25 = 24,31227.
Получаем
Tn =
17
135
= M35.
Из табл. 91 для п = 10 и а = 0,95 находим Тп@,05) = 2,4903.
Так как Тп = 1,435 < Тп@,05) = 2,4903, гипотеза экспоненциальности распределения
вероятностей случайных величин не отклоняется.
3.3.13. Критерий Эппеа—Палли—Чёрго—Уэлча
Как и критерий Кочара (см. раздел 3.3.12), критерий Эппса^Палли [322] предпо-
предполагает проверку гипотезы экспоненциальности против альтернативы монотонного
изменения интенсивности отказов.
Критерий, подобно критерию Муроты-Такеучи для проверки нормальности
распределения (см. раздел 3.2.2.17), использует выборочную характеристическую
функцию
cn(t) = I
300 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Статистика критерия имеет вид
c=V48n -> ехр -- -- .
Гипотеза экспоненциальности не отклоняется, если с\(а) < с < С2(а), где ci(a)
и С2(а)—критические значения, соответствующие доверительной вероятности а;
они приведены в табл. 92.
Таблица 92
Критические значения ci(ck) и С2(«) критерия
Эппса—Палли (а-
п
7
8
9
10
11
12
14
16
18
20
22
24
26
28
30
35
40
45
50
60
80
100
120
160
200
0,95
с\
-1,64
-1,65
-1,65
-1,66
-1,66
-1,66
-1,67
-1,67
-1,67
-1,67
-1,67
-1,68
-1,68
-1,68
-1,68
-1,68
-1,68
-1,68
-1,68
-1,68
-1,67
-1,67
-1,67
-1,67
-1,67
1,31
1,35
1,38
1,40
1,42
1,44
1,46
1,48
1,49
1,50
1,51
1,52
1,53
1,53
1,54
1,55
1,56
1,57
1,57
1,58
1,59
1,60
1,60
1,60
1,62
- доверительная
а
0,975
с\
-1,81
-1,83
-1,84
-1,85
-1,86
-1,87
-1,88
-1,89
-1,90
-1,91
-1,91
-1,92
-1,92
-1,92
-1,93
-1,93
-1,94
-1,94
-1,94
-1,95
-1,95
-1,95
-1,95
-1,96
-1,96
С2
1,71
1,74
1,77
1,79
1,81
1,82
1,84
1,86
1,87
1,88
1,89
1,89
1,89
1,90
1,91
1,91
1,92
1,92
1,93
1,93
1,94
1,94
1,94
1,96
1,96
вероятность)
0,99
-2,00
-2,02
-2,04
-2,06
-2,08
-2,09
-2,11
-2,13
-2,15
-2,16
-2,17
-2,18
-2,19
-2,19
-2,20
-2,21
-2,22
-2,23
-2,24
-2,25
-2,25
-2,27
-2,28
-2,29
-2,30
2,18
2,22
2,25
2,26
2,28
2,29
2,31
2,32
2,33
2,33
2,34
2,34
2,34
2,34
2,35
2,35
2,35
2,35
2,35
2,35
2,35
2,35
2,35
2,35
2,35
При п > 200с —)¦ JV(O,1) критические значения ci(a) = —Ua и 02@.) = C/a, где
Ua — «-квантиль стандартного нормального распределения.
При сравнительной простоте вычисления с™критерий достаточно мощен, не
уступая критериям Шапиро^Уилка и Кочара против большинства альтернатив.
Критерий, аналогичный критерию Эппса^Палли, рассмотрен Чёрго и Уэлчем [323].
Его статистика имеет вид
М =
sup
I tXi 1
где
71-1
-\2
3.3]
Критерии проверки экспоненциальности распределения
301
Гипотеза экспоненциальности отклоняется, если М ^ Мп(а), где Мп{а)—кри™
тические значения, приведенные для различных уровней достоверности а в табл. 93.
Таблица 93
Критические значения Мп(сх)
критерия "Чёрго^Уэлча
(а — доверительная вероятность)
п
20
50
100
а
0,90
1,11
1,05
1,00
0,95
1,45
1,23
1,16
0,00
2,02
1,67
1,45
Критерий по мощности сравним с критерием Эппса^Палли и равносилен ему,
однако требует значительно больших вычислений.
Задача 138. В условиях задачи 125 проверить гипотезу экспоненциальности распре-
распределения вероятностей случайных величин критерием Эппса-Палли при доверительной
вероятности а = 0,95.
Имеем х = 13,5 и вычисляем статистику критерия Эппса-Палли
—• ехр
10 I \ 13,5
¦ехр -
13,5
+ ехр —
13,5
¦ ... + ехр -
35
13,5
- - ^ = 0,3345.
2 (
Из табл. 92 находим ci@,95) = -1,66 и с2@,95) = 1,38.
Так как ci@,95) = —1,66 < с = ^0,3345 < С2@,95) = 1,38, гипотеза экспоненциально-
экспоненциальности не отклоняется.
3.3.14. Критерий Бергмана
Этот критерий базируется на проверке постоянства интенсивности отказов про™
тив альтернативы „бутылкообразной" зависимости интенсивности отказов от вре-
времени (с участком приработки, когда A;(i) < 0, и износа, когда Xf(t) > 0). Критерий
развит в [323-325].
Определим для выборки объема п: х\ ^ Х2 ^ ... ^ хп переменную
х0 = 0.
1){хз - xj^i
Для экспоненциального распределения — и Щ должны быть связаны строгой линей-
п
ной зависимостью. Отклонения от такой зависимости указывают на отклонение от
экспоненциальности исследуемого распределения и являются источником построе-
построения критерия для установления этого факта.
Бергман [324] предложил простой критерий проверки экспоненциальности рас™
пределения, основанный на числе пересечений прямой
= — графиком зависимо-
302 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Обозначим через Кп число пересечений „снизу", когда для г = 1, ..., п — 1 имеют
г г + 1
место неравенства Щ < — и C/^+i ^ . Статистикой критерия является общее
п п
г
< — и C/^+i ^
п п
число пересечений, определямое как
-1 тт 1 f -I тт
1, если ui < —, г II, если un^i
^ 02 =
гг — 1
О в ином случае;
О в ином случае.
Значения вероятности того, что Ln ^ к при справедливости гипотезв! экспоненци™
альности распределения, приведены в табл. 94.
Таблица 94
Значения ?(Ln ^ к) [324]
п
10
20
30
40
50
60
70
90
100
к
1
0,8000
0,9000
0,9333
0,9500
0,9600
0,9667
0,9714
0,9778
0,9800
2
0,4913
0,7143
0,8019
0,8485
0,8773
0,8969
0,9112
0,9304
0,9372
3
0,2564
0,5324
0,6628
0,7369
0,7844
0,8174
0,8417
0,8750
0,8869
4
0,0959
0,3416
0,4964
0,5945
0,6612
0,7093
0,7455
0,7964
0,8149
5
0,0294
0,2083
0,3617
0,4709
0,5499
0,6089
0,6545
0,7202
0,7445
6
0,0058
0,1068
0,2353
0,3427
0,4272
0,4938
0,5473
0,6269
0,6573
7
0,0008
0,0524
0,1504
0,2470
0,3299
0,3989
0,4563
0,5449
0,5795
8
0,0000
0,0211
0,0846
0,1618
0,2360
0,3023
0,3600
0,4535
0,4914
9
0,0000
0,0081
0,0471
0,1058
0,1690
0,2295
0,2849
0,3787
0,4180
Задача 139. Проверить гипотезу экспоненциальности в условиях задачи 125 крите-
критерием Бергмана на уровне значимости а = 0,05.
ю
Имеем ^2(п — j + 1)(xj — Xj-i) = 135.
i=i
Результаты вычислений сведем в таблицу:
i
1
2
3
4
5
г
п
0,1
0,2
0,3
0,4
0,5
х-
1
2
4
5
9
Ui
0,0740
0,1417
0,2592
0,3111
0,4889
i
6
7
8
9
10
i
п
0,6
0,7
0,8
0,9
1,0
х-
11
18
21
29
35
Ui
0,5630
0,7703
0,8370
0,9555
1,0000
Из таблицы видно, что
= 1 \Ui = 0,074 < ^ = 0Д
= 0 (u9 = 0,9555 > ^- = 0,9
Kn =
7
U6 = 0,5630 < — = 0,6 и U7 = 0,7703 > — = 0,7
Имеем Ln = 1 - 1 + 2 • A - 0) + 0 - 1 = 1. Из табл. 94 находим P(Ln ^ 1) = 0,80, т. е. при
справедливости гипотезы экспоненциальности эта вероятность высока и намного превос-
превосходит заданный уровень значимости. Следовательно, гипотеза экспоненциальности не
отклоняется.
3.3]
Критерии проверки экспоненциалъности распределения
303
3.3.15. Критерий Шермана
Статистика критерия имеет вид [327]
2п х
Критические значения статистики Шермана приведены в табл. 95.
Таблица 95
Критические значения ujn{ot) статистики Шермана
(а — доверительная вероятность) [328]
п
1
2
3
4
5
6
7
8
9
10
а
0,90
0,450
0,484
0,467
0,468
0,462
0,458
0,454
0,451
0,448
0,445
0,95
0,475
0,537
0,518
0,509
0,502
0,494
0,488
0,482
0,477
0,473
0,99
0,495
0,609
0,614
0,589
0,574
0,562
0,551
0,542
0,534
0,527
п
11
12
13
14
15
16
17
18
19
20
а
0,90
0,442
0,440
0,438
0,436
0,434
0,433
0,431
0,430
0,429
0,427
0,95
0?469
0,466
0,463
0,460
0,458
0,455
0,453
0,451
0,449
0,448
0,99
0,521
0,516
0,511
0,506
0,502
0,498
0,495
0,491
0,489
0,486
При п > 20 критерий Шермана удовлетворительно аппроксимируется нормаль-
нормальным распределением со средним М(о;п) и дисперсией D(o;n), где
п+1
- = 0,36788;
е
DW =
2пп
2)(га
чп+2
2п+2
^5 1
о
е п
0,05908
Следовательно, случайная величина ш* =
имеет стандартное нор™
мальное распределение. В [329] рассмотрена аппроксимация распределения
шп-статистики ^-распределением Фишера. Там же предложена очень эффективная
нормальная аппроксимация
0,0955 (тт2 ч
wn = ^- ^ (Z7 - 1) , где U =
оп -0,3679A- —
2п
-( 0,605 \*
г 1
I п )
Статистика шп хорошо аппроксимируется стандартным нормальным распределение
ем уясе при п > 20.
Если шп > шп(а) или 6оп > иа1 то с доверительной вероятностью а гипотеза
экспоненциальное™ отклоняется (иа — а-квантиль стандартного нормального рас™
пределения).
304 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Задача 140. Проверить гипотезу экспоненциальности для данных задачи 125 крите-
критерием Шермана при доверительной вероятности а = 0,95.
Имеем
1
х = 13,5; шп =
2-10- 13,5
- 13,5| + |2 - 13,5|
|35 - 13,5|) = 0,4.
Из табл. 95 для п = 10 находим шп@,95) = 0,473.
Так как шп = 0,400 < сип@,95) = 0,473, гипотеза экспоненциальное™ не отклоняется.
Используем теперь нормальную аппроксимацию
0,4 - 0,3679 • 1 -
U =
2-10/
шп = 0,069914 -
0,2431 ¦ V10 • ( 1 -
0,0995
0,605
10
= 0,069914;
\/То
@,0699142 - 1) = 0,1012,
что существенно меньше, чем и-о,э5 =: 1,645 (однако следует помнить, что пример демон-
демонстрационный и нормальным приближением следует пользоваться только при п > 20).
3.3.16. Критерий наибольшего интервала
Статистика критерия имеет вид [140]
max (pa — Xi-i
Статистика rjn совпадает с известной статистикой Кохрана для проверки одно™
родности нескольких дисперсий (при числе степеней свободы / = 2). Критические
значения г)п{а) приведены в табл. 96.
Таблица 96
Критические значения г)п(сх)
статистики г)п [25]
п
2
3
4
5
6
7
8
9
10
Доверительная
вероятность а
0,95
0,975
0,871
0,768
0,684
0,616
0,561
0,561
0,477
0,445
0,99
0,995
0,942
0,864
0,788
0,722
0,664
0,664
0,573
0,536
п
12
15
20
24
30
40
60
120
Доверительная
вероятность а
0,95
0,392
0,335
0,270
0,235
0,198
0,158
0,113
0,063
0,99
0,475
0,407
0,330
0,287
0,241
0,191
0,137
0,076
Задача 141. Проверить гипотезу экспоненциальности критерием наибольшего ин-
интервала для данных задачи 125 при а = 0,95.
Имеем
хг = 135; г]п = = 0,0592.
Из табл. 96 имеем т?п@,95) = 0,445.
Так как щ = 0,0592 < ?]п@,95) = 0,445, гипотеза экспоненциальности не отклоняется.
3.3]
Критерии проверки экспоненциальности распределения
305
3.3.17. Критерий Хартли [330]
Это один из наиболее простых в вычислительном отношении критериев (однако
его мощность, естественно, уступает рассмотренным ранее). Статистика критерия
имеет вид
max Xi
h(n) = ^<n ,
mm Xi
При справедливости нулевой гипотезы h(n) имеет % -распределение с / = 2
степенями свободы. Критические значения На(п) статистики Хартли приведены
в табл. 97.
Таблица 97
Критические значения ha(n) статистики Хартли
(а — доверительная вероятность) [140]
2
3
4
5
0,95
39
88
142
202
0,99
199
448
729
1036
6
7
8
9
0,95
266
333
403
475
0,99
1362
1705
2063
2432
10
11
12
0,95
550
626
704
а
0,99
2813
3204
3605
При h(n) > Ha(n) гипотеза экспоненциальности отклоняется.
Задача 142. В условиях задачи 125 проверить гипотезу экспоненциалъности крите-
критерием Хартли при а = 0,95.
Имеем h(n) =
= f =35.
Для п = 10 из табл. 97 имеем До,э5(Ю) = 550, что существенно больше полученного
значения h(n) = 35. Следовательно, гипотеза экспоненциальности не отклоняется.
3.3.18. Критерий показательных меток
Применительно к задачам испытаний на надежность постоянство интенсивности
отказов указывает на экспоненциальный закон распределения вероятностей значе™
ний временных промежутков между соседними отказами. В [310] для проверки
экспоненциальности рассмотрен критерий показательных меток. Пусть имеются
моменты появления отказов изделия ti,^, ..., tn и порождаемая ими последова-
последовательность интервалов между отказами
= ti- t
2;
At, =ti+1 -
Каждому интервалу ставится в соответствие его номер и так называемая метка,
равная математическому ожиданию r-й порядковой статистики из единичного экс-
экспоненциального распределения в выборке объема п — sr^n^\ (здесь г — порядковый
номер интервала Air в общем, упорядоченном по возрастанию ряду (п — 1) интер-
интервалов)
П- j
306 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Статистика критерия имеет вид [310]
Критерий применяется при п > 50, его критические значения в этом случае
вв1числяются, исходя из того, что величина s имеет асимптотически нормальное
распределение со средним M(s) = 0 и дисперсией
D(S) =
где
Задача 143. Предположим, что ряд данных задачи 125
хц 1, 2, 4, 5, 9, 11, 18, 21, 29, 35
представляет собой моменты отказов изделий. Проверить гипотезу экспоненциально-
сти распределения Xi критерием показательных меток при доверительной вероятно-
вероятности а = 0,95 (при совпадении рангов интервалов г можно использовать их случайную
последовательную нумерацию).
Результаты расчетов приведены в таблице:
г
1
2
3
4
5
6
7
8
9
10
Xi
1
2
4
5
9
11
18
21
29
35
Axi
1
2
1
4
2
7
3
8
6
г
1
3
2
6
4
8
5
9
7
0,1000
0,3361
0,2111
0,8456
0,4790
1,4290
0,6456
1,9290
1,0956
z%
1
2
3
4
5
6
7
8
9
zi - z
-4
-3
-2
-1
0
1
2
3
4
(z^zf
16
9
4
1
0
1
4
9
16
Sr,n(zi - z)
-0,4000
-1,0083
-0,4222
-0,8456
0
1,4290
1,2912
5,7870
4,3824
+ ± + ...+ i + i) =0,7138.
Далее s = 10,2135; M(s) = 0; DE) = 0,7138 • 60 = 42,828
Случайная величина
= 6,544).
s - M(s) _ 10,2135
\/Щз) ~ 6,544
= 1,5607
имеет стандартное нормальное распределение, 95%™я квантиль которого равна
^о,95 = 1,645 (см. табл. 1). Так как s* = 1,5607 < ^0,95 = 1,645, гипотеза экспоненциаль-
ности не отклоняется.
3.3.19. Ранговый критерий независимости интервалов
Характеристической особенностью экспоненциального распределения случай™
ных величин является независимость интервалов между двумя соседними случай™
ными величинами Axi = Xi — Xi-\.
Для выборок объема п > 30 в качестве оценки такой независимости может
служить ранговый смешанный момент [296, 310]
п-1
г=1
где tj —ранг j-vo интервала в общем упорядоченном ряду значений интервалов.
3.3] Критерии проверки экспоненциальности распределения 307
Например, если были получены величины х\ = 3, ж 2 = 1, #з = 5, Ж4 = 2, а?5 = 11,
то после упорядочения по величине мы имеем #2 = 1, #4 = 2, a?i = 3, Жз=4иж5 = 5.
При справедливости гипотезы экспоненциальности случайная величина
где
М(Лх) = ^(п - 1)(п + 1)Cп + 2);
(п + 1) Eп6 + 21п5 + 501п4 - 823п3 + 1102п2 - 68п - 240)
= 720(n-2)(n-3) '
имеет стандартное нормальное распределение.
(с% \
1 — — 1 -квантиль стан™
дартного нормального распределения, то на уровне значимости а гипотеза экспо-
экспоненциальности не отклоняется.
В [310] рассмотрена модификация этого критерия в форме
п-1
Rl=^2 Sri+ltnSritn,
г=1
Х~^ 1
где sr п = 7 математическое ожидание r-й порядковой статистики из
' 1-^ п — % + 1
г=1
единичного нормированного экспоненциального распределения.
По аналогии рассматривается статистика
где
- ,05772
Правило проверки гипотезы экспоненциальности аналогично случаю крите-
критерия Д*. При совпадении рангов r^ = Tj используются средние ранги (например,
в случае Г{ = rj для обеих величин принимается ранг — -). Следует помнить,
что эти критерии обладают приемлемой мощностью только при п ^ 30.
Задача 144. Проверить гипотезу экспоненциальности распределения вероятностей
случайных величин для данных задачи 125 критериями независимости интервалов
(а = 0,95).
Для ряда
Хг (га =10): 1, 2, 4, 5, 9, 11, 18, 21, 29, 35
имеем ряд интервалов
Axi (n = 9): 1, 2, 1, 4, 2, 7, 3, 8, 6
и соответствующий им ряд рангов
гц 1,5; 3,5; 1,5; 6; 3,5; 8; 5; 9; 7.
Вычисляем
Кг = J2 r*+i • П = 3,5 • 1,5 + 1,5 • 3.5 + ... + 9 • 5 + 7 • 9 = 216,5;
308 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
720-7-6
х [10 • E • 96 + 21 • 95 + 501 • Э4 - 823 • Э3 + 1102 • Э2 ~~ 68 • 9 - 240)] = 2206,5932.
91 б 5 193 3
Тогда R\ = — = 0,494, что меньше иг_а = гхо,975 = 1,96.
Следовательно, гипотеза экспоненциальности не отклоняется.
Вычислим теперь критерий R\. Имеем
sri,n = -= 0,1111; Sr2,n = 0,2361; sr^n = 0,3790; sr^n = 0,5456; sr5,n = 0,7456;
sr^n = 0,9956; sr7jn = 1,329; srg,n = 1,829; sr9,n = 2,829;
sr r,n = ^^—^^ = 0,1736; sr ,n = ^^—^^ = 0,4626;
#i = 0,4626 • 0,1736 + 0,1736 • 0,4626 + 0,9956 • 0,1736 + ... + 1,329 • 2,829 = 8,8728;
М(Ёг) =9-2+i-(ln9 + 0,5772) + ^^ = 7,3144;
• (93 -6-92+24-9) -21n9 = 6,534 (a/d^Ri) = 2,556);
Так как R\ = 0,6097 < иг___а = uo,975 = 1,96, гипотеза экспоненциальности распреде-
распределения вероятностей случайных величин не отклоняется.
3.3.20. Критерии, основанные на трансформации
экспоненциального распределения в равномерное
Если случайные величины #i,#2, -->jxij • • • > хп распределены экспоненциаль™
но, то случайные величины Щ = — должны быть распределены равномерно
i
на интервале [0,1] [231]. В этом случае проверка равномерности распределения
величин Ui эквивалентна проверке экспоненциальности распределения исходных
величин Х{. Рассмотрим серию критериев такого типа.
3.3.20.1. Критерий U
Простейший критерий, основан на статистике
п — 1
1
и= —
г=1
Критические значения статистики Ua приведены в табл. 98.
При п ^ 15 моясно использовать тот факт, что величина
[7* =
распределена как N@,1) и ее квантили тогда могут быть вычислены через квантили
стандартного нормального распределения.
3.3]
Критерии проверки экспоненциальности распределения
309
Таблица Э<!
Критические значения Ua статистики U (а — уровень значимости) [231]
п
5
6
7
8
9
10
11
13
15
17
а
0,01
0,176
0,208
0,232
0,251
0,266
0,279
0,290
0,308
0,322
0,330
0,025
0,221
0,250
0,271
0,288
0,301
0,312
0,322
0,337
0,349
0,359
0,05
0,262
0,287
0,306
0,320
0,332
0,341
0,350
0,363
0,373
0,381
0,10
0,312
0,332
0,347
0,359
0,368
0,376
0,382
0,393
0,401
0,407
п
19
21
26
31
36
41
46
51
61
а
0,01
0,343
0,351
0,366
0,387
0,378
0,394
0,400
0,405
0,420
0,025
0,367
0,374
0,387
0,397
0,404
0,411
0,416
0,420
0,432
0,05
0,388
0,394
0,405
0,413
0,420
0,425
0,429
0,433
0,443
0,10
0,412
0,417
0,426
0,432
0,437
0,441
0,445
0,448
0,456
3.3.20.2. Критерий U
Наиболее простой в вычислительном отношении критерий, основанный на ста-
статистике
U =
(п - г) Ur
r(l-Ur)'
имеющей при справедливости гипотезы экспоненциальности ^распределение
с /i = 2г и /2 = 2(п — г) степенями свободы. Рекомендуется выбирать г = — (п —
четное) или г =
П+1
(в — нечетное).
3.3.20.3. Критерий Гринвуда
Известен ряд весьма эффективных критериев, основанных на спейсингах вели-
величин Ui, равных Di = Ui — Ui-i (i = 1, ..., n; Щ — 0; Un = 1). Здесь Щ следует рас™
сматривать как порядковые статистики (т. е. ряд U{ должен быть предварительно
упорядочен по возрастанию).
Легко видеть, что
В качестве примера критерия экспоненциальности, основанного на спейсин™
rax Di, приведем критерий Гринвуда [331]
?*<
Гипотеза экспоненциальности не отклоняется, если G±(a) ^ G ^ ^(^О? гДе G\(a)
и (jr2(a) — критические значения, приведенные в табл. 99.
310 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 99
Критические значения Gri(o) и
статистики Гринвуда
(а — доверительная вероятность) [332, 333]
п
3
4
5
6
7
8
9
10
11
13
15
17
19
21
26
31
41
51
61
81
101
201
501
а =
0,694
0,825
0,923
0,997
1,055
1,104
1,145
1,180
1,211
1,272
1,312
1,346
1,375
1,400
1,451
1,490
1,548
1,589
1,621
1,666
1,698
1,781
1,858
0,90
G2
1,539
1,852
2,037
2,160
2,246
2,306
2,349
2,381
2,404
2,441
2,457
2,464
2,466
2,465
2,456
2,443
2,415
2,389
2,367
2,331
2,304
2,226
2,147
а =
Gt
0,680
0,796
0,895
0,954
1,009
1,060
1,095
1,129
1,159
1,234
1,272
1,304
1,332
1,356
1,405
1,444
1,502
1,544
1,577
1,625
1,659
1,750
1,836
0,95
G2
1,673
2,075
2,311
2,461
2,559
2,615
2,670
2,700
2,717
2,693
2,691
2,691
2,685
2,677
2,651
2,624
2,573
2,531
2,495
2,441
2,400
2,289
2,183
a =
Gt
0,672
0,776
0,855
0,919
0,973
1,017
1,055
1,088
1,117
1,198
1,233
1,263
1,288
1,311
1,358
1,395
1,453
1,495
1,529
1,579
1,616
1,714
1,811
0,99
G2
1,780
2,269
2,560
2,737
2,849
2,921
2,967
2,997
3,008
3,015
3,014
3,003
2,988
2,970
2,920
2,873
2,790
2,723
2,669
2,587
2,528
2,371
2,228
Задача 145. Проверить экспоненциальность распределения по данным задачи 125
критериями U и Гринвуда на уровне значимости а = 0,05.
Имеем
Xj = 135. Далее вычисляем
= 0,00741; U2 = -|- = 0,02222; U3 =
135
= 0,05185;
U4 = 0,08889; U5 = 0,15555; U6 = 0,23703; U7 = 0,37037; U8 = 0,5259;
1 9
U9 = 0,74074; U10 = 1,00 и U =-• ]P Ui = 0,2444.
9 i=i
Из табл. 98 для п = 9 и а = 0,05 находим Оо,о5 = 0,332.
Так как U = 0,2444 < f/0,05 = 0,332, гипотеза экспоненциальное™ не отклоняется.
Применим критерий, для которого (при г = — = 5) имеем
U =
(ю -ъ)-иъ
5 -0,1555
= 0,1842.
5 ¦ A — С/5) 5 ¦ A -0,1555)
При а = 0,05, /2 = 2 • A0 - 5) = 10 имеем Fo.osA0,10) = 2?978.
Следовательно, U = 0,18 < 2,98 и гипотеза экспоненциальное™ не отклоняется.
3.3] Критерии проверки экспоненциалъности распределения 311
Рассмотрим теперь критерий Гринвуда. Имеем
D1 = U1= 0,00741; D2 = U2-U1= 0,01481; D3 = U3 - U2 = 0,0295;
D4 = 0,03704; D5 = 0,0666; D6 = 0,08148; D7 = 0,13333; D8 = 0,15555;
10
D9 = 0,08148; D10 = 0,2539 и G = n-^Dt = 1,689.
i=l
Из табл. 99 имеем Gi@,95) = 1,129 и G2@,95) = 2,700.
Так как G\(ot) = 1,29 < G = 1,689 < G^a) = 2,700, гипотеза экспоненциальное™ не
отклоняется.
3.3.21. Критерий Манн-Фертига-Шуера длм распределения Вейбулла
Распределение Вейбулла является обобщающим для экспоненциального распре-
распределения. Закон распределения Вейбулла
/ х
F(x) = 1-ехр --
V а
совпадает при C = 1 с экспоненциальным. Поэтому распределение Вейбулла часто
рассматривается как альтернативное при проверке экспоненциальное™ распреде™
ления.
Учитывая изложенное, критерий согласия для распределения Вейбулла приво-
приводится здесь. Критерий был предложен авторами применительно к задаче испытаний
изделий на долговечность.
Если ti,t2, ..., tr — первые г порядковых статистик наработки на отказ при
испытаниях выборки изделий объема п ^ г, то статистика критерия имеет вид
[Т1 V
— —наибольшее целое число ^ —, щ — коэффициенты, приведенные
в табл. 100.
Гипотеза согласия эмпирического распределения с двухпараметрическим рас™
пределением Вейбулла отклоняется, если
К > Ка(г,п),
где К > Ка (г, п) — критическое значение статистики для доверительной вероятно-
вероятности а (при известных результатах отказов г изделий из п), приведенное в табл. 101.
Задача 146. Проверить гипотезу согласия данных задачи 125 с двухпараметрическим
распределением Вейбулла при доверительной вероятности а = 0,95.
Для ряда значений х% имеем ряд
In ж*: 0; 0,693; 1,386; 1,609; 2,197; 2,398; 2,890; 3,044; 3,367; 3,555.
С учетом коэффициентов а% из табл. 100 для п = г = 10 имеем
JU 1пж»+1 - 1пж» _ 2,890 - 2,398 3,555 - 3,367 _
0,269493 h """H 0,405316
312 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 100
Коэффициенты о» Ж-критерия согласия
Манн—Фертига—ШСуера для распределения Вейбулла [95]
п
3
4
5
6
7
8
9
10
11
г
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
3
4
5
6
1
2
3
4
5
6
7
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
1
2
3
4
5
щ
1,216395
0,863046
1,150727
0,706698
0,679596
1,115718
0,645384
0,532445
0,583273
1,093929
0,612330
0,474330
0,442920
0,522759
1,079055
0,591158
0,442789
0,387289
0,387714
0,480648
1,068252
0,577339
0,422889
0,356967
0,334089
0,349907
0,449338
1,060046
0,566942
0,409157
0,337763
0,304777
0,297949
0,322189
0,424958
1,053606
0,559013
0,399100
0,324470
0,286163
0,269493
0,271645
0,300869
0,405316
1,048411
0,552769
0,391410
0,314705
0,273245
п
11
12
13
14
15
г
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
щ
0,251386
0,243928
0,251548
0,283879
0,389071
1,044137
0,547721
0,385338
0,307221
0,263737
0,238797
0,226264
0,224477
0,235630
0,269966
0,375356
1,040515
0,543556
0,380417
0,301300
0,256437
0,229515
0,213966
0,207205
0,209131
0,222667
0,258323
0,363582
1,037513
0,540059
0,376352
0,296496
0,250650
0,222377
0,204885
0,195165
0,192209
0,196679
0,211875
0,248409
0,353334
1,034894
0,537085
0,372934
0,292518
0,255180
0,216712
0,197893
0,186266
п
15
16
17
18
г
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
1
2
3
4
5
6
7
8
9
10
11
12
щ
0,180266
0,180072
0,180072
0,186347
0,239842
0,344309
1,032617
0,534521
0,370021
0,289169
0,242049
0,212103
0,192338
0,179407
0,171667
0,168476
0,170026
0,177619
0,194859
0,232350
0,336283
1,030618
0,532290
0,367507
0,286765
0,238765
0,208278
0,187813
0,173951
0,164928
0,159891
0,158624
0,161559
0,170132
0,188005
0,225729
0,329085
1,028850
0,530332
0,365314
0,283846
0,235958
0,205051
0,184055
0,169504
0,159564
0,153263
0,150176
0,150333
3.3]
Критерии проверки экспоненциалъности распределения
313
Окончание таблицы 100
п
18
19
20
21
i
13
14
15
16
17
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
1
2
3
4
5
6
7
8
9
щ
0,154313
0,163630
0,181971
0,219825
0,322580
1,027277
0,528594
0,363389
0,281692
0,233535
0,202291
0,180882
0,165807
0,155189
0,147984
0,143650
0,142012
0,143250
0,148031
0,157921
0,176611
0,214520
0,316666
1,0,25866
0,527046
0,361682
0,279798
0,231417
0,199905
0,178167
0,162684
0,151549
0,143674
0,138448
0,135580
0,135306
0,137120
0,142527
0,152861
0,171810
0,209721
0,311257
1,024594
0,525657
0,360159
0,278117
0,229551
0,197821
0,175815
0,160009
0,148471
п
21
22
23
г
10
11
12
13
14
15
16
17
18
19
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
«г
0,140087
0,134200
0,130451
0,128702
0,129025
0,131756
0,137659
0,148341
0,167481
0,205352
0,306285
1,023439
0,524405
0,358790
0,276618
0,278950
0,195983
0,173760
0,157692
0,145834
0,137052
0,130662
0,126260
0,123640
0,122763
0,123763
0,127019
0,133316
0,144273
0,163552
0,201355
0,301693
1,022380
0,523269
0,357557
0,275268
0,226417
0,194351
0,171948
0,155666
0,143549
0,134451
0,127667
0,122768
0,119503
0,117764
0,117577
0,119120
0,122799
0,129416
0,140590
п
23
24
25
г
20
21
22
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
щ
0,159966
0,197679
0,297435
1,021431
0,522233
0,356436
0,274051
0,225086
0,192892
0,170330
0,153877
0,141549
0,132195
0,125099
0,119811
0,116054
0,113677
0,112638
0,113007
0,114990
0,119014
0,125889
0,137235
0,156679
0,194285
0,293473
1,020551
0,521285
0,355415
0,272945
0,223885
0,191578
0,168899
0,152286
0,139789
0,130219
0,122871
0,117274
0,113132
0,110268
0,108598
0,108124
0,108944
0,111289
0,115596
0,122683
0,134165
0,153650
0,191137
0,289773
314 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
ю
СЛ
ш
е
СЛ
о
95
о
90
о
ft
99
о
,95
о
СЛ
о
СЛ
СЛ
о
,95
о
о
СЛ
о
<ч
СЛ
СЛ
о
95
о
90
о
ю
t-
о
Is-
СО
о
63
о
т-Н
СО
гЧ
3
О
со
00
О
о
00
О
ю
т-Н
ю
00
О
со
о
т—|
о
«
о
т-Н
СЛ
о
95
о
о
СЛ
о
СО
СО
о
о
Is-
о
66
о
Ю
т-Н
СО
00
о
Is-
о
00
СО
о
СО
СЛ
о
СЛ
СО
о
СО
о
о
т-Н
СЛ
СЛ
о
95
о
о
СЛ
о
СО
СО
Is-
о
СО
со
о
62
о
СО
т-Н
СЛ
00
о
т-Н
00
о
ю
Is-
о
Is-
сл
о
ю
о
о
о
СО
т-Н
т-Н
СЛ
00
о
СО
Is-
о
67
о
СЛ
о
ю
о
о
о
СО
t-
т—1
см
00
о
СО
Is-
о
СО
СО
о
00
о
СЛ
о
ь-
о
00
СО
о
СЛ
СЛ
о
95
о
о
о
СО
ю
о
о
00
t-
о
69
о
ю
00
о
ь-
о
t-
о
СЛ
3
о
со
00
о
о
00
о
ю
СЛ
00
о
t-
о
68
о
СЛ
о
Is-
00
о
80
о
ю
СЛ
t-
о
о
t-
о
ю
СО
о
о
СО
00
о
ю
ь-
о
00
СО
о
СО
СЛ
о
96
о
СЛ
t-
о
ю
ю
00
о
Is-
о
68
о
СО
00
о
ь-
о
СЛ
со
о
т—1
СЛ
00
о
т—1
00
о
ю
ь-
о
t-
сл
СЛ
о
95
о
о
о
СО
со
СЛ
00
о
о
00
о
ю
о
Is-
Is-
о
00
СО
о
S
о
см
см
00
о
см
о
СО
СО
о
00
СЛ
00
о
СО
Is-
о
00
СО
о
т-Н
00
о
см
о
66
о
00
СЛ
о
о
ь-
со
о
СО
ю
00
о
ь-
ь-
о
т—1
о
СЛ
СЛ
о
86
о
80
о
ю
ю
00
о
Is-
ь~
о
t-
о
ю
t-
о
t-
СО
о
СО
о
о
о
ь-
о
СО
о
о
1—1
00
о
СО
о
66
о
СО
СЛ
ь-
о
о
Is-
о
65
о
о
СЛ
СЛ
о
ю
о
о
СЛ
о
СО
ю
гЧ
см
00
о
ь-
о
СЛ
СО
о
гЧ
т—1
СЛ
СЛ
о
95
о
о
о
СО
00
о
2*
о
69
о
т-Н
о
СЛ
о
00
о
со
о
СЛ
о
ю
о
о
о
СО
см
т-Н
СЛ
00
о
Is-
Is-
о
68
о
Is-
ь-
о
СЛ
СО
о
64
о
см
СЛ
о
СО
00
о
00
о
ю
СЛ
00
о
00
о
00
СО
о
СЛ
о
СО
00
о
80
о
ю
о
00
о
см
Is-
о
67
о
СО
со
00
о
ю
о
t-
со
о
со
3
о
со
00
о
о
00
о
ю
ю
00
о
t-
о
Is-
СО
о
СО
ю
о
00
СО
о
63
о
СЛ
00
о
т—1
00
о
о
Is-
ю
00
о
о
Is-
СО
о
СО
о
00
о
80
о
Is-
о
t-
ь-
Is-
о
о
Is-
о
66
о
ю
см
00
о
см
Is-
о
СО
со
о
00
СЛ
00
о
т-Н
00
о
ю
Is-
о
ь-
сл
о
ю
СЛ
о
90
о
СО
00
о
СО
СО
о
62
о
СО
ю
00
о
ь-
Is-
о
см
Is-
о
СЛ
см
00
о
см
Is-
о
СО
СО
о
00
о
СЛ
о
Is-
ь-
о
68
о
ю
ь-
о
СЛ
СО
о
65
о
ь-
сл
о
о
о
со
о
о
ю
00
о
ь-
ь-
о
т—1
о
СЛ
СЛ
о
00
00
о
80
о
ю
СЛ
о
ю
СЛ
о
о
о
СО
00
т-Н
00
о
t-
о
СЛ
СО
о
1—1
ь-
о
о
ь-
о
ю
СО
о
о
1—1
ю
00
о
t-
о
ь-
СО
о
СО
о
СЛ
о
ь-
Is-
о
68
о
о
00
со
о
со
о
см
см
00
о
ь-
о
СЛ
СО
о
гЧ
т—1
СЛ
00
о
80
о
ь-
о
ь-
сл
о
СО
00
о
80
о
ю
СЛ
Is-
о
Is-
о
Is-
СО
о
СО
СО
о
00
СО
о
СО
СО
о
см
т-Н
т-Н
00
о
тЧ
Is-
о
59
о
00
CD
00
о
ю
о
67
о
СО
{О
о
ь-
со
о
СО
со
о
СЛ
о
ю
о
о
о
СО
СО
т-Н
СЛ
о
95
о
90
о
СО
СЛ
00
о
г-Н
СО
о
ю
ь-
о
ь-
t-
t-
о
о
t-
о
СО
СО
о
ю
00
о
t-
t-
о
00
СО
о
00
о
ь-
t-
о
68
о
см
00
о
СО
Is-
о
66
о
00
СЛ
СЛ
о
СЛ
о
о
СЛ
о
СО
СО
т—1
СЛ
о
СО
00
о
о
00
о
ю
СЛ
о
86
о
80
о
ю
ю
00
о
t-
t-
о
см
Is-
о
СЛ
00
о
00
Is-
о
СЛ
со
о
СО
00
о
ю
t-
о
00
СО
о
СО
СО
00
о
ю
Is-
о
t-
СО
о
СО
о
00
о
т-Н
Is-
о
65
о
о
3
о
СО
00
о
о
00
о
ю
о
о
т—|
00
о
ю
Is-
о
ь-
сл
00
о
80
о
Is-
о
t-
см
00
о
ь-
о
69
о
1—1
СО
00
о
ю
t-
о
00
СО
о
СО
см
00
о
см
ь-
о
СО
СО
о
00
см
00
о
см
t-
о
66
о
00
t-
ь-
о
СЛ
СО
о
64
о
см
СЛ
00
о
т—1
00
о
ю
ь-
о
ь-
ю
00
о
ь-
ь-
о
см
ь-
о
о»
ю
00
о
СО
о
гЧ
о
СЛ
о
00
о
см
t-
о
68
о
СО
00
о
Is-
о
СО
СО
о
00
СЛ
t-
о
о
t-
о
LO-
LOCO
о
о
т-Н
СЛ
СЛ
о
ю
СЛ
о
06
о
СО
о
т-Н
CD
ь-
о
Is-
CD
о
63
о
00
о
ь-
о
о
СЛ
см
00
о
ь-
о
СЛ
СО
о
т-Н
т—1
о
о
1^
о
68
о
00
t-
о
о
t-
о
66
о
ю
СЛ
t-
о
т—|
t-
о
ю
со
о
о
т-Н
со
о
00
СО
о
СО
о
см
т—1
СЛ
о
СО
00
о
80
о
ю
о
СО
СО
о
62
о
СО
см
00
о
Is-
о
СЛ
СО
о
т—1
т-Н
СЛ
о
см
о
Is-
СО
о
СО
т-Н
ю
00
о
ю
Is-
о
68
о
СО
СО
Is-
о
СЛ
со
о
65
о
t-
Is-
ь-
о
СЛ
со
о
3
о
см
т-Н
СЛ
о
ю
о
о
о
СО
т-Н
СЛ
00
о
т-Н
00
о
ю
Is-
о
t-
т—1
ь-
о
ю
СО
о
62
о
00
00
о
см
Is-
о
00
СО
о
СО
т-Н
о
СЛ
о
ь-
Is-
о
00
СО
о
т-Н
00
о
см
ь-
о
СО
СО
о
00
3.3]
Критерии проверки экспоненциалъности распределения
315
ft
99
о
95
о
о
СЛ
о
ft
СЛ
СЛ
о
,95
о
90
о
СЛ
СЛ
о
,95
о
90
о
Cj
СЛ
СЛ
о
95
о
о
СЛ
о
о
00
О
СО
IN
О
68
о
СО
СМ
LO
о
00
CD
О
CD
О
СЛ
гЧ
см
см
СЛ
ел
о
ю
СЛ
о
о
СЛ
о
СО
т—Н
см
99
о
95
о
90
о
СО
ел
т-Ч
CD
о
00
CD
О
64
о
см
ь-
о
ю
CD
О
т-Ч
CD
О
О
СМ
о
СЛ
о
00
о
СЛ
CD
О
90
о
оо
ь-
о
69
о
О
т-Ч
IN
О
67
о
LO
00
ь-
о
ь-
со
о
3
о
т-Ч
см
СЛ
о
CD
00
о
о
00
о
ю
94
о
86
о
т-Ч
00
о
Ю
о
CD
о
63
о
CD
о
IN
о
CD
о
т-Ч
CD
О
см
см
Ю
00
о
ь-
о
ь-
CD
о
CD
86
о
ю
IN
о
68
о
со
CD
о
СЛ
CD
О
65
о
ь-
О5
СЛ
о
ю
О5
О
о
СЛ
о
СО
СО
СМ
ел
оо
о
о
00
о
ю
ь-
о
ь-
89
о
81
о
ю
Jb-
о
Jb-
СО
о
CD
CD
О
62
О
00
СЛ
00
о
ь~
о
00
CD
О
см
00
о
СО
о
CD
CD
О
00
82
о
см
о
67
о
00
ю
ь-
о
00
CD
О
64
о
О5
'xf
СЛ
о
CD
00
О
о
00
О
ю
ю
00
о
ь-
ь-
о
см
ь-
о
СЛ
85
о
t-
ь-
о
см
ь-
о
СЛ
см
о
LO
CD
о
61
о
о
см
CD
00
о
CD
О
00
CD
О
CD
О
00
о
о
ь-
о
LO
со
о
о
80
о
т-Ч
JN
О
65
о
о
СО
ь-
о
ь-
CD
О
64
о
1—1
см
СЛ
00
о
см
00
о
CD
IN
О
IN
CM
00
о
IN
о
СЛ
CD
О
т—1
82
о
IN
О
69
о
т-Ч
т-Ч
о
CD
О
1—1
CD
О
СМ
см
СО
00
о
СО
ь~
о
CD
О
00
IN
о
СЛ
CD
О
"х*
CD
О
СМ
t-
Jb-
о
69
о
64
о
см
см
ь-
о
CD
CD
О
63
о
СО
СМ
CD
00
О
00
о
см
IN
О
СЛ
ел
ь-
о
см
ь-
о
00
CD
О
СО
80
о
см
ь-
о
68
о
СО
СЛ
со
о
3
о
о
CD
О
см
о
GO
о
т-Ч
IN
О
CD
CD
О
О
ю
ь-
о
ь-
CD
о
СО
со
О
CD
JN-
О
68
о
63
о
СЛ
О5
О
Ю
СЛ
О
90
о
СО
Ю
СМ
см
00
о
ю
IN
О
о
ь-
о
т-Ч
00
ь-
о
о
ь-
о
CD
CD
О
Ю
00
Ь-
О
О
IN
О
66
О
ю
т-Ч
СЛ
о
00
о
69
о
00
о
СЛ
CD
о
CD
О
см
ь-
о
IN
CD
О
СО
CD
О
CD
ь-
О
66
о
62
о
CD
СЛ
о
00
о
т-Ч
00
о
LO
о
00
о
СО
О
00
CD
О
СО
CD
о
О5
CD
О
ю
CD
О
ь-
СО
IN
О
69
о
65
о
CD
00
О
ю
in
о
68
о
со
CD
О
GO
CD
О
СО
CD
О
-xf
СО
О
CD
CD
О
СМ
со
о
00
см
JN-
о
65
о
61
о
00
СЛ
00
О
т—|
00
О
ю
Ь-
О
Ь-
00
IN
о
т-Ч
О
IN
CD
О
LO
ю
ь-
о
00
CD
о
CD
О
СЛ
°
IN
CD
О
64
о
О5
СМ
00
О
см
IN
О
66
о
00
Ю
IN
о
IN
CD
О
СО
CD
О
CD
СМ
ь-
о
ю
со
о
т—1
со
о
о
см
99
о
95
о
о
СЛ
о
СО
о
см
LO
00
о
ь-
t-
о
см
t-
о
СЛ
Jb-
о
СЛ
CD
о
LO
CD
о
ь~
СО
ь-
о
ь-
со
о
СО
CD
о
1—1
см
90
о
оо
о
68
о
о
00
о
о
In
о
65
о
о
СО
о
СО
со
о
см
CD
о
00
СЛ
СЛ
о
ю
СЛ
о
о
СЛ
о
СО
см
см
91
о
86
о
о
00
о
ю
см
00
о
LO
ь-
о
о
ь-
о
т-Ч
LO
о
00
CD
о
3
о
О5
о
СЛ
о
ь-
ь-
о
00
со
о
86
о
LO
о
67
о
со
00
о
СЛ
со
о
64
о
см
см
IN
о
ю
CD
о
т-Ч
со
о
о
см
ел
о
CD
00
о
о
00
о
ю
89
о
81
о
ю
Jb-
о
Jb-
т-Ч
00
о
СО
о
68
о
СО
СО
о
CD
о
СО
CD
о
т-Ч
см
LO
00
о
LO
о
00
CD
о
CD
82
о
со
о
66
о
00
CD
о
00
CD
о
63
о
о
ь-
о
CD
о
о
CD
о
см
см
СЛ
00
о
т-Ч
00
о
ю
ь-
о
ь-
85
о
ь-
о
см
ь-
о
СЛ
о
т-Ч
о
66
о
LO
см
ь-
о
СО
CD
о
СО
CD
о
СО
см
см
00
о
см
ь-
о
CD
со
о
00
80
о
т-Ч
о
65
о
о
о
СО
о
63
о
CD
О5
О5
о
ю
О5
о
о
СЛ
о
СО
"xf
см
Ю
00
о
ь-
ь-
о
см
IN
о
СЛ
83
о
IN
о
69
о
т-Ч
CD
о
СЛ
CD
о
65
о
ь-
о
СЛ
о
00
ь~
о
ел
CD
о
"X*
о
00
о
о
ь-
о
ю
CD
о
о
In
t-
о
69
о
64
о
см
СО
о
CD
со
о
62
о
00
'xf
СЛ
о
СО
00
о
г—1
00
о
ю
см
00
о
ь-
о
СЛ
CD
о
т—1
80
о
см
ь-
о
68
о
СО
LO
о
00
CD
о
64
о
СЛ
LO
00
о
LO
IN
о
00
CD
о
CD
00
о
СЛ
CD
о
со
о
см
CD
JN-
о
68
о
63
о
см
IN
о
Ю
CD
о
61
о
о
см
О5
00
о
т-Ч
00
о
ю
ь-
о
IN
о
00
о
см
ь-
о
00
CD
о
СО
00
о
т-Ч
IN
о
66
о
ю
о
ь-
CD
о
63
о
т—1
см
СО
00
о
СО
IN
о
СО
о
00
ю
ь-
о
00
со
о
СО
CD
о
о
67
о
62
о
CD
т-Ч
о
CD
о
т-Ч
CD
о
см
см
CD
00
о
ь-
о
см
IN
о
СЛ
00
о
т-Ч
ь-
о
ь-
CD
о
ю
CD
IN
о
69
о
65
о
см
о
CD
со
о
63
о
СО
см
о
GO
о
т-Ч
IN
о
СО
CD
о
о
ь-
о
ь-
CD
о
см
со
о
CD
см
JN-
о
66
о
62
о
00
о
о
СО
CD
о
о
CD
О
"xf
СМ
СО
00
о
ю
IN
О
о
ь-
о
т-Ч
т-Ч
CD
о
СЛ
CD
о
Ю
CD
О
ь-
ь-
о
68
о
64
о
СЛ
т-Ч
ь-
о
ю
со
о
62
о
Ю
см
00
t>
о
о
IN
о
СО
О
см
гЧ
СО
о
CD
СО
О
СМ
CD
О
00
т-Ч
о
65
о
т-Ч
CD
О
О
см
316 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
-Inxi 0,693 2,398-2,197
1 3929959 \h +
Е1пжг+1 -Inxi 0,693 2,398-2,197
!±i 1 = 3,929959 -\ ¦ h ... + ¦ = 8,901:
щ ' 1,053606 0,28163
К = ; = 0,441.
8,901
Из табл. 101 для п = г = 10 имеем Ж0,95(Ю,10) = 0,69.
Так как К = 0,441 < Жо,э5(Ю, 10) = 0,69, нулевая гипотеза не отклоняется. Она вклю-
включает в себя и гипотезу экспоненциальное™ распределения, так как экспоненциальное
распределение является частным случаем распределения Вейбулла. Рассмотрим случай
цензурированных испытаний при г = 7 < п = 10. Для этого случая имеем
б б
У ln^+i^ln^ = 4,3402333; V ]nXi+1 ~ lnXi = 6,886416;
К = 4'3402333 = 0,630026.
6,886416
Из табл. 101 для п = 10 и г = 7 находим K0j95G,10) = 0,81.
Так как К = 0,63 < ifo,95G,10) = 0,81, нулевая гипотеза не отклоняется и в этой
ситуации.
3.3.22. Критерий Дешпанде
В [334] Дешпанде рассмотрел класс критериев экспоненциальности против алв™
тернатив распределений с увеличивающейся интенсивностью отказов, основанных
на статистике
т * v^ / к \ / к \ J1' если ж» > Ьж^;
^i71 ~ 1) гф^ [0, еСЛИ Xi ^ fe^j.
В условиях, когда нулевая гипотеза справедлива, величина \jn[ J — ) рас™
пределена асимптотически нормально с нулевым средним и дисперсией [326]
1 М 1 26 26 2
D
26 A + ЬJ 1 + 6 + Ь2
От выбора постоянной Ъ зависит эффективность критерия против различных
альтернатив. Мы воспользуемся рекомендацией авторов работы [326], установив™
ших, что для наиболее распространенной альтернативы вейбулловского распреде-
распределения следует брать Ъ = 0,44.
Тогда критерий отклоняет нулевую гипотезу в случае, если
J2 ^fe 0,44^-) ^ 0,1494^г(^ - 1) иа + 0,694тг(п - 1).
ъфз
Задача 147. В условиях задачи 125 проверить соответствие эмпирических данных
экспоненциальному распределению критерием Дешпанде при а = 0,95.
Имеем для различных сочетаний i и j:
<p(xi] 0,44ж2) = (f(l; 0,44 • 2) = (p(l; 0,88) = 1;
(p(xi\0,Ux3) = у>A; 0,44 • 4) = <рA; 1,76) = 0;
<p(xi\ 0,44ж4) = ... = (p(xi\ 0,44жю) = 0; (p(x2; 0,44x3) = 1;
(f(x2; 0,44ж4) = ... = ip(x2] 0,44жю) = 0; ^(ж3; 0,44^4) = 1;
3.3] Критерии проверки экепоненциальности распределения 317
; 0,44ж5) = (f(x4; 0,44ж6) = 1; (f(x4; 0,44ж7) = ... = (f(x4; ,044жю) = 0;
х5; 0,44х6) = (р(хь; 0,44ж7) = 1; ^(ж5; 0,44х8) = ... = ^(ж5; 0,44жю) = 0;
(р(х6; 0,44ж7) = (f(x6; 0,44ж8) = 1; (р(х6; 0,44ж9) = (р(х9; 0,44жю) = 0;
(р(х7; 9,44ж8) = ... = (f(x7; 0,44жю) = 1;
(^(ж8;0,44ж9) = у?(ж8;0,44ж1о) = <р(х9\0,Ых10) = 1;
В нашем случае 17о,95 = 1,645 и п = 10. Тогда имеем
0,1494 • л/10 • A0 - 1) • 1,645 + 0,694 • 10 • A0 - 1) = 69,454.
Так как J^ (f(xi; 0,44a?j) = 17 < 69,454, гипотеза экепоненциальности распределения слу-
гфз
чайных величин не отклоняется.
3.3.23. Критерий Лоулесса
В работах Лоулесса [336], Энгельгардта и Байна [335] рассмотрен критерий про-
проверки гипотезы относительно величины параметра формы гамма-распределения,
основанный на статистике
где х = I Y\ xi I ; ж = — J^ Xi — соответственно геометрическое и арифметическое
средние ряда х±, #2, • • •, хп.
Напомним, что при равенстве параметра формы гамма-распределения единице
оно переходит в экспоненциальное. Поэтому проверка нулевой гипотезы Н®: к = 1
против альтернативы Н[ : к > 1 или Н": к < 1 эквивалентна проверке гипотезы
экепоненциальности выборочных данных. Гипотеза экепоненциальности принима™
ется на уровне значимости а, если выборочное значение W находится в интервале
M/ri(a) < W < М^2(ск)- Если W < Wi(a), то нулевая гипотеза отклоняется в пользу
гипотезы Н" (т. е. в пользу гипотезы о распределении с уменьшающейся интенсив-
интенсивностью отказов).
Если W > W(ck), to нулевая гипотеза отклоняется в пользу альтернативы Н[
(распределение с увеличивающейся интенсивностью отказов).
Статистика W является обобщением ранее рассмотренной нами статистики
Бартлетта^Морана (см. раздел 3.3.9). Критические значения Wi(a) и W^tt) для
проверки гипотезы экепоненциальности, заимствованные из [337], приведены
в табл. 102.
Задача 148. В условиях задачи 125 проверить соответствие эмпирических данных
экспоненциальному распределению критерием Лоулесса при а = 0,05.
Имеем
/ п \п х
х = I П ж* I = A • 2 • 4 • 5 • 9 • 11 • 18 • 21 • 29 • 35) ю = 8,28257;
* = !.1> = 13,5; W = * = 8-^ = 0,6135.
п р^ х 13,5
Из табл. 102 для п = 10 и а = 0,05 имеем Wx = 0,3758 и W2 = 0,8210.
Так как W\ = 0,3758 < W = 0,6135 < W2 = 0,821, гипотеза экепоненциальности не
отклоняется.
318 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 102
Критические значения W"i(o) и W^^ol)
критерия экспоненциальности Лоулесса [337]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Уровень значимости а
0,
Шг
0,4359
0,3991
0,3966
0,4006
0,4061
0,4115
0,4165
0,4216
0,4261
0,4302
0,4339
0,4373
0,4405
0,4435
0,4463
0,4487
0,4513
0,4535
0,4556
0,4574
0,4595
0,4613
0,4629
0,4644
0,4662
0,4674
0,4688
0,4700
0,4713
10
w2
0,9950
0,9574
0,9147
0,8794
0,8512
0,8285
0,8099
0,7944
0,7812
0,7699
0,7601
0,7514
0,7437
0,7368
0,7306
0,7350
0,7199
0,7151
0,7108
0,7070
0,7031
0,6998
0,6964
0,6933
0,6906
0,6878
0,6854
0,6830
0,6808
0,
0,3122
0,3058
0,3173
0,3299
0,3413
0,3515
0,3601
0,3684
0,3758
0,3818
0,3877
0,3929
0,3977
0,4019
0,4058
0,4094
0,4130
0,4162
0,4194
0,4219
0,4249
0,4273
0,4296
0,4317
0,4341
0,4360
0,4380
0,4398
0,4416
35
w2
0,9987
0,9790
0,9477
0,9176
0,8915
0,8695
0,8508
0,8348
0,8210
0,8089
0,7982
0,7887
0,7802
0,7726
0,7656
0,7593
0,7536
0,7482
0,7432
0,7388
0,7343
0,7305
0,7265
0,7230
0,7199
0,7167
0,7137
0,7110
0,7083
0,
0,1411
0,1670
0,1927
0,2157
0,2344
0,2505
0,2644
0,2763
0,2876
0,2973
0,3059
0,3139
0,3211
0,3275
0,3334
0,3393
0,3446
0,3491
0,3542
0,3580
0,3619
0,3655
0,3690
0,3724
0,3761
0,3786
0,3817
0,3843
0,3868
31
w2
0,9999
0,9959
0,9826
0,9646
0,9458
0,9280
0,9115
0,8967
0,8832
0,8710
0,8600
0,8500
0,8408
0,8324
0,8241
0,8175
0,8109
0,8047
0,7989
0,7936
0,7885
0,7838
0,7793
0,7750
0,7710
0,7672
0,7637
0,7602
0,7571
3.4]
Критерии согласия для равномерного распределения
319
3.4. Критерии согласия для равномерного распределения
Напомним, если х\, ...,хп—выборка из распределения вероятностей с функ™
цией F(x), то случайная величина yi = F{xi) распределена равномерно на интер™
вале [0,1]. Поэтому установление равномерности распределения у^ является по
существу критерием согласия наблюдаемвж данных с теоретическим распределен
нием F(x). Этим объясняется повышенный интерес к поиску простых в вычисли™
тельном отношении и эффективных критериев равномерности распределения слу-
случайных величин. Можно указать на такие критерии равномерности распределения,
как
— критерий Кимбела [338]
г=1
Un+1 = 1;
— критерий Морана [339]
п+1
в=
— критерий и [340]
г=1
U4 ~~
2г — 1
п
Здесь Ui — порядковая статистика равномерно распределенной случайной ве-
величины. В настоящем разделе мы рассмотрим наиболее эффективные критерии
равномерности распределения случайных величин.
3.4.1. Критерий Шермана
Статистика критерия Шермана для проверки равномерности распределения
имеет вид [327]
п+1
и0 = 1, ип =
Распределение статистики Шермана рассмотрено в разделе 3.3.15, там же приведе-
приведены критические значения (табл. 95) и аппроксимации статистики этого критерия.
Задача 149. Имеется ряд наблюдений над случайной величиной:
Uii 0,047; 0,05; 0,15; 0,18; 0,29; 0,48; 0,52; 0,61; 0,72; 0,91.
Необходимо проверить гипотезу равномерности распределения случайной величины Ui
на интервале [0,1] критерием Шермана при доверительной вероятности а = 0,95.
Находим
1
0,047--
0,5 - 0,047 - jj
0,72 - 0,61 - ^
0,91 - 0,72
= 0,245.
Из табл. 95 для п = 10 имеем сию @,95) = 0,473.
Так как шп = 0,245 < сию @,95) = 0,473, гипотеза равномерности не отклоняется.
320 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Рассмотрим нормальную аппроксимацию шп-распределения.
Имеем (см. раздел 3.3.15)
2 . ю12 + 10 ¦ 912 /10х 22
D(o;n) = — —^ ( — j = G,Q05251 {у/Щшп) = 0,07246).
Вычисляем
u)n-M(ujn) 0,245-0,35049
ш = —1,457.
у/Щшп) 0,07246
Так как \шп\ = 1,457 < t?o,95 = 1,645 (95%-я квантиль стандартного нормального распре-
распределения), гипотеза равномерности распределения не отклоняется.
И еще одна аппроксимация:
и =
Видим, что результаты близки — случайная величина С/', имеющая стандартное нор-
нормальное распределение, находится в пределах 95%-го интервала, что позволяет принять
гипотезу равномерности.
3.4.2. Критерий Морана
Статистика критерия, предложенного Мораном [309], используется в форме
где A = Ui-Ui-U Di = UU Dn+1 = 1 - Un (г = 1, ... ,n + 1).
В [231] показано, что случайная величина
М _
7п
имеет распределение %2 с / = п степенями свободы. Используя аппроксимацию
Вилсона-Хилферти (см. раздел 1.1.8), мо^но получить аппроксимацию
7n +
где z — случайная величина, имеющая стандартное нормальное распределение.
Гипотеза равномерности принимается, если
Мг{а) ^Мп^М2{а),
где Mi (а) и М2(а)—критические значения статистики, приведенные в табл. 103.
Для частного случая, когда Щ = .F(a^), критерий Морана становится критерием
согласия эмпирического распределения с теоретическим F(x). В случае их совпа-
совпадения случайная величина Щ должна быть распределена равномерно на интерва™
ле [0,1].
3.4]
Критерии согласия для равномерного распределения
321
Таблица 103
Критические значения JVfi(cx) и
статистики Морана [341]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Доверительная вероятность а
0
Mi
0,130
0,356
0,643
0,967
1,317
1,687
2,072
2,469
2,876
3,292
3,715
4,145
4,581
5,021
5,466
5,916
6,369
6,825
7,285
90
м2
2,756
3,699
4,573
5,408
6,214
7,001
7,772
8,531
9,279
10,018
10,750
11,475
12,194
12,909
13,618
14,324
15,025
15,721
16,418
0
Мг
0,064
0,215
0,430
0,689
0,979
1,292
1,625
1,973
2,333
2,704
3,085
3,479
3,870
4,272
4,681
5,094
5,513
5,936
6,362
95
м2
3,554
4,592
5,546
6,449
7,319
8,162
8,987
9,795
10,591
11,375
12,150
12,916
13,675
14,428
15,174
15,916
16,652
17,384
18,112
0,99
Mi
0,012
0,070
0,180
0,334
0,523
0,741
0,982
1,242
1,519
1,810
2,113
2,428
2,752
3,085
3,425
3,774
4,128
4,489
4,855
М2
5,370
6,579
7,675
8,705
9,688
10,637
11,559
12,460
13,343
14,210
15,064
15,907
16,740
17,563
18,378
19,186
19,987
20,782
21,571
Если параметры теоретического распределения известны заранее, то критерий
Морана используется в форме [342]
п+1
где Di = Ui-Ui-Ui = l, ...,n + l, E/o = O, Un+1 = 1.
Равномерность распределения Щ на интервале [0,1], а следовательно, и дону™
стимость использования в качестве вероятностной модели распределения функ™
ции -Р(ж), отклоняется, если [342]
>Х(п)
С2
где Cl =
X«(n) — о^квантшть стандартного нормального распределения с / = п степенями
свободы.
Если параметры распределения F(x) определяются по выборке, то критерий
имеет вид
Мп + - - а
—i— > х2»'
где к — число определяемых по выборке параметров.
11 А. И. Кобзарь
322 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Эти аппроксимации, предложенные Ченгом и Стефенсом [342], дают весьма
удовлетворительные результаты уже при п > 5.
Задача 150. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайных величин критерием Морана при доверительной вероятности а = 0,95.
Имеем
D1 = U1 = 0,047; D2 = 0,05 - 0,047 = 0,003; D3 = 0,15 - 0,05 = 0,10;
D4 = 0,18 - 0,15 = 0,03; D5 = 0,11; D6 = 0,19; D7 = 0,04; D8 = 0,04;
D9 = 0,09; Dio = 11; Dn = 0,09.
Тогда
Mn = ^ In [(n + 1) • Di] = -11 In 11-^; In A =
г=1 г=1
= 26,3768 - (In 0,047 + In 0,003 + ... + In 0,19 + In 0,09) = 4,0698.
Из табл. 103 находим Мг = 2,333 и М2 = 10,591.
Так как Mi = 2,333 < Мп = 4,0698 < М2 = 10,591, гипотеза равномерности не откло™
няетея.
Воспользуемся теперь нормальной аппроксимацией и вычислим
1
12-11 \ з / 2
4,0698 - 1- —
J ^^Z = ^0,635,
2
90
что находится в диапазоне Zo,o5 -г- ^о,95 = —1,645 -=- +1,645.
Случайная величина Мп = • Мп = • 4,0698 = 6,887 имеет у2-рас-
7п + 8 78
пределение с / = 10 степенями свободы. При а = 0,95 значение Хо,9бA0) = 18,307
(см. табл. 55), что больше Мп и, следовательно, не отклоняет гипотезу равномерности
распределения.
Применим теперь аппроксимацию Ченга-Стефенса.
11
Имеем Мп = V^lnD^ = 30,4467. Далее вычисляем
г=1
d = A0 + 1) • (In 11 + 0,57722) л/б • 11 • ( — - 1) - — = 15,84026;
с2 = , г • 11 • ( — - 1 ) - — = 1,071176.
л/2^То \ 6 / 2 6'1г
Тогда — = — ' = 13,636 < Хо 95(Ю) = 18,307, и этот критерий не от™
С2 1,071176 '
клоняет нулевую гипотезу.
3.4.3. Критерий Ченга-Спиринга
Критерий равномерности распределения, аналогичный критерию Шапиро-Уил™
ки (см. разделы 3.2.2.1 и 3.3.1), предложен в [343]. Его статистика имеет вид
1 2
?Ур —
где хп — х\ —выборочный размах.
3.4]
Критерии согласия для равномерного распределения
323
Всегда
п(п — 1)
4п(п + 1)
(n = 2,4, ...,2fe);
(ra= 1,3, ...,2fc- 1)
при справедливости нулевой гипотезы (подробнее об этом см. в [211]).
Гипотеза равномерности отклоняется, если W\(a) ^ Wp ^ W(a), где Wi(a)
и W^a)— критические значения при доверительной вероятности а, приведенные
в табл. 104.
Таблица 104
Критические значения Wi(«) и И^г(ск)
критерия равномерности Ченга^С пиринга [143]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
Доверительная
0,90
Шг
6,30
3,74
2,58
2,00
1,64
1,40
1,22
1,08
0,97
0,89
0,81
0,75
0,70
w2
7,97
5,31
4,02
3,23
2,68
2,32
2,04
1,79
1,60
1,45
1,31
1,22
1,12
0,
6,15
3,44
2,42
1,88
1,54
1,32
1,15
1,02
0,92
0,84
0,77
0,71
0,66
вероятность а
95
w2
7,99
5,43
4,18
3,41
2,85
2,47
2,19
1,92
1,73
1,57
1,42
1,31
1,21
0,99
Wx
6,03
3,08
2540
1,71
1539
1,18
1,04
0,91
0,83
0,76
0,69
0,64
0,60
w2
8,00
5,53
4,39
3,67
3,13
2,77
2,46
2,18
1,99
1,79
1,64
1,52
1,39
п
16
17
18
19
20
21
22
23
24
25
30
40
50
Доверительная
0,
Шг
0,65
0,61
0,58
0,55
0,52
0,50
0,47
0,45
0,44
0,42
0,35
0,26
0,21
90
w2
1,03
0,97
0,90
0,85
0,80
0,76
0,72
0,68
0,65
0,62
0,51
0,37
0,29
0,
Wt
0,62
0,58
0,55
0,52
0,50
0,47
0,45
0,43
0,42
0,40
0,33
0,25
0,20
вероятность а
95
w2
1,11
1,04
0,98
0,92
0,86
0,81
0,78
0,73
0,70
0,67
0,54
0,39
0,30
0,
Wt
0,56
0,53
0,50
0,47
0,45
0,43
0,41
0,40
0,38
0,36
0,31
0,23
0,19
99
w2
1,31
1,20
1,12
1,05
0,98
0,92
0,89
0,84
0,80
0,76
0,61
0,44
0,33
Задача 151. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайной величины критерием Ченга-Спиринга при а = 0,95.
ю
Имеем хп = 0,91, ал = 0,047 и ]Р
ж* - жJ = 0,7973241.
Тогда Wp =
@,91 - 0,047) • —
= 1,395. Из табл. 104 для а = 0,95 и п = 10 находим
0,7973241
Wi@,95) = 1,02 и W2@,95) = 1,92.
Так как Wt(a) = 1,102 < Wp = 1,395 < W2(a) = 1,92, гипотеза равномерности распре-
распределения совокупности случайных величин не отклоняется.
3.4.4. Критерий Саркади-Косика
В [344] рассмотрен новый, весьма эффективный критерий равномерности на [0,1],
основанный на модификации критерия Ватсона (см. раздел 1.2.5), со статистикой
где
11*
324 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Распределение признается не противоречащим равномерному на уровне значи™
мости а, если J < «/(а), где J(a) — критическое значение, приведенное в табл. 105.
Таблица 105
Критические значения «/(«)
критерия Саркади—Косика [344]
п
5
10
15
20
25
30
35
Доверительная
вероятность а
0,05
0,499
0,741
0,881
0,931
0,973
1,000
1,020
ОДО
0,408
0,599
0,695
0,748
0,782
0,806
0,823
п
40
50
60
70
80
90
100
Доверительная
вероятность а
0,05
1,040
1,020
1,060
1,070
1,070
1,080
1,080
0,10
0,836
0,823
0,862
0,870
0,876
0,880
0,883
Критерий обладает высокой мощностью против большого спектра альтернатив.
Задача 152. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайной величины критерием Саркади-Косика на уровне значимости а = 0,05.
Вычисления статистики критерия приведены в таблице:
ъ
1
2
3
4
5
6
7
8
9
10
Xi
0,047
0,050
0,150
0,180
0,290
0,480
0,520
0,610
0,720
0,910
г
п + 1
0,0909
0,1818
0,2727
0,3636
0,4545
0,5454
0,6363
0,7272
0,8181
0,9090
г
Х% п+ 1
-0,0439
-0,1318
-0,1227
-0,1836
-0,1645
-0,0654
-0,1163
-0,1172
-0,0981
0,0010
Цп-i + l)
10
18
24
28
30
30
28
24
18
10
di
-0,004390
-0,007322
-0,005110
-0,006557
-0,005480
-0,002180
-0,004150
-0,004880
-0,005450
0,000100
dl
1,927-10^5
5,631 • 10^5
2,614-10^5
4,300 • 10^5
3,010-10^5
4,750 • 10^5
1,720 • 10^5
2,380 • 10^5
2,970 • 10^5
Вычисляем статистику
J = 100 • 2,5028 •
- 10 • @,045419J = 4,399
Легко видеть, что J = 4,399 • 10~~3 < J(ol) = 0,741, что не отклоняет гипотезу равномер-
равномерности.
3.4.5. Энтропийный критерий Дудевича-ван дер Мюлена
По аналогии с критерием нормальности Васичека [247] (см. раздел 3.2.2.2) в [345]
рассмотрен критерий для оценки равномерности распределения.
Пусть х\ ^ ... ^ хп — выборка случайных величин. Ее выборочная энтропия
равна [2471
п
, п) = --
г=1
log2 7^(%i+m - хг^п
т — целое число ^ — (используем Х{ = х\ при г < 1 и Xi = хп при г > п).
3.4]
Критерии согласия для равномерного распределения
325
Распределение случайных величин признается равномерным, если Н{т1п)
На(т,п), где Ha(mJn)—критическое значение, приведенное в табл. 106.
Таблица 106
Критические значения Ша{туп)
статистики Дудевича—ван дер Мюлена [346]
ТЬ
10
20
30
40
тп
1
2
3
4
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
Уровень значимости а
0,01
1,228
0,979
0,951
0,977
0,787
0,588
0,536
0,536
0,543
0,557
0,581
0,605
0,632
0,665
0,540
0,402
0,384
0,384
0,394
0,407
0,420
0,440
0,459
0,569
0,379
0,330
0,316
0,311
0,313
0,318
0,05
0,974
0,766
0,741
0,774
0,658
0,466
0,429
0,428
0,438
0,458
0,481
0,509
0,536
0,544
0,367
0,324
0,312
0,314
0,322
0,335
0,350
0,366
0,383
0,491
0,315
0,270
0,254
0,253
0,257
0,265
0,10
0,845
0,659
0,645
0,681
0,585
0,412
0,378
0,378
0,391
0,410
0,433
0,460
0,489
0,496
0,327
0,287
0,279
0,282
0,291
0,304
0,319
0,336
0,354
0,450
0,283
0,242
0,229
0,228
0,231
0,239
ть
40
50
100
тп
8
9
10
15
1
2
3
4
5
6
7
8
9
10
15
20
1
2
3
4
5
6
7
8
9
10
15
20
30
40
Уровень значимости а
0,01
0,327
0,339
0,350
0,415
0,532
0,342
0,284
0,264
0,257
0,257
0,260
0,266
0,274
0,283
0,337
0,397
0,430
0,353
0,199
0,175
0,165
0,160
0,157
0,157
0,159
0,160
0,180
0,205
0,262
0,325
0,05
0,274
05285
0,297
0,367
0,458
0,282
0,236
0,219
0,214
0,215
0,219
0,226
0,234
0,243
0,295
0,355
0,381
0,219
0,170
0,150
0,140
0,135
0,134
0,134
0,136
0,138
0,159
0,185
0,243
0,314
0,10
0,249
0,260
0,272
0,316
0,422
0,256
0,213
0,198
0,195
0,196
0,201
0,207
0,216
0,224
0,276
0,336
0,360
0,204
0,158
0,138
0,128
0,123
0,122
0,123
0,124
0,128
0,149
0,175
0,233
0,306
Для п > 20 полезна аппроксимация
Х< у^ Iog2(^.
г=0
где
R(l,m- 1) =
_ ) m-l
E
m- j
¦ 2 - m)[log2(ra + 1) + 0,5772 - ДA,га - 1)] > ,
при т = 1 (х0 = 0; жт+1 = 1);
при т ^ 2.
Статистика Н(гп, п) имеет стандартное нормальное распределение. Следует по-
помнить, что Н(т,п) всегда отрицательно и log2 a = 3,3219 lg a.
326 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Задача 153. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайной величины критерием Дудевича-ван дер Мюлена на уровне значимости
а = 0,05.
Выбираем т = 2 и вычисляем статистику критерия
ЯB, Ю) = -^ • |log2 ™ • (х3 - Х1) + ... + log2 И . (Ж10 _ Ж8) J =
= ОД • (log2 0,82 + Iog2 0,3325 + ... + log2 0,75) = 0,20914.
Из табл. 106 для п = 10, т = 2 ш а = 0,05 имеем Я0,о5B,10) = 0,766.
Так как ЯB,10) = 0,209 < Яо,о5B,10) = 0,766, гипотеза равномерности распределен
ния вероятностей случайной величины не отклоняется.
3.4.6. Критерий Хегази-Грина
По аналогии с критерием нормальности Хегази—Грина (см. раздел 3.2.2.3) авто-
авторы работы [249] рассмотрели и критерий равномерности на основе статистик
г=1 г=1
где Xi—порядковые статистики выборки; щ = М(з^)—математическое ожидание
г-й порядковой статистики.
Критерий применим и для случайных величин, распределенных на любом интер-
интервале [а, Ь]. В этом случае следует перейти к переменной у^ = г (г = 1, ..., п)
и объем выборки п заменить на (тг — 2).
В конечном итоге предлагаются статистики
1 \ ' " ГТ1 *-
J-2 = —
771 1-^
г=1
m ^—^ \ m + 1
=1
для переменной ж^ Е [0,1] ;
где т = ^ ж^ _ Ж1
п — 2 для переменной ^ = — •
В [249] рассмотрены так^е модифицированные статистики, которые вместо
математического ожидания г-й порядковой статистики т = используют его
т + 1
модальное значение ^ = г (в силу несимметричности распределения порядко™
вых статистик).
Критерии в этом случае вычисляются по формулам
1
т
\ "\
г —
т —
1
1
1
т
Х^ ( г — 1
Гипотеза равномерности распределения случайных величин а^ принимается на
уровне значимости а, если
TiCTi*) < Тг(а)(Т*(а)) или Т2(Т2*) < Т2(а)(Т2*(а)),
где Ti(a), Тх*(а), Т2(а), Г2*(а) —критические значения соответствующих статистик,
приведенные в табл. 107.
3.4]
Критерии согласия для равномерного распределения
327
Таблица 107
Критические значения Т\(о:), Т]*(о), T^ol) и TJ(q:)
критерия равномерности Хегази—Грина [249]
п
3
8
18
38
78
Уровень значимости а
0,01
Тг
0,3893
0,2590
0,1724
0,1225
0,0853
Т*
0,4277
0,2674
0,1764
0,1224
0,0843
т2
0,1744
0,0822
0,0376
0,0191
0,0096
гр*
А2
0,2807
0,0998
0,0421
0,0188
0,0095
0,05
Тг
0,3254
0,2030
0,1360
0,0950
0,0664
т*
0,3778
0,2142
0,1399
0,0949
0,0663
т2
0,1189
0,0522
0,0240
0,0119
0,0059
0,2059
0,0641
0,0268
0,0123
0,0059
Для промежуточных значений п применима аппроксимация
/п п
коэффициенты а, Ь и с которой для различных статистик и уровней значимости
приведены в таблице:
Статистика
IT (а)
Ща)
Г2*(а)
"Уровень значимости а
0,01
а
-0,0070
-0,0090
-0,0148
0,0047
Ь
0,8373
0,7949
0,1701
-0,0607
с
-0,2500
-0,0782
0,2745
0,9330
0,05
а
0,0003
0,0064
-0,0068
0,0214
ь
0,5876
0,5066
0,0783
-0,1395
с
-0,0425
0,2364
0,2419
0,8212
Мощность критерия достаточно велика по сравнению с другими критериями.
Задача 154. Проверить гипотезу равномерности распределения случайной величи-
величины Х{ на интервале [0,1] для данных задачи 149 критериями Хегази-Грина на уровне
значимости а = 0,05.
Имеем
ю
= 0,1 • @,0439 + 0,1318 + ... + 0,0982 + 0,0083) = 0,1051;
п + 1
1
10
= 0,1 • A,9272 • 10^3 + 0,01737 + ... + 6,889 • 10~5) = 0,0136;
г- 1
- 1
= 0,1 • @,047 + 0,1722 + ... + 0,16888 + 0,09) = 0,1248;
= 0,01764.
Из табл. 107 для а = 0,05 и п = 10 находим (аппроксимацией)
Ti(a) = 0,20; Т*(а) = 0,21; Т2(а) = 0,05; Г2 (а) = 0,06.
Более точные критические значения получим, воспользовавшись аппроксимациями:
71@,05) = 0,0003+^ -Mfi =0,182;
328 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Т;@,05) = 0,0064+ ^ + ^=0,190;
10 Ю
Т2@,05) = -0,0068 + ^ + ^ = 0,042;
vlO Ю
Т2*@,05) = 0,0124 - 2^ + °*™ = 0,050.
lO Ю
Так как
Тг = 0,1052 < Ti@,05) = 0,182; Г* = 0,1248 < 1^@,05) = 0,190;
Т2 = 0,0316 < Т@,05) = 0,042; Г2* = 0,017 < Г2*@,05) = 0,050,
то всеми критериями гипотеза равномерности не отклоняется.
3.4.7. Критерий Янга
В [347] изучен критерий для проверки распределения точек на отрезке. Пусть
на отрезке длиной I с началом в нуле расположено п точек с координатами
х\ ^ ... ^ хп. Определим переменные
Dt = хъ Di = Xi- Xi-i, Dn+1 = l-xn.
Впервые критерии для проверки равномерности, основанные на D-статистиках,
рассмотрены в [348, 349], однако пригодные аппроксимации получены в [347].
Статистика критерия Янга имеет вид
* г=1
п п
Очевидно, что 0 ^ М ^ . При I = 1 имеет место М = ^ mm(D^, A+i)-
г=1
Если I неизвестно, то используется статистика
М* = ^^— J^ min(A, A+i),
Хп ^ Xi , = 2
распределение которой совпадает с распределением М^статистики при замене п на
(п-2).
Гипотеза равномерности не отклоняется, если
Mi (а) <:м<: М2(а),
где Mi (а) и М2(а)—критические значения, приведенные в табл. 108.
При п ^ 15 можно использовать тот факт, что статистика
имеет стандартное нормальное распределение. Если иа — «^квантиль стандартного
нормального распределения, то
, , , ч п . 1 2п — 1
м^а) = 2(^ТТ) * Ui^ 27^ТТ) V ~з~-
Напомним, что
ui-ot = —1,645 при а = 0,90; гы-а = —1,96 при а = 0,95
2 2
и ги^а = ^2,58 при а = 0,99.
2
3.4]
Критерии согласия для равномерного распределения
329
Таблица 108
Критические значения A^i(ck)
статистики Янга [347]
п
2
3
4
5
10
15
20
30
40
Доверительная вероятность а
0,90
Mi
0,090
0,151
0,192
0,220
0,300
0,340
0,370
0,390
0,400
М2
0,545
0,589
0,602
0,610
0,600
0,590
0,590
0,570
0,570
0,95
Mi
0,043
0,104
0,142
0,170
0,260
0,310
0,330
0,360
0,380
М2
0,581
0,627
0,646
0,650
0,640
0,620
0,610
0,600
0,590
0,99
Mi
0,010
0,046
0,073
0,100
0,190
0,240
0,270
0,310
0,340
М2
0,545
0,589
0,602
0,610
0,600
0,590
0,590
0,570
0,570
Более точно распределение Tkf-статистики аппроксимируется бета-распределе-
бета-распределением (см. раздел 1.1.7) с параметрами
а = Ь =
Зп2
2Bгс- 1)
Задача 155. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайной величины критерием Янга при уровне достоверности а = 0,95.
В нашем случае 1 = 1. Имеем ряд
Вг = 0,047; D2 = х2 - хг = 0,05 - 0,047 = 0,003;
D3 = 0,15 - 0,05 = 0,10; D4 = 0,18 ~~ 0,15 = 0,03; D5 = 0,29 - 0,18 = 0,11;
D6 = 0,48 - 0,29 = 0,19; D7 = 0,52 - 0,48 = 0,04; D8 = 0,61 - 0,52 = 0,09;
D9 = 0,72 - 0,61 = 0,11; D10 = 0,91 - 0,72 = 0,19; Dtl = 1 - 0,91 = 0,09,
з которого следует ряд значений:
Mi = mIn(Di,D2) = 0,003; M2 = min(D2,D3) = 0,003; M3 = mm(D3,D4) = 0,03;
M4 = mm(D4, D5) = 0,03; M5 = min(D5,D6) = 0,11; M6 = min(D6, D7) = 0,04;
M7 = mfn(D7, D8) = 0,04; M8 = m!n(D8, D9) = 0,09; M9 = min(D9, D10) = 0,11;
Mio = min(?>iOvDii) = 0,09.
10
Тогда М =J2Mi = 0,546. Из табл. 108 для п = 10 и а = 0,95 имеем Мг = 0,26
, М2 = 0,64. Так как Mi = 0,26 < М = 0,546 < М2 = 0,64, гипотеза равномерности не
отклоняется.
Если воспользоваться нормальной аппроксимацией, то
Mi @.95) =
М2@,95) =
10
1
2-11 \ 3 / 2-11
Видно, что полученные значения близки к табличным.
= 0,266;
= 0,642.
330 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.4.8. Критерии типа Колмогорова-Смирнова
Ранее были рассмотрены критерии типа Колмогорова—Смирнова, основанные
на сравнении теоретической и эмпирической функций распределения (см. разде-
разделы 3.1.2.1 — критерий Колмогорова—Смирнова; 3.1.2.6 — критерий Купера, как об-
общие критерии согласия; 3.2.1.2 — в задачах проверки нормальности распределения;
3.3.2 — в задачах проверки экспоненциальное™ распределения).
Приведем модифицированные формы критериев Колмогорова-Смирнова
+^, D) и Купера (V') для задачи проверки равномерности распределения
D^ = max| —
V = D+ + ?T.
Распределения указанных статистик быстро сходится к предельному, если ис-
использовать их модификации:
D+ =
п
0,4
0,2
0,68
w);
V = IV-
п-1
Критические значения для модифицированных статистик D+, D , D,
дены в табл. 109.
Таблица 109
Критические значения -D~*~, D~, D, V
критериев равномерности [231]
п
D+
D~
D
V
Уровень значимости а
0,01
1,518
1,518
1,628
2,001
0,025
1,358
1,358
1,480
1,852
0,05
1,224
1,224
1,358
1,747
0,10
1,073
1,073
1,224
1,620
0,15
0,973
0,973
1,138
1,537
Задача 156. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайной величины критериями типа Колмогорова-Смирнова на уровне значимо-
значимости а = 0,05.
Результаты вычислений представлены в таблице:
г
1
2
3
4
5
6
7
8
9
10
Щ
0,047
0,050
0,150
0,180
0,290
0,480
0,520
0,610
0,720
0,910
i
п + 1
0,1111
0,1818
0,2727
0,3636
0,4545
0,5454
0,6363
0,7272
0,8181
0,9090
тт. г
п + 1
^0,0641
^0,0404
-0,1227
-0,1836
-0,1645
-0,0654
-0,1163
-0,1172
-0,0981
0,0010
г тт-
п + 1
0,0641
0,1318
0,1227
0,1836
0,1645
0,0654
0,1163
0,1172
0,0981
-0,0010
3.4]
Критерии согласия для равномерного распределения
331
Вычисляем
D+ = 0,001; D~ = 0,1836; D = 0,1836; V = D+ + D^ = 0,1846;
~+ / 04\ / j— 068\
D+ = f 0,001 + -^- 1 • f V10 + 0,2 + -j= J = 0,1466;
= 0,1836-
0,4
To"
0 4
D= @,1836+^-
V = ( 0,1846 - - ] •
10 + 0,2-
0,6
= 0,799;
'2+tS)=0'799;
0,1555+ ^^ ) = 0,264.
Из табл. 109 для а = 0,05 находим D = 1,358 и V = 1,747.
Так как D = 0,799 < Й@,05) = 1,358 и V = 0,264 < F@,05) = 1,747, гипотеза равно-
равномерности распределения не отклоняется.
3.4.9. Критерий Фроцини
Ранее мы рассмотрели критерии Фроцини [239] применительно к проверке со-
соответствия эмпирического распределения нормальному (см. раздел 3.2.1.3) и экс-
экспоненциальному (см. раздел 3.3.4) законам. Для проверки равномерности ряда
Щ: U\ ^ ... ^ Un на отрезке [0,1] статистика критерия Фроцини имеет вид
U4 -
Распределение признается равномерным, если Вп < Bn(ct), где Вп(а) — критиче-
критическое значение статистики Фроцини для проверки равномерности (а — доверитель-
доверительная вероятность), приведенное в табл. 110.
Таблица 110
Критические значения статистики В„(а) критерия Фроцини
для проверки равномерности распределения [239]
п
5
6
7
8
9
10
Доверительная
вероятность а
0,90
0,4964
0,4908
0,4955
0,4933
0,4947
0,4896
0,95
0,5756
0,5700
0,5780
0,5733
0,5764
0,5723
0,99
0,7282
0,7123
0,7428
0,7394
0,7258
0,7310
п
11
12
13
14
15
сю
Доверительная
вероятность а
0,90
0,4948
0,4987
0,4942
0,4956
0,4961
0,4970
0,95
0,5806
0,5790
0,5815
0,5769
0,5730
0,5780
0,99
0,7486
0,7324
0,7441
0,7417
0,7418
0,7440
Задача 157. Для данных задачи 149 проверить гипотезу равномерности распределе-
распределения случайной величины критерием Фроцини при доверительной вероятности а = 0,95.
Вычисляем
Вп = -^= • (|0,047 - 0,05| + |0,05 - 0,15| ¦
vl0
, + |0,91-0,995|) = 0,3298.
Из табл. 110 находим Бп@,95) = 0,5723.
Так как Вп = 0,3298 < ??п@,95) = 0,5723, гипотеза равномерности распределения не
отклоняется.
332 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.4.10. Критерий Грмнвуда-Кэсенберри-Миллера
Ранее, при анализе критериев экспоненциальности, мы рассмотрели критерий
Гринвуда (см. раздел 3.3.20) [331] со статистикой
G = (п
С/о = 0,
В [339] показано, что при п —>> оо распределение (^-статистики медленно стре-
стремится к стандартному нормальному. Критические значения статистики Гринвуда
приведены в табл. 99 (в которой вместо п нужно использовать значения (п — 1)).
В [350] предложен более мощный критерий проверки равномерности распреде™
ления, основанный на статистике
Q =
г=1
Гипотеза равномерности отклоняется, если Q > Q(a), где Q{pt)—критическое
значение статистики на уровне значимости а, приведенное в табл. 111.
Таблица 111
Критические значения Q(ok)
статистики Гринвуда^Кэсенберри^Миллера
для проверки равномерности распределения [346]
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
"Уровень значимости а
0,01
0,932
0,831
0,727
0,642
0,573
0,512
0,463
0,423
0,378
0,351
0,318
0,298
0,279
0,259
0,245
0,230
0,218
0,206
0,196
0,187
0,178
0,169
0,163
0,156
0,148
0,144
0,138
0,134
0,130
0,125
0,05
0,859
0,736
0,635
0,551
0,483
0,429
0,387
0,350
0,319
0,294
0,272
0,253
0,237
0,222
0,209
0,197
0,187
0,177
0,168
0,162
0,154
0,147
0,141
0,136
0,131
0,126
0,121
0,117
0,114
0,110
0,10
0,811
0,691
0,586
0,505
0,442
0,393
0,355
0,322
0,294
0,272
0,251
0,234
0,220
0,206
0,195
0,184
0,174
0,166
0,158
0,151
0,144
0,138
0,133
0,128
0,123
0,119
0,114
0,111
0,107
0,104
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
55
60
65
70
75
80
85
90
95
100
"Уровень значимости а
0,01
0,120
0,116
0,112
0,110
0,107
0,103
0,100
0,097
0,095
0,092
0,090
0,088
0,086
0,084
0,082
0,080
0,078
0,077
0,075
0,068
0,062
0,057
0,052
0,048
0,045
0,042
0,040
0,038
0,036
0,05
0,106
0,103
0,100
0,097
0,095
0,092
0,089
0,087
0,085
0,083
0,081
0,079
0,077
0,075
0,074
0,072
0,070
0,069
0,068
0,061
0,056
0,052
0,048
0,045
0,042
0,039
0,037
0,035
0,033
0,10
0,101
0,097
0,095
0,092
0,090
0,087
0,085
0,083
0,081
0,079
0,077
0,075
0,073
0,072
0,070
0,069
0,067
0,066
0,065
0,059
0,054
0,050
0,046
0,043
0,040
0,038
0,036
0,034
0,032
3.4] Критерии согласия для равномерного распределения 333
Задача 158. Проверить гипотезу равномерности распределения случайной величины
для данных задачи 149 критерием Гринвуда-Кэсенберри-Миллера на уровне значимости
а = 0,05.
Вычисляем
п+1
^2(Ui - C/i-iJ = @,047 - ОJ + @,05 - 0,047J + ... + A - 0,91J = 0,127318;
= @,047 - 0) • @,05 - 0,047) + ... + @,91 - 0572) • A - 0,91) = 0,088259.
Тогда Q = 0,127318 + 0,088259 = 0,215577.
Из табл. 111 для а = 0,05 и п = 10 находим Q@, 05) = 0, 319.
Так как Q = 0,215 < Q@,05) = 0,319, гипотеза равномерности распределения не от-
отклоняется.
3.4.11. „Сглаженный44 критерий Неймана-Бартона
Высокую мощность против альтернатив экспоненциального типа имеет крите-
критерий равномерности, предложенный в [346]. Критерий, основанный на отношении
правдоподобия, строится следующим образом. Для ряда величин U\ ^ ... ^ Un
строим ряд
где iTj(Ui) — полиномы Лежандра, ортогональные на отрезке [0,1].
Первые четыре полинома равны
; п2(у) = V5Fy2 - 0,5);
тгз(у) = V7B0y3 - Зу2); тг4(у) = 3G0у4 - 15у2 + 0,375),
где у = U — 0,5.
Статистика Неймана^Бартона имеет вид
J=l
Дэвид [351] показал, что распределение Nk очень хорошо (уже при п ^ 20)
аппроксимируется %2™распределением с / = К степенями свободы.
Если Nk > Nk(cz)i гипотеза равномерности отклоняется на уровне значимо-
значимости а. Критические значения Nk(&) для К = 2,3,4 приведены в табл. 112. При
п > 20 гипотеза равномерности отклоняется, если N^ > Хк(а)^ гДе Хк(а) —
«^квантиль распределения хи™квадрат с / = К степенями свободы.
Задача 159. Проверить гипотезу равномерности распределения случайной величины
для данных задачи 149 критерием Неймана-Бартона на уровне значимости а = 0,05.
Для ряда
Un 0,047; 0,05; 0,15; 0,18; 0,29; 0,48; 0,52; 0,61; 0,72; 0,91
имеем ряд значений г/j = С/г — 0,5:
-0,453; -0,45; -0,35; -0,32; -0,21; -0,02; 0,02; 0,11; 0,22; 0,41.
334 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Таблица 112
Критические значения -2Ук(ск)
критерия равномерности Неймана^Бартона [352, 353]
п
Уровень значимости а,
0,01
0,05
0,10
п
Уровень значимости а
0,01
0,05
0,10
2
3
4
5
6
7
8
9
10
11
12
14
16
10,012
9,717
9,643
9,517
9,384
9,326
0,276
9,208
9,265
9,173
9,170
9,235
9,233
5,903
5,682
5,566
5,573
5,618
5,640
5,683
5,735
5,774
5,790
5,822
5,897
5,908
4,023
4,013
4,116
4,227
4,316
4,382
4,421
4,453
4,476
4,489
4,486
4,517
4,527
18
20
25
30
35
40
45
50
60
80
100
оо
9,235
9,234
9,230
9,230
9,226
9,230
9,221
9,223
9,294
9,218
9,220
9,219
5,918
5,925
5,937
5,947
5,962
5,958
5,961
5,964
5,969
5,974
5,979
5,991
4,536
4,542
4,554
4,562
4,568
4,573
4,576
4,579
4,584
4,589
4,592
4,605
N3
2
3
4
5
6
7
8
9
10
11
13,500
12,870
12,450
12,150
11,950
11,810
11,710
11,650
11,600
11,570
7,400
7,480
7,530
7,570
7,600
7,630
7,650
7,670
7,680
7,690
5,590
5,750
5,910
5,990
6,040
6,070
6,100
6,110
6,120
6,130
12
14
16
18
20
30
40
50
оо
11,560
11,520
11,510
11,500
11,500
11,490
11,490
11,480
11,350
7,700
7,720
7,730
7,730
7,740
7,750
7,760
7,760
7,810
6,130
6,140
6,140
6,140
6,150
6,160
6,170
6,180
6,250
2
3
4
5
6
7
8
9
10
16,140
15,800
15,430
15,120
14,860
14,650
14,470
14,320
14,090
9,520
9,510
9,500
9,490
9,480
9,470
9,470
9,460
9,450
7,190
7,340
7,460
7,530
7,570
7,600
7,620
7,630
7,650
12
14
16
18
20
30
40
50
оо
14,000
13,870
13,780
13,710
13,670
13,580
13,530
13,480
13,280
9,450
9,440
9,430
9,420
9,420
9,400
9,400
9,400
9,490
7,650
7,660
7,660
7,670
7,670
7,680
7,680
7,690
7,780
Вычисляем полиномы для j = 1:
tti(Z7i) = TTi @,047) = 2^3 • (-0,453) = -1,569238;
7n(C72) = -1,55884; тп(С7з) =-1,21243; 7п(С/4) =-1,1085;
7Ti(U5) = ^0,72746; 7п(С76)= ^0,062982; 7п(С/7) = ^0,069282;
тг(С78) = 0,381051; 7п(С/9) = 0,762102; 7n(E/iO) = 1,420282.
Далее по аналогии вычисляем остальные полиномы Hj(Ui). Результаты сведены в та-
таблицу:
3.4]
Критерии согласия для равномерного распределения
335
г
1
2
3
4
5
6
7
8
9
10
-1,569238
-1,558840
-1,212430
-1,108510
-0,727460
-0,069282
-0,069282
0,381051
0,762102
1,420282
1,635133
1,598789
0,525476
0,255806
-0,526370
-1,112667
-1,112667
-0,955695
-0,468680
1,137264
-1,323390
-1,250117
0,509307
0,806000
1,176777
0,158322
-0,158322
-0,802668
-1,182756
0,392680
0,129156
0,623810
-1,236190
-1,280990
-0,451090
0,225033
0,225033
0,611246
-0,561062
-0,505402
-3,751607 0,976389 -1,6741667 -2,220456
Далее вычисляем
]T
F3 =
7i) = -1,18636230; F2 =
= -0,529417995; F4 =
^Г
vlO i=1
= 0,308761312;
7r4(C/*) = -0,70216984;
2 3 4
N2 = J2 Vj2 = !5502789; N3 = J2 vf = 1,783072; JV4 = ^ F/ = 2,2761149.
3=1 3=1 3=1
Из табл. 112 для п = 10 и а = 0,05 находим
Ж2@,05) = 5,774, i?3@,05) = 7,68 и Ж4@,05) = 9,45.
Легко видеть, что N2 < N2{а), N3 < -/Уз(а) и N4 < ./?4@), что не противоречит гипотезе
равномерности распределения.
336 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.5. Критерии симметрии
Если отсутствуют предпосылки для проверки согласия эмпирического распре-
распределения с каким-либо теоретическим, то выявление даже самых общих свойств
эмпирического распределения дает некоторую информацию для выбора приемов
и методов обработки экспериментального материала.
Одним из таких практически важных свойств распределения является его сим-
симметричность относительно центра группирования значений случайной величины.
3.5.1. быстрым44 критерий Кенуя
Критерий применим для быстрой (но грубой) проверки симметричности в вы-
выборках объема п ^ 50 [121].
Статистика критерия стоится следующим образом. Выборочные значения упо-
упорядочиваются по возрастанию: х\ ^ Х2 ^ ... ^ хп, определяются порядковые ста-
п 1Ъп п
тистики с номерами —, —тг? 77? т-е- ЖГ^Ъ #/i5n\, Х(п\.
16 16 2 116/ \Tefj ^2^
По ним вычисляются мера асимметрии А = #/i5n\ —2x/n\Jrx/nm\ и статистика
критерия
3s
где s = — 1 х/15п\ — Х( п_\ I , или А = \/п-
3 V \~^J vieJ/
При п ^ 50 распределение статистики может быть аппроксимировано стандарт-
стандартным нормальным распределением. Тогда гипотеза симметрии отклоняется с до-
достоверностью а, если \А\ > ui+a, где и7 — 7™квантиль стандартного нормального
2
распределения.
Напомним две весьма точные аппроксимации для вычисления нормальных кван-
квантилей (см. раздел 1.1.1)
и7 = 2,0637[1пA - 7) ^ ОДб]0'4274 - 1,5774
с погрешностью менее 0,0008 и и7 = 4,91 7°'14 — A — 7) ' с погрешностью ме-
менее 0,3%.
Задача 160. В выборке объема п = 64 имеются порядковые статистики
ж/15п\ = ЖF0) = 127; х/п\ = ЖD) = 17; х/п\ = ХC2) = 44. Проверить гипотезу симмет-
V 16 J ^ 6 / \2 )
ричности распределения случайной величины критерием Кенуя при доверительной ве-
вероятности а = 0,95.
Находим
жF0) - жD)
Для а = 0,95 имеем (применяя аппроксимацию):
ui+a = uQ 975 = 2,0637 • [ln(l - 0,975)"х - 0,1б]°'4274 - 1,5774 = 1,96.
[ ]
2
Так как А = 4,07 > 1,96, гипотеза симметрии отклоняется.
3.5]
Критерии симметрии
337
3.5.2. Критерий симметрии Смирнова
Проверяется гипотеза Щ: F(a) = 1 — F{a), то есть гипотеза о том, что пред™
полагаемая функция распределения F(x) симметрична относительно центра а.
Для выборки a?i,#2, • • • ixn случайной величины х > 0 статистика Смирнова имеет
вид [354]
тп =
|
ж>0 '
где К^~ —число значений ж, попавших в интервал (а, а + ж); К~ —число значений ж,
попавших в интервал (а — ж, а).
Гипотеза симметричности распределения отклоняется с достоверностью а, если
тп ^ тп(а)ч гДе тп{а)—критическое значение статистики, при п ^ 50 равное [170]
rn[a) =
Задача 161. Имеется ряд выборочных данных
хц 1, 2, 3, 5, 9, 11, 18, 21, 29, 35.
Необходимо проверить гипотезу симметричности распределения случайной величи-
величины х относительно а = 10 критерием Смирнова при доверительной вероятности
а = 0,95.
Имеем для х\ = 1:
— в интервал A0,11) попало К+ = 1 значение;
— в интервал (9,10) попало К~~~ = 1 значение.
Следовательно, при х\ = 1 имеем К+ — К~ = 0.
По аналогии получаем данные, приведенные в таблице:
г
1
2
3
4
5
6
7
8
9
10
Xi
1
2
3
5
9
11
18
21
29
35
К+
1
1
1
1
2
3
3
4
5
5
К^
1
1
1
2
5
5
5
5
5
5
К+ - К^
0
0
0
-1
-3
^2
-2
-1
0
0
Тогда
2 \ 2
rnmax(i^+ - K~) = 3 и rn(o;)=(l0+-
= 3,266 • 1,96 = 6,40.
Так как тп = 3 < тп(а) = 6,40, распределение можно считать симметричным (напомним,
что критерий следует применять при п ^ 50, а настоящий пример следует рассматривать
как демонстрационный).
3.5.3. Знаковый критерий симметрии
Проверяется гипотеза о симметричности распределения относительно центра.
Статистиками критерия являются К+ — число положительных значений величин
yi = Xi — а, и К~ —число отрицательных значений этих величин.
338 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Гипотеза симметричности отклоняется, если
где К (а)—критическое значение, приведенное в табл. 113.
Таблица 113
Критические значения K(ot) критерия знаков
(а — уровень значимости) [12]
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
а
0,01
0
0
0
0
1
1
1
2
2
2
3
3
3
4
4
4
5
5
6
6
6
7
7
7
8
8
0,05
0
0
0
1
1
1
2
2
2
3
3
4
4
4
5
5
5
6
6
7
7
7
8
8
9
9
9
10
0,10
0
0
0
0
1
1
2
2
3
3
3
4
4
5
5
5
6
6
7
7
7
8
8
9
9
10
10
10
11
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
а
0,01
9
9
9
10
10
11
11
11
12
12
13
13
13
14
14
15
15
15
16
16
17
17
17
18
18
19
19
20
20
0,05
10
11
11
12
12
12
13
13
14
14
15
15
15
16
16
17
17
18
18
18
19
19
20
20
21
21
21
22
22
0,10
11
12
12
13
13
13
14
14
15
15
16
16
16
17
17
18
18
19
19
20
20
20
21
21
22
22
23
23
24
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
а
0,01
20
21
21
22
22
22
23
23
24
24
25
25
25
26
26
27
27
28
28
28
29
29
30
30
31
31
31
32
32
0,05
23
23
24
24
25
25
25
26
26
27
27
28
28
28
29
29
30
30
31
31
32
32
32
33
33
34
34
35
35
0,10
24
24
25
25
26
26
27
27
28
28
28
29
29
30
30
31
31
32
32
33
33
33
34
34
35
35
36
36
37
При п > 100 распределение К+ удовлетворительно аппроксимируется нормаль-
нормальным с М{К+) = | и D(K+) = j.
Простая формула для критических значений приведена в [12]: К (а) =
, где [х] —ближайшее целое число к х (с = 1,2879 для а = 0,01;
0,98 для а = 0,05 и 0,8224 для а = 0,10).
Случайная величина F = при справедливости нулевой гипотезы
п — К +1
симметричности имеет ^-распределение Фишера с / = 2(п — К+ + 1) и /2 = 2К+
степенями свободы.
3.5]
Критерии симметрии
339
Критерий прост в вычислительном отношении, но обладает невысокой мощно™
стью. Поэтому его рекомендуется использовать при п > 50 (п — половина объема
выборки).
Задача 162. В условиях задачи 161 проверить гипотезу симметричности распреде-
распределения относительно х = 10 критерием знаков на уровне значимости а = 0,05.
Имеем К+ = 5 и К~ = 5, min(K+, К~) = Ъ. Далее
К@,0Ь) = [^у^ ~~ 0,98 • л/Tlj = 1.
Так как imn(K+^K ) = 5 > Х@,05) = 1, гипотеза симметричности распределения не
отклоняется.
3.5.4. Одновыборочный критерий Вилкоксона
От ряда выборочных величин Х{ переходим к ряду величин у^ = Х{ — а, где
а — предполагаемый центр распределения. Значения у^ упорядочим по абсолют-
абсолютной величине: \yi\ ^ |г/2|
(
\Уп\- В полученном ряду каждому значению \yi\
припишем ранг (от 1 до п), равный его порядковому номеру в упорядоченной
последовательности.
Обозначим через Rf ранги случайных величин t/^, имеющих положительное
значение.
Статистика критерия Вилкоксона задается формулой [355]:
г=1
Гипотеза симметричности отклоняется, если Т+ > Т+(а), где Т+(а) —критическое
значение, приведенное в табл. 114.
Таблица 114
Критические значения Г~*"(а) одновыборочного
критерия Вилкоксона (адаптирована из [24])
п
3
4
5
6
7
8
9
10
11
Доверительная
вероятность а
0,90
6
8
12
17
21
27
33
40
47
0,95
6
9
14
18
23
29
36
43
51
0,99
6
10
15
20
27
34
41
49
58
п
12
13
14
15
16
17
18
19
20
Доверительная
вероятность а
0,90
55
64
73
82
93
103
115
127
139
0,95
60
69
78
89
99
111
123
136
149
0,99
67
77
88
100
111
124
137
151
166
При п > 20 распределение Т+ удовлетворительно аппроксимируется нормаль™
ным с параметрами
М(Т+) =
п(п + 1)
и D(T+) =
24
340 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
т. е. критические значения могут быть вычислены по формуле
п(п + '
Т+ (а) =
+
4 V 24
где [х] —ближайшее целое число к х.
Задача 163. Для данных задачи 161 проверить гипотезу симметричности распреде-
распределения относительно а = 10 критерием Вилкоксона при доверительной вероятности
а = 0,95.
Ряд
xf. 1, 2, 3, 5, 9, 11, 18, 21, 29, 35
преобразуем в ряд
yi = Xi-a: -9, -8, -7, -5, -1, 1, 8, 11, 19, 25.
Ранжированный ряд значений \yi\ имеет вид
1, 1, 5, 7, 8, 8, 9, 11, 19, 25,
для которого имеем последовательность рангов (для одинаковых значений используются
средние ранги):
1,5; 1,5; 3; 4; 5,5; 5,5; 7; 8; 9; 10.
Отмечая в ряду \yi\ значения yi > 0 (они выделены), приходим к последовательности
рангов
Rf: 1,5; 5,5; 8; 9; 10.
Тогда Т+ = J2 Rf = 1,5 + 5,5 + 8 + 9 + 10 = 34.
г=1
Так как Т+ = 34 < Т+(а) = 43, гипотеза симметричности не отклоняется.
Для нормального приближения (гхо,95 :=: 1,645) имеем
что совпадает с табличным результатом.
3.5.5. Критерий Антилла—Керетинга—Цуккини
Критерий, рассмотренный в [356], использует статистику, подобную статистике
Вилкоксона (см. раздел 3.5.4).
Пусть х — эмпирическая медиана ряда х\ ^ х^ ^ • • • ^ хп. Образуем ряд вели-
величин yi = \х{ — ж|, и пусть Ri—ранг величины yi в упорядоченном по возрастанию
ряду значений у^.
Обозначим
Тогда статистика критерия имеет вид
где с7 = mliif а, — 1 при 0 ^ а, 7 ^ «•
Гипотеза симметричности отклоняется, если Ti(j) ^ Ткр(А).
3.5] Критерии симметрии 341
При 7 = 0ип^7 статистика
распределена асимптотически нормально с и = 0 и дисперсией сг2= 0,03156 ехр( ),
V п/
где а = 5,66 для четных п и а = 9,75 для нечетных п. При j = - для Т( - 1 также
6 \6J
применима нормальная аппроксимация при п^7с дисперсией о = 0,01736 ехр I 1,
V п/
где а = 5,77 для четных в и а= 11,11 для нечетных п.
Таким образом, для рассмотренных статистик критические значения могут быть
вычислены по формулам (а — доверительная вероятность):
— для четных п
Гкр@) =0,1776513ехрf-^p) ua; Ткр(±) = 0,131757expf-^) ua;
— для нечетных п
Ткр@) = 0,177613ехр|—^— j U«; Ткр ( - 1 = 0,131757 expf—^— j wa,
где на — а™квантиль стандартного нормального распределения. Критерии этой
группы обладают большей мощностью, чем критерий Вилкоксона (см. раздел 5.4).
Задача 164. Для данных задачи 161 проверить гипотезу симметричности распреде-
распределения критериями Ti@) и Ti(l/6) Антилла-Керстинга-Цуккини при а = 0,95.
Для ряда
хп 1, 2, 3, 5, 9, 11, 18, 21, 29, 35
медиана равна х = = 10. Получаем ряд значений
yi = \Xi -x\ : 9, 8, 7, 4, 1, 1, 8, 11, 19, 25.
Ранжированному ряду
ун 1, 1, 4, 7, 8, 8, 9, 11, 19, 25
соответствует последовательность рангов
Rn 1,5; 1,5; 3; 4; 5,5; 5,5; 7; 8; 9; 10.
Поэтому последовательность рангов jRj, соответствующая последовательности г/$,
имеет вид
7; 5,5; 4; 3; 1,5; 1,5; 5,5; 8; 9; 10.
Для этой последовательности ряд sign(xi — х) будет иметь вид
-1, -1, -1, -1, -1, +1, +1, +1, +1, +1.
Вычисляем статистики критерия:
~ ?) = ^^ х
r^10) = ^'gmin[^IL]'Sign
х Imin (ттп' \)' {~1] + min (гтг' 0 •(-1) + • • •+min (Лт^) •хI =0Д868;
342 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Ti ( - | = —= • 2_, rnin ~~(—"—г 5 " sign ixi — х) -
\ / v ^=1 L v / J
Г / 7 l\ / 55 Л / 10 1\ 1
х min , - • (-1) + min —!—, ~~ • (-1) + ... + min , - ) • 1 = 0,11498.
L \2-11'3/ V ; \2-11'3/ V ; \2-11'3/ J
Для а = 0,95 имеем иа = 1,645, и критические значения статистик равны:
Ткр@) = 0,17765 • expf --^— J • 1,645 = 0,220;
/l\ /2 885\
Гкр [ - ) = 0,131757 • ехр ( - • 1,645 = 0,1624.
V6/ V 10 /
ТаккакГДО) = 0,1868 < Гкр@) = 0,220 и 1\ | - ] =0,115 <Гкр( - ) = 0,162, гипотеза
W V6/
симметричности распределения случайных величин не отклоняется.
3.5.6. Критерий Бхатачарья-Гаствирта-Райта
(модифицированный критерий Вилкоксона)
Критерий является обобщением критерия Вилкоксона (см. раздел 3.5.4) при
проверке гипотезы относительно неизвестного центра распределения [357].
Статистика критерия строится следующим образом. Пусть имеется выборка
xij • • • •,x2n+i и определены вероятности р и д = 1-р @<р<1). Обозначим вы™
борочные квантили Ж[п+1], Ж[пд+1] ж xy2n+i-nq] ix[C] — [/^Ья порядковая статистика
в упорядоченном по возрастанию ряду xf, [... ] — целая часть числа, содержащегося
в скобках).
В [357] предложены две статистики. Первая статистика является модификацией
критерия Вилкоксона (см. раздел 5.4) в форме, рассмотренной авторами рабо-
работы [358].
Обозначим
У{г) = X[nq+1]
1, и < 0;
0
и > 0.
Тогда статистика критерия записывается в форме
Статистика основана на сравнении -q-x верхней и нижней частей данных.
Вторая статистика построена в ранговой форме. Пусть
У {г) = хп+1 — xn+l-i] %{i) = Xn+i-i — Xn+i.
Объединим yf и z' в одну выборку, обозначим через R\^ ..., Rn и Дп+1, ..., i^2n
ранги у'-ов и z'-ов в объединенной выборке. Тогда статистика критерия записыва-
записывается в форме
Л [ п 2п 1
s = г{J2(Ri - 2пр)+ - J2 (Ri - 2пр)+ (' где х+ =
[ J
{J2 J2
Bn+lJ [i=l i=n+l
3.5]
Критерии симметрии
343
При п ^ 10 можно считать, что распределение статистик Т и S нормально со
средними М(Т) = ~~ и М(Я) = 0 и дисперсиями [357]:
^Для q = 0,25: D(T) = 1 и DE) = 0,006;
^Для g = 0,5: D(T) = 0,754 и DE) = 0,9394.
Случай q = 1 соответствует обычному критерию Вилкоксона с центром, оцени™
ваемым выборочной медианой. Критерии рассмотренного типа обладают большей
мощностью, чем критерий Вилкоксона.
Гипотеза симметричности распределения отклоняется с доверительной вероят™
ностью а, если:
— при q = 0,25
\Т\
— при q = 0,5
\Т\
Ткр = 0,5
Ткр =
\S\
\S\
SKp = 0,1985ц i+а,
где и7 — 7™квантиль стандартного нормального распределения.
Задача 165. Проверить гипотезу симметричности распределения критериями Т и S
Бхатачарья-Гаствирта-Райта при д = 0,5 и а = 0,95 для выборки данных
хц 1, 2, 3, 5, 9, 1, 18, 21, 29, 35, 45, 49, 51.
Имеем 2п + 1 = 13, п = 6и
] ^ X[ng+i^i] = Ж[6.0,5 + 1] — Ж
У (г) = X
Вычисляем
-i] = Х[4] ^
Н] -Х[щ.
Т =
1
F.0,5)^ ге^е
— Ж3 — Ж13
(Ж4 — Ж3 — Ж12
— Ж1 — Ж13
= ^ • {хE - 3 - 49 + 35) + хE - 3 - 51 + 35) + ... + хE - 1 - 51 + 35)} =
= I • Ы-12) + х(-14) + ... + х(-12)} = 1.
Тогда при ц 1+0,95 = ^0,975 = 1,96 имеем Ткр = 0,5 + 0,8683 • 1,96 = 2,20.
2
Так как Т = 1 < Ткр = 2,20, гипотеза симметричности распределения не отклоняется.
Рассмотрим теперь Я-критерий. Вычисления, необходимые для подсчета значения
критерия, приведены в таблице (п = б, жп+1 = xj = 18):
i
1
2
3
4
5
6
Xn+l-i
11
9
5
3
2
1
Жп+1+г
21
29
35
45
49
51
7
9
13
15
16
17
(*)
3
11
17
27
31
33
V'(z')
3A)
7B)
9C)
11D)
13E)
15F)
2
3
5
6
l
4
344 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Окончание
г
7
8
9
10
11
12
"@
y'[zf)
16G)
17(8,5)
17(8,5)
27A0)
31A1)
33A2)
7
8,5
8,5
10
11
12
Статистика критерия равна
s = з" * {тахB - 2 • 6 • 0,5; 0) + тахC - 2 • 6 • 0,5; 0) + ... + тахA2 - 6; 0)} =
B-6 + 1J
= 0,2133 • @ + 0 + ... + 2,5 - 0... - 6) = ^0,2982.
Далее имеем Якр = 0,1985 • 1,96 = 0,389. Так как \S\ = 0,298 < Якр = 0,389, гипотеза
симметричности не отклоняется.
3.5.7. Критерий Финча
Критерий рассмотрен в [359]. Основан на интервалах порядковых статистик,
обладает высокой чувствительностью к отклонению распределения от симметрич-
симметричности.
Для выборки х\ ^ Х2 ^ • • • ^ хп введем обозначения
где г = 1, ...,fc; fc = ^ .
L ?> J
Статистика критерия имеет вид V =
, где
; v = 2d2 + A - d2) (am2 + Ьт + =-
I v^ 2
С = > UJJ
V=l /
d = 0,278+^; a = 0,41 + ^f; m=l,47--; 6 = -2ma.
n n n
При п ^ 10 применима аппроксимация критических значений У-статистики
(а — доверительная вероятность)
где иа — «-квантиль стандартного нормального распределения.
Если
\V
то гипотеза симметричности распределения отклоняется с доверительной вероят-
вероятностью а.
3.5] Критерии симметрии 345
Задача 166. Для данных задачи 165 проверить гипотезу симметричности критерием
Финча при доверительной вероятности а = 0,95.
Имеем ряд
хц 1, 2, 3, 5, 9, 11, 21, 29, 35, 45, 49, 51 (п = 13).
Находим
d = 0,278 + — = 0,41646; т = 1,47 - — = 0,8546; а = 0,41 + ^4 = 0,54846;
13 ' ' 13 ' ' ' 132
6= ^2 -0,8546-0,54846 = ^0,93743; v = 3d2 +(l - d2) • (am2 + Ьт + - J = -11,774.
V з /
Далее вычисляем
*=1?|=б;
5+* 1 7 1
ujj = с • 2~2 т' oji = с • 0,16667; Ш2 = с • \J - = с- 0,5095;
Шз = с • 0,8845; ш4 = с • 1,32897; ш5 = с • 1,928968; ш6 = с • 3,01987.
Из равенства ^^ш2 = с2 - 15,6764 = 1 находим с = 0,252567.
Далее
*-J\ *^п — fc-f-1 *^7i — 1 — fc-f-1 i •^'fe-f-2 — 1
i о /iii — t»i о -i ^ i -i — o^/^ i ^ i -4- ner> i i -i nen — O.npi-r -4- т»^> OA — 9.18 -4- 1 1
— = 0,4.
жз — же 21 —
С учетом полученного значения с = 0,25256 имеем
ал = = 0,04209; uj2 = 0,12860; ш3 = 0,22339; ш4 = 0,33564;
6
Ш5 = 0,48718; ш6 = 0,762698.
Вычисляем статистику критерия
\V\ = |-11,774 • @,04209 • (-0,4) + 0128603 • 0,6 + ... + 0,762698 • 0,3333)| = 10,3058.
Далее находим критическое значение (г/о,95 :=: 1,645)
к
Укр —
0,5773- 1,645
= 34,4876.
Так как V = 10,3058 < FKp = 34,4876, гипотеза симметричности распределения не
отклоняется.
3.5.8. Критерий Бооса
Критерий рассмотрен в [360], позволяет проверить симметричность распределе™
ния относительно его центра, в качестве которого используется оценка Ходжеса™
Лемана
х =
n-(n+l) ЛТ „
т. е. медиана всех возмоясных попарных средних Уолша. Статистика
346 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
критерия имеет вид
В = п(
-1-
1 ^\
п
У.
xi +
Xi —
х3 - х
Xj
Для п ^ 10 критические точки В (а) приведены в табл. 115.
Таблица 115
Критические значения jB-критерия Бооса
(а — доверительная вероятность) [360]
а
В(а)
0,90
0,712
0,95
0,899
0,975
1,093
0,99
1,358
Если В > В (а), то гипотеза симметричности отклоняется. Критерий обладает
высокой эффективностью и менее чувствителен, чем другие, к выбросам на хвостах
распределения.
Задача 167. Для данных задачи 165 проверить гипотезу симметричности распреде-
распределения критерием Бооса при а = 0,95.
Имеем ряд
хц 1, 2, 3, 5, 9, 11, 18, 21, 29, 35, 45, 49, 51.
Сначала вычислим оценку Ходжеса-Лемана. Для нахождения медианы расположим
*г + Xj , , _ п(п + 1) _ 13 • 14
= 91) в ряд по возрастанию и найдем
все значения (их будет
2 2 2
медиану х = жп+1 = Ж91+1 = Ж46 = 20 (т.е. 46™ю порядковую статистику).
2 2
Дальнейшие вычисления сведены в таблицу, в которой приняты обозначения
г. 4- т ¦ 9^ • -гIе*. —
i
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
j
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
40
38
37
35
31
29
22
19
11
5
5
9
11
40
37
36
34
30
28
-**
xij
1
2
4
8
10
17
20
28
34
44
48
50
1
3
7
9
г
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
э
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
21
18
10
4
5
10
12
37
36
35
33
29
27
20
17
9
3
7
11
*?;
i6
19
27
33
43
47
49
2
6
8
15
18
26
323
42
46
i
3
4
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
5
5
3
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
13
35
34
33
31
27
25
18
15
7
1
9
13
15
31
30
29
27
23
58
4
6
13
16
24
30
40
44
46
3.5]
Критерии симметрии
347
г
5
5
5
5
5
5
5
5
6
6
6
6
6
6
6
6
6
6
6
6
6
7
7
7
7
7
7
7
7
7
7
7
7
7
8
8
8
8
3
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
21
14
11
3
3
13
17
19
29
28
27
25
21
19
12
9
1
5
15
19
21
22
21
20
18
14
12
5
2
6
12
22
26
28
19
18
17
15
ж*/
2
9
12
20
26
36
40
42
7
10
10
24
34
38
40
3
11
17
27
31
33
г
8
8
8
8
8
8
8
8
8
9
9
9
9
9
9
9
9
9
9
9
9
9
10
10
10
10
10
10
10
10
10
10
10
10
10
11
11
11
3
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
11
9
2
1
9
15
15
29
31
11
10
9
7
3
1
6
9
17
23
33
37
39
5
4
3
1
3
5
12
15
23
29
39
43
45
5
5
7
-**
xij
8
14
24
28
30
33
20
22
10
43
16
г
11
11
11
11
11
11
11
11
11
11
12
12
12
12
12
12
12
12
12
12
12
12
12
13
13
13
13
13
13
13
13
13
13
13
13
13
Оконч
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
1
2
3
4
5
6
7
8
9
10
11
12
13
xij
9
13
15
22
15
33
39
49
53
55
9
10
11
13
17
19
26
29
37
43
53
57
59
11
12
13
15
19
21
28
31
39
45
55
59
61
ание
*?;
4
6
2
Суммируя столбцы таблицы, получаем
п п
Ч +Х4 - 2х\ = 3532 и
= 1688.
г=1 г=1
Окончательно вычисляем
г<3
Из табл. 15 для а = 0,95 находим Б@,95) = 0,899.
Так как В = 0,6007 < 5@,95) = 0,899, гипотеза симметричности распределения не
отклоняется.
348 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.5.9. Критерий Гупты
Критерий рассмотрен в [314, 361] и обладает достаточной мощностью против
обширного класса альтернатив.
Последовательность процедур вычисления критерия включает в себя следующие
шаги. Для выборки объема х\ ^ ... ^ хп находим медиану
п = 1,3, ...,2k- 1;
2
-(хп +Хп,Л , п = 2,4, ... ,2k.
2\ 2 2+У
Вводим переменную
{1, если Х{ + Xj > 2х;
О, если Х{ + Xj ^ 2х
и находим
1 \nz2\ Гтг]
2 J[2J'
где [у] —наибольшее целое, меньшее или равное у.
Далее вычисляем
2
п(п + 1)
Вводим переменную
{/ _i\ / _i\
1, еСЛИ [X ^ П 5 ) ^ ж^ ^ I ж + п 5 ) ;
V / V /
Находим
{
О, если неравенство не выполняется.
= тах< 1,2^ а» > ; A3=[2n5)D; t =
{ i=l J
где uy — |/~квантиль стандартного нормального распределения; Ах — симметрич-
симметричный двусторонний доверительный интервал для х.
Построение симметричного двустороннего доверительного интервала для х с до™
верительной вероятностью A — а) включает следующие шаги. Находим величину
24
k(a) =
где [... ] — ближайшее целое к числу в скобках.
Далее составляем N = величин z\j = ^~™—-(г < j) и ранясируем их по
возрастанию.
Искомый интервал равен
Ах = цщ — цп, где k = JV + 1 — Aj(q) 5 I '=- k(ct).
Графический метод определения величины Ах изложен в [362].
3.5]
Критерии симметрии
349
Продолжая алгоритм вычисления критерия Гупты, находим
2
Если \J\ ^ гА-|__а, то гипотеза симметричности отклоняется с доверительной веро-
вероятностью 1 — а.
Задача 168. Для выборки
Xii 1, 2, 3, 5, 9, 11, 18, 21, 29, 35
проверить гипотезу симметричности распределения критерием Гупты при довери-
доверительной вероятности 0,90.
9+11
тт / \ ~ Ж5+Ж6 9+11
Находим оценку медианы (п — четное): х = = = 10.
Для вычисления А\ составим таблицу величин Sij при различных сочетаниях г и j:
3
2
3
4
5
6
7
8
9
10
г
1
0
0
0
0
0
0
1
1
1
2
0
0
0
0
0
1
1
1
3
0
0
0
1
1
1
1
4
0
0
1
1
1
1
5
0
1
1
1
1
6
1
1
1
1
7
1
1
1
8
1
1
9
1
Находим А\ = 28 (число единиц в таблице) и Аъ =
Далее вычисляем
2
10-2
10
4- 5
= 10.
B8 - 10) = 0,4; х - п^ 5 = 10 - 10" 5 = 9,369; х + п^ \ = 10,631.
Имеем аг = а2 = ... = а10 = 0; D = тах{1,0} = 1; А3 = 2 • 105 . 1 = 12,619.
Из условия задачи 1 — а = 0,90 (а = 0,10), следовательно, и а = г^о,о5 = —1,645.
п(п + 1) 10-11
=
Найдем ЛГ =
представлены в таблице.
Имеем ряд (равные ранги усредняются):
= 55 значении полусумм Zij =
(г < j), которые
г
1
1
1
1
1
1
1
1
1
1
3
1
2
3
4
5
6
7
8
9
10
1
1,5
2
3
5
6
9,5
11
15
18
Ранг
1
2
3,5
6,5
10,5
13,5
20
24,5
33,5
39,5
ъ
2
2
2
2
2
2
2
2
2
3
j
2
3
4
5
6
7
8
9
10
3
Zij
2
2,5
3,5
5,5
5,5
10
11,5
15,5
13,5
3
Ранг
3,5
5
8
12
12
21,5
26,5
35
30,5
6,5
i
3
3
3
3
3
3
3
4
4
4
j
4
5
6
7
8
9
10
4
5
6
Zij
4
6
7
10,5
12
16
19
5
7
8
Ранг
9
13,5
16,5
23
28
36,5
41,5
10,5
16,5
18
350 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
ъ
4
4
4
4
5
5
5
5
5
j
7
8
9
10
5
6
7
8
9
11,5
13
17
19,5
9
10
13,5
15
19
Ранг
26,5
29
38
43,5
19
21,5
30,5
33,5
40,5
ъ
5
6
6
6
6
6
7
7
7
j
10
6
7
8
9
10
7
8
9
22
11
14,5
16
20
23
18
19,5
23,5
Ранг
47
24,5
32
36,5
45
48,5
39,5
43,5
50
г
7
8
8
8
9
9
10
3
10
8
9
10
9
10
10
Окон
zij
26,5
21
25
23
29
32
35
чание
Ранг
52
46
51
48,5
53
54
55
Находим к (а) =
10-11 /10-11-21
(-1,645) = 11.
2 V 24
Следовательно,
k = N + l- к(а) = 55 + 1 - 11 = 45; 1 = к (а) = 11; Ах = z45
Далее вычисляем
t =
«0,95
Ах-л/^Ы 15-
12 4 \ 12,619/
= 20 - 5 = 15.
=0,3317;
J = ( — ) 2 • (c - 0,25) = f^H) 2 . (o,4 - 0,25) = 0,823.
\nj \ 10 )
Так как J = 0,823 < ^0,95 = 1,645, гипотеза симметричности распределения не откло-
отклоняется.
3.5.10. Критерий Фрезера
Пусть ап(г) = M(xi) — математическое ожидание модуля г-й порядковой ста-
статистики в выборке объема п из стандартного нормального распределения. По
аналогии с критерием знаков (см. раздел 5.3), от переменной Х{ переходим к пере-
переменной yi = Х{ — а (а — предполагаемый центр распределения). Упорядочиваем
(
по абсолютной величине: \у\\ ^ |t/2
Уп\- Пусть Щ —ранг в этом ряду поло-
поло\\ || \\
жительных значений у^ = Х{ — а > 0. Фрезер [363, 364] предложил для проверки
симметричности распределения случайных величин статистику
г=1
Для практических расчетов применима следующая аппроксимация с помощью
квантилей стандартного нормального распределения:
где Pi = \\ ^^ + 1
Напомним ранее приведенные аппроксимации (см. раздел 5.1)
Г _i 10,4247
иа. = 2,0637 ln(l - cti) -0,16 -1,5774
(oti > 0,5; при оц < 0,5 следует вместо oti использовать 1 — щ и поменять знак у uai);
Л П1 Г 0,14 (Л \0,14l
а. =4,91 \а^ -A -аг) J .
3.5] Критерии симметрии 351
При п ^ 10 распределение 5 может быть аппроксимировано нормальным рас™
пределением [365] со средним МEГ) и дисперсией D(S), где
МE) = ^= = 0,399n; DE) = ± ? К№)]2 = | Е
Следовательно, случайная величина ' будет иметь стандартное нор™
0,5 WE ul
мальное распределение. Поэтому критическое значение Я™статистики равно
S(a) = 0,399 • п + 0,5 • Jv^. • иа.
П г———
Если Y1 и% ^ 0,399п + 0,5л/г^.г/а, то с доверительной вероятностью а гипотеза
г=1 V г
симметричности распределения отклоняется.
Задача 169. Для данных задачи 168 проверить гипотезу симметрии распределения
критерием Фрезера при а = 0,95 относительно медианы^ равной 10.
Имеем ряд
»,. — ™. _ ™. _ о. _я. _7« — ^« —1* 1- 7- 11- 1Q- 9^
Строим ранжированный ряд
Ы = \xi -x\: 1; 1; 5; 7; 7; 8; 9; 11; 19; 25.
Ему соответствует последовательность рангов
1,5; 1,5; 3; 4,5; 4,5; 6; 7; 8; 9; 10.
Легко убедиться, что значения yi = х% —- х > 0 (это 1, 7, 11, 19 и 25) имеют в общем
ряду ранги i^i = 1,5; 4,5; 8; 9; 10. Рангам Ri соответствует ряд значений:
A-i-^'J-H^^)-0-""*
А " 3 ¦ (^ + >) " ¦"»>* А " 3 ¦ (^5 +') " °'871Ж;
1 /9-Q.375 Л 1 /ш-ода \
М 2 \ 10,25 ) 2 \ 10,25 /
Соответствующие им квантили г!,/з,; равны
ti^ = 4,91 • [/3i'14 -A - /3iH'14] = 4,91 • [0,55488ОД4 -A - 0,55488H'14] = 0,13738;
и(з2 = 0,52597; щ3 = 1,13446; щА = 1,4104; и^ = 1,87673.
Вычисляем
S = Y, и^ = 5,08494; ]Г и}. = 7,09386.
i i
Для а = 0,95 и 1?q,95 = 1,645 имеем
5@,95) = 8,399 • 10 + 0,5 • G,09386) 2 . 1,645 = 6,1807.
Так как S = 5,085 < 5@,95) = 6,18, гипотеза симметричности распределения совокуп™
ности случайных величин не отклоняется.
352 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3.6. Подбор кривых распределения вероятностей
по экспериментальным данным
Часто инженер или исследователь не имеет достаточных оснований для выбора
того или иного закона распределения вероятностей. Его попытка использовать
критерии нормальности, экспоненциальности или равномерности распределения
случайных величин потерпели неудачу. Что же ему делать? Очевидно, смириться
с тем, что он не сможет применить хорошо известные математические модели для
описания своих экспериментальных данных, и попытаться найти все-таки модель,
которой отвечают его результаты.
Другими словами, ему необходимо подобрать по экспериментальным данным
распределение, которое удовлетворительно описывало бы имеющийся эксперимен™
тальный материал.
3.6.1. Кривые распределения Джонсона
Джонсон [366] предложил для аппроксимации эмпирических распределений
использовать кривые, получающиеся с помощью преобразований плотности нор™
мального распределения.
Пусть х — случайная величина, для которой подбирается распределение Джон™
сона. В общем случае преобразование Джонсона имеет вид
z = 7 + vf(x^ е > А) ? V > 0? ^°° < 7 < °°7 А > 0, ^оо < ? < оо,
где 75 Vi е и А— параметры распределения Джонсона; /(...) —произвольная функ-
функция; z — случайная величина, имеющая стандартное нормальное распределение.
Джонсон [13] предложил три формы функционального преобразования:
/2 (х; е, А) = In I ) , е ^ х ^ е + А;
(х-
/з(ж; е, А) = Arsh —-— ) , ^оо < х < оо.
V л
Им соответствуют семейства кривых 5^, 5^ и Sjj Джонсона.
Подбор кривых распределения Джонсона по экспериментальным данным про-
проводится в два этапа. Сначала определяется, какое из трех семейств распределений
приемлемо. Затем находятся оценки параметров выбранного семейства распреде™
лений (Sl, Sb или Sjj).
Чтобы решить, какое распределение из трех семейств распределения Джонсона
следует использовать для описания полученных экспериментальных данных, вы-
вычисляем эмпирические оценки третьего («з) и четвертого («4) моментов
-I П 1 П -1 П
1 \-^ / -\3 л х \™^ / -\4 2 1 \™^ / -\2
|^Д^ ^ ______ ^^ I ^|^ ^ ^д^ I f^C, ^J. _______ 4^ i ^Д^, ^ ^Д^ la X ^/..Д^У^ C ______ 1? I ^Д^ ^ ^Д^, I ^
ns . -, ns . ., n — I
г==1 г=1 г=1
Далее рекомендуется следующая приближенная процедура выбора типа распре-
распределения:
если «4 > 3(l + 0,641а3) —выбирается семейство Su]
если «4 ~ 3A + 0,641а3) —выбирается семейство Sl]
если «4 < 3(l + 0,641а3) —выбирается семейство Sb-
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 353
При «4 < 1
кривые Джонсона неприменимы. Более точный метод выбора
вида распределения Джонсона по значениям «з -> «4 и коэффициента вариации v = —
s
приведен в [367]. Обширный анализ вопросов, связанных с семейством распределе-
распределений Джонсона, содержится в [368].
3.6.1.1. Семейство распределений Sl Джонсона
Плотность распределения Джонсона семейства S
имеет вид
где г] > 0; ^оо < j = 7 — ^1пЛ < оо; ^оо < е < 77; ™оо < 7 < °°; А > 0 — параметры
распределения и х ^ е.
Распределение, соответствующее кривой /i(x), является логарифмически нор-
нормальным (см. раздел 1.1.3) с параметрами ?]=^,7 = и параметром положе-
ния ?, определяющим начало координат.
Рассмотрим два случая: значение е известно (положим е = 0) и значение па-
параметра неизвестно. В первом случае переходим от переменной х к переменной
™ . . 1 ^ ш
ж = ж — е. 1огда оценки параметров г] ж j имеют вид п=- И7= , где
S S
т = —
п ¦
п(п — 1)
111 Xj —
' In Xj
г=1
Если значение е неизвестно, то оценки параметров находятся по формулам
1,645'
r)= 1,645 In
7 =
1 — ехр —
Т]
Х[0,5п] — ж[0,05п]
? = ,
ехР
где Ж[^] —порядковая статистика эмпирического распределения с номером /3.
Рекомендуется сначала найти квантили распределения случайной величины In x
с помощью таблиц (или формул) стандартного нормального распределения, а затем
потенцированием перейти к квантилям исходной случайной величины х.
Задача 170. В результате испытаний п = 100 изделий получены следующие значения
случайной переменной х (параметра изделия):
1,0
2,0
2,5
3,0
3,5
4,2
4,6
4,9
5,1
5,2
5,3
5,3
5,5
5,6
5,8
6,0
6,3
6,5
6,6
6,7
6,8
7,0
7,0
7 1
7,5
7,5
7,9
7,9
8,0
8,1
8,1
8,3
8,7
8,7
8,8
8,8
8,9
9,0
9,2
9,4
9,6
9,7
9,8
9,9
10,1
10,2
10,2
10,2
10,8
10,9
10,9
11,0
11,0
11,2
11,3
11,5
11,9
11,9
12,0
12,3
12,4
12,5
12,7
12,7
13,5
13,9
14,0
14,1
14,2
14,3
14,4
14,5
15,3
15,9
16,0
16,5
17,0
17,5
18,0
21,2
5,0 6,1
8,4 9,5 10,5 11,7 13,0 14,8 22,3
5,0 6,1 7,3 8,5 9,5 10,6 11,8 13,2 15,2 26,1
12 А. И. Кобзарь
354 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Необходимо выяснить возможность аппроксимации распределения переменной х кри-
кривой из семейства Джонсона и оценить параметры этого распределения. Вычислить
вероятность того, что параметр изделия х ^ 15. Найти значение параметра изделия^
вероятность превышения которого не более 0,05.
Сначала вычислим необходимые исходные данные s2, аз и «4-
Имеем
х = 9,971; s2 =
«3 =
i ~ ХТ = 19,075; S = 4,36749;
i-x) =4,18945.
Находим, что «4 = 4,189 w3*(l + 0,641 • а2.) :=: 4,143. Поэтому для описания получен-
полученных данных применимо семейство Sl Джонсона. Вычисляем параметры распределения
т = —
п
= 2,1915; s =
п(п — 1)
= 0,0505798.
В нашем случае порядковые статистики равны:
Х[0,95-п] = ж0,95 = 17,0; Ж[о,О5-п] = %5 = 3,5; Ж[о,5-п] = х50 = 9,5.
Далее
'17-9,5'
= 1,645- In
9,5-3,5
= 7,3719;
7 = 7,3719 • In
1 - ехр 1 -
7,3719 /
9,5 -3,5
= -25,0732; е = 9,5 - ехр
^jf)
1 = -20,5.
Таким образом, плотность распределения случайной величины может быть описана
функцией
7,3719 ' * г "" п"пп l2
2тг • (ж + 20,5)
-- • 7,37192 • I - ^^ + Ы(х + 20,5)
2 7,3719 v ;
= 2,941 • (ж + 20,5)м1 • ехр{-29,172 • [-3,401 + \п(х + 20,5)]2} .
Случайная величина z = 7 + ^ • 1П(Ж ~ е) имеет стандартное нормальное распределе-
распределение, что позволяет выразить квантили и% распределения случайной величины х через
квантили иа стандартного нормального распределения
[1 / Л]
иа = ехр \- • ^а - 7 П + е.
Этим соотношением можно воспользоваться для ответа на дальнейшие вопросы, постав-
поставленные в задаче. Найдем сначала вероятность того, что х ^ 15. Задача сводится к следу-
следующему— по заданной квантили и^ найти иа и вычислить вероятность, соответствующую
этой квантили. Имеем
15 = ехр [—^ • («о + 25,0732I - 20,5.
Отсюда иа = 1,241, и искомая величина а ищется из условия a = F(ua), где F{y) —
функция стандартного нормального распределения.
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 355
Для вычисления F(y) воспользуемся аппроксимацией (см. раздел 1.1.1)
2,34 ^
g g is a i i " \ i i /1 \
F{y) = 1 - 0,852 •
2,0637 J
и получим
f /l 241 + 1 5774\2'34]
а = F(ua) = 1 - 0,852 • exp<^ - ^ ^ } = 0,893.
1 J ' I \ 2,0637 J J
Следовательно, вероятность того, что ж ^ 15, равна 0,893.
Вторая задача — вычисление значения и^, для которого Р(х > и^) = 0,05, эквива-
эквивалентна поиску квантили и% при а = 1 — 0,05 = 0,95. Имеем г&о,95 = 1,645 и
иха = ехр —-— • A,645 + 25,0732) - 20,5 = 17.
Следовательно, вероятность того, что х ^ 17, не более 0,05.
3.6.1.2. Семейство распределений Sb Джонсона
Уравнение для плотности распределения кривых этого семейства имеет вид
}
где у] > 0, ^оо < 7 < оо, Л > 0, ^оо < е < оо — параметры распределения.
Случайная величина ж, имеющая распределение из семейства Sb Джонсона,
ограничена пределами еие + А.
Возможны три случая:
— оба предела е и е + Л известны (например, если случайной величиной является
доля дефектнвгх изделий в партии, заключенная, очевидно, между 0 и 1);
— известен один предел (например, если х — долговечность изделия, то е = 0);
— оба предела неизвестны.
Если оба предела известны (известны параметры е и Л), то оценки параметров
?7 и 7 находятся по формулам [13, 366]
где иа — а-квантиль стандартного нормального распределения; ха — эмпири™
ческая квантиль ([а(п + 1)]-й упорядоченный по возрастанию член выборки
Х1 ^ Х2 ^ • • • ^ хп)-
Рекомендуется выбирать а' = а, а," = 1-аи уровень а = 0,05.
Квантили аппроксимирующего распределения и^ могут быть выражены через
квантили стандартного нормального распределения иа следующим образом:
<=
1 .
1 + ехр
Если известно только одно крайнее значение ?, то в дополнение к оценкам 7 и
12*
356 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
необходимо найти оценку Л по формуле
с /~ ч (х — е)(ха — е) + (ж — ?){х\-а — s) — 2(жа — e(xi^a — e))
(х - еJ - (ха - ?){xi-ot - e)
где х — выборочная медиана ряда.
Параметры г] и 7 находятся по формулам для случая, когда оба предела извест-
известны (вместо параметра Л используется его эмпирическая оценка Л). Если пределы е
и е + Л неизвестны, то для нахождения оценок параметров необходимо решить
численными методами систему четырех нелинейных уравнений
i = 1'2'3'4'
где uai и xai — «-квантили соответствующих величин.
Однако такая ситуация практически очень редка и здесь не рассматривается.
Задача 171. Наблюдение за временем изготовления п = 50 изделий позволило полу-
получить следующие данные (мин):
0,70 0,93 1,09 1,21 1,41
0,72 0,95 1,10 1,23 1,46
0,75 0,95 1,10 1,23 1,54
0,81 0,96 1,11 1,25 1,55
0,83 0,98 1,12 1,29 1,61
0,84 0,98 1,13 1,32 1,61
0,87 1,02 1,14 1,34 1,62
0,89 1,04 1,15 1,37 1,62
0,90 1,06 1,16 1,38 1,63
0,91 1,08 1,17 1,40 1,63
Необходимо установить возможность аппроксимации распределения времени изготов-
изготовления изделий кривой из семейства Sb Джонсона. Найти параметры распределения^
вычислить вероятность того^ что искомая величина будет находиться в интервале
0,92 ^ х ^ 1,28.
Вычисляем
ж = 1,1628; / = 0,07086; s = 0,26620; ]Г(ж^ - жK = 0,257706; J2(Xi - жL = 0,51103;
г=1 г=1
аз = ~\ • Y(xi - xf = 0,273231; а4 = ^ • Vfc - жL = 2,03551.
Имеем «4 = 2,03551 < 3 • (l + 0,641 • a§) = 3,143, что соответствует области семей-
семейства Sb- В нашем случае по смыслу задачи е = 0 и необходимо найти оценки парамет-
параметров ?], 7 и А. Выбирая а = 0,05, имеем г?о,95 = 1,645 и tto,os = ~ 1,645. Далее находим ста-
статистики с порядковыми номерами [0,05 • 51] = 2 (жг = 0,72); [A — а) • (п +1)] = [0,95 • 51] = 48
( 1,62).
1 1 12 + 1 13
Медиана выборки равна ж = - • (ж25 + Ж2в) = — '— = 1,125.
Тогда для е = 0 находим
А = 1,125 • М25-0,72+ 1,126-1,62-2-0,72-1,62 =
1Д252 - 0,72- 1,62
П
0,72- C,398- 1,62)
= 2,695; -у = 1,645 - 2,695 • Inf lfi2 ) = 1,896.
Г ' \ 3.398-1,62/
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 357
Таким образом, плотность аппроксимирующего распределения есть
/(ж) = ^р^ • ехр\ -- • 11,896 + 2,695 • In
2 I ' ' \ 3,398 -x
3,653
expi- 1,341+ 1,906-In
x -C,398™ x) I L \3,ЗЭ8-ж
Квантиль распределения и^ равна
тг • ехр
fj J _ 3,398 • ехр@,371 • иа - 0,703)
. _^ L t I + ехр@,371 • иа - 0,703)
Вероятность того, что 0,92 ^С х ^ 1,28, равна по определению
Р@,92 ^ х ^ 1,28) = Р(ж ^ 1,28) - Р(ж ^ 0,92).
Задача сводится к тому, чтобы найти вероятности C' = Р(ж ^ 1,28) и /3/; = Р(ж ^ 0,92),
соответствующие квантилям u^i = 1,28 и tto77°'92-
Алгоритм решения этой задачи включает в себя следующие этапы:
— по заданным и^, и u^f, находятся соответствующие им значения upi и гх^//;
— по найденным значениям и^ и и$п вычисляются значения функции стандартного
нормального распределения F(up/) и F(upf/);
— вычисляется искомая вероятность р = /3f -— C".
Теперь, пользуясь аппроксимацией для F(y) (см. предыдущую задачу), вычисляем
},) = F@,5374) = 1 - 0,852 ¦ exp^^^^tJ^^! = 0,704;
= 1 - 0,852 . ехр j^ ^П^^^Х = 0,236.
Окончательно получаем р = J3' - /3ff = 0,704 - 0,236 = 0,468.
Следовательно, вероятность того, что 0,92 ^ х ^ 2,28, равна 0,468.
3.6.1.3. Семейство распределений Sjj Дж:онсона
Уравнение кривых распределения семейства Sjj Дхсонсона имеет вид
I / I Г/ x2lf|\2>
/(Х)= "
Случайная величина, имеющая распределение S\j Джонсона, теоретически
неограничена, и в общем случае все четвхре параметра ^^ ц^ \ ж е неизвестны
и должны быть оценены по выборке. Для оценки параметров rj и j следует исполь™
зовать табл. 116, в которой аз и «4 — соответственно третий и четвертый моменты
распределения вероятностей.
Затем вычисляются оценки
/u[l) где и = ехр -^
358 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Оценки параметров
Таблица 116
и г/ распределения Su Джонсона [369]
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6,0
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,0
8,2
8,4
8,6
8,8
9,0
«3
0,
^7
0,3479
0,2328
0,1760
0,1421
0,1196
0,1035
0,0914
0,0820
0,0745
0,0684
0,0633
0,0589
0,0552
0,0519
0,0491
0,0466
0,0444
0,0424
0,0406
0,0390
0,0374
0,0361
0,0348
0,0337
0,0326
0,0316
0,0307
0,0298
0,0290
0,0283
0,0276
0,0269
0,0263
0,0257
0,0251
0,0246
0,0241
0,0236
0,0232
0,0277
0,0223
0,0219
0,0215
0,0212
0,0208
0,0205
0,0202
0,0198
0,0195
0,0195
0,0190
0,0185
0,0180
0,0175
0,0171
05
Г]
4,671
3,886
3,396
3,081
2,852
2,676
2,535
2,420
2,324
2,242
2,171
2,109
2,054
2,005
1,961
1,921
1,885
1,852
1,822
1,793
1,767
1,743
1,721
1,699
1,680
1,661
1,643
1,627
1,611
1,596
1,582
1,568
1,556
1,543
1,532
1,520
1,510
1,499
1,490
1,480
1,471
1,462
1,454
1,445
1,438
1,430
1,415
1,415
1,408
1,408
1,395
1,383
1,371
1,360
1,349
0,
^7
0,7373
0,4834
0,3620
0,2905
0,2435
0,2102
0,1853
0,1661
0,1507
0,1381
0,1276
0,1188
0,1112
0,1046
0,0989
0,0938
0,0893
0,0852
0,0816
0,0783
0,0752
0,0725
0,0700
0,0676
0,0655
0,0635
0,0616
0,0599
0,0583
0,0568
0,0553
0,0540
0,0527
0,0515
0,0504
0,0493
0,0483
0,0473
0,0464
0,0455
0,0447
0,0439
0,0431
0,0424
0,0417
0,0410
0,0404
0,0398
0,0392
0,0392
0,0380
0,0370
0,0360
0,0351
0,0342
10
V
4,787
3,927
3,435
3,108
2,872
2,692
2,548
2,431
2,333
2,250
2,178
2,115
2,060
2,010
1,966
1,925
1,889
1,855
1,825
1,796
1,770
1,746
1,723
1,702
1,682
1,663
1,645
1,628
1,613
1,598
1,583
1,570
1,557
1,545
1,533
1,522
1,511
1,501
1,491
1,481
1,472
1,463
1,455
1,446
1,438
1,431
1,423
1,416
1,409
1,409
1,396
1,383
1,372
1,361
1,350
0,
^7
1,2280
0,7747
0,5699
0,4528
0,3776
0,3238
0,2845
0,2542
0,2302
0,2106
0,1943
0,1806
0,1689
0,1588
0,1499
0,1421
0,1352
0,1290
0,1234
0,1184
0,1138
0,1096
0,1057
0,1022
0,0989
0,0958
0,0930
0,0904
0,0879
0,0856
0,0835
0,0814
0,0795
0,0777
0,0760
0,0743
0,0728
0,0713
0,0699
0,0686
0,0673
0,0661
0,0650
0,0639
0,0628
0,0618
0,0608
0,0599
0,0590
0,0590
0,0572
0,0557
0,0542
0,0528
0,0515
15
V
5,004
4,036
3,503
3,156
2,908
2,719
2,571
2,450
2,349
2,264
2,190
2,126
2,069
2,018
1,973
1,932
1,895
1,861
1,830
1,801
1,775
1,750
1,727
1,705
1,685
1,666
1,648
1,631
1,615
1,606
1,586
1,572
1,559
1,555
1,554
1,524
1,513
1,502
1,492
1,448
1,474
1,465
1,456
1,448
1,440
1,432
1,425
1,418
1,411
1,411
1,397
1,385
1,373
1,362
1,351
0,
^7
1,9490
1,1430
0,8166
0,6384
0,5260
0,4487
0,3921
0,3490
0,3150
0,2875
0,2647
0,2456
0,2294
0,2153
0,2031
0,1923
0,1828
0,1743
0,1666
0,1597
0,1534
0,1477
0,1424
0,1376
0,1331
0,1290
0,1251
0,1215
0,1182
0,1151
0,1121
0,1094
0,1067
0,1043
0,1020
0,0998
0,0977
0,0957
0,0938
0,0920
0,0903
0,0887
0,0871
0,0856
0,0842
0,0828
0,0815
0,0802
0,0790
0,0790
0,0767
0,0745
0,0725
0,0707
0,0689
20
7]
5,369
4,208
3,607
3,227
2,960
2,760
2,604
2,477
2,372
2,283
2,207
2,141
2,082
2,030
1,984
1,942
1,904
1,869
1,837
1,808
1,781
1,756
1,732
1,711
1,690
1,671
1,653
1,636
1,619
1,604
1,590
1,576
1,563
1,550
1,538
1,527
1,516
1,505
1,495
1,485
1,476
1,467
1,458
1,450
1,442
1,434
1,427
1,419
1,412
1,412
1,399
1,386
1,374
1,363
1,352
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 359
Продолжение таблицы 116
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7Д
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
«3
0,
-7
3,1890
1,6560
1,1330
0,8620
0,6997
0,5907
0,5125
0,4536
0,4076
0,3707
0,3404
0,3151
0,2937
0,2752
0,2592
0,2451
0,2327
0,2216
0,2117
0,2027
0,1946
0,1872
0,1804
0,1742
0,1684
0,1631
0,1582
0,1536
0,1493
0,1415
0,1380
0,1347
0,1315
0,1286
0,1258
0,1231
0,1206
0,1182
0,1159
0,1137
0,1116
0,1096
0,1077
0,1059
0,1042
0,1025
0,1009
0,0993
25
Г]
5,992
4,469
3,759
3,328
3,033
2,816
2,648
2,513
2,402
2,309
2,229
2,160
2,100
2,046
1,998
1,955
1,916
1,880
1,847
1,817
1,790
1,764
1,740
1,718
1,697
1,677
1,658
1,641
1,625
1,594
1,580
1,567
1,554
1,542
1,530
1,519
1,509
1,498
1,489
1,479
1,470
1,461
1,453
1,445
1,437
1,429
1,422
1,415
0,
^7
6,3890
2,4770
1,5690
1,1480
0,9115
0,7586
0,6515
0,5723
0,5113
0,4629
0,4234
0,3907
0,3632
0,3396
0,3192
0,3014
0,2857
0,2717
0,2592
0,2480
0,2378
0,2285
0,2201
0,2183
0,2052
0,1986
0,1925
0,1868
0,1815
0,1719
0,1676
0,1635
0,1596
0,1560
0,1525
0,1492
0,1461
0,1432
0,1404
0,1377
0,1352
0,1327
0,1304
0,1282
0,1260
0,1240
0,1220
0,1201
30
Г]
7,204
4,875
3,979
3,467
3,132
2,890
2,707
2,561
2,442
2,343
2,258
2,186
2,122
2,066
2,016
1,971
1,930
1,893
1,860
1,829
1,800
1,774
1,749
1,726
1,705
1,685
1,666
1,648
1,631
1,600
1,586
1,572
1,559
1,547
1,535
1,524
1,513
1,502
1,492
1,483
1,474
1,465
1,456
1,448
1,440
1,432
1,425
1,418
0,
-7
2,2360
1,5460
1,1870
0,9681
0,8197
0,7127
0,6304
0,5673
0,5165
0,4747
0,4397
0,4100
0,3844
0,3622
0,3426
0,3354
0,3099
0,2961
0,2836
0,2723
0,2620
0,2525
0,2438
0,2358
0,2284
0,2215
0,2151
0,2035
0,1983
0,1933
0,1887
0,1843
0,1802
0,1762
0,1726
0,1690
0,1656
0,1624
0,1594
0,1565
0,1537
0,1510
0,1485
0,1460
0,1437
0,1414
35
7]
4,300
3,663
3,266
2,989
2,783
2,623
2,492
2,385
2,295
2,217
2,150
2,090
2,038
1,991
1,948
1,910
1,875
1,843
1,813
1,786
1,760
1,737
1,715
1,694
1,674
1,656
1,639
1,607
1,593
1,579
1,565
1,553
1,541
1,529
1,518
1,507
1,497
1,487
1,478
1,465
1,456
1,448
1,440
1,432
1,425
1,418
0,40
^7
3,4840
2,1460
1,5650
1,2380
1,0280
0,8814
0,7733
0,6902
0,6243
0,5708
0,5265
0,4891
0,4564
0,4288
0,4048
0,3836
0,3648
0,3479
0,3328
0,3191
0,3066
0,2952
0,2848
0,2752
0,2663
0,2581
0,2504
0,2366
0,2304
0,2245
0,2190
0,2138
0,2089
0,2043
0,1999
0,1957
0,1918
0,1880
0,1844
0,1810
0,1777
0,1746
0,1716
0,1687
0,1660
0,1633
4,813
3,943
3,448
3,120
2,882
2,701
2,557
2,439
2,340
2,256
2,184
2,121
2,065
2,015
1,970
1,930
1,893
1,859
1,829
1,800
1,774
1,749
1,773
1,705
1,685
1,666
1,648
1,615
1,600
1,586
1,573
1,560
1,547
1,535
1,524
1,513
1,503
1,493
1,483
1,474
1,465
1,457
1,448
1,440
1,433
1,425
360 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6,0
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,2
8,4
8,6
8,8
9,0
9,2
9,4
Продолжение табл]
яц ы 116
«3
0,45
-7
2,1390
1,6140
1,3020
1,0950
0,9470
0,8363
0,7503
0,6814
0,6251
0,5780
0,5382
0,5040
0,4744
0,4484
0,4254
0,4050
0,3866
0,3696
0,3547
0,3411
0,3286
0,3172
0,3066
0,2967
0,2879
0,2794
0,2716
0,2643
0,2574
0,2509
0,2448
0,2391
0,2337
0,2285
0,2237
0,2190
0,2147
0,2105
0,2065
0,2020
0,1991
0,1956
0,1922
0,1891
0,1860
0,1802
0,1749
0,1699
0,1653
0,1610
0,1570
0,1532
f]
3,705
3,295
3,011
2,801
2,637
2,505
2,396
2,304
2,226
2,157
2,097
2,044
1,997
1,954
1,915
1,880
1,847
1,817
1,789
1,764
1,740
1,718
1,697
1,677
1,659
1,642
1,625
1,610
1,595
1,581
1,568
1,555
1,543
1,531
1,520
1,509
1,499
1,489
1,480
1,471
1,462
1,454
1,445
1,438
1,430
1,416
1,402
1,389
1,377
1,366
1,355
1,345
0,
-7
3,1570
2,1880
1,6870
1,3780
1,1690
1,0180
0,9031
0,8132
0,7407
0,6811
0,6311
0,5886
0,5520
0,5202
0,4922
0,4674
0,4453
0,4255
0,4076
0,3913
0,3765
0,3629
0,3504
0,3385
0,3278
0,3180
0,3088
0,3002
0,2921
0,2846
0,2775
0,2709
0,2646
0,2586
0,2530
0,2476
0,2426
0,2377
0,2331
0,2287
0,2246
0,2206
0,2167
0,2131
0,2095
0,2029
0,1968
0,1912
0,1859
0,1810
0,1764
0,1721
50
Г]
4,087
3,540
3,184
2,931
2,739
2,588
2,465
2,363
2,276
2,202
2,140
2,079
2,028
1,982
1,941
1,903
1,869
1,837
1,808
1,781
1,756
1,733
1,711
1,691
1,672
1,653
1,636
1,620
1,605
1,591
1,577
1,564
1,551
1,539
1,528
1,517
1,506
1,496
1,487
1,477
1,468
1,460
1,451
1,443
1,436
1,421
1,407
1,394
1,381
1,370
1,359
1,348
0
~7
2,2840
1,7830
1,4690
1,2530
1,0960
0,9748
0,8802
0,8033
0,7399
0,6865
0,6410
0,6017
0,5675
0,5274
0,5106
0,4868
0,4653
0,4459
0,4283
0,4122
0,3975
0,3840
0,3714
0,3598
0,3491
0,3390
0,3297
0,3209
0,3123
0,3046
0,2973
0,2904
0,2839
0,2778
0,2719
0,2664
0,2611
0,2561
0,2513
0,2467
0,2423
0,2381
0,2341
0,2266
0,2196
0,2132
0,2072
0,2016
0,1914
0,1905
55
V
3,424
3,105
2,872
2,694
2,552
2,436
2,338
2,255
2,136
2,120
2,065
2,015
1,971
1,931
1,894
1,860
1,830
1,801
1,775
1,750
1,728
1,706
1,686
1,6667
1,649
1,633
1,617
1,602
1,587
1,574
1,561
1,548
1,537
1,525
1,514
1,504
1,494
1,487
1,475
1,466
1,458
1,450
1,442
1,426
1,412
1,399
1,386
1,374
1,363
1,353
0,
-7
3,3830
2,4260
1,9060
1,5770
1,3490
1,1820
1,0540
0,9527
0,9183
0,8024
0,7451
0,6962
0,6539
0,6170
0,5845
0,5556
0,5298
0,5066
0,4856
0,4665
0,4491
0,4331
0,4184
0,4049
0,3923
0,3806
0,3697
0,3595
0,3500
0,3410
0,3326
0,3247
0,3172
0,3101
0,3034
0,2967
0,2907
0,2849
0,2795
0,2742
0,2692
0,2645
0,2599
0,2514
0,2435
0,2362
0,2294
0,2231
0,2172
0,2117
60
7]
3,776
3,346
3,049
2,830
2,662
2,526
2,414
2,320
2,240
2,170
2,109
2,055
2,007
1,963
1,924
1,888
1,855
1,824
1,796
1,770
1,746
1,691
1,673
1,653
1,664
1,647
1,630
1,614
1,599
1,585
1,572
1,559
1,547
1,453
1,524
1,513
1,503
1,493
1,483
1,447
1,465
1,457
1,448
1,433
1,418
1,405
1,392
1,380
1,368
1,357
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 361
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6,0
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,1
8,2
8,3
8,4
8,5
8,6
8,7
8,8
8,9
9,0
9,2
9,4
9,6
9,8
10,0
0,65
^7
2,6210
2,0600
1,7050
1,4600
1,2800
1,1420
1,0330
0,9434
0,8699
0,8083
0,7550
0,7092
0,6693
0,6341
0,6028
0,5749
0,5498
0,5270
0,5063
0,4875
0,4701
0,4542
0,4395
0,4258
0,4131
0,4013
0,3903
0,3799
0,3702
0,3611
0,3524
0,3443
0,3366
0,3293
0,3224
0,3159
0,3096
0,3037
0,2980
0,2926
0,2871
0,2822
0,2724
0,2729
0,2685
0,2643
0,2603
0,2564
0,2526
0,2490
0,2455
0,2389
0,2328
п
3,294
3,013
2,804
2,641
2,510
2,401
2,309
2,231
2,162
2,100
2,049
2,001
1,958
1,919
1,884
1,851
1,821
1,794
1,768
1,744
1,722
1,701
1,681
1,663
1,645
1,629
1,613
1,598
1,584
1,571
1,558
1,546
1,.534
1,523
1,512
1,502
1,492
1,483
1,473
1,469
1,456
1,448
1,440
1,432
1,425
1,418
1,411
1,404
1,398
1,391
1,385
1,373
1,362
0,70
^7
4,1040
2,8860
2,2540
1,8600
1,5890
1,3920
1,2400
1,1210
1,0240
0,9436
0,8761
0,8154
0,7687
0,7252
0,6869
0,6530
0,6226
0,5953
0,5706
0,5482
0,5276
0,5088
0,4915
0,4755
0,4607
0,4470
0,4341
0,4221
0,4109
0,4004
0,3905
0,3812
0,3723
0,3640
0,3561
0,3486
0,3415
0,3347
0,3283
0,3221
0,3163
0,3106
0,3053
0,3001
0,2952
0,2904
0,2859
0,2812
0,2770
0,2730
0,2691
0,2617
0,2548
0,2483
0,2422
0,2365
7]
3,659
3,269
2,996
2,791
2,631
2,502
2,395
2,304
2,226
2,159
2,099
2,045
1,999
1,957
1,918
1,883
1,850
1,820
1,793
1,767
1,743
1,721
1,700
1,681
1,662
1,645
1,628
1,613
1,598
1,584
1,571
1,558
1,546
1,534
1,523
1,512
1,502
1,492
1,483
1,474
1,465
1,456
1,448
1,440
1,433
1,425
1,418
1,411
1,404
1,398
1,392
1,379
1,368
1,357
1,347
1,337
Продолжение таблицы 116
«3
0,75
^7
1,5220
1,3530
1,2210
1,1140
1,0250
0,9509
0,8877
0,8331
0,7586
0,7419
0,7067
0,6735
0,6337
0,6168
0,5924
0,5700
0,5496
0,5308
0,5134
0,4973
0,4824
0,4684
0,4554
0,4433
0,4318
0,4211
0,4110
0,4014
0,3924
0,3838
0,3757
0,3680
0,3607
0,3537
0,3470
0,3407
0,3346
0,3288
0,3232
0,3179
0,3127
0,3078
0,3031
0,2985
0,2941
0,2858
0,2778
0,2706
0,2639
0,2575
п
2,503
2,395
2,305
2,227
2,160
2,100
2,048
2,000
1,958
1,918
1,884
1,851
1,821
1,794
1,777
1,744
1,722
1,701
1,682
1,663
1,646
1,629
1,614
1,599
1,585
1,572
1,559
1,547
1,535
1,524
1,523
1,503
1,493
1,483
1,474
1,466
1,457
1,448
1,441
1,433
1,426
1,419
1,412
1,405
1,399
1,386
1,374
1,363
1,353
1,343
0,
^7
1,9310
1,6760
1,4850
1,3360
1,2150
1,1170
1,0340
0,9642
0,9039
0,8515
0,8055
0,7647
0,7284
0,6942
0,6663
0,6396
0,6152
0,5929
0,5724
0,5535
0,5359
0,5197
0,5045
0,4904
0,4772
0,4648
0,4531
0,4421
0,4318
0,4220
0,4127
0,4039
0,3956
0,3876
0,3800
0,3729
0,3660
0,3594
0,3531
0,3471
0,3413
0,3358
0,3305
0,3253
0,3204
0,3111
0,3025
0,2944
0,2868
0,2798
80
п
2,641
2,511
2,403
2,312
2,234
2,165
2,105
2,052
2,005
1,962
1,923
1,887
1,855
1,824
1,797
1,771
1,747
1,725
1,704
1,684
1,666
1,648
1,632
1,616
1,601
1,587
1,573
1,561
1,548
1,537
1,525
1,515
1,504
1,494
1,485
1,476
1,467
1,458
1,450
1,442
1,435
1,427
1,420
1,413
1,406
1,393
1,381
1,370
1,359
1,349
362 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6,0
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,1
8,2
8,3
8,4
8,5
8,6
8,7
8,8
8,9
9,0
9,2
9,4
9,6
9,8
10,0
Продолжение табл]
яц ы 116
0,
-7
2,6020
2,1670
1,8640
1,6410
1,4690
1,3330
1,2210
1,1280
1,0500
0,9826
0,9243
0,8732
0,8282
0,7881
0,7521
0,7197
0,6904
0,6637
0,6392
0,6150
0,5962
0,5770
0,5592
0,5247
0,5273
0,5130
0,4995
0,4868
0,4749
0,4636
0,4530
0,4429
0,4334
0,4244
0,4158
0,4076
0,3998
0,3923
0,3852
0,3784
0,3719
0,3657
0,3597
0,3539
0,3484
0,3380
0,3283
0,3193
0,3109
0,3030
35
7]
2,828
2,662
2,529
2,418
2,325
2,245
2,176
2,115
2,061
2,012
1,969
1,929
1,893
1,860
1,830
1,802
1,776
1,752
1,729
1,707
1,688
1,668
1,652
1,635
1,619
1,604
1,590
1,576
1,563
1,551
1,539
1,528
1,517
1,507
1,497
1,487
1,478
1,469
1,460
1,452
1,444
1,437
1,429
1,422
1,415
1,401
1,389
1,377
1,366
1,355
0,
~7
4,0290
3,0380
2,4730
2,1000
1,8320
1,6290
1,4700
1,3420
1,2360
1,1470
1,0710
1,0060
0,9485
0,8982
0,8536
0,8138
0,7780
0,7456
0,7161
0,6892
0,6646
0,6419
0,6209
0,5961
0,5835
0,5666
0,5509
0,5362
0,5224
0,5094
0,4972
0,4857
0,4747
0,4644
0,4546
0,4452
0,4364
0,4279
0,4199
0,4122
0,4048
0,3978
0,3910
0,3845
0,3783
0,3666
0,3558
0,3457
0,3363
0,3275
90
V
3,093
2,868
2,694
2,555
2,441
2,344
2,262
2,191
2,128
2,073
2,023
1,979
1,939
1,902
1,868
1,837
1,809
1,782
1,758
1,735
1,713
1,693
1,678
1,656
1,639
1,623
1,608
1,594
1,580
1,567
1,555
1,543
1,531
1,520
1,510
1,500
1,490
1,481
1,472
1,463
1,455
1,447
1,439
1,431
1,424
1,410
1,397
1,385
1,373
1,362
0,
~7
2,4070
2,0710
1,8250
1,6350
1,4840
1,3610
1,2590
1,1720
1,0980
1,0330
1,9765
0,9265
0,8620
0,8420
0,8060
0,7733
0,7436
0,7164
0,6914
0,6683
0,6470
0,6272
0,6087
0,5915
0,5754
0,5593
0,5463
0,5328
0,5203
0,5084
0,4971
0,4864
0,4763
0,4667
0,4575
0,4488
0,4405
0,4325
0,4248
0,4175
0,4105
0,3974
0,3852
0,3839
0,3634
0,3537
Э5
V
2,592
2,472
2,371
2,285
2,211
2,146
2,089
2,038
1,992
1,951
1,913
1,879
1,847
1,818
1,791
1,766
1,742
1,721
1,700
1,681
1,653
1,645
1,629
1,614
1,599
1,585
1,572
1,559
1,547
1,536
1,524
1,514
1,504
1,494
1,484
1,475
1,467
1,458
1,450
1,442
1,434
1,420
1,406
1,394
1,381
1,370
-7
3,5380
2,8320
2,3860
2,0720
1,8390
1,6570
1,5100
1,3900
1,2890
1,2030
1,1290
1,0650
1,0080
0,9581
0,9132
0,8729
0,8364
0,8033
0,7730
0,7453
0,7198
0,6962
0,6744
0,6541
0,6352
0,6171
0,6010
0,5855
0,5709
0,5571
0,5442
0,5309
0,5203
0,5092
0,4987
0,4888
0,4793
0,4702
0,4616
0,4533
0,4454
0,4305
0,4169
0,4042
0,3925
0,3816
30
Ч]
2,799
2,641
2,512
2,406
2,315
2,237
2,170
2,110
2,057
2,009
1,967
1,928
1,892
1,860
1,830
1,802
1,776
1,752
1,730
1,708
1,689
1,670
1,653
1,636
1,620
1,605
1,591
1,578
1,565
1,552
1,541
1,529
1,519
1,508
1,498
1,489
1,479
1,471
1,462
1,454
1,446
1,431
1,416
1,403
1,390
1,379
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 363
«4
5,4
5,5
5,6
5,7
5,8
5,9
6,0
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,1
8,2
8,3
8,4
8,5
8,6
8,7
8,8
8,9
9,0
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
10,0
10,2
10,4
10,6
10,8
11,0
11,2
11,4
Продолжение табл
ицы 116
1,
^7
2,4030
2,0990
1,8710
1,6920
1,5470
1,4280
1,3270
1,2410
1,1670
1,1020
1,0440
0,9933
0,9477
0,9066
0,8694
0,8356
0,8046
0,7762
0,7500
0,7258
0,7034
0,6825
0,6630
0,6448
0,6278
0,6117
0,5967
0,5825
0,5960
0,5563
0,5443
0,5328
0,5220
0,5099
0,5018
0,4924
0,4834
0,4748
0,4666
0,4587
0,4511
0,4439
0,4369
0,4302
0,4237
0,4175
0,4115
0,4001
0,3895
0,3796
0,3703
0,3615
0,3533
0,3455
05
V
2,450
2,353
2,270
2,299
2,136
2,080
2,031
1,986
1,945
1,908
1,875
1,843
1,815
1,788
1,763
1,740
1,719
1,698
1,679
1,661
1,644
1,628
1,613
1,598
1,584
1,571
1,559
1,547
1,535
1,524
1,514
1,504
1,494
1,484
1,475
1,467
1,458
1,450
1,442
1,435
1,427
1,420
1,413
1,407
1,400
1,394
1,388
1,376
1,365
1,355
1,345
1,335
1,326
1,318
1,
^7
2,5430
2,4780
2,4500
2,1490
1,9210
1,7410
1,5970
1,4750
1,3730
1,2850
1,2100
1,1430
1,0850
1,0320
0,9857
0,9435
0,9053
0,8705
0,8386
0,8093
0,7823
0,7573
0,7342
0,7126
0,6924
0,6736
0,6559
0,6393
0,6237
0,6089
0,5950
0,5818
0,5693
0,5574
0,5461
0,5354
0,5251
0,5154
0,5060
0,4971
0,4885
0,4803
0,4724
0,4648
0,4576
0,4506
0,4438
0,4311
0,4192
0,4082
0,3978
0,3881
0,3789
0,3703
10
7]
2,632
2,505
2,400
2,311
2,234
2,168
2,109
2,056
2,009
1,966
1,928
1,893
1,860
1,830
1,803
1,777
1,753
1,731
1,710
1,690
1,671
1,654
1,637
1,622
1,607
1,593
1,579
1,566
1,554
1,542
1,531
1,520
1,510
1,500
1,490
1,481
1,472
1,463
1,455
1,447
1,440
1,432
1,425
1,418
1,411
1,404
1,398
1,386
1,374
1,363
1,353
1,343
1,334
1,325
1,
^7
2,5350
2,2240
1,9900
1,8050
1,6560
1,5310
1,4270
1,3370
1,2590
1,1900
1,1300
1,0760
1,0280
1,9840
0,9444
0,9083
0,8753
0,8450
0,8179
0,7910
0,7670
0,7445
0,7326
0,7040
0,6857
0,6684
0,6521
0,6368
0,6223
0,6085
0,5955
0,5831
0,5714
0,5601
0,5494
0,5393
0,5295
0,5202
0,5112
0,5027
0,4945
0,4866
0,4790
0,4646
0,4513
0,4389
0,4273
0,4165
0,4063
0,3698
15
п
2,362
2,278
2,206
2,143
2,087
2,037
1,992
1,951
1,914
1,880
1,849
1,820
1,793
1,768
1,745
1,723
1,703
1,683
1,665
1,648
1,632
1,616
1,602
1,558
1,575
1,562
1,550
1,538
1,527
1,517
1,507
1,497
1,487
1,478
1,469
1,461
1,453
1,445
1,437
1,430
1,423
1,416
1,409
1,396
1,384
1,373
1,362
1,352
1,342
1,332
1,
^7
3,8860
3,1240
2,6540
2,3250
2,0790
1,8850
1,7290
1,5990
1,4900
1,3960
1,3150
1,2430
1,1800
1,1240
1,0740
1,0280
0,9871
0,9495
0,9151
0,8834
0,8542
0,8272
0,8020
0,7786
0,7568
0,7464
0,7172
0,6991
0,6822
0,6661
0,6510
0,6366
0,6230
0,6101
0,5978
0,5861
0,5749
0,5642
0,5540
0,5443
0,5349
0,5260
0,5174
0,5012
0,4862
0,4723
0,4593
0,4472
0,4358
0,4252
20
п
2,530
2,423
2,331
2,253
2,184
1,124
2,070
2,022
1,978
1,.939
1,903
1,870
1,840
1,811
1,785
1,761
1,738
1,717
1,697
1,678
1,660
1,644
1,628
1,613
1,598
1,585
1,571
1,559
1,547
1,536
1,525
1,514
1,504
1,495
1,485
1,476
1,468
1,459
1,451
1,443
1,436
1,428
1,421
1,408
1,395
1,383
1,372
1,361
1,351
1,341
364 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Продолжение таблицы 116
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7,0
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,1
8,2
8,3
8,4
8,5
8,6
8,7
8,8
8,9
9,0
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
10,0
10,2
10,4
10,6
10,8
11,0
11,2
11,4
11,6
11,8
12,0
1,25
^7
2,8230
2,4590
2,1920
1,9840
1,8170
1,6790
1,5630
1,4640
1,3790
1,3030
1,2370
1,1780
1,1250
1,0770
1,0340
0,9945
0,9584
0,9251
0,8945
0,8661
0,8397
0,8152
0,7923
0,7709
0,7507
0,7318
0,7140
0,6972
0,6813
0,6663
0,6520
0,6385
0,6256
0,6133
0,6016
0,5904
0,5797
0,5695
0,5597
0,5413
0,5243
0,5086
0,4940
0,4804
0,4678
0,4559
Г]
2,309
2,234
2,168
2,109
2,057
2,011
1,969
1,930
1,895
1,863
1,833
1,806
1,780
1,756
1,734
1,713
1,693
1,675
1,657
1,640
1,625
1,610
1,596
1,582
1,569
1,557
1,545
1,534
1,523
1,513
1,503
1,493
1,484
1,475
1,466
1,458
1,450
1,442
1,435
1,420
1,407
1,394
1,382
1,371
1,360
1,350
1,
^7
5,1110
3,7120
3,0540
2,6350
2,3350
2,1060
1,9240
1,7750
1,6500
1,5440
1,4520
1,3720
1,3010
1,2380
1,1820
1,1320
1,0860
1,0440
1,0060
0,9706
0,9382
0,9083
0,8805
0,8546
0,8304
0,8078
0,7866
0,7667
0,7480
0,7303
0,7136
0,6977
0,6827
0,6685
0,6549
0,6420
0,6297
0,6180
0,6067
0,5857
0,5664
0,5485
0,5320
0,5167
0,5025
0,4891
30
V
2,476
2,378
2,294
2,221
2,156
2,100
2,049
2,003
1,962
1,924
1,890
1,858
1,829
1,802
1,776
1,753
1,731
1,710
1,691
1,672
1,655
1,639
1,623
1,608
1,594
1,581
1,568
1,556
1,544
1,533
1,522
1,512
1,502
1,492
1,483
1,474
1,466
1,458
1,450
1,434
1,420
1,407
1,394
1,382
1,371
1,360
1,35
^7
2,5250
2,2590
2,0550
1,8900
1,7520
1,6360
1,5370
1,4500
1,3740
1,3080
1,2460
1,1920
1,1430
1,0990
1,0580
1,0200
0,9860
0,9542
0,9246
0,8972
0,8716
0,8477
0,8252
0,8042
0,7843
0,7656
0,7480
0,7312
0,7154
0,7003
0,6860
0,6724
0,6594
0,6352
0,6131
0,5927
0,5739
0,5566
0,5404
0,5254
Г]
2,151
2,094
2,044
1,999
1,958
1,921
1,887
1,856
1,827
1,800
1,775
1,751
1,730
1,709
1,690
1,671
1,654
1,638
1,623
1,608
1,594
1,580
1,568
1,566
1,440
1,533
1,522
1,512
1,502
1,492
1,474
1,466
1,456
1,450
1,435
1,420
1,407
1,394
1,383
1,371
1,
^7
3,9290
3,2130
2,7680
2,4550
2,2170
2,0290
1,8750
1,7460
1,6360
1,5400
1,4570
1,3840
1,3190
1,2600
1,2070
1,1590
1,1150
1,0750
1,0380
1,0040
0,9729
0,9436
0,9136
0,8908
0,8669
0,8445
0,8234
0,8036
0,7848
0,7671
0,7503
0,7343
0,7192
0,6910
0,6654
0,6420
0,6205
0,6007
0,5823
0,5653
0,5495
0,5347
0,5209
40
7]
2,281
2,210
2,148
2,093
2,043
1,998
1,958
1,921
1,887
1,856
1,827
1,800
1,775
1,752
1,730
1,709
1,690
1,672
1,655
1,639
1,623
1,608
1,594
1,581
1,568
1,556
1,545
1,534
1,523
1,513
1,503
1,493
1,484
1,467
1,450
1,435
1,421
1,408
1,395
1,383
1,372
1,361
1,351
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 365
Продолжение таблицы 116
7,4
7,5
7,6
7,7
7,8
7,9
8,0
8,1
8,2
8,3
8,4
8,5
8,6
8,7
8,8
8,9
9,0
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
10,0
10,2
10,4
10,6
10,8
11,0
11,2
11,4
11,6
11,8
12,0
12,2
12,4
12,6
12,8
13,0
1,45
-7
2,4300
2,2020
2,0240
1,8770
1,7520
1,646
1,5540
1,4730
1,4010
1,3370
1,2790
1,2270
1,1800
1,1360
1,0960
1,0600
1,0260
0,9943
0,9651
0,9377
0,9122
0,8882
0,8657
0,8445
0,8245
0,8056
0,7877
0,7546
0,7247
0,6975
0,6727
0,6499
0,6289
0,6095
0,5915
0,5748
0,5592
Г)
2,046
2,001
1,960
1,923
1,889
1,858
1,829
1,802
1,777
1,754
1,732
1,711
1,692
1,674
1,657
1,640
1,625
1,610
1,596
1,583
1,570
1,558
1,546
1,535
1,524
1,514
1,504
1,485
1,468
1,452
1,437
1,422
1,409
1,396
1,.384
1,373
1,365
1,50
^7
3,6690
3,0880
2,7050
2,4260
2,2110
2,0370
1,8930
1,7720
1,6670
1,5760
1,4960
1,4250
1,3610
1,3040
1,2520
2,2040
1,1610
1,1210
1,0840
1,0500
1,0190
0,9892
0,9616
0,9359
0,9117
0,8889
0,8675
0,8280
0,7927
0,7608
0,7318
0,7053
0,6811
0,6588
0,6383
0,6192
0,6016
V
2,157
2,102
2,051
2,006
1,965
1,928
1,894
1,862
1,833
1,806
1,781
1,758
1,736
1,715
1,695
1,677
1,660
1,643
1,628
1,613
1,599
1,586
1,573
1,560
1,549
1,538
1,527
1,506
1,488
1,470
1,454
1,439
1,424
1,411
1,398
1,386
1,375
1,
^7
2,4590
2,2400
2,0670
1,9240
1,8030
1,6980
1,6070
1,5270
1,4560
1,3920
1,3340
1,2820
1,2340
1,1900
1,1500
1,1120
1,0780
1,0460
1,0160
0,9881
0,9619
0,9142
0,8718
0,8338
0,7996
0,7686
0,7403
0,7145
0,6907
0,6688
0,6486
0,6297
0,6122
0,5959
0,5806
0,5662
55
п
1,974
1,936
1,901
1,869
1,840
1,812
1,787
1,763
1,741
1,720
1,700
1,682
1,664
1,648
1,632
1,617
1,603
1,589
1,576
1,564
1,552
1,530
1,509
1,491
1,473
1,456
1,441
1,427
1,413
1,400
1,388
1,377
1,366
1,356
1,346
1,337
1,
-7
3,8130
3,1920
2,7950
2,5100
2,2910
2,1150
1,9690
1,8460
1,7400
1,6470
1,5660
1,4930
1,4280
1,3700
1,3160
1,2680
1,2230
1,1820
1,1440
1,1090
1,0760
1,0170
0,9655
0,9196
0,8785
0,8416
0,8083
0,7780
0,7503
0,7248
0,7014
0,6798
0,6598
0,6411
0,6237
0,6074
60
Г]
2,074
2,028
1,985
1,947
1,911
1,879
1,849
1,821
1,795
1,771
1,748
1,727
1,707
1,688
1,670
1,653
1,637
1,622
1,608
1,594
1,581
1,557
1,534
1,513
1,494
1,476
1,460
1,444
1,430
1,416
1,403
1,391
1,379
1,369
1,358
1,348
Напомним, что
Z ,
e +е
shz =
Квантили и^ эмпирического семейства Sjj выражаются через квантили иа стан™
дартного нормального распределения с помощью формулы
иха = е + Л sh (
иа - 7
V V
366 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
8,6
8,7
8,8
8,9
9,0
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
10,0
10,2
10,4
10,6
10,8
11,0
11,2
11,4
11,6
11,8
12,0
12,2
12,4
12,6
12,8
13,0
13,2
13,4
13,6
13,8
14,0
14,2
14,4
14,6
14,8
15,0
Продолжение табл]
яц ы 116
«3
1,65
-7
2,6010
2,3650
2,1810
2,0300
1,9020
1,7930
1,6970
1,6130
1,5390
1,4720
1,4120
1,3570
1,3070
1,2620
1,2190
1,1440
1,0790
1,0220
0,9720
0,9274
0,8874
0,8513
0,8186
0,7888
0,7615
0,7364
0,7132
0,6918
0,6719
0,6533
V
1,925
1,891
1,860
1,831
1,805
1,780
1,757
1,735
1,715
1,696
1,678
1,660
1,644
1,629
1,614
1,587
1,562
1,539
1,518
1,490
1,481
1,464
1,448
1,433
1,419
1,406
1,394
1,382
1,371
1,361
1,
~7
4,6030
3,5820
3,0610
2,7190
2,4670
2,2690
2,1080
1,9730
1,8580
1,7580
1,6700
1,5920
1,5230
1,4600
1,4030
1,3040
1,2200
1,1480
1,0850
1,0300
0,9811
0,9375
0,8983
0,8628
0,8306
0,8011
0,7740
0,7491
0,7261
0,7047
70
V
2,018
1,978
1,940
1,906
1,874
1,844
1,817
1,792
1,768
1,745
1,725
1,705
1,686
1,669
1,652
1,621
1,594
1,568
1,545
1,524
1,504
1,485
1,468
1,452
1,437
1,423
1,410
1,398
1,386
1,375
1,
~7
2,3820
2,2080
2,0620
1,9380
1,8310
1,7380
1,6560
1,5160
1,4020
1,3070
1,2260
1,1560
1,0950
1,0410
0,9928
0,9499
0,9112
0,8761
0,8441
0,8148
0,7879
0,7630
0,7400
0,7187
0,6988
0,6802
0,6628
0,6464
0,6311
0,6166
0,6029
0,5900
75
V
1,831
1,805
1,781
1,758
1,736
1,716
1,697
1,662
1,631
1,602
1,576
1,552
1,530
1,510
1,491
1,474
1,458
1,442
1,428
1,415
1,402
1,390
1,379
1,368
1,358
1,348
1,339
1,330
1,321
1,313
1,305
1,298
1,80
-7
3,6790
3,1470
2,7930
2,5350
2,3350
2,1720
2,0360
1,8190
1,6520
1,5180
1,4080
1,3160
1,2360
1,1680
1,1080
1,0540
1,0070
0,9644
0,9260
0,8910
0,8592
0,8299
0,8030
0,7781
0,7551
0,7336
0,7136
0,6949
0,6774
0,6609
0,6454
0,6308
п
1,910
1,879
1,849
1,822
1,796
1,772
1,750
1,709
1,673
1,640
1,631
1,584
1,560
1,538
1,517
1,498
1,480
1,463
1,448
1,433
1,420
1,407
1,394
1,383
1,372
1,362
1,352
1,342
1,333
1,325
1,316
1,308
Задача 172. В результате наблюдений над случайной величиной х получены следую-
следующие значения (п = 50):
11 16 18 21 21 23 24 24 25 26
27 28 28 28 28 29 29 30 31 31
34 34 35 35
38 39
31
35
40
32
36
41
32
36
42
32
37
42
33
37
45
33
38
46
40
48 55 60
40
62
Найти аппроксимирующее распределение Джонсона^ оценить его параметры и вычис-
вычислить значение х = ж*, для которого а = Р(ж ^ ж*) = 0,95.
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 367
Окончание таблицы 116
10,2
10,4
10,6
10,8
11,0
11,2
11,4
11,6
11,8
12,0
12,2
12,4
12,6
12,8
13,0
13,2
13,4
13,6
13,8
14,0
14,2
14,4
14,6
14,8
15,0
1,85
^7
2,3100
2,0280
1,8200
1,6580
1,5280
1,4200
1,3290
1,2510
1,1830
1,1240
1,0710
1,0240
0,9811
0,9427
0,9078
0,8758
0,8465
0,8195
0,7945
0,7712
0,7496
0,7295
0,7106
0,6929
0,6763
V
1,766
1,723
1,686
1,652
1,622
1,594
1,569
1,546
1,525
1,505
1,487
1,470
1,454
1,439
1,425
1,412
1,400
1,388
1,377
1,366
1,356
1,346
1,337
1,328
1,320
1,
^7
3,4750
2,7260
2,3130
2,0360
1,8320
1,6730
1,5440
1,4380
1,3470
1,2700
1,2020
1,1430
1,0900
1,0430
1,0000
0,9614
0,9263
0,8941
0,8646
0,8373
0,8121
0,7886
0,7668
0,7464
0,7273
90
V
1,834
1,784
1,740
1,701
1,666
1,634
1,605
1,580
1,556
1,534
1,514
1,495
1,477
1,461
1,446
1,431
1,418
1,405
1,393
1,382
1,371
1,361
1,351
1,342
1,333
«3
1,95
-7
2,3310
2,0580
1,8550
1,6960
1,5680
1,4610
1,3700
1,2930
1,2250
1,1650
1,1120
1,0640
1,0210
0,9822
0,9466
0,9141
0,8842
0,8566
0,8310
0,8072
0,7851
п
1,717
1,681
1,648
1,618
1,591
1,567
1,544
1,523
1,504
1,486
1,469
1,453
1,438
1,425
1,412
1,399
1,388
1,377
1,366
1,356
1,346
2,00
^7
3,6120
2,8040
2,3770
2,0960
1,8890
1,7280
1,5980
1,4900
1,3990
1,3200
1,2510
1,1900
1,1360
1,0880
1,0450
1,0050
0,9690
0,9359
0,9055
0,8774
0,8514
п
1,780
1,737
1,698
1,664
1,633
1,605
1,579
1,555
1,534
1,514
1,495
1,478
1,461
1,446
1,432
1,419
1,406
1,394
1,383
1,372
1,362
Находим
х = - • J2 х^ = 33'725 ^ = 100,858; s = 10,0428;
(ж, - xf = 28396,44481;
J2 (%i ~ x) = 1947356,956; a3 = 0,5607; a4 = 3,8287.
Так как a4 = 3,8287 > 3 • (l + 0,641 • a§) = 3,604, применима аппроксимация распре-
распределением из семейства Su Джонсона. Для а4 = 3,83 и аз = 0,56 из табл. 116 (используя
аппроксимацию) находим оценки 7 = ~2,1 и ?) = 3,30.
Далее вычисляем
/ .. \
0,091827 -, АП/-1ТГ
= е = 1,096175;
ch -г =
2- (-2,11)
3,30
= ch(-l,27878) = 1,9353145;
sh[ - ) =sh[ -
= -0,68386.
Тогда
Л =
10,0428
= 25,9209;
1 - ¦ A,09618 - 1) - A,09618 ¦ 1,9353 + 1)
i = 33,77 + 25,9209 • ^/1,09618 • (-0,68386) = 15,2108.
368 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Плотность аппроксимирующего распределения семейства Su Джонсона имеет вид
3,3 1
• — х
д/(ж- 15,21)+25,9212
1 / , х-15,21 /Ж^15,21\2 \
х ехр{ -- • -2,11 + 3,3 • 1п< ¦ Ь \ 1 — + 1 > / •
F j 2 I ' ' | 25,921 YV 25,921 J \) \
Для того, чтобы найти ж*, для которого а = Р(ж ^ ж*) = 0,95, учитывая, что
'J'a = 11,0,95 = 1,645, и полагая по определению ж* = и% = гА§;95? находим
^о,95 = 15Д6 + 25,92 • sh ( 1>645 + 2>1г ) = 51,49.
\ 3,30 J
Следовательно, х ^ 51,49 с вероятностью а = 0,95.
3.6.2. Кривые распределений Пирсона
Наибольшее распространение для аппроксимации эмпирических распределений
получили кривые Пирсона. Плотность вероятности /(ж), график которой принад™
лежит семейству Пирсона, является решением дифференциального уравнения [10]
dy х + Ь
У со + с\х + с2х2
Постоянные 5, cq, ci, c^ выражаются через первые четыре момента распределен
ния (математическое ожидание, дисперсия, коэффициенты асимметрии «з и экс-
эксцесса «4):
„ 6(a4-ag-l)
где К = -^ .
3«з - 2а4 + 6
Выбор из семейства кривых Пирсона такой кривой, у которой первые четыре
момента совпадают с выборочными моментами, определенными по эксперимен™
тальным данным, составляет содержание задачи подбора эмпирической кривой для
распределения вероятностей случайной величины.
Тип кривой из семейства Пирсона определяется значением показателя х [10]
= aj(a4 + 3J= al (К + 2J
Х ~ 4Dа4 - Заз)Bа4 - 3«з - 6) ~ 16 (К + 1) '
На практике различают 7 основных типов кривых Пирсона, которым соответ-
соответствуют различные значения х, а следовательно, «з и «4- Графики для определения
типа кривой Пирсона по значениям аз и «4 приведены в [25], по показателю х —
в [10].
Так как достаточно эффективные и стабильные оценки моментов «з и а4 рас-
распределения достигаются при значительных объемах выборок, то анализу подвер™
гаются, как правило, статистические ряды, разбитые на интервалы равной длины
с = Xi+i — Xi, т.е. статистический ряд представляется своей эмпирической гисто-
гистограммой.
В этом случае границы интервалов разбиения (a^,a^_|_i) фиксируются, а случай-
случайной величиной является количество выборочных значений данных щ, попавших
в тот или иной интервал.
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 369
Далее для всех кривых Пирсона переменная представлена в виде х = ,
с
где ж* —реальное значение переменной; х — мода распределения (значение случай-
случайной величины, соответствующее максимуму плотности распределения); с — длина
интервала, на которые разбит эмпирический статистический ряд.
Напомним порядок вычисления моментов распределения, заданного эмпириче-
эмпирической гистограммой. Гистограмма представлена совокупностью пар
xN
n2/ ' vW ' ' \Щ/ ' ' \nN
где X{ — середина г-го интервала разбиения; щ — количество данных, попавших в г-й
интервал; N — количество интервалов разбиения гистограммы.
Первые четыре момента распределения подсчитываютея по формулам
N \ г N
Xini> & = 1? 2, 3, 4.
Часто вместо переменной х удобнее использовать переменную х = , где
xq —условное начало отсчета (как правило, это величина, соответствующая интер-
интервалу разбиения с наибольшей частотой щ). Тогда х = х® + т\с.
Очевидно, что стп\ = ж, т. е. первый начальный момент равен среднему значе-
значению. Дисперсия а2 выражается через начальные моменты формулой а2 = 7П2 ^тп2^
или а = \/гп2 — тп\. Переход к метрической величине осуществляется по формуле
а' = са.
Коэффициенты асимметрии и эксцесса выражаются через начальные моменты
следующим образом:
З 2т1 А 6 3
з 5 «4 =
(Ш2-ш?J (ma
Легко видеть, что для негруппированного ряда с = 1, П{ = 1. Порядок вычисле-
вычисления mk будет продемонстрирован ниже.
Аппроксимация распределением из семейства Пирсона позволяет подыскать
подходящую кривую для описания плотности распределения эмпирических данных,
что необходимо для выявления основных характеристик распределения (его ход,
симметричность, поведение на хвостах). Однако найти квантиль этого распреде-
распределения по аналитической формуле плотности распределения — задача непростая.
Эту задачу можно решить без подбора распределения, достаточно найти оцен-
оценки «з и а4 и воспользоваться известными таблицами квантилей распределения
Пирсона (табл. 117) для нормированной переменной у = (тогда истинная
квантиль равна х@ = х + sya).
3.6.2.1. Кривые Пирсона типа I
Для кривых этого семейства % < 0- Уравнение кривой имеет вид
где
370 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
ИГ
К
В
S 3
м то
if
и к
а
о н
РЗ К
0 к
\ ГО
1 К
ш
я л
S
в
ф
5
со
1,00
0,90
0,80
0,70
0,60
0,50
,40
о
,30
о
0,20
0,15
о
о
0,05
0,03 1
0,01 |
0,00 1
0,05
II
1,47
1,51
1,35
о
"xt«
1,46
,33
1,41
1,45
,50
1,55
1,55
1,58
1,56
1,59
1,56 1
1,61
00 О
т-Н СМ
1,64
см
см
1,61
1,65
см
,30
,38
1,45
1,49
,53
1,57
1,59
1,61
1,65
со
см
1,29
,35
,42
1,48
1,51
,54
1,57
1,59
1,62
1,65
оо
см
1,27
со
со
,39
,44
1,49
1,52
,55
1,58
1,59
см
со
1,64
о
со
2
1,25
1,31
ь-
со
,42
,46
1,50
1,53
,55
1,58
1,59
т-Н
СО
1,64
см
со
1,19
1,24
1,30
1,35
1,39
,43
,47
1,51
1,53
,55
1,58
1,59
1,61
1,64
со
1,18
1,23
1,28
1,33
1,37
1,41
,45
,48
1,52
1,53
,55
1,58
1,59
1,61
1,63
CD
со
1,23
1,27
гЧ
со
1,35
1,39
1,42
со
,49
1,52
1,54
,55
1,58
1,59
о
со
1,63
оо
со
1,26
1,30
со
1,37
1,40
1,43
со
,49
1,52
1,54
,55
1,57
1,59
о
со
1,62
о
00 гЧ
1,32
1,34
со ь-
со со
О) О
со ^
1,42
1,42
1,33
1,34
LO t-
co со
1,38
1,39
1,43
1,44
1,44
1,45
1,45
1,46
OS О
"хГ1 Ю
1,52
1,52
1,54
1,54
LO LO
LO LO
LO LO
1,58
1,58
о о
со со
см см
CD CD
CM -xf
oo oo
о о
LO LO
CM CM
LO LO
1,35
1,38
1,40
1,42
1,44
1,46
,48
,50
1,52
-xf oo oo
LO LO LO
LO LO
LO LO
LO LO
oo oo
LO LO
1,59
1,59
1,61
1,61
CD 00
,55
1,56
1,57 1
1,58 |
1,60 1
о
LO
a = 0,95
1,72
oz'x
1,66
1,56
1,61
00 О
гЧ CM
1,83
1,80
,77
1,74
t-
1,68
1,64
CM
CM
,87
1,83
1,80
,77
1,74
t-
1,69
1,65
"xf
CM
1,92
О 00
O5 00
1,93
1,90
CO
oo
оо
1,98
1,95
СЛ
1,91
1,98
1,96
LO
СЛ
1,92
1,93
1,93
1,90
Об'Х
1,88
СМ СЛ Ь- Ю
ел оо оо оо
1,88
1,86
1,87
1,85
,84
CD "xf CM О
oo oo oo oo
т-Ч О
oo oo
1,79
1,77
CO LO
oo см
т-Н О
1,68
1,68
ю ю
CD CD
CD 00
CM CM
1,78
CD
b-
,74
b-
1,69
1,77
1,75
со
о
ь-
1,69
1,83
см о
оо оо
,79
1,76
ь-
,72
,77
1,74
оо
со
,71
ел оо
со со
1,84
1,83
1,82
1,80
ел оо
,76
1,73
1,72
,70
,75
1,72
т-Н
ь-
1,91
1,89
1,85
1,88
1,86
1,84
со -xt*
оо оо
1,83
1,82
т-Н О
оо оо
1,79
со
,74
1,71
1,70
1,78
,75
,73
1,70
1,69
сл оо оо
CD CD CD
1,68
1,67
1,68
1,67
1,66
1,66
1,67
1,67
1,66
1,65
1,64
1,64
о
со
см
со
1,64
1,63
CD
со со
1,65
1,64
1,63
1,62
оо
со
о
1,66
1,66
1,65
1,65
1,64
1,63
1,62
см
"xf
1,62
"xf
"xf
см
оо
1,80
1,78
1,76
,74
см
1,70
1,68
,67
1,65
1,64
1,63
1,61
CD
1,85
1,83
т-Н
оо
1,79
ь-
ь-
ю
ь-
,73
т—)
1,69
1,68
со
со
1,65
1,64
1,62
1,61
оо
1,84
1,82
1,80
1,78
1,76
г
,73
ь-
1,68
1,67
,66
1,64
1,63 1
см
со
1,60 1
о
LO
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 371
о
Он
!МСО
0
1,00
0,90
0,80
0,70
0,60
0,50
0,40
,30
о
0,20
LO
0,05 | 0,10
0,03 |
0,01 |
| оо'о
LO
0,0
I
1,56
1,62
1,68
1,65 1
1,76
00 О
т-Н Ol
1,41
1,49
ZS I 99 I
1,71
CD
b-
1,83
Ol
Ol
,39
1,51
1,58
1,73 1,65
114
Ol
oo
1,88
Ol
1,37
,47
1,58
1,64
1,78 1,71
1,82
CD
oo
1,92
CD
Ol
LO
со
1,45
,55
1,65
1,70
Ol
oo
1,85
СЛ
oo
1,94
oo
Ol
1,33
Ol
1,52
о
CO
1,69
1,74
1,84 1,79
1,87
tH
СЛ
1,96
о
со
1,24
1,32
1,40
oo
1,57
,65
1,72
1,77
1,86 1,81
1,89
со
ел
1,97
Ol
со
1,23
1,31
1,39
1,46
1,54
1,61
,68
1,75
1,79
1,88 1,83
1,90
1,94
1,98
«
со
1,23
1,30
1,38
1,44
1,51
1,58
1,65
,71
III
1,81
1,89 1,85
1,91
1,95
oo
oo
CD
со
1,29
1,36
1,43
1,49
1,56
1,62
1,67
,73
1,79
1,82
oo
о
ел
Ol
oo
1,95
oo
oo
oo
со
1,35
1,41
1,47
1,53
1,59
1,64
1,70
,75
1,81
1,84
oo
T—I
СЛ
1,93
1,96
oo
oo
о
-xf"
1,40
1,45
1,51
1,56
1,62
1,67
1,72
,76
1,82
1,84
1,91 1,88
1,93
1,96
2,00
Ol
-xf
1,44
1,49
1,54
1,59
1,64
1,69
1,73
,78
1,83
1,85
1,92 1,88
1,94
1,96
2,00
-xf
-xf"
1,47
1,52
1,57
1,62
1,66
1,70
1,75
,79
1,83
1,86
1,92 1,89
1,94
1,96
2,00
CD
-xf"
1,50
1,55
СЛ
LO
1,64
1,68
1,72
1,76
,80
1,84
1,87
oo
oo
СЛ
1,94
1,97
2,00
oo
1,53
1,57
t—1
CD
1,65
1,69
1,73
1,77
,81
1,85
1,87
со
СЛ
1,94 1
1,97 |
2,00 1
о
LO
LO
b-
0,9
II
e
1,89
1,86
1,82
1,65 1
1,76
00 О
гЧ Ol
2,06
2,04
о
о
Ol
CD
СЛ
1,93
1,89
1,83
Ol
Ol
,25
Ol
2,11
2,08
LO
О
fM
T—I
О
Ol
1,98
1,94
1,88
"xf
Ol
2,22
Д8
Ol
ГМ
2,11
2,03 2,08
о
Ol
1,97
1,92
со
Ol
2,27
2,24
о
Ol
CM
2,15
2,13
2,05 2,09
2,03
1,99
1,94
oo
Ol
2,32
2,28
2,25
,21
CM
2,16
2,13
2,06 2,10
2,04
2,01
1,96
о
со
2,38
2,35
2,32
2,29
2,25
,21
Ol
2,16
2,14
2,07 2,11
2,05
2,02
1,97
Ol
со
2,41
2,38
2,35
2,32
2,28
2,25
,21
Ol
2,16
2,14
2,07 2,11
sot
2,02
1,98
"xt1
со
2,44
2,41
oo
Ol
2,34
2,31
2,28
2,24
,20
Ol
2,16
2,14
2,07 2,11
sot
2,02
66'X
CD
со
2,43
2,40
2,36
2,33
2,30
2,27
2,24
о
Ol
Ol
2,16
2,13
2,07 2,11
2,05
2,03
66'X
oo
со
2,41
2,38
2,35
2,32
2,29
2,26
2,23
Д9
Ol
2,15
2,13
2,07 2,11
2,05
2,03
2,00
о
2,40
2,37
2,34
2,31
2,28
2,25
2,22
Д9
Ol
2,15
2,13
2,07 2,10
2,05
2,03
2,00
Ol
2,39
2,36
2,33
2,31
2,28
2,25
2,22
Д8
Ol
2,15
2,13
2,07 2,10
2,05
2,03
2,00
"xf
2,38
2,35
2,32
2,30
2,27
2,24
2,21
Д8
Ol
ГМ
2,12
2,07 2,10
2,05
2,03
2,00
со
2,36
2,33
2,31
2,29
2,26
2,23
2,21
Д7
Ol
ГМ
2,12
2,07 2,10
2,05
2,03
2,00
oo
2,35
2,33
2,30
2,28
2,25
2,23
2,20
Д7
Ol
ГМ
2,12
2,07 | 2,09
2,05 1
2,03 |
2,00 1
о
LO
372 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
см ее
1,00
0,90
0,80
0,70
0,60
0,50
40
о
0,30
0,20
0,15
о
о
05
о
со
о
о
т-Н
о
о
о
о
о
tf
т-Н
II
62
СЛ
CD
т-Н
ь-
ь-
rH
о ь~
Ь- 00
т-Н т-Н
00 О
гЧ СМ
1,45
LO
ю
64
76
со
оо
т-Н
ел
т-Н
О
см
см
см
1,43
СЛ
LO
оо
со
ь-
ь~
rH
89
LO
ев
т-Н
со
о
см
см
т—1
см
см
т-Н
ю
LO
1,70
ев
ь-
оо
оо
99
LO
СМ
см
см
т-Н
см
см
со
см
1,39
см
LO
1,66
1,81
ев
оо
98
08
см
со
см
СЛ
см
ь~
см
см
оо
см
1,38
1,50
62
^
1,76
1,90
1,97
05
см
т-Ч
СМ
СЛ
т-Ч
см
LO
см
см
оо
оо
см
о
оо
1,26
zs'x
1,48
1,59
т-Ч
IN
1,84
1,96
2,03
т-Ч
т-Н
СМ
ев
т-Ч
СМ
см
см
СЛ
см
см
ь~
оо
см
см
оо
1,26
1,36
1,46
1,57
1,68
СЛ
IN
1,90
2,02
2,09
со
т-Н
СМ
24
см
оо
см
см
оо
оо
см
о
см
оо
1,26
ss'x
1,45
1,55
1,65
1,76
CD
оо
1,96
2,07
2,13
о
см
см
27
см
оо
см
со
оо
см
оо
см
со
оо
1,34
1,43
ss'x
1,62
1,72
1,82
91
^
2,01
2,11
ь~
см
оо
см
см
30
см
оо
см
СЛ
оо
см
ю
см
оо
оо
1,42
1,51
1,60
1,69
1,78
1,87
96
^
2,05
2,15
2,20
со
см
см
33
см
CD
оо
см
см
ь~
см
о
1,49
1,58
1,66
1,75
1,83
1,92
о
о
см
2,09
2,18
2,23
оо
см
см
35
см
оо
оо
см
оо
см
ев
см
см
1,56
1,64
см
ь~
1,80
88'Х
1,96
04
см
2,12
2,21
2,25
31
см
37
см
о
см
см
о
ю
см
"хР
1,62
1,70
ь-
ь~
1,80
1,92
2,00
07
см
2,15
2,23
2,27
32
см
38
см
см
см
со
см
т-Н
ю
см
со
1,67
1,74
т-Ч
оо
1,88
1,96
2,03
о
т—1
см
2,17
2,25
2,29
34
см
40
см
со
см
ь-
см
см
ю
см
оо
1,72
1,79
ю
оо
1,92
1,99
2,06
см
т—1
см
2,19
2,27
2,31
36
см
41
см
см
оо
см
оо
ю
см
о
LO
СЛ
d
оо
о
см
о
о
см
LO
СЛ
т-Ч
о ь-
ь- оо
т-Ч т-Ч
00 О
т-Ч СМ
2,25
2,24
см
см
см
оо
т-Ч
см
LO
т-Ч
см
о
т-Ч
см
т-Н
о
см
см
см
2,40
2,38
2,36
33
см
28
см
LO
см
см
о
см
см
см
т-Ч
см
см
см
LO
см
2,51
2,48
2,45
42
см
36
см
со
оо
см
оо
см
см
т-Ч
см
см
со
см
2,63
61
см
2,59
2,55
2,52
48
см
43
см
СЛ
оо
см
со
см
ь~
<м
см
оо
см
ь~
см
2,70
68
см
2,64
2,59
2,56
со
LO
СМ
48
см
см
о
см
со
оо
см
о
со
2,80
2,79
2,77
2,75
см
см
2,68
2,63
2,60
CD
LO
CM
51
см
GO
CM
44
см
b~
oo
CM
CM
со
2,87
2,86
2,84
2,82
2,79
LO
b~
CM
2,71
2,66
2,63
СЛ
LO
CM
54
CM
T—1
LO
CM
47
CM
о
CM
"xf
со
2,93
2,91
2,90
2,87
2,85
2,81
oo
b~
CM
2,74
2,68
2,65
61
CM
56
CM
со
LO
CM
49
CM
oo
CM
со
со
2,97
2,95
2,92
2,90
2,87
2,83
о
oo
CM
2,75
2,70
2,67
63
CM
58
CM
LO
LO
CM
T—1
LO
CM
LO
CM
oo
со
2,99
2,97
2,94
2,91
2,88
2,85
81
CM
b~
b~
CM
со
b~
CM
2,68
65
CM
о
CD
CM
b-
LO
CM
со
LO
CM
b~
CM
о
3,01
2,99
2,95
2,92
2,89
2,86
82
CM
2,78
со
b~
CM
2,69
66
CM
61
CM
GO
LO
CM
LO
CM
CB
CM
CM
3,02
2,99
2,96
2,93
2,90
2,86
83
CM
2,78
со
b~
CM
2,70
67
CM
62
CM
СЛ
LO
CM
CD
LO
CM
о
LO
CM
"xP
3,03
GO'S
2,97
2,94
2,90
2,87
83
CM
2,79
2,74
b-
CM
68
CM
63
CM
о
CD
CM
b-
LO
CM
1—1
LO
CM
CO
-xP
3,03
GO'S
2,97
2,94
O5
CM
2,87
84
CM
2,80
LO
b~
CM
2,72
68
CM
64
CM
CD
CM
oo
LO
CM
CM
LO
CM
oo
-xP
3,03
GO'S
2,97
2,95
CM
2,88
84
CM
2,80
LO
b~
CM
2,72
69
CM
64
CM
CM
CD
CM
oo
LO
CM
со
LO
CM
о
LO
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 373
n gfgf2 Г(ЛГ) , _ sa3K
Т(^)К2Г( ; Ж Ж
n — объем выборки; с — длина интервала разбиения; I — размах кривой; х — модалв-
ное значение; s = с- а — именованное значение среднеквадратического отклонения.
Для вычисления гамма-функции T(z) приведем ряд полезных соотношений:
T(z) = (z- l)T(z -l) = (z- l){z - 2)T(z - 2) = ..., (z > 1);
Очень полезна аппроксимация
»l-0,427(/3-l)^1>9,
при /3 > 1 ошибка не превышает 0,2%.
В общем случае вычисление гамма-функции по любому аргументу можно про-
производить по формуле (/3 > 1, [z] — целая часть числа)
г|и +1 j = [1 -о,427(/з-1)г1'9] П (и + \ -4-
Например, вычислим значение ГE,6178):
ГE,6178) = ГE + 0,6178) = Г ^5 +
= [1 - 0,427 • 0,6186~1}9] • 4,6178 • 3,6178 • 2,6178 • 1,6178 = 63,26699.
Кривая Пирсона типа I представляет собой бета-распределение (см. раздел 1.1.7),
поэтому ее функция распределения F(x; Ii, I4, #1, ^2? А) модсет быть выражена через
функцию бета-распределения
F{x]lul2,q\,q2, А) = 1г1+ж (gi + l,g2 + 1) •
Задача 173. В результате наблюдений получен статистический ряд^ заданный та-
блицей (п = 1000, с = 5). Необходимо подобрать аппроксимирующую кривую распреде-
распределения Пирсона и найти 95%-ю квантиль распределения.
Сначала найдем моменты распределения. В нашем случае все эмпирические данные
разбиты на 13 интервалов длиной с = 5 каждый. В качестве случайной величины будем
рассматривать середину каждого интервала. Порядок вычислений представлен в таблице
ж^-42,5,
(здесь xi = ).
о
Таким образом, имеем
п п
пц = - • У^ xi - щ = 0,093; т2 = - • Y^ х* • щ = 4,859; т3 = 7,755; т4 = 72,383.
г=1 г=1
374 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
г
1
2
3
4
5
6
7
8
9
10
11
12
13
Xi
22,5
27,5
32,5
37,5
42,5
47,5
52,5
57,5
62,5
67,5
72,5
77,5
82,5
щ
11
93
162
176
178
132
101
67
40
24
12
3
1
Xi
-4
-3
_2
-1
0
1
2
3
4
5
6
7
8
UiXi
-44
-279
-324
-176
0
132
202
201
160
120
72
21
8
riixf
176
837
648
176
0
132
404
603
640
600
432
147
64
TliX^
-704
-2511
-1296
-176
0
132
808
1809
2560
3000
2592
1029
512
2816
7533
2592
176
0
132
1616
5427
10240
15000
15552
7203
4096
Е
100
93 4859
7755 72383
Далее вычисляем
х = 42,5 + mi • с = 42,5 + 0,093 • 5 = 42,965; а2 = т2 - ml = 4,859 - 0,0932 = 4,85;
«4 =
а = 2,202 (s = с • а = 5 • 2,202 = 11,011);
7,755 - 3 ¦ 4,859 ¦ 0,093 + 2 ¦ 0,0932 _
D,850J
72,383 - 4 • 7,755 • 0,093 + 6 • 4,859 • 0,0932 - 3 • 0,0934
4,8502
= 0,3609);
= 2,965.
Имеем
6 • B,965 - 0,3609 - 1)
3 • 0,3609 - 2 • 2,965 + 6
0,3609. B + 8
16 • A + 8,3496)
Так как % < 0, можно применить аппроксимацию эмпирического распределения кривой
Пирсона типа 1.
Выполняем необходимые вычисления:
s-a3 К+ 2 лелГкПГ 11,011-0,60075 10,3496
х = х -— • ^п—г = 42,965 • п I _ = 37,574;
2 К-2
2 • 11,011
6,3496
1 =
^9,3496 • 1,25841 = 15,107;
6,3496 - 8,3496 •
0,60075
4- ^/9,3496- 1,25841
= 1,283;
= -- F,3496 + 3,7837) = 5,067;
h = —
6,3496
= 3,052; h = Б-°
X =
6,3496
1000 1,283х'283 - 5,0675'067
,055 (I = h + h = 3,052 + 12,055 = 15,107);
Г (8,3496)
15,107 6,34966'3496 Г B,283) ¦ Г F,067)'
Г(8,3496) = Г ( 8 + —— ) = [1 - 0,427 • 1,8604 • 2,8604^l!9l x
V ' ; \ 2,8604/ L J
х 7,3496 • 6,3496 • 5,3496 • 4,3496 • 3,3496 • 2,3496 • 1,3496 = 10289,8761;
= [l - 0,427 • 2,5335 • 3,5335m1'9] • 1,283 = 1,156879;
ГB,283) = Г( 2 +
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 375
ГF,067) = ГF+
\ 14,925 /
= [l - 0,427 • 13,925 • 14,925^1;9] • 5,067 • 4,067 • 3,067 • 2,067 • 1,067 = 134,51827;
= 7135 . 10289,8761
1,156879 • 134,51827
Таким образом, уравнение для аппроксимирующей плотности распределения имеет вид
/ ~ \ 1,283 / ~ \ 5,607
у = 179,419962 • [ 1 + ^— j • [ 1 — )
\ 3,052/ \ 12,055/
Напомним, что в качестве переменной мы используем
z = х^ = 0^2 , _ 37^74).
с
Относительно реальной переменной уравнение принимает вид
у = 179,419962 • @,0655 • х - 1,46225I5283 • A,62337 - 0,01659 • жM'067.
Например, для х = 52,5 частота равна
2/E2,5) = 179,419962 • @,0655 • 52,5 - 1/Ш25I'283 • A,62337 - 0,01659 • 52,5M'067 = 101,7,
что совпадает с эмпирической частотой, равной 101.
Для нахождения 95%-й квантили распределения обратимся к табл. 117. Для
Q/3 = 0,359, «4 = 2,965 и а = 0,95 находим, что г/о,95 ^ 1,8. Следовательно,
^„5 = ^р = Ж°-95п4121'965 = 1,8; *о,в5 = 42,965 + 1,8 • 11,011 = 62,78.
Следовательно, вероятность того, что х ^ 62,78, равна 0,95.
3.6.2.2. Кривые Пирсона типа II
Для кривых этого семейства Х = 0, аз = 0 и а^ < 3. Они являются частным
случаем кривых типа I и определяются уравнением
где
/ _ 5ск4-9 п ГBд
q Л
q^ 2C^а4у Л
Криввхе симметричны относительно оси ординат и х = х.
Задача 174. Для статистического ряда, заданного таблицей (п = 205, с = 2) подо-
подобрать кривую распределения из семейства Пирсона.
Вычисление моментов представлено в таблице (здесь xi = — ).
Находим (с = 2)
1 п 1 п
пц = - • У" Зц • гц = 0,0195; т2 = - • V щ • щ = 2,1951;
п f-| та ^
-I П 1 П
тз = — • У"^ ж?- • П{ = 0,3122: Ш4 = — • У^ Хл • щ = 13,2;
те г—^ п ~
г=1 г=1
х = 34 + 0,0195-2 = 34,039.
376 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
i
1
2
3
4
5
6
7
8
9
Xi
26
28
30
32
34
36
38
40
42
щ
1
6
27
40
54
45
23
7
2
Xi
-4
^3
-2
-1
0
1
2
3
4
-4
-18
-54
-40
0
45
46
21
8
16
54
108
40
0
45
92
63
32
-64
^162
-216
-40
0
45
184
189
128
fliXJ
256
486
432
40
0
45
368
567
512
Е 205
450
64 2706
В случае, когда обе ветви кривой асимптотически приближаются к оси абсцисс,
необходимо при оценке четных центральных моментов (/12 = rri2 — т\ и /14 = т^ —
— 4тз • т\ + 6m2 • m\ — Зга4) применять корректирующие поправки Шеппарда [10], с
учетом которых
2 2 2
В нашем случае, полагая с = 1 (половина разряда), имеем
/12 = 2,1951 - 0,01952 = 2,1947; /22 = <т2 = 2,1947 - 0,0833 = 2,1114 (<т = 1,453);
/14 = 13,180656 - 0,5 • 2,1947 + 0,02916 = 12,1125;
Д4 = 13,2 - 4 • 0,3122 • 0,0195 + 6 • 2,1951 • 0,0195 - 3 • 0,01954 = 13,1800656;
/i3 = газ — 3 • wi2
Тогда получаем
„ _ Аз
+ 2 • га? = 0,3122 - 3 • 2,1951 • 0,0195 + 2 • 0,01953 = 0,1838.
-^Щ- = 0,060 (а23 = 0,0036); а4 = § = ??™ = 2;716;
А!
2,11142
6 • B,716 - 0,0036 - 1)
2Д1142
= 17,751; х =
0,0036 • 19,7512
16 • 18,751
= -0,00468.
3-0,0036- 2-2,716 + 1
Так как а4 > 3 и % й 0, для аппроксимации заданного статистического ряда можно
использовать кривую типа П.
Находим параметры кривой:
Я = 7
Л =
-716 =8,063; I = 1,453 .
2C-2,716) ' ' ' V 3-2,716
= 6?354;
205
ГA8,126)
= 225,56210"
ГA8,126)
217'126-6,354 [Г(9,063)]2 —^— [Г(9,063)]2.
Далее вычисляем
ГA8,126) =ГИ8+—— J = [l-0,427-6,9365-7,9365м1'9] • 17,126 ... 1,126 = 5,108028-104;
/ 1 \
Г(9,063) = Г 9 + = [1 - 0,427 • 14,873 • 15,873""l59l • 8,063 ... 1,063 = 46124,251.
Окончательно
Л = 225,562 • 10
^6 5,108028 • 101
46124,2512
= 54,15774468.
Таким образом, уравнение аппроксимирующей кривой имеет вид
~2 \ 8,063
у = 54,15774468 • 1 -
40,373316
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 377
х _ х х — 34 039
Переменной здесь является х = = - .
Окончательно имеем
у = 54,15774468 • @,421553186 • х - 0,0061922 • х2 - 6Д74624)8'063.
Например, для х = 30:
2/C0) = 54,15774468 • @,421553186 • 30 - 0,0061922 • 302 - 6,174624) 8'°63 = 23,
что близко к эмпирической частоте, равной 27.
3.6.2.3. Кривые Пирсона типа III
Для этого типа кривых % = ±оо. Уравнение кривой имеет вид
qx
где
а3
2
X = X —
сааз
Кривые типа III асимметричны и ограничены в одном направлении точкой
х = —I. Кривая типа III совпадает с гамма™распределением. Хорошая аппроксима™
ция эмпирических распределений кривой типа III достигается уже при |%| > 4.
Задача 175. Найти аппроксимирующую кривую для плотности распределения слу-
случайной величины, заданной эмпирическим статистическим рядом (п = 40000, с = 2),
приведенным в таблице.
тэ * ( ж^ - 2,356
Вычисления начальных моментов приведены в таолице (здесь х% = у.
г
1
2
3
4
5
6
7
8
9
Xi
1,5
3,5
5,5
7,5
9,5
11,5
13,5
15,5
17,5
щ
9600
13600
9200
4000
2000
800
400
0
400
Xi
-0,448
0,552
1,552
2,552
3,552
4,552
5,552
6,552
7,552
UiXi
-19200
-13600
0
4000
4000
2400
1600
0
2400
щх^
38400
13600
0
4000
8000
7200
6400
0
14400
-76800
-13600
0
4000
16000
21600
25600
0
86400
153600
13600
0
4000
32000
64800
102400
0
518400
Е
40000
Вычисляем
т\ = — •
п
-18400 92000
ii = —0,46: 7712 = — *
г =1,58:
1
—
63200 888800
= 2,30:
=22,22:
П ^ п -л
г=1 г=1
а2 = [12 = т2 - ml = 2,0884; а = 1,4451;
/i3 = 1,58 - 3 • 2,30 • (-0,46) + 2 • (-0,46K = 4,5593;
/14 = 22,22 - 4 • 1,58 • (-0,46) + 6 • 2,30 • (-0,46J - 3 • 0,464 = 27,9129;
378 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
х = 5,5 - 0,46 • 2 = 4,58; а3 = Щ- = 1,1508; «3 = 2,2825;
27,9129 _ 6.F,4-2,2825-
2,08842 ~ ' ' 3 ¦ 2,2825 -2-6,4 + 6
Q4 = Ц = tUZ^l = 6i400; K= »-w--—-^ = зЭ3,79; х = -56,6.
Так как |х| ^> 4, то приемлема аппроксимация кривой Пирсона типа III.
Вычисляем параметры кривой:
Л 1 1 = 0,752451; I = 1,4451 • ( — Ы^ ) = 0,8213977;
' ' ' \ 15108 2 / '
1 0,752451; I 1,4451 (
2,2822 ' ' ' \ 1,5108 /
2 • 1,4451 • 1,5108
ж = 4,58 ¦ ¦ = 2,3974292;
40000 2,752451 232356451
Л ^^
0,8213977 ехрA,752451) ¦ ГB,752451) ГB,752451)
Находим
ГB,752451) = Г( 2 + ) = [1 - 0,427 • 0,32899 • 1,32899)91 • 1,752451 = 1,6090457;
1,32899 /
Л = 23235Д9417 = 14440,3569.
1,6090457
Уравнение кривой имеет вид
х \°'752451 / 0,752451- х
у = 14440,3589 • Ц • ехр -
0,8213977/ \ 0,5213977
Здесь в качестве переменной используется величина х = = 0,5ж — 1,1925, и относи»
с
тельно нее после преобразований получаем
у = 43052,93758 • @,608718529 • х - 0,451793692H'752451 • ехр(-0,458030866 • ж).
Например, для х = 3,5 имеем
у = 43052,93758 • @,608718529 • 3,5 - 0,451793692H'752451 • ехр(-0,458030866 • 3,5) = 12796,
что близко к эмпирической частоте, равной 13600.
3.6.2.4. Кривые Пирсона типа IV
Для кривых этого семейства имеет место 0 < % < 1. Уравнение кривой типа IV
имеет вид
у = А ( 1 + — ) ехр | -v arctg у ) ,
где
2 + г# б(а4-аз-1) г (г - 2) а3
а=
^ i/) —функция, значения которой по аргументу (р = arctg — приведены в [10].
Уравнение записано относительно переменной х = /.
с г
Кривые асимметричны и имеют неограниченный размах.
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 379
Задача 176. Для эмпирического ряда (N = 1000, с = 2), приведенного в таблице, най-
найти аппроксимирующую кривую из семейства Пирсона.
Вычисление начальных моментов приведено в таблице (xi = —
0,2
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Xi
0,5
0,7
0,9
1,1
1,3
1,5
1,7
1,9
2,1
2,3
2,5
2,7
2 Ц
3,1
3,3
3,5
3,7
щ
-7
6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
8
9
Xi
2
5
14
33
67
123
160
172
153
112
68
41
25
14
7
3
1
HiXi
-14
-30
-70
-132
-201
-246
-160
0
153
224
204
164
125
84
49
24
9
Пгх\
98
180
350
528
603
492
160
0
153
448
612
656
625
504
343
192
81
-686
-1080
-1750
-2112
-1809
-984
-160
0
153
896
1836
2624
3125
3024
2401
1536
729
~ А
fliX^
4802
6480
8750
8448
5427
1968
160
0
153
1792
5508
10496
15625
18144
16807
12288
6561
1000
183 6025
7743 123409
Имеем
т1п = - •
щ = 0,183; т2 = 6,025; т3 = 7,743; т4 = 123,409;
1? = 5,908; /хз = 771з - 3 • 7712 • mi + 2m? = 4,448;
12
A4 = Ш4 — 4 •
• 7711 + 6 • 7712 • 771? - 3 • 77li = 118,948;
= М4 - ^ + — = 118,484;
^ 12 240
= 2,43064;
«з =
Мз
3
А!
= 0,30974;
= 0,096; аА = ^| = 3,407816.
Вычисляем далее:
К =
6 • C,407816 - 0,096 - 1)
3 • 0,096 - 2 • 3,407816 + 6
- = -26,288959; х= -:
16-(К
= -0,139971.
Таким образом, для аппроксимации может быть выбрана кривая типа IV из семейства
Пирсона. Вычисляем ее параметры:
г = ~К = 26,288959; q = 2 + 26-288959 = 14,14444795;
1 =
2,43064
25,288959 - 0,0961 • 24,2889592 = 11,3345908;
26,288959 • 24,288959 • 0,30974
= -10,602238; Л=т
1
8,225505
• 25,288959 - 0,096 ¦ 24,2889592
Находим из [10, таблица XIV, с. 532]: F{r,u) « 1,82 для
v
I F(r, и)
11,12625 о л 88,225505
= arctg — = arctg —^ = 22,6 ; Л = — = 48,4753.
г 226,576 1,82
380 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Далее х =
х - 1,9 10,602238 • 11,3345908
0,2 26,225505
Окончательно получаем уравнение кривой
-14,1444795
= Ъх- 4,928023.
у = 48,4753 • 1
4,3345908^
ехр 10,602238 arctg
11,3345908
= 48,4753 • 11 +
Eж-4,9288023)"
11,3359082
J
• ехр 10,602238 • arctg
5х - 4,9288023
4,3345908
3.6.2.5. Кривые Пирсона типа V
Для кривых этого типа % = 1. Уравнение кривой типа V имеет вид
у = Ах ехр I — y
В}'
где
q = 4 -\
Л = п-
и = a(q — 2)уд — 3 (знак такой лее, как у
д —1
-1)' с ' q-2'
Кривые симметричны и определены для 0 < х < сю.
Задача 177. Для статистического ряда, приведенного в таблице, найти аппроксими-
аппроксимирующую кривую из семейства Пирсона (п = 1000, с = 0,04).
Имеем х% =
0,04
?2
и сводим результаты вычислений в таблицу:
г
1
2
3
4
5
6
7
8
9
10
Xi
0,04
0,08
0,12
0,16
0,2
0,24
0,28
0,32
0,36
040
щ
-4
-3
^2
-1
0
1
2
3
4
5
Xi
3
11
99
346
288
148
83
15
6
1
щх{
-12
-33
-198
-346
0
148
168
45
24
5
Пгх\
48
99
396
346
0
148
332
135
96
25
пгх\
-192
-297
-792
-346
0
148
664
405
384
125
пгх\
768
891
1584
346
0
148
1328
1215
1536
625
1000 -199 1625
99 8441
Находим:
mi = -0,199; т2 = 1,625; т3 = 0,099; т4 = 8,441;
= 1,585;
+ 2т\ = 1?053;
+ 6m2mi — Зт4 = 8,901; а = \J~\Ii = 1,259;
х = 0,20 + с • mi = 0,192; а3 = ^| = 0,528;
/if
= 0,278; «4 = Ч = 3,549.
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 381
Так как % « 1, для аппроксимации может быть использована кривая из семейства
Пирсона типа V.
Вычисляем параметры кривой
=
0,278
= 62 537; и = 1,259 • 60,637 • ^59,537 = 588,085;
11 5 1 V ' 11
Л = 1000.
ГF1,537)
Уравнение кривой принимает вид
=3,5514.10-.
588,085
^ z х- 0,192 588,085
В нашем случае переменная х = 1 = 25ж + 4,9145 и
0,04 60,537
у = 3,5514 • 1090 • B5ж + 4,9145)~62'537
Например, для х = 0,16 имеем
• ехр -
588,085
25ж +4,9145
588,085
8,91456
= 304,
у = 3,5514 • 1090 • 8,91456~62'537 • ехр [ -
что близко к эмпирическому значению 346.
3.6.2.6. Кривые Пирсона типа VI
Для кривых этого типа справедливо неравенство 1 < х < оо.
Уравнение кривой имеет вид
у = Ах [х - I) ,
где
Т(К-2)\;
x); A np; ^ +
F(gi - q2 -2) с qi - q2 - 2
Криввхе асимметричны и ограничены в одном направлении точкой х = I. Если
«з < 0? то Я < 0 и размах распределения находится в пределах (оо, — 1).
Задача 178. Для статистического ряда^ приведенного в таблице^ найти аппрокси-
аппроксимирующую кривую из семейства Пирсона и 99%-w? квантиль распределения (п = 368,
с=1).
Здесь Xi = х — 3.
i
1
2
3
4
5
6
7
8
Xi
1
2
3
4
5
6
7
8
Я-г
^2
-1
0
1
2
3
4
5
Xi
1
56
167
98
34
9
2
1
TliXi
^2
-56
0
98
68
27
8
5
nix\
4
56
0
98
136
81
32
25
ПгЩ
-8
-56
0
98
272
243
128
125
n%x\
16
56
0
98
544
729
512
625
368
148
432
802 2580
382 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Находим
mi = 0,4021; т2 = 1,17391; т3 = 2,17935; т4 = 7,01087.
Учитывая, что размах кривой неограничен, при оценке центральных моментов будем
учитывать поправки Шеппарда (с = 1). Имеем
^2 = щ2 - ml = 1,0121; Д2 - А*2 - — = 0,92883;
/i3 = 2,17935 - 3 • 1,17391 • 0,40217 + 2 • 0,402172 = 0,89310;
М4 = 4,56573; Д4 = /х4 - — + — = 4,088; а = у% = 0,96376;
аз = Щ- = 0,9977; а4 = ^ = 4,7394; х = 3 + 0,40217 • 1 = 3,40217.
Далее
Й
6.D,7394-0,9954-1) = _ 0,9954 - (-31,423)=» =
3-0,9954-2-4,7394 + 6 16 • (-32,423)
Видим, что возможна аппроксимация кривой типа VI. Находим параметры кривой:
1 О QQ77
qi = -- {(^33,423) • (-31,423)} • , ^(^35,423) = 42,031;
2 LV > ' v ^ v/0,9954 ¦ (-31,423) + 16 - (-32,423)
g2 = 6,608; 1 = 2- 0,96376 • ^32,423) • A - 1,761)9,5745;
Л^368" ГC4,423).ГG,608) ^1,5268527-10 ,
xj^ 12 345 = ^—^ + 12,345 = х + 9,345.
1
с ' 1
Окончательно получаем
у = 1,5268627 • 1046 • (ж + Э,345Г42'031 • (х - 1,0383N'608 .
Например, при х = 3 имеем у = 174, что близко к эмпирическому значению 167.
Для нахождения 99%-й квантили обратимся к табл. 117. Из нее следует для
а§ = 0,9954 и а4 = 4,74, что г/0,99 = 3,03 и
жо,ээ = х + а • с • t/o,99 = 3,40217 + 0,96376 • 1 • 3,03 = 6,32236.
3.6.2.7. Кривые Пирсона типа VII
Для этого случая % = 0, «з = 0иа4>3. Уравнение кривой имеет вид
~2 \ —Я
где
Кривые асимметричны относительно среднего значения, совпадающего с модой,
и имеют неограниченный размах. При х = 0? аз = 0и«4 = 3 распределение пере-
переходит в нормальное.
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 383
Задача 179. Для статистического ряда^ заданного таблицей^ найти аппроксимиру-
аппроксимирующее распределение из семейства Пирсона (п = 2886, с = 10).
Здесь жо,99 = х + а • с • y0j99 = 3,40217 + 0,96376 • 1 • 3,03 = 6,6322.
Результаты расчетов сведем в таблицу:
i
1
2
3
4
5
6
7
8
9
10
11
Xi
725
735
745
755
765
775
785
795
805
815
825
щ
^5
-4
-3
^2
-1
0
1
2
3
4
5
4
10
84
270
658
1095
506
152
63
32
12
ЩХг
^20
-40
-252
^540
-658
0
506
304
189
128
60
100
160
756
1080
658
0
506
608
567
512
300
^500
-640
-2268
^2160
-658
0
506
1216
1701
2048
1500
Пгх\
2500
2560
6804
4320
658
0
506
2432
5103
8192
7500
Е
2886 -323 5247
745 40575
Далее:
Я =
2 • D,390574 - 3)
= 4,657382; , = 1,34365 •
1,390574
= 3,376484;
Л =
2886
ГD,657382)
3,376484 ГD,657382) • Г@,5)'
ГD,657382) = [1 - 0,427 • 0,521185 • ^бгпвб'9] • 3,657382 ... 1,657382 = 14,492645;
ГD,157382) = [1 - 0,427 • 5,353967 • 6,353967~159] • 3,157382 ... 1,157382 = 7,3466223;
1-0,427-l-2i»
Г@,5) =
0,5
л =
2886
0,5
14,492645
3,376484 7,3466223 • 1,771176
Имеем уравнение искомой кривой
=
= 951,98444575.
-4,657382
у = 951,9844785 • 11 +
В нашем случае переменной является
х ~~ х
3,376484^
= ОД • (ж - х) ; х = 775 + тг • с = 775 + 10 • (-0,112) = 773,88;
х = ОДж - 77,388.
Относительно реальной переменной уравнение кривой имеет вид
@,1х - 77,-°^-4'657382
у = 951,984475 • ( 1 +
Например, при х = 795 имеем
3,3764842
1/G95) = 951,984475 • @,000877145 • 7952 - 1,3576075 • 795 + 526,3126435)
что находится вблизи эмпирического значения 152.
-4,657382
= 204,
384 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Внимание! Во всех расчетах кривых Пирсона требуется высокая точность
вычислений (необходимо удерживать до 8^-10 знаков после запятой), что объясня-
объясняется мультипликативной схемой накопления ошибок в степенных членах.
3.6.3. Разложение теоретических распределений
Для эмпирического распределения можно получить хорошее аналитическое при™
ближение, если использовать плотность известного теоретического распределения
(f(x) и ее производные.
Для распределений, незначительно отличающихся от нормального, хорошие
результаты дает приближение с помощью рядов Грама^Шарлье [10]
«4^3
24
где
<р(х) =
1 _*±
2 —плотность стандартного нормального распределения;
(р(ж) = — (ж3 — Зх)ср(х)— третья производная от (р(х); (р (ж) = (ж4 — 6ж2
четвертая производная от (р(х).
Переменная используется в нормализованной форме
х =
х — М(ж)
Задача 180. Для статистического ряда, заданного таблицей, найти аппроксими-
аппроксимирующую кривую для плотности распределения с помощью разложения нормальной
плотности распределения вероятностей (п = 2000, с = 40).
Вычисление моментов распределения приведено в таблице (xi = ):
i
1
2
3
4
5
6
7
8
9
10
11
12
13
Xi
175
215
255
295
335
375
415
455
495
535
575
615
655
щ
-6
^5
-4
-3
^2
-1
0
1
2
3
4
5
6
Xi
0
7
22
102
260
386
461
356
239
108
40
15
4
ЩХг
0
^35
-88
-306
^520
-386
0
356
478
324
160
75
24
Пгх\
0
175
352
918
1040
386
0
356
956
972
640
375
144
0
^875
-1408
-2754
^2080
-386
0
356
1912
2916
2560
1875
864
ПгХ,\
0
4375
5632
8262
4160
386
0
356
3824
8748
10240
9375
5184
Е
2000
82 6314
Имеем
mi = 0,041; т2 = 9,157; т3 = 1,49; т4 = 30,271;
li2 = т^т\ = 3,1553; а = 1,77632; s
2980 60542
х = 415 + 40 • 0,041 = 416,64;
: а • с = 71,0528;
fj,3 = т —
2rrii = 1,1018;
= 7П4 ~~
— 3mi = 30,269;
а3 = ^| = 0,1966; а4 = ^ = 3,04.
а6 сг4
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 385
^ ^ х - 416,64
Для аппроксимирующей кривой по переменной х = имеем
f(x) = ф) - 11 + — - (х - Зх) + —^— • (х ^6х + 3I =
= 0,3989 • е" Ж2 • [1 + 0,03276 • (ж3 - Зж) + 1,667 • 10~3 • (ж4 - 6х2 + 3)] .
Например, для х = 495
х = 495 ~ 416'64 = 1Д028; е~^ = 0,54439; х3 - Зх = -1,96721;
I ±y
ж4 - 6ж2 + 3 = -2,81794;
/A,1028) = 0,3989 • 0,54439 • [l + 0,03276 • (-1,96721) + 1,667 • 103 • (-2,81794)] = 0,20214.
Частота в соответствующем интервале равна
п • f(x) = 2000 • 0,20214 = 404.
3.6.4. Метод вкладов
Рассмотренные ранее в разделах 6.1, 6.2 и 6.3 методы восстановления функции
распределения вероятностей требуют большого количества данных и неприменимы
для малых выборок [370, 371]. Поэтому, начиная с 50-х годов, ведутся работы по
поиску эффективных методов построения функций распределения вероятностей
случайной величины по информации, содержащейся в малой выборке [371^373,
382—384]. Среди таких методов можно отметить метод вкладов с использованием
бета^распределения [374, 375], метод структурной минимизации риска [377], метод
уменьшения неопределенности [379], метод нормальных вкладов [380], метод после™
довательных медиан [381].
Широкое распространение получил метод вкладов. Суть метода вкладов заклю-
заключается в том, что каждому выборочному значению случайной величины Х{ ставит-
ставится в соответствие некоторая непрерывная функция tpi(xj)^ называемая функцией
вклада. Наибольшую эффективность демонстрирует метод, в котором в качестве
вкладов используется бета-функция [374]
где сг =
(о — а) г г Т(щ)Т(гПг)
а < х < Ъ — область существования случайной величины; Xj—реализация случай-
случайной величины, совпадающая с модой частного бета-распределения <fi(xj).
Численным экспериментом с использованием оптимизирующих критериев [376,
378] получены следующие оценки параметров частных бета-вкладов
к «¦ 0,5254
щ = 1 + IJn
0,ЗЭЭ6п~0-2335 (хп - х)
_ 0,6286тГ0'2380 - 0,ЗЭ9бг^0'2335 '
A 0,3996п'2335)(хп ^ х
1 - 0,6286п^0'2380 - 0,3996тг^0'2335 '
где п — объем выборки; #i, xn — соответственно наименьшее и наибольшее выбо-
выборочные значения.
13 А. И. Кобзарь
386 Методы анализа законов распределения вероятностей случайных величин [Гл. 3
Итоговая плотность распределения в точке Xj подсчитывается по формуле
1 п
П г=1
Задача 181. В результате эксперимента получено пять значений случайной величи-
величины Xji 1, 2, 4, 7 и 10. Необходимо с помощью метода бета-вкладов построить оценку
плотности распределения вероятностей случайной величины х.
Вычисляем
0,3996-5-°-2335-A0-1)
Сь — JL —
n oQon n поде
- 0,6286 - 5~0'2380 - 0,3996 ¦ 5~0'2335
A - 0,3996 • 50'2335) • A0 - 1)
6=1 + - —тг^ш — iprv^ = 22,98637;
1 - 0,6286 ¦ 5^0'23380 - 0,3996 • 5^0'2335
5 7 . 5
о,5254
пц = 15,2774 - щ.
22,У8оо7 — Xi
Xi + 7,315423
Вычисляем параметры бета-вкладов:
с 7 сгО,5254
щ = 1 + i^^T^;—; = 4,643588; пц = 15,2774 - 4,643588 = 10,633812;
22,98оо7 — I
1 + 7,315423 +
13,2774
П2 = г + 22,98637 - 21 = 5'081765 т^ = ЮД95639;
+1
= ! +
2 + 7,315423 +1
1 Я 2774
22,98637-4
4 + 7,315423 +
7 + 7,315423
_ 13,2774
П5 ~ + 22,98637- 10
10 + 7,315423
Далее вычисляем значения cf.
Г (щ +mi)
ГD,643588 + 10,633812)
B2,98637 + 7,315423L'643588+10'633812^1 • ГF,643588) • ГA0,633812)
ГA5,2773) 1,8380547 • 1011
30,3017914'2773 • ГD,643588) • ГA0б633812) 30,3017914'2773 ¦ ГD,643588) • ГA0,633812)
_ 1,2971 ¦ 10~10
~~ 14,6994- 1541115,637
1,2971 -100 1,2971 -10~10 аЛА 1Л_х8
ж 44 1 С) *
= 5,726-108;
f 44 1 С)
ГE,0817)-ГA0,1956) 27,1584-565781,67
= 1,2971- 10-1° = 1,2971-10-"» = . 17
ГE,9581) -Г(9,31929) 111,71426-80451,32
= 1»2971 • Ю-10 = 1-2971 ¦ Ю-10 = ^ 10^17>
ГG,2726) • Г(8,0048) 1208,4768 • 5085,2762 ' '
3.6] Подбор кривых распределения вероятностей по экспериментальным данным 387
с5 =
1,2971 • 10"
1,2971 • 10"
= 1,8487-10"
ГF,5865) • Г(8,69087) 335,9016 • 20885,6629
Вычисляем значение функции вклада
Pifci) = а • (Х1 - аO11^1 • (Ь - ая)™1 =
= 5,725 • 108 • A + 7,315423K'643588 • B2,98637 - I)9'633812 = 0,109543.
Далее вычисляем функции вкладов по аналогии, используя различные значения Xj,
Ci, rii и mi. Результаты вычислений сведены в таблицу:
(fi(xj)
<pi(xj)
<f2(Xj)
<P3(Xj)
<P4(Xj)
(f5(Xj)
/fe)
Xl = 1
0,109543
0,034305
0,019857
0,005578
0,011499
0,180782
0,036156
x2 = 2
0,105809
0,009948
0,005677
0,001365
0,003068
0,125867
0,025173
хз = 4
0,081900
0,000064
0,000238
3,5-10
1,01 • 10~4
0,082338
0,016467
Ж4 = 7
0,036800
8-10"9
4,887-100
4,103 -lO2
5,31 -lO1
0,036800
0,007360
x5 = 10
0,009938
8,24 -10~6
3,541 • 10
6,52 • 10
1,68 • 10
0,009952
0,001904
Там же приведены оценки плотности распределения вероятностей
f(Xj) = - -Y^lfiiXj).
13*
ГЛАВА 4
ПРОВЕРКА ГИПОТЕЗ О ЗНАЧЕНИЯХ
ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ
Общие положения. Высказывание гипотез о свойствах окружающего нас мира
и проверка их непосредственными наблюдениями или с помощью целенаправлен-
целенаправленного экспериментирования составляет основу того, что мы называем наукой или
научной деятельностью.
Оставляя в стороне проблему формирования гипотез (она лежит за пределами
прикладной математической статистики), рассмотрим процесс проверки их спра-
справедливости по результатам наблюдений.
Проверка научной гипотезы применительно к потребностям ежедневной прак-
практики инженера и исследователя зависит от специфики наблюдаемых процессов
и потребностей практики.
Например, часто встречающаяся на пути инженера задача — проверка соответ™
ствия параметров разработанного изделия предъявляемым требованиям — в мате-
матико-статистической формулировке может звучать так: „необходимо проверить
гипотезу о том1 что параметр е распределения случайной величины х превосхо-
превосходит заданную величину ?qu.
Сколь разнообразен и сложен окружающий нас мир, столь многочисленны
и разнообразны возможные гипотезы о его свойствах. Поэтому настоящая глава
является наиболее объемным разделом настоящей книги. Она содержит в себе
большое количество способов проверки гипотез и примеров их реализации.
Следует всегда помнить о противоречии между категоричностью и надежностью
высказываний по гипотезе: как правило, надежное высказывание некатегорично,
категорическое высказывание ненадежно. Мы выдвигаем гипотезу и отвергаем
ее тогда, когда по выборке получаем результат, маловероятный при истинности
выдвинутой гипотезы. Принятая граница маловероятности называется уровнем
значимости. При превышении этого уровня выдвинутая нулевая гипотеза отклоня-
отклоняется. Иногда пользуются доверительной вероятностью^ являющейся дополнением
уровня значимости до 1. Различие между наблюдаемым и истинным значениями
параметра распределения признается значимым на уровне значимости /3, если
правильная гипотеза будет отклонена в /3 • 100% случаев (мы чаще пользуемся
доверительной вероятностью а = 1 — /3).
При проверке гипотез возможны ошибки двух типов: первого рода — отклонение
верной гипотезы, и второго рода — принятие ложной гипотезы.
Следует помнить, что уровень значимости (или доверительная вероятность)
должен устанавливаться перед (!) получением данных.
Обычно на практике применяются доверительные вероятности 0,95 или 0,99
(уровни значимости 0,05 или 0,01). Важно неукоснительно выполнять основное
требование — гипотезы должны быть выдвинуты перед статистическим анализом,
сам числовой материал не должен быть использован для выдвижения гипотезы.
Гипотезы, выдвинутые на основе анализа полученного материала, могут быть
полезны только в качестве новых гипотез для последующих проверок.
4.1] Сравнение параметров распределений 389
4.1. Сравнение параметров распределений
Рассмотрим в качестве примера однопараметрическое распределение f(x;e) слу-
случайной величины х с параметром е. Относительно е можно выдвинуть три гипотезы
(называемые нулевыми), в соответствии с которыми неизвестный параметр е = ?q,
s > eg или ? < е® (eg — гипотетическое значение параметра). Символически эти
гипотезы обозначаются как Щ: ? = ?q ; Н^: ? > ?® и Hq : ? < ?q . Им противостоят
альтернативы, соответственно записываемые по аналогии символами
Нце^ео; Н[ : е < е0 и Щ: е > е0.
Основой для вынесения суждения по гипотезе является выборочная точечная
оценка параметра, по которой строится доверительный интервал, включающий
с заданной вероятностью неизвестное истинное значение параметра. Методы оценки
параметров распределений подробно изложены в главе 2.
Между нахождением интервальных оценок параметров и проверкой гипотез
об их возможных значениях существует тесная взаимосвязь. Это по сути два
различных способа формулировки одной задачи. Для проверки гипотез о значени-
значениях параметра достаточно найти доверительный интервал параметра и проверить,
попадает ли в него гипотетическое значение параметра.
Например, гипотеза Щ: ? = е0 не отклоняется с вероятностью а, если е0 по™
падает в двусторонний доверительный интервал параметра е с коэффициентом
доверия а. Гипотеза Hq : ? > ?q не отклоняется, если ?® не превышает нижней
границы одностороннего доверительного интервала для е; гипотеза Hq : ? < ?® не
отклоняется, если ?q превосходит верхнюю границу одностороннего доверительного
интервала.
Упрощенное изложение методологии проверки гипотез, изложенное выше, хотя и
отражает суть проблемы, но, конечно лее, не исчерпывает всех возможных ситуаций
(например, когда нужно сравнить несколько (> 2) параметров одновременно и т. п.).
Следует помнить, что суждение по гипотезе приходится выносить по резуль™
татам выборочной реализации наблюдаемых случайных величин. Случайность на™
блюдаемых величин порождает, естественно, и некоторую неопределенность наших
заключений по гипотезе. Привычная классическая формулировке „результаты на-
наблюдений подтверждают выдвинутую гипотез^ должна уступить место фор-
формуле „результаты наблюдений с достоверностью а (заранее принятая величина)
не противоречат выдвинутой гипотезе1'.
4.1.1. Сравнение параметров нормальных распределений
4.1.1.1. Сравнение двух средних значений
Имеются две выборки независимых случайных величин
Xi,Х2, ...,Xn-i,Xn И 2/1,2/2» ••-,Ут-1,Ут-
Необходимо на основе выборочных данных установить наличие значимой разни™
цы в средних двух совокупностей, из которых извлечены выборки, т. е. прове-
проверить нулевую гипотезу Hq : /jli = /j>2 против альтернатив Hi: и± ф /i2, Н[: а\ > /Х2
и H'l: Hi < Ц2-
4.1.1.1.1. Сравнение при известных дисперсиях о"^ и сг^
Статистика критерия проверки нулевой гипотезы имеет вид
(- -J^-L^l"^ - If - !^
z = [х - у) \ — + — > , где x = -y.Xi] У = ^ yyi*
I n га п т
^ ' i=l г=1
390 Проверка гипотез о значениях параметров распределений [Гл. 4
При справедливости нулевой гипотезы z-статистика имеет нормальное распреде™
ление. Гипотеза Щ: /ii = /12 предпочитается альтернативе Hi: /ii / /12 с довери™
тельной вероятностью а, если \z\ < ui+a; альтернативе Н[: /j,i > /12, если z < на;
2
и альтернативе Н": /ii < /12, если z > гхх_а (здесь Uj — 7"квантиль стандартного
нормального распределения).
Задача 182. Имеются две выборки случайных величин:
(гс = 10) хц 1,2; 2,1; 3,2; 3,6; 3,8; 4,4; 6,1; 7,1; 9; 10,2;
(гп = 8) уг: 2,4; 2,8; 4,1; 4,4; 6,8; 7,2; 8,9
с известными дисперсиями о2х = 8,7 г/ <т^ = 6,1. Проверить гипотезу равенства средних
значений Но : fix = fiy в двух выборках при доверительной вероятности а = 0,95 против
альтернативы Hi: Цг Ф fi2-
Вычисляем оценки х = — • У) хг — 5,07; у = — # У^ 2/г = 5,587 и статистику проверки
п т
нулевой гипотезы z = E,07 - 5,587) • \ — + — I = ^0,4046.
[10 8 J
Для а = 0,95 имеем (см. табл. 1) значение tti+a = tio,975 = 1,96.
2
Так как \z\ = 0,4046 < 1^0,975 = 1,96, нулевая гипотеза равенства средних не отклоня-
отклоняется.
4.1.1.1.2. Сравнение при неизвестных равных дисперсиях
Статистика критерия определяется формулой
т — \
т + п
где
п + т-2 ' г п-1^1 7 ' 2 ш-1
г=1 г=1
При справедливости нулевой гипотезы статистика критерия имеет распределе-
распределение Стьюдента (см. раздел 1.1.9) с / = n + m^2 степенями свободы. Проверка
нулевой гипотезы выполняется по аналогии со случаем, когда дисперсии известны,
с заменой квантилей стандартного нормального распределения щ на квантили
распределения Стьюдента t7, значения которых для / $С 30 приведены в табл. 118
(при / > 30 можно принять tj = г/7).
Задача 183. Имеются два ряда выборочных данных:
(п = 12) хц 1, 2, 3, 5, 7, 12, 14, 16, 16, 17, 19, 22;
(т = 10) уц 12, 16, 19, 22, 24, 26, 32, 34, 36, 44.
Необходимо проверить гипотезу равенства средних в обеих выборках Но: /ii = /i2
против альтернативы Hi: ц\ ф Ц2 при доверительной вероятности а = 0,90.
Имеем х = 11,167; у = 26,5; s\ = 52,515 (si = 7,247); si = 98,5 (s2 = 9,925).
Проверкой по критерию Фишера (см. раздел 3.1.1.3.1) убеждаемся в статистической
неразличимости (равенстве) значений s\ и s2- Вычисляем
g2 = A2-1). 52,515+A0-1). 98,5
12 + 10-2
11,167-26,5 \ Г 12 + 10
8^56 ) ' \ 12-10
= 73,21 (s = 8,56);
= -4,18.
4.1]
Сравнение параметров распределений
391
Из табл. 118 для числа степеней свободы / = 12 + 10^2 = 20 и а = 0,90 находим
ti+a = to,95 = 1,725. Так как \t\ = 4,18 > to,95 = 1,725, нулевая гипотеза равенства сред™
2
них должна быть отклонена.
Таблица 118
Таблица квантилей распределения Стыодента tT (ti_7 = —?7)
/
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
7
0,90
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
0,95
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
0,975
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
0,99
31,821
6,695
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
/
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
7
0,90
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
0,95
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
0,975
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,059
2,056
2,052
2,048
2,045
2,042
0,99
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
4.1.1.1.3. Сравнение при неизвестных неравных дисперсиях
Задача сравнения средних двух нормально распределенных совокупностей при
неизвестных и неравных (по выборочным оценкам) дисперсиях известна как про™
блема Беренса^Фишера [5] по имени авторов, впервые ее сформулировавших.
Точного решения этой задачи до настоящего времени нет. На практике обычно
используются различные приближения, некоторые из которых рассмотрены ниже.
4.1.1.1.3.1. Критерий Кохрана-Кокса [386]
1 s2 s2
Статистика критерия 1к = - (х — у), где s2 = — -\—-.
Критические значения статистики вычисляются по формуле
• / т \ , , { т \ 2 2
t'a = via I1+Za 2' где v^8i и и* = Ъ
ta(f) — «-квантиль распределения Стыодента с / степенями свободы (в нашем
случае Д = п — 1 и /2 = т — 1).
4.1.1.1.3.2. Критерий Сатервайта [387]
Статистика критерия совпадает со статистикой критерия Кохрана—Кокс. Кри-
Критическими значениями статистики являются квантили распределения Стьюдента
с числом степеней свободы
392 Проверка гипотез о значениях параметров распределений [Гл. 4
4.1.1.1.3.3. Критерий Уэлча [388]
Отличается от критерия Сатервайта только числом степеней свободы, при ко™
тором определяется критическое значение распределения Стьюдента. В критерии
Уэлча
/у =
Задача 184. Имеются две выборки данных:
(гс = 10) хп 2, 4, 6, 7, 9, 12, 14, 16, 19, 24;
(т = 9) ун 9, 14, 19, 21, 25, 29, 35, 41, 46.
Необходимо проверить гипотезу равенства средних при достоверности а = 0,95.
Вычисляем х = 1,3; у = 26,55. Далее находим:
1 10 1 9
s? = - • J2(Xi - ^f = 49'12' 4 = - - J2(yi - уJ = 1525528;
9 i=l 8 г=1
2 2
щ = -^ = 4,912; i/2 = -^ = 16,947; s2 = щ + и2 = 21,8595 (s = 4,675).
п т
Вычислим теперь статистики критериев для проверки нулевой гипотезы.
Критерий Кохрана-Кокс D.1.1.1.3.1)
Находим по табл. 118 значения to,9s(/i = п. —- 1 = 9) = 1,833 и to,95 (/2 = т —¦ 1 = 9 —
— 1 = 8) = 1,77. Вычисляем статистику критерия и ее критическое значение:
26,55 — 11,33 4,912 • 1,833 + 16,947 • 1,86
К ~~ 4,675 ~~ ' ' °'95 ~~ 4,912 + 16,947 ~~ '
Так как tx = 3,255 > to,95 = 1,853, нулевая гипотеза равенства средних отклоняется.
Критерий Сатервайта D.1.1.1.3.2)
Вычисляем
лак I1 /Ч912У , 1 /152,528\21 '
tc = 4,675 • < - • I I + - • I I ( = 12,57.
Из табл. 118 находим критическое значение: ?о,9б(/ = 12,34) « 1,77, которым также
отклоняется нулевая гипотеза.
4.1.1.1.4. Модифицированный критерий Стьюдента [389]
Статистика критерия
Ш\ + UJ2
где Ш\ = жшах — xmin и 6^2 = I/max "~ 2/min — размахи сравниваемых выборок.
Критические значения Та статистики для выборок одинакового объема п = т
приведены в табл. 119.
Если \Т\ < Ti+g , то гипотеза iifо: /ii = /12 предпочитается альтернативе
2
Л^ : |/1 ф Ц2] если Т < Та — альтернативе iif{ : /zi > /125 если Т > Та — альтернативе
U^ : /ii < /12 (ск — доверительная вероятность).
При п ^ 10 критерий не уступает по эффективности обычному критерию Стьк>
дента [390]. В связи с существенной потерей эффективности пользоваться крите-
критерием при п ^ 20 не рекомендуется.
4.1]
Сравнение параметров распределений
393
Таблица 119
Критические значения модифицированного критерия Стьюдента
для сравнения средних по двум выборкам равного объема [24]
2
3
4
5
6
7
8
9
10
Доверительная
0,95
2,322
0,974
0,644
0,493
0,405
0,347
0,306
0,275
0,250
0,975
3,427
1,272
0,813
0,613
0,499
0,426
0,373
0,334
0,304
вероятность а
0,99
5,553
1,715
1,047
0,772
0,621
0,525
0,459
0,409
0,371
0,995
7,916
2,093
1,237
0,896
0,714
0,600
0,521
0,464
0,419
12
13
14
15
16
17
18
19
20
Доверительная
0,95
0,214
0,201
0,189
0,179
0,170
0,162
0,155
0,149
0,143
0,975
0,260
0,243
0,228
0,216
0,205
0,195
0,187
0,179
0,172
вероятность а
0,99
0,315
0,294
0,276
0,261
0,247
0,236
0,225
0,216
0,207
0,995
0,355
0,331
0,311
0,293
0,278
0,264
0,252
0,242
0,232
Задача 185. Имеются две выборки данных объема п = т = 10:
хщ 2, 4, 6, 7, 9, 12, 14, 16, 19, 24;
xi2: 9, 14, 19, 21, 25, 29, 35, 41, 46, 50.
Необходимо проверить гипотезу равенства средних модифицированным критерием
Стьюдента при а = 0,95 против альтернативы Hi: fii ф цъ-
Имеем xt = 12,3; х2 = 28,9; ал = 24 - 2 = 22; ш2 = 50 - 9 = 41.
12 3 — 28 9
Находим Г = 2 • ^ i J = ^0,527.
22 + 41
Из табл. 119 для
-0,95
= 0,975 находим критическое значение Т-статиетики
2 2
ДЛЯ П = 10 - Т0,975 = 0,304.
Так как \Т\ = 0,527 > То,975 = 0,304, нулевая гипотеза равенства средних откло™
няется.
4.1.1.1.5. Парный t-критерий сравнения средних
Предположим, имеются две выборки случайных величин одинакового объема п,
члены которых расположены в порядке их наблюдения. Требуется проверить ги-
гипотезу равенства средних в этих выборках. В такой постановке двухвыборочная
задача может быть сформулирована как одновыборочная, если в качестве случай™
ной величины рассматривать разности yi = хц — Х{2 наблюдаемых пар
Статистика критерия аналогична обычной статистике Стьюдента (см. раздел
4.1.1.1.3)
t = — у/п, где у = - ^ уг] sy = —
у г=1 ^ г=1
Проверка нулевой гипотезы полностью аналогична обычному критерию Стьюдента.
Задача 186. Проверить гипотезу равенства средних двух выборок в условиях зада-
задачи 185 парным t-критерием.
Имеем последовательность разностей
Уг = хц - xi2 = 7, 10, 13, 14, 16, 17, 21, 25, 27, 26.
394 Проверка гипотез о значениях параметров распределений [Гл. 4
Находим
у = 17,6; 4 = 48>044 (sv = 6>931); * = Т^ ¦ ^10 = 8'03-
Из табл. 118 для п = 10 и а = 0,975 находим ?0,975(Ю) = 1,812.
Так как t = 8,03 > to,975 = 1,812, нулевая гипотеза отклоняется.
4.1.1.1.6. Критерий Уолша, основанный на порядковых статистиках [391]
Рассмотрим следующую ситуацию. Имеется выборка #i, ..., хп объема п из
нормального распределения со средним jii и дисперсией а2. Получено одно неза-
независимое наблюдение у из нормального распределения со средним Ц2 и такой же
дисперсией а2. Необходимо проверить гипотезу Щ: /ii = /л2 против альтернатив
Н[ : ii\ < 112 и Н'{ : iii > Ii2- По сути, нулевая гипотеза утверждает, что независимая
случайная величина у принадлежит распределению, из которого извлечена выборка
Х\, . . . , Хп.
Напомним, что k-й порядковой статистикой называется k-e по величине значение
в выборке упорядоченных по возрастанию случайных величин х\ ^ Х2 ^ ... ^ хп.
Если выборочные значения упорядочены по возрастанию, то порядковые статисти-
статистики просто являются элементами такой выборки.
Проверка гипотезы Hq : /ii = /12 включает в себя проверку справедливости серии
неравенств.
Если
у — х > \/п + 1 (х — хт) или у + х > \/п-\- 1 (х + xn+i^m) ,
где т = 1,..., 4, то нулевая гипотеза отклоняется в пользу альтернативы Hi: /12 > Mi-
Если
у — х < л/п + 1(х - xn+i^m) или у + х < \/п+ 1{х + хт),
то нулевая гипотеза отклоняется в пользу альтернативы Н[: /ii > /z2- В любом
ином случае нулевая гипотеза не отклоняется. Уровень значимости а, принимаемый
для проверки гипотезы, определяется в зависимости от принятого значения т
следующим образом:
@,5)п при т = 1;
а = <
1)@,5)п при т =
(п2 + п + 2)@,5)n+1 при т = 3;
i (n3 + 5п + 6) @,5)п при т = 4.
По сравнению с обычным критерием Стьюдента (см. раздел 4.1.1.1.3) относи™
тельная эффективность критерия Уолша равна от 0,95 при п = 6 до 0,70 при п = 16.
Задача 187. Имеется выборка данных
xf. 7, 10, 13, 14, 16, 17, 21, 26, 26, 27.
Проверить критерием Уолша гипотезу о принадлежности независимо полученного
выборочного значения у = 31 распределению, из которого извлечена выборка х%.
Имеем х = 17,6 при т=1и жю+i-i = жю = 27.
Вычисляем
1 • (ж - xi) = 35,156; V^ + 1 • (х + жю) = 147,92;
(ж - жю) = -31,176; л/п + 1 • (ж + жх) = 81,589.
4.1]
Сравнение параметров распределений
395
Непосредственной проверкой убеждаемся, что
у - ж = 31 - 17,6 = 13,4 > 35,156; у + ж = 31 + 17,6 = 48,6 < 147,02;
у-х = 31- 17,6 = 13,4 > -31,176; у + х = 31 + 17,6 = 48,6 < 81,589.
Видим, что одно из неравенств, а именно у + х < \/п + 1 • (ж + жш), удовлетворяется,
что позволяет отклонить нулевую гипотезу в пользу альтернативы Н\ : fit > /i2- To есть
значение у = 31 взято из распределения со средним, большим, чем среднее распределения
случайных величин Xi. Такой вывод сделан на уровне значимости а = @,5I0 = 0,00097,
т. е. значимым признается событие, вероятность которого не превышает 0,00097.
Это очень низкий уровень значимости (обычно на практике используются значения
0,05 или 0,1). Для а = 0,05 имеем т = 3, жз = 13 и жю+1-з = Ж8 = 25.
Тогда
(х - жз) = 15,25;
1-(х-х8) = ^24,54;
Убеждаемся, что неравенство у + ж <
ж8) = 141,28;
ж3) = 101,48.
выполняется и в этом случае,
что и на уровне значимости а = 0,05 отклоняет нулевую гипотезу в пользу гипотезы
4.1.1.1.7. Двухступенчатый двухвыборочный медианный критерий Волфа [392]
Довольно любопытный критерий сравнения средних двух совокупностей, наи™
более эффективно реализуемый применительно к испытаниям на долговечность
технических объектов.
Процедура проверки гипотезы равенства двух средних заключается в следую™
щем. Фиксируется выборка из первой совокупности объема п: Xi, ... ,жп. Опреде™
ляется ее медиана х = хп+\ (при п нечетном) или х =
Хп + Хп
(при п четном).
2 • • 2
Затем отбираются члены из второй совокупности у до тех пор, пока не будет
получено ровно г значений у-ов, превосходящих медиану.
Статистикой критерия является число Nn значений у-ов, которое необходимо,
чтобы получить ровно г значений у-ов, превосходящих медиану.
Таблица 120
Критические значения Nq (г, п)
для доверительной вероятности а = 0,95 [392]
п
3
5
г
6
7
8
9
10
11
12
13
14
15
16
17
6
7
No
6
7
8
9
10
12
13
14
15
16
17
18
6
7
п
5
7
г
8
9
10
11
12
13
14
15
6
7
8
9
10
11
No
9
10
11
12
13
15
16
17
6
7
9
10
11
13
п
7
9
11
г
12
13
5
6
7
8
9
10
11
12
5
6
7
8
No
14
15
5
6
8
9
10
12
13
14
5
6
8
9
п
11
13
15
17
г
9
10
5
6
7
8
5
7
8
9
5
6
7
8
N0
10
12
5
6
8
9
5
8
9
11
5
7
8
9
396
Проверка гипотез о значениях параметров распределений
[Гл.4
Нулевая гипотеза Но: /лу = /лх отклоняется в пользу альтернативы Hi: /лу > /лх
тогда и только тогда, когда Nn ^ TVq (r, n), где iVo(r, п)—критические значения,
приведенные в табл. 120.
Таблица 121
Значения г и Nq при п ^ 20 для двухступенчатого
двухвыборочного критерия сравнения средних
при доверительной вероятности а = 0,95 [392]
г
No
4
4
5
5
6
7
7
8
8
10
9
12
10
13
11
15
12
17
13
18
14
20
15
21
При п ^ 20 рекомендуемые значения г и No при а = 0,95 приведены в табл. 121.
Задача 188. При испытаниях п = 11 приборов получены значения ресурса
хц 790, 830, 920, 1010, 1080, 1210, 1250, 1300, 1400, 4404 ч.
Необходимо проверить, увеличилась ли долговечность приборов после их усовершен-
усовершенствования.
Для проверки гипотезы были проведены испытания усовершенствованной партии
приборов. В результате испытаний пяти приборов из усовершенствованной партии были
получены следующие значения:
уц 1090, 1100, 1120, 1090, 1200 ч.
Исходя из табл. 120, для выбранного значения г = 5 необходимо, чтобы все первые
пять значений ресурса превосходили медиану, равную в нашем случае 1080 ч. "Убежда-
"Убеждаемся, что Nn = JVo, что позволяет отклонить нулевую гипотезу в пользу альтернативы,
утверждающей значимое смещение ресурса усовершенствованных приборов в сторону
увеличения.
4.1.1.1.8. ^-критерий длм сравнения двух средних с одинаковыми дисперсиями
Критерий эквивалентен t-критерию (ем. раздел 4.1.1.1.2) и использует соотно
шение между распределением Стьюдента и ^-распределением F\j = Й, где F\j —
случайная величина, имеющая распределение Фишера с Д = 1 и /2 = / степенями
свободы.
Достоинством использования такой эквивалентной формы критерия является
экономичность в вычислениях, объем которых снижается на ^ 30%. Если мы име-
имеем выборки
..., х
П1
= /Л2 имеет вид
F =
,|/П2, то статистика критерия проверки гипотезы
¦ 712 — .
ПЩ2
Y1 У^) ~ П2
2/1
Величина F имеет распределение Фишера (см. раздел 1.1.10) с /i = 1 и
f2 = щ + П2 — 1 степенями свободы. При п\ = П2 = n имеет место соотношение
F =
где
4.1] Сравнение параметров распределений 397
Нулевая гипотеза отклоняется, если F > Fa(fi, /2), где ^(/ъ/г)—критическое
значение ^статистики на уровне значимости а при /i и /2 степенях свободы.
Для его нахождения можно воспользоваться таблицами или аппроксимациями,
приведенными в главе 1 (рекомендуется аппроксимация 9).
Задача 189. Проверить F-критерием гипотезу равенства средних в двух выборках из
нормального распределения при а = 0,95 (щ = П2 = 30)
хц 1 3 4 5 7 8 11 14 19 21 23 26 30 35 41
44 49 56 57 58 59 60 63 65 70 71 73 82 84 90;
уц 12 15 19 21 30 40 50 51 52 52 54 55 60 61 62
64 64 65 70 71 73 75 79 80 81 84 85 86 87 90.
Находим J2Xi = 1229' ЛУ^ = 17885 J2x2i = 72805; XZ 2/? = 121146 и вычисляем
Имеем m = гс2 = 30, /i = 1, /2 = 2 • 30 - 2 = 58.
У^ = 17885 J2x2i
C0 - 1) • A229 - 17
1229' ЛУ^ = 17885 J2xi = 72805; XZ 2/?
статистику критерия
788J
F =
30 • G2805 + 121146) - A2292 + 17882)
Для а = 0,95 находим из аппроксимации для F-распределения (см. аппроксимацию 9
в разделе 1.1.10) коэффициенты а = 1,4287, Ъ = 0,95 и с = 0,681. Тогда имеем
h = 2flh = 1,9661; g = ^^А = 0,98276;
/1 + /2 /1 - /2
lgF0,95(l;58) = 1,4287- A,9661 - 0,95)" 2 -0,681-0,98276 = 0,7709;
Fo,95(l;58) = 100'7709 = 5,900.
Так как F = 8,155 > .Fo,95 A; 58) = 5,900, гипотеза равенства средних отклоняется.
4.1.1.2. Сравнение нескольких (к > 2) средних
Имеются к выборок равного объема п из нормалвно распределенной совокупно-
совокупности Жц, #12, • • • ,Х1п1] Ж21,Ж22, • • • ,^2п25 • • • ; Хк1,Хк2, • • • , %кпк •
Проверке подле^кит нулевая гипотеза о статистической неразличимости средних
Но'- fJ>i = /J>2 = • - - = Ук против альтернативы
Hi: |a4+i — fjio\ > 0 (г = 1, ..., к).
4.1.1.2.1. Модифицированный критерий Стьюдента
Статистика критерия имеет вид
к
) (^ j max %jmin)
i=i
где Xjmax, Xjm_in — наибольшее и наименьшее значения j-й выборки.
Если Q > Qa(A;,7i), где Qa(k,n)—критическое значение статистики, приведен™
ное в табл. 122, то нулевая гипотеза отклоняется.
Критерий достаточно прост в применении, но, в связи с большой потерей эф-
эффективности с ростом объема выборки, его рекомендуется применять при п ^ 10.
398
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 122
Критические значения Qa(kjn)
модифицированного критерия Стьюдента [119, 393]
к
п
2
3
4
5
6
7
8
9
10
Доверительная вероятность а = 0,05
1
2
3
4
5
6
7
8
9
10
18,10
3,50
1,79
1,18
0,89
0,71
0,59
0,50
0,44
0,39
7,60
2,50
1,44
1,01
0,78
0,64
0,53
0,46
0,41
0,36
6,20
2,30
1,41
1,01
0,78
0,64
0,54
0,47
0,42
0,37
5,80
2,30
1,43
1,03
0,81
0,66
0,56
0,49
0,43
0,39
5,70
2,40
1,47
1,07
0,84
0,69
0,59
0,51
0,45
0,40
5,70
2,40
1,52
1,11
0,87
0,71
0,61
0,53
0,47
0,42
5,80
2,50
1,57
1,14
0,91
0,74
0,64
0,56
0,49
0,44
5,90
2,60
1,62
1,19
0,94
0,77
0,66
0,58
0,51
0,46
6,00
2,60
1,68
1,23
0,97
0,80
0,68
0,60
0,53
0,47
Доверительная вероятность а = 0,01
1
2
3
4
5
6
7
8
9
10
90,00
8,30
3,40
2,00
1,43
1,09
0,89
0,74
0,64
0,56
17,50
4,00
2,10
1,42
1,07
0,86
0,71
0,61
0,53
0,47
11,20
3,40
1,91
1,33
1,01
0,82
0,69
0,60
0,52
0,47
9,30
3,20
1,87
1,32
1,01
0,82
0,70
0,60
0,53
0,47
8,60
3,10
1,87
1,33
1,03
0,84
0,72
0,62
0,55
0,49
8,20
3,10
1,90
1,36
1,06
0,86
0,74
0,64
0,56
0,50
8,00
3,10
1,93
1,39
1,09
0,89
0,76
0,66
0,58
0,52
8,00
3,20
1,98
1,43
1,12
0,92
0,78
0,68
0,60
0,54
8,00
3,20
2,00
1,47
1,15
0,95
0,80
0,70
0,62
0,55
Задача 190. В результате испытаний пяти выборок приборов объемом п = 8 каж-
каждая, изготовленных разными заводами, получены следующие значения долговечности
приборов (ч):
11
15
8
4
24
14
19
11
5
26
18
21
14
9
32
21
22
19
18
48
30
26
31
24
54
32
38
32
31
62
40
41
44
45
66
45
52
58
61
70.
Требуется проверить гипотезу о статистической неразличимости средних значений
долговечности в выборках на уровне значимости а = 0,05 модифицированным крите-
критерием Стьюдента.
Вычисляем предварительно суммы
J2 хц = 211; J2 х^ = 234' J2 жзг = 217; J2 х^ = 1975 J2 х^ = 3825
Имеем
= 382: mm
in) = 234.
= 197: Q =
382 - 197
224
= 0,8259.
Из табл. 122 для a = 0,05, k = Б и п = 8 находим критическое значение
Go,05 E,8) = 0,91. Так как Q = 0,826 < Qo,o5E,8) = 0,91, нулевая гипотеза равенства сред-
средних не отклоняется, однако критерий находится вблизи критической зоны.
4.1] Сравнение параметров распределений 399
4.1.1.2.2. Критерий „стьюдентизированного" размаха
Статистика критерия
q = ( max Xj — mm
_ l A
где Xj = — y. xij и sf — независимая оценка стандартного отклонения случайных
п ,
величин Xij, полученная на отдельной выборке объема п = / + 1.
Нулевая гипотеза отклоняется, если q > ga(n,/), где qa{nj) —критическое зна™
чение, приведенное в табл. 123.
Для применения критерия необходимо предварительно иметь оценку стандарт-
стандартного отклонения а по отдельной выборке и располагать информацией о том, что
дисперсии во всех выборках одинаковы (методы проверки этого предположения,
т.е. методы сравнения дисперсий, изложены в разделе 4.1.1.4).
Задача 191. Проверить на уровне значимости а = 0,95 гипотезу равенства сред-
средних критерием „стьюдентизированногоа размаха, если оценка стандартного откло-
отклонения Sf получена по выборке
х{: 10, 12, 14, 19, 22, 28, 34, 46, 52, 61, 70.
В качестве выборочного материала использовать данные задачи 190.
Имеем
хг = 26,375; х2 = 29,25; ж3 = 27,125; х4 = 24,625; х5 = 47,75;
f 1 " 2р
z5 = 47,75; min% = 26,375; sf = { • 2^{хг - xf } = 20,868.
г=1
Тогда q = —^ • D7,75 - 26,375) = 3,239.
20,868 v 5;5
Из табл. 123 для а = 0,05, / = 10 и п = 8 имеем go,os(8,10) = 5,30.
Так как q = 3,239 < go,os(8,10) = 5,30, гипотеза равенства средних не отклоняется.
4.1.1.2.3. Дисперсионный критерий
Статистика критерия имеет вид
k
kn (n — 1) j=i
fc-1
где
F =
- if ^ 1
При справедливости нулевой гипотезы статистика критерия имеет распределен
ние Фишера (см. раздел 1.1.10) c/i = fc — 1и/2 = &(п—1) степенями свободы.
При F > Fa(k — 1; к (п — 1)) нулевая гипотеза отклоняется. Здесь -Fa(/i, /2) —
«^квантиль ^^распределения, ее значения могут быть найдены или по соответствую
ющим таблицам, или с помощью аппроксимации.
400
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 123
Жритические значения с|о,(п,, /)
„стьюдентизированного" размаха [119]
п
/
2
5
10
15
20
30
40
60
оо
Доверительная вероятность а = 0,05
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
6,08
8,33
9,80
10,88
11,74
12,44
13,03
13,54
13,99
14,39
14,75
15,08
15,38
15,65
15,91
16,14
16,37
16,57
16,77
3,64
4,60
5,22
5,67
6,03
6,33
6,58
6,80
6,99
7,17
7,32
7,47
7,60
7,72
7,83
7,93
8,03
8,12
8,21
3,15
3,88
4,33
4,65
4,91
5,12
5,30
5,46
5,60
5,72
5,83
5,93
6,03
6,11
6,19
6,27
6,34
6,40
6,47
3,01
3,67
4,08
4,37
4,59
4,78
4,94
5,08
5,20
5,31
5,40
5,49
5,57
5,65
5,72
5,78
5,85
5,90
5,96
2,95
3,58
3,96
4,23
4,45
4,62
4,77
4,90
5,01
5,11
5,20
5,28
5,36
5,43
5,49
5,55
5,61
5,66
5,71
2,89
3,49
3,85
4,10
4,30
4,46
4,60
4,72
4,82
4,92
5,00
5,08
5,15
5,21
5,27
5,33
5,38
5,43
5,47
2,86
3,44
3,79
4,04
4,23
4,39
4,52
4,63
4,73
4,82
4,90
4,98
5,04
5,11
5,16
5,22
5,27
5,31
5,36
2,83
3,40
3,74
3,98
4,16
4,31
4,44
4,55
4,65
4,73
4,81
4,88
4,94
5,00
5,06
5,11
5,15
5,20
5,24
2,77
3,31
3,63
3,86
4,03
4,17
4,29
4,39
4,47
4,55
4,62
4,68
4,73
4,80
4,85
4,89
4,93
4,97
5,01
Доверительная вероятность а = 0,01
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
14,04
19,02
22,29
24,72
26,63
28,20
29,53
30,68
31,69
32,59
33,40
34,13
34,81
35,43
36,00
36,53
37,03
37,50
37,95
5,70
6,98
7,80
8,42
8,91
9,32
9,67
9,97
10,24
10,48
10,70
10,89
11,08
11,24
11,40
11,55
11,68
11,81
11,93
4,48
5,27
5,77
6,14
6,43
6,67
6,87
7,05
7,21
7,36
7,49
7,60
7,71
7,81
7,91
7,99
8,08
8,15
8,23
4,17
4,84
5,25
5,56
5,80
5,99
6,16
6,31
6,44
6,55
6,66
6,76
6,84
6,93
7,00
7,07
7,14
7,20
7,26
4,02
4,64
5,02
5,29
5,51
5,69
5,84
5,97
6,09
6,19
6,28
6,37
6,45
6,52
6,59
6,65
6,71
6,77
6,82
3,89
4,45
4,80
5,05
5,24
5,40
5,54
5,65
5,76
5,85
5,93
6,01
6,08
6,14
6,20
6,26
6,31
6,36
6,41
3,82
4,37
4,70
4,93
5,11
5,26
5,39
5,50
5,60
5,69
5,76
5,83
5,90
5,96
6,02
6,07
6,12
6,16
6,21
3,76
4,28
4,59
4,82
4,99
5,13
5,25
5,36
5,45
5,53
5,60
5,67
5,73
5,78
5,84
5,89
5,93
5,97
6,01
3,64
4,12
4,40
4,60
4,76
4,88
4,99
5,08
5,16
5,23
5,29
5,35
5,40
5,45
5,49
5,54
5,57
5,61
5,65
При /2 = fc(n—1)>4 можно использовать упрощенный критерий Романовско™
го [13], основанный на статистике
R =
4.1] Сравнение параметров распределений 401
где
к
п[к(п-1)- 2] j=i 2 (fcn - 3)
к-1
Если R ^ 3, нулевая гипотеза отклоняется.
Изложенная процедура называется однофакторным дисперсионным анализом.
Подробно дисперсионный анализ изложен в главе 5.
Следует помнить, что применение этого критерия при отсутствии нормальности
исходных распределений величин Xij не рекомендуется, так как он становится в этом
случае неустойчивым.
Его устойчивость к отклонениям от нормальности повышается, если использо™
вать модифицированные степени свободы для i^-критерия [87]:
где
, кп +1 с A s2
d=l+ ; с=—; v =
кп — 1 кп — с и кп —
кп(кп + 1)а4 - Цкп - l)s22 _ J^ " .
Задача 192. Проверить в условиях задачи 190 гипотезу равенства средних при дове-
доверительной вероятности а = 0,95.
Имеем
xi = 26,375; х2 = 29,25; х3 = 27,125; х4 = 24,625; ж5 = 47,75;
1 5 8 5 5 8
х= 'J2J2Xii= 315°255 JZ fe ~ xf = 363,66875; ]Г J2 (Xii ~ xjf = 9603,124.
j = l i=l j = l j = l г=1
^ 5-8-7 363,66875
Отсюда F = • = 2,65.
5-1 9603,124
Для а = 0,95, /i = 5 - 1 = 4 и /2 = 5 • (8 - 1) = 35 имеем F0,95D; 35) = 2,67 (см., на»
пример, табл. А7 в [10]).
Так как F = 2,65 < „Fb,95 D; 35) = 2,67, нулевая гипотеза не отклоняется.
Рассмотрим теперь более устойчивый критерий. Вычисляем
5 8 5 8
s2 = J2 J2 (XiJ ~ хзТ = 9602,34; s4 = ]Г J2 (Xii ~~ xif = 5077427,388;
А = 5-8-E-8 + D-5077427,388-3. E-8-l).9602,34^ = _Mg8Q
E • 8 - 1) • E • 8 - 2) • E • 8 - 3) ' '
9602,34 44880,84582
и = '— = 246,2138; с = =~ = ^0,7403;
5-8-1 246,21382
d = 1 + L*±± (-0-7403) =0,98089;
5-8-1 5 • 8 + 0,7403
/i = 0,98089 . E - 1) = 3,923; /2 = 0,98089 • 5 • 7 = 34,3.
Видим, что число степеней свободы несколько снижается, что позволяет отклонить
гипотезу.
402 Проверка гипотез о значениях параметров распределений [Гл. 4
Рассмотрим упрощенный критерий Романовского:
= 8.E-7-2) _ 360,66875 = = / 2 • (Б • 8 - 3) =
5-1 9602,234 v у E - !) • E ' 8 ~ 5 ~ 4)
^ = 3,209.
0,7725
Так как R > 3, нулевая гипотеза отклоняется.
4.1.1.2.4. Критерий Полсона
В [394] Полсоном рассмотрена проблема выделения среди к выборок, по п
наблюдений в каждой, выборки со средним значением, большим, чем у (Aj — 1)
остальных.
Статистика критерия имеет вид
п I max Xi — х ] ь
А = , где х = т
\
Если А ^ Аа, то с вероятностью а справедлива нулевая гипотеза Но : х\ = ... = х^.
В ином случае (А > Ха) выборка с наибольшим средним признается значимо от-
отличной от остальных.
Критическое значение статистики равно
п(к ~~
где Faf — a'-квантиль распределения Фишера с Д = 1 и /2 = кп — 2 степенями
свободы и а' = —^.
к
2а
Значения для а' = — следует брать из обычных таблиц ^-распределения,
используя аппроксимацию по а. Некоторые значения Fa/(l',kn — 2) приведены
в табл. 124, составленной на основе данных таблиц i-статистики Вонферрони [87, 395].
Задача 193. Проверить критерием Полсона в условиях задачи 190 гипотезу равен-
равенства средних против альтернативы, утверждающей, что выборка с наибольшим сред-
ним значимо отличается от остальных (а = 0,95).
5 8
Имеем max х* = 47,75; х = 31,025; \" Y" (хц - жJ = 9602,34.
Находим А = ' = 1,365. Из табл. 124 для к = Ъ, п = 8 ш а = 0,95
'9602,34
имеем F'a = 5,90. Вычисляем критическое значение
А095 =
/ 0927-
5- E-7 + 5-2 + 5,90)
Так как А = 1,365 > Ао,э5 = 0,927, нулевая гипотеза отклоняется и выборка со сред™
ним Xj = 47,75 должна быть признана значимо отличающейся от остальных. Этот вывод
не совпадает с ранее полученным, что может быть следствием отклонения распределения
значений x%j от нормального, а критерий Полсона очень критичен к нормальности
распределения.
4.1]
Сравнение параметров распределений
403
Значения
Таблица 124
; кп — 2) для доверительной вероятности а = 0,95
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
30
к
2
7,71
5,99
5,32
4,96
4,75
4,60
4,49
4,41
4,35
4,30
4,26
4,22
4,20
4,17
4,15
4,13
4,11
4,10
4,00
3
7,10
5,91
5,68
5,41
5,29
5,17
5,09
5,01
4,96
4,93
4,89
4,85
4,83
4,81
4,79
4,77
4,76
4,75
4,63
4
6,94
6,30
5,98
5,79
5,66
5,57
5,50
5,45
5,41
5,39
5,35
5,34
5,29
5,26
5,24
5,21
5,18
5,15
5,02
5
7,02
6,51
6,25
6,09
5,98
5,90
5,86
5,81
5,78
5,75
5,71
5,68
5,66
5,63
5,61
5,59
5,57
5,56
5,41
6
7,61
7,11
6,86
6,70
6,59
6,54
6,49
6,45
6,39
6,37
6,35
6,33
6,31
6,29
6,27
6,25
6,23
6,20
6,02
7
7,31
6,93
6,72
6,59
6,49
6,42
6,39
6,37
6,34
6,30
6,28
6,26
6,24
6,22
6,20
6,18
6,16
6,15
6,02
8
7,54
7,16
7,05
6,91
6,85
6,81
6,79
6,77
6,75
6,72
6,70
6,68
6,65
6,62
6,59
6,57
6,55
6,53
6,41
9
7,29
7,30
7,15
7,11
6,95
6,90
6,86
6,82
6,78
6,75
6,72
6,69
6,67
6,65
6,63
6,60
6,59
6,58
6,51
10
7,63
7,35
7,24
7,05
6,95
6,91
6,87
6,85
6,83
6,81
6,79
6,77
6,75
6,73
6,71
6,70
6,68
6,63
6,52
4.1.1.2.5. Метод прямого сравнения (критерий Тьюки)
В [396] рассмотрен критерий, основанный на последовательности статистик
\Xj - X
сравнивающих попарно все исследуемые средние Xj с общим средним. В этом
случае s2 является оценкой общей дисперсии с / = &(п — 1) степенями свободы,
т. е.
-1 к п
-\2
j = li=l
Если Tj < Та для всех j = 1, ..., к, где Та —критическое значение статистики,
приведенное в табл. 125, то нулевая гипотеза не отклоняется. Нарушение нера-
неравенства при любом значении j отклоняет нулевую гипотезу. Предполагается, что
дисперсии s1- всех выборок статистически неразличимы. Этот критерий является
альтернативой дисперсионному анализу (см. раздел 4.1.1.2.3).
Задача 194. В условиях задачи 190 проверить гипотезу равенства средних методом
прямого сравнения при доверительной вероятности а = 0,95.
Имеем
= 26,375; х2 = 29,25; х3 = 27,125; х4 = 24,625; х5 = 31,025;
S2 =
1
= 274,35257.
404
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 125
Критические значения Та критерия Тьюки [396]
/
к
3
4
5
6
7
8
9
10
Доверительная вероятность а = 0,90
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
30
60
120
3,164
2?813
2,629
2,516
2,440
2,385
2,344
2,312
2,286
2,265
2,247
2,232
2,219
2,208
2,198
2,190
2,182
2,175
2,133
2,092
2,068
3,094
2,877
2,744
2,654
2,589
2,540
2,502
2,472
2,447
2,426
2,408
2,393
2,379
2,368
2,357
2,348
2,340
2,290
2,241
2,193
3,054
3,032
2,806
2,734
2,679
2,636
2,602
2,574
2,551
2,531
2,514
2,499
2,486
2,474
2,464
2,455
2,398
2,343
2,289
2,924
2,846
2,787
2,740
2,703
2,673
2,647
2,626
2,607
2,591
2,577
2,565
2,553
2,544
2,482
2,422
2,363
3,020
2,937
2,875
2,826
2,786
2,754
2,727
2,704
2,684
2,667
2,652
2,638
2,626
2,616
2,550
2,486
2,423
3,015
2,949
2,898
2,856
2,822
2,794
2,769
2,748
2,730
2,715
2,700
2,688
2,677
2,607
2,539
2,473
3,014
2,960
2,917
2,881
2,852
2,826
2,804
2,786
2,769
2,754
2,741
2,730
2,657
2,586
2,516
3,015
2,970
2,934
2,903
2,876
2,854
2,834
2,817
2,802
2,788
2,776
2,700
2,627
2,554
Доверительная вероятность а = 0,95
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
30
60
120
4,148
3,565
3,254
3,068
2,944
2,857
2,791
2,741
2,700
2,667
2,640
2,617
2,597
2,580
2,565
2,552
2,540
2,530
2,465
2,404
2,367
3,889
3,527
3,311
3,168
3,066
2,990
2,931
2,884
2,845
2,813
2,786
2,763
2,743
2,726
2,711
2,697
2,685
2,610
2,538
2,497
3,724
3,486
3,327
3,215
3,131
3,066
3,014
2,971
2,936
2,906
2,881
2,859
2,840
2,823
2,808
2,794
2,711
2,632
2,587
3,622
4,453
3,332
3,242
3,172
3,116
3,070
3,032
3,000
2,973
2,949
2,928
2,910
2,894
2,879
2,790
2,704
2,656
3,556
3,428
3,333
3,259
3,200
3,151
3,111
3,077
3,048
3,023
3,001
2,982
2,965
2,949
2,854
2,764
2,713
3,510
3,410
3,333
3,271
3,220
3,178
3,143
3,112
3,086
3,063
3,043
3,025
3,009
2,909
2,814
2,761
3,478
3,397
3,333
3,281
3,237
3,200
3,168
3,141
3,117
3,096
3,077
3,060
2,957
2,857
2,803
3,454
3,388
3,334
3,289
3,250
3,219
3,189
3,164
3,143
3,123
3,106
2,998
2,896
2,839
4.1] Сравнение параметров распределений 405
Вычисляем
|26,375-31,025| |29,25 - 31,025|
Tl= lfisfi2 5-1 =°'888' Т2= 5,23768 =°'339'
|27,125-3?W| = 124,625 - 31,0251 =
5,23768 ' ' 5,23768
т |47-те - 3!:025
5,23768 '
Для / = к • (п — 1) = 5 • (8 — 1) = 35 степеней свободы, а = 0,95 и к = 5 из табл. 125
имеем То,95 = 2,6. Так как Т% = 3,193 > То,95 = 2,6, нулевая гипотеза равенства средних
отклоняется, так как ж5 значимо отклоняется от х.
Этот вывод совпадает с заключением, полученным при использовании критерия
Полсона (задача 193).
4.1.1.2.6. Критерий „стьюдентизированного" максимума
(обобщенный критерий Тьмжи)
Критерий основан на использовании верхней а • 100%-й критической точки
та^*,и модуля „стьюдентизированного" максимума max — с параметрами
к* = — и г/ = Aj (п — 1). Подробно критерий рассмотрен в [397, 398].
Средние г-й и j-й выборок признаются не различающимися, если
,г?3 = 1? • • • 7 ^5 г Т 3)'
Здесь, как и ранее, s2 является оценкой дисперсии объединенной выборки с
у = к(п — 1) степенями свободы, т. е.
i к п
Таким образом, нулевая гипотеза равенства всех j = 1, ..., к средних не откло™
fc(fc-l)
няется только тогда, когда все —- пар средних удовлетворяют вышеприведен™
ному неравенству.
Таблицы значений та^*,и опубликованы в [399, 400], наиболее полные таблицы
содержатся в [398]. Фрагмент этой таблицы воспроизведен в табл. 126.
Задача 195. В условиях задачи 190 проверить гипотезу равенства средних критерием
„стьюдентизированного" максимума при доверительной вероятности а = 0,95.
Имеем
п = 8; к = 5; и = к • (п - 1) = 35; хг = 26,375; х2 = 29,25; ж3 = 27,125;
ж4 = 24,625; ж5 = 47,75; s = 16,563.
Вычисляем = = 10 значений Мц:
2 3 3
Ml2 =
406
Проверка гипотез о значениях параметров распределений
[Гл.4
и далее по аналогии
М13 = 0,091; Мы = 0,212; М15 = 2,585; М23 = 0,257; М24 = 0,559;
М25 = 2,237; М34 = 0,302; М35 = 2,494; М45 = 2,797.
Из табл. 126 для v = k • (п — 1) = 35, & = 5 и а = 0,95 получаем (интерполяцией)
majk*,u = 2,97. Так как все значения Mij < 2,97, следует принять нулевую гипотезу
равенства средних. Необходимо помнить, что применение этого критерия предполагает
равенство (стохастическое ) выборочных дисперсий сравниваемых выборок.
Таблица 126
Критические значения критерия та,к*,и
„стьюдентизированного" максимума [398]
к
к*
5
7
10
i
12
16
20
24
30
60
120
Доверительная вероятность а = 0,95
3
4
5
6
7
8
9
10
12
14
16
18
20
3
6
10
15
21
28
36
45
66
91
120
153
190
3,40
3,93
4,31
4,61
4,85
5,06
5,23
5,38
5,64
5,85
6,03
6,18
6,31
3,05
3,49
3,80
4,05
4,25
4,42
4,57
4,69
4,91
5,08
5,23
5,36
5,47
2,83
3,20
3,47
3,68
3,85
3,99
4,12
4,22
4,41
4,56
4,69
4,80
4,90
2,75
3,09
3,34
3,54
3,77
3,83
3,95
4,05
4,22
4,37
4,49
4,59
4,68
2,65
2,97
3,20
3,38
3,52
3,64
3,75
3,84
4,00
4,13
4,24
4,33
4,42
2,59
2,90
3,11
3,28
3,42
3,53
3,63
3,72
3,87
3,99
4,09
4,18
4,26
2,56
2,85
3,06
3,22
3,35
3,46
3,56
3,64
3,78
3,90
4,00
4,08
4,16
0,52
2,80
3,00
3,16
3,29
3,39
3,48
3,56
3,70
3,81
3,90
3,98
4,06
2,45
2,76
2,90
3,04
3,16
3,25
3,33
3,41
3,53
3,63
3,71
3,78
3,85
2,42
2,72
2,85
2,98
3,09
3,18
3,19
3,33
3,44
3,54
3,62
3,68
3,75
Доверительная вероятность а = 0,90
3
4
5
6
7
8
9
10
12
14
16
18
20
3
6
10
15
21
28
36
45
66
91
120
153
190
2,78
3,24
3,58
3,84
4,05
4,22
4,37
4,51
4,73
4,91
5,06
5,19
5,30
2,55
2,96
3,25
3,48
3,66
3,81
3,94
4,06
4,25
4,41
4,54
4,66
4,76
2,41
2,77
3,03
3,23
3,39
3,53
3,64
3,75
3,92
4,06
4,18
4,28
4,37
2,36
2,70
2,95
3,14
3,29
3,42
3,53
3,63
3,79
3,92
4,04
4,13
4,22
2,29
2,62
2,84
3,02
3,16
3,29
3,39
3,48
3,63
3,76
3,86
3,95
4,03
2,25
2,57
2,79
2,96
3,09
3,21
3,31
3,39
3,54
3,66
3,76
3,85
3,92
2,23
2,53
2,75
2,91
3,04
3,16
3,25
3,33
3,48
3,59
3,69
3,77
3,85
2,21
2,50
2,71
2,87
3,00
3,10
3,20
3,28
3,41
3,52
3,62
3,70
3,77
2,16
2,44
2,63
2,78
2,90
3,00
3,09
3,16
3,29
3,39
3,47
3,55
3,62
2,14
2,41
2,60
2,74
2,85
2,95
3,03
3,10
3,22
3,32
3,40
3,47
3,54
4.1.1.2.7. Критерий Шеффе
Среди к средних значений, предварительно упорядоченных по величине:
%1 ^ ^2 ^ • •. ^ Хк, производится (к — 1) сравнений. Например, для к = 5 произво™
дится к — 1 = 4 множественных сравнения
Если при этом будет превышена критическая разница, то нулевая гипотеза
о равенстве средних /^ и /ij отклоняется.
4.1] Сравнение параметров распределений 407
Шеффе [401] предложил использовать в качестве критического значения вели™
чину
где
к п -I к -|
? ? ^ ~
к (п - 1) ? ? ^ ^ ' ^=fc?^' XJ =
F<x(fii /2) — а-квантиль распределения Фишера с Д = А; — 1 и /2 = А:(тг — 1) сте-
степенями свободы (может быть взята из таблиц или аппроксимирована — см. раз™
дел 1.1.10). Критерий Шеффе является грубым критерием и особенно пригоден
тогда, когда имеется подозрение о неравенстве дисперсий s2- (j = 1, ..., к) между
собой.
Задача 196. В условиях задачи 190 проверить нулевую гипотезу равенства средних
критерием Шеффе при доверительной вероятности а = 0,95.
Имеем
п = 8; к = 5; хг = 26,375; х2 = 29,25; ж3 = 27,125; х4 = 24,625; ж5 = 47,75;
s = 16,563; Д = fc - 1 = 4; /2 = fc • (п - 1) = 35.
Из таблиц ^-распределения для а = 0,95, Д = 4 и Д = 35 находим .Fo,95D; 35) = 2,65.
/24
Следовательно, D\ = 16,563 • 4 / • 2,65 = 26,963.
Имеем ж5 - Ж1 = 47,75 - 24,625 = 23,125 < Вг = 26,963.
Очевидно, что дальнейшая проверка не имеет смысла, и критерий Шеффе не откло-
отклоняет нулевую гипотезу.
4.1.1.2.8. Критерий Стьюдента-Ньюмена-Кейлса
Критерий предложен в [402, 403]. Алгоритм его применения аналогичен крите-
критерию Шеффе (см. раздел 4.1.1.2.7), отличаясь от него только критическим значением
разности средних.
В критерии Стьюдента^Ньюмена^Кейлса критическая разность средних равна
D2 = J-q(k*J,a),
где g(fc*,/, а)—множитель, значения которого приведены в табл. 127; к*—коли-
к*—количество средних значений между сравниваемыми, включая сами эти значения (на-
(например, для разности ж5 — ^4 имеем к* = 2, а для разности х5 — ^2 имеем к* =4);
-< к п
f = к(п — 1) —число степеней свободы при оценке s2; s2 = 77 тт У2 У2 (xij ~~ %) 5
к{<п~^ j=n=i
1 к п
j = l i=l
Задача 197. В условиях задачи 190 проверить гипотезу равенства средних критерием
Стьюдента-Ньюмена-Кейлса при доверительной вероятности а = 0,95.
Из табл. 127 для х5 - хг(к* = 5), / = к • (п ~~ 1) = 35 и а = 0,95 имеем дE,35,0,95) =
= 4,07. Тогда D2 = q • ~4= = 4'07' г^563 = 23,833.
Vn V8
жб^жх = 47,75^24,625 = 23,125 « D2 = 23,833, нулевая гипотеза отклоняется.
408 Проверка гипотез о значениях параметров распределений [Гл. 4
4.1.1.2.9. Критерий Дункана
Дункан [404] предложил модификацию критерия Стьюдента-Ыьюмена-Кейлса,
заменив уровень значимости а на а' = 1 — A — а)
Метод Дункана дает наименьшие допуски для разности средних и наиболее
широко применим. Он позволяет „уловить" различие между средними, которые
„пропускает" критерий Стьюдента—Ньюмена—Кейлса. Алгоритм применения кри-
критерия Дункана D$ идентичен алгоритму критерия Стьюдента—Ньюмена—Кейлса
(см. раздел 4.1.1.2.8), отличаясь от него только использованием вместо множи-
множителя q(k*1f1a) множителя g(fc*,/, а;), значения которого для а = 0,95 приведены
в табл. 128.
Задача 198. В условиях задачи 190 проверить гипотезу равенства средних критерием
Дункана при доверительной вероятности а = 0,95.
Из табл. 128 для х5 — х\ (к* = 5) имеем при f = к • (п — 1) = ЗЪ дE; 35; 0,95) = 3,18.
m ^ s 3,18 • 16,563
Тогда D3 = q • — = ¦=?¦ = 18,622.
\/п V8
Так как х% — х\ = 47,75 — 24,625 = 23,125 > ТK = 18,622, нулевая гипотеза отклоня-
отклоняется (хъ признается с вероятностью 0,95 большим, чем х\).
Для х5 - х2 (к* = 4) имеем q D; 35; 0,95) = 3,12 ш D3 = -?—'-=1 = 18,270.
v 8
Так как х% — Х2 = 47,75 — 26,375 = 21,375, то и разница между х§ и Х2 признается
значимой. Далее по аналогии для
х5 - х3 (к* = 3) имеем D3 = 3'02'^563 = 17,684.
v 8
Имеем xs — х3 = 47,74 — 27,125 = 20,625 > D3l что также позволяет прийти к заклю-
заключению о значимости разности между х§ и х3.
Для х5 - х3 имеем D3 = 16,748 и х5 - х4 = 47,75 - 29,75 = 18,0 > D3 = 16,748.
Таким образом, х§ значимо больше, чем xi, X2, х3 и аЦ- Можсно показать, что
остальные пары средних критерием Дункана статистически не различимы.
Отметим, что, в отличие от ряда ранее использовавшихся критериев, критерий
Дункана, как более чувствительный критерий, отклонил нулевую гипотезу достаточно
уверенно.
4.1.1.2.10. Критерий Л инка-Уоллеса
Критерий предложен в [405, 406] и достаточно полно изложен в [9]. Его приме-
применение предполагает нормальность распределения xij, равенство дисперсий s? и рав™
ные объемы сравниваемых выборок (п). Обозначим через Rj = max хц — mm Xij
размах j-й выборки, а через R = max Xj — min x* размах средних к выборок.
Нулевая гипотеза равенства средних отклоняется, если
К = — > К(п, к, а),
где К(п,к^а)—критические значения, приведенные в табл. 129.
к
У j ^3
Если Xi — Xj > К(п, Aj, a) , то с вероятностью а средние х\ и Xj признаются
статистически различимыми.
4.1]
Сравнение параметров распределений
409
ИГ
s
И
1
s
о- а
к в
Ш
о
CM
on
гЧ
CO
CM
о
О)
сю
со
Ю
со
см
см
т-Ч
т-Ч
00
ел
о
т-Ч
69
о
т—1
35
о
т-Ч
ю
О5
О5
46
ел
00
т-Ч
ел
ю
00
00
48
00
04
00
О
ю
ь-
82
CD
91
ю
о
ю
-xf
СО
СО
СМ
ел
ео
о
О5
OS
b-
00
52
00
т—1
см
00
83
i>
60
ь-
LO
СО
ь-
05
т-Ч
ь~
CD
О5
СМ
СО
CD
Ю
04
Ю
93
СО
т-Ч
СМ
00
00
о
00
83
ь-
60
ь~
см
ОО
ь-
99
CD
80
CD
00
LO
СО
33
CD
03
CD
b-
CO
LO
22
ю
о
CO
63
CO
Ю
СЛ
Ю
b-
CO
b-
CM
b-
03
b-
O5
b-
CD
49
CD
32
CD
CM
t—1
CD
90
ю
63
ю
о
CO
Ю
90
-xf
34
-xf
46
CO
CD
b-
T—1
b-
CM
о
b-
85
CO
66
CD
CO
CO
CO
T—1
CD
О
О
CD
CM
GO
LO
T—1
CD
LO
36
LO
CO
о
LO
68
CD
T—1
34
CO
b-
b-
00
CD
00
b-
CD
b-
Ю
CO
39
CD
GO
t—1
CO
92
ю
b-
b-
Ю
о
CO
Ю
40
Ю
b-
t—1
Ю
O5
00
'xf
53
о
26
CO
00
CD
CD
T—1
Ю
CD
36
CD
O5
T—1
CD
00
O5
LO
Ю
Ю
Ю
CO
Ю
24
Ю
02
Ю
41
-xf
95
CO
О
CM
CO
OS
b-
CD
CO
CD
CD
т-Ч
CO
03
CD
CO
00
LO
60
ю
46
ю
о
CO
LO
CM
t—1
Ю
t—1
LO
CD
33
00
00
CO
LO
т-Ч
CO
О
CO
CO
CD
О
CM
CO
06
CO
90
LO
T—I
b-
LO
49
LO
LO
CO
Ю
О
CM
LO
03
LO
82
b~
LO
26
82
CO
t—1
T—i
CO
T—i
T—1
CM
CD
O5
О
CO
95
LO
80
LO
T—!
CO
LO
39
LO
b-
CM
LO
CM
г—1
LO
95
LO
b-
^
т-Ч
LO
20
b-
b-
00
08
CO
CM
г—1
t—1
CD
O5
CD
Ю
86
ю
t—1
[>
Ю
CO
Ю
Ю
32
Ю
СЛ
T—1
Ю
Ю
о
Ю
00
00
69
-xf
Ю
-f
Ю
t—1
-xf
CO
b-
CO
05
CO
CO
CO
о
CD
т-Ч
O5
LO
OS
b-
LO
64
LO
CO
LO
25
LO
CO
T—1
LO
O5
O5
83
64
т-Ч
i—1
t—1
о
b-
CO
03
CO
CD
Ю
LO
00
LO
CM
b-
LO
57
Ю
о
LO
20
Ю
08
ю
O5
00
b-
^
CD
LO
^
b-
OO
08
67
00
01
CO
Ю
о
O5
Ю
b-
LO
66
LO
52
Ю
LO
CO
LO
Ю
t—1
LO
03
Ю
О
O5
b~
CD
LO
^
CO
CO
05
-xf
65
CO
О
о
CO
CD
00
Ю
CO
b-
LO
т-Ч
CD
LO
47
ю
т-Ч
CO
LO
т—1
т-Ч
Ю
99
CD
00
70
CM
LO
о
CO
CM
о
63
CO
98
CM
b-
СЛ
b-
Ю
O5
со
Ю
b-
Ю
Ю
43
Ю
b-
CM
Ю
07
Ю
96
CM
00
67
49
GO
CM
-xf
о
о
61
00
97
CM
00
LQ
b-
LO
LO
CD
LO
CO
LO
LO
39
LO
CO
CM
LO
04
LO
92
C5
64
47
LO
CM
98
CO
O5
LO
CO
96
CM
OS
T—1
b-
Ю
т-Ч
CD
LO
49
LO
36
Ю
о
CM
LO
T 1
о
Ю
90
b-
b-
62
45
CO
CM
96
CO
00
LO
CO
95
CM
о
CO
LO
CO
Ю
LO
43
Ю
30
LO
Ю
T—I
LO
96
85
CM
b~
58
T—1
о
CM
93
CO
Ю
LO
CO
93
CM
CM
CD
LO
Ю
49
LO
38
LO
25
ю
о
т-Ч
LO
92
81
00
CD
54
37
b-
Т-Ч
90
CO
CO
LO
00
92
CM
Ю
Ю
Ю
CD
Ю
34
ю
T—1
CM
Ю
CD
О
Ю
O5
00
-xf
00
b-
^
Ю
CD
-xf
t—1
Ю
34
-xf
T 1
¦"xf
00
00
CO
t—1
Ю
CO
t—1
СЛ
CM
CD
T—1
LO
LO
CM
LO
О
CO
Ю
GO
T—I
Ю
CO
О
LO
CD
00
^
Ю
b-
^
CM
CO
48
CM
CO
^
CM
т-Ч
^
CD
00
CO
О
LO
CO
90
CM
00
b-
-xf
Ю
00
CO
LO
b~
CM
LO
LO
Ю
о
о
LO
82
CM
b-
о
CD
"xt1
46
30
о
т-Ч
85
CO
49
00
89
CM
о
CD
CO
Ю
b~
CM
Ю
CD
T—1
Ю
04
ю
о
O5
73
-xf
63
CM
Ю
-xf
39
CO
CM
-xf
О
"xf
79
CO
44
CO
86
CM
о
OS
CM
LO
о
CM
LO
о
т-Ч
LO
99
LO
CO
"хЧ
69
00
LO
^
b-
"хЧ
34
OS
т-Ч
О
о
CD
b-
CO
41
CO
84
CM
о
CM
Ю
Ю
т—1
Ю
06
Ю
94
гЧ
00
'xf
65
Ю
Ю
-xf
'xf
'xf
31
CD
t—1
-xf
GO
O5
CO
-xf
b-
CO
о
'xf
00
83
CM
о
CO
т-Ч
Ю
о
LO
95
84
56
-xf
CO
CO
24
о
т-Ч
CM
O5
CO
68
CO
36
CO
80
CM
о
т-Ч
410
Проверка гипотез о значениях параметров распределений
[Гл.4
00
CM
к ю
VO О"
о
оо
со
^
см
о
аз
оо
ь-
ю
ю
«
со
см
см
LO
-xf
52
см
LO
см
ю
-xf
см
ю
'xf
см
ю
^
см
ю
-xf
см
ю
'xf
см
LO
см
ю
'xf
см
LO
'xf
см
Ю
^
см
ю
'xf
о
LO
'xf
СО
СО
о
"xf
03
03
00
о
СО
о
03
-xf
СО
о
"xf
СО
о
03
00
о
СО
о
03
-xf
о
93
00
т-Ч
00
СО
т—1
00
СО
т-Н
00
СО
т-Н
00
СО
т-Н
00
СО
т-Ч
00
СО
т-Ч
00
СО
т—1
00
СО
т—1
00
СО
т-Н
00
СО
т-Н
00
СО
80
СО
ю
ь-
СО
64
СО
ю
о
00
СО
80
ео
о
ь-
00
о
СО
о
О0
о
СО
о
00
о
t-
ео
о
00
аз
CD
ОО
00
СО
О0
65
СО
аз
ю
00
СО
-xf
ео
СО
СО
CD
СО
63
00
63
СО
СО
СО
СО
00
СО
00
63
ОО
СО
со
СО
СО
со
00
см
CD
СО
т-Н
СО
СО
аз
ю
00
Ю
ю
ОО
00
-xf
00
СО
СО
00
Ю
СО
58
00
00
Ю
00
00
ю
СО
00
ю
00
00
LO
СО
00
ю
СО
00
Ю
00
ь-
ю
00
ю
ю
00
СМ
LO
00
48
СО
О
СО
CD
СМ
00
00
Ю
Ю
СО
55
СО
ю
LO
СО
LO
ю
СО
Ю
Ю
СО
Ю
ю
СО
Ю
СО
Ю
СО
СМ
LO
СО
О
ю
СО
'xf
СО
42
СО
СО
СО
О
см
СО
аз
СО
Ю
СО
53
СО
00
Ю
СО
СО
Ю
СО
СО
ю
00
СМ
ю
ОО
СМ
ю
СО
о
ю
00
аз
'xf
СО
CD
СО
СО
00
38
ОО
О5
СМ
00
ю
1—1
СО
О
т-Ч
LO
СО
т—1
LO
ОО
LO
00
т-Н
ю
СО
ю
ео
о
LO
00
49
СО
00
ОО
46
00
44
00
О
-xf
ео
34
00
СО
см
О0
т—1
1—1
00
1—1
о
ю
СО
50
СО
о
ю
СО
о
ю
СО
о
ю
СО
00
-xf
СО
47
СО
СО
СО
"xf
СО
т-Н
СО
t-
СО
СО
т-Ч
СО
СО
СМ
см
СО
08
СО
СМ
аз
со
49
СО
49
СО
аз
СО
00
ОО
ь-
ОО
СО
СО
СО
СМ
СО
аз
оо
ОО
ю
СО
ОО
аз
см
СО
О
СМ
ОО
06
ОО
СО
00
СО
48
СО
00
СО
48
СО
ь-
00
46
СО
44
СО
СО
СО
О
СО
ь-
ОО
СО
СО
СО
00
1>
СМ
00
00
СО
03
00
00
"¦xf
СО
48
00
00
00
48
СО
СО
00
45
СО
43
СО
т—1
00
39
СО
СО
ОО
00
СО
СО
LO
СМ
00
СО
ОО
01
00
Ю
00
СО
48
ео
00
СО
ь-
00
со
О0
СО
СМ
СО
О
ео
00
СО
СО
00
ОО
о
СО
ОО
СМ
СО
00
О
о
ео
СО
О0
СО
48
СО
ь-
'xf
СО
CD
СО
Ю
00
СО
СО
т-Ч
СО
аз
00
СО
ь-
СО
СО
СО
СО
СО
00
СМ
00
СМ
см
ОО
СО
СО
00
аз
см
00
ь-
00
ь-
00
46
СО
ео
см
00
40
СО
00
ео
оо
36
00
СМ
СО
00
ь-
см
ео
т-Ч
СМ
00
СМ
О0
97
см
00
СО
47
СО
ь-
СО
СО
СО
СО
СМ
СО
40
СО
00
СО
СО
35
СО
т-Н
СО
СО
со
СМ
СО
О
СМ
СО
т-Ч
СО
96
см
аз
ь-
00
47
ОО
46
СО
LO
СО
'xf
'xf
ОО
т-Ч
СО
аз
ОО
СО
ь-
00
О0
СО
СО
О
ОО
ОО
'xf
см
ОО
аз
т-Ч
СО
О
ОО
95
см
о
¦*xf
СО
46
СО
46
СО
44
СО
СМ
00
39
СО
ь-
00
СО
СО
СМ
00
СО
00
СМ
СО
СО
СМ
00
СО
т-Ч
СО
О
СО
92
см
"xf
СО
46
СО
ю
СО
СО
'xf
СО
о
'xf
СО
СО
СО
ю
СО
СО
СМ
СО
СО
аз
см
СО
ю
см
СО
о
см
СО
СО
т-Н
СО
'xf
о
СО
89
см
о
ь-
00
46
ОО
'xf
СО
СМ
'xf
СО
аз
СО
ОО
LO
СО
СО
СО
ОО
СО
о
ОО
ОО
ь-
см
СО
см
см
ОО
ь-
т—1
ОО
о
т-Ч
ОО
т-Ч
о
ОО
86
см
о
00
45
СО
ео
00
т-Н
-xf
СО
ь-
00
ео
33
СО
т-Ч
00
СО
00
СМ
ОО
"xf
см
00
О
см
00
-xf
т-Ч
ео
07
00
00
аз
см
00
00
СМ
о
"xf
СО
45
СО
СМ
СО
СО
СО
со
СО
СО
т-Ч
СО
СО
аз
см
СО
ю
см
СО
СМ
ся
СО
т-Н
СО
см
т-Ч
СО
04
СО
ю
аз
см
80
см
о
т-Н
4.1]
Сравнение параметров распределений
411
СЗ
СМ
сб
и
ф
0
х
—1
О,
крите
для
—N
ш
К
го
ф
—
S
II
d
1
0
х
§
а
ш
д
п
Л
е;
ш
S
а
ф
0
S
Oi
п
о
ио
со
см
о
о
00
Jv_
со
ю
^ф
со
см
ь-
см
о
о
СО
о
СО
СО
О
00
СО
О
СП
О
т-Н
ю
о
CD
LO
О
см
со
о
о
о
о
00
о
СЗ
о
т-Н
т-Ч
1,44
о
СЗ
см
ю
см
о
00
см
о
т-Ч
СО
о
ю
СО
о
о
о
г-
о
т-Ч
ю
о
ь-
ю
о
со
СО
о
см
о
00
О
т-Ч
О
т-Ч
ю
см
см
CD
ю
см
О
ь-
см
о
о
СО
о
СО
О
СЪ
СО
О
»о
о
о
ю
о
ю
Ю
о
т—1
CD
О
о
IN-
о
см
00
О
СО
аз
о
аз
СО
LQ
СО
СМ
О
ь-
см
о
о
СО
о
СО
О
СЪ
СО
О
ю
О
О
О
ю
ю
о
т-Ч
CD
О
со
СО
о
о
00
о
ю
аз
о
о
ю
CD
Ю
СМ
о
ь-
см
о
о
СО
о
СО
о
съ
СО
О
ю
о
о
ю
о
ю
ю
о
1—1
СО
о
аз
со
о
о
00
о
ю
аз
о
*!
а>
ю
см
о
00
см
о
СО
о
Ю
СО
О
СЪ
СО
О
СО
О
О
ю
о
ю
ю
о
см
со
о
о
о
т-Ч
00
о
со
СЗ
о
00
ч.
00
ю
см
о
00
см
о
т-Ч
СО
о
ю
СО
о
<-)
о
о
т-Ч
ю
о
СО
ю
О
см
СО
О
т-Ч
JN-
О
СМ
СО
О
h-
аз
о
аз
о
ю
аз
СО
см
о
аз
см
о
см
СО
О
CD
СО
О
т-Ч
о
г-
о
см
ю
о
ь-
ю
о
со
CD
О
СМ
in
о
со
00
о
00
аз
о
1,20
см
ю
о
1^
см
о
аз
см
о
см
СО
О
со
СО
О
т-Ч
"*чР
о
ОО
О
СМ
ю
о
00
ю
О
^
СО
О
СО
IN
о
00
О
СЪ
СО
о
см
см
ю
т—|
г-
см
о
о
СО
о
СО
СО
О
г-
СО
О
ГМ
о
СТ)
О
СО
Ю
О
00
ю
О
ю
CD
О
^
IN-
О
ю
00
О
т-Ч
О
СО
СМ
СО
LQ
СМ
ь-
см
о
о
СО
о
СО
СО
О
Г-
СО
О
ГМ
о
о^
о
LQ
о
О)
LO
о
со
CD
О
ю
JN
о
CD
00
О
СМ
о
1,25
00
ю
СО
00
см
О
О
СО
О
^
СО
О
00
СО
О
СО
О
О
ю
О
Ю
ю
О
о
со
о
h-
CD
О
СО
о
00
О
СО
О
со
см
о
СО
00
см
О
ч—|
СО
О
^
СО
О
00
СО
О
О
т-Ч
ю
о
ю
ю
о
ч—|
СО
о
ОО
СО
О
г-
IN-
О
аз
00
о
»о
о
00
СМ
см
CD
а»
см
о
т-Ч
СО
О
ю
СО
О
СО
СО
О
О
см
ю
о
со
ю
о
см
со
о
съ
CD
о
00
о
о
СО
о
СО
О
о
СО
CD
CD
аз
см
о
см
СО
О
ю
СО
О
аз
СО
О
»П
О
СМ
LO
о
г-
ю
о
СО
СО
О
о
IN
°
аз
IN
о
т-Ч
аз
о
00
о
1,31
СО
CD
сз
см
о
см
СО
о
со
СО
о
о
о
СО
о
со
ю
о
00
ю
о
со
о
1—1
JN
°
О
00
о
см
СЗ
О
СТ)
О
СО
СО
00
CD
00
О
СО
О
СО
СО
О
СО
СО
О
т-Ч
О
со
О
ю
о
аз
ю
о
со
О
см
JN-
О
т-Ч
00
О
СО
аз
о
о
т-Ч
ю
СО
О
JN-
оз
о
СО
О
СО
СО
О
IN-
СО
О
т-Ч
О
IN-
О
LQ
О
СЗ
LQ
о
ю
со
о
СО
JN-
О
СМ
00
О
ю
СЗ
о
см
т-Н
1,36
см
ь-
о
СО
о
СО
о
т-Ч
о
со
о
гм
ю
о
о
CD
о
со
со
о
СО
IN
О
т—1
00
О
т-Н
о
о
ю
о
т-Ч
см
см
ю
см
аз
о
г-~
СО
О
о
о
о
о
ю
о
ю
о
СО
со
о
см
ь-
о
аз
In
О
00
00
О
аз
аз
о
т-Ч
т-Ч
ю
СО
СО
со
00
О
СМ
о
СЗ
СО
О
СО
о
00
О
СО
ю
о
т-Ч
СО
О
т-Н
о
ь-
ь-
о
ю
00
о
СЗ
о
со
о
т—1
см
см
т-Ч
ю
IN
00
см
см
о
о
ю
о
ю
ю
о
о
CD
о
г-
СО
о
г-
IN
о
съ
00
о
1^
аз
о
ь-
о
т-Ч
съ
т-Ч
т-Ч
СО
1—1
ю
ю
т-Ч
со
00
2,23
т—|
00
см
о
т-Ч
412 Проверка гипотез о значениях параметров распределений [Гл. 4
Задача 199. В условиях задачи 190 проверить гипотезу равенства средних критерием
Линка-Уоллеса при доверительной вероятности а = 0,95.
Имеем
#i = 45 - 11 = 34; R2 = 52 - 15 = 37; R3 = 58 - 8 = 50; R4 = 61 - 4 = 57;
5
R5 = 70 ~~ 24 = 46; ]P Rd = 224; Д = max% - min% = 47,75 - 24,625 = 23,125.
i=i
Вычисляем
= 8-23,125 =
224 '
Из табл. 129 для а = 0,95, fc = 5 и п = 8 имеем К(8, 5, 0,95) = 0,81.
Так как К = 0,826 > /?"(8,5,0,95) = 0,81, нулевая гипотеза отклоняется.
Находим критическую разницу средних
Видим, что Х5 — х\ = 47,75 — 24,625 = 23,125 превосходит эту величину.
Следовательно, разность между ж 5 и х\ признается значимой.
4.1.1.3. Сравнение двух дисперсий
Для двух выборок нормально распределенных случайных величин ж1? ..., хп
и 2/1, ..., ут необходимо проверить гипотезу равенства дисперсий о~\ и <т|, опираясь
на их выборочные оценки s\ и s\.
4.1.1.3.1. Критерий Фишера
Если выборочными оценками максимального правдоподобия дисперсий являются
1 п -I га
2
то статистика критерия Фишера записывается как F = -j.
s2
При справедливости нулевой гипотезы Ы®: ®f = o\ статистика критерия имеет
распределение Фишера (см. раздел 1.1.10) с Д = п — 1 и /2 = m ^ 1 степенями
свободы, где п и т — объемы сравниваемых выборок.
Если F > Fi+g (n — 1; ?тг — 1) ж F < Fi~a (п — 1; ?п — 1), то нулевая гипотеза от-
2 2
клоняется в пользу альтернативы Hi: а\ ф (г\.
Если F > Fa(n — 1; ?п — 1), то нулевая гипотеза отклоняется в пользу альтер-
альтернативы Н[: af > <j\ (a — доверительная вероятность). В числителе всегда должна
стоять большая по величине из двух сравниваемых дисперсий.
Критерий Фишера очень чувствителен к отклонениям от нормальности
[407^409] распределения а^, у%. Его устойчивость к отклонениям от нормальности
может быть повышена соответствующей корректировкой степеней свободы [87].
Вместо /i и /2 в этом случае используются степени свободы
f[=df и f2 = bf, где
п + m — F2 — 3)
= 1
4.1] Сравнение параметров распределений 413
В дальнейшем процедура проверки нулевой гипотезы не отличается от обычного
.F-критерия. Критические значения ^статистики приведены в таблицах (ссылки на
таблицы см. в разделе 1.1.10).
Задача 200. Имеются две выборки нормально распределенных случайных величин
(п = т = 10):
хц 2,1; 3,1; 4,8; 6,1; 7,4; 8,5; 10,1; 12,1; 14,0; 15,6;
уц 4,6; 6,1; 8,2; 9,8; 9,9; 10,4; 13,1; 14,5; 16,1; 19,1.
Необходимо проверить гипотезу равенства дисперсий Но: a2 = <j\ против альтерна-
альтернативы Hi: а\ ф о\ при доверительной вероятности а = 0?95.
Имеем
ж = 8,38; у =11,18;
1 10 -I 10
¦4 = j^j ¦ Е (х> - *J = 20>757; *2 = j^j ¦ Е (у* - уJ = 20>419-
Далее F = -^ = —' = 1,016. Из таблиц находим
^ si 20,419 '
F1+a (n - 1; т - 1) = Fi+o!95 A0 - 1; 10 - 1) = F0;975(9; 9) = 4,03.
2 2
Так как F = 1,016 < Fo,975 (9,9) = 4,03, нулевая гипотеза не отклоняется.
Рассмотрим теперь критерий со скорректированными степенями свободы. Имеем
ю ю ю
]Г (хг - xf = 186,813; ]Г (уг - уJ = 183,771; ]Г (Xi - жL = 6439,996;
г=1 г=1 г=1
= 7281,725; Ь2 = A0 + 10) • 6439^96 + 7281^ = lj99832;
' ' 1 ^ A86,813+ 183,771J
d = { 1 + 0,5 • 10 + 1°4 • A,99832 - 3) 1 = 1,802.
[ 10 + 10-3-A,99832-3) v 7J
Окончательно имеем /{ = d • /i = 1,802 • 9 = 16,22 и f2 = d • f2 = 16,22.
Из таблиц [87] для дробных степеней свободы и = 0,975 имеем
F0!975A6,22; 16,22) « 2,65. Так как F = 1,016 < Fo,975 = 2,65, нулевая гипотеза не
отклоняется и в этом случае.
4.1.1.3.2. Критерий Романовского [207]
Статистика критерия:
т-3 si
Если R ^ 3, то нулевая гипотеза равенства дисперсий отклоняется с достовер-
достоверностью не менее 0,89.
Задача 201. Для данных задачи 200 проверить гипотезу равенства дисперсий крите-
критерием Романовского.
Имеем
-=0,7906;
10-1 20,419 ' ' ч У A0-1)-A0-5)
Так как R < 3, нулевая гипотеза равенства дисперсий не отклоняется.
414
Проверка гипотез о значениях параметров распределений
[Гл.4
4.1.1.3.3. Критерий отношения размахов
Статистика критерия имеет вид
где шп = жтах — хш-1П; шт = ?/тах — ут[п — размахи сравниваемых выборок.
Если F* > F?, где F?—критическое значение статистики, то нулевая гипоте-
гипотеза отклоняется с вероятностью а. Критические значения F^(n^m) приведены в
табл. 130, заимствованной из [25]. При п ^ 15 мощность критерия отношения разма-
размахов практически не отличается от мощности критерия Фишера (см. раздел 4.1.1.3.1)
(в числителе всегда должно быть наибольшее из двух значение размаха).
Таблица 130
Критические значения F* (то, тог) отношения размахов
(а — доверительная вероятность) [25]
п
3
4
5
6
7
8
т
2
3
4
5
3
4
5
6
3
4
5
6
7
8
4
5
6
7
8
9
10
5
6
7
8
9
10
11
12
5
0,95
3,90
4,37
5,14
5,71
2,03
2,66
3,07
3,38
1,60
2,06
2,35
2,57
2,74
3,00
1,99
2,16
2,30
2,41
2,51
2,59
2,67
1,92
2,03
2,13
2,21
2,28
2,35
2,40
2,46
1,75
а
0,99
7,37
9,99
11,71
12,98
3,72
4,79
5,49
6,01
2,66
3,32
3,76
4,08
4,36
4,73
2,98
3,22
3,41
3,56
3,70
3,81
3,92
2,74
2,89
3,02
3,13
3,22
3,30
3,38
3,44
2,44
п
8
9
10
11
т
6
7
8
9
10
11
12
5
6
7
8
9
10
11
12
13
14
15
6
7
8
9
10
11
12
13
14
15
8
9
а
0,95
1,85
1,94
2,01
2,08
2,13
2,18
2,23
1,63
1,72
1,80
1,87
1,93
1,98
2,02
2,07
2,10
2,14
2,17
1,63
1,70
1,76
1,81
1,86
1,90
1,94
1,98
2,01
2,04
1,67
1,72
0,99
2,57
2,67
2,76
2,84
2,91
2,98
2,56
2,23
2,34
2,43
2,14
2,20
2,26
2,31
2,75
2,80
2,84
2,88
2,17
2,26
2,33
2,39
2,45
2,50
2,54
2,59
2,62
2,66
2,19
2,25
п
11
12
13
14
15
т
10
11
12
13
14
15
10
11
12
13
14
15
10
11
12
13
14
15
10
11
12
13
14
15
10
11
12
13
14
15
а
0,95
1,77
1,81
1,84
1,88
1,91
1,93
1,69
1,73
1,77
1,80
1,82
1,85
1,63
1,67
1,70
1,73
1,76
1,78
1,58
1,61
1,64
1,67
1,70
1,72
1,53
1,57
1,60
1,62
1,65
1,67
0,99
2,30
2,34
2,39
2,42
2,46
2,49
2,18
2,22
2,26
2,30
2,33
2,36
2,08
2,12
2,16
2,19
2,22
2,25
2,00
2,04
2,07
2,10
2,13
2,16
1,93
1,97
2,00
2,03
2,06
2,08
Задача 202. Для данных задачи 200 проверить гипотезу равенства дисперсий крите-
критерием отношения размахов при доверительной вероятности а = 0,95.
Имеем шп = 15,6 - 2,1 = 13,5 и шт = 19,1 - 4,6 = 14,5.
4.1] Сравнение параметров распределений 415
Далее F* = JJJ = 1,074.
Из табл. 130 для п = т= 10 ша = 0,95 имеем F0*95 A0,10) = 1,86.
Так как F* = 1,074 < Fq g^A0,10) = 1,86, нулевая гипотеза равенства дисперсий не
отклоняется.
4.1.1.3.4. Критерий „стьюдентизированного" размаха
Статистика критерия:
q — •) ГДе Шп — З^гпах «^min? ®m —
Нулевая гипотеза равенства дисперсий отклоняется, если g > ga, где qa—кри™
тическое значение статистики, приведенное в табл. 123 (следует помнить, что здесь
Задача 203. Для данных задачи 200 проверить гипотезу равенства дисперсий крите-
критерием „стъюдентизированного" размаха при а = 0,95.
Имеем
Г 1 10 1 *
Шп = 15,6 - 2,1 = 13,5; у = 11,18; sm = < • ]Г (у* - уJ У = 4,519.
Тогда q = f^ = 2599.
Из табл. 123 для п = 10, / = 10^1 = 9иа = 0,95 имеем до,95 ^ 5,5.
Так как q = 2,99 < до,95 = 5,5, нулевая гипотеза равенства дисперсий не отклоняется.
4.1.1.3.5. Критерий Аризоно-Охты
Предложен в [410] и основан на энтропийном критерии нормальности Васичека
(см. раздел 3.2.2.2).
Если обе выборки упорядочены:
xi ^ х2 ^ • • • ^ хп и уг ^ у2 ^ ... ^ уш,
то статистика записывается в форме
П
где Xij yj —порядковые статистики выборок (т.е. упорядоченные по величине эле-
элементы выборок).
При г, j ^ 1 хг (yj) = хг (уг) и при г (j) > п (т) хг (yj) = хп (ут).
Критерий практически не уступает по мощности критерию Фишера (см. раз™
дел 4.1.1.3.1) при п (т) ^ 20.
При Ki(a) ^ К ^ K2(ol) нулевая гипотеза равенства дисперсий не отклоняется.
Здесь Ki(a) и К2(а) —критические значения статистики, приведенные в табл. 131.
При К < К\(а) или К > К2(о) нулевая гипотеза отклоняется (здесь а — довери™
тельная вероятность).
416
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 131
Критические значения jK"i(q:) (верхняя строка)
и K?(ol) (нижняя строка) статистики Аризоно^Охты
для доверительной вероятности ol = 0,95 [410]
3
5
8
10
15
20
с
1
2
3
3
3
3
m = 3
d=l
0,139
7,425
0,105
2,613
0,087
1,892
0,082
1,619
0,072
1,270
0,069
1,167
5
2
0,316
3,087
0,264
2,045
0,244
1,739
0,218
1,350
0,199
1,205
8
3
0,435
2,316
0,398
1,945
0,360
1,488
0,335
1,346
10
3
0,468
2,101
0,425
1,617
0,408
1,427
15
3
0,559
1,804
0,530
1,576
20
3
0,602
1,692
В табл. 131 указаны соотношения п{гп) и c(d), обеспечивающие максимальную
мощность критерия.
Задача 204. В условиях задачи 200 проверить нулевую гипотезу равенства дисперсий
критерием Аризоно-Охты.
Имеем п = т = 10. Из табл. 131 выбираем с = d = 3.
Вычисляем (имея в виду, что х% = х\ при г ^ 1 и х% = хп при г ^ п):
ю
Д (xi+3 ^ Жг-з) = (х4 - хг) • (х5 - хг) • - • (х10 - х6) • (х10 - х7) =
г=1
= F,2 - 2,1) • G,4 - 2,1) • • • A5,6 - 8,5) • A5,6 - 10,1) = 2,80223251 • 108;
1
B,8023251 • 108I0 = 6,994223;
ю
П B/i+3 - Vj-з) = (9,8 - 4,6) • (9,9 - 4,6) • • • A9,1 - 10,4) • A9,1 - 13,1) = 43770949;
i=i
D3770949) То = 5,8092303.
^ г/ 3 10 6,9944223
Окончательно получаем К = — • — • = 1,204.
3 10 5,8092303
Для п = т = 10, c = d = 3ma = 0,95 из табл. 131 имеем
lfi@,95) = 0,468 и #2 @,95) = 2,101.
Так как #i@,95) = 0,468 < К = 1,204 < 1^@,95) = 2,101, нулевая гипотеза равенства
дисперсий не отклоняется.
4.1.1.4. Сравнение нескольких (к > 2) дисперсий
Пусть sf,s|, • • •, s|—взаимно независимые выборочные оценки дисперсий
-f,a|, ..., G^ по выборкам объема Bi,B2, . ..,п^. Проверяется нулевая гипотеза
q : о\ = сг|+1 против альтернативы Но: af / сг|+1 (для г = 1, 2, ..., Aj — 1).
4.1] Сравнение параметров распределений 417
4.1.1.4.1. Критерий Бартлетта
Предложен в [411], основан на статистике
При щ > 3 (г = 1, ..., Aj) и справедливости нулевой гипотезы величина
Г 1 (к 1 Л)
В = М < 1 -\ j-. г I У^ I } имеет распределение у2 с f = к — 1
[ 3(fc^ 1) у^ гг* — 1 ny j
степенями свободы (о распределении %2 см. раздел 1.1.8).
Если В > Ха(/)? то с достоверностью а нулевая гипотеза отклоняется. Крити™
ческие значения Х«(/) содержатся в табл. 55 или могут быть вычислены с помощью
аппроксимаций.
При / > 30 можно использовать аппроксимацию Вилсона^Хилферти (см. ап™
( 2 / 2 \
проксимацию 3 в разделе 1.1.8) Х«(/) ^ ^114 7+^ai/^I ? гДе иа —квантиль
V 9/ V 9J У
стандартного нормального распределения. Критерий очень чувствителен к откло-
отклонениям от нормальности распределения исследуемых случайных величин. Если
нет уверенности в нормальности распределения (критерии проверки нормальности
распределения рассмотрены в разделе 3.2), им не рекомендуется пользоваться. При
отклонении от нормальности рекомендуется вместо статистики М пользоваться ее
модификацией [22, 87, 412]
М* =
Статистика М* имеет ^-распределение с /i и /2 степенями свободы. Поэтому
нулевую гипотезу следует отклонить, если М* > Fa (/15/2).
Задача 205. Имеются четыре выборки (к = 4) объема п = 5 каждая
хц: 3, 4, 5, 6, 7; xi2: 2, 8, 9, 11, 15;
xi3: 9, 11, 15, 20, 28; xi4: 4, 6, 8, 10, 16.
Необходимо проверить нулевую гипотезу равенства дисперсий в выборках Но: (Т\ =
= а\ = и\ = а! критерием Барлетта при доверительной вероятности а = 0,95.
Имеем
X! =5; х2 = 9; х3 = 16,6; ж4 = 8,8;
1 5
s\ = • J2(Xil - Xlf = 2'5 (Sl = !'581M
1 5
1 5
5з = • У)(ж*з - ж3J = 58,3 (s3 = 7,635);
1 5 9
^(xi4 ~~ хА = 21 2 (s4 =
5 - :
14 А. И. Кобзарь
418 Проверка гипотез о значениях параметров распределений [Гл. 4
Вычисляем
5 -.4 4
га = 53 (п* - 1) = 4 • 4 = 16; М = 16 '1п ~ * J2 4 * ^ ~ J2 4 *ln s* = 456088;
г=1 i=l i=l
c=l+ / • fe ^-- ^ = 1,04; 5 = ^ = 1^=4,474.
3-D-l) 1^5-1 16 I ' ' с 1,104
Из табл. 55 для /=fc^l=4^1=3 находим Хо,9бC) = 7,81.
Так как В = 4,174 < Хоэб(З) = 7,81, нулевая гипотеза не отклоняется. Применим
теперь уточненный критерий. Находим
/i = fc - 1 = 3; /2 = fc + 19 = 4 + 1 9 = 462,28;
(с-IJ A,104™ IJ ' '
ь 462,282 ki^k^ дж* 462,28-4,6088
Ь = = 514,566; М = = 1,393.
462,28 ¦ B,1,104) + 1,104 3 • E14,566 - 4,6088)
Из таблиц находим F0,95C; 462,3) = 2,60. Так как М* = 1,393 < F0,95 = 2,60, нулевая
гипотеза не отклоняется.
4.1.1.4.2. Критерий Кохрана
Для случая выборок равных объемов (тц = п при г = 1,2, ...,&) Кохран [414]
предложил критерий, основанный на статистике
max si
г=1
Если g" > g"a(Aj, гг), то нулевая гипотеза отклоняется. Значения приведены
в табл. 132. Критические значения можно найти также, пользуясь таблицами
F-распределения, с помощью соотношения
Ffc+1_a [п - 1; (п - 1) (fc - 1I
БаУ ' J ~ k^l + Fk^1+a \п - 1; (п - 1) (к - I)] ?
к
где i^7(/i,/2)—7™квантиль ^-распределения с /i и /2 степенями свободы.
Задача 206. Проверить нулевую гипотезу равенства дисперсий в условиях задачи 205
критерием Кохрана при доверительной вероятности а = 0,95.
Имеем J2 s<2i = 2'5 + 22'5 + 58'3 + 21,2 = 104,5; max s\ = 58,3.
Г О О
Тогда g = —— = о,558.
б 104,5
Из табл. 132 для n = 5, k = 4 ш а = 0,95 имеем go,95D; 5) = 0,721.
Так как g = 0,558 < go,95 D; 5) = 0,721, нулевая гипотеза не отклоняется. Если вое™
пользоваться таблицами /^-распределения, то мы бы получили
^4^1+0,95 [E - 1); E - 1) • D - 1)] = F0,987D; 12) « 5,4; go,95D; 5) = 5Л = 0,643.
4 4 — I + 5,4
Естественно, что приближение, дающее удовлетворительные результаты при п ^ 20,
не обеспечило в нашем случае приемлемой точности.
4.1]
Сравнение параметров распределений
419
Таблица 132
Критические значения ^а(к^п) статистики Кохрана
для доверительной вероятности ос = 0,95 [25]
к
2
3
4
5
6
7
8
9
10
12
15
20
30
к
2
3
4
5
6
7
8
9
10
12
15
20
30
п
2
0,999
0,993
0,967
0,928
0,883
0,838
0,794
0,754
0,707
0,653
0,548
0,480
0,363
3
0,995
0,942
0,864
0,788
0,722
0,664
0,615
0,573
0,536
0,475
0,407
0,330
0,241
4
0,979
0,883
0,781
0,696
0,626
0,568
0,521
0,481
0,447
0,392
0,332
0,265
0,191
5
0,959
0,833
0,721
0,633
0,563
0,508
0,463
0,425
0,393
0,343
0,288
0,229
0,163
6
0,937
0,793
0,676
0,587
0,519
0,466
0,423
0,387
0,357
0,310
0,259
0,205
0,145
7
0,917
0,761
0,641
0,553
0,487
0,435
0,393
0,359
0,331
0,286
0,239
0,188
0,133
те
8
0,899
0,733
0,613
0,526
0,461
0,410
0,370
0,338
0,311
0,268
0,223
0,175
0,123
9
0,882
0,711
0,590
0,504
0,440
0,391
0,352
0,321
0,294
0,253
0,210
0,165
0,116
10
0,867
0,691
0,570
0,485
0,423
0,375
0,337
0,307
0,281
0,242
0,200
0,157
0,110
11
0,854
0,673
0,554
0,470
0,408
0,362
0,325
0,295
0,270
0,232
0,192
0,150
0,105
17
0,795
0,606
0,488
0,409
0,353
0,310
0,278
0,251
0,230
0,196
0,161
0,125
0,087
37
0,707
0,515
0,406
0,335
0,286
0,249
0,221
0,199
0,181
0,153
0,125
0,096
0,066
4.1.1.4.3. Критерий Неймана-Пирсона (критерий отношения правдоподобия)
Статистика критерия определяется отношением арифметического среднего
всех sf к их геометрическому среднему (предполагается, что п\ = П2 = ... = п& = п)
Н =
к \ к
ГК
При Н > На нулевая гипотеза отклоняется. Критические значения критерия
приведены в табл. 133. Статистика Н применима и для случая, когда средние зна-
значения сравниваемых выборок значимо отличаются друг от друга (методы проверки
равенства средних см. в разделе 4.1.1).
14*
420
Проверка гипотез о значениях параметров распределений
[Гл.4
При равенстве средних х\ = ... = xj~ применима статистика
1 к
я* =
г=1
Критические значения Н^ приведены в табл. 134.
Таблица 133
Критические значения На критерия Неймана—Пирсона
для доверительной вероятности а = 0,95
к
2
3
4
5
10
20
25
50
п
3
3,21
3,18
3,17
3,05
2,68
2,39
2,31
2,12
4
2,09
2,13
2,08
2,03
1,87
1,75
1,71
1,59
5
1,71
1,74
1,71
1,68
1558
1,50
1,48
1,40
6
1,52
1,54
1,52
1,50
1,44
1,38
1,36
1,31
7
1,41
1,43
1,41
1,40
1,35
1,30
1,28
1,25
8
1,34
1,35
1,34
1,33
1,29
1,25
1,24
1,21
9
1,29
1,30
1,29
1,28
1,25
1,22
1,20
1,17
10
1,25
1,26
1,25
1,25
1,22
1,19
1,18
1,15
12
1,20
1,21
1,20
1,20
1,17
1,15
1,14
1,12
15
1,15
1,16
1,15
1,15
1,13
1,12
1,11
1,09
20
1,11
1,11
1,11
1,11
1,09
1,08
1,08
1,07
Таблица 134
Критические значения Н^ критерия Неймана—Пирсона
для доверительной вероятности а = 0,95
к
2
3
4
5
10
20
25
50
п
3
5,82
5,73
5,42
5,14
4,36
3,79
3,64
3,29
4
3,05
3,12
3,00
2,92
2,64
2,41
2,38
2,15
5
2,26
2,33
2,26
2,22
2,06
2,93
1,87
1,74
6
1,99
2,06
2,01
1,97
1,84
1,74
1,68
1,58
7
1,78
1,84
1,81
1,78
1,66
1,58
1,54
1,48
8
1,62
1,68
1,66
1,62
1,54
1,44
1,42
1,38
9
1,51
1,54
1,54
1,50
1,44
1,38
1,36
1,32
10
1,41
1,43
1,43
1,42
1,38
1,32
1,31
1,27
12
1,33
1,35
1,35
1,34
1,31
1,26
1,25
1,21
15
1,25
1,26
1,26
1,25
1,23
1,20
1,19
1,17
20
1,17
1,18
1,18
1,18
1,16
1,14
1,13
1,12
Задача 207. Проверить нулевую гипотезу равенства дисперсий критерием Неймана-
Пирсона для данных задачи 205.
Имеем
хг =5; х2 = 9; х3 = 16,6; ж4 = 8,8; s? = 2,5; si = 22,5; S3 = 58,3; s\ = 21,2.
Находим
Н =
- V^ ч2 1
4 ^ l --B,5 + 22,5 + 58,3 + 21,2)
П
= 1,609.
B,5 ¦ 22,5-58,3-21,2L
Из табл. 133 для п = 5, к = 4 находим i/o,95 = 1,71.
Так как Н = 1,609 < i?o,95 = 1,T1, нулевая гипотеза не отклоняется.
4.1]
Сравнение параметров распределений
421
4.1.1.4.4. Критерий Блисса-Кохрана-Тьюки
Критерий предложен в [415] как аналог критерия Кохрана (см. раздел 4.1.1.4.2)
и использует статистику
с =
где uji = max Xji — mm x*i—размах г-й выборки.
Если с > ca(n1 Aj), to нулевая гипотеза отклоняется. Критические значения ca(n, Aj)
приведены в табл. 135. Критерий не обладает высокой мощностью и рекомендуется
к применению при п ^ 10.
Таблица 135
Критические значения са(п,к) критерия Блисса—Кохрана—Тьюки
для доверительной вероятности ol = 0,95 [119]
к
3
4
5
6
7
8
9
10
п
3
0,667
0,538
0,451
0,389
0,342
0,305
0,276
0,253
4
0,601
0,479
0,398
0,342
0,300
0,267
0,241
0,220
5
0,563
0,446
0,369
0,316
0,278
0,248
0,224
0,204
6
0,539
0,425
0,351
0,300
0,263
0,234
0,211
0,193
7
0,521
0,410
0,338
0,288
0,353
0,225
0,203
0,185
8
0,507
0,398
0,328
0,280
0,245
0,218
0,197
0,179
9
0,498
0,389
0,320
0,273
0,239
0,213
0,192
0,184
10
0,489
0,382
0,314
0,267
0,234
0,208
0,188
0,172
Задача 208. Проверить нулевую гипотезу равенства дисперсий критерием Блисса-
Кохрана-Тьюки в условиях задачи 205.
Имеем ал = 7 - 3 = 4; ш2 = 15 ~~ 2 = 13; ш3 = 28 ~~ 9 = 19; ш4 = 16 ~~ 4 = 12.
тпя.х UJi
Тогда с =
4+13 + 19 + 12
= 0,396.
Из табл. 135 находим со,9бE;4) = 0,446.
Так как с = 0,396 < со,9бE;4) = 0,446, нулевая гипотеза не отклоняется.
4.1.1.4.5. Критерий Хартли
Критерий основан на статистике [416]
h =
При h > ha(nJk) нулевая гипотеза равенства дисперсий отклоняется. Критиче™
ские значения h > ha(n^k) приведены в [25, 119, 140] и воспроизведены в табл. 136.
Критерий не обладает высокой мощностью и рекомендуется к применению при
к<: ю.
422
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 136
Критические значения ha {n^ к) критерия Хартли
для доверительной вероятности сх. = 0,95 [119]
п
3
4
5
6
7
8
9
10
13
16
21
31
61
к
2
39,0
15,4
9,60
7,15
5,82
4,99
4,43
4,03
3,28
2,86
2,46
2,07
1,67
3
87?5
27,8
15,5
10,8
8,38
6,94
6,00
5,34
4,16
3,54
2,95
2,40
1,85
4
142
39,2
20,6
13,7
10,4
8,44
7,18
6,31
4,79
4,01
3,29
2,61
1,96
5
202
50,7
25,2
16,3
12,1
9,70
8,12
7,11
5,30
4,37
3,54
2,78
2,04
6
266
60,0
29,5
18,7
13,7
10,8
9,03
7,80
5,72
4,68
3,76
2,91
2,11
7
333
72,9
33,5
20,8
15,0
11,8
9,78
8,41
6,09
4,95
3,94
3,02
2,17
8
403
83,5
37,5
22,9
16,3
12,7
10,5
8,95
6,42
5,19
4,10
3,12
2,22
9
475
93,9
41,1
24,7
17,5
13,5
11,1
9,45
6,72
5,40
4,24
3,21
2,26
10
550
104
44,6
26,5
18,6
14,3
11,7
9,91
7,00
5,59
4,37
3,29
2,30
11
626
114
48,0
28,2
19,7
15,1
12,2
10,3
7,25
5,77
4,49
3,36
2,33
12
704
124
51,4
29,9
20,7
15,8
12,7
10,7
7,48
5,93
4,59
3,39
2,36
Задача 209. Проверить нулевую гипотезу равенства дисперсий критерием Хартли
в условиях задачи 205.
Имеем
I = 4 = 58,3;
^ = sx = 2,5; h =
58,3
~2^f
= 23,32.
Из табл. 136 для к = 4 и п = 5 имеем /io,9sE; 4) = 20,6.
Так как h = 23,32 > /10,95 E; 4) = 20,62, нулевая гипотеза отклоняется (т.е. дисперсии
не признаются равными).
4.1.1.4.6. Критерий Кэдуэлла-Лесли-Брауна
Кэдуэлл [147], Лесли и Браун [418] предложили аналог критерия Хартли
(ем. раздел 4.1.1.4.5), основанный на статистике отношения размахов
max uji
к = ls^fc .
Критические значения статистики Ka(nJ fc), превышение которых приводит к от™
клонению нулевой гипотезы, приведены в табл. 137. Критерий применим при к ^ 10,
однако его мощность меньше мощности критерия Хартли.
Таблица 137
Критические значения Ка(п,к) критерия Кэдуэлла^Лесли^Брауна
для доверительной вероятности сх, = 0,95 [119]
п
3
4
5
6
7
8
9
10
к
2
6,28
3,96
3,15
2,74
2,49
2,32
2,20
2,11
3
9,32
5,31
4,02
3,37
2,99
2,75
2,58
2,45
4
11,90
6,32
4,63
3,82
3,34
3,04
2,83
2,68
5
14,20
7,20
5,10
4,16
3,61
3,27
3,03
2,84
6
16,30
7,95
5,53
4,47
3,85
3,46
3,19
2,99
7
18,20
8,63
5,93
4,71
4,04
3,62
3,32
3,11
8
20,00
9,24
6,26
4,93
4,22
3,75
3,44
3,21
9
21,70
9,76
6,55
5,14
4,37
3,88
3,55
3,31
10
23,30
10,30
6,80
5,32
4,51
3,99
3,64
3,39
4.1] Сравнение параметров распределений 423
Задача 210. Проверить нулевую гипотезу равенства дисперсий критерием Кэдуэл-
ла^Лесли^Брауна в условиях задачи 205.
Имеем max ил = шз = 28 — 9 = 19: min из% = ш\ = 7 — 3 = 4.
19
Тогда К = — = 4,75. Из табл. 137 имеем Жо,9бE;4) = 4,63.
Так как К = 4,75 > Жо,95E;4) = 4,63, нулевая гипотеза отклоняется.
4.1.1.4.7. Критерий Самиуддина
Критерий Бартлетта (см. раздел 4.1.1.4.1) очень чувствителен к отклонениям
от нормальности. Поэтому не прекращаются попытки найти альтернативные ему
критерии, отличающиеся повышенной устойчивостью к отклонениям от нормаль-
нормальности. Одна из таких попыток рассмотрена в работах [419, 420]. В них Самиуддином
предложены статистики, основанные на использовании корня кубического из вы-
( s2\^
борочной дисперсии, исходя из того факта, что отношение I —|- I распределено
\ai У
асимптотически нормально.
Пусть sf —выборочные оценки дисперсии с fi = щ — 1 степенями свободы. Обо-
Обозначим
J г=1 i=l J г=1
Тогда В = /(inж2 — t), есть статистика критерия Бартлетта, рассмотренная
в разделе 4.1.1.4.1. Для записи статистик критериев введем обозначения
г=1
Тогда статистики модифицированных критериев Самиуддина имеют вид
1
i X з I
^ Ь{Г 2 ¦__
При к ^> 1 статистики PF* и W** имеют распределение %2(fc — 1). Нулевая
гипотеза равенства дисперсий отклоняется, если
W*(W**)>xl(k-l),
где X2(fc — 1) — «^квантиль распределения %2 с (к — 1) степенями свободы (ее
значения приведены в табл. 55).
Из предложенных критериев наибольшей мощностью обладает критерий W**,
но все они превышают по мощности критерий Бартлетта.
Задача 211. Проверить нулевую гипотезу равенства дисперсий в условиях задачи 205,
используя семейство критериев Самиуддина (а = 0,95).
Имеем
/i = ... = /4=n-l = 5-l = 4; sl = 2,5; si = 22,5; S3 = 58,3; s\ = 21,2;
1 1 i I
ti(sl) 3 = 1,3572; t2 = (si) 3 = 2,8231; t3 = (s23) 3 = 3,8775; t4 = (s24) 3 = 2,7676;
/ 2
61 = ... = 64 = \ -— =0,2357.
424 Проверка гипотез о значениях параметров распределений [Гл. 4
Далее
Ел-.? 4'104'5
i=l
Вычисляем статистики критериев:
;5 = 0,0239; z2 = 0,2153; z3 = 0,5579; z4 = 0,2029.
45
W* = V ——-— = о • V fe - A - 0, 2357) • 2, 754521 = 2, 6027;
^ к-Т 0,2357-2,75452 L J
= 7,638.
Из табл. 55 для f = k — 1 = 3иа = 0,95 находим Хо,9бC) = 7,81.
Так как W* = 2,6027 и W** = 7,638 меньше, чем Хо,9бC) = 7,81, нулевая гипотеза не
отклоняется.
4.1.2. Сравнение параметров экспоненциальных распределений
4.1.2.1. Сравнение двух параметров
Предположим, имеются две выборки случайных величин (например, наработка
на отказ изделия) объемами п и т из экспоненциальных распределений (см. раз-
раздел 1.1.4)
хъх2, ...,а?„ и У1,у2, • ..,Уш,
т. е. из распределений с плотностями
-?) и /B/) =
где i/i и 1/2—параметры распределений (средние значения).
Иногда в практике (задачи анализа надежности объектов) используют параметр
Л = интенсивность отказов. В дальнейшем мы будем уточнять, о каком пара-
параметре идет речь.
4.1.2.1.1. Критерий Фишера
Статистика критерия имеет вид
F=^^
При справедливости нулевой гипотезы статистика F имеет распределение Фише™
ра (см. раздел 1.1.10) с / = 2п и / = 2т степенями свободы. Если F7 — 7™квантиль
распределения Фишера, то с достоверностью а нулевая гипотеза отклоняется:
4.1] Сравнение параметров распределений 425
в пользу альтернативы Hi: v\ / ?2, если
F ^ Fi+a Bn, 2m) или F ^ Fi^a Bгс, 2т) ;
2 2
в пользу альтернативы U{ : vi > i/2, если F > FaBn,2m); в пользу альтернативы
Н'{: i/i < i/2, если F < Fi^aB)
Задача 212. Две партии приборов были испытаны на надежность. В результате
были получены следующие значения моментов их отказов (в условных единицах):
хц 12, 14, 16, 20, 30, 40, 60, 85 (п = 8);
уу. 22, 38, 44, 54, 68, 72 (т = 6).
Необходимо проверить нулевую гипотезу равенства средних Но: v\ = 1/2 против аль-
альтернативы Hi: и\ ф ъ?2 при доверительной вероятности а = 0,95.
а . 977
Имеем ]>>; = 277; Y.Vi = 298; F = ^^ = °>697-
Так как в числителе должно быть большее значение, используем величину
F=^^ = 1,434.
т • 2_j хг
При необходимости найти критическое значение при а = 0,95: Fi+o^s Bга; 2п) =
= Fo,975A2;16).
По таблицам ^распределения (подробнее см. раздел 1.1.10) находим
F0,975A2,16) = 2,90. Так как F = 1,434 < F0,975A2,16) = 2,90, нулевая гипотеза не
отклоняется.
4.1.2.1.2. Критерий Фишера при сравнении интенсивностей отказов (Л)
Рассмотрим сравнение интенсивностей отказов Л в двух экспоненциально рас-
распределенных выборках. Это наиболее распространенный показатель надежности,
используемый при оценке технических объектов. Обычной ситуацией, в которой
получается оценка интенсивности отказов, является испытание объектов, в процессе
которых фиксируется количество отказов за определенный временной промежуток.
Именно в такой интерпретации изложим применение критерия Фишера.
Предположим, были зафиксированы за время испытаний t\ первого объекта
7*1 отказов, а у второго объекта т^ отказов за время t^.
Для проверки нулевой гипотезы Hq : Х± = Х2 используется статистика
71*2 А2 „
К = ^^ = —, имеющая при справедливости нулевой гипотезы г -распределение
7*2*1 Ai
с /1 = 2г2 и /2 = 1тi степенями свободы. При справедливости нулевой гипотезы
( ^2 1 \
(т.е., когда — « 1) должно выполняться неравенство
Ai
Д= Т-Щ- < Fi+aBr2,2r1).
Задача 213. При испытании первого изделия были получены 12 отказов за 210 ч
испытаний. У второго изделия были получены 5 отказов за 100 ч испытаний. Про-
Проверить гипотезу равенства интенсивностей отказов у изделий при доверительной
вероятности а = 0,95.
Имеем п = 5; *i = 100; г2 = 12; *2 = 210; R = U ' 10° = 1,143.
Из таблиц находим jPq,975A0,24) = 2,64.
Так как R = 1,143 < Fq,975A0,24) = 2,64, нулевая гипотеза не отклоняется.
426 Проверка гипотез о значениях параметров распределений [Гл. 4
4.1.2.1.3. Двухвыборочный пуассоновский критерий
Известно (см. раздел 1.1.4), что экспоненциальное распределение порождается
пуассоновским потоком с интенсивностью Л.
Предположим, наблюдаются г\ отказов одного изделия за время i\ и г 2 отказов
второго изделия за время t^. В нашем случае Г\ и г 2—случайные величины,
подчиненные закону Пуассона с параметрами 71 = tiAi и 72 = ^2^2-
В [421] предложен критерий проверки нулевой гипотезы Щ : Х1 = Л2 против аль™
1
тернативы Hi: \\ < Аг, основанный на статистике z = ( г 2 -ri ) \ — (г\ + 1)
V У L J
Нулевая гипотеза отклоняется, если z > гха, где иа—о^квантиль стандартного
нормального распределения, а — уровень достоверности.
Более точный критерий предложен в [422]:
tl
z'= l * '
При z* > ua он также отклоняет нулевую гипотезу.
Задача 214. В условиях задачи 213 проверить нулевую гипотезу равенства интенсив-
ностей отказов двухвыборочным пуассоновским критерием при уровне достоверности
а = 0,95.
210
12 -5
Имеем п = 5; ti = 100; г2 = 12; t2 = 210; z = 10° — = 0,422.
'210 ."
_.E + i)
Из табл. 1 находим г^о,95 = 1,64. Так как z = 0,422 < ^0,95 = 1,64, нулевая гипотеза не
отклоняется.
По аналогии находим
3\ I
12+8 -
210\
1 + Wo)
= 0,179,
что такж:е не отклоняет нулевую гипотезу.
4.1.2.1.4. Сравнение значения параметра с заданным
В практике испытаний на надежность технических объектов особый интерес
представляет проверка гипотез Щ: v ^ щ или Но: v > i/0, где щ — некоторое за-
заданное значение наработки на отказ, являющееся, как правило, нормируемым
количественным показателем надежности.
Рассмотрим методы проверки гипотез о значении интенсивности отказов изде-
изделий (А = —) применительно к различным планам испытаний на надежность (по™
дробнее о планах испытаний на надежность см. в разделе 2.2).
План [N,B,T]
Статистикой критерия проверки нуль^гипотезы является число отказов г за
время испытаний Т. Если г ^ с, где с — приемочное число, удовлетворяющее
4.1]
Сравнение параметров распределений
427
неравенству
Ка{с) > NX0T,
где Ка(с)—коэффициент, значения которого для различных а и с приведены
в табл. 138; Aq— гипотетическое значение интенсивности отказов; а — доверитель™
пая вероятность, то гипотеза Н®: А > Aq отклоняется в пользу альтернативы
Hi: А ^ Ао с достоверностью а.
Таблица 138
Значения коэффициентов Ка(с) [140]
с
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Доверительная вероятность а
0,99
0,01005
0,14855
0,43604
0,82325
1,27911
1,78528
2,33021
2,90611
3,50746
4,13020
4,77125
5,42818
6,09907
6,78235
7,47673
8,18111
8,89457
0,95
0,05129
0,35536
0,81769
1,36632
1,97015
2,61301
3,28532
3,98082
4,69523
5,42541
6,16901
6,92421
7,68958
8,46394
9,24633
10,03596
10,83114
0,93
0,07257
0,43081
0,94223
1,53414
2,17670
2,85488
3,55984
4,28584
5,02895
5,78633
6,55583
7,33581
8,12496
8,92222
9,72672
10,53773
11,35465
0,90
0,10536
0,53181
1,10206
1,74477
2,43259
3,15190
3,89477
4,65612
5,43247
6,22130
7,02075
7,82934
8,64594
9,46962
10,29962
11,13530
11,97613
План [N,B,r]
Статистикой критерия является суммарная наработка изделий до момента на™
ступления г-го отказа Tr = Nr^ критические значения которой находятся по фор-
формуле
где Ka(r — 1) — коэффициент из табл. 138 при с = г — 1.
Гипотеза Но: А < Ао отклоняется в пользу альтернативы Hi: А ^ Ао, если
Тг <Тг(а).
План [N, Б, Т]
Статистикой критерия проверки нулевой гипотезы является число отказов г,
полученное за время испытаний Т.
Если г > с, где с — наименьшее целочисленное решение неравенства
N г
]С CN i1 - е ) е ° ^ а'
i=c+l
то с вероятностью а гипотеза Hq : A ^ Aq отклоняется в пользу альтернативы
Нг: А> Ао.
428 Проверка гипотез о значениях параметров распределений [Гл. 4
План [ЛГ, Б, г]
Статистикой критерия для проверки нулевой гипотезы является суммарная
наработка
Тг = Х> + (ЛГ-г)*Г)
г=1
критические значения которой равны
Если Тг < Тг(а), то гипотеза Но: А < А® отклоняется в пользу альтернативы
Нг: А^ Ао.
Задача 215. Партия электронных приборов была испытана на надеаюность в со-
соответствии с планом испытаний [N,B,T]. При этом испытаниям подвергались
N = 100 ламп в течение Т = 200 ч с заменой отказавших ламп. При испытаниях были
зафиксированы г = 5 отказов. Необходимо с достоверностью а = 0,99 проверить гипо-
гипотезу о том, что интенсивность отказов ламп не превышает величины Ао = 10^4 ч^1.
Вычисляем N • Ао • Т = 100 • 10~4 • 200 = 2.
Из табл. 138 для а = 0,99 видим, что Ж"о,9э(с) ^ 2 при с = 6.
Так как г = 5 < с = 6, гипотеза Но: А ^ Ао не отклоняется.
Находим приемочное число с из условия Ка(с) ^ N • Ао • Т = 2.
Задача 216. На надеаюность была испытана партия электронных ламп в соответ-
соответствии с планом испытаний [N,B,r]. Испытаниям подвергались N= 100 ламп с за-
заменой отказавших ламп. Испытания проводились до появления г = 5 отказов. При
этом пятый отказ наступил при t$ = 200 ч. Необходимо с достоверностью а = 0,95
проверить нулевую гипотезу о том, что интенсивность отказов ламп не превосходит
допустимой величины Ао = 1,3 • 10~4 ч-1.
Из табл. 138 для а = 0,95 иг = 5 (с = г-1 = 4) находим Жо,9бD) = 1,97015 и
Т5@,95)=^95D)= 1'97°154 = 15155 ч.
Ао 1,3 • 10"
В нашем случае Тг = N • tr = 100 • 200 = 20000 ч.
Так как Ts = 20000 > Ts@,95) = 15155, нулевая гипотеза Но: А < Ао не отклоняется,
т. е. с достоверностью 0,95 можно утверждать, что интенсивность отказов ламп не пре-
превосходит 1,3 • 10~4 ч.
Задача 217. Проверить нулевую гипотезу в условиях задачи 216, если испытания
проводились без замены отказавших приборов^ т.е. когда вместо плана [N,B,r] был
реализован план [N, Б, г]. При этом были зафиксированы моменты наступления отка-
отказов ламп
tx = 50, t2 = 60, t3 = 100, U = 180, t5 = 200 ч.
Имеем суммарную наработку до 5-го отказа
5
Т5 = J2 1г + A0° - 5) *5 = 50 + 60 + 100 + 180 + 200 + 95 • 200 = 19590 ч.
г=1
Критическое значение равно
Гв@>95) = К°М4\ = 1'97°154 = 15155.
К } 1,3- 10~4 1,3-10
Так как Тг = 19590 > Т5@,95) = 15155, нулевая гипотеза не отклоняется.
4.1] Сравнение параметров распределений 429
Задача 218. Партия изделий N = 5 была испытана на надежность в течение
Т = 100 ч без замены отказавших приборов (т. е. в соответствии с планом [N,B,T]).
При этом были получены г = 2 отказа. Необходимо проверить гипотезу Но : X < Ао при
доверительной вероятности а = 0,95 и Ао = 6,93 • 10^3 ч.
Находим подбором наименьшее целочисленное решение неравенства
г=с+1
В нашем случае
^ C*.(l_ ^6,93.10^-100^ , ^6,93-100.E^) ^ Q595;
J] CJ • 0, 5г • 0, 5Ж^ = J2 ^5-0,5^ = 0,5-5- 5Z ^5^0,95;
г=с+1 г=с+1 г=с+1
^1 °'55
5 5
Имеем при с = 0: J^ G| = 5 + 10 + 10 + 5 + 1 = 31; при с = 1: ]Г Сг5 = 26 < 30,4. Сле~
г=1 г=2
довательно, с = 1, а так как г = 2 > с = 1, нулевая гипотеза отклоняется.
Задача 219. Партия N = 15 изделий была испытана на надетсность без замены
отказавших ламп до получения г = 5 отказов. Моменты появления отказов равны (ч):
t\ = 100, ?2 = 150, ?3 = 300, ?4 = 400 и tb = 510 (m. e. имеет место план испыта-
испытаний [N,E,r]. Необходимо проверить гипотезу о том, что А < Ао = 1,8 • 10~ ч^ при
а = 0,99.
5
Имеем Tr = J2ti + A5 - 5) ' 510 = 656°-
г=1
Из табл. 138 находим Жо,99E — 1) = Жо,9эD) = 1,279.
1 279
Критическое значение равно Гб@,99) = ' j = 7105,5.
v ; 1,8- 10~4
Так как Ts = 6560 < Т5@,99) = 7105, нулевая гипотеза отклоняется и можно утвер-
утверждать, что интенсивность отказов изделия превышает 1,8 • 10^4 ч.
4.1.2.2. Сравнение нескольких (k ^ 2) параметров
4.1.2.2.1. Критерий Дэвида
Предположим, что к выборок одинакового объема п испытаны в течение фик™
сированного времени t. При этом зафиксированы Г{ отказов в каждой г-й выборке.
Полученные значения г^ упорядочим по убыванию г\ ^ г2 ^ • • • ^ т^.
Дэвид [421] предложил для проверки гипотезы Hq : Xi = A^_|_i (г = 1,2,...,/г — 1)
критерий, основанный на статистике
А = 2
При Di > Dai где Da — критическое значение статистики, приведенное в табл. 139,
гипотеза Но отклоняется в пользу альтернативы Hi: Ai = Л2 = ... = Л^ Ф A^+i =
= ... = Afc.
Если все D{ < Da, то гипотеза Но принимается на уровне достоверности а.
430
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 139
Критические значения Da критерия Дэвида
(а — доверительная вероятность) [421]
к
Dq,95
2
2,77
3
2,48
4
2,28
5
2,13
6
2,02
7
1,93
8
1,86
9
1,81
10
1,76
11
1,72
12
1,69
Задача 220. При испытаниях пяти выборок изделий объемом п = 10 каждая, в тече-
течение одинакового промежутка времени были получены следующие количества отказов
в выборках: т\ = 11, г 2 = 9, гз = 5, г 4 = 4 и г в = 2. Необходимо проверить гипотезу
равенства интенсивностей отказов в выборках при достоверности а = 0,95.
Имеем ряд значений
Di = 2 •
+ 0,5 - 2 • у/г2 + 0,5 = 2 • л/ГЦ) - 2 • ^/9^5 = 0,618;
D2 = 1,474; D3 = 0,448; D4 = 1,080.
Из табл. 139 для к = 5 имеем Do,95 = 2,13. Так как все Di < Do,95, то нулевая гипотеза
равенства интенсивностей отказов не отклоняется.
4.1.2.2.2. Критерий максимального правдоподобия
Статистика критерия имеет вид
к к 1 к
При справедливости нулевой гипотезы U-статистика распределена как %2
с / = Aj — 1 степенями свободы. Поэтому нулевая гипотеза равенства к интенсив™
ностей отказов не отклоняется при доверительной вероятности а, если Н < Х^ (/),
где значения х«(/) приведены в табл. 55.
Если в качестве наблюдаемой случайной величины рассматриваются моменты
наступления фиксированного числа отказов r{trI то iJ-статистика используется
в форме [422]
Я* = 2 <
In —— — к In
к
?<
г=1
где tr{ —момент наступления г~го отказа в i-й выборке.
Задача 221. При испытаниях пяти выборок изделий (к = 5) были получены 4 отказа
в каждой выборке (г = 4). При этом моменты наступления последних по времени
отказов в выборках равнялись
U = 120, t2 = 210, t3 = 340, U = 510, t5 = 520.
Необходимо проверить гипотезу равенства интенсивностей отказов в выборках кри-
критерием максимального правдоподобия при доверительной вероятности а = 0,95.
Имеем
5Я* = 2 • ^ 4 • In — - 5 • 4 • In
t
г=1
= 5,543.
Из табл. 5 для а = 0,95 находим Хо,эб(/ — 4) = 11,14.
Так как Я* = 5,54 < Хо,9бD) = ИД4, нулевая гипотеза не отклоняется.
4.1]
Сравнение параметров распределений
431
Задача 222. Предположим, что в задаче 221 наблюдались не моменты времени до
достижения фиксированного количества отказов в выборках, а количества отказов за
фиксированное время испытаний. Пусть за одно и тоже время испытаний t в выборках
наблюдались следующие количества отказов: г\ = 5, Г2 = 4, гз = 2, г 4 = 6, г^ = 1. Необ-
Необходимо проверить гипотезу равенства интенсивностей отказов в выборках критерием
максимального правдоподобия.
Имеем к = 5; J^ r% = 5 +
г=1
Тогда
Н = 2-
-2 + 6+ 1 = 18.
• In 7*i —
^ = 5,346.
Так как Н = 5,346 < Хо,э5 :=: ИД4, нулевая гипотеза не отклоняется.
4.1.2.2.3. Критерий отношения правдоподобия (критерий Нагарсенкера)
Предположим, имеются к выборок объема п каждая, содержащие экспоненци-
экспоненциально распределенные случайные величины. В [423] для проверки нулевой гипотезы
Hq : v\ = V2 = • • • = v\z равенства средних значений во всех выборках рассмотрен
критерий, основанный на статистике
Их1 ГД6 Xj' n^^j' X nk^Xij'
3 = 1 г=1 г=1
Если L ^ La(n^k), то нулевая гипотеза отклоняется с вероятностью а. Крити-
Критические значения Ьа(п, к) для а = 0,95 приведены в табл. 140.
Таблица 140
Критические значения iya(n, к) критерия отношения правдоподобия
для доверительной вероятности а = 0,95 [423]
п
4
5
6
7
8
9
к
3
0,454
0,535
0,596
0,643
0,681
0,711
4
0,443
0,510
0,563
0,606
0,641
5
0,442
0,498
0,545
0,583
6
0,444
0,492
0,534
п
10
20
40
80
100
к
3
0,736
0,859
0,927
0,963
0,970
4
0,671
0,821
0,906
0,952
0,962
5
0,616
0,787
0,888
0,942
0,954
6
0,569
0,756
0,870
0,933
0,946
Задача 223. Имеются четыре (к = 4) выборки из экспоненциального распределения:
хц: 2, 4, 8, 12, 18; xi2: 5, 7, 11, 19, 21;
ж^3: 11, 17, 21, 22, 29; xi4: 1, 5, 9, 13, 18.
Необходимо проверить гипотезу равенства параметров экспоненциальных распределе-
распределений в выборках критерием Нагарсенкера при доверительной вероятности а = 0,95.
5
Находим х\ = 8,8; х^ = 12,6; хз = 20; Х4 = 9,2; х =
1
= 12,65.
Далее имеем L = I I —^- =
12,6
20
9,2
12,65 12,65 12,65 12,65
= 0,797.
Из табл. 140 находим Ь0,э5E,4) = 0,443.
Так как L = 0,707 > Ьо,э5E,4) = 0,443, нулевая гипотеза не отклоняется.
432
Проверка гипотез о значениях параметров распределений
[Гл.4
4.1.2.2.4. Критерий Чена для двухпараметрических экспоненциальных
распределений
Рассмотрим к независимых экспоненциально распределенных случайных вели™
чин с плотностью распределения вероятностей
Параметр положения Д в практике интерпретируется обычно как гарантийная
наработка, в пределах которой отказы изделия не допускаются.
Чей [424] предложил критерий проверки гипотезы Н®: Д = const, утверждаю-
утверждающей, что гарантийная наработка у всех испытываемых партий изделий постоянна.
Процедура построения статистики критерия Чена включает в себя отбор из
каждой выборки (объема п) наименьшего наблюдения yj = min Xij и определение
размаха совокупности значений yj
Шу = max yj -
Статистика критерия Чена имеет вид
Г к п
[j=n=i
с = кп(п -12)
ул.
J
^ =yj)
-1
Если c>ca(fc,n), то нулевая гипотеза отклоняется на уровне значимости а.
Критические значения статистики Чена са(к,п) приведены в табл. 141.
Таблица 141
Критические значения cCK(fe, n) статистики "Чена [424]
п
3
4
5
6
8
10
16
30
60
3
3,77
3,48
3,34
3,26
3,18
3,13
3,06
3,02
2,99
"Уровень значимости
1
4
4,09
3,83
3,71
3,64
3,56
3,52
3,46
3,41
3,39
5
4,31
4,08
3,97
3,90
3,83
3,79
3,73
3,69
3,67
10
4,92
4,76
4,68
4,64
4,58
4,55
4,51
4,48
4,47
а = ОД
20
5,50
5,40
5,35
5,32
5,28
5,27
5,24
5,22
5,21
30
5,86
5,78
5,74
5,71
5,68
5,67
5,65
5,64
5,63
п
3
4
5
6
8
10
16
30
60
Уровень значимости а = 0,01:
к
3
5,00
4,50
4,28
4,15
4,01
3,93
3,83
3,75
3,71
4
5,23
4,81
4,62
4,50
4,38
4,31
4,21
4,15
4,11
5
5,29
5,02
4,85
4,75
4,63
4,57
4,49
4,43
4,39
10
5,85
5,61
5,50
5,43
5,36
5,31
5,26
5,21
5,19
20
6,34
6,20
6,13
6,08
6,04
6,01
5,97
5,94
5,93
30
6,66
6,55
6,50
6,47
6,43
6,41
6,38
6,36
6,35
Задача 224. В условиях задачи 223 проверить критерием Чена гипотезу равенства
параметров положения (/3i) на уровне значимости а = 0,05 (напоминаем — это озна-
означает, что мы будем принимать значимыми, а не случайными, значения статистики
Чена, вероятность появления которых не превышает 0,05).
Имеем t/i = min хц = 2; г/2 == 5; уз = 11; 2/4 = 1; ojy = 11 — 1 = 10.
l<i<5
4.1]
Сравнение параметров распределений
433
Далее
Е Е
j=n=i=
2/i) = B - 2) + (8 - 2) + ... + A3 ^ 1) + A8 - 1) = 158;
4-5- E™ 1) • 10
158
= 5,063.
Из табл. 141 при а = 0,05 находим со,обD,5) = 4,62.
Так как с = 5,063 > со,о5D,5) = 4,62, нулевая гипотеза отклоняется и гарантийные
наработки у сравниваемых совокупностей следует признать отличающимися.
4.1.2.2.5. Комбинированный критерий Сингха
Обычно мы рассматриваем параметр положения /3 (гарантийный период, когда
отказы не допускаются) и параметр масштаба v (средняя наработка, измеряемая от
параметра положения — гарантийного срока).
Критерий Сингха [437] предполагает проверку гипотезы
Но
= ...= fik= ft]
против общей альтернативы для совокупностей, подчиняющихся экспоненциально™
му закону распределения вероятностей,
Различные варианты критериев проверки такого рода гипотез рассмотрены
в [425—431]. Подробно все эти критерии рассмотрены в [432], там же предложен
один из наиболее мощных критериев для множественного сравнения параметров
экспоненциальных распределений.
Пусть хц ^ X2j ^ ... ^%kj — порядковые наблюдения j'-й выборки (j = 1, 2,..., к).
Предположим, что мы располагаем только первыми (наименьшими) тэ- наблюдени™
ями из каждой j-й выборки.
Оценками максимального правдоподобия для параметров i/j и /3j будут (см. раз™
дел 2.2)
1
bj=xlj; Vj =
Введем обозначения
s =
xij ~ xm) + (rij - rj)(xr.j - Xm)
где xm =
, x12j x13, ..., xlk); R =
Известно [431], что случайные величины
2s* 2Я** 2Я*
и v v
соответственно с / = 2(rj — 1); 2(г — к) и 2 (к — 1) степенями свободы.
распределены как
434 Проверка гипотез о значениях параметров распределений [Гл. 4
Введя обозначение
запишем статистику
(R-\)V
(fc-l)S"
которая распределена как статистика Фишера с Д = 2(А? — 1) и /2 = 2{R — 1) сте-
степенями свободы.
Если С/> Fa[2(fc — 1); 2(i2 — 1)], то с достоверностью а нулевая гипотеза
Hq : v\ = ... = 1/к = v {у и /3 — не определены) отклоняется в пользу альтернативы,
утверждающей, что при равных v по крайней мере две из к выборок различаются
параметрами положения C (т.е. гарантийным сроком).
Для нулевой гипотезы Hq : v\ = ... = v^ = v (/3 не определено) против альтер-
альтернативы, утверждающей, что по крайней мере в двух выборках отличаются пара-
параметры I/, может быть использована модификация критерия Бартлетта (см. раз™
дел 4.1.1.4.1), статистика которого применительно к проверке нашей гипотезы имеет
вид
где
При Q ^ X«(fe ~~ 1) гипотеза Hr0 отклоняется в пользу альтернативы (х«(^ ~~ 1)
для разных а см. в табл. 55).
Совместной проверкой критериев U и Q осуществляется комплексная проверка
гипотез для трехпараметрического экспоненциального распределения.
Задача 225. В результате испытаний на надетсность 4 выборок изделий получены
следующие результаты:
— 1-я выборка (j = 1) — из 7ii = 24 испытанных приборов известны п = 8 первых
наблюдений:
хц = 1, Ж21 = 4, Ж31 = 11, Ж41 = 16, Ж51 = 18, Ж61 = 24, ж71 = 31, Ж81 = 39;
^2~я выборка (j = 2) —из гьч = 30 испытанных приборов известны данные по гч = 5
первым наблюдениям
х\2 = 3, Ж22 = 5, Ж2з = 13, Ж24 = 14, Ж25 = 22;
^3-я выборка (j = 3) —из пз = 10 испытанных приборов известны данные для пер-
первых трех наблюдений (гз = 3):
Ж1з = 10, ж23 = 14, жзз = 20;
^4-я выборка (j = 4) —из п^ = 18 испытанных приборов известны г^ = 6 первых
результатов:
Хы = 20, Ж24 = 25, Ж34 = 31, Ж44 = 42, Ж54 = 44, Ж64 = 49.
Необходимо проверить гипотезу о равенстве параметров положения /3j и масштаба i/j
во всех выборках при доверительной вероятности а = 0,95.
4.1] Сравнение параметров распределений 435
Находим
8
B4 - 8) ' (Ж81 - хи) = 744;
г=1
5
«S2 = J^ (xi2 — Ж12) + C0 — 5) • (Ж52 — Ж12) = 517;
г=1
3
5з = ^2 (Xi3 ~ Ж13) + О-® ~ з) ¦ (Жз3 "¦Ж13)= ^4'
г=1
6
г=1
Далее вычисляем:
S = J2 sj = 744 + 517 + 84 + 439 = 1784; si = -^— = — = 106,2854;
^~ 8 — 1 7
so S4 84 sa 439
„* z 1 on oc. o* ^ /19. o* C7 Q«
S2 — — lZy,ZO, S3 — — — 4Z, S4 — — — r — O'^o?
W ™™. X I X I rys . ___ I 1 _A_ I /n . _ rr* . I I /y» , „_ I 1 I — 1 I / Sr\ * W —
F = V У" щ • (жг7- - X! i - 1) = 492; 17 = -^=—^^^ = 1,513.
^2 \й / B-1)-2276
Находим из таблиц F-распределения Fo59sB • 3; 2 • 21) = Fo,9sF,42) = 2,33.
Так как U = 1,513 < .Fo,95F,42) = 2,33, нулевая гипотеза Но не отклоняется.
Теперь для проверки нулевой гипотезы H'Q вычислим
/ = R - к = 22 - 4 = 18; Д = п - 1 = 7; /2 = г2 - 1 = 4;
/з = г3 - 1; /4 = г4 - 1 = 5;
Тогда Q = • 18 • In 99,111 - У" /-• • In sП = 0,692.
^ 1,1152 l ' Z^JJ 3 '
Так как Q = 0,692 < Хо,9бC) = 7,81, гипотеза Н'о так^е не отклоняется.
4.1.3. Сравнение параметров биномиальных распределений
4.1.3.1. Сравнение двух параметров
Рассмотрим следующую задачу. В выборках объемов п\ и П2 из двух боль™
ших партий изделий зафиксировано соответственно т\ ж т2 дефектных изделий.
Требуется установить значимость различия долей дефектных приборов в партиях
(pi ИР2), что тождественно проверке нулевой гипотезы Н® : рг = р2 против возмож-
возможных альтернатив Н\\ р\ ф Р2-> Н[ : р\ > Р2 и Н": р\ < Р2-
При нормальной аппроксимации биномиального распределения (см. раздел 1.2.1)
436 Проверка гипотез о значениях параметров распределений [Гл. 4
статистикой для проверки Щ является величина
ггц 1 т2 1
z =
/JT) -| J rfYl о Т) -1 —J— T1 о ТП -I ТП о /1
^1+^2 П<1 + П2 \ П
При справедливости нулевой гипотезв! z имеет стандартное нормалвное рас-
распределение. Если \z\ > Ui+a , z > Ua или z < Ui^aj нулевая гипотеза Ы®: рг = р2
отклоняется в пользу альтернатив
Hi: pi ф P2'j H[: pi > р2 и Н" : рг < р2
соответственно (а — доверительная вероятность).
При использовании нормальной аппроксимации с помощью преобразования
arcsln (см. раздел 1.2.1) статистика z имеет вид
1 . 1 /о . /mi
1z arcsin \ / 2 arcsin
\ V
П\
2 \
Задача 226. В двух партиях приборов объемами гц = 100 шт. и П2 = 200 шт. обна-
обнаружены соответственно mi = 3 и rri2 = 5 дефектных приборов. Необходимо проверить
нулевую гипотезу о равенстве долей дефектных приборов в партиях при доверительной
вероятности а = 0,95.
Вычисляем
3 15 1
+ ¦
100 2 • 100 200 2 • 200 _ q 376
3 + 5 100 + 200-3-5/1 1 \
100 + 200" 100 + 200 ' \100 200/
Из табл. 1 находим it 1+0,95 = ^0,975 = 1,96.
2
Так как z = 0,376 < 110,975 = 1,96, нулевая гипотеза не отклоняется.
Аналогично получаем
1 1 / / з / 5 \
1 • 2 arcsin \ / 2 arcsin \ / = 0,37,
100 200 I V ЮО V 200 I
что дает тот же результат.
4.1.3.2. Сравнение значения параметра с заданным
На практике доля дефектных изделий в партии является, как правило, кри-
критерием качества изделий на стадии производства. Основная задача вв1борочного
контроля качества изделий заключается в том, чтобв! по результатам проверки
выборки изделий из партии установить, превосходит ли доля дефектных изделий
в партии некоторую заранее нормированную контрольную величину. В терминах
математической статистики такая задача формулируется как проверка нулевой
гипотезы Щ: р = ро (здесь р — неизвестная истинная доля дефектных изделий
в партии; ро—допустимая величина доли дефектных изделий в партии) против
альтернатив Нi: р > р0 или Н[: р < р0 •
При контроле качества продукции представляет интерес, как правило, гипотеза
Н®: р ^ р® (отклонение этой гипотезы альтернативой Hi: р > р® приводит к бра-
браковке партии изделий).
4.1] Сравнение параметров распределений 437
Статистикой для проверки гипотезы Щ: р ^ р® по выборке изделий объема п
является величина
1
роA — ро)
п
имеющая при справедливости нулевой гипотезы стандартное нормальное распре-
распределение. Гипотеза Щ: р ^ р0 отклоняется в пользу альтернативы Нг: р > pOi если
z > иа1 где иа —«-квантиль стандартного нормального распределения.
При использовании нормализующего преобразования arcsin значения z подсчи-
тываются по формуле
2 ( . [^
z = —р= arcsin \ arcsin -
V*\ V п
где п — объем выборки, т — число дефектных изделий в выборке.
Задача 227. Нормируемый уровень дефектных изделий в партии ро = 0,05. Предпо-
Предположим, что из партии изделий извлечена выборка п = 20 изделий, в которой обнару-
мсены при проверке т = 2 дефектных изделия. Проверить с достоверностью а = 0,95
гипотезу о том^ что доля дефектных изделий в партии не превосходит нормируемого
значения.
Находим
0,05
z= 20 40 ==0,51.
0,05 • A - 0,05)
20
Так как z = 0,51 < 11-0,95 = 1,645, проверяемая гипотеза не отклоняется.
4.1.3.3. Сравнение нескольких параметров (k ^ 2)
Предположим, имеются к выборок из биномиальных совокупностей, объема-
объемами rii, П2, . ..,7ifc. В каждой г-й выборке изучаемое событие наблюдалось mi раз
(г = 1, ..., к). Необходимо проверить гипотезу Hq : pi = Рг+i (fc = l, •••,& — 1) про-
против альтернативы Hi: pi Ф Pi+i-
Статистикой критерия проверки Но является величина
к
9 1 ^^ / ^х2 _ г=1 ГПг
При справедливости нулевой гипотезы величина %2 имеет распределение
хи-квадрат (см. раздел 1.1.8) с f = к — 1 степенями свободы. Поэтому если
X2 ^ Ха(^ ~~ 1)? гДе Х«—а-квантиль распределения хи-квадрат, то с достовер™
ностью а нулевая гипотеза отклоняется.
Если использовать нормализующее преобразование arcsin, то статистика крите™
рия вычисляется по формуле
к
X2 = Y,ndVt -уJ, где
г=1
= 2arcsin 4/—, у =
438 Проверка гипотез о значениях параметров распределений [Гл. 4
Задача 228. Из 8 различных партий изделий извлечены выборки объемами
щ = 10, п2 = 20, п3 = 10, п4 = 50, п5 = 30, п6 = 25, п7 = 10, п8 = 40.
При проверке в них были обнаружены следующие количества дефектных изделий:
ТП\ = 2, 7712 = 5, Шз = 3, Ш4 = 8, Ш5 = 10, Шб = 6, 7717 = 3, mg = 7.
Необходимо проверить гипотезу о равенстве долей дефектных изделий в партиях
изделий с достоверностью а = 0,99.
Имеем
Pi = — = 0,2; р2 = — = 0,4; р3 = — = 0,3; р4 = — = 0,16;
20 20 10 50
10 6 3 7
Р5 = — = 0,33; р6 = — = 0,24; р7 = — = 0,3; р8 = — = 0,175.
Вычисляем
8
i=i * 2 + 5 + 3 + 8 + 10 + 6 + 3 + 7
= 2
20 + 10 + 50 + 30 + 25 + 10 + 40
Далее
1 8 г
X = V п* • (pi - pf = 5,7239 • 10 • @,2 - 0,2256J +
0,2256 • A - 0,2256) r^ L v 7
+ 20 • @,4 - 0,2256J + 10 • @,3 - 0,2256J + 50 • @,16 - 0,2256J + 30 • @,33 - 0,2256J +
+ 25 • @,24 - 0,2256J + 10 • @.33 - 0,2256J + 40 • @,175 - 052256J I = 8,325.
При а = 0,99 имеем Хо,ээ(/ = к - 1 = 7) = 18,48.
Так, как %2 = 8,325 < Хо,ээG) = 18,48, нулевая гипотеза не отклоняется.
4.1.4. Последовательные методы проверки гипотез о значениях параметров
распределений (последовательный анализ Вальда)
Рассмотренные ранее методы проверки статистических гипотез предполагали
фиксированный объем выборки. Вальд [433] предложил теорию последователвной
проверки гипотез (последовательный анализ), существенным отличием которой яв-
является то, что число наблюдений, необходимое для принятия решения по гипотезе,
зависит от исходов испытаний и является случайной, не фиксированной заранее
величиной.
Метод последовательной проверки гипотезы предполагает на каждой стадии
наблюдений (эксперимента) принятие одного из возможных решений: принять
гипотезу, отклонить ее или продолжить наблюдения. Обычно при последователь-
последовательном анализе нулевая гипотеза относительно значения параметра е формулируется
в форме предположения об одном из двух его возможных значений ?® или е\:
Щ: е = е0, Нг: е = ?г.
Задача последовательного анализа в ходе эксперимента — выбрать одну из ги-
гипотез. Вальд [433] показал, что для проверки гипотез методами последовательного
анализа требуется в среднем в два раза меньше наблюдений, чем при проверке
классическими методами, основанными на заранее фиксированном числе наблюде-
наблюдений. Впоследствии было показано [434], что при определенных условиях выигрыш
от применения последовательной процедуры по сравнению с классической теорети-
теоретически неограничен.
4.1] Сравнение параметров распределений 439
Перед планированием процедуры последовательного анализа назначают при™
емлемые величины вероятностей допустимых ошибок: а — вероятность принятия
гипотезы Hi, когда верна гипотеза Hq (ошибка первого рода) и C — вероятность
принятия гипотезы Hq, когда верна гипотеза Hi (ошибка второго рода).
Наибольший выигрыш последовательный анализ дает при а ^> C или а <С /3, т. е.
когда а и /3 являются величинами разного порядка малости.
Так как число наблюдений п в последовательном анализе является величиной
случайной, то необходимо знать либо его функцию распределения вероятностей,
либо параметры этого распределения (например, среднее количество необходимых
наблюдений). Среднее значение зависит только от истинного значения параметра,
относительно которого проверяется гипотеза.
Функция п(е), определяющая зависимость поте, называется функцией среднего
числа наблюдений.
На практике обычно находят средние значения числа наблюдений п(ео) и n(ei)
соответствующие гипотетическим значениям параметра е® и ?]_, между которыми
осуществляется выбор, и максимальное среднее значение числа наблюдений nmax,
необходимое для окончания последовательной процедуры проверки гипотезы.
Если знания только среднего числа наблюдений недостаточно и требуется опре™
делить либо вероятность того, что для завершения последовательной процедуры
понадобится не более некоторого, наперед заданного, числа наблюдений, либо число
наблюдений, соответствующее заданной вероятности завершения последовательной
процедуры, используются таблицы распределения Вальда [435] с функцией
р (х < а) = Wc(a) =
п
где х = ——отношение числа наблюдений к его среднему значению; с — параметр
п
распределения, определяемый видом распределения исследуемой случайной вели™
чины и гипотетическим значением параметра (eq или ?]_).
Вероятность j завершения процедуры последовательного анализа и число испыта™
« / \ ( \ TJ7 П (€)
нии п\е) при некотором значении е (?q или ei) связаны соотношением 7 = Н/С(е) - / \ ?
из которого можно определить либо 75 соответствующее заданному n(e), либо п(е),
соответствующее заданному значению 7-
Некоторые, наиболее употребляемые значения функции распределения Вальда
Wc ( х = з ), приведены в табл. 142.
4.1.4.1. Проверка гипотез о параметрах нормального распределения
4.1.4.1.1. Проверка гипотезы о значении среднего
Проверяется нулевая гипотеза Hq : /л = /iq против альтернативы Hi: /л = /ii
(/хо < fii). Полагается, что дисперсии и\ и а\ известны заранее, причем и\ = сг| = а2.
Введем обозначения
1 — а 2
а 2
Т> О" л I — р flQ + /l\
440
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 142
X
0,006
0,007
0,008
0,009
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
0,12
0,13
0,14
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,5
3,0
3,5
0,01
0,1986
0,2343
0,2662
0,2948
0,3205
0,4843
0,5693
0,6232
0,6612
0,6899
0,7125
0,7309
0,7465
0,7593
0,7706
0,7805
0,7893
0,7971
0,8041
0,8312
0,8498
0,8635
0,8743
0,8829
0,8901
0,8962
0,9015
0,9060
0,9101
0,9137
0,9169
0,9198
0,9225
0,9249
0,9272
0,9292
0,9329
0,9362
0,9390
0,9416
0,9349
0,9459
0,9478
0,9495
0,9511
0,9526
0,9585
0,9629
0,9663
Функции
0,02
0,0692
0,0928
0,1161
0,1388
0,1605
0,3237
0,4225
0,4891
0,5376
0,5750
0,6048
0,6294
0,6500
0,6677
0,6831
0,6967
0,7087
0,7194
0,7292
0,7667
0,7926
0,8119
0,8270
0,8391
0,8493
0,8578
0,8562
0,8717
0,8774
0,8824
0,8871
0,8912
0,8949
0,8984
0,9016
0,9045
0,9098
0,9143
0,9183
0,9220
0,9252
0,9281
0,9308
0,9332
0,9354
0,9375
0,9458
0,9520
0,9568
[ распределения
0,03
0,0261
0,0396
0,0544
0,0699
0,0858
0,2227
0,3269
0,3981
0,4518
0,4939
0,5281
0,5565
0,5806
0,6013
0,6195
0,6355
0,6498
0,6626
0,6742
0,7192
0,7506
0,7740
0,7923
0,8071
0,8194
0,8300
0,8390
0,8469
0,8590
0,8601
0,8657
0,8707
0,8754
0,8796
0,8835
0,8871
0,8835
0,8991
0,9040
0,9074
0,9124
0,9160
0,9192
0,9222
0,9249
0,9274
0,9376
0,9451
0,9509
с
0,04
0,0102
0,0175
0,0264
0,0364
0,0473
0,1637
0,2582
0,3301
0,3860
0,4309
0,4677
0,4987
0,5252
0,5482
0,5683
0,5682
0,6022
0,6166
0,6297
0,6806
0,7163
0,7431
0,7641
0,7811
0,7953
0,8074
0,8178
0,8269
0,8350
0,8421
0,8486
0,8544
0,8598
0,8646
0,8691
0,8771
0,8807
0,8871
0,8929
0,8980
0,9025
0,9066
0,9104
0,9138
0,9170
0,9199
0,9316
0,9402
0,9468
Wc(x) Вальда [435]
0,05
0,0041
0,0079
0,0130
0,0194
0,0266
0,1196
0,2067
0,2769
0,3334
0,3795
0,4282
0,4508
0,4790
0,5036
0,5252
0,5445
0,5619
0,5775
0,5918
0,6476
0,6870
0,7166
0,7400
0,7589
0,7748
0,7882
0,7998
0,8100
0,8190
0,8270
0,8342
0,8407
0,8467
0,8521
0,8571
0,8618
0,8701
0,8773
0,8873
0,8894
0,8945
0,8991
0,9033
0,9071
0,9106
0,9138
0,9269
0,9365
0,9438
0,07
0,0017
0,0033
0,0057
0,0087
0,0658
0,1357
0,1992
0,2536
0,3000
0,3399
0,3744
0,4046
0,4313
0,4555
0,4764
0,4957
0,5132
0,5292
0,5928
0,6381
0,6725
0,6997
0,7219
0,7405
0,7563
0,7700
0,7819
0,7926
0,8020
0,8106
0,8183
0,8253
0,8318
0,8377
0,8419
0,8530
0,8616
0,8691
0,8758
0,8818
0,8873
0,8922
0,8967
0,9009
0,9047
0,9201
0,9313
0,9398
0,10
0,0017
0,0280
0,0749
0,1256
0,1736
0,2170
0,2559
0,2906
0,3217
0,3498
0,3751
0,3981
0,4191
0,4384
0,4592
0,5277
0,5797
0,6196
0,6514
0,6776
0,6996
0,7183
0,7345
0,7488
0,7614
0,7727
0,7829
0,7921
0,8005
0,8082
0,8153
0,8219
0,8336
0,8439
0,8529
0,8608
0,8681
0,8745
0,8804
0,8858
0,8907
0,8952
0,9134
0,9266
0,9366
0,20
0,0019
0,0120
0,0309
0,0554
0,0826
0,1106
0,1383
0,1652
0,1909
0,2153
0,2385
0,2604
0,2810
0,3006
0,3835
0,4478
0,4990
0,5409
0,5760
0,5958
0,6316
0,6541
0,6739
0,6916
0,7074
0,7218
0,7347
0,7466
0,7575
0,7675
0,7768
0,7934
0,8097
0,8206
0,8319
0,8419
0,8510
0,8592
0,8667
0,8735
0,8798
0,9046
0,9222
0,9353
4.1]
Сравнение параметров распределений
441
X
4,0
4,5
5,0
6,0
7,0
8,0
9,0
10,0
15,0
20,0
25,0
30,0
40,0
50,0
100,0
X
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,10
0,11
0,12
0,13
0,14
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
1,0
1,1
1,2
1,3
1,4
0,01
0,9690
0,9713
0,9732
0,9762
0,9786
0,9805
0,9820
0,9833
0,9877
0,9903
0,9920
0,9932
0,9949
0,9960
0,9983
0,3
0,0021
0,0083
0,0192
0,0340
0,0515
0,0706
0,0907
0,1112
0,1316
0,1518
0,1715
0,1907
0,2093
0,2926
0,3614
0,4183
0,4662
0,5070
0,5421
0,5727
0,5997
0,6236
0,6450
0,6643
0,6817
0,6976
0,7121
0,7254
0,7490
0,7693
0,7870
0,8025
0,8163
0,02
0,9606
0,9638
0,9663
0,9706
0,9739
0,9765
0,9786
0,9804
0,9863
0,9897
0,9918
0,9932
0,9954
0,9966
0,9990
0,5
0,0025
0,0063
0,0122
0,0201
0,0298
0,0410
0,0533
0,0664
0,0802
0,0945
0,1089
0,1814
0,2492
0,3039
0,3635
0,4109
0,4528
0,4901
0,5234
0,5534
0,5804
0,6048
0,6271
0,6474
0,6661
0,6833
0,7138
0,7400
0,7628
0,7828
0,8003
0,03
0,9555
0,9594
0,9626
0,9677
0,9716
0,9747
0,9772
0,9793
0,9862
0,9900
0,9924
0,9940
0,9961
0,9973
0,9994
0,7
0,0012
0,0031
0,0069
0,0104
0,0159
0,0227
0,0306
0,0395
0,0491
0,0595
0,1175
0,1787
0,2379
0,2930
0,3435
0,3894
0,4310
0,4688
0,5031
0,5343
0,5628
0,5889
0,6128
0,6348
0,6551
0,6911
0,7221
0,7491
0,7726
0,7932
0,04
0,9521
0,9565
0,9601
0,9659
0,9703
0,9738
0,9766
0,9790
0,9865
0,9906
0,9931
0,9947
0,9968
0,9979
0,9996
0,9
0,0064
0,0090
0,0145
0,0199
0,0262
0,0333
0,0778
0,1309
0,1863
0,2406
0,2921
0,3402
0,3878
0,4258
0,4635
0,4981
0,5299
0,5592
0,5861
0,6109
0,6339
0,6748
0,7099
0,7404
0,7669
0,7901
Продолжение табл
0,05
0,9497
0,9545
0,9585
0,9649
0,9697
0,9734
0,9765
0,9790
0,9870
0,9912
0,9938
0,9954
0,9974
0,9984
0,9998
1,0
0,0041
0,0066
0,0100
0,0143
0,0193
0,0251
0,0637
0,1127
0,1657
0,2190
0,2706
0,3194
0,3650
0,4072
0,4464
0,4825
0,5158
0,5464
0,5747
0,6008
0,6250
0,6681
0,7025
0,7372
0,7651
0,7894
0,07
0,9466
0,9522
0,9568
0,9640
0,9694
0,9737
0,9771
0,9798
0,9884
0,9926
0,9951
0,9966
0,9982
0,9990
0,9999
1,2
0,0017
0,0030
0,0049
0,0074
0,0106
0,0144
0,0431
0,0842
0,1322
0,1829
0,2337
0,2832
0,3303
0,3746
0,4162
0,4548
0,4907
0,5239
0,5547
0,5833
0,6097
0,6568
0,6975
0,7325
0,7629
0,7893
0,10
0,9445
0,9508
0,9561
0,9643
0,9704
0,9750
0,9787
0,9816
0,9904
0,9944
0,9966
0,9980
0,9991
0,9995
0,9999
1,4
0,0024
0,0039
0,0058
0,0083
0,0295
0,0634
0,1062
0,1538
0,2033
0,2527
0,3007
0,3466
0,3900
0,4308
0,4690
0,5045
0,5376
0,5683
0,5967
0,6477
0,6915
0,7293
0,7619
0,7902
ицы 142
0,20
0,9454
0,9538
0,9598
0,9694
0,9762
0,9812
0,9849
0,9878
0,9952
0,9979
0,9990
0,9996
0,9999
0,9999
0,9999
1,6
0,0012
0,0020
0,0032
0,0049
0,0202
0,0481
0,0859
0,1301
0,1777
0,2266
0,2750
0,3220
0,3670
0,4096
0,4498
0,4874
0,5225
0,5552
0,5855
0,6400
0,6868
0,7272
0,7619
0,7928
442
Проверка гипотез о значениях параметров распределений
[Гл.4
Продолжение таблицы 142
X
1,5
1,6
1,7
1,8
1,9
2,0
2,5
3,0
3,5
4,0
4,5
5,0
6,0
7,0
8,0
9,0
10,0
15,0
20,0
50,0
X
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
с
0,3
0,8286
0,8396
0,8495
0,8585
0,8667
0,8742
0,9036
0,9240
0,9389
0,9500
0,9587
0,9654
0,9753
0,9819
0,9865
0,9898
0,9922
0,9977
0,9993
0,9996
1,8
0,0028
0,0140
0,0366
0,0697
0,1105
0,1561
0,2039
0,2524
0,3000
0,3464
0,3906
0,4325
0,4720
0,5100
0,5435
0,5757
0,6056
0,6334
0,6831
0,7258
0,7624
0,7939
0,8201
0,8442
0,8643
0,8816
0,9066
0,9096
0,5
0,8160
0,8299
0,8424
0,8536
0,8638
0,8731
0,9086
0,9321
0,9486
0,9604
0,9690
0,9755
0,9844
0,9898
0,9932
0,9954
0,9968
0,9994
0,9999
0,9999
2,0
0,0017
0,0097
0,0280
0,0569
0,0942
0,1375
0,1842
0,2323
0,2806
0,3278
0,3734
0,4168
0,4580
0,4967
0,5330
0,5669
0,5984
0,6277
0,6800
0,7250
0,7634
0,7936
0,8244
0,8484
0,8691
0,8818
0,9020
0,9150
0,7
0,8114
0,8276
0,8420
0,8549
0,8664
0,8769
0,9161
0,9411
0,9578
0,9692
0,9772
0,9830
0,9902
0,9942
0,9965
0,9979
0,9987
0,9998
0,9999
0,9999
2,2
0,0068
0,0215
0,0465
0,0806
0,1215
0,1667
0,2144
0,2629
0,3109
0,2576
0,4025
0,4452
0,4856
0,5235
0,5589
0,.5920
0,6227
0,6776
0,7246
0,7647
0,7989
0,8280
0,8527
0,8738
0,8918
0,9071
0,9218
0,9
0,8105
0,8284
0,8487
0,8585
0,8711
0,8824
0,9240
0,9434
0,9656
0,9762
0,9833
0,9881
0,9939
0,9967
0,9982
0,9990
0,9994
0,9999
0,9999
0,9999
2,4
0,0047
0,0166
0,0382
0,0691
0,1076
0,1513
0,1983
0,2468
0,2953
0,3431
0,3892
0,4334
0,4752
0,5147
0,5516
0,5861
0,6182
0,6755
0,7245
0,7662
0,8016
0,8316
0,8569
0,8784
0,8966
0,9120
0,9250
1,0
0,8108
0,8295
0,8461
0,8608
0,8738
0,8855
0,9278
0,9532
0,9690
0,9791
0,9857
0,9901
0,9951
0,9975
0,9987
0,9993
0,9996
0,9999
0,9999
0,9999
2,6
0,0033
0,0128
0,0314
0,0594
0,0955
0,0138
0,1837
0,2320
0,2810
0,3296
0,3769
0,4223
0,4657
0,5065
0,5450
0,5808
0,6142
0,6738
0,7247
0,7679
0,8044
0,8352
0,8611
0,8828
0,9011
0,9166
0,9295
1,2
0,8123
0,8325
0,8502
0,8658
0,8795
0,8917
0,9350
0,9599
0,9748
0,9838
0,9895
0,9931
0,9969
0,9986
0,9993
0,9997
0,9998
0,9999
0,9999
0,9999
2,8
0,0023
0,0099
0,0259
0,0511
0,0849
0,1253
0,1705
0,2185
0,2678
0,3170
0,3654
0,4121
0,4567
0,4990
0,5387
0,5759
0,6106
0,6725
0,7252
0,7698
0,8073
0,8388
0,8651
0,8872
0,9056
0,9209
0,9338
1,4
0,8148
0,8361
0,8547
0,8701
0,8853
0,8979
0,9416
0,9657
0,9794
0,9875
0,9922
0,9952
0,9981
0,9992
0,9996
0,9998
0,9999
0,9999
0,9999
0,9999
3,0
0,0016
0,0770
0,0214
0,0441
0,0756
0,1143
0,1584
0,2060
0,2554
0,3053
0,3545
0,4024
0,4483
0,4919
0,5330
0,5714
0,6073
0,6713
0,6958
0,7717
0,8102
0,8423
0,8691
0,8913
0,9098
0,9251
0,9378
1,6
0,8177
0,8401
0,8595
0,8764
0,8911
0,9039
0,9476
0,9707
0,9833
0,9903
0,9943
0,9966
0,9988
0,9995
0,9997
0,9998
0,9999
0,9999
0,9999
0,9999
3,2
0,0011
0,0060
0,0177
0,0381
0,0674
0,1044
0,1474
0,1945
0,2440
0,2943
0,3443
0,3932
0,4403
0,4852
0,5376
0,5673
0,6043
0,6704
0,7265
0,7737
0,8131
0,8458
0,8729
0,8953
0,9138
0,9290
0,9415
4.1]
Сравнение параметров распределений
443
X
2,5
3,0
3,5
4,0
4,5
5,0
6,0
7,0
8,0
X
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,5
3,0
4,0
5,0
X
0,30
0,35
0,40
0,45
0,50
0,55
0,60
1,8
0,9530
0,9749
0,9863
0,9925
0,9958
0,9976
0,9992
0,9997
0,9999
3,4
0,0046
0,0146
0,0330
0,0602
0,0955
0,1373
0,1838
0,2332
0,2839
0,3347
0,3846
0,4328
0,4789
0,5225
0,5634
0,6015
0,6700
0,7274
0,7758
0,8160
0,8493
0,8767
0,8992
0,9176
0,9327
0,9450
0,9799
0,9926
0,9969
0,9998
5,0
0,0033
0,0107
0,0251
0,0482
0, 0801
0,1200
0,1666
2,0
0,9578
0,9785
0,9889
0,9942
0,9969
0,9983
0,9995
0,9998
0,9999
3,6
0,0036
0,0121
0,0285
0,0538
0,0874
0,1280
0,1738
0,2231
0,2741
0,3256
0,2763
0,4256
0,4729
0,5176
0,5597
0,6000
0,6691
0,7283
0,7779
0,8189
0,8527
0,8804
0,9029
0,9213
0,9362
0,9483
0,9819
0,9936
0,9992
0,9999
5,5
0,0021
0,0076
0,0192
0,0392
0,0682
0,1058
0,1510
2,2
0,9621
0,9816
0,9909
0,9954
0,9977
0,9988
0,9997
0,9999
0,9999
3,8
0,0028
0,0100
0,0247
0,0481
0,0801
0,1195
0,1645
0,2136
0,2648
0,3169
0,3685
0,4188
0,4671
0,5131
0,5563
0,5966
0,6686
0,7296
0,7800
0,8218
0,8560
0,8839
0,9065
0,9248
0,9395
0,9514
0,9837
0,9945
0,9994
0,9999
6,0
0,0014
0,0054
0,0148
0,0320
0,0582
0,0935
0,1371
с
2,4
0,9659
0,9842
0,9926
0,9964
0,9983
0,9992
0,9998
0,9999
0,9999
4,0
0,0022
0,0084
0,0214
0,0431
0,0735
0,1116
0,1559
0,2046
0,2560
0,3086
0,3610
0,4123
0,4617
0,5087
0,5530
0,5944
0,6682
0,7305
0,7822
0,8247
0,8593
0,8873
0,9099
0,9281
0,9426
0,9542
0,9853
0,9953
0,9995
0,9999
6,5
0,0039
0,0115
0,0261
0,0498
0,0828
0,1248
Продолжение табл
2,6
0,9694
0,9865
0,9939
0,9972
0,9987
0,9994
0,9999
0,9999
0,9999
4,2
0,0017
0,0070
0,0186
0,0386
0,0674
0,1043
0,1478
0,1962
0,2477
0,3007
0,3539
0,4061
0,4565
0,5046
0,5499
0,5923
0,6680
0,7316
0,7844
0,8275
0,8624
0,8906
0,9132
0,9312
0,9455
0,9570
0,9868
0,9959
0,9996
0,9999
7,0
0,0028
0,0089
0,0215
0,0427
0,0735
0,1137
2,8
0,9725
0,9884
0,9950
0,9978
0,9990
0,9996
0,9999
0,9999
0,9999
4,4
0,0013
0,0058
0,0162
0,0347
0,0619
0,0975
0,1402
0,1882
0,2397
0,2931
0,3470
0,4000
0,4515
0,5006
0,5470
0,5904
0,6678
0,7328
0,7865
0,8303
0,8656
0,8939
0,9164
0,9343
0,9484
0,9595
0,9881
0,9965
0,9997
0,9999
7,5
0,0020
0,0069
0,0176
0,0366
0,0653
0,1038
3,0
0,9725
0,9900
0,9959
0,9983
0,9992
0,9997
0,9999
0,9999
0,9999
4,6
0,0010
0,0048
0,0141
0,0311
0,0569
0,0913
0,1330
0,1806
0,2321
0,2859
0,3404
0,3943
0,4467
0,4968
0,5442
0,5886
0,6677
0,7341
0,7887
0,8330
0,8686
0,9870
0,9194
0,9371
0,9510
0,9619
0,9892
0,9970
0,9998
0,9999
8,0
0,0014
0,0053
0,0145
0,0315
0,0581
0,0949
ицы 142
3,2
0,9777
0,9914
0,9966
0,9987
0,9994
0,9998
0,9999
0,9999
0,9999
4,8
0,6677
0,7353
0,7909
0,8357
0,8716
0,9000
0,9224
0,9399
0,9535
0,9641
0,9903
0,9974
0,9998
0,9999
8,5
0,0010
0,0041
0,0120
0,0271
0,0518
0,0869
444
Проверка гипотез о значениях параметров распределений
[Гл.4
X
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,5
3,0
4,0
5,0
X
0,40
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,5
3,0
5,0
0,2180
0,2723
0,3279
0,3834
0,4376
0,4897
0,5390
0,6677
0,7366
0,7930
0,8384
0,8745
0,9030
0,9252
0,9425
0,9559
0,9662
0,9912
0,9977
0,9998
0,9999
9,0
0,0032
0,0234
0,0462
0,0796
0,1235
0,1768
0,2373
0,3026
0,3701
0,4374
0,5028
0,5648
0,6747
0,7636
0,8321
0,8830
0,9197
0,9455
0,9635
0,9757
0,9840
0,9895
0,9988
0,9999
5,5
0,2019
0,2567
0,3135
0,3707
0,4270
0,4814
0,5331
0,6680
0,7399
0,7983
0,8449
0,8815
0,9099
0,9318
0,9485
0,9613
0,9709
0,9932
0,9984
0,9999
0,9999
10
0,0020
0,0174
0,0369
0,0670
0,1084
0,1603
0,2209
0,2874
0,3572
0,4276
0,4963
0,5616
0,6772
0,7701
0,8405
0,8918
0,9279
0,9457
0,9693
0,9802
0,9874
0,9921
0,9993
0,9999
6,0
0,1874
0,2424
0,3002
0,3590
0,4173
0,4738
0,5277
0,6685
0,7433
0,8036
0,8511
0,8880
0,9163
0,9377
0,9539
0,9659
0,9749
0,9947
0,9989
0,9999
0,9999
15
0,0042
0,0124
0,0294
0,0584
0,1015
0,1586
0,2279
0,3057
0,3881
0,4709
0,5507
0,6913
0,7996
0,8758
0,9260
0,9573
0,9760
0,9868
0,9929
0,9962
0,9980
0,9999
0,9999
с
6,5
0,1742
0,2293
0,2879
0,3481
0,4082
0,4668
0,5228
0,6693
0,7467
0,8086
0,8570
0,8941
0,9222
0,9431
0,9586
0,9700
0,9784
0,9959
0,9992
0,9999
0,9999
20
0,0010
0,0045
0,0134
0,0320
0,0864
0,1100
0,1852
0,2310
0,3580
0,4512
0,5441
0,7052
0,8243
0,9022
0,9486
0,9742
0,9876
0,9942
0,9974
0,9988
0,9995
0,9999
0,9999
Окончанр
[ е т а б л
ицы 142
7,0
0,1623
0,2172
0,2765
0,3379
0,3997
0,4602
0,5283
0,6702
0,7501
0,8136
0,8627
0,8999
0,9276
0,9480
0,9629
0,9736
0,9813
0,9968
0,9995
0,9999
0,9999
25
0,0063
0,0131
0,0442
0,0840
0,1528
0,2311
0,3334
0,4284
0,5395
0,7184
0,8452
0,9223
0,9638
0,9842
0,9934
0,9974
0,9990
0,9996
0,9999
0,9999
0,9999
7,5
0,1513
0,2060
0,2658
0,3283
0,3917
0,4541
0,5140
0,6712
0,7535
0,8184
0,8681
0,9053
0,9326
0,9524
0,9666
0,9767
0,9838
0,9975
0,9996
0,9999
0,9999
30
0,0030
0,0064
0,0131
0,0620
0,1273
0,2111
0,3124
0,4250
0,5361
0,7307
0,8631
0,9379
0,9743
0,9902
0,9965
0,9988
0,9996
0,9999
0,9999
0,9999
0,9999
8,0
0,1412
0,1956
0,2557
0,3193
0,3841
0,4482
0,5101
0,6723
0,7569
0,8231
0,8733
0,9104
0,9473
0,9565
0,9700
0,9795
0,9860
0,9980
0,9997
0,9999
0,9999
35
0,0014
0,0064
0,0204
0,0512
0,1068
0,1873
0,2940
0,4120
0,5335
0,7421
0,8795
0,9501
0,9817
0,9939
0,9981
0,9995
0,9998
0,9999
0,9999
0,9999
0,9999
8,5
0,1320
0,1859
0,2462
0,3107
0,3769
0,4429
0,5053
0,6734
0,7603
0,8277
0,8782
0,9152
0,9416
0,9601
0,9730
0,9819
0,9879
0,9985
0,9997
0,9999
0,9999
40
0,0032
0,0140
0,0330
0,0901
0,1640
0,2775
0,3940
0,5313
0,7528
0,8919
0,9597
0,9869
0,9961
0,9990
0,9997
0,9999
0,9999
0,9999
0,9999
0,9999
4.1] Сравнение параметров распределений 445
Если:
п
У^ Xj ^ Д то принимается гипотеза Щ;
п
^ ж^ ^ 5, то принимается гипотеза Н\\
п
А < ^ ж^ < I?, то наблюдения продол^:аются.
г=1
Средние объемы выборок, необходимые для завершения процедуры последова-
последовательного анализа, равны
1 — OL QL
A —- a) In — Ь ol In —
-/ \ о 2 Р 1 ~ Р
1 —- а
(Mi - Mo)
Параметр с распределения Вальда находится по формуле
1 ! -
In —-—, если /1 = /io 1 « <С
: = К-
если/* =
Задача 229. Предположим^ что параметр прибора распределен нормально со стан-
стандартным отклонением а = 200. Необходимо проверить при а = 0,1 и /3 = 0,01 ги-
гипотезу о том, что параметр прибора равен /х = /io = 1800, против альтернативы
ц = 1л1= 2000.
Найти контрольные границы и средние объемы выборок для последовательной про-
проверки гипотезы. Определить объем выборки по,э5, для которого с вероятностью не
менее 0,95 процедура последовательного анализа закончится принятием решения по
гипотезе.
Находим
2002 , 0,01 2000 + 1800
А = • In Ь п • z = -899,96 + 1900 • га;
200 - 1800 0,9 2 ' '
_ 2002 0,99 2000 + 1800
В = In Ь га • = 458,5 + 1900 • п.
2000 - 1800 0,1 2
Далее вычисляем средние объемы выборок (округляем до ближайшего большего
целого):
0,9 0,1
0,9 • In -±- + 0,1 • In ¦
п A800) = 2 . 2002 • °?1 ^^ = 8;
B000 - 1800J
0,01 0,99
0,01 • In — h 0,99 • In ——
п B000) = 2 • 2002 • ^ 3—5^- = 5;
V ; B000 - 1800J
0,01 0,99
inn П 0,9 ' П ОД 1П
nmax = —200 • l V — Ю-
B000 - 1800J
446 Проверка гипотез о значениях параметров распределений [Гл. 4
В нашем случае /3 <^. а, тогда для \х\ = 2000 находим
2000 + 1800
0 99
К = In -?— = 2,2925; с = 2,2925 •
2000-
= 1,14625.
ОД 2000 - 1800
При /i = fjii мы ранее получили n(/ii) = 5. Из табл.142 для с = 1,1462 находим
^0,95 w / ч п ЛС
ж = —-— соответствующее условию Wc{x) = 0,95.
Для с = 1,1462 и 7 = 0,95 имеем (интерполируя) х = —f— = 2,3.
Тогда ?го,95 = 2,3 • п B000) = 2,3 • 5 = 14, т. е. с вероятностью 0,95 для принятия реше-
решения по гипотезе потребуется не более 14 испытаний.
Итак, принимаем гипотезу Но, если
J2xi ^ -899,96 + 1900 • п,
г=1
и принимаем гипотезу Hi, если
JTxi ^ 458,5 + 1900 • п.
г=1
В любом ином случае испытания необходимо продолжить. При Но в среднем пона-
понадобятся 8 испытаний, а при Hi — 5 испытаний. Максимальное среднее число испытаний
не превысит 10.
4.1.4.1.2. Проверка гипотезы о значении дисперсии
Проверяется гипотеза Но: а2 = а\ против альтернативы Нi: а2 = а2 (а\ > (Jq)
при известном среднем /х.
п п
Гипотеза Hq принимается, если J^ х2 ^ А; если ^ х2 ^ В, принимается гипо-
г=1 г=1
п
теза ii/"i; если А < ^ ж| < В, то испытания продолжаются. Здесь
г=1
е70
Средние объемы выборок, необходимые для завершения последовательной про™
цедуры, равны
^JL Ч_Л.у J.JLJL „
й(G2) = 2 L
1 2 ^Л
In —
\
Вероятностные оценки необходимого числа испытаний могут быть найдены, по
аналогии с критерием для проверки гипотезы о среднем значении, с помощью
табл. 142 распределения Вальда при
= к
а —
2 ^O^T^l f_ l-OL
где
In —-—, если сг2 = ctq, а <С /3;
In , если а2 = а2, C <С а.
4.1] Сравнение параметров распределений 447
Если значение среднего /л неизвестно, то все приведенные соотношения сохра™
няются при замене п на (п — 1).
Задача 230. Предположим, что параметр прибора распределен нормально с извест-
известным средним ц. Необходимо проверить при а = 0,01 и /3 = 0,1 гипотезу о том, что дис-
дисперсия значений параметра прибора равна а2 = о% = 25 против альтернативы, утвер-
утверждающей, что а = G\ = 49.
Найти контрольные границы и средние объемы выборок для последовательной про-
цедуры проверки гипотез. Определить объем выборки по,э, для которого с вероятно-
вероятностью не менее 7 = 0,90 процедура последовательного анализа закончится принятием
решения по гипотезе. Определить вероятность того, что последовательная процедура
потребует не более 20 испытаний.
ё-©1
Находим
А = 2 ' 2Б ' 49 . Ь I ^- • [ - ) I = -234,029 + 34,348 • га;
49-25 [Спп |г| '
2'25-49 ¦ Г°'9 ¦'- '=459,354+ 34,348-п.
Если ^2xi ^ —-234, 029 + 34, 348 • п, то принимается гипотеза о том, что а =25;
г=1
п
если ^2 Х1 ^ 459,354 + 34,348 • п, то принимается гипотеза о том, что а2 = 49. В случае
г=1
п
—234,029 + 34,348 • гг < J^ ж^ < 459,354 + 34,348 • п испытания необходимо продолжить.
г=1
Далее вычисляем средние объемы выборок (округляя до ближайшего целого числа)
ОД 0,01 ОД 0,9
0,99 ¦ In — Ь 0,01 • In —— 0,1 ¦ In — h 0,9 • In ^^
nB5) = 2 • ^ J?L = 25; fiD9) = 2 • ^ ^ = 27;
2 • In 1 + ( - ) f-)-l-2-ln-
5 \7j \bj 5
0,1 0,9
2 ¦ In —^— • In ¦
0,99 0,01 ._
= 46.
В нашем случае а <С /3, тогда для а2 = erg = 25 находим
0,1
In-
" 0,99
= 2,292 и с = 2,292 <
49
25 +
2
49
. —- ]_
,146.
Из табл. 142 имеем W1M&(x) = 0,90 при х = -^- « 2,8, тогда по,э = п (сто) • 2,8 = 70.
Теперь определим вероятность окончания последовательной процедуры при п ^ 20. Име-
Имеем х = — = — = 0,8.
п 25
Из табл. 142 находим для с = 1,146: М^1Д4б(ж) = 0,56.
Следовательно, с вероятностью 0,56 для окончания последовательной процедуры
потребуется не более 20 испытаний, при условии, что а2 = ст§ = 25.
4.1.4.2. Проверка гипотезы о параметре экспоненциального распределения
Проверяется гипотеза Hq: Л = Aq (напомним, что Л = \jv — средняя наработка
до отказа, v — интенсивность отказов), против альтернативы Hi: А = Ai > Aq.
448
Проверка гипотез о значениях параметров распределений
[Гл.4
Введем обозначения
А =
Ai fa
1-/3
; 5 =
¦In
Если
принимается гипотеза Н$\ если
Ао V P
2 5, принимается гипоте™
г=1
г=1
за i?i; если А < ^ Х{ < В, испытания продолжаются.
г=1
Средние объемы выборок для последовательной процедуры определяются по
формулам
A — a) In — h a In
Ai 1 .
Т~ ~ г ~ 1п
-; n(\l) = i-
Ао
Ао
Л1
-, Ai
1п Г"
Ао
In
1 2 Al
ln If
Параметр распределения Вальда находится по формуле
^Ар
2
^^—, где К =
Ai
1 — а
In —-—, если А =
ot <C
2 7
In , если А = Ai, /3
Задача 231. Найти параметры плана последовательных испытаний при а = 0,2
и /3 = 0,05 d/L« проверки гипотезы Но о том, что средняя наработка на отказ элек-
электронного прибора равна А = Ао = 100 ч против альтернативы Н\ : А = Ai = 150 ч. Вы-
Вычислить средние объемы выборок, необходимых для окончания последовательного ана-
анализа. Найти вероятность того^ что последовательная процедура позволит принять
решение уже после п = 20 испытаний.
Находим
А =
150 - 100
•In
В =
150 - 100
•In
150 /0,2\"
100 \ 0,95
150 / 0,8 \ п
100 * \ 0,05 у
= 0,00811 «п^ 0,0312;
= 0,00811
0,0554.
Далее вычисляем:
0,8 0,2
0,8 • In — Ь 0,2 • In ^—
1 + In
100 100
0,05 0,95
0,05 • In — h 0,95 • In ——
0,8 ' 0,2
100
50
_
= 19; nmax =
0,8 0,2
2 150
100
= 27.
4.1]
Сравнение параметров распределений
449
Теперь найдем, учитывая, что
= Ai = 150,
150 150 - 100
К = 1п
0,95
= 1,558 и с =1,558 •
In-
' 100
/150- 100 у
V 150 )
= 344,864.
п 20
Имеем х = ——- = — « 1 и из табл. 142 для х = 1 и с = 344 имеем Wc(^) = 0,53, т. е.
n(Ai) 19
с вероятностью 0,53 процедура последовательного анализа закончится при п = 20, если
Л = Ai = 150.
4.1.4.3. Проверка гипотезы о параметре биномиального распределения
Проверяется гипотеза Hq : р = ро против альтернативы Hi: р = р\ > Ро-
Введем обозначения
А =
В =
In
In
In-
Pi !
Po
In
Pi
1 -
In
1 -
¦ a
1 -
1-
a
-In
1-
Po
Pi
Po
1 -;
Po
In
In
In
P1 I
Po
In
Pi
1-
-ln
1 -
1-
Pi
1 -
1 -
Po
Pi
1-
Po '
Pi
-Po *
1-P1
Пусть x — число наступлений наблюдаемого события (например, количество
дефектных приборов в партии). Если х ^ А, то принимается гипотеза Н$\ если
х ^ В, принимается гипотеза ii/i; в случае А < х < В испытания продолжаются.
Средние объемы выборок равны
в(ро) =
A — a) In Ь ск In
1 — а а
1 Pl /1 м Х ^Ро '
ро In A — ро) ш
Ро 1 - Pi
п(рг) =
Ро
1 ^ Pi
1 - a
lnPilni^?o
PO 1 ^ Pl
Параметр распределения Вальда находится по формуле
с = К~
где
Pi
1 Pi (Л u 1Po
pin A -p)ln-
Ро 1 - Pi
In-
<С
<С
15 А. И. Кобзарь
450
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 232. Необходимо найти параметры плана последовательных испытаний для
проверки гипотезы Но о том, что доля дефектных изделий в партии р = ро = 0,01
против альтернативы Hi: р = рг = 0,02. Определить количество испытаний, для ко-
которого с вероятностью j = 0,95 последовательная процедура закончится принятием
решения (заданы а = ОД и /3 = 0,01).
Находим
0,99
In
А =
В =
0,01
0,9
0,98
0,02 0,99
In — Ь In ——
0,01 0,98
0,02 0,99
In — h In
0,01
In
0,99
0,1
ln-
0,9
0,99
1 0,98
0,02 0,99
In — h In ——
0,01 0,98
In— hln{0,99}0,98
0,01 г J
= -6,399 + 0,0144 • n;
= 3,26 + 0,0144 -n.
Далее
n@,01) =
0,01 0,99
0,9 ¦ In — h 0,1 • In ——
0,9 0,1
(Щ oM
0,01 • In — 0,99 • In ——
0,9 ' 0,98
= 1225;
0,99 0,01
In • In
_ 0,1 0,9
Uinax ~ 0,02 0,99
Вычисляем параметр с (при /3 <С а и р = р\):
0,01 0,99
0,01 • In — h 0,99 • In ——
(ЦJ 0^99"
0,02 ¦ In — 0,98 • In ——
0,01 0,98
= 1466.
= 569;
1 — В
К = In = In
0,1
= 2,2925 и с = 2,2925 ¦
0,02 0,99
0,02 • In — 0,98 • In ——
0,01 0,98
0,02 • 0,98 • In
0,02
0,01
-In
0,99
= 0,65.
Теперь из табл. 142 находим х =
Q,95
, соответствующее условию Wc(x) = 0,95. Име-
Имеем Wo,65(ж) = 0,95 при х к, 3,5, или по,эб = 569 • 3,5 = 1992.
Следовательно, с вероятностью 0,95 при р = р\ = 0,02 процедура последовательного
анализа потребует не более 1992 испытаний.
4.2] Непараметрические критерии однородности статистических данных 451
4.2. Непараметрические (свободные от распределения)
критерии однородности статистических данных
Рассмотренные ранее методы сравнения параметров распределений предполагав
ли, что мы заранее обладаем фундаментальной информацией — нам известен вид
закона распределения вероятностей.
Обычно это требование редко является препятствием для желающих применять
статистику для решения своих проблем. Однако отклонение закона распределения
вероятностей изучаемой случайной величины от нам понравившегося приводит
к искажению вероятностных характеристик наших выводов (вплоть до принятия
решения, противоположного правдоподобному).
В тех случаях, когда наши предположения о гипотетическом законе распреде-
распределения вероятностей не кажутся убедительными, следует применять иные методы
для сравнения случайных величин и проверки гипотез об их значениях.
Методы статистической обработки и анализа результатов наблюдений, закон
распределения вероятностей появления которых неизвестен, объединены единым
направлением математической статистики, получившим название непараметриче-
непараметрическая статистика. Ее приемы и методы, известные еще как методы? свободные от
распределения^ интенсивно развиваются в последние годы.
Любое распределение можно описать параметром положения, характеризую™
щим центр группирования случайных величин, и параметром масштаба, характе-
характеризующим степень рассеяния случайных величин относительно центра группирова-
группирования (например, в случае нормального распределения ими являются соответственно
среднее \х и стандартное отклонение а).
Когда закон распределения неизвестен, гипотезы о параметрах положения и мас-
масштаба проверяются с помощью специальных критериев сдвига и масштаба.
Если fi(x) и /2(х)—неизвестные плотности вероятностей, то гипотеза сдвига
записывается как Hq: fi(x) = /2(ж) против альтернативы Hi: fi(x) = /2(ж — А),
или Н®: А = 0 против альтернативы Hi: А ф 0, где А — сдвиг, определяемый раз™
ностью параметров положения распределений.
Гипотезы о разнице в дисперсиях (при неизвестных распределениях) формули-
формулируются как гипотезы о параметрах масштаба.
Например, если
l(^JL^ и f2(x) = f(x - »),
то гипотеза о параметре масштаба записывается как Hq : т = 1 против альтернати-
альтернативы Hi: т ф 1.
Достоинством рассматриваемых в настоящем разделе непараметрических (сво-
(свободных от распределения) методов проверки статистических гипотез является их
расчетная простота. Однако мощность статистических критериев, построенных на
их основе, уступает аналогичным параметрическим критериям (например, крите-
критериям Стьюдента, Фишера и т. п.). Легко догадаться, что это плата за незнание вида
распределения случайных величин.
Рекомендуется следующий порядок использования непараметрических критериев.
Если распределение случайной величины неизвестно, то непараметрические критерии
являются единственно возможными критериями для проверки различных статистиче-
статистических гипотез. Если распределение известно, то рекомендуется сначала применить про-
простые в вычислительном отношении непараметрические критерии. При отклонении
ими проверяемой гипотезы дальнейшее уточнение не требуется. Если непараметриче-
непараметрический критерий не отклоняет гипотезу, необходимо осуществить ее дальнейшую про-
проверку одним из более точных параметрических критериев, изложенных в разделе 4.1.
15*
452
Проверка гипотез о значениях параметров распределений
[Гл. 4
4.2.1. Непараметрические критерии сдвига
4.2.1.1. Сравнение параметров сдвига двух совокупностей
4.2.1.1.1. Быстрый (грубый) критерий Кенум
Критерий изложен в [121]. Алгоритм его построения состоит в следующем.
Пусть 0 < ж < 1. Черех хж обозначим такое значение случайной величины,
которое превышается [мп] значениями из выборки.
Вычисляется среднее значение
т = 0,2ж j^ + 0 fix 1 + 0,2ж15
16 2 16
со стандартным отклонением
1,1s
где s = - [х± -xi5
J \ 16 16
Для очень несимметричных распределений используются оценки
Ь
+
3 + х is
4 16
1
s = -
4
3 3
-xi - -хз - х is
4 4 4 4 16
16 4 2 4 16 / ^ \ 16
Проверка разности в параметрах положения проверяется критерием
м = ""- -""-
(индексы относятся к номерам проверяемых выборок).
При объемах проверяемых выборок свыше 20 статистика критерия распреде™
лена нормально. Поэтому нулевая гипотеза отсутствия сдвига не отклоняется при
доверительной вероятности а, если \М\ < ui+a .
2
Критерий устойчив к отклонениям от нормальности, имеет эффективность по
сравнению с параметрическим критерием Стьюдента не хуже « 93%.
Задача 233. Имеются две группы наблюдений объема п = 32:
(гр. 1): 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28,
(гр. 2): 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,
26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41.
Необходимо проверить отсутствие сдвига меэюду средними критерием Кенуя при
доверительной вероятности а, = 0,95.
Находим для первой совокупности
пц = 0,2 • 30 + 0,6 • 16 + 0,2 • 2 = 16;
13,
29,
22,
14,
30,
23,
15,
31,
24,
16,
32;
25,
xi = 16;
2
ж is = 2;
16
S! =
Для второй совокупности имеем
жх=39;
16
Ж1=25;
2
ж is = 11;
16
S2 = 5
^ = 9,33.
о
т2 = 0,2 • 39 + 0,6 • 25 + 0,2 • 11 = 25;
Н = 9K3.
Далее
М =
nil — ГП2
13,199
= 0,682.
4.2] Непараметрические критерии однородности статистических данных 453
Для а = 0,95 имеем и 1+0,95 = ^о,975 = 1,96.
2
Так как \М\ = 0,682 < г^о,975 = 1,96, гипотеза сдвига отклоняется.
Рассмотрим второй вариант критерия. Для первой выборки имеем
Ж1=28; Жз=4; гпг = -Л 1 1 1 Ж = 30 + 28+^16 + 4 + 2 =
4 4 6 6
si = - • ( 30 + - • 28 - - • 4 - 2 ) = 11,5.
4 \ 4 4 J
Аналогично для второй выборки имеем
xi = 37; хз = 13; т,2 = 25; S2 = 11,5.
4 4
Получаем Af = 0,555; легко видеть, что в силу симметричности наших выборок оба
метода дают одинаковые результаты.
4.2.1.1.2. Ранговые критерии сдвига
Ранговые критерии основываются на последовательности рангов выборочных
значений случайных величин. При этом рассматриваются не сами выборочные
значения, а их ранги, определяемые порядковым номером элемента выборки в об-
общем ряду, упорядоченном по возрастанию. Например, в упорядоченной выборке
%i ^ Х2 ^ • • • ^ %п выборочное значение Х{ заменяется рангом R = г.
4.2.1.1.2.1. Быстрый (грубый) ранговый критерий
Изложен в [121]. Рассматриваются две выборки объемов п и т при п + т = 20
(в, т ^ 4). Их элементы ранжируются по возрастанию совместно. Одинаковым на-
наблюдениям присваивается одинаковый усредненный ранг. Для каждой группы на-
находятся суммы рангов ^ R\ и J^ R2 и средние ранги R± = — ^ Ri и R^ = ~~ J^ Rj •
Вычисляем d = R\ — R2. Статистика d-критерия может быть аппроксимирована
нормальным распределением со средним М(сГ) = 0 и дисперсией
Поэтому при \d*
d
12 \ттг
гипотеза сдвига отклоняется с доверительной
Sd
вероятностью а.
Эффективность критерия для нормально распределенных выборок 0,95 (для
любого другого исходного распределения — не хуже 0,86).
Задача 234. Имеются две выборки случайных величин (п = 12, т = 8):
хщ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12;
x2i: Ю, 11, 12, 13, 14, 15, 16, 17.
Необходимо проверить гипотезу сдвига быстрым ранговым критерием при доверитель-
доверительной вероятности а, = 0,95.
Совместный ранжированный ряд имеет вид (вверху проставлены значения случайной
величины, внизу — принадлежность к выборке):
1 2 3 4 5 6 7 8 9 10 10 11 11 12 12 13 14 15 16 17
Х\ Х\ Х\ Х\ Xi Х\ Х\ Х\ Х\ Xi Х2 Х\ Х2 Х\ Х2 Х2 Х2 Х2 Х2 Х2
454
Проверка гипотез о значениях параметров распределений
[Гл.4
Ранги элементов первой выборки (хц) равны (одинаковые ранги усредняются) 1; 2;
3; 4; 5; 6; 7; 8; 9; 10,5; 11,5; 12,5 и ]Г Пг = 79,5; Кг = 6,625.
Для второй выборки имеем ряд
R2: 10,5; 11,5; 12,5; 13; 14; 15; 16; 17 и
Далее
d =
- R2 = |6,625 - 13,687| = 7,062; \d*
= 109,5; R2 = 13,687.
7,062
2,70
= 2,61.
Так
\d*\ = 2,61 > ui+at = 1,96, гипотеза сдвига не отклоняется.
2
4.2.1.1.2.2. Критерий Манна-Уитни-Вилкоксона
Пусть ж1? . ..,жп и г/!, . ..,ут—упорядоченные по возрастанию выборки. Для
проверки гипотезы сдвига Манн и Уитни [436] предложили ранговый критерий,
основанный на статистике
п т (-1 ^
крити-
критиЗдесь U — точное число пар значений xi и yj, для которых Xi < yj.
Если Ui(a) ^ U ^ ^(а), гипотеза сдвига отклоняется (Ui(a) и ^(
ческие значения, приведенные в табл. 143).
С U-статистикой Манна^Уитни связана статистика Вилкоксона [437], определя-
определяемая суммой рангов элементов одной выборки (предположим, xi объема п) в общей
упорядоченной последовательности элементов совместной выборки объема (m + n):
R = тп -
п(п+
-и.
При п, га > 20 применима аппроксимация
П (п + 771 + 1)
W =
пт (п + т?г + 1)
12
Статистика W аппроксимируется нормальным распределением, и гипотеза сдви™
га отклоняется с достоверностью а, если \W\ > wi+a.
2
Если в двух сравниваемых выборках есть совпадающие значения, то им реко-
рекомендуется приписывать средние ранги (среднеарифметическое для каждой серии
последовательных рангов). При этом в знаменателе статистики следует использо-
использовать величину
12
1-
(т + п)(т + п -— 1)(тт1 + п + 1)
где А; — общее число групп совпадающих величин; t{ — число совпавших величин
в г-й группе (следует помнить, что совпадения учитываются только тогда, когда
совпавшие величины принадлежат различным выборкам, т. е. совпадения, целиком
состоящие из элементов одной и той же выборки, на величину W не влияют).
4.2]
Непараметрические критерии однородности статистических данных
455
Таблица 143
Критические значения U\{ol) и С/г (о) критерия Манна-Уитни
(а — доверительная вероятность) [57]
п
4
5
6
7
8
9
10
т
4
5
6
7
8
9
10
5
6
7
8
9
10
6
7
8
9
10
11
12
7
8
9
10
11
12
13
14
8
9
10
11
12
13
14
15
16
9
10
11
12
13
14
15
16
10
11
12
а
0,90
иг
1
2
3
4
5
6
7
4
5
6
8
9
11
7
8
10
12
14
16
17
11
13
15
17
19
21
24
26
15
18
20
23
26
28
31
33
36
21
24
27
30
33
36
39
42
27
31
34
и2
15
18
21
24
27
30
33
21
25
29
32
36
39
29
34
38
42
46
50
55
38
43
48
53
58
63
67
72
49
57
60
65
70
76
81
87
92
60
66
72
78
84
90
96
102
73
79
86
0,95
иг
0
1
2
3
4
4
5
2
3
5
6
7
8
5
6
8
10
11
13
14
8
10
12
14
16
18
20
22
13
15
17
19
22
24
26
29
31
17
20
23
26
28
31
34
37
23
26
29
и2
16
19
22
25
28
32
35
23
27
30
34
38
42
31
36
40
44
49
53
58
41
46
51
56
61
66
71
76
51
54
63
69
74
80
86
91
97
64
70
76
82
89
95
101
107
77
84
91
п
10
12
14
16
18
20
т
13
14
15
16
17
18
19
20
12
13
14
15
16
17
18
19
20
14
15
16
17
18
19
20
21
22
16
17
18
19
20
21
22
23
24
18
19
20
21
22
23
24
25
26
20
21
22
23
а
0,90
иг
37
41
44
48
51
55
58
62
42
47
51
55
60
64
68
72
77
61
66
71
77
82
87
92
97
102
83
89
95
101
107
113
119
125
131
109
116
123
130
136
143
150
157
164
138
146
154
161
и2
93
99
106
112
119
125
132
138
102
109
117
125
132
140
148
156
163
135
144
153
161
170
179
188
197
206
173
183
193
203
213
223
233
243
253
215
226
237
248
260
271
282
293
304
262
274
286
299
0,95
иг
33
36
39
42
45
48
52
55
37
41
45
49
53
57
61
65
69
55
59
64
69
74
78
83
88
93
75
81
86
92
98
103
109
115
120
99
106
112
119
125
132
138
145
151
127
134
141
149
и2
97
104
111
118
125
132
138
145
107
117
123
131
139
147
155
163
171
141
151
160
169
178
188
197
206
215
181
191
202
212
222
233
243
253
264
225
236
248
259
271
282
294
305
317
273
286
299
311
456
Проверка гипотез о значениях параметров распределений
[Гл.4
Окончание таблицы 143
п
20
22
24
26
28
т
24
25
26
27
28
22
23
24
25
26
27
28
29
30
24
25
26
27
28
29
30
31
32
26
27
28
28
30
31
32
28
29
30
31
а
0,90
иг
169
177
185
192
200
171
179
188
197
205
214
223
231
240
207
217
226
236
245
255
264
274
284
247
257
268
278
289
299
310
291
302
313
325
и2
311
323
335
348
360
313
327
340
353
367
380
393
407
420
369
383
398
412
427
441
456
470
484
429
445
460
476
491
507
522
493
510
527
543
0,
иг
156
163
171
178
186
158
166
174
182
191
199
207
215
223
192
201
210
219
228
238
247
256
265
230
240
250
260
270
280
290
272
282
293
304
95
и2
324
337
349
362
374
326
340
354
368
381
395
409
423
437
384
399
414
429
444
458
473
488
503
446
462
478
494
510
526
542
512
530
547
564
п
28
30
32
34
36
38
40
т
32
33
34
30
31
32
33
34
35
36
32
33
34
35
36
37
38
34
35
36
37
38
39
40
36
37
38
39
40
38
39
40
40
0,90
иг
347
359
370
338
350
362
374
387
399
411
388
402
415
428
441
454
467
443
457
471
485
499
513
527
471
486
500
515
529
563
578
594
628
и2
549
565
582
562
580
598
616
633
651
669
636
654
673
692
711
730
749
713
733
753
773
793
813
833
753
774
795
815
836
881
904
926
972
а
0,95
иг
315
326
337
317
328
340
352
364
375
387
365
378
391
403
416
428
441
418
431
445
458
472
485
499
445
459
473
487
501
533
548
563
596
и2
571
598
615
583
602
620
638
656
675
693
659
678
697
717
736
756
775
738
759
779
800
820
841
861
779
801
822
843
864
911
934
957
1004
Более точная аппроксимация предложена Иманом [438]. В соответствии с ней
гипотеза сдвига отклоняется с достоверностью а', если
\J\=< J(a'),
где
za< —ct'-квантиль нормального распределения; tai(f) — а'-квантиль распределения
Стьюдента с f — п + т — 2 степенями свободы; а' — —-—.
Асимптотическая эффективность критерия Манна—Уитни равна 3/тг « 0,95.
4.2]
Непараметрические критерии однородности статистических данных
457
Одним из вариантов применения рассмотренного критерия является так на™
зываемый ранговый критерий Вилкоксона. Его статистика строится следующим
образом. Для двух выборок х и у одинакового объема п строится ряд разностей
Х{ — у%\, который затем ранжируется по возрастанию.
В упорядоченном ряду значений \х{ — yi\ находится сумма рангов Т величин
Zi = Xi ~ yi > 0. Гипотеза сдвига отклоняется, если Т\(а) ^ Т ^ Т2(а), где Т\(а)
и Т2(а)—критические значения, приведенные в табл. 144.
Таблица 144
Критические значения статистики Т знакового рангового
критерия Вилкоксона (а, — доверительная вероятность) [57]
п
6
7
8
9
10
11
12
а
0,90
2
4
6
9
11
14
18
т2
19
24
30
36
44
51
60
0,95
0
3
4
6
9
11
14
т2
21
25
32
39
46
55
64
п
13
14
15
16
17
18
19
а
0,90
22
26
31
36
42
48
54
т2
69
79
89
100
111
123
136
0,95
Ti
18
22
26
30
35
41
47
т2
73
83
94
106
118
130
143
п
20
22
24
26
28
30
32
а
0,90
Тг
61
76
92
111
131
152
176
т2
149
177
208
240
275
313
353
0,95
Ti
53
66
82
99
117
138
160
т2
157
187
218
252
289
327
368
При п ^ 20 применимо приближение
Г-
п(п+ 1)
Т* =
л/п (п + 1) Bп + 1)
При \Т*\ < ui+a гипотеза сдвига отклоняется (здесь и1 — 7~квантиль стандарт-
2
ного нормального распределения).
Более точно приближение содержится в [439], в соответствии с ним гипотеза
сдвига отклоняется на уровне достоверности а, если
\К\ < К(а),
где
К(а) = \za + \ta(n-l);
za — а-квантиль стандартного нормального распределения; ta(f) — «-квантиль рас-
распределения Стьюдента с / = п™ 1 степенями свободы.
Задача 235. Имеются две выборки случайных величин
(п = 8): 1,2; 2,1; 3,8; 6,4; 7,2; 9; 11; 12,4;
(т=10): 2,1; 2,1; 6,1; 6,3; 9; 9; 11,2; 12,4; 13,6.
Необходимо проверить гипотезу сдвига критериями группы Манна-Уитни-Вилкоксона
при доверительной вероятности а = 0,95.
Применим критерий Манна—Уитни, для чего подсчитаем количество пар, для кото-
которых Хг < у j при всех i = l, . ..,n и j = 1, ..., т. Например, для г = 1 и различных j =
ю
= 1, ..., 10 имеем число таких пар, равное ]Р h\j = 10. Далее по аналогии получаем:
458
Проверка гипотез о значениях параметров распределений
[Гл.4
i
1
10
2
8
3
8
4
6
5
6
6
4
7
4
8
2
8 10
Имеем U =J2J2hiJ = 10'
= 48.
Для а = 0,95 из табл. 143 находим Z7i @,95) = 17 и Е/2@,95) = 63.
Так как 17 < U = 48 < 63, гипотеза сдвига отклоняется.
8 • 9
Для статистики Вилкоксона имеем R = 8 • 10 -\ 48 = 68.
При вычислении W--статистики необходимо иметь в виду, что у нас есть три группы
совпадающих наблюдений B,1; 2,1; 2,1), (9; 9; 9) и A2,4; 12,4), т.е. к = 3, ti = 3, t2 = 3
и t3 = 2.
Вычисляем
8- 10- (8 + 10 + 1)
12
1 -
A0 + 8) • A0 + 8 + 1) • A0 + 8 - 1) ^
8- 19
-2— = -0,714.
= 11,202;
68-
w =
11,202
Имеем tii+o,95 = tio,975 = 1,96. Так как \U\ = 0,714 < 1,96, гипотеза сдвига отклоняет-
2
Используем теперь аппроксимацию Имана. Имеем zi+a = ^0,975 = 1,96.
?о,975(/ = Ю + 8 - 20 = 16) = to,97sA6) = 2,12 (см. таб! 118). Тогда
10-2
¦10-1 -0,714^
= -0,708; J@,975) =
1
2-1,96 2-2,12
= 0,491.
Так как \J\ = 0,708 > J@,975) = 0,491, гипотеза сдвига не отклоняется, т. е. более точная
аппроксимация отклоняет нулевую гипотезу.
Применим теперь знаковый ранговый критерий Вилкоксона (для чего ограничим
в демонстрационных целях выборку yj m = 8 значениями). Находим ряд разностей
Xi-yn -0,9; 0; -2,3; 0,1; -1,8; 0; -0,2; 0.
Ранжируем по величине значения zi = \х% — yi\ (вверху обозначим ранг)
(ранг): 2224 5 6 7 8
(zi): 0 0 0 ОД 0,2 0,9 1,8 2,3
1 + 2 + 3
(для трех равных значений Zi = 0 берем средний ранг =2).
о
Величина z% > 0 в ранжированном ряду имеет ранг Т = 4. Из табл. 144 находим
Ti = 4 и Тч = 32. Так как 2\ = 4 ^ Т = 4 ^ Т^ = 32, гипотеза сдвига отклоняется при
а = 0,95. 8.9
4
Для Т* имеем Т* =
= —0,4. Так как |Т* = 0,4 < 1?о,э75 — 1,96, эта аппроксима™
8 ¦ 9 • 17
ция также отклоняет гипотезу сдвига (однако следует помнить, что Т-аппроксимация
применима только при п ^ 20).
Более точное приближение дает (имеем в виду to,975(/ = 7) = 2,365):
= ^0,389; Ж @,975) =
+
= 0,466.
Так как \К\ = 0,389 < if@,975) = 0,466, гипотеза сдвига отклоняется.
4.2]
Непараметрические критерии однородности статистических данных
459
4.2.1.1.2.3. Критерий Фишера-Йэйтса-Терри-Гёфдинга
Критерий рассмотрен в работах Фишера и Йэйтса [440], Терри [441] и Гёфдин™
га [442] и основан на статистике
г=1
где ат+п{г) = M{zlm+n)—математическое ожидание г-й порядковой статистики
в выборке объема (га + п) из стандартного нормального распределения; Щ — ранг
значений у± в объединенной ранжированной выборке х и у (или ранг Х{ в объеди-
объединенной выборке, тогда суммирование нужно вести по г = 1, ..., п).
Напомним (см. аппроксимацию 5 в разделе 1.1.1), что для ап{г) может быть
использована аппроксимация
\0,14
где р =
Гипотеза сдвига отклоняется, если \S\ < 5(а), где S(a) — критическая величина,
некоторые значения которой приведены в табл. 145.
Таблица 145
Критические значения
статистики Фишера^Йэйтса^Терри^Гёфдинга
(а — доверительная вероятность) [443]
п
5
4
6
5
7
6
5
7
6
8
7
6
т
3
4
3
4
3
4
5
4
5
4
5
6
а
0,90
2,12
2,27
2,33
2,42
2,32
2,46
2,58
2,47
2,60
2,55
2,66
2,75
0,95
2,74
2,59
2,69
2,72
2,66
2,82
2,92
2,92
3,00
3,00
3,10
3,19
п
9
8
7
10
9
8
7
10
9
8
11
10
т
4
5
6
4
5
6
7
5
6
7
5
6
а
0,90
2,62
2,77
2,83
2,67
2,82
2,93
2,95
2,89
3,00
3,06
2,94
3,07
0,95
3,04
3,23
3,29
3,11
3,82
3,40
3,44
3,40
3,52
3,58
3,45
3,59
п
9
8
10
9
10
9
11
10
12
11
10
т
7
8
7
8
8
9
8
9
8
9
10
а
0,90
3,15
3,17
3,22
3,27
3,35
3,38
3,42
3,46
3,50
3,55
3,57
0,95
3,68
3,73
3,78
3,82
3,94
3,96
4,02
4,07
4,11
4,17
4,20
При га, п ^ 10 распределение 5 удовлетворительно аппроксимируется нормаль™
ным со средним /х = МE) = 0 и дисперсией
т-\-п
В этом случае гипотеза сдвига отклоняется, если
S
где ti7 — 7™квантиль стандартного нормального распределения.
460
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 236. Для двух выборок
(гс = 8) хн 1, 3, 4, 7, 9, 10, 15, 16;
(га = 7) ун 6, 8, 11, 14, 18, 21, 26
проверить гипотезу сдвига критерием Фишера-Йэйтса-Терри-Гёфдинга при довери-
доверительной вероятности а = 0,95.
Ранжируем совместную выборку, отмечая в ней ранги величин жиг/ (вверху отмечен
ранг, внизу принадлежность к выборке х или у)
12 3 4 5 6 7 8 9 10 11 12 13 14 15
1 3 4 6 7 8 9 10 11 14 15 16 18 21 26
хххухухх у у х х у у у
Следовательно, ранги членов выборки х в общем ряду будут
Rii 1, 2, 3, 5, 7, 8, 11, 12.
3
Для них находим а\ь(г) = 4,91 • [р0'14 — A — р)°'14], где р = ^-.
В результате имеем:
г
aib{i)
1
-1,7419
2
-1,2444
3
-0,94388
5
-0,51307
7
-0,16441
8
0
11
0,51307
12
0,71156
Далее вычисляем
S =
i) = -1,7419 - 1,2444 - ... + 0,51307 + 0,71156 = -3,383.
Из табл. 145 для а = 0,90, п = 8шт = 7 имеем 5@,95) = 3,58.
Так как \S\ = 3,383 < 5@,95) = 3,58, гипотеза сдвига отклоняется.
Для нормального приближения вычисляем дополнительно:
г
а\ъ{г)
4
^0,71156
6
^0,33358
9
0,16441
10
0,33349
13
0,94388
14
1,2444
15
1,7419
Имеем
@ = 12,763;
8-7
3,38
(8 + 7) ¦ (8 + 7- 1) 1,845
Так как \S*\ = 1,832 < tio,975 = 1,96, гипотеза сдвига отклоняется.
4.2.1.1.2.4. Критерий Ван дер Вардена [2]
Статистика критерия имеет вид
т
X =
= 1,832.
где Ury — 7™квантиль стандартного нормального распределения.
Для вычисления квантилей и я* может быть применено приближение (см. ап-
аппроксимацию 15 в разделе 1.1.1)
и л, « 4,91
п + т + 1
0,14
т + 1
0,14'
4.2]
Непараметрические критерии однородности статистических данных
461
Гипотеза сдвига отклоняется, если \Х\ < xaj где ха—критическое значение,
приведенное в табл. 146.
Таблица 146
Критические значения Ха статистики Ван дер Вардена
(а — доверительная вероятность) [2, 443]
п
4
4
5
6
5
6
5
7
6
8
7
6
9
8
ТП
3
4
3
3
4
4
5
4
5
4
5
6
4
5
а
0,90
1,82
1,98
1,84
2,05
2,12
2,18
2,29
2,26
2,32
2,32
2,40
2,45
2,36
2,50
0,95
2,14
2,27
2,41
2,37
2,39
2,50
2,60
2,59
2,69
2,69
2,79
2,85
2,76
2,92
п
7
9
8
7
10
9
8
11
10
9
8
12
11
10
тп
6
5
6
7
5
6
7
5
6
7
8
5
6
7
а
0,90
2,56
2,57
2,65
2,69
2,61
2,71
2,76
2,68
2,80
2,87
2,90
2,73
2,86
2,95
0,95
2,98
3,04
3,07
3,12
3,07
3,20
3,25
3,14
3,28
3,36
3,40
3,20
3,36
3,46
ть
9
12
11
10
9
13
12
11
10
14
13
12
11
10
тп
8
6
7
8
9
6
7
8
9
6
7
8
9
10
а
0,90
2,99
2,91
3,02
3,08
3,09
2,97
3,08
3,15
3,19
3,02
3,15
3,23
3,28
3,30
0,95
3,51
3,43
3,54
3,61
3,63
3,49
3,62
3,70
3,75
3,56
3,70
3,80
3,86
3,88
При п, га ^ 20 распределение X удовлетворительно описывается нормальным со
средним ji = М(ж) = 0 и дисперсией
Т>(Х) =
т-\-п
Если X
X
a, гипотеза сдвига отклоняется с достоверностью а.
Вспомогательные величины
К = —?— У и2
то+п
приведены в табл. 147.
При п + га —>• оо эффективность критерия Ван дер Вардена не уступает эффек-
эффективности критерия Стьюдента.
Задача 237. Проверить гипотезу сдвига в условиях задачи 236 критерием Ван дер
Вардена.
Для рангов выборки х в общем ранжированном ряду
Rii 1, 2, 3, 5, 7, 8, 11, 12
находим
i 1 =«1 =4,91- —
8+7+1 16 I \ J-O
0'14
0'14
= -1,5354;
и 2_ = -1Д492; из_ = -0,8851; и^ = -0,4869; uj_ = -0,1566;
16 16 16 16
и^ =0; ми = 0,4869; U12 = 0,6723.
16 16 16
462
Проверка гипотез о значениях параметров распределений
[Гл.4
Имеем X = ]Р ur i
i=1 т + п+1
= ™3,054. Из табл. 146 для п = 8, т = 7 находим жо,95 = 3,25.
Так как |Х| = 3?054 < жо,95 = 3,25? гипотеза сдвига отклоняется.
Используем теперь нормальное приближение. Из табл. 147 находим
К =
т-\-п
Окончательно
D(I) =
п .К= 1^.0,705 = 2,82;
— 1 14
3,054
1,679
= 1,819.
Так как \Х*\ = 1,819 < гйз,95 = 1,96, нулевая гипотеза сдвига отклоняется.
Таблица 147
Вспомогательные величины К критерия Ван дер Вардена [2]
т + п
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
К
0,449
0,497
0,537
0,570
0,598
0,622
0,642
0,661
0,667
0,692
0,705
0,716
0,727
0,737
0,746
0,755
т + п
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
К
0,763
0,770
0,777
0,783
0,789
0,794
0,799
0,804
0,809
0,813
0,817
0,821
0,825
0,829
0,833
0,836
т + п
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
К
0,839
0,842
0,845
0,848
0,850
0,853
0,855
0,858
0,860
0,862
0,864
0,866
0,868
0,870
0,872
0,874
т + п
53
54
55
56
57
58
59
60
62
64
66
68
70
72
74
76
К
0,876
0,877
0,879
0,880
0,882
0,884
0,885
0,887
0,889
0,892
0,894
0,897
0,899
0,901
0,903
0,905
т + п
78
80
82
84
86
88
90
92
94
96
98
100
110
120
130
140
К
0,907
0,908
0,910
0,912
0,913
0,915
0,916
0,918
0,919
0,920
0,922
0,923
0,928
0,933
0,937
0,940
4.2.1.1.2.5. Медианный критерий
Статистика критерия строится следующим образом [365]. Находится медиана
Ме(ж,у) общего упорядоченного ряда (ж, у), и подсчитывается число наблюдений
выборки ж, превосходящих медиану (если (га + п) нечетно и медиана принадлежит
выборке ж, то это число увеличивается на 1/2). Тогда статистика критерия может
быть записана как
S =
г=1
где
При п^т^ 10 распределение S удовлетворительно описывается нормальным [365
со средним \х = МE) = — и дисперсией
- 1)
, если га + n = 2fc;
если m -\- n = 2k — 1.
4.2] Непараметрические критерии однородности статистических данных 463
Если
то с достоверностью а гипотеза сдвига отклоняется.
Иногда применяется другая форма медианного критерия [444]. Пусть А ж С —
количества элементов выборки ж, соответственно больших и меньших медианы
объединенной выборки, а В и D — аналогичные числа для выборки у. Тогда стати-
статистикой критерия сдвига является величина
Y2=
Х
(А + В) (С + D) + (А + С) (B + DY
имеющая, при отсутствии сдвига, распределение хи~квадрат с / = 1 степенью сво-
свободы.
Критерий неприменим, если А, В, С или D < 5 и n + m < 40. Для этих условий
следует пользоваться точным критерием, критические значения которого D и С
для заданных А и В приведены в [44] (из-за громоздкости таблиц мы их здесь не
приводим).
Эффективность медианного критерия по сравнению с критерием Стьюдента
в случае нормального распределения равна 2/тг « 0,64.
Задача 238. Даны две выборки случайных величин:
(ш = 20) х: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20;
(п = 21) у: 9 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49.
Необходимо проверить гипотезу сдвига медианным критерием при доверительной ве-
вероятности а = 0,95.
Ранжируем совместный ряд (ж, у) (вверху обозначен ранг члена выборки в общем
ряду, для совпадающих значений ранги усреднены)
1 2 3 4 5 6 7 8 9,5 9,5 11 12,5 12,5 14 15,5 15,5 17 18,5 18,5 20
12 3 4 5 6 7 8 9 9 10 11 11 12 13 13 14 15 15 16
ххххххххх ух х у х х у х х у х
21,5 21,5 23 24,5 24,5 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
17 17 18 19 19 20 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
х у х х ухууууууууууууууу
Легко видеть, что медианой этого ряда является член выборки с порядковым номером
т + те + 1 20 + 21 + 1 „
= 21, это х = 17.
Вычисляем
20
1L = 3,5;
Тогда 15*1 = — = 4,06. Так как 15*1 = 4,06 > гх1+о,95 = 1,96, гипотеза сдвига не
1,60 —2—
отклоняется.
464 Проверка гипотез о значениях параметров распределений [Гл. 4
Рассмотрим вторую модификацию критерия. В нашем случае А = 3, С = В = 16
ш D = 4. Тогда
B1 + 20) • МЗ • 4 - 16 • 16| -
V
)
B1 + 20) МЗ 4 16 16| )
-у2 — ^ z ?_ — 2694 8
Х C + 16). A6+ 4)+ C + 16). A6+ 4)
что, конечно же, чудовищно превышает критическое значение Xo,9s(l) = 3,84. Следу-
Следует помнить, что критерий применим только при n + m < 40 и А, В, С, D < 5. Мы его
применили некорректно, однако основной цели достигли — продемонстрировали технику
применения критерия.
4.2.1.1.2.6. Критерий Мостеллера
Рассмотрен в [445] и формулируется следующим образом. Гипотеза равенства
средних двух выборок одинакового объема п > 5 отклоняется с доверительной веро-
вероятностью 0,95, если 5 (при п ^ 25) или 6 (при п > 25) наибольших или наименьших
значений содержатся в одной и той же выборке. Критерий имеет низкую мощность
и может быть рекомендован только для быстрой грубой проверки гипотез сдвига.
Задача 239. В условиях задачи 238 {исключив значение у = 49 для того, чтобы выров-
выровнять объемы выборок п = т = 20) проверить гипотезу сдвига критерием Мостеллера.
Видим, что здесь 14 наибольших значений принадлежат выборке у, что намного
превышает критическое значение, равное 5. Следовательно, можно уверенно признать
наличие сдвига в параметре положения двух выборок.
4.2.1.1.2.7. Критерий Розенбаума
Предложен в [446] для двух выборок равного объема. Если не менее 5 (для
в^16иа = 0,95) или 7 (для п^20иа = 0,99) значений одной выборки находятся
вне размаха второй выборки, то нулевая гипотеза отсутствия сдвига на указанных
уровнях достоверности отклоняется.
Критерий рекомендуется использовать для быстрой приближенной проверки
гипотезы сдвига.
Задача 240. Проверить гипотезу сдвига в условиях задачи 238 критерием Розенбау-
Розенбаума.
Вне размаха выборки у (от 9 до 47) находятся 8 значений выборки ж, что больше
критического числа 5 и позволяет предположить наличие сдвига в параметрах положения
двух выборок.
4.2.1.1.2.8. Критерий Хаги
Рассмотрен в [447]. Пусть А и В1— количества наблюдений среди х\, ...,жп?
больших, чем max г/j, и меньших, чем mln у л соответственно, и пусть А' ж В —
количества наблюдений среди г/i, . ..,уп, больших, чем max a^, и меньших, чем
mm Xi соответственно. Критерий Хаги основан на статистике
Т = А + В^ А1 -В1.
Гипотеза сдвига принимается на уровне значимости а, если \Т\ > Та, где Та —
критическое значение, приведенное в табл. 148.
При n, m > 25 применимо соотношение [448]
к) = У+?*У {p2+q)q
(p-q)(l+Py
4.2]
Непараметрические критерии однородности статистических данных
465
Таблица 148
Критические значения Та критерия Хаги (а — уровень значимости) [448]
4
5
6
7
8
9
а
0,05
6
6
6
6
7
7
0,10
5
5
5
5
6
6
10
11
12
13
14
15
а
0,05
7
7
7
7
7
7
0,10
6
6
6
6
6
6
16
17
18
19
20
21
а
0,05
7
7
7
7
7
7
0,10
6
6
6
6
6
6
22
23
24
а
0,05
7
7
7
0,10
6
6
6
где
Гипотеза сдвига принимается, если вычисленное значение Р(Т ^ к) < —, где а —
заданный уровень значимости.
Задача 241. Для данных задачи 238 проверить гипотезу сдвига критерием Хаги на
уровне значимости а = 0,05 (принимаем п = т = 20).
Имеем А = 0, В' = 8, А' = 14, В = 0 и Г = 0 + 0 - 14 - 8 = ^22.
Из табл. 148 для п = т = 20 находим критическое значение Го,о5 = 7.
Так как \Т\ = 22 > To,os = 7, гипотеза сдвига уверенно принимается.
Находим далее
.-6
Р(Г
22) =[ — + !
\ 2 3
= 2,7 • 10~
Легко видеть, что Р(Т ^ 22) <С 0,05/2 = 0,025, что также позволяет принять гипотезу
сдвига.
4.2.1.1.2.9. ^-критерий
Предложен Гаеком и Шидаком [365, 449]. В обозначениях, введенных для кри™
терия Хага (см. раздел 4.2.1.1.2.8), статистика ^-критерия записывается как
Е= \mm(A, В) - min(Af, Вг)\ .
Таблицы критических значений Е^критерия приведены в [450]. Однако мы
рекомендуем вместо таблиц использовать достаточно простую формулу
?(Е
с:
где к = 1, 2, ..., min(ra, n).
Так как ~Р(Е ^ к) = Р(.?7 ^ Aj), to на уровне значимости а гипотеза сдвига будет
принята, если Р(Е ^ к) или P(i? ^ Aj) будет меньше, чем а/2.
Задача 242. Проверить Е-критерием гипотезу сдвига в условиях задачи 238.
Имеем А = 0, В' = 8, А1 = 14 и В = 0.
Тогда ?" = |min@,0) - mln(8,14)| = 8 и
?(Е :> 8) =
^20+20-2-8
20+20
Легко видеть, что ~Р(Е ^ 8) <С а/2 = 0,025, что позволяет уверенно принять гипотезу
сдвига, так как наблюдаемое значение Е = 8 очень маловероятно при отсутствии сдвига
в параметрах положения двух выборок.
466
Проверка гипотез о значениях параметров распределений
[Гл.4
4.2.1.2. Сравнение параметров сдвига нескольких (к > 2) совокупностей
4.2.1.2.1. Критерий Круекала—Уоллиса
Рассмотрен в [451]. Пусть в нашем распоряжении имеются к выборок случайных
величин
1, #12, •••?
#21? #22» •••?#2п2;
Упорядочим все N = ]Р щ элементов выборок по возрастанию и обозначим
г=1
через Rij ранг j-ro элемента г-й выборки в общем упорядоченном ряду.
Статистика критерия Крускала^Уоллиса для проверки гипотезы о наличии сдви-
сдвига в параметрах положения двух сравниваемых выборок имеет вид
N + 1
12
N(N
г=1
где iJi =
i
Легко видеть, что критерий Крускала^Уоллиса является многомерным обобще-
обобщением двухвыборочного критерия Вилкоксона^Манна^Уитни (см раздел 4.2.1.1.2.2).
Гипотеза сдвига отклоняется на уровне значимости а1 если Н ^ На1 где На —
критическое значение, приведенное в табл. 149 для к ^ 5 и п^ ^ 8. При гц ^ 5
применимы различные аппроксимации. Укажем некоторые из них.
Таблица 149
Критические значения критерия Крускала^Уоллиса
(а — уровень значимости) [18, 57, 444]
«i
2
3
3
3
4
4
4
4
4
4
5
5
5
n2
2
2
3
3
2
3
3
4
4
4
2
3
3
пз
2
2
2
3
2
2
3
2
3
4
2
2
3
ОД
4,571
4,500
4,556
4,622
4,458
4,511
4,709
4,555
4,545
4,654
4,373
4,651
4,533
0,05
4,714
5,361
5,600
5,333
5,444
5,791
5,455
5,598
5,692
5,160
5,251
5,648
П\
5
5
5
5
5
5
5
6
6
6
6
6
6
п2
4
4
4
5
5
5
5
2
3
3
4
4
4
пз
к--
2
3
4
2
3
4
5
2
2
3
2
3
4
a
ОД
0,05
= 3
4,541
4,549
4,668
4,623
4,545
4,523
4,560
4,545
4,682
4,590
4,494
4,604
4,595
5,273
5,656
5,657
5,338
5,705
5,666
5,780
5,345
5,348
5,615
5,340
5,610
5,681
«1
6
6
6
6
6
6
6
6
6
7
8
П2
5
5
5
5
6
6
6
6
6
7
8
пз
2
3
4
5
2
3
4
5
6
7
8
а
ОД
4,596
4,535
4,522
4,547
4,438
4,558
4,548
4,542
4,643
4,594
4,595
0,05
5,338
5,602
5,661
5,729
5,410
5,625
5,724
5,765
5,801
5,819
5,805
4.2]
Непараметрические критерии однородности статистических данных
467
Окончание таблицы 149
2
3
3
3
3
4
4
4
4
2
3
п2
2
2
3
3
3
2
пз
2
2
2
3
3
2
п2
4
4
4
2
2
пз
4
4
4
2
2
п4
2
2
2
2
3
2
Q
ОД
5,667
5,664
5,745
5,879
6,026
5,755
п4
2
3
4
2
2
п6
2
2
ОД
5,914
6,042
6,088
6,982
6,955
к =
0,05
6,167
6,333
6,527
6,727
7,000
6,545
к =
а
0,05
6,957
7,142
7,235
7,418
7,682
= 4
4
4
4
4
4
= 5
3
3
3
3
п2
3
3
3
4
4
п3
2
3
3
2
2
п2
3
3
3
3
пз
2
3
3
3
п4
«4
2
2
3
3
2
2
3
2
2
а
ОД
5,750
5,872
6,016
5,808
5,901
«5
2
2
2
3
од
7,026
7,121
7,210
7,333
0,05
6,621
6,795
6,984
6,731
6,874
а
0,05
7,910
8,044
8,200
8,333
Аппроксимация Крускала-Уоллиса [451]
Пусть
м =
N(N + 1) '
V = 2(k-1)-
= (к - 1)
(к-
5iV(iV
Тогда статистика
F =
^V
1)}
М ^к + 1
jfe- I J
будет иметь при отсутствии сдвига i^-распределение с и\ и г/2 степенями сво-
свободы. Таким образом, нулевая гипотеза отклоняется с достоверностью а, если
F>Fa(vuv2).
Аппроксимация Имана-Давенпорта [452]
В соответствии с ней нулевая гипотеза сдвига отклоняется с достоверностью а,
если J ^ Jai где
J = f
- fe)
" 1)} ,
Faifit /2) и Xa(a) —соответственно критические значения статистик Фишера и хи™
квадрат с соответствующими степенями свободы.
Это более точная аппроксимация, чем аппроксимация Крускала^Уоллиса. При
наличии связанных рангов (т. е. когда совпадают значения величин из разных
468
Проверка гипотез о значениях параметров распределений
[Гл.4
выборок и им присваивается одинаковые средние ранги) необходимо использовать
'1
модифицированную статистику Н* = Н < 1 —
v=i
3
7V ~N
5 гДе
= t| —
tj—размер j-й группы одинаковых элементов; q — количество групп одинаковых
элементов.
При щ ^ 20 справедлива аппроксимация распределения статистики Н % -рас-
-распределением с / = & — 1 степенями свободы, т. е. нулевая гипотеза отклоняется, если
Задача 243. В результате наблюдений получены пять выборок случайных величин
(к = 5)
xtji 1, 2, 3, 4, 5, 6 (щ=6); x2j: 3, 4, 5, 6, 7 (п2 = 5); x3j-: 7, 8, 9 (п3 = 3);
x4i: 1, 5, 7, 8, 10, 12 (п4 = 6); ж5,: 10, 11, 13, 14, 16, 18, 20 (га5 = 7).
Необходимо проверить гипотезу об отсутствии сдвига между параметрами положе-
положения в выборках критерием Крускала-Уоллиса на уровне значимости а = 0,05.
5
Ранжируем совместно все N = ]>^Пг = б + 5 + 5 + 6 + 7 = 27 выборочных значений
г=1
Xij (г — номер выборки; Rij—ранг j-ro наблюдения в г-й выборке). Результаты сведем
в таблицу, усредняя ранги совпадающих наблюдений:
г
1
4
1
1
2
1
2
Xij
1
1
2
3
3
4
4
1,5
1,5
3
4,5
4,5
6,5
6,5
i
1
2
4
1
2
2
3
Xij
5
5
5
6
6
7
7
9
9
9
11,5
11,5
14
14
i
4
3
4
3
4
5
5
Xij
7
8
8
9
10
10
11
Ri
14
16,5
16,5
18
19,5
19,5
21
i
4
5
5
5
5
5
Xij
12
13
14
16
18
20
Rt
22
23
24
25
26
27
Далее подсчитываем
36
Кг = У Rtj = 1,5 + 3 + 4,5 + 6,5 + 9 + 11,5 = 36 (#i = — = 6);
r~f 6
R2 = 4,5 + 16,5 + 9 + 11,5 + 14 = 45,5 (R2 = — = 9,1);
R3 = 48,5 (R3 = 16,166); R4 = 82,5 (R4 = 13,75); R5 = 165,5 (Д5 = 23,643).
Тогда
12 5 R2
H = • у -5- - 3 • 28 = 18,562.
27 • 28 ^ rii
Используя аппроксимацию Крускала-Уоллиса, имеем
з
М =
V = 2-4:-
= 24,8095; щ = 3,8274; и2 = 19,91;
\ 5
I - 5. у; — = 6,464.
27-28
2- {3-52 ^6-5 + 27- B-25^6-5
5-27-28
4.2]
Непараметрические критерии однородности статистических данных
469
Учитывая, что у нас были группы совпадающих рангов (всего было q = 8 совпадаю-
совпадающих групп с t\ = 2, ?2 = 2, ?3 = 2, ?4 = 3, ?5 = 2, te = 3, ?7 = 2, tg = 2), находим
Я* =
н
= 18,642;
1 -
27 - 27
18,642 • B4,8095 -5 + 1)
4 • B4,8095 - 18,642) '
Из таблиц F-распределения (или аппроксимаций — см. раздел 1.1.10) находим для
уровня достоверности 1 — а = 0,95: .Fo,95(^1 = 3,83; 1/2 = 19,91) = 3,05.
Так как F = 15,725 > .Fo,95C,83; 19,91) = 3,05, гипотеза сдвига не отклоняется (т.е.
сдвиг признается значимым).
Используем теперь аппроксимацию Имана-Давенпорта:
J =
18,642
1 +
27 - 1 - 18,642
= 37,19; Jo,95 = \ • [4 • F0,95D; 22) + Хо,э5D)] .
Из таблиц находим Fo,95D;22) = 2,82 и Хо,9бD) = 9,49 (аппроксимации см. в разде-
разделах 1.1.8, 1.1.10). Тогда Jo,95 = - • D • 2,82 + 9,49) = 10,385.
Так как J = 37,19 > Jo,95 = 10,385, гипотеза сдвига не отклоняется.
4.2.1.2.2. Критерий Неменьи
Критерий применим для выборок равного объема п (т.е. N = nk). Статистика
критерия, предложенного Неменьи [453], в обозначениях, принятых для крите-
критерия Крускала-Уоллиса (ем. раздел 4.2.1.2.1), имеет вид D^m = \Щ — Rm\, (l ф т;
1,т= 1,2, ...,fc).
Гипотеза сдвига считается принятой, если В^ш ^ ?>/}Ш(а), где D|,m(a) — крити-
критические значения, приведенные в табл. 150.
Задача 244. Для к = 4 выборок равного объема п = 5
xij: 1, 2, 3, 4, 5; x2ji 3, 4, 5, 6, 7;
x3j: 4, 5, 6, 7, 8; x4ji 7, 8, 9, 10, 11
проверить гипотезу сдвига критерием Неменьи при достоверности а = 0,95.
Упорядочиваем по возрастанию ряд j\T = n-lc = 5-4 = 20 значений хц (г — номер
выборки). Результаты сводим в таблицу, ранги совпадающих наблюдений усредняем:
%
1
1
1
2
1
Xij
1
2
3
3
4
Щ
1
2
3,5
3,5
6
г
2
3
1
2
3
Хц
4
4
5
5
5
6
6
9
9
9
i
2
3
2
3
4
Xij
6
6
7
7
7
11,5
11,5
14
14
14
i
3
4
4
4
4
Xij
8
8
9
10
11
Rtj
16,5
16,5
18
19
20
Вычисляем
20
Ri = J2 RlJ = X + 2 + 3'5 + 6 + 9 - 21'5'
j • = 3,5 + 6 + 9 + 11,5 + 14 = 44;
20
i = 6 + 9 + 11,5 + 14 + 16,5 = 57;
^J = I4 +
+ 18 + 19 + 20 = 87,5.
470
Проверка гипотез о значениях параметров распределений
[Гл.4
Критические значения
Таблица 150
критерия Неменьи [9]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
к
3
13,8
20,9
29,0
37,9
47,6
58,0
69,1
80,8
93,1
105,9
119,3
133,2
147,6
162,5
177,9
193,7
210,0
226,7
243,8
261,3
279,2
297,5
316,2
15,7
23,9
33,1
43,3
54,4
66,2
78,9
92,3
106,3
120,9
136,2
152,1
168,6
185,6
203,1
221,2
239,8
258,8
278,8
298,4
318,9
339,8
361,1
4
5
6
7
Доверительная вероятность
20,2
30,9
42,9
56,1
70,5
86,0
102,4
119,8
138,0
157,1
177,0
197,7
219,1
241,3
264,2
287,7
311,9
336,7
362,2
388,2
414,9
442,2
470,0
26,9
41,2
57,2
75,0
94,3
115,0
137,0
160,3
184,8
210,4
237,1
264,8
293,0
323,3
353,9
385,5
417,9
451,2
485,4
520,4
556,1
592,7
630,0
33,9
51,8
72,1
94,5
118,8
145,0
172,8
202,2
233,1
265,4
299,1
334,1
370,4
407,9
446,6
486,5
527,5
568,5
612,6
656,8
702,0
748,1
795,3
40,9
62,6
87,3
114,4
144,0
175,7
209,4
245,1
282,6
321,8
362,7
405,1
449,2
494,7
541,6
590,0
639,7
690,7
743,0
796,6
851,4
907,4
964,6
Доверительная вероятность
22,7
34,6
48,1
62,9
79,1
96,4
114,8
134,3
154,8
176,2
198,5
221,7
245,7
270,6
296,2
322,6
349,7
377,6
406,1
435,5
465,3
495,8
527,0
29,9
45,6
63,5
83,2
104,6
127,6
152,0
177,8
205,0
233,4
263,0
293,8
325,7
358,6
392,6
427,6
463,3
500,5
538,4
577,2
616,9
657,4
698,8
37,3
57,0
79,3
104,0
130,8
159,6
190,2
222,6
256,6
292,2
329,3
367,8
407,8
449,1
491,7
535,5
580,6
626,9
674,4
723,0
772,7
823,5
875,4
44,8
60,6
95,5
125,3
157,6
192,4
229,3
268,4
309,4
352,4
397,1
443,6
491,9
541,7
593,1
646,1
700,5
756,4
813,7
872,3
932,4
993,7
1056,3
8
а = 0,90
48,1
73,8
102,8
134,8
169,6
207,0
246,8
288,9
333,1
379,3
427,6
477,7
529,6
583,3
638,7
695,7
754,3
814,5
876,2
939,4
1001,1
1070,2
1137,6
а = 0,95
52,5
80,4
112,0
147,0
184,9
225,7
269,1
315,0
363,2
413,6
466,2
520,8
577,4
635,9
696,3
758,5
822,4
888,1
955,4
1024,3
1094,8
1166,8
1240,4
9
55,5
85,1
118,6
155,6
195,8
239,0
284,9
333,5
384,6
438,0
493,7
551,6
611,6
673,6
737,6
803,4
871,2
940,7
1012,0
1085,0
1159,7
1236,0
1314,0
60,3
92,4
128,8
169,1
212,8
259,7
309,6
362,4
417,9
476,0
536,5
599,4
664,6
732,0
801,5
837,1
946,7
1022,3
1099,8
1179,1
1260,3
1343,2
1427,9
10
63,0
96,5
134,6
222,3
271,4
323,6
378,8
436,8
497,5
560,8
626,6
694,8
765,2
837,7
912,8
989,7
1068,8
1149,8
1232,7
1317,6
1404,3
1492,9
1591,0
68,2
104,6
145,8
191,4
240,9
294,1
350,6
410,5
473,3
539,1
607,7
679,0
752,8
829,2
907,9
989,0
1072,4
1158,1
1245,9
1335,7
1427,7
1521,7
1617,6
4.2]
Непараметрические критерии однородности статистических данных
471
Далее вычисляем разности D^m = \Щ — Rm\:
1
1
2
3
т
2
22,5
3
35,5
13,0
4
66,0
33,5
30,5
Так как Di,4 = 66 > DiiTn@,95) = 48,1, гипотеза сдвига не отклоняется, между первой
и четвертой выборками существует значимый сдвиг в параметрах положения.
4.2.1.2.3. Критерий Вилкоксона—Вилкокс
Критерий предложен в [454] и подобен критерию Неменьи (см. раздел 4.2.1.2.2).
Пусть имеются к выборок равного объема п и Xij — г-й элемент j-й выборки
(г = 1,2, ..., щ j = 1,2, ..., к). Обозначим через Rij ранг г-го наблюдения j-и вы™
борки в упорядоченном по возрастанию ряду i-x элементов к выборок A ^ Rij ^ к)
и через Rj =
ij сумму рангов j-й выборки.
г=1
Статистикой критерия является разность
критические значения которой приведены в табл. 151.
При Dv^? ^ DVt)?{pt) с доверительной вероятностью а гипотеза сдвига принима-
принимается.
Так лее, как и критерий Неменьи, настоящий критерий позволяет выявить
выборки, приводящие к отклонению нулевой гипотезы.
Задача 245. Для данных задачи 244 проверить гипотезу сдвига критерием Викоксо-
на-Вилкокс.
Ранжируем первые элементы всех 4 выборок. Результаты сведем в таблицу:
г
1
2
3
4
5
3
1
Xij
1
2
3
4
5
1
1
1
1
1
2
Xij
3
4
5
6
7
2
2,5
2
2
2
3
4
4
6
7
8
Rij
3
2,5
3
3
3
4
7
8
9
10
11
Rij
4
4
4
4
4
Далее составляем разности DV? = \RV — Re
и
1
2
3
?
2
5,5
3
9,5
4,0
4
15,0
9,5
5,5
Для fc = 4, n = 5 и a = 0,95 находим из табл. 151 DU?@,9b) = 10,5. Так как
Di?4 = 15 > D^e@,95) = 10,5, сдвиг между параметрами положения первой и четвертой
выборок следует признать значимым (т.е. не случайным).
472
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица
Критические значения .О„>е(сх) критерия
Вилкоксона^Вилкокс [9]
151
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
к
3
5,0
5,8
6,5
7Д
7,7
8,2
8,7
9,2
9,6
10,1
10,5
10,9
11,2
11,6
12,0
12,3
12,6
13,0
13,3
13,6
13,9
14,2
14,5
5,7
6,6
7,4
8,1
8,8
9,4
9,9
10,5
11,0
11,5
11,9
12,4
12,8
13,3
13,7
14,1
14,4
14,8
15,2
15,5
15,9
16,2
16,6
4
5
6
7
Доверительная вероятность
7,2
8,4
9,4
10,2
11,1
11,8
12,5
13,2
13,9
14,5
15,1
15,7
16,2
16,7
17,2
17,7
18,2
18,7
19,2
19,6
20,1
20,5
20,9
9,5
11,0
12,3
13,5
14,5
15,6
16,5
17,4
18,2
19,0
19,8
20,6
21,3
22,0
22,7
23,3
24,0
24,6
25,2
25,9
26,4
26,9
27,5
11,9
13,7
15,3
16,8
18,1
19,4
20,5
21,7
22,7
23,7
24,7
25,6
26,5
27,4
28,2
29,1
29,9
30,6
31,4
32,1
32,8
33,6
34,2
14,2
16,5
18,4
20,2
21,8
23,3
24,7
26,0
27,3
28,5
29,7
30,8
31,9
32,9
33,9
34,9
35,9
36,9
37,7
38,6
39,5
40,5
41,1
Доверительная вероятность
8,1
9,4
10,5
11,5
12,4
13,3
14,1
14,8
15,6
16,2
16,9
17,5
18,2
18,8
19,3
19,9
20,4
21,0
21,5
22,0
22,5
23,0
23,5
10,6
12,2
13,6
14,9
16,1
17,3
18,3
19,3
20,2
21,1
22,0
22,8
23,6
24,4
25,2
25,9
26,6
27,3
28,0
28,6
29,3
29,9
30,5
13,1
15,1
16,9
18,5
19,9
21,3
22,6
23,8
25,0
26,1
27,2
28,2
29,2
30,2
31,1
32,0
32,9
33,7
34,6
35,4
36,2
36,9
37,7
15,6
18,0
20,1
22,1
23,9
25,5
27,0
28,5
29,9
31,2
32,5
33,7
34,9
36,0
37,1
38,2
39,3
40,3
41,3
42,3
43,2
44,1
45,0
8
9
а = 0,90
16,7
19,3
21,5
23,6
25,5
27,2
28,9
30,4
31,9
33,4
34,7
36,0
37,3
38,5
39,7
40,9
42,0
43,1
44,1
45,2
46,2
47,2
48,1
19,1
22,1
24,7
27,1
29,3
31,3
33,2
35,0
36,7
38,3
39,9
41,4
42,8
44,2
45,6
46,9
48,2
49,4
50,7
51,9
53,0
54,2
55,3
а = 0,95
18,2
21,0
23,5
25,7
27,8
29,7
31,5
33,2
34,8
36,4
37,9
39,3
40,7
42,0
43,3
44,5
45,8
47,0
48,1
49,2
50,3
51,4
52,5
20,8
24,0
26,9
29,4
31,8
34,0
36,0
38,0
39,8
41,6
43,3
45,0
46,5
48,1
49,5
51,0
52,4
53,7
55,1
56,4
57,6
58,9
60,1
10
21,7
25,0
28,0
30,6
33,1
35,4
37,3
41,5
43,3
44,3
45,1
46,8
48,4
50,0
51,5
53,0
54,5
55,9
57,3
58,6
60,0
61,2
62,5
23,5
27,1
30,3
33,2
35,8
38,3
40,6
42,8
44,9
46,9
48,8
50,7
52,5
54,2
55,9
57,5
59,0
60,6
62,1
63,5
65,0
66,4
67,7
4.2]
Непараметрические критерии однородности статистических данных
473
4.2.1.2.4. „Быстрый66 критерий Кенуя
Среди к выборок равного объема п ^ 20 находятся наибольшее среди наимень-
наименьших значений ж™^. и наименьшее среди наибольших значений x^f* в выборках.
Подсчитываются количества п\ наблюдений, для которых Х{ < ж™^., и П2, для
КОТОРЫХ Х{ < X™f?.
Статистикой критерия Кенуя является сумма п = П1+П2, критические значения
которой п(а) приведены в табл. 152.
Таблица 152
Критические значения n(pt) критерия Кенуя
(а — уровень значимости) [121]
к
а = 0,05
а = 0,01
2
9
12
3
17
22
4
27
33
5
37
45
6
47
57
8
70
83
10
93
110
Задача 246. Имеются три выборки случайных величин объема п = 20 каждая
xtji 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39;
x2j: Ю, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48;
x3j: 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40.
Необходимо проверить гипотезу сдвига критерием Кенуя на уровне значимости
а = 0,05.
Имеем ж?кх = 21 и ж?2Т = 39. Тогда щ = 16, п2 = 6 и п = 16 + 6 = 22.
Из табл. 152 для к = 3 и а = 0,05 находим п(а) = 17.
Так как п = 22 > п(а) = 17, гипотеза сдвига не отклоняется.
4.2.1.2.5. Критерий Фишера-Терри-Йэйтса-Гёфдинга
Вариант критерия Фишера-Терри-Йэйтса-Гёфдинга (см. раздел 4.2.1.1.2.3) для
к > 2 выборок основан на статистике [365]
1 2
к
(JV-l)V-
3 = 1
г=1
где Rij —ранг элементов j-и выборки в общем ряду (N = У^ rij).
3 = 1
При rij > 10 распределение статистики Q может быть аппроксимировано % -рас-
-распределением с / = Aj — 1 степенями свободы. Поэтому нулевая гипотеза отсутствия
сдвига отклоняется с достоверностью а, если Q > Х^{к — 1).
Задача 247. Имеются три выборки случайных величин:
хи: 1, 25 3, 4, 5, 6, 75 8, 9, 10;
x2j: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25;
x3j: 12, 14, 16, 18, 20, 22, 24, 26, 28, 30.
Необходимо проверить гипотезу сдвига критерием Фигиера-Терри—Йэйтса-Гёфдинга
при доверительной вероятности а = 0,95.
Имеем 7ii = Ю, п2 = 11, п3 = 10 и N = 31.
Строим общий, ранжированный по возрастанию, ряд из элементов трех заданных
выборок (г = 1,2,3 — номер первичной выборки, Xj—элементы объединенной выборки,
j = 1,2, ...,31; Rij —ранг j-ro элемента в объединенной выборке):
474
Проверка гипотез о значениях параметров распределений
[Гл.4
i
1
1
1
1
1
2
1
1
Xij
1
2
3
4
5
5
6
7
1
2
3
4
5,5
5,5
7
8,5
ъ
2
1
1
2
1
2
3
2
7
8
9
9
10
11
12
13
8,5
10
11,5
11,5
13
14
15
16
г
3
2
3
2
3
2
3
2
14
15
16
17
18
19
20
21
Rn
17
18
19
20
21
22
23
24
г
3
2
3
2
3
3
3
Xij
22
23
24
25
26
28
30
25
26
27
28
29
30
31
Далее вычисляем значения (см. раздел 4.2.1.1.2.3)
= 4,91 •
3
0,14
k-3-
1-
включая дробные значения к (дробные ранги).
Результаты сведем в таблицу:
к
1
2
3
4
5
5,5
6
7
8
«31(к)
-2,0567
-1,6276
-1,3788
-1,1943
-1,0434
-0,97634
-0,9134
-0,7974
-0,6913
к
8,5
9
10
11
11,5
12
13
14
15
а3г(к)
-0,6412
-0,5927
-0,4996
-0,4108
-0,3676
-0,3252
-0,2419
-0,1604
-0,0799
к
16
17
18
19
20
21
22
23
24
а3г(к)
0
0,0799
0,1604
0,2419
0,3252
0,4108
0,4996
0,5927
0,6913
к
25
26
27
28
29
30
31
азг(к)
0,7974
0,9134
1,0434
1,1943
1,3788
1,6276
2,0567
Для первой выборки (г = 1) имеем
31
Rij : 1, 2, 3, 4, 5,5, 7, 8,5, 10, 11,5, 13 и ^ a3i(Rij) = ^9,7814.
i=i
Для второй (г = 2) выборки
31
R2j : 5,5, 8,5, 11,5, 14, 16, 18, 20, 22, 24, 26, 28 и ]Г a^{R2j) = 1,6387.
i=i
Для третьей выборки (г = 3)
31
R3j : 15, 17, 19, 21, 23, 25, 27, 29, 30, 31 и ^ a3i(R3j) = 8,1293.
3 = 1
31
Находим ^^ Q-3i@ =:: 28,4186 и вычисляем статистику критерия
Q = ——— • У" —
^ 28,4186 ~_nj
= 17,367.
Находим из табл. 55: Хо,9бB) = 5,99.
Так как Q = 17,367 > Хо,9бB) = 5,99, гипотеза сдвига не отклоняется.
4.2]
Непараметрические критерии однородности статистических данных
475
4.2.1.2.6. Критерий Ван дер Вардена
Статистика Ван дер Вардена для к > 2 выборок имеет вид
-1 т, г 1 2
При справедливости нулевой гипотезы статистика Q* распределена как %
с / = Aj — 1 степенями свободы. Поэтому нулевая гипотеза отсутствия сдвига от™
клоняется, если Q* > Х«(^ ~~ 1)? гДе а — доверительная вероятность.
Задача 248. Проверить гипотезу сдвига в условиях задачи 247 критерием Ван дер
Вардена.
0,14
Вычисляем и % = 4,91 • I I — ) — ( 1 — -^
Результаты сведем в таблицу (включая дробные значения рангов г):
ОД4
г
1
2
3
4
5
5,5
6
7
8
U i
32
-1,8658
-1,5354
-1,3178
-1,1492
-1,0083
-0,9448
^0,8851
-0,7743
-0,6723
i
8,5
9
10
11
11,5
12
13
14
15
U i
32
-0,6723
-0,5771
-0,4869
-0,4006
-0,3586
-0,3173
-0,2362
-0,1566
-0,078
i
16
17
18
19
20
21
22
23
32
0
0,078
0,1566
0,2362
0,3173
0,4006
0,4869
0,5771
г
24
25
26
27
28
29
30
31
U i
32
0,6723
0,7743
0,8851
1,0083
1,1492
1,3178
1,5354
1,8658
Легко видеть, что соотношение и % = —-UN+i-i позволяет ограничиться расчетами
ЛГ+1 ЛГ+1
ЛГ + 1
для г < . Из табл. 147 находим
31
31
31
= 0,817-31 = 25,327.
г=1 32 г=1 М+г
Находим последовательно для г = 1, 2, 3:
31 31 31
J2 и Rlj = -9,293; J2 и R2j = 1,5834; J2 и «3i = 6,1801.
Окончательно получаем
30
25,327
4^
N+1
— • [и д.. = 18,3848.
Так как Q* = 18,38 > хО)95B) = 5,99, гипотеза сдвига принимается, как и ранее.
4.2.1.2.7. Медианный критерий
Для множественного аналога двухвыборочного медианного критерия (см. раз™
дел 4.2.1.1.2.5) используется статистика
476 Проверка гипотез о значениях параметров распределений [Гл. 4
имеющая при щ —>> оо (> 10) распределение хи^квадрат с f = k — 1 степенями сво-
свободы. Здесь rrii—число наблюдений г-й выборки, превосходящих медиану объеди-
к
ненной выборки (N = У^ щ).
г=1
Задача 249. Проверить гипотезу сдвига в условиях задачи 247 медианным крите-
критерием.
Медианой объединенной выборки является х = 13.
Имеем 77ii = 0, W2 = 6, тз = 9, JV = 31. Тогда
X2 = 4 - У -1 - т?^ 31 = 4 • f ^ + ^ + ^)- 31 = 14,492.
Л ^ га* V10 10 10 у
Так как %2 = 14,492 > Xo,9sB) = 5,99, гипотеза сдвига не отклоняется.
4.2.1.2.8. Критерий Хеттманспергера
Критерий рассмотрен в [455]. Используется для проверки равенства параметров
положения Hq : //]_ = ...= //& против альтернатив упорядоченности Hi: \xi ^ ... ^ /i^,
где хотя бы одно из неравенств — строгое. Статистика критерия
Нулевая гипотеза отклоняется с достоверностью а, если
где иа — «-квантиль стандартного нормального распределения,
2
г = п (< = 1,2 fc) D(L)=
Я-
Как и в критерии Крускала-Уоллиса, приняты обозначения ^ = —^, ^ = ]Р Л^j
^ • -I
tj ¦ ¦ « г г J = 1
и ii^j —ранг j-го элемента г™и выборки в общем упорядоченном ряду.
Задача 250. Проверить гипотезу сдвига против порядковой альтернативы крите-
критерием Хеттманспергера в условиях задачи 243.
Имеем (см. задачу 243)
Кг = 5,333; R2 = 9,1; R3 = 16,166; R4 = 13,75; R5 = 23,64.
Тогда
= 0,1924 • [A - 3) • E,333 - 14) + B - 3) • (9,1 - 14) + ... + E - 3) • B3,64 - 14)] = 7,94;
5
D(L) = 5 • ? ^ • (* - 3J = 3'7439 (VDW = 1,935).
Окончательно имеем для а = 0,95: ъйэ,э5 = 1,645 и no,95 * yD(L) = 3,183.
Так как L = 7,94 > 3,183, гипотеза сдвига не отклоняется.
4.2] Непараметрические критерии однородности статистических данных 477
4.2.1.2.9. Критерий Терпстры-Джонкхира
Так же как и критерий Хеттманспергера (см. раздел 4.2.1.2.8), используется
для проверки гипотезы сдвига против альтернатив упорядоченности. Критерий
предложен в [456, 457] и основан на попарных статистиках Вилкоксона^Манна^
Уитни (см. раздел 4.2.1.1.2.2). Статистика критерия имеет вид
г=1 j = l
где dij—количество наблюдений из первых (г — 1) выборок (г > 1), меныних, чем
X{j —j-e наблюдение в г-й выборке.
Гипотеза отсутствия сдвига отклоняется, если S > Sai где Sa—критические
значения, приведенные в табл. 153 и 154.
При щ ^ 10 применима аппроксимация
sa =
где
иа — «-квантиль стандартного нормального распределения.
Легко убедиться, что статистики критериев L — Хеттманспергера ж S — Терпст-
ры-Джонкхира эквивалентны.
Задача 251. Проверить гипотезу сдвига против порядковой альтернативы крите-
критерием Терпстры-Дэюонкхира для данных задачи 243.
Поясним порядок вычисления критерия S. Для ъ = 2 (второй выборки) находим
количество наблюдений первой выборки, меньших, чем x^j-
Для j = 1 имеем #2i = 3 и в первой выборке два значения (жп = 1 и Ж12 = 2) меньше,
чем Ж21 = 3, т. е. «21 = 2.
Далее по аналогии для j = 2 имеем «22 = 3 (предлагается убедиться в этом самому
читателю). Для j = 3 имеем «23 = 4 и далее «24 = 5 и п25 = 6.
При г = 3 находим количества значений в первых двух выборках, меньших, чем x$j
(при различных j): а^\ = 10, аз2 = 11, «зз = И-
Для г = 4 имеем a^i = 0, 042 = 6, 043 = 10, 044 = 12, 045 = 14, а.46 = 14.
Для г = 5 имеем а$\ = 18, пб2 = 19, пбз = 20, as4 = 20, 055 = 20, ase = 20, 057 = 20.
Окончательно находим
5 fii
ij =2 + 3 + 4 + 5 + 6 +10+11+ 11+ ... + 20 +20 = 245-
Далее вычисляем
=
4
DE) = — • [729 • B • 27 + 3) - 36 • B • 6 + 3) - 25 • B • 3 + 3) - ...
( 2i
... - 49 • B • 7 + 3)] = 344,916; уЩЩ = 23,343.
Находим (имея в виду, что гйз,95 = 1,645) 5о,э5 = 143,5 + 1,645 • 23,343 = 181,9.
Так как S = 245 > Яо,э5 = 181,9, имеющиеся результаты наблюдений не противоречат
гипотезе сдвига.
478
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 153
Критические значения Sa критерия Терпстры^Джонкхира для к = 3
(а — доверительная вероятность) [458]
«1
CM
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
см
2
2
2
2
2
2
2
2
2
2
n2
см
2
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
5
5
5
5
6
6
6
7
7
8
ПЗ
2
3
4
5
6
7
8
3
4
5
6
7
8
4
5
6
7
8
5
6
7
8
6
7
8
7
8
8
а
0,90
9
12
15
18
20
23
26
15
19
22
25
29
32
23
27
31
35
38
31
36
40
45
41
46
51
52
57
63
0,95
20
21
16
19
22
25
28
17
20
24
27
31
35
25
29
33
37
41
34
38
43
48
44
49
54
55
61
68
П\
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
п2
3
3
3
3
3
3
4
4
4
4
4
5
5
5
5
6
6
6
7
7
8
4
4
4
4
4
5
5
пз
3
4
5
6
7
8
4
5
6
7
8
5
6
7
8
6
7
8
7
8
8
4
5
6
7
8
5
6
а
0,90
19
23
27
31
35
39
28
32
37
41
46
37
42
48
53
48
54
57
60
66
73
33
38
43
48
53
44
49
0,95
21
25
29
33
38
42
30
35
39
44
49
40
45
51
56
51
57
63
64
70
778
35
41
46
51
57
47
53
П\
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
7
7
7
8
П2
5
5
6
6
6
7
7
8
5
5
5
5
6
6
6
7
7
8
6
6
6
7
7
8
7
7
8
8
Пз
7
8
6
7
8
7
8
8
5
6
7
8
6
7
8
7
8
8
6
7
8
7
8
8
7
8
8
8
а
0,90
55
60
55
62
68
68
75
82
50
56
62
68
63
69
76
77
84
92
70
77
85
85
93
101
94
102
111
120
0,95
58
64
59
66
72
73
80
87
53
60
66
73
67
74
81
81
89
97
74
82
90
90
99
107
99
108
117
127
Таблица 154
Критические значения Sa
критерия Терпстры^Джонкхира
для выборок равного объема
(а — доверительная вероятность) [458]
те
2
3
4
к
4
5
6
4
5
6
4
5
а
0,90
17
27
39
36
58
84
62
99
0,95
18
29
42
39
61
89
66
105
п
4
5
6
к
6
4
5
6
4
5
6
а
0,90
146
94
152
223
133
215
316
0,95
153
99
159
233
140
225
329
4.2] Непараметрические критерии однородности статистических данных 479
4.2.1.2.10. Критерий Мостеллера
Для к выборок равного объема п критерий позволяет ответитв на вопрос: не
является ли одна из к выборок сдвинутой по отношению к (fc — 1) остальнвхм?
Вероятноств того, что в одной из к выборок (равного объема n) r или более чле-
членов больше, чем в (к — 1) оставшихся выборках, равна [455] Р(У) = кС'^^г(С'^п)^1
или при п —>> оо и фиксированных к ж г:
Р(г) = 1
2кп
Если Р(г) < 1 — а, где а — доверительная вероятность, то гипотеза сдвига от™
клоняется.
Задача 252. Для данных задачи 244 проверить гипотезу сдвига критерием Мостел-
Мостеллера.
Проверяем четвертую вв1борку. В ней три члена (9, 10 и 11) превышают все значения
остальных 3 выборок. Имеем jfc = 4, n = 5 и г = 3. Вычисляем
РC) = 4 • Щ^ = 4 • % = 4 • ^^ = 0, 035.
С|.5 С|о 15504
Так как РC) = 0,035 < 1 — а = 0,05, сдвиг четвертой выборки по отношению ко всем
остальным следует признать значимым.
4.2.1.2.11. Критерий Левиса
Критерий аналогичен критерию Мостеллера [459] и использует соотношение
между размахами сравниваемых выборок.
Пусть для г-й выборки имеем min хц = Щ. max Xij = Vi и Щ = V{ — Щ —
размах г-и выборки.
Обозначим max Щ = U и minl^ = V. Параметры положения сравниваемых вы-
выборок не равны между собой (гипотеза Hq отклоняется), если по крайней мере
в двух выборках размахи не пересекаются, т. е. если U > V.
Гипотеза сдвига принимается с достоверностью а, если [459]
?(U > V) < 1-а,
ГДСЗ к г-1
г=2 j = l
При п —>¦ оо (п > 10)
Задача 253. Для данных задачи 244 проверить гипотезу сдвига критерием Левиса.
Имеем Z7i = 1, U2 = 3, U3 = 4, U4 = 7; Vi = 5, F2 = 7, F3 = 8, V4 = 11; C7 = max*/* = 7;
V = minVi = 5.
Находим
i=2j = l °5i
i n2ni 2 n^ni з /^4^i
= E(-D2 • тЙ1 + E(-D3 • Ш + E(-D4 • ^g
j = l °10 i = l °15 j = l °20
Так как Р(С/ > V) = 0,04 < 1 — 0,95 = 0,05, гипотеза сдвига не отклоняется.
480
Проверка гипотез о значениях параметров распределений
[Гл.4
4.2.1.2.12. Х-критерий, основанный на U-статистиках
Пусть имеются к выборок объема щ (г = 1, ..., к) каждая. Из каждой выборки
берем по одному наблюдению. Проделав это всеми возможными способами, в ре~
к
зультате получаем Yi ni выборок одинакового объема к.
г=1
Обозначим через v^j {уц^} количество выборок, в которых наблюдение, взятое
из г-й выборки, было наименьшим (наибольшим). Определим величину щ^ =
Ц
Щк
г
В [461, 462] предложен критерий сдвига, основанный на статистике
L =
i=l
,г=1
где k = -Uij +щк.
При L > La гипотеза сдвига принимается с достоверностью а (здесь La — кри™
тическое значение, приведенное в табл. 155).
Таблица 155
Критические значения La для к = 3
и доверительной вероятности а = 0,95 [460]
711
2
2
2
2
2
2
2
2
3
3
пз
2
3
4
3
4
^0,95
5,33
5,39
6,00
5,85
5,78
711
2
3
3
3
4
712
4
3
3
4
4
пз
4
3
4
4
4
Ьо,Э5
5,55
6,22
6,16
6,22
6,12
При к > 3 справедливо приближение
где Xa(f) — «-квантиль распределения хи™квадрат с / степенями свободы.
Задача 254. Даны три выборки случайных величин е
xxj: 1, 2, 3; x2j: 4, 5, 6; x3j: 7, 8, 9.
Проверить гипотезу сдвига L-критерием при доверительной вероятности а = 0,95
(А; = 3, пг = 3).
В нашем случае следует рассмотреть Y\rii = 3 • 3 • 3 = 27 выборок равного объема
гс = 3.
Имеем выборки:
1.4.7 1,5,7 1,6,7 2,4,7 2,5,7 2,6,7 3,4,7 3,5,7 2,6,7
1.4.8 1,5,8 1,6,8 2,4,8 2,5,8 2,6,8 3,4,8 3,5,8 2,6,8
1.4.9 1,5,9 1,6,9 2,4,9 2,5,9 2,6,9 3,4,9 3,5,9 3,6,9
Находим при г = 1 (первая выборка) иц = 27, ?лз = 0 и по аналогии г>21 = 0, V23 = 0,
^31 = 0, и3з = 27.
4.2] Непараметрические критерии однородности статистических данных 481
Следовательно, имеем
u\\ = = 1; iti3 = 0; U21 = 0; гхгзО; г/31 = 1;
h = -1 + 0 =-1; h = -0 + 0 = 0; /3 =-0 + 1 = 1;
r- 9-5-4.С| /ЛЗ 2 / з
Из табл. 155 для т = П2 = пз = 3 находим Ьо,95 = 6,22; так как L = 8 > Ьо,э5 = 6,22,
гипотеза сдвига не отклоняется.
4.2.1.2.13. Критерий Краузе
Этот критерий является обобщением критерия Вилкоксона^Манна^Уитни (ем.
раздел 4.2.1.1.2.2) на многовыборочный случай. К этому классу относятся кри-
критерии Круекала-Уоллиса (см. раздел 4.2.1.2.1) и Терпстры-Джонкхира (см. раз™
дел 4.2.1.2.9).
Рассмотрим формы обобщения критерия Вилкоксона^Манна^Уитни, порожда-
порождающие различные многовыборочные критерии.
Пусть Wij—статистика Манна-Уитни, возникающая при сравнении выборок
с номерами г и j, т.е. (см. раздел 4.2.1.1.2.2) Wij есть точное число пар значений
Xiv И Xj?, ДЛЯ КОТОРЫХ Xiv < Xj? ПО ВС6М V = 1, 2, . . . , Щ И ? = 1, 2, . . . , flj.
Тогда Wi = J^ Wij будет статистикой Манна-Уитни, сравнивающей г™ю выборку
со всеми остальными. Мо^но показать [463], что
к
где N = J^ rii и Ri — среднее из рангов членов г-й выборки в общем ранжированном
ряду N = J^ n^ значений.
При справедливости нулевой гипотезы (отсутствие сдвига в параметрах поло™
жения к выборок) математическое ожидание M(W^) и дисперсия D(W^) равны
M(Wi) = \nt(N - щ); T>{Wi) = ±nt(N - щ)(М + 1).
В принятых обозначениях рассмотренные ранее статистики Н — Крускала^Уол-
лиса (см. раздел 4.2.1.2.1) и S — Терпстры-Джонкхира (см. раздел 4.2.1.2.9) могут
быть записаны как
г=1
В этом разделе мы рассматриваем статистику критерия, предложенного Краузе
[464, 465]:
2
N + 1
l
Этот критерий эквивалентен критерию Крускала^Уоллиса, но более эффективен
против большого количества альтернатив.
16 А. И. Кобзарь
482
Проверка гипотез о значениях параметров распределений
[Гл.4
При справедливости нулевой гипотезы статистика V распределена как %2
с f = к — 1 степенями свободы. Поэтому гипотеза сдвига отклоняется с достовер™
ностью а, если V < %«(к — 1).
Задача 255. Проверить гипотезу сдвига для данных задачи 243 непараметрическим
критерием Краузе.
Для выборок % = 1 и j = 2. Имеем W12 = 5 + 5 + 4 + 3 + 2 + 1 = 20.
Поясним способ подсчета Wij. Для первого элемента выборки с номером ъ = 1,
равного 1 во второй выборке имеются 5 элементов C, 4, 5, 6, 7), превосходящих его.
Для 2-го элемента выборки, равного 2, во второй выборке находятся также 5 элементов,
превосходящих его по величине. Для 3™го элемента выборки, равного 3, их во второй
выборке уже 4, и т. д.
По аналогии имеем
W13 = 3 + 3 + 3 + 3-
W15 = 7 + 7 + 7 + 7-
W2A = 5 + 5 + 4 + 4-
W34 = 3 + 2 + 2 = 7;
Вычислим теперь
- 3 + 3 + 3 = 18; W14 = 5 + 5 + 5 + 5 + 4 + 4 = 28;
- 7 + 7 = 42; W23 = 3 + 3 + 3 + 3 + 2 = 14;
-4 + 3 = 21; W2b = 7 + 7 + 7 + 7 + 7 = 35;
W35 = 7 + 7 + 7 = 21; W45 = 7 + 7 + 7 + 7 + 6 + 5 = 39.
12
6-5
18-
6-3
6-7
27+1
6-5
6-3
= 19,1.
Из табл. 55 находим Хо,эб(а = 5 — 1 = 4) = 9,49.
Так как V = 19,1 > Хо,9бD) = 9,49, гипотеза сдвига не отклоняется.
4.2.1.2.14. Критерий Пейджа
Используется для выборок равного объема в целях проверки гипотезы отсут™
ствия сдвига Hq : fi\ = ... = /j,k против порядковых альтернатив Hi: \xi ^ \х^ ^
^ ... ^ /ifc, так же как критерии Хеттманспергера (см. раздел 4.2.1.2.8) и Терпстры—
Джонкхира (см. раздел 4.2.1.2.9). Статистика критерия строится следующим обра-
образом. Составляется таблица:
Номер элемента
в выборке
1
2
п
Номер выборки
1
#11
#12
#1п
2
#21
х2п
к
#fci
Xk2
Хкп
Далее ранжируем по возрастанию элементы каждой строки от 1 до к (получаем
п
совокупность рангов Vij). Обозначим через Щ = ^ rij сумму рангов по столбцам.
Тогда статистика критерия Пейджа записывается в форме [466]
Нулевая гипотеза отклоняется с достоверностью а, если
La(Aj,n)—критические значения, приведенные в табл. 156.
где
4.2]
Непараметрические критерии однородности статистических данных
483
Таблица 156
Критические значения La(k^n)
критерия Пейджа
для доверительной вероятности о = 0,95 [18]
п
2
3
4
5
6
7
8
9
10
11
12
к
3
28
41
54
66
79
91
104
116
128
141
153
4
58
84
111
137
163
189
214
240
266
292
317
5
103
150
197
244
291
338
384
431
477
523
570
6
166
244
321
397
474
550
625
701
777
852
928
7
252
370
487
603
719
835
950
1065
1180
1295
1410
8
362
532
701
869
1037
1204
1371
1537
1703
1868
2035
к = 3 п = 13 14 15
La(k,n) = 165 178 190
При п > 10 справедлива аппроксимация
16
202
20
251
где
M(L) =
D(L) =
п(к3 - кJ
Ы4(к - 1)'
При L* ^ иа нулевая гипотеза отклоняется (иа — «^квантиль стандартного нор™
мального распределения).
Задача 256. Проверить гипотезу сдвига критерием Пейджа в условиях задачи 244.
Имеем таблицу:
Номер элемента
в выборке
1
2
3
4
5
Номер выборки
1
1
2
3
4
5
2
3
4
5
6
7
3
4
5
6
7
8
4
7
8
9
10
11
Заменяя элементы выборки по строкам их рангами в строке, получаем таблицу
рангов Rii
3
1
2
3
4
5
г
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
= 5 R2 = Ю R3 = 15 R4 = 20
16*
484
Проверка гипотез о значениях параметров распределений
[Гл.4
Статистика критерия Пейджа равна
к
L = Yii-Ri = 1-5 + 2- 10 + 3-15 + 4- 20= 150.
г=1
Из табл. 156 для к = 4 ш п = 5 находим Ьо,9бD,5) = 137.
Так как L = 150 > bo,9sD,5) = 137, гипотеза сдвига не отклоняется.
Используем теперь аппроксимацию
= 41,667;
Так как ъг,о,95 = 1,645 и L* = 3,872 > tto,95 = 1,645, то и в этом случае гипотеза сдвига
не отклоняется.
4.2.1.2.15. Критерий Фридмена-Кендалла-Бэбингтона Смита
Обратимся, как и в предыдущем разделе, к таблице:
Номер элемента
в выборке
1
2
п
Номер выборки
1
Хц
Х\1
Xin
2
#21
Ж22
%2п
к
Xkl
Хк2
Хкп
Проран^ируем, от наибольшего к наименьшему, наблюдения внутри каждой
строки. Пусть rij — ранг члена хц в совместной ранж:ировке x\j, ..., Xkj- Обозначим
Для проверки гипотезы сдвига между параметрами положения выборок равного
объема в [467, 468] предложен критерий, основанный на статистике
Гипотеза сдвига отклоняется, если S < Sa(n1 к), где 5а(п, к) —критическое зна-
значение, приведенное в табл. 157, построенной с применением интерполяции по та-
таблице, приведенной в [18].
В связи с тем, что таблицы распределения рассматриваемого критерия со-
составлены для небольшого диапазона значений, широко применяются различные
аппроксимации. Приведем наиболее употребляемые из них.
При п ^ 13 ш к ^ 20 применима аппроксимация
Sa(n,k)=xl(k-1).
Для других значений п и к используется преобразование
F =
п(к- 1M*
4.2]
Непараметрические критерии однородности статистических данных
485
Таблица 157
Критические значения Sq-(ti, k) критерия
Фридмена^Кендалла^Бэбингтона Смита [18]
3
4
5
6
7
8
9
10
11
12
13
Доверительная
вероятность а
= 0,95
к
3
5,82
6,31
6,10
6,33
6,00
6,25
6,00
6,10
6,09
6,08
6,00
4
7,00
7,20
7,32
7,40
7,63
7,50
5
8,30
8,80
8,96
Доверительная
вероятность а
= 0,90
к
3
5,42
5,10
5,21
4,83
4,71
5,00
4,67
4,90
4,91
4,67
4,77
4
6,20
6,00
6,12
6,20
6,26
6,30
5
7,47
7,58
7,61
Гипотеза сдвига отклоняется, если F < .Fa(/i, /2), где -Fa(/i>/2)— «-квантиль
распределения Фишера при Д и /2 степенях свободы.
При 7^к^19шп^13 принимаем f\ = к — 1 и /2 = (к — 1)(п — 1).
При к^8ж7^п^12 принимаем Д = fe - 1 и
(n-1)
где
L=(п ¦
г=1
Если /2 становится дробным, то при использовании таблиц следует применять
интерполяцию.
Весьма эффективны аппроксимации, предложенные Иманом и Давенпор™
том [469]. Для к ^ 7 и п ^ 8 статистика Имана-Давенпорта вычисляется по
формуле J = i[(jfc - 1)F + 5].
Гипотеза сдвига отклоняется с достоверностью а, если J < Jai где /1 = fc — 1,
Здесь Xa (
При 1с
1) — а-квантиль распределения хи^квадрат с (Aj —1) степенями свободы.
6и2^п^6и1с = 5,п = 6,7 вместо J ш Ja следует использовать
К = \ [(к -
486
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 257. Для трех выборок случайных величин, приведенных в таблице, прове-
проверить гипотезу сдвига критерием Фридмена-Кендалла-Бэбингтона Смита при досто-
достоверности а = О5Э5:
Номер элемента
в выборке
1
2
3
4
5
6
7
8
9
10
Номер выборки
1
2,1
1,8
1,7
1,8
1,9
2,4
1,7
1,6
1,5
1,7
2
3,2
4,1
2,3
2,4
2,5
1,2
1,9
2,3
2,4
2,9
3
4,3
2,3
3,4
3,5
3,6
3,7
3,2
2,8
2,9
3,7
Т '
^3
3,20
2,73
2,47
2,57
2,67
2,43
2,27
2,23
2,26
2,83
Строим таблицу рангов щ по строкам:
3
1
2
3
4
5
6
7
8
9
10
г
1
1
1
1
1
1
2
1
1
1
1
2
2
3
2
2
2
1
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
Имеем
Ri = 11, R2 = 20, R3 = 29.
Вычисляем статистику критерия
12
10-3-4
г2 - 3 • 10 • 4 = 0,1 • (II2 + 202 + 292) - 120 = 16,2.
Находим из табл. 157 So,95A6,3) = 6,1.
Так как S = 16,2 > «So,95 A6,3) = 6,1, гипотеза сдвига не отклоняется.
Продемонстрируем теперь применение аппроксимаций. У нас 1с = 3<7игг=10>
поэтому воспользуемся аппроксимацией J Имана—Давенпорта. Находим
F=
=38,37;
=i. B- 38,37+ 16,2) =46,47.
2 V ' ' ;
Г; =
n-(k-l)-S 10-2-16,2
Из таблиц находим Fo,9sB; 18) = 3,55 и Хо,9бB) = 5,99. Следовательно,
Jo,95 = 0,5 • B • 3,55 + 5,99) = 6,54.
Так как J = 46,47 > Jo,95 = 6,54, гипотеза сдвига не отклоняется.
4.2.1.2.16. Критерий Андерсона-Каннемана-Шэча
Является аналогом критерия Фридмена-Кендалла-Бэбингтона Смита (см. раз™
дел 4.2.1.2.15). Предложен в [470-472]. Для некоторых алвтернатив обладает по
сравнению с критерием Фридмена большей мощностью. Для пояснения последова-
4.2]
Непараметрические критерии однородности статистических данных
487
тельности вычисления статистики критерия воспользуемся обозначениями преды-
предыдущего раздела. Так же, как и в критерии Фридмена—Кендалла—Бэбингтона Смита,
предварительно ранжируем наблюдения в каждой строке. Затем вычисляем эле-
элементы матрицы сопряженности рангов D = ||D^||? гДе Вц —число строк, в которых
столбец г получил ранг I (г, I = 1, 2, ..., к). Правильность вычислений проверяется
условием
1=1 i=l l=li=l
Статистика критерия вычисляется по формуле
к к / х 2 к к к
п
кк
При п ^ 10 гипотеза сдвига отклоняется, если
где Х«(/) — «^квантиль распределения %2 с / степенями свободы.
Задача 258. Проверить гипотезу сдвига для данных задачи 257 критерием Андерсона-
Каннемана-Шэча.
Составляем матрицу сопряженности рангов
1
1
2
3
i
1
9
1
0
10
2
1
8
1
10
3
0
1
9
10
10
10
10
30
Вычисляем статистику критерия
3
А= — -
u] - Ю • 3 = 0, 3 • (92 + I2 + ... + I2 + 92) - 30 = 39;
Из табл. 55 находим Хо,9бD) = 9,49. Так как
k-1
А = 26 > Xo,9sD) = 9,49, наличие
сдвига между параметрами выборок на выбранном уровне значимости 1 — а = 0,05 сле-
следует считать значимым.
4.2.1.2.17. Критерий со взвешенными ранжировками Даны Квейд
Критерий подобен критерию Фридмена (см. раздел 4.2.1.2.15), но позволяет
учесть разброс наблюдений в строках таблицы
3
1
2
п
г
1
Х\х
Xnl
2
#12
Ж22
ХП2
к
Х2к
Хпк
488
Проверка гипотез о значениях параметров распределений
[Гл.4
Критерий предложен в [473, 474]. Ранжирование наблюдений производится вну™
три строк так же, как и в критериях Фридмена (см. раздел 4.2.1.2.15) и Андерсона
(см. раздел 4.2.1.2.16).
Предварительно в качестве „меры доверия" данных выбирается некоторый пока-
показатель, например, Dj —дисперсия в j-й строке таблицы. Затем значения дисперсий
Dj ранжируются рангами qj от наименьшего к наибольшему (j = 1,2, ..., п). Вы™
числяются величина
к
и статистика критерия
W =
72S
k(k + l)n(n + l)Brc +1)
При п ^ 5 справедлива аппроксимация
2Bn
d
где
С — J. О
Зга
5n(n+l)Bn
0 —
(fc -
и — ОС zl
72Cn
Гипотеза сдвига отклоняется с достоверностью а, если W* > Х^(^)? гДе Ха(^) —
а-квантиль распределения хи-квадрат с / = S степенями свободы.
В среднем критерий Д. Квейд мощнее критерия Фридмена по отношению к боль™
шинству альтернатив [475].
Задача 259. Проверить гипотезу сдвига для данных задачи 257 критерием Даны
Квейд.
Подсчитываем дисперсии
по формуле
k
2
Имеем таблицу рангов щ по строкам и дисперсий
внутри столбца от 1 до п:
по строкам, ранжированных
3
1
2
3
4
5
6
7
8
9
10
г
1
1
1
1
1
1
2
1
1
1
1
2
2
3
2
2
2
1
2
2
2
2
3
3
2
3
3
3
3
3
3
3
3
Dj
1,21
1,46
0,74
0,74
0,74
1,56
0,66
0,36
0,50
1,01
8
9
4
5
6
10
3
1
2
7
Вычисляем
з
г=1
, v 2 / Ю
(IZ ^i ' r*i ) = ПС
\i l
= 40442;
4.2]
Непараметрические критерии однородности статистических данных
489
W =
72 • 40442
Далее вычисляем
с= 1-6-
3-4- 10- 11 -21
3-100 + 3-10-1
5-10-11-21
9-4- 11 • 10
2 -21
= 0,829; S =
= 10,758.
2
0,5562
Тогда
= 3- 0,829-2+
(Ю,™-2)-0,829
7-102-112-212
=
= 4,446;
=
0,556
Из табл. 55 находим Хо,95 C,686) « 8,96.
Так как W* = 17,504 > Хо,95 C,686) = 8,96, гипотеза сдвига не отклоняется.
4.2.1.2.18. Критерий Кендалла-Эренберга
Является аналогом критерия Фридмена-Кендалла-Бэбингтона Смита (см. раз™
дел 4.2.1.2.15), превосходя его по мощности [477]. Предварительно наблюдения
ранжируются по строкам, как и в предыдущих критериях. Обозначим через сц
число тех случаев, когда ранг 1-го объекта больше ранга j-vo объекта A^1, j < к)
и Cji —число тех случаев, когда ранг 1-го элемента меньше ранга j-ro.
Предварительно вычисляются элементы матрицы ||qj|| (при этом Cjj = 0). Тогда
статистика критерия имеет вид
К= J2 си(п - cij) = n J2 cij~ J2 сЬ-
Гипотеза не отклоняется, если К > Ка(к,п), где Ка(к1п)—критическое значе-
значение, приведенное для некоторых п и к в табл. 158.
Таблица 158
Критические значения Ка(к,п)
критерия Кендалла^Эренберга
для доверительной вероятности а = 0,95 [119]
к
3
3
3
3
3
п
4
5
6
7
8
^0,95
3
18
14
22
31
к
3
3
4
4
4
п
9
10
3
4
5
^0,95
42
54
4
10
20
к
4
5
5
п
6
3
4
i^0,95
34
8
20
Для выборок большого объема применяется следующее приближение, основан™
ное на статистике U*,
U* = аС/ + /,
где
_ 6Bk+ 5)kn(k- l)(n- l)t
8к
/ =
4(n-2JBA;2
Гипотеза сдвига отклоняется, если U* < Х«(/)? гДе Х«(/) — о^квантиль Х
пределения с / степенями свободы. Следует помнить, что в этом критерии, как и во
всех предыдущих, для одинаковых (связанных) наблюдений применяются средние
ранги (в нашем случае связи сц = 1 и Cj\ = 0 заменяются на сц = Cji = 1/2).
490
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 260. Проверить гипотезу сдвига для данных задачи 257 критерием Кендалла-
Эренберга.
Восстановим таблицу рангов Гц из задачи 257:
3
1
2
3
4
5
6
7
8
9
10
г
1
1
1
1
1
1
2
1
1
1
1
2
2
3
2
2
2
1
2
2
2
2
3
3
2
3
3
3
3
3
3
3
3
Вычисляем элементы матрицы ||qj||:
1
1
2
3
3
1
*
9
10
2
1
*
9
3
0
1
*
Из элементов второго столбца (г = 2) только один элемент имеет ранг, меньший, чем
элементы первого столбца. Следовательно, с\2 = 1. Аналогичным образом заполняются
все остальные элементы матрицы ||qj||.
Вычисляем
К = Ci2 * С21 + Ci3 ' С31 + С23 * С32 = Ci2 • (п — С12) + Ci3 • (п — С13) + С23 ' (п ~ С2з) =
= 1 • A0 - 1) + 0 • A0 - 0) + 9 • A0 - 9) = 18.
Из табл. 158 для k = 3 ш п = 7 находим Жо,э5 = 22.
Так как К = 18 < Жо,95 = 22, гипотеза сдвига не отклоняется.
Вычислим теперь приближенный критерий. Находим
= 25,9; U=l-
6- 11-3-10-2-9
4-8-B-9 + 6-3 + 7)
2- II3 -3- 10-2 -9
8- 18
3-10-2-9
= 0,7333;
/ =
—з = 3,0369.
4 • 82 • B • З2 + 6 • 3 + 7J
Далее U* = 25,90 • 0,733 + 35037 = 22502. Из табл. 55 имеем Хо,95C) = 7,81.
Так как U* = 22,02 > Хо,9бC) = 7,81, гипотеза сдвига не отклоняется.
4.2.1.2.19. Критерий Ходжеса-Лемана-Сена
Аналог критерия Фридмена--Кендалла--Бэбингтона Смита (см. раздел 4.2.1.2.15),
но обладает по сравнению с ним большей эффективностью. Статистика критерия
строится следующим образом. Находится среднее значение в j-й строке Xj = у
к
г=1
и определяются выровненные наблюдения yij = Xij—Xj. Затем все (п — к) выровнен-
выровненных наблюдений уц ранжируются, что приводит к последовательности рангов Кц.
4.2] Непараметрические критерии однородности статистических данных 491
Далее, пусть
г) J 1, если г/-е наблюдение среди наблюдений ^j относится к г-й строке;
}1J I 0 в противн
Введем обозначения
(г)
}1J I 0 в противном случае (г = 1,2, ..., 2k] v = 1,2, ..., iV).
м =
N(N-1)BN
Тогда статистика критерия имеет вид S = —
' к
Е-
,• -А;
N-
При п ^ 10 гипотеза сдвига отклоняется, если 5 < %^ (& — 1), где %^ — а-кван™
тиль распределения хи-квадрат с / = Aj — 1 степенями свободы.
Следует помнить, что в этом критерии для равных наблюдений не применяются
средние ранги, они просто распределяются между равными величинами случайным
образом.
Задача 261. Проверить гипотезу сдвига для данных задачи 257 критерием Ходэюеса-
Лемана-Сена.
Иллюстрируем вычисления по шагам. Вычисляем величины tjiji
3
1
2
3
4
5
г
1
-1,10
9,93
-0,77
-0,77
-0,77
2
0
1,37
-0,17
-0,17
-0,17
3
1,10
-0,43
0,93
0,93
0,93
3
6
7
8
9
10
i
1
-0,03
-0,57
-0,73
-0,77
-1,07
2
-1,23
-0,37
-0,03
0,13
0,13
3
1,27
0,93
0,47
0,63
0,93
Ранги Rij величин yij составляют следующую таблицу (равным значениям
чайным образом присваиваются последовательные ранги без усреднения):
слу-
слу3
1
2
3
4
5
г
1
2
4
5
6
7
2
18
30
13
14
15
3
28
11
24
25
26
3
6
7
8
9
10
1
16
10
8
9
3
2
1
12
17
19
20
3
29
27
21
22
23
Вычислим теперь значения Zjyu, i = 1,2,3 и и = 1, ...,30. Всего нужно вычислить
nN = 10 • 30 = 300 значений величин < z^ v >. Затем необходимо найти те значения z^ v
(% = 1,2,3), которые равны 1. Результаты сведем в следующую таблицу значений для
различных I/ и i при N = 30:
492
Проверка гипотез о значениях параметров распределений
[Гл.4
у
1
2
3
4
5
6
7
8
9
10
1
1
1
1
1
1
1
1
1
1
2
1
3
у
11
12
13
14
15
16
17
18
19
20
i
1
1
2
1
1
1
1
1
1
1
1
3
1
у
21
22
23
24
25
26
27
28
29
30
%
1
2
1
3
1
1
1
1
1
1
1
1
1
Из таблицы имеем
10
10
5
г
2 + 3 + 4 + 5 + 6 + 7
9 + 10 + 16
12 + 13 + 14 + 15 + 17 + 18 + 19 + 20 -
10
= 15,8
11 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 + 29
10
= 23,6.
Далее, вычисляя Rj = - • J^i^, имеем J?i = 16; i?2 = 15; R3 = 14; Л4 = 16;
3 i=1
R6 = 15,33; R7 = 16,33.
Тогда
J2 R* = 2407,5845; M = 111,6123; S = 12,366.
Имеем из табл. 55 Хо,9бB) = 5,99. Так как S = 12,366 > Хо,эбB) = 5,99, гипотеза сдви-
сдвига не отклоняется.
4.2.2. Непараметрические критерии масштаба
Непараметрические ранговые критерии сравнения параметров масштаба, как
правило, строятся на базе соответствующих критериев сдвига изменением либо
статистики критерия, либо правил присвоения рангов наблюдениям. При даль-
дальнейшем изложении достаточно широкой гаммы известных критериев масштаба мы
будем специально обращать внимание читателя на это обстоятельство. Напомним,
что критерии масштаба преследуют цель выявить возможные различия в мерах
разброса (изменчивости) наблюдений в двух или более выборках.
4.2.2.1. Сравнение параметров масштаба двух совокупностей
4.2.2.1.1. Критерий Лнсари—Бредли
Является масштабным аналогом критерия Вилкоксона (см. раздел 4.2.1.1.2.2).
Сравниваются две выборки Х{ hj/j, объемами тип соответственно. Пусть Ri —
ранги элементов одной из выборок (предположим, х) в общем упорядоченном по
возрастанию ряду. Статистикой критерия Ансари—Бредли является
S =
г=1
m -
I
2
- 1
D ?7l + П +
2
1
4.2] Непараметрические критерии однородности статистических данных 493
Вычисление статистики критерия может быть выполнено и другим, более
простым методом. Поставим элементам упорядоченной по возрастанию выборки
Х1 ^ Х2 ^ • • • ^ хт+п объема га + п в соответствие ранги по следующему правилу
{. . 1 .771 + П + 1
га + п — г + 1, если г > ;
г, если г ^ .
Тогда статистика критерия равна
г=1
т. е. она определяется суммой специальным образом назначенных рангов одной
выборки.
Легко видеть, что при четном (га + п) последовательность таких рангов имеет
вид
1 2 Ч т + П т + П Ч 2 1
а при нечетном (га + п) —
m + n^ I m + n + 1
i, z, j, ..., - , - , ..., «j, z, i.
Гипотеза равенства параметров масштаба не отклоняется с достоверностью
а, если S\(a) < S < #2@;), где Si (а), ^(а)—критические значения, приведенные
в табл. 159.
При га, п > 10 можно использовать асимптотическую нормальность распределен
ния величины
5, = 5 - M(g)
где
га (га + п + 2)
при га + п = 2/с;
1 при га + п = 2/г — 1;
4(?тг + п)
ттг(т + п - 2)(га + п + 2)
при тв + п =
48(m + n-l)
+ n+l)[(m + nJ + 3] , _. 1
9 при га + n = 2fc — 1.
48( + )
Нулевая гипотеза равенства параметров масштаба в двух выборках принимается
с достоверностью а, если
Эффективность критерия по сравнению с ^критерием в случае нормального
распределения равна — ~ 0,61.
494
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 159
Критические значения Si (о) и ^г(ск) статистики
Лнсари^Бредли (а — доверительная вероятность) [479]
т
2
3
4
п
8
9
10
11
12
13
14
15
16
17
18
6
7
8
9
10
11
12
13
14
15
16
17
5
6
7
8
9
10
11
12
13
14
15
16
а
0,90
Si
2
2
2
2
2
3
3
3
3
3
3
4
5
5
5
5
6
6
6
7
7
7
8
7
7
8
8
9
9
10
10
11
11
12
12
s2
10
11
12
13
14
14
15
16
17
18
19
13
13
15
16
17
18
20
21
22
23
24
25
14
17
19
20
21
23
24
26
27
29
30
32
0,
Si
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
5
5
5
5
6
6
6
6
6
7
7
7
8
8
9
9
9
10
10
11
Э5
Si
10
11
12
13
14
15
16
17
17
19
19
13
14
16
17
18
19
21
22
23
24
25
26
16
17
19
21
22
24
26
27
29
30
32
33
т
5
6
7
8
9
10
п
5
6
7
8
9
10
11
12
13
14
15
6
7
8
9
10
11
12
13
14
7
8
9
10
11
8
9
10
11
12
9
10
11
10
а
0,
Si
10
1
11
12
13
14
14
15
16
16
17
15
16
17
18
18
19
20
21
22
21
22
23
24
25
26
29
30
31
32
35
36
38
43
90
s2
20
21
24
26
27
29
31
33
34
36
38
27
29
31
34
36
38
40
42
44
35
38
40
43
45
45
48
50
53
56
55
58
61
67
0,
Si
10
10
11
11
12
12
13
14
14
15
15
14
15
16
16
17
18
19
19
20
19
20
21
22
23
26
27
28
29
30
33
34
36
41
95
s2
20
23
24
26
28
30
32
34
36
38
40
28
30
32
35
37
40
41
44
46
37
39
42
44
47
46
49
52
55
58
57
58
63
69
Задача 262. Имеются две выборки случайных величин:
(m = 8)xij: 1,2; 3,4; 6,2; 8,1; 10,2; 11,3; 13,0; 15,9;
(n = 10)x2j: 0,8; 2,4; 4,2; 5,1; 6,8; 11,4; 13,8; 20,1; 24,2; 26,7.
Проверить гипотезу равенства параметров масштаба в выборках критерием Ансари-
Бредли при достоверности а = 0,95.
"Упорядочиваем объединенную выборку по возрастанию (г — номер выборки, Ri —
ранг случайной величины в объединенной выборке). Результаты сведем в таблицу:
4.2]
Непараметрические критерии однородности статистических данных
495
i
2
1
2
1
2
2
0,8
1,2
2,4
3,4
4,2
5,1
1
2
3
4
5
6
г
1
2
1
1
1
2
Xij
6,2
6,8
8,1
10,2
11,3
11,4
7
8
9
10
11
12
i
1
2
1
2
2
2
13,0
13,8
15,9
20,1
24,2
26,7
13
14
15
16
17
18
Далее находим
8 + 10 + 1
Ri-
8 + 10 + 1
= 76 - (|2 - 9,5| + |4 - 9,5| + |7 - 9,5| + ... + |13 - 9,5| + |15 - 9,5|) = 49.
Если бы использовался иной метод присвоения рангов, то имели бы следующую
последовательность рангов:
г: 212122121112121222
Rii 123456789987654321
Сумма таких рангов первой выборки равна S = 2 + 4 + 7 + 9 + 9 + 8 + 6 + 4 = 49, что
естественно совпадает с ранее полученным результатом.
Теперь из табл. 159 для т = 8, п = 10 и а = 0,95 находим Si = 28 и S2 = 52. Так как
Si = 28 < S = 49 < Si = 51, нулевая гипотеза равенства параметров масштаба в выбор™
ках не отклоняется.
Используем теперь нормальную аппроксимацию. Так как (т + п) — четное, имеем
М(Я) =
= 40; DCS) =
' 2°
48-17
= 31, 3725
= 5, 601);
5,601
. 1,606.
Так как Я* = 1,606 < lM(i+a)/2 = ^o,975 = 1596, нулевая гипотеза и в этом случае не
отклоняется.
4.2.2.1.2. Критерий Сижела-Тьюки
Сижел и Тьюки [480] предложили преобразование критериев сдвига в критерии
масштаба. Суть их способа сводится к преобразованию первичной упорядоченной
объединенной выборки. Пусть х\ ^ х^ ^ ... ^ хп—первичная объединенная
выборка. Из нее получаем новую последовательность вида
XI, Хп, Хп-1,Х2, Ж3, Хп^2, %n^3i %4, X&, . . .
(т. е. оставшийся ряд „переворачивается" каждый раз после приписывания рангов
паре краштых значений).
Далее проверка гипотезы о разности параметров масштаба в двух выборках
аналогична проверке гипотезы сдвига в новой последовательности с описанным
правилом нумерации рангов.
Если использовать в качестве критерия проверки нулевой гипотезы сумму ран-
то.
гов (It! = ^ Щ) элементов выборки меньшего объема в такой последовательности,
то нулевая гипотеза принимается, если R\{ot) < R < R2{ol), где R±(a) и
критические значения, которые могут быть получены с помощью табл. 143 крите-
критерия Манна—Уитни (см. раздел 4.2.1.1.2.2). Для этого необходимо из табл. 143 найти
496
Проверка гипотез о значениях параметров распределений
[Гл.4
Ui и U2 для заданных а, га и п и затем вычислить
га(га + 1) ТТ
= nm ¦
= nm ¦
т (га + 1)
-U.
Здесь га — объем меньшей выборки.
При п, га > 10 справедлива аппроксимация
га(п + га + 1)
nm(n + га + 1)
Если |W| > tii+a , нулевая гипотеза равенства параметров масштаба принимает™
ся с достоверностью а.
Задача 263. Проверить гипотезу равенства параметров масштаба критерием Си-
мсела-Тьюки для данных задачи 262.
Строим упорядоченный ряд с нумерацией рангов в соответствии с правилом крите-
критерия Оижела^Тькжи. Результаты сведем в таблицу (г — номер выборки; Ri — ранг члена
объединенной выборки, упорядоченной по правилу Сижела—Тьюки).
г
2
2
2
1
2
2
Xi
0,8
26,7
24,2
1,2
2,4
20,1
Ri
1
2
3
4
5
6
г
1
1
2
2
1
2
Xi
15,9
3,4
4,2
13,8
13,0
5,1
Ri
7
8
9
10
11
12
г
1
2
1
2
1
1
Xi
6,2
11,4
11,3
6,8
8Д
10,2
Ri
13
14
15
16
17
18
Для первой выборки (г = 1) из таблицы имеем
8
= 4 + 7 + 8 + 11 + 13 + 15 + 17 + 18 = 93.
г=1
Из табл. 143 для т = 8, п = 10 и а = 0,95 находим U\ = 17 и 172= 63, откуда
Ri(a) = 80 + — - 63 = 53 и R2 (а) = 80 + — - 17 = 99.
Так как R\(a) = 53 < i? = 93 < i?2(a), нулевая гипотеза принимается.
Используем теперь аппроксимацию
8- 19
93-
W =
= 1,51.
Так как W = 1,51 < гхо,975 :=: 1,96, нулевая гипотеза и в этом случае не отклоняется.
4.2.2.1.3. Критерий Кейпена
Предложен в [481] и является масштабным аналогом критерия Фишера- Йэйтса-
Терри-Гёфдинга (см. раздел 4.2.1.1.2.3).
Если Ri — ранг i-го элемента меньшей по объему выборки х\^Х2^ ...,хш в об™
щем упорядоченном ряду (га + п) значений объединенной выборки, то статистика
критерия может быть записана в виде
К = ]Г am+n(Ri),
г=1
n,
4.2]
Непараметрические критерии однородности статистических данных
497
где ат+п(г) —математическое ожидание квадрата г-й порядковой статистики в вы™
борке объема (га + п) из стандартного нормального распределения (значения а^{г)^
называемые метками критерия, приведены в табл. 160).
Таблица 160
Метки ам(г) критерия Кейпена (все значения умножены на 100) [482]
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
N
6
202
69
29
29
69
202
7
222
83
34
21
34
83
222
8
240
97
42
21
21
42
97
240
9
256
109
51
25
17
25
51
109
256
10
271
122
61
30
17
17
30
61
122
271
11
285
133
70
36
19
14
19
36
70
133
285
12
298
144
79
43
23
14
14
23
43
79
144
298
13
310
155
89
50
27
15
12
15
27
50
87
155
310
14
321
164
96
57
32
18
12
12
18
32
57
96
164
321
15
331
174
104
63
38
22
13
10
13
22
38
63
104
174
331
16
341
182
112
70
43
26
15
10
10
15
26
43
70
112
182
341
17
351
191
119
77
49
30
18
11
9
11
18
30
49
77
119
191
351
18
360
199
126
83
54
34
21
13
9
9
13
21
34
54
83
126
199
360
19
368
207
133
89
60
39
25
15
10
8
10
15
25
39
60
89
133
207
368
20
376
214
140
95
65
44
28
18
11
8
8
11
18
28
44
65
95
140
214
376
Нулевая гипотеза отклоняется, если
Кг{а) <К <К2{а),
где Ki(a) и К2(а) — критические значения, приведенные в табл. 161.
При га, п > 10 справедливо приближение
К - М(К)
к* =
где
М(К) = га; В(К) =
JV(O,1),
т-\-п
(т + п)(т + п —
¦ГС- 1
При \К*\ < ui+g нулевая гипотеза принимается с достоверностью а.
2
Задача 264. Проверить гипотезу равенства параметров масштаба критерием Кей-
Кейпена для данных задачи 262.
Ранги Ri первой выборки (объема т = 8) в общей упорядоченной последовательности
равны: 2, 4, 7, 9, 10, 11, 13, 15.
Из табл. 160 находим ряд ад
ai8B) = 19
ai8A0) = 9;
= 83; а18G) = 21; а18(9) = 9;
= 13; сы8A3) = 34; сы8A5) = 83.
498
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 161
Критические значения JK~i(a) и K^^pt) статистики Кейпена
(все значения умножены на 100, а — доверительная вероятность) [482]
п
6
5
4
6
5
8
7
6
5
9
8
7
6
10
9
8
7
6
11
10
9
8
7
9
11
т
2
3
4
3
4
2
3
4
5
2
3
4
5
2
3
4
5
6
2
3
4
5
6
8
7
а
0,90
Кг
42
84
181
93
176
34
95
156
247
78
86
139
226
37
80
139
211
297
30
77
139
203
286
423
329
К2
80
577
619
563
672
542
572
694
755
570
589
710
792
442
586
698
826
905
465
620
719
829
927
1186
1101
0,95
Кг
42
84
126
67
144
34
77
125
199
33
69
122
192
28
71
123
173
261
27
57
107
171
243
369
280
к2
80
577
674
621
672
542
603
725
803
570
640
739
843
596
639
763
862
941
620
647
790
877
969
1246
1170
п
12
11
10
9
8
7
13
12
11
10
9
8
14
13
12
11
10
9
8
14
13
11
10
10
9
т
2
3
4
5
6
7
2
3
4
5
6
7
2
3
4
5
6
7
8
3
4
6
7
8
9
а
0
Кг
30
76
133
201
276
366
32
70
122
196
270
357
30
68
122
190
264
345
431
69
122
185
335
412
501
90
к2
485
581
717
842
946
1034
505
609
727
851
959
1054
523
593
735
860
970
1072
1167
619
743
863
1090
1203
1297
0
Кг
24
56
113
170
233
313
26
57
102
158
228
308
25
51
99
159
221
300
381
52
99
154
292
360
442
95
к2
642
660
795
895
991
1087
662
679
804
912
1016
1105
523
697
809
929
1030
1126
1217
711
828
947
1158
1266
1356
Тогда К = J2 «is (г) = 199 + 83 + 21 + 9 + 9 + 13 + 34 + 83 = 451.
г=1
Из табл. 161 для а = 0,95, т = 8 и п = 10 находим Кг = 360 и К2 = 1266.
Так как Кг = 360 < К = 451 < К2 = 1266, нулевая гипотеза равенства параметров
масштаба в выборках не отклоняется.
Покажем теперь использование аппроксимации. Необходимо иметь в виду, что
в табл. 160 и 161 приведены значения ajv(z) и Кг(К2), в 100 раз превосходящие реальные
величины. Это не сказывается на проверке критерия, однако должно быть учтено при
использовании аппроксимации (т. е. при вычислении величины К* нужно использовать
значения К и ап+т(г), уменьшенные в 100 раз). Имеем Ш(К) = 8 и (используя табл. 161)
) = 3,62 + 1,992 + 1,262 + 0,832 + 0,542 + 0,342 + 0,212 + ОДЗ2
- ОДЗ2 + 0,212 + 0,342
0,542
0,832 + 1,262 + 1,992
Далее получаем
ЩК) =
8- 10
18- 17
• 39,3458 -
8- 10
17
0,09^ + 0,09^ +
3,62 = 39,3458.
5,5806 (у/ЩК) = 2,362); \К*\ =
4,51 -I
2,362
= 1,478.
Так как \К*\ = 1,478 < иг+а = гк»,975 = 1596, нулевая гипотеза не отклоняется и этим
2
критерием.
4.2]
Непараметрические критерии однородности статистических данных
499
4.2.2.1.4. Критерий Клотпа
Критерий, предложенный Клотцем [483], является масштабным аналогом крите-
критерия Ван дер Вардена (см. раздел 4.2.1.2.6). Его статистика в принятвгх ранее обозна™
чениях имеет вид L =
, где и1 — 7™квантиль стандартного нормального
2
распределения; т^п — объемы сравниваемых выборок; Щ—ранги, полученные
элементами первой выборки (объема га) в общем упорядоченном по возрастанию
ряду. Напомним (см. аппроксимацию 15 в разделе 1.1.1), что можно использовать
аппроксимацию
Метки критерия Клотца и2г приведены в табл. 162.
Таблица 162
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Метки
U i ]
JV
критерия
Клотца (все значения
[ умножены
на 100) [482]
N
6
114
32
3
3
32
114
7
132
46
10
0
10
46
132
8
149
58
19
2
2
19
58
149
9
164
71
28
6
0
6
28
71
164
10
178
83
37
12
1
1
12
37
83
178
11
191
94
46
19
4
0
4
19
46
94
191
12
203
104
54
25
9
1
1
9
25
54
104
203
13
215
114
63
32
13
3
0
3
13
32
63
114
215
14
225
123
71
39
19
6
1
1
6
19
39
71
123
225
15
235
132
79
46
24
10
2
0
2
10
24
46
79
132
235
16
245
141
86
52
29
14
5
1
1
5
14
29
52
86
141
245
17
254
149
94
58
35
19
8
2
0
2
0
19
35
58
94
149
254
18
262
157
101
65
40
23
11
4
0
0
4
11
23
40
65
101
157
262
19
271
164
107
71
46
28
15
6
2
0
2
6
15
28
46
71
107
164
271
20
278
171
114
77
51
32
19
9
1
0
0
1
1
9
19
32
51
77
114
171
278
Гипотеза равенства параметров масштаба двух выборок принимается с досто™
верностью а, если Li(a) < L < L2(aI где Li(a) и L2(a)—критические значения,
приведенные в табл. 163.
При га, п > 10 распределение статистик L удовлетворительно аппроксимируется
нормальным со средним M(L) и дисперсией D(L), где
то+п
M(L) =
т-\-п
т + п
т+п+1
D(L) =
г=1
m+n+l
т(т
m+n
771 "ЧГ""^ о
771 + 71
m + n + l
500
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 163
Критические значения jLi(a) и 1/2 (а) статистики Клотца
(все значения умножены на 100, а — доверительная вероятность) [482]
т
2
3
4
3
4
2
3
4
5
3
4
5
4
5
6
4
5
6
4
5
6
7
4
5
6
7
4
5
6
7
те
6
5
4
6
5
8
7
6
5
8
7
6
8
7
6
9
8
7
10
9
8
7
11
10
9
8
12
11
10
9
а
0,
Ьг
4
23
81
34
83
2
39
76
134
38
69
130
73
124
178
77
121
177
78
123
175
241
74
123
177
238
73
122
177
235
ЭО
ь2
298
356
375
356
427
356
368
451
488
386
474
526
469
560
614
496
570
642
508
593
664
727
523
605
683
753
532
627
720
776
0,95
Ьг
4
23
42
12
62
2
25
51
99
23
54
100
60
90
149
51
95
145
60
98
142
199
52
93
144
199
53
97
140
197
ь2
298
356
414
399
427
356
393
476
523
428
495
568
519
589
643
547
610
673
560
645
702
769
573
652
729
794
581
667
751
820
т
3
4
5
6
7
8
3
4
5
6
7
8
9
4
5
6
7
8
9
2
7
4
5
6
7
8
11
10
8
те
14
13
12
11
10
9
15
14
13
12
11
10
9
15
14
13
12
11
10
18
13
16
15
4
13
12
9
10
8
а
0
Ьг
37
75
122
177
234
298
34
74
120
174
233
296
364
76
122
174
233
294
362
9
35
73
120
172
230
293
359
429
301
90
ь2
442
552
640
719
797
870
459
560
648
736
815
891
962
570
660
751
835
912
986
392
481
578
673
763
849
930
1005
1079
845
0
Ьг
23
56
95
141
198
256
23
54
92
141
192
250
314
51
94
140
193
250
313
3
22
53
92
139
190
247
309
375
257
95
ь2
508
602
694
772
847
919
524
616
704
791
869
943
1012
619
723
811
891
965
1039
449
556
639
737
823
907
986
1061
1133
889
|гаИ |LM(L)|
Если [L \ = J— ^ < иг+а, нулевая гипотеза принимается.
Щь) 2
Критерий Клотца оптимален для распределений, близких к нормальному.
Задача 265. Проверить гипотезу равенства параметров масштаба критерием Клот-
Клотца для данных задачи 262.
Имеем последовательность рангов Щ: 2, 4, 7, 9, 10, 11, 13, 15.
Из табл. 162 находим для N = т + п = 18:
19
2
= 262; и j^ = 65;
= 11;
иш = 0;
19
Вычисляем L = 262 + 65 + 11 ¦
и 11 = 4;
19
19
и\з = 23;
19
и\
= 0;
19
^5 = 65.
19
-0 + 0 + 0 + 4 + 23 + 65 = 430.
Из табл. 163 для m = 8, n = 10 и а = 0,95 находим Ь\ = 250 и L2 = 943.
Так как jLi=250<jL = 430 < L2 = 943, параметры масштаба двух выборок призна-
признаются статистически неразличимыми с достоверностью а = 0,95.
4.2]
Непараметрические критерии однородности статистических данных
501
Используем теперь нормальную аппроксимацию. Вычисляем, используя таблицу 162:
М(Ь) = — • B62 + 157 + 101 + 65 + ... + 157 + 262) = 589,333;
18
D(L) =
8- 10
18- 17
B622 + 1572 + 1012 + 652 + ... + 157+2622) = 55280,087;
/5A) = 235,117; L* =
= 0,678,
235,117
что меньше iio,975 = 1,96; следовательно, и в этом случае нулевая гипотеза не отклоня-
отклоняется.
4.2.2.1.5. Квартальный критерий
Критерий является интуитивным аналогом медианного критерия сдвига (см.
раздел 4.2.1.2.7). Статистика критерия имеет вид
г=1
т + п + 1
т + п + 1
2
где
Название критерия исходит из того, что S приблизительно равно числу на-
наблюдений из первой выборки, лежащих за пределами первой и третьей кварти-
квартилей объединенной выборки. Точнее, S получается, если подсчитать количество
г « с л \ т + п + 1 3(т + ?г + 1)
наблюдении Х{ (г = 1, ..., т), для которых щ < или щ > — -,
4 4
и, если (га + n + 1) делится на 4, прибавить 1/2 в случае, когда Щ = или
3(т + п + 1)
для некоторого г = 1, ..., га, или прибавить 1 в случае, когда оба
последних равенства имеют место для некоторых двух различных индексов г.
При га, п > 20 статистика S имеет приближенно нормальное распределение со
средним М(Я) и дисперсией DEr) [365], где
т(т + п — 1)
МE) =
. т
?гг?г[(т + гг
при га + n = 4fc — 1;
при т-\-п ф 4к -\- 1;
- 2(т + п) - 1]
D(S) =
4(т + п) (пг + гг — 1)
2kmn(rn + гг — 2fc)
при ?п + n = 4Aj — 1;
при ?тг + п т^ 4Aj — 1.
(гтг + п) (гтг + гг — 1)
Поэтому нулевая гипотеза равенства параметров масштаба принимается, если
1 < г/i+a, где а — доверительная вероятность.
yD(S) 2
Эффективность критерия по сравнению с i^-критерием в случае нормального
распределения невелика и равна « 0,37, поэтому им рекомендуется пользоваться
при га, п > 50.
Задача 266. Проверить гипотезу равенства параметров масштаба для данных задачи
262 квартильным критерием.
Имеем ряд рангов Щ: 2, 4, 75 9, 10, 11, 13, 15.
Вычисляем 6 —
Ri-
8 + 10 + 1
8 + 10 + 1
= <5(|2 - 9,5| - 4,75) = EB,75) = 1.
502
Проверка гипотез о значениях параметров распределений
[Гл.4
Далее по аналогии имеем
8(\R2 - 9,5| - 4,75) = E@,75) = 1; 8(\R3 ~~ 9,5| - 4,75) = ?(-2,25) = -1;
S(\R4 - 9,5| - 4,75) = ?(-4,25) = -1; S(\R5 - 9,5| - 4,75) = ?(-4,25) = -1;
S(\R6 - 9,5| - 4,75) = ?(-3,25) = -1; S(\R7 - 9,5| - 4,75) = ?(-1,25) = -1;
S (\R8 - 9,5| - 4,75) = ?@,75) = 1.
Тогда 5 = - • A-1-1-1-1-1 + 1 + 8) = 2,5.
Далее вычисляем, имея в виду, что при k = 4m + п = 41с + 2 (8 + 10 = 4-4 + 2)
8 + 10
- 17
Имеем
12 5 — 3 55|
— -—
1,078
= 0,97. Так как \S*\ = 0,97 < г^о,975 = 1,96, нулевая гипотеза
,
принимается. Следует отметить, что к этому выводу нужно относиться с осторожностью.
Это связано с тем, что точность аппроксимации при наших объемах выборок (т = 8
и п = 10) невелика.
4.2.2.1.6. Критерий Сэвиджа
Для распределений, плотность которых определена на полупрямой @ ^ х < оо),
т. е. экспоненциального типа, Сэвидж [484] предложил критерий масштаба, основан-
основанный на статистике
т п
i=l j=m-\-n — Ri-\-l
где Щ — так же, как и ранее, ранги элементов одной выборки объема т^пв общем
упорядоченном ряду.
Нулевая гипотеза равенства параметров масштаба принимается, если
Ci(a) < С < С^а), где С±(а) и C2(pt) — критические значения, приведенные
в табл. 164.
Применительно к экспоненциальному распределению критерий Сэвиджа позво-
позволяет установить разницу в значениях параметров распределений (Л или v — см.
раздел 1.1.4) в двух совокупностях (например, сравнить средние наработки на отказ
изделий двух выборок).
Задача 267. Даны две выборки случайных величин:
(га = 7) хц: 2,1; 3,2; 4,8; 5,7; 8,1; 9,2; 12,4;
(га = 8) x2j: 0,8; 0,9; 2,6; 4,3; 7,1; 9,4; 12,7; 15,1.
Проверить гипотезу равенства параметров масштаба в выборках критерием Сэвидэюа
при доверительной вероятности а = 0,95.
Ранжируем совместный ряд. Результаты сведем в таблицу (г — номер выборки, Ri —
ранг члена выборки хц в объединенном ряду):
%
2
2
1
2
1
ХЦ
0,8
0,9
2,1
2,6
3,2
Ri
1
2
3
4
5
i
2
1
1
2
1
Xij
4,3
4,8
5,7
7,1
8,1
Ri
6
7
8
9
10
i
1
2
1
2
2
Xij
9,2
9,4
12,4
12,7
15,1
Ri
11
12
13
14
15
Для первой выборки (i = 1) получаем последовательность рангов
Ri = 3, 5, 7, 8, 10, 11, 13.
4.2]
Непараметрические критерии однородности статистических данных
503
Таблица 164
Критические значения Ci(ct) и С2(ок) критерия Сэвиджа
т
3
2
3
2
3
4
2
3
4
2
3
4
5
2
3
4
5
2
3
4
5
6
2
3
4
5
6
2
3
4
5
6
7
2
3
4
5
6
7
(все значения
3
5
4
6
5
4
7
6
5
8
7
6
5
9
8
7
6
10
9
8
7
6
11
10
9
8
7
12
11
10
9
8
7
13
12
11
10
9
8
умножены на 100, а-
а
0,90
Сг
116
45
121
40
119
205
49
110
190
44
109
188
2783
49
106
180
264
44
107
177
256
344
43
102
173
252
338
47
102
169
246
391
420
44
101
167
243
325
414
с2
485
418
494
444
507
595
416
521
623
436
534
636
729
421
547
647
747
437
547
655
758
854
428
559
667
771
871
422
564
672
781
883
979
435
563
677
791
895
994
0,95
Сг
116
45
96
40
83
171
35
90
165
31
92
157
240
28
85
152
233
35
86
148
223
307
33
83
148
219
299
30
81
142
214
294
378
36
81
143
212
288
372
с2
485
418
527
444
566
629
466
566
654
486
571
677
762
504
578
686
784
470
585
699
799
891
486
596
712
816
913
500
603
722
828
927
1021
480
613
727
839
943
1039
— доверительная вероятность) [485]
т
2
3
4
5
6
7
8
2
3
4
5
6
7
8
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
10
п
14
13
12
11
10
9
8
15
14
13
12
11
10
9
16
15
14
13
12
11
10
9
17
17
15
14
13
12
11
10
18
17
16
15
14
13
12
11
10
а
0,90
Сг
42
99
165
240
321
407
498
45
99
164
237
317
402
492
43
97
162
235
314
397
486
578
42
97
161
233
310
393
479
570
44
96
160
230
307
389
475
564
657
с2
431
571
685
798
905
1006
1102
438
572
691
805
913
1017
1116
440
573
696
812
922
1027
1128
1225
438
576
698
815
927
1034
1136
1235
437
578
702
820
933
1041
1145
1246
1342
0
Сг
33
79
140
207
283
365
452
31
79
137
205
279
359
445
30
77
137
202
276
355
439
528
28
77
134
200
272
349
432
520
32
76
133
198
269
346
427
513
603
95
с2
493
619
736
849
955
1054
1148
505
622
743
859
967
1069
1165
491
628
749
868
977
1082
1181
1275
501
632
757
873
985
1091
1192
1288
491
637
761
880
993
1101
1204
1302
1397
Вычисляем статистику критерия
1 1
С =
7+8-3+1
-13 +
= 1,104.
7+8-5+1 7+8-7+1
Из табл. 164 для m = 7, п = 8 и а = 0,95 имеем (учитывая, что в ней приведены
умноженные на 100 критические значения) С\ = 3,72.
504 Проверка гипотез о значениях параметров распределений [Гл. 4
Так как С = 1,104 < С г = 3,72, нулевая гипотеза равенства параметров масштаба
критерием Сэвиджа отклоняется.
Используем теперь нормальную аппроксимацию. При га, п > 10 справедливо нор-
нормальное приближение, в соответствии с которым величина распределена как стандартная
нормальная случайная величина.
Для наших данных вычисляем
7 8 / 1 15 Л
М(С) = т = 7; D(C) = • 1 • V - = 3,115 (\/ЩС) = 1,764).
Имеем [С*1= I1'104'.
1 1,764
Так как |С* = 3,342 > tio,975 :=: 1,96, то и этот критерий отклоняет нулевую гипотезу.
4.2.2.1.7. Критерий Муда
Рассмотрен в [486, 487] в качестве альтернативы критерию, основанному на
i^-статистике Фишера, когда вместо наблюдений используются их ранги. Стати-
Статистика критерия имеет вид
г=1
где Щ —ранги элементов выборки ж1? ..., хт в общем упорядоченном ряду значе™
ний хъ ... ,хт и 2/1, ... ,уп(т ^ п).
Нулевая гипотеза равенства параметров масштаба в обеих выборках принима-
принимается, если rai(a) < М < га2(ск), гДе nii(a) и гп2(а)—критические значения стати™
стики, приведенные в табл. 165.
При га, п > 10 справедлива нормальная аппроксимация [488, 489]
М - Ш(М) + -
м* = 2;
/
где
т(т + п + 1)(т + п - 1) ^ тл(М\ = ™n{m + n + l)(m + n + 2)(m + n - 2)
12 ' v ; 180
Нулевая гипотеза принимается, если
\М*\ < ui+a.
2
Эффективность критерия Муда по отношению к ^-критерию в случае исходного
нормального распределения равна 0,76 [486].
Необходимо отметить, что критерий Муда (как и все ранее рассмотренные
критерии) предполагает равенство средних (параметров положения). Это может
быть обеспечено введением величин Х{ — Дх и у^ — fa вместо величин Xi и у^ (Д]_, fa —
медианы соответствующих выборок).
Задача 268. Поверить гипотезу равенства параметров масштаба в условиях задачи
267 критерием Муда.
Для ряда рангов Щ : 3, 5, 7, 8,10,11,13 имеем
Из табл. 165 для га = 7, п = 8иа = 0,95 имеем Мг = 67 ш М2 = 196.
4.2]
Непараметрические критерии однородности статистических данных
505
Таблица 165
Критические значения M\(ol) и M^^ol) статистики Муда
(а — доверительная вероятность) [488]
т
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
5
5
5
5
5
п
6
7
8
9
10
11
12
13
3
4
5
6
7
8
9
10
11
4
5
6
7
8
9
10
5
6
7
8
9
а
0,
Mi
1
1
2
2
2
3
3
4
3
5
5
5
9
9
9
11
13
9
11
15
15
19
21
23
21
25
29
33
37
90
м2
18
25
32
34
50
57
72
74
15
22
27
34
43
51
63
77
87
33
42
53
66
79
93
107
61
76
91
107
125
0,
Mi
1
1
1
1
1
1
2
2
3
2
3
5
5
5
7
8
9
9
9
11
14
15
15
19
17
20
23
27
31
95
м2
18
25
32
41
50
61
72
80
15
22
31
36
47
57
71
81
93
33
45
55
70
83
101
117
65
79
95
114
135
т
6
6
6
6
6
7
7
7
7
7
7
7
8
8
8
8
8
9
9
5
5
5
6
6
6
6
9
10
п
10
11
12
13
14
7
8
9
10
11
12
13
8
9
10
11
12
9
10
10
11
12
6
7
8
9
11
10
а
0,
Mi
65
74
81
90
99
68
76
86
95
106
116
128
106
117
130
144
158
156
172
42
47
54
41
46
51
59
188
220
ЭО
м2
191
217
245
274
303
160
185
214
243
274
307
342
234
267
302
338
378
328
369
147
107
190
101
123
143
166
410
444
0,
Mi
55
62
69
75
83
60
67
74
83
92
100
110
94
104
116
127
138
140
155
34
39
43
35
39
43
50
168
200
35
м2
203
230
259
291
323
168
196
224
255
290
324
362
246
280
318
356
398
344
386
155
179
203
107
130
151
176
432
464
Так как Mi = 67 < М = 73 < М2 = 196, нулевая гипотеза не отклоняется.
Для нормального приближения имеем
М(М) = 7'16'14 = 130,66; D(M) =
12
|М*
180
|ТЗ —- 130,61|
33,16
= 1100,08
М) = 33,16);
= 1,737.
Так как \М*\ = 1,737 < iio,975 = 1,96, нулевая гипотеза этим критерием не отклоня-
отклоняется.
4.2.2.1.8. Критерий Сукхатме
Критерий является модифицированной формой критерия Вилкоксона-Уитни
(см. раздел 4.2.1.1.2.2). Статистика критерия имеет вид [491, 492]
если0<а<6;
если а < 0,
6.
506 Проверка гипотез о значениях параметров распределений [Гл. 4
При га, п > 10 используется аппроксимация
где
При справедливости нулевой гипотезы Т* распределена как нормальная слу-
случайная величина. Поэтому с вероятностью а нулевая гипотеза отклоняется, если
Т*\ > ui+a. (здесь и7—7™квантиль стандартного нормального распределения).
2
Эффективность критерия Сукхатме для нормально распределенных случайных
величин равна 0,61, для экспоненциально распределенных — 0,94.
Основным неудобством критерия, основанного на Т-статистике, является необ-
ходимость предварительного знания соотношения параметров положения в выбор-
выборках. Этого недостатка лишен модифицированный критерий, предложенный в [490]
(имеем выборки х\, ..., хт и г/i, ..., уп):
п т
2 Y Е
i=pj=i
где
{1, если 0 < и < гу, 0 < v < w
или w < и < 0, ги < г; < 0;
0 в остальных случаях;
{1, если 0 < и < v,
или v < и < 0;
0 в остальных случаях.
Более удобна для практических вычислений другая форма
Г7 = Г[ +Г^,
где
, ^2 m + n-8^o ni(m
212
г=1 г=1
2
-4 ^ , п2(гг2 + l)[3(m + n)+ 8п2 - 14]
^ i2 +
^ i2 + 12
г=1
Здесь Rn —ранг i-то положительного наблюдения у^ в упорядоченных по величине
положительных значениях Х{ и у^\ Ri2 — ранг i-ro отрицательного наблюдения
в упорядоченном по величине ряду отрицательных значений Х{ и у±\ п\—число
положительных наблюдений у {п^ = п — ni); mi —число полож:ительных наблюде-
наблюдений х (ni2 = тп — nil).
При справедливости нулевой гипотезы имеем
М(Т') = ^п [5(w + nf - 3n(m + n) - 2n2 - 12(m + n) + 12n] ;
Щ1 j " 2880 X
x [61(m + nK + 331(m + nf - 120n2 + 480n(m + n) - 2344(m + n) - 600n + 2636] .
Эффективность Т'-статистики по отношению к Т-статистике равна 1,13.
4.2]
Непараметрические критерии однородности статистических данных
507
Задача 269. Проверить гипотезу масштаба критерием Сукхатме для данных зада-
задачи 267.
Имеем выборки
Xii 2,1, 3,2, 4,8, 5,7, 8,1, 8,2, 12,4 (m = 7);
уц 0,8, 0,9, 2,6, 4,3, 7,1, 9,4, 12,7, 15,1 (п = 8).
Значения ф{хг^у^) (г = 1, ..., 7; j = 1, ..., 8) представлены в таблице:
1
2
3
4
5
6
7
1
0
0
0
0
0
0
0
2
0
0
0
0
0
0
0
3
1
0
0
0
0
0
0
4
1
1
0
0
0
0
0
5
1
1
1
1
0
0
0
6
1
1
1
1
1
1
0
7
1
1
1
1
1
1
1
8
1
1
1
1
1
1
1
Имеем
-i m n
т ¦ п т-^ .л *' %>
г=1з=1
Окончательно имеем Т*
= 0,482;
45 • 1 ¦ о
= 0,00818
= 0,09).
|0,482 — 0,25|
0^09
= 2,577.
Так как \Т*\ = 2,577 > 11,0,975 = 1,96, нулевая гипотеза отклоняется.
4.2.2.1.9. Критерий Сэндвика—Олесона
Критерий применим для парных выборок равного объема
xli X2i • • • ? xn'i
г/1,2/2, • • • ,2/n-
Пусть тж и Шу — оценки медиан в выборках. Построим последовательность
величин
Cq ™~~™ \ JU q iil/n
- \у{ -
i = 1, . ..,n.
Нулевая гипотеза равенства параметров масштаба принимается, если z^ не
имеют тенденции быть положительными [493]. Для проверки этого используется
критерий знаковых рангов Вилкоксона (см. раздел 4.2.1.1.2.2).
Статистикой критерия является величина
где Ri — ранги неотрицательных значений zi в общем ранжированном по возраста-
возрастанию ряду \zi\.
При п > 20 моясно использовать приближение
^+ п{п+1)
Т* =
п{п+ 1)Bп
24
При \Т*\ > ui+g нулевая гипотеза отклоняется.
2
508
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 270. Проверить критерием Сэндвика-Олссона равенство параметров мае-
штаба для выборок
хц 1,4, 1,8, 2,7, 3,9, 6,1, 7,8, 7,9;
yii 0,8, 0,9, 2,7, 5,9, 6,1, 8,1, 11,2
при доверительной вероятности а = 0,95.
Для ряда xi имеем медиану тх = 3,9 и, по аналогии, тпу = 5,9. Вычисляем:
zt = \xi - гпх\ - \уг - гпу\ = |1,4 - 3,9| - |0,8 - 5,9| = ^2,6;
z2 = |1,8 - 3,9| - |0,9 - 5,9| = -2,9; z3 = |2,7 - 3,9| - |2,7 - 5,9| = -1,0;
z4 = |3,9 - 3,9| - |5,9 - 5,9| = 0; z5 = |6,1 - 3,9| - |6,1 - 5,9| = 2,0;
z6 = |7,8 - 3,9| - (8,1 - 5,9) = 1,7; z7 = |7,9 - 3,9| - |11,2 - 5,9| = -1,3.
Формируем упорядоченный ряд значений \zi\ (внизу отмечены ранги):
Zi\: 0 1,0 1,3 1,7 2,0 2,6 2,9
Rii 1 2 3 4 5 6 7
Видим, что положительные значения ^@; 1,7; 2,0) имеют ранги Rf. 1, 4 и 5 соответ-
соответственно. Следовательно, Т+ = 1 + 4 + 5 = 10.
Из табл. 144 для п = 7иа = 0,95 имеем Т\ = 4 и Т2 = 24.
Так как Т\ = 4 < Т+ = 10 < Т2 = 24, нулевая гипотеза равенства параметров масшта-
масштаба не отклоняется. Легко видеть, что к такому выводу приводит и аппроксимация
7 •!
= 0,676 < Ui + g = 1^C,975 = 1,96.
4.2.2.1.10. Критерий Краута-Линерта
Большинство из рассмотренных нами ранее критериев предполагали равенство
параметров положения сравниваемых выборок. Краутом и Линертом [494, 495]
рассмотрены критерии масштаба, нечувствительные к сдвигу. Если в нашем распо-
распоряжении находятся две зависимые (парные) выборки
хг: хъх2, ...5ж„;
Vi- 2/15 2/2? • • • ,Уп?
то критерий масштаба строится следующим образом. Сначала случайным образом
тъ
образуем — пар совокупностей
и (жг2?2/г2) и находим
D,=
h - Xj2) - (yix -yi2)
2
Если совокупность величин Di симметрична, то нулевая гипотеза равенства
параметров масштаба не отклоняется. Таким образом, задача сводится к проверке
симметричности распределения совокупности значений Di. Это может быть выпол™
нено одним из критериев, приведенных в главе 3 (см. раздел 3.5).
Для случая независимых выборок критерий строится следующим образом. Каж™
дая выборка случайным образом разбивается на пары наблюдений
( \ ' 1 /
Затем производится сравнение рядов разностей
с помощью любого критерия сдвига.
и Dy.=
(У 31 ™
4.2] Непараметрические критерии однородности статистических данных 509
Задача 271. Для выборок равного объема п = 16
Xii 1, 2, 4, 6, 9, 12, 15, 21, 27, 31, 35, 46, 51, 61, 71, 75;
yji 2, 6, 9, 14, 21, 27, 38, 46, 59, 76, 91, 101, 110, 120, 140, 155
проверить гипотезу равенства параметров масштаба критерием Краута-Линерта
при доверительной вероятности а = 0,95.
Разбиваем выборку хг произвольно на 8 пар:
A,75), B,6), D,61), (9,46), B1,35), A5,51), A2,27), C1,71).
Аналогично поступаем с выборкой у у.
F,9), B,27), B1,155), A4,101), C8,59), D6,140), (91,120), G6,110)
Вычисляем ряд значений
Р., = <«" 7"J -> A -275J = 2738; ^=8;
=1624,5; (9~46J =684,5; B1 ~ ^ = 98;
' ' 2 ' ' 2
648
2
По аналогии получаем ряд
=112,5; C1 ~ llf = 800.
2
^^^=45; ^
^^4,5;
=4,5; ^=312,5;
B1 -2155J = 8978; A4-2101J =3784,5; C8 ^ = 220,5;
D6-214°J=4418; (91-2120J =420,5; (?6 ^ = 578.
Сдвиг рядов _DXi и DVi проверяем критерием Вилкоксона (см. раздел 4.2.1.1.2.2), для
чего строим ряд значений
Z! = 2738 - 4,5 = 2733,5; z2 = 8 - 312,5 = -304,5; z3 = 1624,5 - 8978 = -7353,5;
z4 = 684,5 - 3784,5 = -3100; z5 = 98 - 220,5 = -122,5; z6 = 648 - 4418 = -3770;
z7 = 112,5 - 420,5 = -308; z8 = 800 - 578 = 222.
Ряд значений \zi\ (внизу отмечены ранги) имеет вид:
\zi\ -+ 122,5 222 304,5 308 2733,5 3100 3770 7353,5
i?i^l234 5 6 7 8
Ранги Ri величин z% > 0 (z\ ш zs) в этом ряду: 2 и 5. Применяя критерий Сэндвика—
Олсона (см. раздел 4.2.2.1.9), имеем
Г+ = ]Г 1^ = 2 + 5 = 7.
Zi>0
Из табл. 144 для п = 8 ш а = 0,95 находим Т\ = 4 и Т2 = 32.
Так как Т\ = 4 < Т+ = 7 < Т2 = 32, гипотеза сдвига не подтверждается, а следова-
следовательно, не подтверждается различие параметров масштаба в выборках.
4.2.2.1.11. Критерий Камата
Является интуитивным масштабным аналогом критерия Хага (см. раз-
раздел 4.2.1.1.2.8). Его применение предполагает равенство параметров положения
выборок (т. е. отсутствие сдвига между ними). Предварительно выборки #i, ..., хп
и г/i, ..., уш (jn ^ п) совместно упорядочиваются. Элементы выборки х получают
ранги RXi, а элементы выборки у — ранги Ryi. Находим размахи рангов
Уг )min И ±хш — \-К"Уг /max \-^"Уг Jniin-
510
Проверка гипотез о значениях параметров распределений
[Гл.4
Статистика критерия Камата записывается как [496]
Естественно, что 0 ^ Dnjm ^ т + п- Нулевая гипотеза равенства параметров
масштаба принимается, если D\{ot) < -On,m < D2 («), где D\{ot) и D2{ol)— крити-
критические значения, приведенные в табл. 166.
Таблица 166
Критические значения D\{ol) и Dz(ol) масштабного критерия
Камата (а — доверительная вероятность) [496]
га + п
8
9
10
11
12
13
14
15
16
п
4
4
4
5
3
4
5
3
4
5
6
3
4
5
6
3
4
5
6
7
3
4
5
6
7
3
4
5
6
7
а
0,90
Вг
0
0
0
0
0
0
1
0
0
1
1
0
1
1
1
0
1
2
2
2
0
1
2
2
2
0
1
2
3
3
8
9
10
10
11
10
10
11
11
11
11
11
12
12
12
12
13
13
12
12
13
14
13
13
13
14
15
14
14
13
0,
Вг
0
0
0
0
0
0
0
0
1
1
0
1
1
1
0
0
1
1
2
0
1
1
2
2
95
10
10
11
11
12
12
12
13
12
12
13
13
13
13
15
14
14
14
13
15
15
15
14
14
га + п
16
17
18
19
20
п
8
3
4
5
6
7
8
3
4
5
6
7
8
9
3
4
5
6
7
8
9
3
4
5
6
7
8
9
10
а
0,90
3
0
2
2
3
3
3
1
2
3
3
4
4
4
1
2
3
4
4
4
4
1
2
3
4
5
5
4
4
D2
13
15
15
15
15
14
14
16
16
16
15
15
15
14
16
16
17
16
16
15
15
17
17
18
17
17
16
16
16
0,95
Di
2
0
1
2
2
2
3
0
1
2
2
3
3
3
0
1
2
3
3
3
3
0
1
1
3
4
4
4
4
D2
14
15
16
16
15
15
15
16
17
16
16
16
15
15
17
18
17
17
16
16
16
18
19
18
18
17
17
16
16
При т + п > 20 справедлива аппроксимация [496]
Dt(a) = M(D) - л/ЩЩкг(а); D2(a) = M(D) + л/ЩБ)К2{а),
где
M(D) =m-
2m
2n
п + 1 т + 1'
2m(n-
8mn
(т - lf(m + 2) (т + 1)(п + 1)
4.2]
Непараметрические критерии однородности статистических данных
511
Здесь Ki(a) и К2(а)—коэффициенты, зависящие от и доверительной вероятно™
сти а (для а = 0,95 их значения приведены в табл. 167).
Таблица 167
Значения корректирующих коэффициентов
jftTi@,95) и Ж2@,95) критерия Камата
р -
т
т + п
@,95)
@,95)
0,50
1,99
1,99
0,
1,
2,
55
88
10
0,60
1,77
2,20
0,65
1,67
2,28
0,
1,
2,
70
57
34
0,75
1,50
2,41
Задача 272. Для данных задачи 270 проверить нулевую гипотезу равенства парамет-
параметров масштаба критерием Камата.
Запишем упорядоченный по возрастанию совместный ряд (г — номер выборки, Ri —
ранг элемента в совместной последовательности значений Хг):
г
2
2
1
1
1
Xi
0,8
0,9
1,4
1,8
2,7
Кг
1
2
3
4
5,5
г
2
1
2
1
2
Xi
2,7
3,9
5,9
6,1
6,1
Ri
5,5
7
8
9,5
9,5
г
1
1
2
2
Xi
7,8
7,9
8,1
11,2
Ri
11
12
13
14
Для первой выборки имеем последовательность рангов
RXi -> 3; 4; 5,5; 7; 9,5; 11; 12 и Rn = 12 - 3 = 9.
Для второй выборки имеем
Ry. -> 1; 2; 5, 5; 8; 9, 5; 13; 14 и Rm = 14 - 1 = 13.
Тогда Dn,m = 9 — 13 + 7 = 3. Из табл. 166 имеем для т + п = 14, т = 7 и а = 0,95:
Di = 1 и D2 = 13. Так как D\ = 1 < Dn,m = 3 < D2 = 13, нулевая гипотеза не отклоня-
отклоняется.
Рассмотрим теперь аппроксимацию. Имеем
M(D) = 7 - — + — = 7;
2
82 ¦ 9
2
82 ¦ 9
4+^
8-8 С[4
Жх = 1,99 = К2. Тогда
i = 7 - 1,99 • 2,55 = 2
Из табл.167 для р = 0,5 имеем
и D2 = 7+1,99-2,55 = 12.
Полученный диапазон критических значений несколько уже точных (это следствие
того, что т + п < 20), но и в этом случае нулевая гипотеза не отклоняется.
4.2.2.1.12. Комбинированный критерий Вуша^Вмнда
Ранее мы рассматривали критерии сдвига и критерии масштаба, которые позво™
ляли проверять гипотезы относительно одного из параметров (сдвига или масшта-
масштаба), фиксируя условия для другого параметра (например, полагая их равенство).
Однако на практике возможны случаи, когда нельзя априори знать, какие пара-
параметры сравниваемых выборок могут отличаться между собой. Естественно, в этом
случае целесообразно иметь критерий, позволяющий одновременно проверить сдвиг
512
Проверка гипотез о значениях параметров распределений
[Гл.4
как в параметре положения, так и в масштабном параметре. Одним из таких ранге™
вых комбинированных критериев является критерий Буша—Винда, рассмотренный
в [497].
Статистика этого критерия строится следующим образом. Пусть мы имеем
две независимые выборки х\, ...,хш и г/i, ..., уп и Щ — ранги xi в совокупной
ранжированной по возрастанию выборке.
Введем метки
адг(г) = и г и bN(i) = a%(i),
N+l
где N = т + п и и7 — 7™квантиль стандартного нормального распределения (можно
7
использовать аппроксимацию для квантили и1
дел. 1.1.1). Дисперсии меток
Введем статистики
1,91 [i
°'14-(l-7)°'14
(l-7)°
см. раз-
г И t
N
i=l
равны соответственно:
г=1
w-.-S-'*'
Т —
-1 ran —
Легко видеть, что статистика Smn эквивалентна статистике Ван дер Вардена
(см. раздел 4.2.1.1.2.4), а статистика Ттп — эквивалентна статистике Клотца (см.
раздел 4.2.2.1.4). В качестве статистики комбинированного критерия предлагается
статистика
Wmn = -21n[2 (I - Ф
- 2 ln[2 A - Ф
где Ф(^) — функция стандартного нормального распределения.
Допустимо использование аппроксимации
2,34"
Гипотеза отсутствия сдвига и неразличимости параметров масштаба с достовер-
достоверностью а принимается, если Wmn < Wmn(aI где Wmn(a)—критические значения,
приведенные в табл. 168.
Таблица 168
Критические значения статистики Wmn(€x)
Буша^Винда для т = п [497]
т = п
5
6
7
8
9
10
15
Доверительная
вероятность а.
0,90
7,03
7,19
7,31
7,36
7,45
7,48
7,58
0,95
7,92
8,06
8,20
8,47
8,54
8,65
8,97
0,975
8,57
8567
9,06
9,25
9550
9,65
10,20
т = п
20
25
30
40
50
оо
Доверительная
вероятность ос
0,90
7,65
7,69
7,71
7,74
7,76
7,78
0,95
9,05
9,09
9,24
9,30
9,32
9,49
0,975
10,50
10,50
10,60
10,70
10,90
11,10
4.2]
Непараметрические критерии однородности статистических данных
513
При га, п > 30 справедлива аппроксимация М^теп(а) = х^D), где х
тиль распределения хи-квадрат с / = 4 степенями свободы. Мощность критерия
Буша-Винда весьма высока, что позволяет считать его эффективным критерием
для непараметрической проверки гипотез в выборках из нормального (или близкого
к нему) распределения.
Задача 273. Для данных задачи 270 проверить гипотезу равенства параметров поло-
положения и масштаба в выборках комбинированным критерием Буша-Винда.
Имеем ряд рангов Щ: 3; 4; 5,5; 7; 9,5; 11; 12.
Используя аппроксимацию
14+1
= 4,91 ¦
0,14
15 15
0,14
вычисляем значения а\^(г). Результаты вычислений сводим в таблицу (там же указаны
величины а?4@ и дополнительные величины аы(г) для дробных рангов 5,5 и 9,5):
г
1
2
3
4
5
5,5
6
7
ai4@
-1,5021
-1,1094
-0,8395
-0,6208
-0,4290
-0,3393
-0,2522
-0,0833
al4(i)
2,2563
1,2308
0,7048
0,3854
0,1841
0,1151
0,0636
0,00693
ъ
8
9
9,5
10
11
12
13
14
ai4(i)
0,0833
0,2522
0,3393
0,4290
0,6208
0,8395
1,1094
1,5021
«14@
0,00693
0,0636
0,1151
0,1841
0,3854
0,7048
1,2308
2,2563
Вычисляем
= °'833);
= 0,618 • [ai3C) + oi4D) + oi4E,5) + ... + ai4A2)] = -0,0515
7 • 7 0,833
Далее вычисляем
= 1,021);
= 0,5048 • [a?4C) + %4D) + ... + a?4A2) - 0,5 • a\4(l) - 0,5 • o?4B)
... - 0,5 • o?4 A4)] = -1,235.
Находим аппроксимации
Ф@,0515) = 1 - 0,852 • exp { -
= 0,5205;
Ф A,235) = 1 - 0,852 . exp ^ - ( —
| (Щ^) | = 0,8918.
Окончательно имеем
Wmn = -2 • ln[2 • A - 0,5205)] - 2 • ln[2 • A - 0,8918)] = 3,145.
17 А. И. Кобзарь
514
Проверка гипотез о значениях параметров распределений
[Гл.4
Из табл. 168 для а = О5Э5 и т = п = 7 имеем Штп@,95) = 8,20.
Так как Wmn = 3,145 < Wmn@,95) = 8,20, гипотеза равенства параметров положения
и масштаба в выборках не отклоняется.
4.2.2.2. Сравнение параметров масштаба нескольких (к > 2) совокупностей
критерием Бхапкара-Дешпанде
Рассмотрим совокупность к выборок
^11, #12, • • • 5 Х1п1] #21? Ж22, • • • , %2n2i •••5 #гЪ #г2? • • • ? ^т* 5
• • • 5 %kli хк2? • • • , хкпк-
Пусть Xij —j-e наблюдение в г-й выборке (j = 1, 2, ..., п^). Если мы будем всеми
возможными способами из каждой выборки брать одно наблюдение, то можем
к
получить Yl ni подвыборок.
г=1
Пусть Vij—число таких подвыборок, в которых наблюдение, соответствующее
г-й выборке, было больше, чем (j — 1) наблюдений (или меньше, чем остальные
2
V ¦
(к — j) наблюдений). Определим величины щ* = =г—, которые распределены рав™
i
номерно на интервале [0,1]. Бхапкар [499] показал, что при справедливости нуле™
вой гипотезы Но: F\{x) = F(x) = ... = Fk(x)^ утверждающей, что распределения
в сравниваемых выборках совпадают с точностью до параметров положения и мас-
масштаба, имеет место соотношение иц = -.
к
Там же Бхапкар предложил критерий для проверки сдвига как в дисперсиях, так
и в средних сравниваемых выборок. В случае равенства параметров положения этот
критерий является критерием проверки равенства параметров масштаба. Критерий
Бхапкара основан на статистике
г+1
Дешпанде, Дюфор и Люнг [500, 501] предложили эффективный критерий для
выявления разницы в параметрах масштаба, основанный на статистике
к
п-
к
г=1
1
К
2
г=1
к
г=1
(^il
Л
-y2(fc-l)
D =
{к2
¦d^
гы
где di = иц + щк (г = 1, 2, ..., к).
Ими же предложена статистика для выявления сдвига в к выборках (что полезно
делать перед применением критериев масштаба). Эта статистика имеет вид
fe-1)
L =
где Ii = — г/ii + Wife (г = 1, 2, ..., &).
4.2]
Непараметрические критерии однородности статистических данных
515
В [502] рассмотрена статистика, эквивалентная статистике Крускала-Уоллиса
(см. раздел 4.2.1.2.1). Нулевая гипотеза не отклоняется критериями V^^D, ес-
если У, L, D < Х«(^ ~~ 1)? гДе Ха(^~-0— «-квантиль распределения хи-квадрат с
/ = Aj — 1 степенями свободы.
Для случая А; = 3 критические значения критериев L и D (La и Da) приведены
в табл. 169.
Таблица 169
Критические значения La и Da
для к = 3 [498]
2
2
2
2
2
2
3
3
4
2
2
2
3
3
4
3
4
4
п3
2
3
4
3
4
4
3
4
4
Доверительная
0
L
6,48
7,33
7,40
7,14
7,47
7,21
7,82
8,20
99
D
11,43
13,33
10,00
9,95
8,30
9,38
6,75
7,15
вероятность а
0
L
5,33
5,39
6,10
5,85
5,80
5,55
6,22
6,34
6,15
95
D
10,00
8,00
5,80
5,59
4,54
5,48
4,80
4,18
4,60
Задача 274. Предположим^ что имеются к = 3 выборки по четыре наблюдения
в каждой
хщ 300, 400, 510, 600;
x2i: 250, 440, 570, 900;
x3i: 520, 610, 920, 1070.
Необходимо проверить гипотезу о равенстве параметров масштаба в выборках крите-
критериями V, L и D при доверительной вероятности а = 0,95.
з
В нашем случае щ = 4 и к = 3. Таким образом, мы можем получитв ]~| щ = 4 =64
г=1
подвыборки объема к = 3 каждая (номер столбца в подвыборках соответствует номеру
выборки)
300,250,520 400,250,520 510,250,520 600,250,520 300,440,520
300,250,610 400,250,610 510,250,610 600,250,610 300,440,610
300,250,920 400,250,920 510,250,920 600,250,1070 300,440,920
300,250,1070 400,250,1070 510,250,1070 600,250,1070 300,440,1070
400,440,520 510,440,520 600,440,520 300,570,520 400,570,520
400,440,610 510,440,610 600,440,610 300,570,610 400,570,610
400,440,920 510,440,920 600,440,920 300,570,920 400,570,920
400,440,1070 510,440,1070 600,440,1070 300,570,1070 400,570,1070
510,570,520 600,570,520 300,900,520 400,900,520 510,900,520 600,900,520
510,570,610 600,570,610 300,900,610 400,900,610 510,900,610 600,900,610
510,570,920 600,570,920 300,900,920 400,900,920 510,900,920 600,900,920
510,570,1070 600,570,1070 300,900,1070 400,900,1070 510,900,1070 600,900,1070
Находим уц—число подвыборок, в которых наблюдения в г-й выборке были мень-
меньше, чем 1с — j=3 — 1 = 2 наблюдения. Прямым перебором убеждаемся, что vn = 35,
17*
516
Проверка гипотез о значениях параметров распределений
[Гл.4
у21 = 27, г;з1 = 2. По аналогии находим г^з —число подвыборок, в которых наблюдения
из г-й выборки были больше, чем 3 — 1 = 2 наблюдения из остальных выборок. Имеем
1713 = 3, V23 = 11, ^33 = 50.
Проверкой убеждаемся, что
= 35 + 27 + 2 = 64 и v13 + v23 + v33 = 3 + 11 + 50 = 64.
Далее находим
= — = — = 0,5469; u2i = — = 0,4219; u3i = — = 0,03125;
64 64 ' ' 64 ' ' 64 '
= тт = 0,0469;
64
U23 = ^ = 0,1719;
64
= ^ = 0,78125;
64
= иг1 +
= 0,5469 + 0,0469 = 0,5938; d2 = u2i + u23 = 0,4219 + 0,1719 = 0,5938;
d3 = u3i + г^зз = 0,03125 + 0,78125 = 0,8125;
= -ии +и3 = ^0,5469 + 0,0469 = ^0,5; l2 = -u2i + u23 = ^0,4219 + 0,1719 = ^0,25;
h = -u31 + u33 = -0,03125 + 0,78125 = 0,75.
Вычисляем статистики критериев
V = 64 • B • 3 - 1) ¦
з
E
г=1
1\2 4 Г» 4 / 1
Н1-3) ' 64 ^64 "Г"
= 320-
0,5469
3
16
@,4219
Г з
16
i
0,03125
3
16
-{ — • [@,549 + 0,4219 + 0,03125 -1)]} \ = 2,89;
L =
64 • 5 • 4 • Of
2 ¦ [9 + (9 + 12 + 2) - Of]
16
= 1,82.
Из табл. 169 для а = 0,95 и щ = 4 находим Lo,95 = 6,15 и Do,95 = 4,60.
Так как D = 1,82 < Do,95 = 4,60 и L = 4,67 < Ьо,95 = 6,15, нулевая гипотеза не откло™
няется.
К такому же результату приводит сравнение с Хо,эбB), так как
V = 2,89, L = 4,64, D = 1,82 < Хо,95B) = 5,99.
4.3] Критерии тренда и случайности 517
4.3. Критерии тренда и случайности
Критерии этого раздела предназначены для проверки гипотез о случайности
расположения полученных выборочных данных, т. е. отсутствия взаимосвязи между
значениями реализаций наблюдаемой случайной величины и их номерами в выбо™
рочной последовательности.
В приводимых ниже критериях используются выборочные значения случайной
величины в порядке их появления (т. е. они образуют временной ряд).
Наибольшее применение критерии тренда находят при статистическом контроле
и предупредительном регулировании технологических процессов в промышленное
сти, позволяя заранее статистически обоснованно выявить намечающуюся тенден™
цию ухудшения качества продукции. Для медика наличие тренда в исследуемом
ряду данных о заболеваниях является объективным критерием оценки надвигаю-
надвигающейся эпидемии. Количество возможных ситуаций, в которых выявление тренда
(закономерности, а не случайности появления ряда данных) дает практически
полезную информацию, велико, и каждый инженер или исследователь повседневно
встречается с необходимостью использовать критерии настоящего раздела в своей
работе.
4.3.1. Критерий Аббе-Линника
Пусть #1, ..., хп — ряд значений взаимно независимых нормально распределен-
распределенных случайных величин с математическими ожиданиями //i, ..., /лп соответственно
и одинаковыми (но неизвестными) дисперсиями. Проверяется гипотеза о том, что
все выборочные значения принадлежат одной генеральной совокупности со сред™
ним \х\ (Но: iii = /i, г = 1,2, ..., п) против альтернативы тренда
#i: |//i+i -iii\ >0, i = 1,2, ...,n-l.
Статистика критерия Аббе^Линника имеет вид
п-1
1 §(жг+1"ХгJ 1 п
г=1
Если q > qai то нулевая гипотеза случайности ряда #i, ..., хп отклоняется с до™
верительной вероятностью а (критические значения qa приведены в табл. 170).
При п > 60 справедлива аппроксимация, основанная на том, что случайная
™ /1 \ / 2^ + !
величина Q = — A — q)x ^ имеет стандартное нормальное распределение.
V 2 - A - д)
Поэтому нулевая гипотеза отклоняется, если Q* < и\—а.
В заключение упомянем достаточно простой критерий, приписываемый Кохра™
ну [9], с помощью которого можно установить изменение среднего статистического
ряда скачком после первых щ наблюдений (щ + n^+i = в, г = 2, ..., п — 1). Его
статистики имеют вид
2 _ щ(п - щ) (хгЛ - xiuJ
Хг ~ п х
где хгл = — У2 Xi\ xin = J2 xi'i х = ~ У2
г=1 i=rii + l г=1
518
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 170
Критические значения qa критерия Аббе—Линника [25]
п
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Доверительная
вероятность а
0,95
0,3902
0,4102
0,4451
0,4680
0,4912
0,5121
0,5311
0,5482
0,5636
0,5778
0,5908
0,6027
0,6137
0,6237
0,6330
0,5417
0,6498
0,6574
0,6645
0,99
0,3128
0,2690
0,2808
0,3070
0,3314
0,3544
0,3759
0,3957
0,4140
0,4309
0,4466
0,4611
0,4746
0,4872
0,4989
0,5100
0,5203
0,5301
0,5393
п
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
Доверительная
вероятность а
0,95
0,6713
0,6776
0,6839
0,6893
0,6946
0,6996
0,7047
0,7091
0,7136
0,7177
0,7216
0,7256
0,7292
0,7328
0,7363
0,7396
0,7429
0,7461
0,7491
0,99
0,5479
0,5562
0,5639
0,5713
0,5784
0,5850
0,5915
0,5975
0,6034
0,6089
0,6141
0,6193
0,6242
0,6290
0,6337
0,6381
0,6425
0,6467
0,6508
п
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
Доверительная
вероятность а
0,95
0,7521
0,7550
0,7576
0,7603
0,7628
0,7653
0,7767
0,7698
0,7718
0,7739
0,7759
0,7779
0,7799
0,7817
0,7836
0,7853
0,7872
0,7891
0,7906
0,99
0,6655
0,6659
0,6622
0,6659
0,6693
0,6727
0,6757
0,6787
0,6814
0,6842
0,6869
0,6896
0,6924
0,6949
0,6974
0,6999
0,7024
0,7049
0,7071
Если xf > Ха(-О> то изменение среднего скачком после первых щ наблюдений
признается значимым с достоверностью а, здесь Ха(-0 — а-квантиль распределения
хи-квадрат с / = 1 степенью свободы.
Задача 275. Имеется выборочный ряд значений случайных величин (п = 10)
хц 4,3; 2,1; 0,9; 5,2; 4,8; 1,2; 0,8; 3,0; 6,1; 10,2.
Проверить гипотезу случайности ряда х% критерием Аббе-Линника при доверительной
вероятности а = 0,95.
Вычисляем
1 ю
^ — . V4 гр. — Q Qfl.
dj — > JLj — O.OU.
10 h
9
J2 {xi+i - Xif = B,1 - 4,3J + @,9 - 2,1J + ... + A0,2 - 6,1J = 69,31;
i=l
У (Xi - xf = 77,124; q = i . ^^ = 0,4493.
f^ 2 77,124
Из табл. 170 при п = 10 и а = 0,95 имеем go,95 = 0,5311.
Так как q = 0,4493 < go,95 = 0,5311, нулевая гипотеза отклоняется, и ряд значений х%
с достоверностью 0,95 может быть признан случайным.
Для нормальной аппроксимации имеем
Т = -A-0,4493)
21
2 - A - 0,4493)'
= -1,938.
Так как Q* = —1,938 < Wo,o5 = —1,645, то этим критерием нулевая гипотеза отклоня™
ется.
4.3]
Критерии тренда и случайности
519
Теперь применим критерий Кохрана. Для последовательности пар значений щ и ni+i,
равных B,8), C,7), D,5), E,5), F,4), G,3), (8,2), находим значения:
4,3 + 2,1 00 _ 0,9 + 5,2 + 4,8 + 1,2 + 0,8 + 3,0 + 6,1 + 10,2
ж2л = = 3,2 и ж2п = = 4,025;
Z 5
4,3 + 2,1 + 0,9 5,2 + 4,8 + 1,2 + 0,8 + 3,0 + 6,1 + 10,2
жзл = ~ = 2,433 и жзп = ¦ ¦ '- ¦ = 4,471;
О I
Ж4л = 3,125 и Ж4п = 4,35; х%л = 3,46 и х^п = 4,26; Жбл = 3,083 и жвп = 5,025;
ж7л = 2,757 и ж7п = 6,43; ж8л = 2,787 и ж8п = 8,15.
Далее вычисляем
10
=
3,86
_
= 2,264;
= 0?933; Х1 = 0,414; Хе = 2,344; Х7 = 7?339; Х8 = 11,92.
Из табл. 55 находим, что Хо,9бA) — 3,481 и, следовательно, критерий Кохрана при™
знает скачок среднего после щ = 7 наблюдений.
4.3.2. Критерий Фостера-Стюарта
Предложен в [503] и используется для проверки тренда как средних, так и дис-
дисперсий. Статистики критерия имеют вид
г=2
г=2
где
di = щ — li] Si = щ + li]
{1, если Xi > Xi—i, Xi^2i • - - 5 %i] J 1, если Xi < ж^—i, ж^_2, • • •, ^i;
О, в противном случае; [0, в противном случае.
Статистика S используется для проверки тренда в дисперсиях, статистика d —
для обнаружения тренда в средних. Очевидно, что
0 ^ S ^ п ^ 1 и — (п — 1) ^ d ^ п — 1.
При отсутствии тренда величины
= 7 и ^
где Z =
- 3,4253, /= ^2 Inn - 0,8456,
имеют распределение Стьюдента с v = п степенями свободы. Формулы для / и I
применимы при п > 50, их значения при п < 50 приведены в табл. 171.
Таблица 171
Постоянные / и I критерия Фостера^Стюарта [503]
/
I
10
1,964
1,288
15
2,153
1,521
20
2,279
1,677
25
2,373
1,791
30
2,447
1,882
35
2,509
1,956
40
2,561
2,019
45
2,606
2,072
50
2,645
2,121
Если \t\ (\t\) > ti+a., то с доверительной вероятностью а нулевая гипотеза от™
2
сутствия трендов отклоняется (t7 — 7™квантиль распределения Стьюдента).
520
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 276. Проверить гипотезу наличия тренда критерием Фостера-Стюарта для
данных задачи 275.
Анализируя ряд а^, получаем значения переменных щ, U, d% и Si.
Результаты сводим в таблицу:
i
2
3
4
5
6
щ
0
0
1
0
0
1
1
0
0
0
-1
-1
1
0
0
Si
1
1
1
0
0
i
7
8
9
10
щ
0
0
1
1
и
1
0
0
0
d%
-1
0
1
1
Si
1
0
1
1
Далее находим 5 =
/ = 1,964 и I = 1,288.
= 6 и d=^di = O. Из табл. 171 для п = 10 находим
Далее имеем t =
0
= 0 и t =
6 - 1,964^
= 1,663.
1,964 1,288
Для ? i+o,95 = to,975(у = 10) = 2,228 (используем таблицы ^-распределения [24-26])
получаем |?| = 0 (|t| = 1,663) < to,975 = 2,228. Следовательно, наличие тренда не подтвер-
подтверждается имеющимися наблюдениями.
4.3.3. Критерий Кокс-Стюарта
В [504] предложена серия быстрых знаковых критериев тренда среднего и дис-
дисперсии в последовательности наблюдений. Для критерия среднего в выборке объема
п предложена статистика
ы
г=1
гДе
Критерий, основанный на статистике 5i, имеет эффективность « 0,86 по отно™
шению к наилучшему параметрическому критерию.
Для проверки гипотезы тренда применяется нормализованная статистика
При
, где MEi) = ^ и D(Si) =
24
гипотеза тренда среднего отклоняется.
Критерий для проверки гипотезы о тренде дисперсии в выборке строится еле™
дующим образом. Выборка х\, ...,хп разбивается на п/k подвыборок жх, ... ,ж^;
ж^+i, ..., Х2к] %2k+ii • • • 5 хзк] xn-k+ii • • • ? жп (если п не делится на fc, отбрасывается
необходимое число наблюдений в центре). Для каждой г-й подвыборки находится
Ы
размах ш^ A ^ г ^ г) (г = — ). Далее размахи ш^ проверяются на тренд крите™
рием *S*i. Рекомендуется выбирать к из следующих соотношений [504]:
п ^ 90 -^ А; = 5; 90 > п ^ 64 -^ А; = 4; 64 > п ^ 48 -^ к = 3; га < 48 ->> А; = 2.
Эффективность дисперсионного критерия « 0,73.
4.3]
Критерии тренда и случайности
521
Задача 277. Имеется выборочная последовательность (п = 48):
г: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
хц 12 1 2 4 6 9 5 3 14 21 24 29 1 3 7 2
г: 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
ж»: 13 21 14 51 1 0 0 17 21 3 4 6 7 8 9 1
г: 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
хц 2 3 12 11 10 21 74 35 28 24 15 О 1 17 19 1.
Необходимо проверить критериями Кокс-Стюарта гипотезу о тренде среднего и дис-
дисперсии в выборке при доверительной вероятности а = 0,95.
Имеем значения hi}fl-i+i для разных г (г = 1, ..., 24):
г
1
2
3
4
5
6
7
8
п — i + 1
48
47
46
45
44
43
42
41
hi,n — i+l
1
0
0
1
1
0
0
0
п — г + 1
9
10
11
12
13
14
15
16
hi,n — i+l
40
39
38
37
36
35
34
33
п - г + 1
0
0
1
1
0
0
1
0
17
18
19
20
21
22
23
24
гг-г + 1
32
31
30
29
28
27
26
25
hi,n — i+l
1
1
1
1
0
0
0
0
Находим
24
Si = J2 D9 - 2i) ' hi,n^i+i = 47 + 41 + 39 + 27 + 25 + 19 + 15 + 13 + 11 + 9 = 246.
г=1
= «1 = 288;
48 • D82 - 1)
24
= 4606 ("v/D(Si) = 67,867);
Так как \Si\ = 0,619 < 1x0,975 = 1,96, гипотеза тренда отклоняется.
Рассмотрим дисперсионный критерий. Выбираем к = 3 и получаем п/к = 16 подвы-
борок:
12, 1, 2; 4, 6, 9; 5, 3, 14; 21, 24, 29; 1, 3, 7; 2, 13, 21; 14, 51, 1; 0, 0, 17;
21, 3, 4; 6, 7, 8; 9, 1, 2; 3, 12, 11; 10, 21, 74; 35, 28, 24 ; 15, 0, 1 ; 17, 19, 1.
Размахи подвыборок образуют ряд
10, 5, 11, 8, 6, 19, 50, 17, 18, 2, 8, 9, 64, 11, 15, 18.
Для полученного ряда находим значения hi^n-V-
= 0,
= 0,
= 0,
Тогда
= 0, he,11 = 1, /17,10 = 1,
|8- 32|
13,038
= 0,
= 0.
16 '
24
= 130,38;
= 1,84.
Так как \S\ = 1,84 < ito,975 — 1,96, гипотеза тренда отклоняется.
= 170;
522
Проверка гипотез о значениях параметров распределений
[Гл.4
4.3.4. Критерий обнаружения сдвига дисперсии в неизвестном точке
(критерий Хсу)
Предположим, что наблюдаемая нами последовательность х\, ..., хп имеет одно
и то же среднее (оцениваемое медианой ряда тх). Необходимо проверить нулевую
гипотезу Hq о неизменности дисперсии в выборке против альтернативы Н\, утвер-
утверждающей, что значение дисперсии меняется в неизвестной точке.
Условно это можно записать так: проверить гипотезу Hq : af = ... = а^ = erg
(<Jq неизвестно) против гипотезы
Я 2 2 2
г: аг = а2 = ... = ак =
>0),
где к неизвестно (l^fc^n — 1).
В [505] предложен критерий для проверки такой гипотезы, основанный на ста™
тистике
Н =
0 < Я < 1.
(n-
i - mx)
Обычно критерий используется в стандартизированной форме
Н -0,5 _/ттЧ п + 1
Я* =
= , где Т>(Н) =
Если Я* < Яа, то с достоверностью а гипотеза изменения дисперсии отклоня™
ется (Яа —критические значения, приведенные в табл. 172). При п > 30 применима
нормальная аппроксимация На « Ua.
Таблица 172
Критические значения (На) Н*-критерия Хсу [505]
п
2
3
4
5
6
7
8
Доверительная
вероятность
0,90
1,345
1,370
1,343
1,325
1,314
1,306
1,303
0,95
1,397
1,613
1,643
1,650
1,652
1,652
1,651
а
0,99
1,414
1,901
2,083
2,170
2,219
2,251
2,260
п
9
10
15
20
25
30
оо
Доверительная
вероятность
0,90
1,301
1,299
1,294
1,290
1,289
1,287
1,282
0,95
1,650
1,650
1,648
1,647
1,647
1,646
1,645
а
0,99
2,266
2,272
2,289
2,298
2,304
2,308
2,326
Определить точку изменения дисперсии позволяет G™критерий, также рассмо-
рассмотренный в [505]. Его статистика строится следующим образом.
Пусть
к
г=1
п — к1
к = 1,2, ...,п- 1,
где к соответствует искомой точке изменения дисперсии.
Пусть далее о^ есть вероятность, соответствующая условию Fak(n — к^к) = W^,
где F1{f\1 J2)—7™квантиль ^-распределения с /i и /2 степенями свободы. Тогда
4.3]
Критерии тренда и случайности
523
О < G € 1.
статистика искомого критерия есть
п-1
к=1 П~ ~
Гипотеза изменения дисперсии отклоняется с вероятностью а, если G < Ga, где
Ga —критические значения, приведенные в табл. 173.
Таблица 173
Критические значения (Ga) G-критерия Хсу [505]
п
2
3
4
5
6
7
8
Доверительная
вероятность а
0,90
0,895
0,838
0,813
0,800
0,792
0,787
0,783
0,95
0,917
0,898
0,874
0,860
0,852
0,847
0,843
0,99
0,989
0,964
0,948
0,938
0,931
0,927
0,926
те
9
10
15
20
30
100
оо
Доверительная
вероятность а
0,90
0,781
0,779
0,774
0,772
0,770
0,768
0,767
0,95
0,840
0,838
0,833
0,831
0,829
0,826
0,825
0,99
0,921
0,920
0,915
0,913
0,911
0,909
0,908
Значение к, для которого величина
ак - о
максимальна, дает оценку точке
изменения значения дисперсии в наблюдаемом ряду. Мощность критериев Н и G
близка.
Задача 278. Для ряда значений
хс 2, 1, 11, 21, 3, 8, 6, 23, 28, 38, 37 (п = 10)
проверить гипотезу о возможном изменения дисперсии ряда критериями Хсу при
доверительной вероятности а = 0,95.
Находим медиану ряда (напомним, что это средний член ранжированного по возра-
возрастанию ряда, если п — нечетное, и полусумма центральных значений, если п — четное).
Q _|_ 1 1
В нашем случае тх = =9,5.
Далее вычисляем
ю
- 9,5J
Н =
1 • A -9,5J + 2- A1 -9,5J
-9-
A0 ^ 1) • ]Г (а^ ^ 9,5J
9 • [B - 9,5J + A - 9,5J + ... + C7 - 9,5J
= 0,831;
В(Я) =
= °'°1697
= 0,130); Н* =
= 2,546.
Из табл. 172 для а = 0,95 и п = 10 находим JIq,95 = 1,65.
Так как Н* = 2,546 > i?o,95 — 1,65, нулевая гипотеза отклоняется в пользу альтерна-
альтернативы изменения дисперсии ряда.
Вычислим теперь статистику (jr-критерия. Находим значения ил и W% (результаты
сведем в таблицу).
Вероятности at находим из соотнош:ений
Fax (9,1) = 3,979; Fa2(8,2) = 3,778; Fa3 G,3) = 6,358;
Fa4F,4) = 4,582; Fa5E,5) = 5,783; Fa6D,6) = 8,60;
Fa7C,7) = 12,776; Fa8 B,8) = 12,498; Fa9(l,9) = 5,179.
524
Проверка гипотез о значениях параметров распределений
[Гл.4
г
1
2
3
4
UJi
56,25
128,50
130,75
263,00
wt
3,979
3,778
6,358
4,582
г
5
6
7
8
UJi
302,25
307,50
319,75
502,00
Wi
5,783
8,600
12,776
12,498
i
9
10
&i
1314,25
2070,50
Wi
5,179
Следует отметить,что имеющиеся таблицы ^-распределения не столь обширны, что-
чтобы по ним можно было быстро определить значения а&. Мы это сделаем интерполяцией
Fa, однако именно из-за отсутствия и громоздкости таких таблиц G-критерий вряд ли
м:ожет быть рекомендован к широкому применению. Тем не менее, используя наиболее
широкие таблицы ^-распределения и применяя интерполяцию, находим:
аг = 0,5675; а2 = 0,7606; а3 = 0,9151; а4 = 0,9137; а5 = 0,9603; а6 = 0,9872;
1 9
а7 = 0,9595; а8 = 0,9995; а9 = 0,9507 и G =
п — 1
= 0,894.
Так как G = 0,894 > Go
гипотезу.
Рассмотрим теперь ряд
,95
= 0,838 (см. табл. 173), этот критерий отклоняет нулевую
• 0,0675; 0,2606; 0,4151; 0,4137; 0,4603; 0,4872; 0,4595; 0,4995; 0,4507.
Из полученного ряда следует, что к:
= max =
Следовательно, начиная с 8™го члена ряда, дисперсия начинает меняться.
4.3.5. Ранговый критерий обнаружения сдвига дисперсии в неизвестной точке
Критерий Хсу (см. раздел 4.3.4) предполагает нормальность распределения слу™
чайной величины. В [506] рассмотрен критерий для решения аналогичной задачи,
но свободный от распределения. Он основан на исполвзовании семейства ранговых
статистик вида
где Щ —ранги выборочных значений в упорядоченном ряду наблюдений.
Метки критерия ап могут быть различными, например
— метки Клотца (см. раздел 4.2.2.1.4) а\п(г) = U2г ;
п+1
— метки Сэвиджа (см. раздел 4.2.2.1.6) a2n{i) = у* :—г-
Обозначим Sj =
), j = 1,2. При отсутствии сдвига дисперсии в ряду на-
i
блюдений Sj-статистики свободны от распределения и симметричны относительно
ajn{i). При справедливости нулевой гипотезы
г=1
4.3]
Критерии тренда и случайности
525
Статистики критериев имеют вид
S3-M(S3)
Нулевая гипотеза отклоняется с доверительной вероятностью а, если \S*\ < *Sj(a),
где Sj(a) — критические значения, приведенные в табл. 174.
Таблица 174
Критические значения рангового критерия
обнаружения сдвига дисперсии [506]
п
5
10
15
20
25
30
40
50
оо
Доверительная
вероятность а = 0,95
Si
1,915
1,928
1,935
1,939
1,942
1,944
1,947
1,949
1,960
s2
1,905
1,923
1,932
1,937
1,940
1,943
1,946
1,948
1,960
Доверительная
вероятность а = 0,90
Si
1,659
1,654
1,652
1,651
1,650
1,650
1,649
1,648
1,645
s2
1,662
1,656
1,653
1,652
1,651
1,650
1,649
1,648
1,645
При п > 20 справедливо приближение Sj(a) ^ иа (иа — «-квантиль стандарт-
стандартного нормального распределения). Статистика S^ имеет наибольшую эффектив™
ность для распределений симметричного типа, Я| —для распределений, скошенных
вправо. Критерии Sf и S^ не уступают по мощности критерию Хсу (см. раз-
раздел 4.3.4) [505], но не требует знания параметров положения.
Задача 279. Проверить гипотезу изменения дисперсии ряда для данных задачи 278
критериями SI и S^-
Ранги выборочной последовательности составляют ряд
хс 2 1 11 21 3 8 6 23 38 37;
Кц 2 1 6 7 3 5 4 8 10 9.
Находим метки ai,n(i) = и2 г , используя аппроксимацию 15 (см. раздел 1.1.1)
п+1
U j =4,91-
п+1
0,14
Вычисляем последовательно метки а\п и а,2П, сводя результаты в таблицу:
п
1
2
3
4
5
o>i,w(i)
1,7822
0,8217
0,3630
0,1206
0,0129
«2Д0(«)
0,1000
0,2111
0,3361
0,4790
0,6456
г
6
7
8
9
10
ai,ioW
0,0129
0,1206
0,3630
0,8217
1,7822
«2,loW
0,8456
1,0956
1,4290
1,9290
2,9290
526 Проверка гипотез о значениях параметров распределений [Гл. 4
Вычисляем статистики критериев
ю
Si = J2 i ' oi,io(#i) = 1 • ai,ioB) + 2 • ai,io(l) + ... + 10 • ai,ioA0) =
= 0,8217 + 2 • 1,7822 + ... + 10 • 0,8217 = 34,804;
10
S2 = Yli • a2,io(Ri) = 1 • 0,2111 + 2 • 0,1 + ... + 10 • 1,929 = 73,295.
Далее находим
II10 11.fi9П1 1П.11
= 55;
D(S2) = 8,051);
|173,29 — 55| _
8,051 ~~ '
Из табл. 174 имеем Si @,95) = 1,928 и S2@,95) = 1,923.
Так как |SJ| = 0,113 < Si@,95) = 1,928 и |S|| = 2,271 > S2@,95) = 1,923, нулевая ги-
гипотеза отклоняется критерием S2 и не отклоняется критерием Si.
4.3.6. Сериальный критерий случайности
Предположим, имеются две выборки случайных величин х и у. Частичная
последовательность элементов одной из выборок в упорядоченной по возрастанию
объединенной выборке, ограниченная с обеих сторон элементами другой выборки
(на границах последовательности — с одной стороны), называется серией.
Например, последовательность
ж, х, у, у, ж, у, х,х,х, у, у
содержит 6 серий C серии элементов уиЗ серии элементов х).
Последовательность ж, ж, ж, у^у^у содержит две серии (одну элементов х и одну
элементов у). Количество и структура серий характеризует случайность появления
последовательности против альтернативы тренда, т. е. наличия закономерности
в расположении элементов одной выборки.
Например, малое число серий будет указывать на тенденцию объединения эле-
элементов одной выборки в группы, т. е. на неслучайный характер их расположения
в общей последовательности.
Большинство сериальных критериев, основанных на числе и структуре серий,
обладает невысокой мощностью, но требует минимальных расчетов.
4.3.6.1. Критерий Вальда-Волфовитца
Имеется выборка значений случайной величины х в порядке их появления; ж —
выборочная медиана. Значения xi ^ ж обозначаем символом а, а значения Х{ < ж
символом Ь. Статистикой критерия является N — общее число полученных серий
элементов а и Ъ.
Гипотеза случайности ряда принимается с вероятностью а, если ni(a) < N <П2(а);
в ином случае она отклоняется в пользу альтернативы неслучайности ряда.
4.3]
Критерии тренда и случайности
527
Таблица 175
Критические значения N±(ol) и N2@1)
сериального критерия Вальда^Волфовитща [25]
т
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
те
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
4
5
6
7
8
9
10
11
12
13
14
Доверительная
вероятность а
0,90
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
1
1
1
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
1
2
2
2
3
3
3
3
3
3
3
N2
5
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
7
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
9
9
9
10
10
10
10
10
10
10
10
0,95
Nj
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
1
1
2
2
2
2
2
2
3
3
3
N2
5
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
7
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
9
9
10
10
10
10
10
10
10
10
10
m
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
6
6
6
6
6
6
6
6
6
7
7
7
7
7
7
7
7
7
7
те
15
16
17
18
19
20
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
7
8
9
10
11
12
13
14
15
16
Доверительная
вероятность а
0,90
Nt
3
4
4
4
4
4
2
3
3
3
3
3
4
4
4
4
4
4
4
5
5
5
3
3
3
4
4
4
4
5
5
5
5
5
5
6
6
3
4
4
4
4
4
15
15
15
16
N2
10
10
10
10
10
10
10
10
11
11
12
12
12
12
12
12
12
12
12
12
12
12
11
12
12
13
13
13
13
14
14
14
14
14
14
14
14
13
13
14
14
14
14
15
15
15
16
0,95
JVi
3
3
3
3
3
3
2
см
2
3
3
3
3
3
3
3
4
4
4
4
4
4
2
3
3
3
3
4
4
4
4
4
4
4
5
5
5
3
3
4
4
4
4
5
5
5
5
N2
10
10
10
10
10
10
10
11
11
12
12
12
12
12
12
12
12
12
12
12
12
12
12
12
13
13
13
14
14
14
14
14
14
14
14
14
14
13
14
14
15
15
15
16
16
16
16
528
Проверка гипотез о значениях параметров распределений
[Гл.4
Продолжение таблицы 175
т
7
7
7
7
8
8
8
8
8
8
8
8
8
8
8
8
8
9
9
9
9
9
9
9
9
9
9
9
9
10
10
10
10
10
10
10
10
10
10
10
11
11
11
11
11
11
11
11
11
п
17
18
19
20
8
9
10
11
12
13
14
15
16
17
18
19
20
9
10
11
12
13
14
15
16
17
18
19
20
10
11
12
13
14
15
16
17
18
19
20
11
12
13
14
15
16
17
18
19
Доверительная
]
0,
Nj
16
16
16
16
14
14
15
15
16
16
16
16
6
7
7
7
7
5
5
6
6
6
7
7
7
7
8
8
8
6
6
7
7
7
7
8
8
8
8
9
7
7
7
8
8
8
9
9
9
зероятность а
ЭО
N2
16
16
16
16
14
14
15
15
16
16
16
16
17
17
17
17
17
15
16
16
16
17
17
18
18
18
18
18
18
16
17
17
18
18
18
19
19
19
20
20
17
18
19
19
19
20
20
20
21
0,95
Nt
5
5
6
6
4
4
4
5
5
5
5
5
6
6
6
6
6
4
5
5
5
6
6
6
6
7
7
7
7
5
5
6
6
6
7
7
7
7
8
8
6
6
6
7
7
7
8
8
8
N2
16
16
16
16
14
15
15
16
16
17
17
17
17
18
18
18
18
16
16
17
17
18
18
18
18
19
19
19
19
17
18
18
19
19
19
20
20
20
20
20
18
19
19
20
20
21
21
21
22
т
11
12
12
12
12
12
12
12
12
12
13
13
13
13
13
13
13
13
14
14
14
14
14
14
14
15
15
15
15
15
15
16
16
16
16
16
17
17
17
17
18
18
18
19
19
20
21
22
23
п
20
12
13
14
15
16
17
18
19
20
13
14
15
16
17
18
19
20
14
15
16
17
18
19
20
15
16
17
18
19
20
16
17
18
19
20
17
18
19
20
18
19
20
19
20
20
21
22
23
Доверительная
вероятность а
0,90
Nt
9
7
8
8
8
9
9
9
10
10
8
9
9
9
10
10
10
10
9
9
10
10
10
11
11
10
10
11
11
11
12
11
11
11
12
12
11
12
12
13
12
13
13
13
13
14
15
16
16
N2
21
19
19
20
20
21
21
21
22
22
20
20
21
21
22
22
23
23
21
22
22
23
23
23
24
22
23
23
24
24
25
23
24
25
25
25
25
25
26
26
26
26
27
27
27
28
28
29
31
0,95
8
7
7
7
8
8
8
8
9
9
7
8
8
8
9
9
9
10
8
8
9
9
9
10
10
9
9
10
10
10
11
10
10
10
11
11
10
11
11
11
11
12
12
12
12
13
14
14
15
N2
22
19
20
21
21
22
22
22
23
23
21
21
22
22
23
23
24
24
22
23
23
24
24
24
25
23
24
24
25
25
26
24
25
26
26
26
26
26
27
27
27
27
28
28
29
29
29
31
32
4.3]
Критерии тренда и случайности
529
Окончание таблицы 175
т
24
25
26
27
28
29
30
31
32
33
34
35
36
37
п
24
25
26
27
28
29
30
31
32
33
34
35
36
37
Доверительная
вероятность а
0,90
Nt
17
18
19
20
21
22
22
23
24
25
26
27
28
29
N2
32
33
34
35
36
37
39
40
41
42
43
44
45
46
0,95
Nt
16
17
18
19
19
20
21
22
23
24
24
25
26
27
N2
33
34
35
36
38
39
40
41
42
43
45
46
47
48
m
38
39
40
41
42
43
44
45
46
47
48
49
50
n
38
39
40
41
42
43
44
45
46
47
48
49
50
Доверительная
вероятность а.
0,90
Ni
30
30
31
32
33
34
34
36
37
38
38
39
40
N2
47
49
50
51
52
53
54
55
56
57
59
60
61
0,95
Nt
28
29
30
31
31
32
33
34
35
36
37
38
38
N2
49
50
51
52
54
55
56
57
58
59
60
61
63
Критические значения п\{а) и П2{сх) приведены в табл. 175. Если т и п —
соответственно количества элементов а и Ъ в последовательности, то при га, п > 20
справедлива аппроксимация
2тп
N -
N* =
+ 1
2тпBтп ~~ т — п)
(га + пJ(т + П — 1)
имеющая стандартное нормальное распределение. Тогда нулевая гипотеза откло-
отклоняется с достоверностью а, если \N*\ > ui+a .
Задача 280. Для ряда значений задачи 278 проверить гипотезу случайности ряда
наблюдений критерием Вальда-Волфовитца при доверительной вероятности а = 0,90.
О _|_ 1 1
Имеем медиану ряда х = =9,5. Обозначим символом а значения Xi < x и сим-
символом Ъ значения х% > х. Получаем ряд символов
а, а, 6, 6, а, а, а, 6, 6, Ь.
В нашем случае имеем т = 5 элементов а и п = 5 элементов Ъ. Всего имеем N = 4
серии элементов — две серии элементов а и две серии элементов Ь.
Из табл. 175 для т = п = Ь и а = 0,90 находим гц = 2 и п2 = 10. Таким образом,
fii = 2<JV = 4<fi2 = Ю, и ряд признается случайным. Следует отметить малую мощ-
мощность таких критериев (их рекомендуется применять при т,п> 50). Для нормальной
аппроксимации имеем
M(N) =
+ 1 = 6; T>(N) =
2-5-5-B-5-5-5-5)
E + 5J • E + 5™ 1)
= 2,222 (y/T)(N) = 1,491);
что меньше ui+a = ti.0,95 = 1,645; следовательно, гипотеза принимается.
2
530
Проверка гипотез о значениях параметров распределений
[Гл.4
4.3.6.2. Критерий Рамачандрана-Ранганатана
В отличие от критерия Вальда—Волфовитца (см. раздел 4.3.6.1) настоящий
критерий учитывает не только количество, но и длины серий (количества элементов
в сериях). Статистика критерия имеет вид
где j— длина серии, п — объем выборки; rij —количество серий длины j.
Гипотеза случайности не отклоняется с вероятностью а при R < R(a). Критиче-
Критические значения R(a) приведены в табл. 176. Критерий обладает большей мощностью
по сравнению с iV-критерием Вальда-Волфовитца.
Таблица 176
Критические значения Ж(о)
критерия Рамачандрана—Ранганатана [14]
п
6
8
10
12
14
16
18
Доверительная
вероятность а
0,90
18
26
34
38
46
54
68
0,95
18
32
38
44
52
60
78
0,99
18
32
50
58
68
80
90
п
20
22
24
26
28
30
Доверительная
вероятность а
0,90
68
76
84
92
98
106
0,95
78
86
94
102
110
118
0,99
100
108
118
128
136
146
Задача 281. Для данных задачи 278 проверить гипотезу случайности ряда критерием
Рамачандрана-Ранганатана.
Имеем две серии элементов длины j = 2 (пг = 2) и две серии элементов длины j = 3
(гс3 = 2). Тогда R = J^f • % = 4 • 2 + 9 • 2 = 26.
з
Из табл. 176 для п = 10 и а = 0,95 имеем R@, 95) = 38.
Так как R = 26 < #@,95) = 38, ряд значений xi признается случайным, а альтерна-
альтернатива тренда отклоняется.
4.3.6.3. Сериальный критерий ЕПахнесси
Критерий Шахнееси [510] является множественным аналогом критерия Вальда™
Волфовитца (см. раздел 4.3.6.1). Если в критерии Вальда^Волфовитца рассматри-
рассматривается количество серий элементов двух „сортов", то критерий Шахнееси предпола-
предполагает анализ серий элементов к „сортов" (к ^ 2). Это делает его более эффективным,
так как позволяет противостоятв большему количеству альтернатив (сдвиг, колеба-
колебания, изменения в определенной точке).
Статистикой критерия остается, как и ранее, N — общее количество серий эле-
элементов. Если количество серий
N<Na(n>,k),
то гипотеза случайности отклоняется с вероятностью а (здесь Na(rii^ к) — критиче-
критические значения, приведенные в табл. 177). В табл. 177 приняты следующие обозна™
чения: rii (г = 1, ..., к) —количество элементов г™го „сорта", к — количество „сортов"
элементов, составляющих ряд.
4.3]
Критерии тренда и случайности
531
Таблица 177
Критические
к
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
и
К
4
4
4
4
4
4
4
4
4
4
4
4
4
и
К
5
5
5
5
5
т
4
4
5
6
6
7
8
8
9
9
п2
4
5
5
6
7
7
8
9
9
10
т
2
q
q
4
с
б
б
711
2
2
2
2
3
3
3
3
4
4
4
4
5
П\
2
2
2
2
2
[
[
[
i значения
а
0,95
2
2
3
3
4
4
5
5
6
6
те2
3
3
3
4
4
4
5
5
5
6
6
6
7
те2
2
2
2
3
3
3
3
4
4
4
4
5
5
П2
2
2
2
2
3
0,9С
Z
(
(
тез
3
3
4
4
4
5
5
5
6
6
6
7
7
тез
3
3
3
3
4
4
4
4
с
1
1
тез
2
2
2
3
3
S
2
4
4
7
г
м-
к
2
2
2
2
2
2
2
2
2
2
п
к)
п\
10
11
11
12
12
13
13
14
15
16
критерия
те2
11
11
12
12
13
13
14
14
15
16
а
0,95
те4
те4
2
2
3
3
3
2
3
3
3
3
4
4
4
4
5
5
5
5
3
4
4
5
5
6
7
7
8
8
9
9
10
0,90
4
4
5
5
6
7
7
8
8
9
10
10
11
а
0,95
4
5
5
6
7
7
8
9
9
10
11
11
12
п5
2
3
3
3
3
0,90
5
5
6
7
7
8
9
9
10
11
11
12
13
а
0,95
6
7
8
8
9
0,90
7
7
8
9
9
Шахнесси
а
0,95
7
7
8
8
9
9
9
10
11
11
3
3
3
3
3
3
3
3
3
3
3
3
3
и
К
4
4
4
4
4
4
4
4
4
4
4
4
i,
Гъ
5
5
5
5
5
0,90
8
8
9
9
9
10
10
11
12
12
711
7
7
7
8
8
8
9
9
10
10
10
11
11
т
5
5
5
6
6
6
6
7
7
7
7
8
711
3
3
3
3
3
к
2
2
2
2
2
2
2
2
2
2
те2
7
8
8
8
9
9
9
10
10
11
11
11
12
п2
те<2
3
3
3
3
4
5
5
6
6
6
6
7
7
7
7
S
3
для
711
16
17
18
19
20
21
22
23
24
25
тез
77
8
8
8
9
9
9
10
10
11
11
11
12
тез
(
(
(
(
<
<
(
тез
3
3
3
4
4
7
7
7
7
к
2
п2
17
18
19
20
20
21
22
23
24
25
510]
а
0,95
12
13
14
14
15
16
17
17
18
19
0,90
13
14
15
16
16
17
18
19
20
21
0,95
те4
Т14
3
3
4
4
4
6
6
6
6
7
7
7
7
8
8
8
8
11
11
12
12
13
13
14
15
16
16
17
18
19
0,90
11
12
13
13
14
14
15
16
17
17
18
19
20
а
0,95
13
13
14
15
15
16
17
17
18
19
19
20
п5
3
4
4
4
4
0,90
13
14
15
15
16
17
17
18
19
20
20
21
а
0,95
10
10
11
12
12
0,90
10
11
12
12
13
532
Проверка гипотез о значениях параметров распределений
[Гл.4
и
к
5
5
5
5
5
5
5
5
4
4
4
4
4
5
5
5
4
4
4
4
5
5
5
5
из
4
4
4
5
5
5
5
5
4
4
5
5
5
5
5
6
4
5
5
5
5
5
6
6
а
0,95
13
14
15
15
16
17
18
18
0,90
14
15
15
16
17
18
18
19
i,
к
5
5
5
5
5
5
5
5
П\
5
5
6
6
6
6
6
7
О к о н ч
Т12
5
6
6
6
6
6
7
7
6
6
6
6
6
7
7
7
ание таблицы 177
6
6
6
6
7
7
7
7
6
6
6
7
7
7
7
7
а
0,95
19
20
21
21
22
23
23
24
0,90
20
21
21
22
23
24
24
25
Задача 282. Дан ряд наблюдений над случайной величиной
хц 12, 8, 6, 0, -4, -3, 1, -2, -6, -10, 8, 4, 2, -1, 5, 15, 21, 32.
Необходимо проверить гипотезу случайности ряда критерием Шахнесси при довери-
доверительной вероятности а = 0,95.
Элементам, для которых Xi < 0, присвоим код а; элементам, у которых 0 ^ Xi ^ 7,
присвоим код 6, а элементам, для которых х% > 7, присвоим код с. Тогда получаем ряд
с^с, 6,6, а,а^ 6, а^а^а, с, 6,6, а, 6, с, с.
Видим, что общее количество серий равно 10 C серии элементов с, 3 серии элементов а
и 4 серии элементов 6). Количества элементов равны п\ =6 (а), П2 = 6 F) ипз = 6 (с).
В табл. 177 для к = 3, гц = 6, П2 = 6 и пз = 6 при а = 0,95 находим па = 9.
Так как п = 10 > па = 9, гипотеза случайности не отклоняется.
4.3.6.4. Критерий Олмстеда
Олмстедом [509] рассмотрена серия критериев случайности, так лее, как и в слу-
случае критерия Рамачандрана-Ранганатана (см. раздел 4.3.6.2) учитывающих длины
серий. В критериях Олмстеда рассматриваются экстремальные длины серий одного
вида, вероятность появления которых связывается с возможным присутствием
тренда в исследуемых рядах. Олмстедом предложено четыре варианта критерия:
наибольшая длина Х\ серии, лежащей по какую-либо одну сторону от медианы;
наибольшая длина \ч серии, лежащей по одну (заранее выбранную) сторону от
медианы; кратчайшая Х^ из обеих наибольших длин серий, лежащих по разные
стороны от медианы; кратчайшая Х± из обеих наибольших длин серий, лежащих по
разные стороны от точки раздела, максимизирующей Х±-
Во всех вариантах для заданных Xi (г = 1,2,3,4) на уровне значимости а ста-
статистикой критерия Олмстеда является наименьший объем выборки п. Гипотеза
случайности отклоняется при п < na(Xi). Критические значения na(Xi) приведены
в табл. 178.
Задача 283. Для ряда наблюдений
Xi : 13, 8, 7, 4, 10, 17, 21, 34, 48, 1, 0, 12, 10, 4, 16, 17, 11, 0, 1, 3, 12, 54, 16, -1
(ji = 24) проверить гипотезу случайности критерием Олмстеда на уровне значимости
а = 0,1.
Находим медиану ряда х = 11. Для значений ряда Xi ^ х примем индекс а, а для
значений х% < х — индекс 6. Получаем ряд
а, 6, 6, 6, 6, а, а, а, а, 6, 6, а, 6, 6, а, а, а, 6, 6, 6, а, а, а, 6,
4.3]
Критерии тренда и случайности
533
в котором 5 серий элементов а и 5 серий элементов Ь, причем h = 4, h = 4, 1з = 4. Из
табл. 178 для а = 0,1, h = I2 = /3 = 4 находим n(h) = 8, п(/г) = 10 и пAз) = 14. Так как
п = 24 > n(Zi), n(h), пAз), то всеми критериями гипотеза случайности не отклоняется.
Легко убедиться, что и последний критерий (I4) также отклоняет гипотезу тренда.
Таблица 178
Критические значения na(li) критерия случайности Олмстеда [24]
/*
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Уровень значимости а
0,10
n(h)
4
6
8
14
20
32
52
86
150
262
500
962
1876
3670
7330
14090
27900
555000
1111000
n(h)
4
6
10
16
26
44
78
142
256
480
930
1838
3630
7160
14190
28100
56100
117300
235000
n(h)
4
8
14
26
50
98
194
390
782
1182
2360
4720
9450
18900
37800
75600
151200
30200
60500
n(h)
4
8
12
18
34
58
108
204
400
790
1568
3130
6220
12490
25000
49900
99900
199800
400000
0,01
n(h)
4
6
8
10
12
16
22
32
42
62
94
156
254
418
766
1472
2860
5570
10860
n(h)
4
6
8
10
14
18
26
38
56
86
140
234
410
748
1446
2830
5530
10860
21500
n(h)
4
6
8
12
20
34
62
116
216
446
884
1762
3510
6990
13930
27900
55500
111000
222000
n(h)
4
6
8
12
16
24
38
66
118
228
444
878
1750
3480
6790
13865
27700
55400
110800
4.3.6.5. Критерий числа серий знаков первых разностей
Для выборки #i, #2, • • • 1 хп вычисляем (п — 1) значений вида
— 1, если Xi+i < Х{\
z% = \ +1, если xi+i > Xi\
0, если я^+i = Х{.
В ряду значений Z{ фиксируем количество серий R, которое и является стати™
стикой рассматриваемого критерия.
Гипотеза случайности ряда не отклоняется при Ri(a) < R < ^(а). Критиче-
Критические значения R\(a) и R^(а) приведены в табл. 179. При п > 30 распределе-
распределение R удовлетворительно аппроксимируется нормальным распределением со сред™
и дисперсией D(.R), где M.(R) = —-—; D(i?) = — . Тогда нулевая
гипотеза проверяется критерием \R*
\R-M(R)\
и при
90
IR* I
гипотеза
случайности отклоняется.
Хальд [51], Уоллис и Мур [413] дополнили критерий числа серий рассмотрением
длин серий знаков + и —. Вероятность появления серий длины I при справедливости
гипотезы случайности ряда равна
2
n
n
(l-
- 1
f 1)!
(
-I
1 +
- 1
2)!
1-2
ЬЗ)!
534
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 179
Критические значения JRi(o) и jR2(ok)
критерия числа серий знаков первых разностей [57]
п
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Ri
1
1
2
2
2
2
4
4
5
5
6
6
7
7
8
8
9
10
10
11
11
12
13
13
14
Доверительная
вероятность а
0,95
Д2
10
11
12
13
14
14
15
16
17
17
18
19
20
20
21
22
23
23
24
0,90
Ri
1
1
2
2
2
3
4
4
5
6
6
7
7
8
8
9
10
10
11
11
12
13
13
14
14
Д2
10
11
12
12
13
14
15
15
16
17
18
18
19
20
21
21
22
23
24
п
30
32
34
36
38
40
42
44
46
48
50
52
54
56
58
60
62
64
66
68
70
80
90
100
Ri
14
15
17
18
19
20
21
23
24
25
26
27
29
30
31
32
34
35
36
37
38
45
51
57
Доверительная
вероятность а
0,95
«2
15
26
28
29
31
32
34
35
37
38
40
41
43
44
45
47
48
50
51
53
54
61
68
75
0,90
Ri
15
16
17
19
20
21
22
23
25
26
27
28
30
31
32
33
35
36
37
38
40
46
52
58
д2
24
26
27
29
30
32
33
34
36
37
39
40
42
43
44
46
47
49
50
52
53
60
67
74
Критерий с учетом длин серий основан на статистике
2 _ V^ [п* ~ nP(l)f
Х ^ ^ прA) '
где суммирование ведется для I = 1,2 и ^ 3 (щ —количество серий длины I, рA) -
вероятность появления серии длины I). В частности,
(
гс V 6
24
120
-; рC) = 1-
7 — 15п
12гс *
Правило проверки нулевой гипотезы формулируется следующим образом:
— при х2 ^ 6,3 нулевая гипотеза отклоняется с вероятностью а, если %2 > %2 B,5),
где %2B,5) — а-квантиль распределения хи-квадрат с / = 2,5 степенями свободы;
— при у2 < 6,3 нулевая гипотеза отклоняется, если у2 > -у2B).
6
4.3 ] Критерии тренда и случайности 535
Задача 284. Проверить гипотезу случайности ряда из задачи 283 критерием числа
серий знаков первых разностей при доверительной вероятности а = 0,95.
Ряд знаков первых разностей имеет вид (п = 24):
Из него получаем число серий R = 9 E серий „—" и 4 серии „+").
Из табл. 179 для п = 24 и а = 0,95 имеем Кг = 11 и R2 = 20.
Так как R = 8 < Ri = 11, гипотеза случайности выборки х отклоняется.
Для нормальной аппроксимации имеем
М(Д) = 2'24^г = 15,67; D(R) = W ' 2*~ 29 = 3,944 [л/ЩЩ = 1,986);
= |11-15,7| = Зб6
1 1,986
Так как \R*\ = 2,366 > tto,975 = 1,96, то и этот критерий отклоняет гипотезу случай-
случайности ряда.
Рассмотрим теперь критерий с учетом длин серий. Вычисляем
= 5-24 + 1 = = 11-24-14 = оД736; р [> 3) = 1-0,42-0,1736 = 0,4064.
f\ ) 12-24 ' ' FX J 60-24 ' ' FX^ }
В нашем случае имеются гц = 1 серия длины I = 1, пг = 5 серий длины I = 2 и пз = 3
серии длины 1 = 3. Находим
2 V^hl~^'P@12 (l-24-Q,42J E - 24-0,1736J C - 24 • 0, 4046J
Y = > тт^^ = Ь h — = 12, 983.
^ п-рA) 24 -0,42 24-0,1736 24-0,4046
Так как %2 > 6,3, то используем критическое значение Хо,9бB,5) = 6,903.
Из того, что х :=: 12,983 > Хо,95B,5) = 6,9, следует, что и этот критерий отклоняет
гипотезу случайности.
4.3.7. Критерий инверсий
Если в выборке значений #i,#2, ¦•¦,жп, записанных в порядке их появле™
ния, за некоторым значением Х{ следует меньшее по величине (т.е. Xi > Xj, где
г + 1 ^ j ^ п), то имеет место инверсия. Общее число инверсий J в выборке является
статистикой критерия случайности полученных значений х [14]. Иногда рассматри™
вают статистику Т, определяемую числом обратных инверсий (когда Х{ < Xj, j > г).
Статистика Т совпадает со статистикой U Манна-Уитни (см. раздел 4.2.1.1.2.2),
и ее критическое значение может быть определено по табл. 143 этого критерия.
В качестве третьей меры можно использовать величину К = Т — /, критические
значения которой приведены в работе Кендалла [422].
При п ^ 20 статистика J распределена приблизительно нормально со средним
МA) и дисперсией DG), где
Щ1) = п^1. р 2n3+3n2-5n_
4 11
При |/*| = ^ ui+a. гипотеза случайности отклоняется с вероятно™
стью а. Точные критические значения I\{ol) и /2(tt) приведены в табл. 180 — ги-
гипотеза случайности принимается, если
h(a) < I < 12(а).
Критерий имеет асимптотическую эффективность уЗтг ~ 0,98 относительно
критерия коэффициента регрессии. Следовательно, по эффективности он превос-
превосходит большинство непараметрических критериев для тренда.
536
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 180
Критические значения /i(ck) и /г(ск) критерим инверсий [14]
п
10
12
14
16
18
20
30
Доверительная
вероятность а
0,90
h
13
21
30
41
54
69
171
h
31
44
60
78
98
120
263
0,95
h
11
18
27
38
50
64
162
h
33
47
63
81
102
125
272
n
40
50
60
70
80
90
100
Доверительная
вероятность а
0,90
h
319
514
756
1045
1382
1766
2198
h
460
710
1013
1369
1777
2238
2751
0,95
h
305
495
731
1014
1344
1721
2145
h
474
729
1038
1400
1815
2283
2804
Задача 285. Проверить гипотезу случайности ряда
хц 13, 8, 7, 4, 10, 17, 21, 34, 48, 1, 12, 9, 3, 18, -1, -3, 49, 50, 0, 14
критерием инверсий при доверительной вероятности а = 0,95.
Определяем количества инверсий / для различных значений Жг5 результаты сведем
в таблицу:
г
1
2
3
4
5
6
7
Xi
13
8
7
4
10
17
21
I
11
7
6
5
6
8
9
г
8
9
10
11
12
13
14
Xi
34
48
1
12
9
3
18
I
9
9
3
5
4
3
4
г
15
16
17
18
19
Xi
-1
^3
49
50
0
I
1
0
2
2
0
Сумма инверсий равна /= 11 + 7+... + 2 + 0 = 94. Из табл. 180 для п = 20 и а = 0,95
имеем /i = 64 и /2 = 272.
Так как Д = 64 < / = 94 < /2 = 272, гипотеза случайности не отклоняется.
Используем теперь нормальную аппроксимацию, для чего находим
- 3 •
- 5 • 20
\Г
72
|94 — 95|
= 237,5 (VD(J) = 15,411);
= 0,065.
15,411
Так как |/*| = 0,065 <С 11-0,975 = 1?96, гипотеза случайности также уверенно не откло-
отклоняется.
4.3.8. Критерий автокорреляции
Если выборка значений х случайна, то значение каждого ее элемента не должно
зависеть от величины предшествующего и последующих членов. Для проверки этой
независимости используется статистика [36]
+
4.3]
Критерии тренда и случайности
537
являющаяся коэффициентом корреляции первого порядка между элементами пер™
вичной выборки (жх, #2, • • •, %п) и элементами выборки, полученной из нее сдвигом
на одну единицу (х2,х3, ...,xn,xi).
Гипотеза случайности ряда принимается с вероятностью а при r[ n(pt) < Г\^п <
< т'-1п{а). Критические значения коэффициентов автокорреляции r[ n{pt) и т'^п(а)
приведены в табл. 181.
Таблица 181
Критические значения г[^п(а,) и г"^п((ж) критерия автокорреляции [22, 511]
п
5
10
15
20
25
30
35
Доверительная вероятность а
0,95
Г1,п
-0,753
-0,564
-0,462
-0,399
-0,356
-0,324
-0,299
Г1,п
0,253
0,360
0,328
0,299
0,276
0,257
0,242
0,99
-0,798
-0,705
-0,597
-0,524
-0,473
-0,433
-0,401
Г1,п
0,297
0,525
0,475
0,432
0,398
0,370
0,347
п
45
50
55
60
65
70
75
Доверительная вероятность а
0,95
Г1,п
-0,262
-0,248
-0,236
-0,226
-0,217
-0,209
-0,201
Г1,п
0,218
0,209
0,201
0,193
0,186
0,180
0,174
0,99
Г1,п
-0,356
-0,339
-0,324
-0,310
-0,298
-0,287
-0,276
Г1,п
0,313
0,300
0,288
0,277
0,267
0,258
0,250
При п ^ 75 величину ri?n можно считать распределенной асимптотически нор™
мально со средним M(ri?n) и дисперсией D(ri?n), где
М(п,„) = -
D г,„) =
; D г,„) = \ 2.
п — L (п + 1)(п — 1)
Поэтому критерий случайности может быть записан в форме
П,п -М(Г,П)
< Ul+a .
2
D(r,n)
Среди других удачных нормализующих преобразований укажем результаты
— Люнга-Бокса [500]: rj п = \ ^ \
^Морана [551]: r*n(n — 1)^
[501]: r\ n =
п-1
1,п + 1
п-2 '
п- 1
1).
Для более сложных альтернатив (например, периодические колебания ряда)
более эффективны различные модификации критериев автокорреляции. Укажем
на некоторые из них.
Сумма коэффициентов корреляции первого и второго порядков [513]
п—1 п—2
]Р (Xi - X)(xi+1 - Х) + ]Р (Xi - ж)(Жг+2 - Ж)
(Xi - X)
имеющая при п ^ 20 приближенно нормальное распределение со средним
и дисперсией DfVi^), где
М(п,2) = —
(п- 1)'
¦ 15п + 28?г - 34
п(п-
538
Проверка гипотез о значениях параметров распределений
[Гл.4
Линейная комбинация сериальных коэффициентов
П =
/ -J ^ % '
также аппроксимирующаяся нормальным распределением со средним М(г/) =
= "" Y1 ~( ТТ и дисперсией, приведенной в таблице для различных п:
П ^ = ^ Ъ\ТЬ 1)
п
D(n)
10
0,041
16
0,036
32
0,027
64
0,018
Во всех случаях при п ^ 20 справедливо следующее решение: если г* 2 =
|Г1,2 - М(П,2)| , . * rt — v'MI I ^
i !„* _ I \ "''ta, то нулевая гипотеза случайности
/D(n)
ряда отклоняется.
Задача 286. Проверить гипотезу случайности ряда значений ж, заданных в зада-
задаче 285, критерием автокорреляции при доверительной вероятности а = 0,95.
Находим
20 \ 19
53 ж* = 98956; J]
i=l J i=l
= 5638; J2 хг = Ю254;
г=1
20 • 5638 - 98596 + 20 _
f on =
20 - 10254 - 98596
Из табл. 181 находим ri!20@,95) = ^0,399 и riJ0@,95) = 0,299.
Так как ri;20@,95) = -0,399 < 74,20 = 0,167 < ViJ0@,95) = 0,299, гипотеза случайно™
сти не отклоняется.
Используем теперь аппроксимацию. Имеем
1 20-17
М(п,2о) = ^ = ^0,526; D(ri,20) = ^j^ = 0,0448
, , [0,167 + 0,05261
г 1 on = = 1.UJ7.
1,20 | 0^12
= 0,212);
Так как |r*iJo| — 1,037 < 1x0,975 — 1,96, нулевая гипотеза не отклоняется.
Применим теперь модификацию коэффициента сериальной корреляции. Вычисляем
{xi+2 - Х)
Г-1,2 =
20 19
х = 15,7; ]Г (xi -х) = 5324,3; ]Г (Xi - х) • (xi+1 - х) = 902,61;
Окончательно имеем
902,61 - 1442,8
Г-1,2 =
5324,3
xi - х) • (жг+2 - ж) = 1442,88.
2-20-31
= -0,1014; М(п,2) = = 0,0973;
4.3]
Критерии тренда и случайности
539
2 • 204 - 13 • 203 + 15 • 202 +28-20-34
202 • 19*21
= 0,07338 (у/Т>(п,2) = 0,2709);
—0,101 + 0,097|
= 0,054.
0,0733
Так как |r*ij2| = 0,054 < 110,975 = 1,96, гипотеза случайности ряда принимается.
4.3.9. Критерии ранговой корреляции
4.3.9.1. Критерий Вальда-Волфовигца [514]
Пусть Ri — ранг наблюдения Xi в упорядоченном по возрастанию ряду значе-
значений #i,#2, ... ,хп. В качестве аналога критерия сериальной корреляции (см. раз™
дел 4.3.8) известен коэффициент ранговой сериальной корреляции Вальда^Волфо-
витца [512, 514]
П—1 / \ / N
R _ у^ (R,_ п+г\ (R. п + 1
г=1 ^ ^ ^
При п > 20 распределение R асимптотически нормально [514, 515] со средним
~M(R) и дисперсией D(RI где
Тогда если \R*
М(Д) = 0; B(R) =
\R\
п2(п -
- 3)Erc + 6)
720
a, то с вероятностью а гипотеза случайности
отклоняется. Для распределений нормального типа асимптотическая эффектив-
эффективность R-критерия ^ 0,91 по отношению к сериальной корреляции первого порядка
(см. раздел 4.3.8), для любых других распределений — не менее 0,86 [512].
Задача 287. Проверить гипотезу случайности ряда значений, заданных в задаче 284,
критерием ранговой автокорреляции при доверительной вероятности а = 0,95.
Имеем ряд х% (ъ — порядковый номер х% в последовательности, Ri — ранг х% в после-
последовательности) :
г
1
2
3
4
5
Xi
13
8
7
4
10
Rt
12
8
7
6
10
i
6
7
8
9
10
хг
17
21
34
48
1
Ri
14
16
17
18
4
г
11
12
13
14
15
Xi
12
9
3
18
-1
Ri
11
9
5
15
1
г
16
17
18
19
20
хг
^3
49
50
0
14
Ri
2
19
20
3
13
Вычисляем
19
20 + 1
Ri+l —
20+1
= A2 - 10,5) • (8 - 10,5) • • • C - 10,5) • A3 - 10,5) = 35,25;
202 -21 • 17- E ¦ 20 + 6)
720
= 21033,3 (л/ЩЩ = 144,99);
144,99
и гипотеза случайности не отклоняется.
35 25
\R*\ = 7777^ = °'249 < «о,975 = 1,96,
540
Проверка гипотез о значениях параметров распределений
[Гл.4
4.3.9.2. Критерий Бартелса
Пусть Ri—ранг г-го наблюдения в последовательности п наблюдений Х{. Бар-
телсом [516] рассмотрен ранговый критерий случайности ряда, основанный на
статистике
В =
При совпадении элементов выборки ранги следует случайным образом распре™
12 12
делить среди них. Значение В заключено в интервале —; г < В < 4 -, г.
п(п + 1) п(п + 1)
В пределе при п —> оо имеем 0 < В < 4. Моменты распределения В рав-
равны [516]: М(В) = 2; ТУ (В) =
пределения В равен «з = ~
4(п-2)Eп -2п^
12
i, коэффициент эксцесса «4
. Коэффициент асимметрии рас™
798
. Отсюда
v 17bn
следует, что распределение симметрично, но медленно стремится к нормальному
эксцессу.
Гипотеза случайности отклоняется на уровне значимости а, если B — Ва) <
< В < (Ва + 2). Критические точки Ва определяются по формуле [516] Ва = а +
+ bnc(\nn)d^ где a^b^c^d — коэффициенты, приведенные в табл. 182.
Таблица 182
Коэффициенты аппроксимации критического
значения критерия Бартелса
(а — уровень значимости) [516]
а
а
b
с
d
0,01
-0,023
0,261
-0,345
2,212
0,025
-0,004
0,381
-0,266
1,748
0,05
0,119
0,440
-0,230
1,520
0,1
-0,465
1,184
-0,088
0,674
4 20
При п -Л оо М(Л) = 2 и ТУ (В) = —, или более точно ТУ (В) = .
При п > 100 критерий приобретает вид В* =
В^Ш(В)
Если |В*| < ui+g, то гипотеза случайности не отклоняется.
2
Задача 288. Проверить гипотезу случайности ряда значений, заданных в задаче 285,
критерием Бартелса,
Вычисляем (используем ранги, приведенные в задаче 287)
1
-
п
г) 4-1
= 10,5;
= A2 - 8J + ... + C - 13J = 1327;
= A2 - 10,5J + ... + C - 10,5J = 614,5;
4.3]
Критерии тренда и случайности
541
в =
1327
614,5
= 2,159.
При п = 20 и а = 0,05 из табл. 182 имеем а = 0,119; Ь = 0,440; с = ^0,230 и d = 1,520.
Тогда Во,о5 = 0,119 + 0,440 • 20^0'230 • (In 20I'520 = 1,29.
Так как B - 1,29) = 0,71 < В = 2,159 < B + 1,29) = 3,29, гипотеза случайности не
отклоняется.
4.3.10. Критерий кумулятивной суммы
В [517, 518] изучен критерий отсутствия тренда, основанный на сумме
где х — медиана и S(z) =
г=1
если z ^ 0;
если z < 0.
Статистикой критерия является R— число переходов через нуль суммы V. Кри™
терий тренда отклоняется на уровне значимости а, если Ri(a) < R < .^(ск), гДе
R\{ol) и i?2(oj)—критические значения, приведенные в табл. 183.
Таблица 183
Критические значения JRi(o) и jR2(ok)
критерия кумулятивной суммы [517]
п
10
20
30
40
50
60
70
80
90
100
Доверительная
вероятность а
0,90
Ri
0
0
1
1
1
1
2
2
2
2
6
9
12
14
15
17
19
20
21
23
0,95
Ri
0
0
0
0
1
1
1
1
1
1
д2
6
10
12
15
17
18
20
22
23
25
п
200
300
400
500
600
700
800
900
1000
Доверительная
вероятность а
0,90
Ri
4
4
5
6
7
7
8
9
9
33
40
47
53
58
63
67
71
75
0,95
Ri
2
3
4
4
5
5
5
6
6
R2
36
44
52
58
64
69
74
79
83
Задача 289. Проверить гипотезу случайности ряда значений ж, заданных в зада-
задаче 285, критерием кумулятивной суммы.
В нашем случае медиана ряда есть х = 11. Последовательность значений 8(xi — х)
имеет вид:
+1, -1, -1, -1, -1, +1, +1, +1, +1, -1, -1, -1, -1, +1, -1, -1, +1, +1, -1, +1.
Этот ряд порождает последовательность сумм V%:
+1, 0, -1, -2, -3, -2, -1, 0, +1, 0, -1, -2, -3, -2, -3, -4, -3, -2, -3, -2.
Следовательно, R = 3 (три нуля). Из табл. 183 для п = 20 и а = 0,95 находим J?i = 0
Так как JR1=0<JR = 3<i?2 = 10, исследуемый ряд должен быть признан случай™
ным.
542
Проверка гипотез о значениях параметров распределений
[Гл.4
4.3.11. Знаково-ранговый критерий Холлина
Холлин опубликовал в последнее время ряд работ [552—555], посвященных де-
детальному изучению проблемы использования рангов в критериях случайности. Ука-
Укажем на последний результат [556], в котором предложено в определенном смысле
обобщение рангового критерия Вальда-Волфовитца (см. раздел 4.3.9.1) и знако-
знакового критерия кумулятивной суммы (см. раздел 4.3.10). Предложенный Холлином
знаково-ранговый критерий автокорреляции основан на статистике
r =
fc(n-l)
?
где k — коэффициент, зависящий от объема выборки (некоторые его значения
приведены в табл. 184); х — медиана выборочного ряда х\ ^ ж 2 ^ ... ^ хп; Ri—
ранг величины Zi = \х{ — х\ в общем упорядоченном по возрастанию ряду значений
{1, если у > 0;
-1, если у < 0;
0, если у = 0.
Таблица 184
Значения к для знаково-рангового критерия Холлина [556]
п
к
5
10,11
10
36,95
20
140,62
50
851,62
100
3370
200
13407
400
53480
Ряд значений Х{ признается случайным, если \г\ < га, где га—критические
значения, приведенные в табл. 185 (а — уровень значимости). Критерий Холлина
обладает большей эффективностью среди всех, рассмотренных ранее ранговых
критериев.
Задача 290. Проверить гипотезу случайности ряда значений Xi, заданных в зада-
задаче 285, знаково-ранговым критерием Холлина на уровне значимости а = 0,05.
Медиана ряда равна х = = 11.
Напомним, что медиана ряда равна
полусумме центральных значений упорядоченного по возрастанию ряда при п
четном и центральному значению при п нечетном. Составляем ряд значений z%
(Ri—ранг Zi в последовательности) и соответствующих им значений 5ц = 5(xi — х)
и S2i = 8[(xi - х) (xi^t - х)] = ёц • <5i,i-i:
2
3
4
7
1
Яг
3,5
5,5
7
9,5
1,5
Su
1
-1
-1
-1
-1
s2i
-1
1
1
1
z%
6
10
23
37
10
Яг
8
12,5
17
18
12,5
Su
1
1
1
1
-1
-1
1
1
1
-1
zi
1
2
8
7
12
Яг
1,5
3,5
11
9,5
15
Su
1
-1
-1
1
-1
s2l
-1
-1
1
-1
-1
Zi
14
38
39
11
3
Ri
16
19
20
14
5,5
Su
-1
1
1
-1
1
s2%
1
-1
1
-1
-1
Для равных значений z% применяем средние ранги.
Из табл. 184 для п = 20 находим к = 140,62 и вычисляем статистику критерия
1
140,62 • B0 - 1)
• ^ S[(xi - х) - (Xi-l ~~ Х)] ' Ri ' Ri-1 =
= 3,7428 • 10^4 • (-3,5 • 5,5 + 5,5 • 7 + 7 • 9,5 + 9,5 • 1,5 - ...
... + 19 • 20 - 20 • 14 - 14 • 5,5) = 0,078.
4.3]
Критерии тренда и случайности
543
Из табл. 185 для п = 20 и а = 0,05 находим критическое значение го,о5 = 0,378. Так
как г = 0,078 < го,о5 = 0,378, ряд следует признать случайным.
Таблица 185
Критические значения га
знаково-рангового критерия Холлина [556]
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Уровень значимости а
0,10
0,667
0,608
0,548
0,501
0,467
0,421
0,415
0,394
0,380
0,361
0,349
0,338
0,325
0,317
0,306
0,298
0,292
0,283
0,276
0,270
0,265
0,260
0,255
0,05
0,816
0,749
0,681
0,625
0,587
0,553
0,522
0,498
0,479
0,455
0,442
0,428
0,412
0,402
0,388
0,378
0,370
0,361
0,350
0,343
0,338
0,330
0,323
0,025
0,915
0,834
0,778
0,720
0,682
0,642
0,610
0,583
0,558
0,535
0,518
0,502
0,485
0,472
0,459
0,446
0,436
0,425
0,413
0,404
0,400
0,388
0,323
28
29
30
32
34
36
38
40
42
44
46
48
50
55
60
65
70
75
80
85
90
95
100
Уровень значимости а
0,10
0,250
0,245
0,241
0,233
0,225
0,219
0,213
0,207
0,202
0,197
0,192
0,188
0,184
0,175
0,168
0,161
0,155
0,150
0,145
0,140
0,136
0,133
0,129
0,05
0,317
0,311
0,306
0,296
0,287
0,279
0,271
0,264
0,257
0,251
0,246
0,240
0,235
0,224
0,214
0,206
0,198
0,191
0,185
0,180
0,174
0,170
0,165
0,025
0,374
0,367
0,361
0,349
0,339
0,320
0,320
0,312
0,304
0,297
0,291
0,285
0,279
0,266
0,254
0,244
0,235
0,227
0,220
0,213
0,207
0,202
0,197
4.3.12. Критерии обнаружения выбросов
Среди методов оценки однородности выборочных данных следует выделить
группу методов, связанных с обнаружением аномальных, не согласующихся
с остальными элементами выборки наблюдений.
Результаты проведенных экспериментов или испытаний иногда существенно от-
отличаются от наблюдаемых средних значений. Необходимо быть уверенным, что эти
результаты не являются грубым промахом, ошибкой при фиксировании наблюдае-
наблюдаемой величины. Другими словами, следует убедиться, являются ли эти отклонения
случайными, либо их появление является следствием проявления систематических
(или, по крайней мере, фиксированных) неслучайных процессов.
Для проверки значимости подозрительных экспериментальных данных разра-
разработаны специальные статистические критерии. Если такой критерий подтверждает
гипотезу о том, что подозрительный результат значимо отличается от остальных,
то исследователь должен выявить причину такого отклонения. Если причина со™
держится в нарушении условий эксперимента (скачок напряжения сети, поломка
измерительного прибора), то она должна быть устранена, а полученный выброс
исключается из выборки. Возможно, что причина отклонения содержится в появ-
появлении нового физического процесса. Тогда статистическое установление значимости
выброса привлечет внимание исследователя к этому процессу.
544
Проверка гипотез о значениях параметров распределений
[Гл.4
Рекомендуется проводить обязательный анализ значимости отклонения край™
них значений выборки от остальных, так как если они являются выбросами, то
их использование при оценке выборочных моментов (особенно высших порядков)
и проверка различных статистических гипотез может привести к большим ошибкам.
В рассматриваемых ниже критериях предполагается, что выборки предвари™
тельно ранжированы по возрастанию.
4.3.12.1. Критерии выбросов в случае нормального распределения
4.3.12.1.1. Критерий Шовене
Согласно критерию Шовене [519, 520] элемент выборки х^ объема п является
выбросом, если вероятность его отклонения от среднего значения не больше —-.
Критические значения К* статистики Шовене
К =
s = - Е ж>; s = ^zrj Е ^ - s)
1 1
г=1
г=1
приведены в табл. 186.
Таблица 186
Критические значения К* критерия Шовене [519]
п
К*
4
1,54
5
1,65
6
1,73
10
1,96
15
2,13
25
2,33
50
2,57
100
2,81
300
3,14
Если К > К*, то значение Xi (г = 1, ..., п) должно быть признано выбросом.
Задача 291. Пусть в нашем распоряжении имеется выборка объема п = 10:
Xii -3, 2, 6, 11, 15, 19, 26, 28, 30, 41.
Необходимо проверить наличие выброса в выборке критерием Шовене.
Имеем х = 17,5; s2 = 192,71 (s = 13,882). Вычисляем (для xi = 41)
к =
13,882
= 1>693.
Для п = 10 из табл. 186 имеем К* = 1,96.
Так как К = 1,693 < К* = 1,96, крайнее значение в выборке не является выбросом.
Очевидно, что проверка крайнего левого значения приведет к аналогичному результату.
4.3.12.1.2. Критерий Ирвина
Предложен в [521], используется в случае, когда дисперсия распределения из-
известна заранее. Статистика критерия имеет вид
— для проверки наибольшего значения жп, и
Х2 - X!
— если подозрительным является наименьшее значение х\. При т (г*) < т(а) —
наибольшее (наименьшее) значение признается выбросом с вероятностью а. Кри-
Критические значения т(а) приведены в табл. 187.
4.3]
Критерии тренда и случайности
545
Таблица 187
Критические значения Т{а) критерим Ирвина [29]
п
2
3
10
20
30
40
50
60
Доверительная
вероятность а
0,90
2,33
1,79
1,18
1,03
0,96
0,91
0,88
0,86
0,95
2,77
2,17
1,46
1,27
1,20
1,15
1,11
1,08
0,99
3,64
2,90
2,03
1,80
1,70
1,63
1,60
1,57
п
70
80
90
100
200
300
500
1000
Доверительная
вероятность а
0,90
0,84
0,83
0,82
0,81
0,75
0,72
0568
0,65
0,95
1,05
1,04
1,03
1,02
0,95
0,91
0,87
0,83
0,99
1,53
1,50
1,50
1,47
1,38
1,32
1,28
1,22
Задача 292. Проверить гипотезу о наличии выбросов для данных задачи 291 при
условии, что а = 17 (^принять а. = 0,95 ).
41 — 30 2 + 3
Имеем т = = 0,647 и г* = = 0,294.
Из табл. 187 для п = 10 и а = 0,95 имеем т@,95) = 1,46.
Так как т = 0,647 (г* = 0,294) < т@,95) = 1,46, крайние значения не являются вы-
выбросами.
4.3.12.1.3. Критерий Груббса
Груббсом в [522] предложена серия критериев для обнаружения выбросов, осно-
основанная на статистиках
П =
(Т S
если подозрителвным является наибольшее значение хП1 и
X — Х\
X — Х\
если подозрительным является наименьшее значение х\.
Статистики т\ или т^ применяются, когда дисперсия известна заранее; стати-
статистики т* и г2* — когда дисперсия оценивается по выборке с помощью соотношения
1 П
1 ^^ / -\2
S =
г=1
При т~1 (г*) ^ Ti(a) или Т2 (Т2) ^ Т2(а) проверяемое значение (хп при т\ и т-j*, х\
при Т2 и т|) признается выбросом. Критические значения т±(а) и Т2(а) приведены
в табл. 188.
При п > 25 критические значения т\ мо^но найти, используя приближение [29]
тг(а) =u1+a^i
где Ury — 7™квантиль стандартного нормального распределения.
Для T2{ol) предло^кена аппроксимация [36] при а = 0,95
т2@;95) =
1,31 + 0,4351п(п - 2,7) при 5 ^ п < 35;
1,962 + 0,2811п(п - 15) при 35 < п ^ 500.
18 А. И. Кобзарь
546
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 188
Критические значения ti(ck), Тг(о:) и тз(ск) статистик Груббса [25, 29]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Доверительная вероятность о
0,90
Т\
1,497
1,696
1,835
1,939
2,022
2,091
2,150
2,200
2,245
2,284
2,320
2,352
2,382
2,409
2,434
2,458
2,480
2,500
2,529
2,538
2,555
2,571
2,587
1,406
1,645
1,791
1,894
1,974
2,041
2,097
2,146
2,190
2,229
2,264
2,297
2,326
2,354
2,380
2,404
2,426
2,447
2,467
2,486
2,504
2,520
2,537
тз
1,818
1,943
2,036
2,111
2,172
2,224
2,269
2,309
2,344
2,376
2,406
2,432
2,457
2,480
2,502
2,522
2,541
2,559
2,576
2,592
2,607
2,621
2,635
0,95
т\
1,738
1,941
2,080
2,184
2,267
2,334
2,392
2,441
2,484
2,523
2,557
2,589
2,617
2,644
2,668
2,691
2,712
2,732
2,750
2,768
2,784
2,800
2,815
1,412
1,689
1,869
1,996
2,093
2,172
2,237
2,294
2,343
2,387
2,426
2,461
2,493
2,523
2,551
2,577
2,600
2,623
2,644
2,664
12,683
2,701
2,717
тз
2,121
2,234
2,319
2,386
2,442
2,490
2,531
2,568
2,601
2,630
2,657
2,682
2,705
2,726
2,746
2,765
2,783
2,799
2,815
2,830
2,844
2,857
2,870
0,99
п
2,215
2,431
2,574
2,679
2,761
2,828
2,884
2,931
2,973
3,010
0,043
3,072
3,099
3,124
3,147
3,168
3,188
3,207
3,224
3,240
3,255
3,269
3,282
Т2
1,414
1,710
1,917
2,067
2,182
2,273
2,349
2,414
2,470
2,519
2,562
2,602
2,638
2,670
2,701
2,728
2,754
2,778
2,801
2,823
2,843
2,862
2,880
тз
2,712
2,806
2,877
2,934
2,981
3,022
3,057
3,089
3,117
3,143
3,166
3,187
3,207
3,226
3,243
3,259
3,275
3,289
3,303
3,316
3,328
3,340
3,351
Если наряду с дисперсией заранее известно и среднее значение (/i) совокупности,
из которой извлекается выборка наряду с дисперсией, то используется статистика
критические значения которой тз(ск) также приведены в табл. 188. Если тз ^ т%(а),
то выброс признается значимым.
Задача 293. Проверить гипотезу о наличии выбросов в выборке задачи 291 критери-
критериями Груббса при а = 0,95 (для критериев n, T2 и тз будем считать, что а = 14, для
критерия тз принять /j, = 17).
Вычисляем
s = 13,697; х = 17,4;
17,4 + 3
14
= 1,457;
41 - 17,4
14
17,4 + 3
= 1,686;
= 1,489;
41 - 17,4
13,697
41 - 17
= 1,723;
14
= 1,714,
13,697
Из табл. 188 для а = 0,95 и m = 10 находим
Ti @,95) = 2,441, г2@,95) = 2,294 и т3@,95) = 2,568.
Так как п = 1,686 (т2 = 1,457) < п@,95) = 2,441; п* = 1,723 (т2* = 1,489) < т2@,95) =
= 2,294 и тз = 1,714 < тз@,95) = 2,568, наличие выбросов в выборке отклоняется.
Воспользуемся аппроксимацией для Т2@,95):
т2@,95) = 1,31 + 0,435 • 1пA0 - 2,7) = 2,175,
что близко к табличному значению Т2@,95) = 2,294.
4.3]
Критерии тренда и случайности
547
4.3.12.1.4. Критерий наибольшего абсолютного отклонения
Основан на статистике
т4 =
гДе s = S Г
-\2
При Т4 ^ т(а) значение
приведены в табл. 189).
признается выбросом (критические значения
Таблица 189
Критические значения тДа)
критерия наибольшего абсолютного отклонения [25]
п
3
4
5
6
7
8
9
10
12
Доверительная
вероятность
0,90
1,412
1,689
1,869
1,996
2,093
2,172
2,238
2,294
2,387
0,95
1,414
1,710
1,917
2,067
2,182
2,273
2,349
2,414
2,519
а
0,99
1,414
1,728
1,972
2,161
2,310
2,431
2,532
2,616
2,753
п
14
16
18
20
22
24
25
28
30
Доверительная
вероятность
0,90
2,461
2,523
2,577
2,623
2,664
2,701
2,734
2,764
2,792
0,95
2,602
2,670
2,718
2,779
2,823
2,862
2,897
2,929
2,958
а
0,99
2,859
2,946
3,017
3,079
3,132
3,179
3,220
3,258
3,291
В [36] предложена весьма точная аппроксимация (с точностью до ^J 0,1)
для т±{а) при а = 0,95:
т4@,95) =
1,39 + 0,4621п(гс - 3) при 5 ^ п < 35;
2,136 - 0,2811п(гс - 15) при 35 < п ^ 500.
Задача 294. Проверить гипотезу наличия выбросов в выборке задачи 291 критерием
наибольшего абсолютного отклонения при доверительной вероятности а = 0,95.
41 - 17,5
Вычисляем Т4 =
max Xi — х
= 1,718.
s 13,679
Из табл. 189 для п = 10 и а = 0,95 имеем т4@,95) = 2,414.
Так как Т4 = 1,718 < Т4@,95) = 2,414, гипотеза о наличии выбросов не находит под-
подтверждения.
Вычислим теперь аппроксимацию
т4@,95) = 1,39 + 0,462 • 1пA0 - 3) = 2,289,
что близко к табличному значению.
4.3.12.1.5. Критерий Дэвида
Является модификацией критерия Груббса (см. раздел 4.3.12.1.3), использует
— — 1 т
статистику [523] Тк = — или т! = , где s = ^^(Уг ~ У) —выбо™
s s m — 1 ¦z—-J
г=1
рочная дисперсия, оцениваемая по отдельной независимой выборке (объема га)
значений г/».
18*
548 Проверка гипотез о значениях параметров распределений [Гл. 4
Критические значения т^(а) статистики Дэвида приведены в табл. 190. При
п > 25 применима аппроксимация
где и7 — 7™квантиль стандартного нормального распределения.
При Т5 (те*) ^ т§{а) одно из крайних выборочных значений признается выбросом
с вероятностью а.
Задача 295. Для ряда данных задачи 291 проверить наличие выбросов критерием
Дэвида при доверительной вероятности а = 0,95. Известно, что оценка дисперсии
s' = 182,15 получена по независимой выборке объема т = 10.
Имеем s = 13,496, тогда 75 = ^^f = 1,741 и т| = ^^ = 1,519.
Из табл. 190 для п = 10, т = 10 и а = 0,95 находим т5@,95) = 2,89.
Так как rs = 1,74 < ts@,95) = 2,89, гипотеза о наличии выбросов в выборке отклоня-
отклоняется.
Такой же результат дает аппроксимация. Имеем
и a-i = -и o,95~i = iio,995 « 4,91 • (о,995°д4 - 0,0050'14) = 2,568;
+ 1+ 10
( з Г?\
т5@,95) « 2,568 • 1 + - . л / — = 3,38.
V 9 v 10/
Видим, что ошибка аппроксимации велика (точное значение rs@,95) = 2,89). Это свя-
связано с малым объемом выборки п = 10 (для точной аппроксимации необходимо п > 25).
4.3.12.1.6. Критерии Диксона
Используются для быстрого выявления выпадающих наблюдений по отношению
размаха и подразмахов.
Статистиками критериев являются [524] (в скобках указаны проверяемые на-
наблюдения):
— для проверки одного сомнительного наблюдения
гю = (для проверки х\); Гю = — — (для проверки хп);
Хп — Х\ Хп — Х\
— для проверки одного сомнительного наблюдения независимо от противополож-
противоположного крайнего наблюдения
х2 — х\ , х хп — xn~i ( ,
П X 1 Хл A>] П X X, ^П^
Xn—i Х\ Хп ?2
— для проверки одного сомнительного наблюдения независимо от двух противопо-
противоположных крайних
Х2- X! , , Хп ^ Хп^1 / х
ri2 = х 9 ^ Ж1 (^i); ri2= х ^Хч М;
Хп — 2 XI Хп Хз
— для проверки одного сомнительного наблюдения независимо от следующего по
величине
%3 — Х\ , ч Хп ^ Хп~2 ( \
Г20 = _ {Xl)l Г20 = _ (Хп);
Jyfl Jy\ Jun ^1
— для проверки одного сомнительного наблюдения независимо от следующего по
величине и крайнего противоположного
Хъ~ Х\ ( ч Хп ~~ Хп^2 / х
r2i = х 1 ^ Ж1 (^i); r2i= (a?n);
Хп — 1 Х\ Хп ?2
4.3]
Критерии тренда и случайности
549
Критические значения
Таблица 190
статистики Дэвида
п
га
4
5
6
7
8
9
10
11
13
Доверительная вероятность а = 0,90
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
оо
1,68
1,66
1,65
1,63
1,62
1,61
1,61
1,60
1,59
1,59
1,58
1,57
1,55
1,54
1,52
1,51
1,50
1,92
1,90
1,88
1,86
1,85
1,84
1,83
1,82
1,82
1,81
1,80
1,78
1,77
1,75
1,73
1,71
1,70
2,09
2,07
2,05
2,03
2,01
2,00
1,99
1,98
1,97
1,96
1,96
1,94
1,92
1,90
1,87
1,85
1,83
2,23
2,20
2,17
2,16
2,14
2,12
2,11
2,10
2,09
2,08
2,08
2,05
2,03
2,01
1,98
1,96
1,94
2,33
2,30
2,28
2,26
2,24
2,22
2,21
2,20
2,19
2,18
2,17
2,15
2,12
2,10
2,07
2,05
2,02
2,42
2,39
2,36
2,34
2,32
2,31
2,29
2,28
2,26
2,26
2,25
2,22
2,20
2,17
2,14
2,12
2,09
2,50
2,46
2,44
2,41
2,39
2,38
2,36
2,35
2,34
2,33
2,32
2,29
2,26
2,23
2,20
2,18
2,15
2,56
2,53
2,50
2,47
2,45
2,44
2,42
2,41
2,39
2,38
2,37
2,34
2,32
2,29
2,26
2,23
2,20
2,68
2,64
2,61
2,58
2,56
2,54
2,52
2,51
2,49
2,48
2,47
2,44
2,41
2,38
2,35
2,32
2,28
Доверительная вероятность а = 0,95
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
оо
2,01
1,98
1,96
1,94
1,93
1,91
1,90
1,89
1,88
1,87
1,87
1,84
1,82
1,80
1,78
1,76
1,74
2,27
2,24
2,21
2,19
2,17
2,15
2,14
2,13
2,11
2,11
2,10
2,07
2,04
2,02
1,99
1,96
1,94
2,46
2,42
2,39
2,35
2,34
2,32
2,31
2,29
2,28
2,27
2,26
2,23
2,20
2,17
2,14
2,11
2,08
2,60
2,56
2,52
2,50
2,47
2,45
2,43
2,42
2,40
2,39
2,38
2,34
2,31
2,28
2,25
2,22
2,18
2,72
2,67
2,63
2,60
2,57
2,55
2,53
2,52
2,50
2,49
2,47
2,44
2,40
2,37
2,33
2,30
2,27
2,81
2,76
2,72
2,69
2,66
2,64
2,62
2,60
2,58
2,57
2,56
2,52
2,48
2,44
2,41
2,37
2,33
2,89
2,84
2,80
2,76
2,74
2,71
2,69
2,67
2,65
2,64
2,63
2,58
2,54
2,50
2,47
2,43
2,39
2,96
2,91
2,87
2,83
2,80
2,77
2,75
2,73
2,71
2,70
2,68
2,64
2,60
2,56
2,52
2,48
2,44
3,08
3,03
2,98
2,94
2,91
2,88
2,86
2,84
2,82
2,80
2,78
2,74
2,69
2,65
2,61
2,57
2,52
Доверительная вероятность а = 0,99
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
оо
2,78
2,72
2,67
2,63
2,60
2,57
2,54
2,52
2,50
2,49
2,47
2,42
2,38
2,34
2,29
2,25
2,22
3,10
3,02
2,96
2,92
2,88
2,84
2,81
2,79
2,77
2,75
2,73
2,68
2,62
2,57
2,52
2,48
2,43
3,32
3,24
3,17
3,12
3,07
3,03
3,00
2,97
2,95
2,93
2,91
2,84
2,79
2,73
2,68
2,62
2,57
3,48
3,39
3,32
3,27
3,22
3,17
3,14
3,11
3,08
3,06
3,04
2,97
2,91
2,85
2,79
2,73
2,68
3,62
3,52
3,45
3,38
3,33
3,29
3,25
3,22
3,19
3,16
3,14
3,07
3,01
2,94
2,88
2,82
2,76
3,73
3,63
3,55
3,48
3,43
3,38
3,34
3,31
3,28
3,25
3,23
3,16
3,08
3,02
2,95
2,89
2,83
3,82
3,72
3,64
3,57
3,51
3,46
3,42
3,38
3,35
3,33
3,30
3,23
3,15
3,08
3,01
2,95
2,88
3,90
3,79
3,71
3,64
3,58
3,53
3,49
3,45
3,42
3,39
3,37
3,29
3,21
3,13
3,06
3,00
2,93
4,04
3,93
3,84
3,76
3,70
3,65
3,60
3,56
3,53
3,50
3,47
3,38
3,30
3,22
3,15
3,08
3,01
550 Проверка гипотез о значениях параметров распределений [Гл. 4
— для проверки одного сомнительного наблюдения независимо от следующего по
величине и двух крайних противоположных
Хз - X! , ч Хп - Хп^2 / х
Г22 = {%1); Г22 = (Хп).
Хп^2 ~ Хг Хп - Х3
Критические значения статистик гю(а)^ гц(а), 7*12(ск), Г2о(«), ^2i(«) и 7*22@:),
превышение которых приводит к признанию наличия выбросов в выборке, при-
приведены в табл. 191. Критерий гю рекомендуется применять при 3 ^ п ^ 7;
критерий Гц —при 8 ^ п ^ 10, критерий 7*21 —при 11 ^ п ^ 13; критерий Г22 —ПРИ
14 ^ п ^ 25.
Задача 296. Для выборочного ряда задачи 291 проверить гипотезу о наличии выбросов
критериями Диксона при доверительной вероятности а = 0,95.
Вычисляем:
а?2 - Ж1 2 + 3
Хп -
Х2
Х2
Хп ~
хз
- xi
-X!
2-*i
-хг
-X!
41 + 32
2 + 3
= 0,1136;
= 0,1515;
30 + 3
_ 2 + 3
~~ 28 + 3
г2о = "* "х = ^^ = 0,2045; г20 =
- - 41 + 3 ' ' хп-Х! 41 + 3
~о ~х 6 + 3 хп^хп^ 41-28
7*21 = z Г" = ^^ = 0,2727; г21 = — — = — = 0,3333;
6 + 3 = 0,2903; г22 = Хп^Хп^2 = 41^28 = 0?3714.
х.
х.
хп
х'
Хп
п-хг
п^Х2
п^Х3
Хп — 2
»-Х2
41
41
41
41
41
41
41
-3D
+ 3
- 30
- 2
-30
-6
-28
П О с;.
= 0?282;
= 0,3143;
= 0,2954:
жп^2-Ж1 28 + 3 ' ^ жп-ж3 41-6
Из табл. 191 для п=10иа = 0,95 находим критические значения
7-ю@,95) = 0,412; г20@,95) = 0,531; щ@,95) = 0,477;
7-2i@,95) = 0,612; 7-12@,95) = 0,537; г22@,95) = 0,682.
Сравнением убеждаемся, что (рассматриваются максимальные величины)
По = 0,25 < 7-ю@,95) = 0,412; щ = 0,28 < т-ц@,95) = 0,477;
П2 = 0,314 < п2@,95) = 0,537; г20 = 0,2954 < г20@,95) = 0,531;
г21 = 0,33 < 7-2i@,95) = 0,612; г22 = 0,3714 < г22@,95) = 0,682.
Следовательно, ни одна из статистик не приводит к принятию гипотезы о наличии
выбросов в выборке.
4.3.12.1.7. Критерий Хоглина^Иглевича
В работе авторов критерия [525] рассматривается правило выделения выпада™
ющих наблюдений в нормалвно распределеннвхх выборках с помощью порядковых
статистик. Правило обнаружения выбросов формулируется следующим образом.
Наблюдение признается выбросом, если его значение находится вне интервала,
ограниченного величинами
A + к)хщ - кх[п+1^ц и A + к)х[п+1_г] - кхщ,
где хщ—г-я порядковая статистика (т.е. г-й по величине член выборки, упорядо-
упорядоченной по возрастанию).
4.3]
Критерии тренда и случайности
551
Таблица 191
Критические значения гю(а,)^ гц(«), ri2(o), Г2о(«)?
т2i (ol) и г22 (ol) статистик Диксона (значения приведены
последовательно по строкам в соответствии с порядком записи,
т.е. верхняя строка — гю, ..., нижняя — Г22) [25]
п
6
7
8
9
10
11
12
13
Доверительная
вероятность
0,90
0,482
0,609
0,745
0,670
0,821
0,965
0,434
0,530
0,636
0,596
0,725
0,850
0,399
0,479
0,557
0,545
0,650
0,745
0,370
0,441
0,504
0,505
0,594
0,676
0,349
0,409
0,454
0,474
0,551
0,620
0,332
0,385
0,431
0,449
0,517
0,578
0,318
0,367
0,406
0,429
0,490
0,543
0,305
0,350
0,387
0,411
0,467
0,95
0,560
0,689
0,824
0,736
0,872
0,983
0,507
0,610
0,712
0,661
0,780
0,881
0,468
0,554
0,632
0,607
0,710
0,803
0,437
0,512
0,580
0,565
0,657
0,737
0,412
0,477
0,537
0,531
0,612
0,682
0,392
0,450
0,502
0,504
0,576
0,637
0,376
0,428
0,473
0,481
0,546
0,600
0,361
0,410
0,451
0,461
0,521
а
0,99
0,698
0,805
0,925
0,836
0,951
0,995
0,637
0,740
0,836
0,778
0,885
0,945
0,590
0,683
0,760
0,710
0,829
0,890
0,555
0,635
0,701
0,667
0,776
0,840
0,527
0,597
0,655
0,632
0,726
0,791
0,502
0,566
0,619
0,603
0,679
0,745
0,482
0,541
0,590
0,579
0,642
0,704
0,465
0,520
0,554
0,557
0,615
п
13
14
15
16
17
18
19
20
21
Доверительная
вероятность
0,90
0,515
0,294
0,336
0,369
0,395
0,448
0,492
0,285
0,323
0,354
0,382
0,431
0,454
0,277
0,313
0,341
0,370
0,416
0,454
0,269
0,303
0,330
0,359
0,403
0,438
0,263
0,295
0,320
0,350
0,391
0,424
0,258
0,288
0,311
0,341
0,380
0,412
0,252
0,282
0,303
0,333
0,371
0,401
0,247
0,276
0,296
0,326
0,95
0,570
0,349
0,395
0,432
0,445
0,501
0,546
0,338
0,381
0,416
0,430
0,483
0,507
0,320
0,359
0,388
0,406
0,433
0,490
0,313
0,349
0,377
0,397
0,440
0,475
0,306
0,341
0,367
0,379
0,428
0,462
0,306
0,341
0,367
0,379
0,428
0,462
0,300
0,334
0,358
0,372
0,419
0,450
0,295
0,327
0,349
0,365
а
0,99
0,670
0,450
0,502
0,542
0,538
0,593
0,641
0,438
0,486
0,523
0,522
0,574
0,595
0,426
0,472
0,508
0,508
0,557
0,595
0,416
0,460
0,493
0,495
0,542
0,577
0,407
0,449
0,480
0,484
0,529
0,561
0,398
0,439
0,469
0,473
0,517
0,547
0,391
0,430
0,458
0,464
0,506
0,535
0,384
0,421
0,449
0,455
552
Проверка гипотез о значениях параметров распределений
[Гл.4
21
22
23
24
25
26
Окон
Доверительная
вероятность
0,90
0,363
0,391
0,242
0,270
0,290
0,320
0,356
0,382
0,238
0,265
0,284
0,314
0,349
0,374
0,234
0,260
0,278
0,309
0,343
0,367
0,230
0,255
0,273
0,304
0,337
0,360
0,227
0,250
0,95
0,410
0,440
0,290
0,320
0,342
0,358
0,402
0,430
0,285
0,314
0,336
0,352
0,395
0,421
0,281
0,309
0,330
0,347
0,388
0,413
0,277
0,304
0,324
0,343
0,382
0,406
0,273
0,299
а
0,99
0,496
0,524
0,378
0,414
0,440
0,447
0,487
0,514
0,372
0,407
0,432
0,440
0,479
0,505
0,367
0,400
0,423
0,434
0,471
0,497
0,362
0,394
0,417
0,428
0,464
0,489
0,357
0,389
п
26
27
28
29
30
чание
таблицы 191
Доверительная
вероятность а
0,90
0,268
0,300
0,331
0,354
0,224
0,246
0,263
0,296
0,325
0,348
0,220
0,243
0,259
0,292
0,320
0,342
0,218
0,239
0,255
0,288
0,316
0,337
0,215
0,236
0,251
0,285
0,312
0,332
0,95
0,319
0,338
0,376
0,399
0,269
0,295
0,314
0,334
0,370
0,393
0,266
0,291
0,309
0,330
0,365
0,387
0,263
0,287
0,305
0,326
0,360
0,381
0,260
0,283
0,301
0,322
0,355
0,376
0,99
0,411
05422
0,457
05486
0,353
0,383
0,405
0,417
0,450
0,475
0,349
0,378
0,399
0,412
0,444
0,469
0,345
0,374
0,394
0,407
0,438
0,463
0,341
0,369
0,389
0,402
0,433
0,457
Для выбора значения I используются варианты
, lU + 3!
*1 = о
где [... j — целая часть числа.
Значения коэффициентов к для различных вариантов выбора значений I и ве-
вероятности отсутствия выброса а приведены в табл. 192.
Задача 297. Проверить гипотезу о наличии выбросов в выборке задачи 291 критерием
Хоглина-Иглевича при доверительной вероятности а = 0,95.
тж 1 1 Гю-ьз] „ F
Имеем h = - • —^— = 3; h =
Для а = 0,95 и п = 10 из табл. 192 находим к = 2,4 (для Zi); fc = 2,2 (для Z2) и /с = 1,8
(для 1з). Окончательно имеем
z[^i] - к ' (x[n+i^h) - x[h]) =хз- 2,4 • (х8 - ж3) = 6 - 2,4 • B8 - 6) = -46,8;
X[n+i-h] + 2,4 • (a;[n+i_Zl] - x[h]) = х8 + 2,4 • (ж8 - х3) = 6 + 2,4 • B8 - 6) = 80,8.
Видим, что вне интервала (—46,8; 80,8) нет элементов выборки. Очевидно, что при
|2 = 2 интервал становится еще шире: (—59,6; 91,6).
Следовательно, с вероятностью 0,95 можно утверждать отсутствие выбросов в вы-
выборке.
4.3]
Критерии тренда и случайности
553
Таблица 192
Значения коэффициента к критерия Хоглина—Мглевича [525]
п
7
8
9
10
11
12
13
14
15
16
Доверительная
0,90
к
2,3
1,8
2,7
2,0
2 2
1,8
2,3
2,0
2,1
1,9
h
1,7
1,6
1,7
1,8
1,8
1,8
1,8
1,9
1,8
1,9
h
1,5
1,4
1,4
1,5
1,7
1,6
1,6
1,7
1,7
1,7
вероятность а
0,95
к
3,0
2,2
3,3
2,4
2,7
2,2
2,8
2,3
2,5
2,3
h
2,3
2Д
2,1
0,2
2,2
2,1
2,2
2,2
2,2
2,2
h
2,0
1,8
1,8
1,8
2,1
2,0
1,9
2,0
2,1
2,1
п
17
18
19
20
30
40
50
75
100
200
Доверительная
0,90
к
2,2
2,0
2,2
1,9
2,0
2,0
2,0
2,1
2,1
2,2
h
1,8
1,9
1,9
1,8
1,9
2,0
2,0
2,0
2,0
2,2
h
1,7
1,7
1,8
2,2
1,9
1,9
1,9
2,0
2,0
2,2
вероятность а.
0,95
к
2,6
2,3
2,6
2,3
2,2
2,2
2 2
2,3
2,2
2,4
h
2Д
2,1
2,3
2,1
2,2
2,2
2,2
2,2
2,2
2,4
h
2,0
2,4
2 2
2,1
2,1
2 2
2,2
2,2
2,2
2,4
4.3.12.1.8. Критерий Титьена-Мура для обнаружения нескольких выбросов
Критерий, предложенный Титьеном и Муром [526], является обобщением кри-
терия Груббса (см. раздел 4.3.12.1.3) на случай выявления нескольких выбросов
в выборке. Для выделения к наибольших выбросов используется статистика
L,=
E(*«-
п — к
1 j
= - Е Xi И *k = ^^fc Е
г=1
Для выделения к наименьших наблюдений используется статистика
п
2^ [Xi -х*к) ^
т* i=k+l „„„ =* 1 v^ -.
Если подозрительными являются как наименьшие, так и наибольшие наблюде-
наблюдения, то для их обнаружения используется следующее правило. Находятся абсолют-
абсолютные отклонения di = \xi — х\ и ранжируются по возрастанию от d\ до dn. Обозначим
через Zi выборочное значение Xi, для которого di является г~м по величине. Для
проверки гипотезы исключения к наибольших по модулю наблюдений используется
статистика
п-к
„_*
E(z- - z)
-
zk =
При использовании критерия Титьена—Мура рекомендуется сначала использо-
использовать статистику L^ (Ь^), а затем Е^. Наличие выбросов признается значимым
с достоверностью а, если
Lk (L*k) < Lk(a) или Ек ^ Ек(а),
где Lk(a) и Е^(а) — критические значения, приведенные в табл. 193 и 194.
554
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 193
Критические значения Lk(ot) и L%(ol) критерия Титьена—Мура [526, 527]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
к
1
0,011
0,098
0,200
0,280
0,348
0,404
0,448
0,490
0,526
0,555
0,578
0,600
0,611
0,631
0,648
0,661
0,676
0,688
0,732
0,766
0,792
0,812
0,826
0,840
0,003
0,051
0,125
0,203
0,273
0,326
0,372
0,418
0,454
0,489
0,517
0,540
0,556
0,579
0,594
0,608
0,624
0,639
0,696
0,730
0,762
0,784
0,802
0,820
2
0,003
0,038
0,091
0,148
0,200
0,248
0,287
0,326
0,361
0,388
0,416
0,436
0,458
0,478
0,496
0,510
0,530
0,588
0,637
0,673
0,702
0,724
0,744
0,001
0,018
0,055
0,106
0,146
0,194
0,233
0,270
0,305
0,337
0,363
0,387
0,410
0,427
0,447
0,462
0,484
0,550
0,599
0,642
0,672
0,696
0,722
3
4
5
6
Доверительная вероятность
0,020
0,056
0,095
0,134
0,170
0,208
0,240
0,270
0,298
0,322
0,342
0,364
0,384
0,398
0,420
0,489
0,523
0,586
0,622
0,648
0,673
0,038
0,068
0,098
0,128
0,159
0,186
0,212
0,236
0,260
0,282
0,302
0,316
0,339
0,412
0,472
0,516
0,554
0,586
0,614
0,051
0,074
0,103
0,126
0,150
0,172
0,194
0,216
0,236
0,251
0,273
0,350
0,411
0,458
0,499
0,533
0,562
0,062
0,082
0,104
0,124
0,144
0,165
0,184
0,199
0,220
0,296
0,339
0,410
0,451
0,488
0,518
Доверительная вероятность
0,010
0,032
0,064
0,099
0,129
0,162
0,196
0,224
0,250
0,276
0,300
0,322
0,337
0,354
0,377
0,450
0,506
0,554
0,588
0,618
0,646
0,022
0,045
0,070
0,098
0,125
0,150
0,174
0,197
0,219
0,240
0,259
0,277
0,299
0,374
0,434
0,482
0,523
0,556
0,588
0,034
0,054
0,076
0,097
0,122
0,140
0,159
0,181
0,200
0,209
0,238
0,312
0,376
0,424
0,468
0,502
0,535
0,042
0,060
0,079
0,097
0,115
0,136
0,154
0,168
0,188
0,262
0,327
0,376
0,421
0,456
0,490
7
а = 90
0,068
0,086
0,104
0,125
0,142
0,158
0,176
0,251
0,316
0,365
0,408
0,447
0,477
а = 95
0,050
0,066
0,082
0,100
0,116
0,130
0,150
0,222
0,283
0,334
0,378
0,417
0,450
8
0,073
0,092
0,108
0,124
0,140
0,213
0,276
0,328
0,372
0,410
0,442
0,055
0,072
0,086
0,099
0,115
0,184
0,245
0,297
0,342
0,382
0,414
9
0,080
0,094
0,110
0,180
0,240
0,294
0,338
0,378
0,410
0,062
0,074
0,088
0,154
0,212
0,264
0,310
0,350
0,383
10
0,085
0,152
0,210
0,262
0,307
0,348
0,380
0,066
0,126
0,183
0,235
0,280
0,320
0,356
4.3]
Критерии тренда и случайности
555
Таблица 194
Критические значения Ек(а) критерия Титьена^Мура [526, 527]
те
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
к
1
0,003
0,005
0,127
0,204
0,268
0,328
0,377
0,420
0,449
0,485
0,510
0,538
0,558
0,578
0,594
0,610
0,629
0,644
0,693
0,730
0,763
0,784
0,803
0,820
0,001
0,025
0,081
0,146
0,208
0,265
0,314
0,356
0,386
0,424
0,455
0,484
0,509
0,526
0,544
0,562
0,581
0,597
0,652
0,698
0,732
0,758
0,778
0,797
2
0,002
0,022
0,056
0,094
0,137
0,175
0,214
0,250
0,278
0,309
0,337
0,360
0,384
0,406
0,424
0,442
0,460
0,528
0,582
0,624
0,657
0,684
0,708
0,001
0,010
0,034
0,065
0,099
0,137
0,172
0,204
0,234
0,262
0,293
0,317
0,340
0,362
0,382
0,398
0,416
0,493
0,549
0,596
0,629
0,658
0,684
3
4
5
6
Доверительная вероятность
0,009
0,027
0,053
0,080
0,108
0,138
0,162
0,189
0,216
0,240
0,263
0,284
0,304
0,322
0,336
0,417
0,475
0,523
0,562
0,593
0,622
0,016
0,032
0,052
0,073
0,094
0,116
0,138
0,160
0,182
0,198
0,217
0,234
0,252
0,331
0,391
0,443
0,486
0,522
0,552
0,022
0,036
0,052
0,068
0,085
0,105
0,122
0,140
0,156
0,172
0,188
0,264
0,325
0,379
0,422
0,459
0,492
0,026
0,038
0,052
0,067
0,082
0,095
0,110
0,124
0,138
0,210
0,270
0,324
0,367
0,406
0,440
Доверительная вероятность
0,004
0,016
0,034
0,057
0,083
0,107
0,133
0,156
0,179
0,206
0,227
0,248
0,267
0,287
0,302
0,381
0,443
0,495
0,534
0,567
0,599
0,010
0,021
0,037
0,055
0,073
0,092
0,112
0,134
0,153
0,170
0,187
0,203
0,221
0,298
0,364
0,417
0,458
0,492
0,529
0,014
0,026
0,039
0,053
0,068
0,084
0,102
0,116
0,132
0,146
0,163
0,236
0,298
0,351
0,395
0,433
0,468
0,018
0,028
0,039
0,052
0,067
0,078
0,091
0,105
0,119
0,186
0,246
0,298
0,343
0,381
0,417
7
а = 90
0,029
0,040
0,053
0,064
0,076
0,089
0,102
0,168
0,224
0,276
0,320
0,360
0,396
а = 95
0,021
0,030
0,041
0,050
0,062
0,074
0,085
0,146
0,203
0,254
0,297
0,337
0,373
8
0,032
0,042
0,051
0,062
0,072
0,132
0,186
0,236
0,278
0,320
0,355
0,024
0,032
0,041
0,050
0,059
0,114
0,166
0,214
0,259
0,299
0,334
9
0,034
0,042
0,051
0,103
0,154
0,202
0,243
0,284
0,319
0,026
0,033
0,041
0,089
0,137
0,171
0,223
0,263
0,299
10
0,035
0,080
0,126
0,172
0,212
0,252
0,287
0,028
0,068
0,112
0,154
0,195
0,233
0,268
556
Проверка гипотез о значениях параметров распределений
[Гл.4
Задача 298. Для ряда наблюдений
хц 0,916; 0,944; 1,292; 1,452; 1,524; 1,604; 1,632; 1,812; 2,017; 2,671
проверить наличие нескольких выбросов критерием Титьена-Мура при доверительной
вероятности а = 0,90.
Имеем
=-.уж^ = 1,586; V
г=1 г=1
щ - х) = 2,385;
1
хг =
10-2
жг = 1,397;
• Y" ж* = 1,4569;
г=1
2,385
Е<
0,737
2,385
= 0,309.
Из табл. 193 для к = 1 (п = 10, а = 0,90) находим Li@,90) = 0,490, для к = 2 имеем
Ь2@,90) = 0,287. Так как Li = 0,452 < ь/@,90) = 0,490, наибольшее значение х = 2,671
признается выбросом. Так как L2 = 0,309 > Ь2@,90) = 0,287, второе наибольшее значе-
значение не должно быть признано выбросом.
Для наименьших наблюдений имеем
х\ =
10 10
г=2 г=2
= 1,308;
5 ?
1,886
2,385
= 0,790;
ю-2
1,308
2,385
V хг = 1,750;
= 1,308.
Так как L\ = 0,790 > Li@,90) = 0,490 и L*2 = 0,548 > L2@,90) = 0,287, оба наимень-
наименьших наблюдения не должны признаваться выбросами.
Используем теперь ^-критерий. Имеем d = \хг — х\ = 10,916 — 1,586| = 0,67.
Вычисляя далее по аналогии, получаем ранжированный ряд значений di. Результаты
сведем в таблицу, там же укажем ранги величин Xi, соответствующие значениям di
в ранжировке:
г
1
2
3
4
5
di
0,018
0,046
0,062
0,134
0,226
Ri
6
7
5
4
8
Zi
1,604
1,632
1,524
1,452
1,812
г
6
7
8
9
10
di
0,294
0,431
0,642
0,670
1,805
Ri
3
9
2
1
10
Zi
1,291
2,017
0,944
0,916
2,671
Пользуясь данными таблицы, вычисляем
1
4; Е (^ - z? = 2>386; * = g • Еz* = м66;
i=l i=l
= 1,079; z2 = \-Y,Zi = 1,535; J2 (zi - z2f = 0,748;
El = 1^=0,452; E2=°^
2,386 2,386
= 0,309.
Из табл. 194 для а = 0,90 и п = 10 имеем #i@,90) = 0,420 и ?J2@,90) = 0,214.
Так как Ег = 0,452 > ??i@,90) = 0,420 ш Е2 = 0,309 > ^2@,90) = 0,214, оба проверяв™
мых наблюдения (это 0,916 и 2,671) не являются выбросами.
4.3 ] Критерии тренда и случайности 557
4.3.12.1.9. Критерий Роснера для обнаружения нескольких выбросов
Рассмотренный ранее критерий Титьена-Мура (см. раздел 4.3.12.1.8) предпола™
гает, что количество выбросов к заранее известно. Однако это не всегда так, поэтому
наиболее интересны методы не только выделения самих выбросов, но и выявления
их количества. Такая проблема рассмотрена Роснером [528, 529], который выдвинул
и реализовал интересную идею последовательного применения критерия Груббса
(см. раздел 4.3.12.1.3) для выделения одного выброса, основанного на статистике
* / х — х\ хп — х
тЛ = max , ^-^
у s s
Алгоритм критерия Роснера состоит в следующем. По начальной выборке объ-
объема п вычисляются значения х и s и статистика rj". Затем из выборки удаляется
экстремальный член хш[п (жтах)—в зависимости от того, какое значение более
удалено от среднего. Так повторяется к раз. Полученные значения статистик т*^
(г = 1, ..., к) каждый раз сравниваются с критическими значениями, приведенны-
приведенными в табл. 195 для заданных п, к и вероятности а. Превышение критерием г*^ крити-
критического значения, полученного из табл. 195 для некоторого г, позволяет установить
не только наличие выбросов, но и их количество (равное значению г, при котором
появляется первая значимая величина критерия т^). Вычисление последователь-
последовательных статистик ведется до тех пор, пока т*^,^ > т^.
Задача 299. Для ряда наблюдений (п = 20)
Хг: 0, 15, 16, 22, 22, 23, 26, 27, 27, 28,
28, 31, 32, 33, 35, 37, 38, 41, 56, 58
проверить наличие выбросов и установить их количество критерием Роснера при
доверительной вероятности а = 0,95.
Находим для полной выборки:
х = 29,75; s = 13,122;
= 2Д53; ?^Е1 = 29-75-° = 2,267) = 2,267.
s 13122 )
2Д53;
s 13,122 s 13,122
Исключаем из выборки значение х = 0, соответствующее полученному максимуму.
Для оставшихся членов выборки (п = 19) находим
хг = 31,316; 81 = 11,402; п*2 = max (Ё^^ММ = 2,34; 31?316 15 = 1,4зЛ = 2,34.
' ' у 11,402 ' ' 11,402 ) '
Так как 2,34 > 2,267, продолжаем вычисления. Исключаем из выборки значение х = 58,
соответствующее максимуму.
Для оставшихся п = 18 наблюдений имеем
Х2 = 29,833; s2 = 9,666; тГз = max f56^'833 = 2,707; 29'f3 15 = 1,534) = 2,707.
у 9,666 9,666 J
Так как 2,707 > 2,34, продолжаем вычисления. Исключаем из выборки значение х = 56,
соответствующее максимуму.
Для оставшихся п = 17 выборочных данных находим
х3 = 28,294; s3 = 7,346; т*4 = max f 41 ^ 28'294 = 1?730; 28;294 ~ 15 = 1?810 ) = 1,810.
у 7,346 7,346 J
Так как Т\± = 1,81 < т^3 = 2,707, то дальнейшие вычисления прекращаем.
Проверим теперь значимость последовательности статистик
т*1 = 2,267; т*2 = 2,34; г*3 = 2,707; п*4 = 1,81.
558
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 195
Мритические значения т*± критерия Роснера [529, 530]
п
20
20
20
20
20
20
20
20
20
20
20
20
20
20
30
30
30
30
30
30
10
10
11
11
12
12
13
13
14
14
15
15
16
16
17
17
18
18
19
19
20
20
20
20
20
к
2
2
3
3
3
4
4
4
4
5
5
5
5
5
2
2
3
3
3
4
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
1
2
3
1
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
3
2,69
2,41
2,76
2,47
2,34
2,81
2,51
2,38
2,29
2,85
2,55
2,40
2,33
2,27
2,89
2,55
2,97
2,61
2,44
3,02
2,39
2,17
2,45
2,23
2,50
2,27
2,57
2,31
2,62
2,39
2,65
2,42
2,70
2,44
2,75
2,48
2,79
2,46
2,80
2,49
2,83
2,52
2,88
2,60
2,45
п
30
30
30
30
30
30
30
30
40
40
40
40
40
40
40
40
40
40
40
40
20
20
20
20
20
20
20
20
20
25
25
30
30
30
30
30
30
30
30
30
30
30
30
30
30
к
4
4
4
5
5
5
5
5
2
2
3
3
3
4
4
4
4
5
5
5
4
4
4
4
5
5
5
5
5
2
2
2
2
3
3
3
4
4
4
4
5
5
5
5
5
г
тн
п
к
Доверительная ]
2
3
4
1
2
3
4
5
1
2
1
2
3
1
2
3
4
1
2
3
2,65
2,48
2,39
3,05
2,67
2,51
2,42
2,35
3,01
2,72
3,07
2,69
2,52
3,14
2,74
2,57
2,45
3,16
2,76
2,59
40
40
50
50
50
50
50
50
50
50
50
50
50
50
50
50
60
60
60
60
5
5
2
2
3
3
3
4
4
4
4
5
5
5
5
5
2
2
3
3
Доверительная ]
1
2
3
4
1
2
3
4
5
1
2
1
2
1
2
3
1
2
3
4
1
2
3
4
5
2,95
2,63
2,49
2,39
2,97
2,65
2,51
2,42
2,37
2,99
2,62
3,05
2,67
3,12
2,73
2,56
3,16
2,77
2,59
2,49
3,19
2,78
2,60
2,51
2,45
35
35
40
40
40
40
40
40
40
40
40
40
40
40
40
40
45
45
50
50
50
50
50
50
50
2
2
2
2
3
3
3
4
4
4
4
5
5
5
5
5
2
2
2
2
3
3
3
4
4
г
ти
п
к
г
вероятность а = 90
4
5
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
1
2
2,46
2,39
3,10
2,72
3,18
2,76
2,58
3,24
2,81
2,62
2,50
3,28
2,84
2,65
2,52
2,44
3,15
2,77
3,26
2,83
60
60
60
60
60
60
60
60
60
60
80
80
80
80
80
80
80
80
80
3
4
4
4
4
5
5
5
5
5
2
2
3
3
3
4
4
4
4
3
1
2
3
4
1
2
3
4
5
1
2
1
2
3
1
2
3
4
вероятность а = 95
1
2
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
1
2
1
2
3
1
2
3,09
2,74
3,17
2,77
3,22
2,81
2,62
3,32
2,86
2,67
2,55
3,31
2,88
2,69
2,55
2,47
3,17
2,82
3,27
2,85
3,34
2,89
2,68
3,40
2,93
50
50
50
50
50
50
50
60
60
60
60
60
60
60
60
60
60
60
60
60
60
80
80
80
80
4
4
5
5
5
5
5
2
2
3
3
3
4
4
4
4
5
5
5
5
5
2
2
3
3
3
4
1
2
3
4
5
1
2
1
2
3
1
2
3
4
1
2
3
4
5
1
2
1
2
2,64
3,31
2,85
2,67
2,54
3,34
2,77
2,68
2,56
2,48
3,28
2,85
3,32
2,90
2,71
3,40
2,93
2,74
2,61
2,72
2,59
3,45
2,96
2,74
2,61
2,52
3,34
2,90
3,42
2,95
2,73
3,48
2,98
2,77
2,63
3,51
3,01
2,77
2,65
2,56
3,45
3,03
3,49
3,03
п
80
80
80
80
80
100
100
100
100
100
100
100
100
100
100
100
100
100
100
80
80
80
80
80
80
80
80
80
80
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
к
5
5
5
5
5
2
2
3
3
3
4
4
4
4
5
5
5
5
5
3
4
4
4
4
5
5
5
5
5
2
2
3
3
3
4
4
4
4
5
5
5
5
5
г
1
2
3
4
5
1
2
1
2
3
1
2
3
4
1
2
3
4
5
3,44
2,98
2,77
2,63
2,54
3,34
2,92
3,44
2,97
2,77
3,47
3,00
2,79
2,66
3,54
3,04
2,81
2,68
2,59
3
1
2
3
4
1
2
3
4
5
1
2
1
2
3
1
2
3
4
1
2
3
4
5
2,81
3,57
3,05
2,84
2,69
3,61
3,11
2,86
2,72
2,62
3,52
3,03
3,60
3,10
2,86
3,64
3,13
2,89
2,74
3,70
3,16
2,91
2,77
2,67
4.3 ] Критерии тренда и случайности 559
Из табл. 195 для а = 0,95, к = 4 и п = 20 находим критические значения Tii@,95) =
= 2,95; Ti2@,95) = 2,63; пз@,95) = 2,49 и п4@,95) = 2,39.
Так как r*i = 2,267 < Гц @,95) = 2,95; п2 = 2,34 < п2@,95) = 2,63; г*3 = 2,707 >
> 7i3@,95) = 2,49 и Тх*4 = 1,81 < 7i4@,95) = 2,39, то делаем следующий вывод: в выборке
имеются к = 3 значимых выброса и ими являются ж = 0, ж = 56иж = 58.
4.3.12.2. Критерии выбросов для экспоненциального распределения
и распределения Вейбулла
4.3.12.2.1. Критерии выбросов для экспоненциального распределения
4.3.12.2.1.1. Критерий Смоляка-Титаренко
Для экспоненциального распределения с плотностью распределения вероятно-
1 ^^
стей f(x) = т~е а наиболее „подозрительными" естественно считать наибольшие
А
наблюдения, как наименее вероятные. Смоляк и Титаренко [527] рассмотрели кри-
критерий, основанный на отношении величины наибольшего члена выборки к выбо™
рочному среднему:
где Х{ — г-е порядковое значение ряда х\^х^^ ..., а^, ..., хп.
Член выборки xn-k+i признается выбросом при Ск > С к (а). Критические зна-
значения Ckipt) приведены в табл. 196.
Задача 300. Для ряда данных
хц 7, 12, 15, 22, 26, 31, 34, 42, 48, 54, 61, 65, 68, 75, 80, 90, 103, 117, 132, 148
проверить наличие выбросов критерием Смоляка-Титаренко при доверительной веро-
вероятности а = 0,95.
Имеем
х = 61,5; & = — = — = 2,407.
х 61,5
При а = 0,95 и п = 20 из табл. 196 находим Ci@,95) = 5,408. Так как С\ не превы-
превышает соответствующего критического значения, то наибольшее значение не может быть
признано выбросом.
4.3.12.2.1.2. Критерий Бродского^Быцаня^Власенко
Критерии, рассмотренные в работе Бродского, Быцаня и Власенко [531], явля™
ются аналогами критерия Диксона (см. раздел 4.3.12.1.6) для случая экспоненци™
ального распределения.
Для экспоненциального распределения, записанного в форме
f(x) = \е-х*,
где А — интенсивность отказов, статистики критериев проверки выбросов имеют
вид [531]
— для проверки на выброс наибольшего значения хп при известном А:
z\ = Ажп_1, z2 = Х(хп - хп-{);
— для проверки на выброс наибольшего значения хп при неизвестном А:
Z'x ==
— для проверки на выброс наибольшего значения хп и наименьшего значения х\:
хп — хп~г
= .
Х\ — Х2
560
Проверка гипотез о значениях параметров распределений
[Гл.4
s
О
5
о
В
н
ф
ffl
сб
В
л
ч
я
ф
м
Ч
)СТЬ
в
н
о
ф
ffl
сб
в
л
ч
я
ф
ffl
о
ц
СО
со
О
О
СО
о
,_(
о
СО
О
О
о
со
о
ь-
СО
00
Is-
тН
г/)
СО
о
СО
СО
см
т-Н
СИ
ю
О)
СО
СО
СО
Is-
ю
СО
СМ
Is-
о
СО
ю
t—
СО
Си
on
t-
LO
СО
СО
СО
О
СО
т-Ч
^
СО
СЪ
СО
СО
СО
"^f
СП)
СО
С^
т-Ч
"xF
СО
Ю
СМ
Of)
Is-
СО
00
см
00
^
00
СО
t-
СО
Is-
С0
СО
ю
т-Н
СЛ
см
т-Ч
СО
ю
СО
тН
СО
СО
^
Is-
СЛ
СО
СО
СО
О)
т-Ч
00
СО
Is-
СО
00
^
О
т-Ч
ю
Is-
СО
О
СО
СЛ
см
см
^
ю
СО
т-Ч
СО
СО
СО
т-Ч
ю
СО
^
00
см
СЛ
СО
Ir-
ю
ю
00
СО
О
о
Ю
ю
ь-
С7)
СО
СО
СМ
со
см
^
СЛ
о^
т-Ч
СО
Is-
СО
СО
т-Ч
Is-
см
т-Ч
см
СЛ
^
О
00
СО
СМ
ю
см
т-Ч
-XF
00
О>
оо
00
СО
О
СИ
г/)
Ю
t-
о
"XF
СО
см
^
см
со
см
СО
оо
СО
СО
00
СО
СМ
СО
т-Ч
ю
см
см
ю
см
Is-
(Л
СМ
СЛ
ОО
СМ
СО
ю
Is-
со
ГЧ1
со
t-
о
о
LQ
ОО
ю
см
СО
со
см
СО
(Л
СО
СО
СО
о
СО
СО
ю
СО
ю
1—1
со
ю
см
СЛ
"xF
о
со
ю
СО
а>
о
о
ю
СО
со
со
^
о
СО
ю
СО
со
ю
СО
ю
см
СО
о
ю
Is-
т—1
СО
СЛ
СО
Ю
Ю
ОО
СО
СМ
со
00
ю
т-Ч
Is-
00
СЛ
СО
СМ
О
Ю
00
СО
ь-
О5
LQ
LO
00
СО
00
СО
^
СО
см
00
СО
т-Ч
ОО
00
СО
СМ
СО
О
00
00
т-Ч
О
t-
ю
00
СМ
т-Ч
см
ю
Is-
00
см
О)
о
Is-
СМ
СО
т-Н
о
о
ю
СО
СО
Ь-
Is-
00
ю
СО
т-Н
ю
ю
СО
СО
СМ
о
см
о
см
СО
Is-
00
ю
00
т-Ч
СМ
см
ю
Is-
C7i
СМ
т-Н
СМ
00
^
СО
СО
о
со
о
т-Ч
ю
со
СО
Ir-
t-
ю
т-Ч
СО
ОО
СМ
ОО
СО
СО
СО
ю
00
ю
см
00
см
Ю
СО
т-Ч
СО
О)
ю
СО
О
00
СМ
Is-
со
о
СО
см
00
Is-
о
Is-
т—1
ю
О)
т-Ч
•^н
СО
СО
О
Is-
^
СМ
т-Ч
"xt
СО
ю
со
ь-
см
а>
см
СО
СО
СО
т-Ч
О
СО
см
00
СО
СМ
СМ
ю
т-Н
СО
О)
т-Ч
О
ю
ю
Is-
о
1—1
Is-
со
т-Ч
Ю
т-Ч
СП
00
ir-
iron
со
СО
00
Is-
О)
СП
СО
ю
оо
LQ
Is-
см
СО
см
л>-
00
СО
СМ
т-Ч
со
со
LQ
см
см
СО
см
СО
Is-
о
т-Ч
ю
СО
ю
СО
т-Ч
СО
съ
т-Ч
ю
тН
СО
00
Is-
О)
СО
СО
СО
СМ
ю
^
Is-
СО
СО
СО
Is-
СО
00
СМ
т-Ч
т-Н
00
СО
тН
см
СО
со
со
см
ю
см
оо
о
СО
СО
О
О)
т-Ч
ю
t-
см
со
ч—|
см
см
ю
см
съ
00
Is-
т-Ч
I4-
00
00
ю
см
съ
СО
Is-
т—1
т-Ч
05
СМ
СО
СО
СО
00
т-Ч
СО
СО
LQ
см
оо
Is-
СО
СО
Is-
со
см
LQ
00
ел
Of)
т—1
см
ю
см
ю
тН
о»
t-
СО
t—
СО
Is-
ю
^
00
т-Ч
ю
СО
00
Is-
00
см
1—1
Is-
сл
СО
СЛ
О
ю
со
со
ю
СО
см
ю
СО
о
СО
ю
Си
см
см
О)
h-
см
о
(Л
Is-
Is-
со
Is-
СО
00
ю
^
СО
ю
СО
Си
о
ю
о
СО
ю
о
<Л
ю
СО
СО
т-Ч
Is-
см
съ
о
ю
СО
00
О
ю
о
т-Ч
см
^
со
о
СО
ю
00
Is-
О)
Is-
00
см
см
СО
^
Is-
СО
ю
СО
О
ю
^
т-Ч
т-Ч
СО
т-Н
тН
^
Is-
CD
СО
СО
Is-
Is-
см
о
Is-
ю
СО
СО
Is-
"^
ю
т-Ч
см
со
СО
о
СО
Ю
00
о
т-Ч
00
т-Ч
о
СО
СО
Is-
^
СМ
оо
СО
СО
ю
ю
»о
Is-
ч—1
СО
ч—1
00
т-Ч
о
ю
t-
СО
Is-
см
00
СМ
Is-
см
CD
СО
СО
ю
ю
LQ
см
см
Is-
см
ю
ю
со
см
00
см
о
о
Is-
СО
00
^
ю
ОО
Is-
СО
О
СО
СО
СМ
СО
СМ
^
см
см
00
со
СП
Is-
00
см
см
00
СО
СО
СМ
ел
ю
ю
СО
см
Is-
ю
ю
СО
ю
см
СО
СО
00
О)
о
о
СО
^
О
ОО
00
СО
Ю
СО
CD
00
СМ
СО
СО
О
ел
00
СО
О)
см
ел
см
СО
ir-
СО
00
СО
ю
со
сх>
со
Ю
о
со
00
С^
Is-
1—1
со
т-Ч
о
ю
Is-
со
СО
о
Ir-
Iron
СО
СО
СМ
СО
О0
^
ю
ю
СО
Is-
Is-
сл
см
00
СО
т-Ч
О
Is-
ю
ю
сх>
со
см
00
ю
С75
т-Ч
ю
00
00
ю
см
со
о
ю
Is-
о
Is-
ю
tr-
trio
О)
СО
СО
Is-
т—1
со
т-Ч
О
ir-
iron
СМ
о
СО
СО
СО
00
СО
СМ
ю
Is-
ю
СО
сл
см
00
СО
О
сл
ю
см
О
CD
00
СМ
СО
СО
^
О
Is-
ч-Ч
ю
см
см
т-Ч
г-
о
00
СО
О
Is-
'xf
ь-
о
Ir-
Iron
СО
О
СО
CD
Is-
00
СО
О
О
00
LQ
t-
СО
О
^
СМ
оо
ю
О
ОО
СО
00
т-Ч
О
сл
СО
СМ
ю
см
т-Ч
ь-
ю
СО
см
СО
т—1
см
ю
^
см
СО
т-Ч
t-
т—1
т-Ч
т—1
СО
СО
СМ
СО
Is-
00
ю
00
СО
Is-
О)
см
ю
о
СО
см
t-
00
СО
СО
^
ю
о
СО
ю
Is-
ю
см
Is-
о
О)
00
СО
ю
СО
О
Is-
ю
^
со
00
т-Ч
Is-
см
ю
т-Ч
СО
СО
СО
(Л
СО
СМ
сл
00
ю
да
00
СО
О
ю
сл
т-Ч
т-Ч
СО
О
г\1
00
СО
Is-
см
ю
^
Is-
со
СО
ю
О)
т-Ч
00
Is-
ю
см
00
ю
СО
Is-
т—1
СО
^
Is-
СО
СМ
Is-
см
О)
т-Ч
СО
ОО
О
О
^
ю
СО
сл
ю
о
СО
о
ю
ч—1
on
т-Ч
СО
Of)
00
00
00
ю
^
ю
см
ю
00
I4-
СО
Ir-
о
о
т-Ч
ю
см
со
СО
СМ
со
СО
^
Is-
00
СМ
ь-
о
СО
см
СО
ОО
о
Is-
JN-
СЛ
ю
т-Н
Is-
со
CD
СО
СО
о
^
Ю
ОО
СО
ir-
iron
СО
СМ
ОО
СО
00
о
^
о
см
о
СО
см
4.3] Критерии тренда и случайности 561
Для статистик перечисленных критериев получены полезные результаты [531]:
п-2
х) = 1 - {l - d+^j" 2
_ д);
J = l
Р(*2 ? х) = е~х- P(z4 > аг) = (п - 2)!A - ж)"-3 Ц 1 + ^ _
i=i
Если принятый уровень значимости а меньше, чем любая из указанных вероят™
ностей (в зависимости от используемого критерия), гипотеза о наличии выбросов
отклоняется.
Задача 301. Для данных задачи 300 проверить наличие выбросов критериями гз и z^
настоящего раздела на уровне значимости а = 0,05.
1 до -I on 1 до -| on
Имеем z3 = = 0,113; z4 = = 0,1176. Вычисляем ?(z3 ^ 0,113) =
148 —- 7 148 —- 12
1
= B0 - 1)! • A - 0,ИЗI8 • ТТ = 0,7262.
v } l ' ; 11 1 + 7- A-0,113)
j=1 -+j-A-0,113)
Так как Р(^з ^ 0,113) = 0,726 > а = 0,05, то наибольшее значение не является выбро-
выбросом.
Аналогично для z^ = 0,1176 имеем Р(^4 ^ 0,1176) = 0,7207, что также больше 0,05 и,
следовательно, также отклоняет гипотезу наличия выброса.
4.3.12.2.1.3. Критерий Кимбера для нескольких выбросов
Кимбер [532] предложил по аналогии с критерием Роснера (см. раздел 4.3.12.1.9)
последовательную процедуру для выявления нескольких выбросов в выборке из экс™
поненциального распределения. Статистика критерия Кимбера Sj для выделения j
наибольших выбросов имеет вид [532]
г=1
Если Sj(a) — критическое значение статистики, то правило принятия решения
по гипотезе включает в себя следующую последовательность операций. Если для
г = 1,2, . ..,& имеет место Si < ЯДа), то с достоверностью а признается, что к
наибольших наблюдений в выборке не являются выбросами. Если Si > Si (а) для
г = &, & — 1, ..., j + 1 и 5j > Sj(a), то j наибольших наблюдений являются выбро-
выбросами. Если Sk > Sfc(a), то к наибольших наблюдений являются выбросами.
Для выделения нижних выбросов используется статистика
А — 1 *? Г) — Л
Очевидно, что S* = Sn^j. Процедура выделения к нижних выбросов аналогич™
на процедуре выделения к верхних выбросов, но с заменой S^, Sk-i, ..., Si на
Ski^k-ii •••?'S'i- Критические значения Sj(a) для выделения нижних и верхних
выбросов приведены в табл. 197 и 198.
562
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 197
Критические значения Sj(ol) статистики Кимбера
для выделения j верхних выбросов [532]
п
Доверительная
0,95
3
1
2
3
4
вероятность а
0,99
3
1
2
3
4
к = 2
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
35
40
45
50
60
70
80
90
100
120
140
0,4830
0,4530
0,4270
0,4030
0,3830
0,3640
0,3470
0,3320
0,3180
0,3060
0,2940
0,2730
0,2560
0,2400
0,2270
0,2150
0,1900
0,1710
0,1550
0,1420
0,1220
0,1070
0,0960
0,0869
0,0894
0,0679
0,0595
0,4340
0,4010
0,3720
0,3480
0,3270
0,3080
0,2920
0,2770
0,2640
0,2520
0,2410
0,2220
0,2060
0,1930
0,1810
0,1710
0,1500
0,1340
0,1210
0,1110
0,0470
0,0630
0,0740
0,0670
0,0612
0,0523
0,0459
0,5700
0,5360
0,5060
0,4800
0,4560
0,4350
0,4150
0,3980
0,3810
0,3660
0,3530
0,3280
0,3070
0,2890
0,2730
0,2580
0,2290
0,2050
0,1860
0,1710
0,1470
0,1290
0,1150
0,1040
0,0948
0,0809
0,0707
0,5140
0,4750
0,4410
0,4120
0,3870
0,3640
0,3450
0,3270
0,3120
0,2970
0,2840
0,2620
0,2420
0,2260
0,2120
0,2000
0,1750
0,1560
0,1400
0,1280
0,1090
0,0955
0,0885
0,0767
0,0699
0,0597
0,0521
к = 3
15
16
17
18
19
20
22
24
26
28
30
35
40
45
50
60
0,3800
0,3630
0,3470
0,3330
0,3250
0,3130
0,2910
0,2690
0,2510
0,2360
0,2290
0,1980
0,1790
0,1660
0,1470
0,1270
0,3210
0,3040
0,2880
0,2740
0,2660
0,2550
0,2350
0,2140
0,2000
0,1880
0,1800
0,1550
0,1400
0,1280
0,1140
0,0973
0,3060
0,2870
0,2710
0,2570
0,2480
0,2360
0,2160
0,1960
0,1830
0,1700
0,1630
0,1390
0,1250
0,1130
0,1010
0,0860
0,4520
0,4320
0,4120
0,3950
0,3800
0,3660
0,3430
0,3210
0,3020
0,2830
0,2680
0,2390
0,2130
0,1930
0,1790
0,1540
0,3790
0,3590
0,3390
0,3220
0,3070
0,2940
0,2720
0,2520
0,2350
0,2190
0,2060
0,1820
0,1600
0,1450
0,1330
0,1130
0,3590
0,0337
0,3160
0,2990
0,2840
0,2700
0,2480
0,2280
0,2120
0,1960
0,1840
0,1600
0,1410
0,1260
0,1160
0,0983
4.3]
Критерии тренда и случайности
563
п
Доверительная
0,95
3
1
2
3
4
Окончани
е т а б л
вероятность а
нцы 197
0,99
3
1
2
3
4
к = 3
70
80
90
100
120
0,1110
0,1030
0,0932
0,0853
0,0626
0,0852
0,0781
0,0706
0,0636
050476
0,0751
0,0685
0,0706
0,0559
0,0417
0,1330
0,1190
0,1090
0,0994
0,0727
0,0981
0,0873
0,0796
0,0726
0,0532
0,0849
0,0754
0,9685
0,0624
0,0458
к = 4
20
22
24
26
28
30
35
40
45
50
60
70
80
90
100
120
140
0,3210
0,2990
0,2800
0,2630
0,2480
0,2350
0,2080
0,1870
0,1690
0,1550
0,1340
0,1170
0,1050
0,0948
0,0866
0,0740
0,0647
0,2610
0,2400
0,2230
0,2080
0,1950
0,1840
0,1610
0,1440
0,1300
0,1190
0,1010
0,0888
0,0792
0,0715
0,0653
0,0588
0,0488
0,2410
0,2210
0,2030
0,1890
0,1760
0,1660
0,1440
0,1280
0,1150
0,1050
0,0892
0,0779
0,0693
0,0625
0,0571
0,0487
0,0426
0,2350
0,2130
0,1950
0,1800
0,1680
0,1570
0,1360
0,1200
0,1070
0,0974
0,0826
0,0719
0,0639
0,0576
0,0525
0,0447
0,0391
0,3770
0,3510
0,3290
0,3090
0,2920
0,2770
0,2450
0,2200
0,2000
0,1830
0,1570
0,1380
0,1230
0,1110
0,1010
0,0866
0,0756
0,3020
0,2780
0,2580
0,2400
0,2250
0,2120
0,1850
0,1650
0,1490
0,1360
0,1115
0,1010
0,0897
0,0809
0,0737
0,0628
0,0546
0,2770
0,2530
0,2330
0,2160
0,2010
0,1890
0,1630
0,1440
0,1300
0,1180
0,0998
0,0869
0,0772
0,0695
0,0633
0,0538
0,0470
0,2690
0,2430
0,2220
0,2050
0,1900
0,1770
0,1520
0,1340
0,1200
0,1080
0,0915
0,0795
0,0704
0,0633
0,0576
0,0489
0,0270
Задача 302. Для ряда данных задачи 300 проверить наличие выбросов критерием
Кимбера при доверительной вероятности а = 0,95.
Вычисляем
132
?*«
г=1
148 х19
= U,IzU; D2 =
1230
19 1082
?*«
г=1
= 0,122;
= = 0,123;
950
—^ = = 0,124.
!7 833
г=1
Используя табл. 197 для п = 20, а = 0,95, к = 4, убеждаемся, что S^ = 0,124 <
< Я4@,95) = 0,235, и по аналогии S3 < Я3@,95), S2 < Я2@,95), Si < Si @,95). Следо-
Следовательно, верхних выбросов в выборке нет.
Проверяем нижние выбросы. Имеем
Ж1 + Ж2 19
= В= 0,632;
19
о* _
Оч —
Х4
= | =0,393;
^ = Н = 0j441;
Х\ + Х2 + 3?з 34
= * = 0,317.
82
564
Проверка гипотез о значениях параметров распределений
[Гл.4
Обратившись к табл. 198 (к = 4), убеждаемся, что
ЯГ > ЯГ @,95) = 0,596; S%< S?@,95) = 0,717;
*^з < 5*3 @,95) = 0,868; Si < ^4@,95) = 0,988.
Следовательно, только первое нижнее значение (х\ =7) является выбросом.
Таблица 198
Критические значения Sj (еж) критерия Кимбера
для выделения j нижних выбросов [532]
п
Доверительная
0,95
3
1
2
3
4
вероятность а
1
0,
2
99
3
4
к = 2
10
15
20
50
100
200
0,977
0,977
0,976
0,975
0,975
0,975
0,837
0,829
0,825
0,819
0,817
0,816
0,996
0,995
0,995
0,995
0,995
0,995
0,921
0,917
0,915
0,911
0,910
0,910
к = 3
15
20
50
100
200
0,984
0,984
0,983
0,983
0,983
0,855
0,852
0,846
0,845
0,843
0,705
0,698
0,687
0,683
0,681
0,997
0,997
0,997
0,997
0,997
0,931
0,929
0,926
0,925
0,925
0,808
0,802
0,792
0,789
0,788
к = 4
20
50
10
200
0,988
0,987
0,987
0,987
0,868
0,863
0,861
0,860
0,717
0,706
0,702
0,700
0,596
0,580
0,575
0,573
0,998
0,998
0,997
0,997
0,938
0,935
0,934
0,934
0,817
0,807
0,804
0,803
0,693
0,677
0,672
0,671
4.3.12.2.2. Критерии выбросов для распределения Вейбулла
В [522, 534^537] представлен достаточно полный набор различных методов вы-
выявления вв1бросов в выборках, большинство из которых рассмотрено выше. В [533]
рассмотрены методы трансформации статистик известных критериев для обнару-
обнаружения выбросов в выборках, извлекаемых из генеральных совокупностей, имеющих
распределение Вейбулла.
Для выделения верхних выбросов статистиками критериев являются:
— критерии типа Груббса [522]
G =
Si-
'n —fe + l, ...,п
п-к
где S =
— х) :
1
п
п-к
— критерии типа Диксона [524, 636]
Xn - X!
Ч Rs =
4.3]
Критерии тренда и случайности
565
Для выделения нижних выбросов статистиками критериев являются
— критерии типа Груббса
G* =
sl...,k=
i=k+l
i=k+l
— критерии типа Диксона
Xn-l — '•
E* =
Xk + l
Критические значения G(a) и Ri(a) приведены в табл. 199, G^(a) и R*(a) —
в табл. 200.
При G < G(pt) и Rjs > Rkipt) в выборке признается наличие к верхних выбросов.
При Grjf < GJI(a) и R^ > R^(ol) — признается наличие к нижних выбросов.
Задача 303. Для выборки наблюдений (п = 20)
хц 2 3 11 14 19 25 26 31 39 41
46 54 59 65 71 81 95 120 138 154
проверить наличие в выборке выбросов критериями Груббса и Диксона для распределе-
распределения Вейбулла при доверительной вероятности а = 0,95.
В нашем случае п = 20, хп = 154, х\ = 2.
Результаты вычислений сводим в таблицу, используя критические значения из
табл. 199 и 200 при п = 20, к = 1, 2, 3 и а = 0,95:
Статистика
Хп^к+1
Я2
^п-к+1
Хп^к
Ri
Ei @,95)
R<2
Я2@595)
Яз
Яз@595)
Gk
Gk@,95)
к
1
49,474
26459
138
0,105
0,18
0,106
0,21
0,112
0,24
0,718
0,78
2
44,55
18186
120
0,224
0,24
0,225
0,29
0,238
0,29
0,494
0,65
3
40,12
12160
95
0,388
0,29
0,391
0,34
0,412
0,34
0,33
0,54
Статистика
Хк
Я2
^к
Хк + 1
RI
i?i@,95)
Ri
Д5(О,95)
Ез
Дз@,95)
GI
Cfc@,95)
к
1
57,47
33915
3
0,0066
0,46
0,0073
0,49
0,0085
0,51
0,921
0,41
2
60,5
30782
11
0,059
0,56
0,066
0,59
0,076
0,61
0,836
0,27
3
63,42
28188
14
0,079
0,61
0,088
0,64
0,1016
0,67
0,765
0,19
Из таблицы следует, что три наибольших наблюдения Xi = 120, 138 и 154 признаются
выбросами, так как для них G3 = 0,330 < G3@,95) = 0,54 и R1 = 0,388 > #i@,95) = 0,29,
R2 = 0,391 > Д2@,95) = 0,34, R3 = 0,412 > Д3@,95) = 0,34. Так как G*k > G%{ol), to ниж-
нижние выбросы в выборке отсутствуют.
4.3.12.3. Критерий выбросов для любого непрерывного распределения
(критерий Дарлинга)
Для любого непрерывного распределения, определенного с точностью до пара™
метров, Дарлинг [538] предложил критерий, основанный на статистике 1п = У^ттт—Ч"
для проверки на выброс наибольшего (наименьшего) наблюдения.
566
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 199
Критические значения Сг(ск) и Жг(ск) критериев типа
Груббса и Диксона для выявления к верхних выбросов
в выборке, имеющей распределение Вейбулла [533]
п
G
0,
Ri
Доверительная
90
R2
Rs
вероятность а
G
0,
Ri
95
R2
Rs
к = 1
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0,30
0,41
0,49
0,55
0,60
0,64
0,67
0,69
0,71
0,74
0,75
0,77
0,78
0,79
0,80
0,81
0,46
0,38
0,32
0,28
0,26
0,24
0,22
0,20
0,19
0,18
0,17
0,17
0,16
0,16
0,15
0,14
0,67
0,53
0,44
0,38
0,34
0,31
0,28
0,26
0,25
0,23
0,22
0,21
0,20
0,19
0,18
0,18
0,90
0,70
0,57
0,48
0,42
0,37
0,34
0,31
0,29
0,27
0,25
0,24
0,23
0,22
0,21
0,20
0,20
0,31
0,41
0,48
0,53
0,58
0,61
0,65
0,67
0,69
0,71
0,73
0,75
0,76
0,77
0,78
0,55
0,46
0,38
0,34
0,32
0,29
0,27
0,25
0,24
0,22
0,21
0,21
0,20
0,19
0,18
0,18
0,76
0,62
0,52
0,45
0,40
0,37
0,34
0,32
0,30
0,28
0,26
0,25
0,24
0,23
0,22
0,21
0,95
0,79
0,66
0,56
0,49
0,44
0,40
0,37
0,35
0,32
0,30
0,29
0,28
0,26
0,25
0,24
к = 2
8
9
10
11
12
13
14
15
16
17
18
19
20
0,32
0,38
0,42
0,47
0,50
0,54
0,56
0,59
0,61
0,63
0,65
0,67
0,69
0,43
0,39
0,35
0,32
0,29
0,28
0,26
0,25
0,24
0,23
0,22
0,21
0,20
0,56
0,49
0,44
0,40
0,37
0,35
0,32
0,31
0,29
0,28
0,27
0,26
0,25
0,68
0,59
0,52
0,48
0,44
0,40
0,38
0,36
0,34
0,32
0,31
0,29
0,28
0,25
0,31
0,37
0,41
0,45
0,48
0,51
0,55
0,57
0,59
0,62
0,63
0,65
0,49
0,44
0,40
0,37
0,34
0,32
0,31
0,29
0,28
0,27
0,26
0,25
0,24
0,62
0,56
0,50
0,46
0,43
0,40
0,37
0,35
0,34
0,32
0,31
0,30
0,29
0,75
0,66
0,59
0,54
0,50
0,46
0,43
0,40
0,38
0,36
0,35
0,34
0,32
к = 3
10
12
14
16
18
20
0,29
0,38
0,45
0,50
0,55
0,58
0,44
0,37
0,33
0,29
0,27
0,25
0,56
0,46
0,40
0,36
0,33
0,30
0,66
0,54
0,46
0,41
0,37
0,34
0,24
0,32
0,39
0,45
0,50
0,54
0,50
0,42
0,37
0,34
0,31
0,29
0,62
0,52
0,45
0,40
0,37
0,34
0,72
0,60
0,51
0,46
0,41
0,38
Здесь F(xi) = Р(ж < Xi) — функция распределения вероятностей в точке х = Х{.
При п > 3 распределение 1п близко к нормальному со средним МAП) и диспер-
дисперсией D(In), где
МA„) =
D(/n) =
п- 1
4.3]
Критерии тренда и случайности
567
Таблица 200
Критические значения G* (а) и Д*(ск) критериев типа
Груббса и Диксона для выявления к нижних выбросов
в выборке, имеющей распределение Вейбулла [533]
п
0,
щ
Доверительная
90
Щ
Щ
вероятность а
G*
0,
Щ
95
Щ
Щ
к = 1
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0,11
0,16
0,20
0,25
0,28
0,31
0,34
0,36
0,38
0,40
0,42
0,43
0,45
0,46
0,48
0,49
0,67
0,60
0,56
0,53
0,51
0,49
0,47
0,46
0,45
0,44
0,43
0,43
0,42
0,41
0,40
0,39
0,79
0,70
0,64
0,60
0,57
0,54
0,52
0,49
0,49
0,47
0,46
0,45
0,44
0,43
0,43
0,42
0,94
0,80
0,72
0,66
0,61
0,58
0,55
0,53
0,51
0,50
0,49
0,47
0,46
0,46
0,44
0,44
0,07
0,10
0,14
0,18
0,20
0,24
0,26
0,28
0,30
0,32
0,34
0,35
0,37
0,38
0,40
0,41
0,74
0,68
0,64
0,60
0,58
0,56
0,55
0,53
0,52
0,51
0,50
0,50
0,49
0,48
0,47
0,46
0,86
0,77
0,71
0,67
0,64
0,61
0,59
0,56
0,56
0,54
0,53
0,52
0,51
0,50
0,50
0,49
0,97
0,87
0,79
0,74
0,69
0,65
0,62
0,61
0,58
0,57
0,56
0,55
0,53
0,53
0,51
0,51
к = 2
8
9
10
11
12
13
14
15
16
17
18
19
20
0,10
0,13
0,15
0,18
0,20
0,22
0,23
0,25
0,27
0,28
0,30
0,31
0,32
0,67
0,64
0,62
0,60
0,58
0,57
0,55
0,54
0,53
0,52
0,52
0,51
0,50
0,75
0,71
0,68
0,65
0,63
0,61
0,60
0,58
0,56
0,56
0,55
0,54
0,53
0,82
0,76
0,72
0,69
0,66
0,64
0,62
0,61
0,59
0,58
0,57
0,56
0,55
0,07
0,09
0,11
0,13
0,15
0,17
0,18
0,20
0,22
0,23
0,25
0,26
0,27
0,73
0,70
0,68
0,65
0,64
0,62
0,61
0,60
0,59
0,58
0,57
0,57
0,56
0,80
0,76
0,73
0,71
0,68
0,67
0,65
0,64
0,62
0,61
0,60
0,59
0,59
0,86
0,81
0,77
0,75
0,72
0,70
0,68
0,66
0,65
0,64
0,63
0,62
0,61
к = 3
10
12
14
16
18
20
0,08
0,12
0,15
0,18
0,21
0,23
0,70
0,66
0,63
0,61
0,58
0,57
0,76
0,71
0,67
0,64
0,61
0,60
0,82
0,75
0,70
0,67
0,64
0,62
0,06
0,09
0,12
0,14
0,17
0,19
0,75
0,71
0,68
0,65
0,63
0,61
0,80
0,75
0,72
0,68
0,66
0,64
0,86
0,79
0,74
0,71
0,69
0,67
т. е. если
то с вероятностью а нижнее (верхнее) выборочное значение признается выбросом
(ча — «-квантиль стандартного нормального распределения).
568 Проверка гипотез о значениях параметров распределений [Гл. 4
В [539, 540] предложена модификация критерия Дарлинга, имеющая большую
мощность, чем исходный критерий. Предложены статистики:
— для проверки на выброс наибольшего значения хп
для проверки на выброс наименьшего значения х\
При L (L*) ^ xlt [^(п — 1)] в выборке отсутствуют выбросы, при L (L*) < %^[2(п — 1)]
хп (xi) является выбросом. Здесь %^,[2(п —1)] — «-квантиль %2-распределения
с / = 2 (п — 1) степенями свободы.
При нормальном исходном распределении мощность этого критерия по сравне-
сравнению с критерием Груббса падает не более, чем на 20%.
Задача 304. Для ряда значений выборки, взятой из экспоненциального распределения
1 / х\
с плотностью f{x) = — ехр I \ и параметром X = 21,5:
А \ А/
хц 1, 4, 9, 16, 23, 24, 28, 31, 56, 63
проверить наличие выбросов критерием Дарлинга при доверительной вероятности
а = 0,95.
Функция нашего распределения F(x) = 1 —- ехр I —
21,5
Находим
F(Xl) = 1 - ехр (-^) = 0.0454; F(x2) = 1 ^ ехр (-^) = 0Д627;
= 0,342; F(a;4) = 0,5249; F(x5) = 0,6569; F(x6) = 0,67256;
F(x7) = 0,7281; F(x8) = 0,7635; F(x9) = 0,9251; F(x10) = 0,9466.
Далее вычисляем
0,9466 /
=21,736.
Из табл. 55 находим Xo,9sB • 9) = 28,869. Так как L = 21,736 < 28,869, то с вероятно™
стью 0,95 наибольшее значение в выборке хп = 63 следует считать выбросом.
Вычислим теперь
L* = -2 • Y^ In 1 - ~F(Xi+1} = -2 • (-2,03859 - 1,1689 - ... - 0,05756) = 11,4622.
Сравнением L* = 11,46 < Хо,9бA8) = 28,869 убеж:даемся, что наименьюаее значение
х\ = 1 также является выбросом.
4.4] Толерантные пределы 569
4.4. Толерантные пределы
Ценную в практическом отношении информацию о распределении наблюдаемой
случайной величины дают границы интервала, в котором с заданной вероятно™
стью а будет находиться /3-я часть совокупности значений случайной величины.
Такие интервалы (или пределы, в случае односторонних интервалов) называются
толерантными.
Например, широко используемый показатель при нормировании характеристик
надежности технических изделий — 7™РесУРс5 определяемый значением наработки
изделия, при котором доля дефектных изделий в партии не будет превышать
A — 7M в математической статистике интерпретируется как односторонний толе-
толерантный предел при j = /3.
4.4.1. Толерантные пределы в случае нормального распределения
4.4.1.1. Толерантные пределы при известных параметрах распределепим
(// и а2)
Двусторонний симметричный относительно ц интервал имеет вид
2 2
Односторонние толерантные интервалы равны
(-оо; fi + u^a] и [/i - и^а; оо) ,
где и? — е-квантиль стандартного нормального распределения.
Задача 305. Найти двусторонний толерантный интервал^ в котором будет нахо-
находиться 75% всей совокупности значений нормально распределенной случайной величи-
величины с параметрами распределения /л = 101 и а = 24,8.
В нашем случае /3 = 0,75 и
и i+o,75 = ^о,875 « 4,91 • @,875ОД4 - 0Д250'14) = 1,149.
2
Тогда искомый интервал ограничен величинами
101 - 1,149 • 24,8 = 72,5 и 101 + 1,149 • 24,8 = 129,5.
Таким образом, в интервале от 72,5 до 129,5 будет находиться 75% всех значений
случайной величины.
4.4.1.2. Толерантные пределы при неизвестных параметрах распреде лепим
4.4.1.2.1. Среднее /л неизвестно, дисперсим и2 известна
Для односторонних толерантных интервалов (^оо;тв] и [тн;оо), где
тв = х + а(п, а, /3)а и тн = х — а(п, а, /3)сг, справедливо утверждение о том, что /3-я
часть совокупности значений случайной величины х с вероятностью а находится
в каждом из них.
Множитель а(п,а,/3) является решением уравнения
откуда следует, что а(п,а,/3) = и@ -\—т=, где и1—7™квантиль стандартного нор™
мального распределения, Ф — функция Лапласа.
570
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 201
Множители а(те9 ск, /3) длм построения
односторонних толерантных пределов
в случае нормального распределения
(/л неизвестно, сг2 известно) [56]
п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100
200
300
400
500
1000
оо
а
0,90
0,90
2,563
2,188
2,021
1,922
1,855
1,805
1,766
1,735
1,709
1,687
1,668
1,652
1,637
1,624
1,612
1,602
1,592
1,584
1,576
1,568
1,538
1,516
1,498
1,484
1,473
1,463
1,447
1,435
1,425
1,417
1,410
1,372
1,356
1,346
1,339
1,322
1,282
0,95
2,926
2,551
2,385
2,286
2,218
2,168
2,129
2,098
2,072
2,050
2,031
2,015
2,000
1,987
1,976
1,965
1,956
1,947
1,939
1,931
1,901
1,879
1,861
1,847
1,836
1,826
1,810
1,798
1,788
1,780
1,773
1,735
1,719
1,709
1,702
1,685
1,645
0,99
3,608
3,233
3,066
2,967
2,899
2,850
2,811
2,779
2,754
2,732
2,713
2,695
2,682
2,669
2,657
2,647
2,637
2,628
2,620
2,613
2,583
2,560
2,543
2,529
2,517
2,508
2,492
2,480
2,470
2,461
2,455
2,417
2,400
2,390
2,384
2,367
2,326
0,95
0,90
2,926
2,445
2,231
2,104
2,017
1,953
1,903
1,863
1,830
1,802
1,777
1,756
1,738
1,721
1,706
1,693
1,680
1,669
1,659
1,649
1,611
1,582
1,560
1,542
1,527
1,514
1,494
1,478
1,465
1,455
1,446
1,398
1,377
1,364
1,355
1,334
1,282
0,95
3,290
2,808
2,595
2,467
2,380
2,316
2,267
2,226
2,193
2,165
2,141
2,120
2,101
2,084
2,070
2,056
2,044
2,033
2,022
2,013
1,974
1,945
1,923
1,905
1,890
1,877
1,857
1,841
1,829
1,818
1,809
1,761
1,740
1,727
1,718
1,697
1,645
0,99
35971
3,489
3,276
3,149
3,062
2,998
2,948
2,908
2,875
2,846
2,822
2,801
2,783
2,766
2,751
2,738
2,725
2,714
2,704
2,694
2,655
2,627
2,604
2,586
2,572
2,559
2,539
2,523
2,510
2,500
2,491
2,443
2,421
2,409
2,400
2,378
2,326
Значения множителей а(п,а,/3) приведены в табл. 201.
Для двусторонних толерантных интервалов (тВ1тп) справедливы формулы
тв = х + а* (в,
тн = х — а* (п, а, /3) а.
Для них справедливо утверждение, что с вероятностью а /3-я часть распределе-
распределения случайной величины х заключена в промежутке [тн;тв]. Значения множителей
4.4]
Толерантные пределы
571
Таблица 202
Множители а* (П) о, /3) длм построения
двусторонних толерантных интервалов
в случае нормального распределения
(/л неизвестно, сг2 известно) [56]
п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100
200
300
400
500
1000
оо
а
0,90
C
0,90
2,927
2,446
2,236
2,114
2,034
1,977
1,935
1,902
1,875
1,854
1,836
1,821
1,808
1,797
1,788
1,779
1,772
1,765
1,759
1,753
1,732
1,718
1,708
1,700
1,694
1,689
1,682
1,677
1,673
1,670
1,667
1,656
1,653
1,651
1,650
1,648
1,645
0,95
3,290
2,809
2,597
2,473
2,390
2,330
2,285
2,250
2,222
2,198
2,179
2,162
2,148
2,136
2,125
2,115
2,107
2,099
2,092
2,086
2,062
2,046
2,034
2,025
2,018
2,012
2,004
1,998
1,993
1,990
1,987
1,974
1,969
1,967
1,966
1,963
1,960
0,99
3,972
3,490
3,277
3,152
3,068
3,003
2,955
2,917
2,886
2,861
2,839
2,821
2,805
2,790
2,778
2,767
2,757
2,748
2,740
2,733
2,704
2,684
2,670
2,659
2,650
2,643
2,632
2,625
2,619
2,614
2,610
2,594
2,588
2,585
2,582
2,579
2,576
0,95
/5
0,90
3,242
2,668
2,415
2,265
2,165
2,093
2,030
1,996
1,961
1,933
1,900
1,889
1,872
1,857
1,844
1,832
1,822
1,812
1,804
1,797
1,767
1,748
1,733
1,723
1,714
1,708
1,697
1,690
1,684
1,680
1,677
1,661
1,656
1,653
1,651
1,649
1,645
0,95
3,605
3,031
2,778
2,627
2,525
2,451
2,395
2,350
2,313
2,283
2,258
2,236
2,218
2,201
2,187
2,174
2,163
2,152
2,143
2,135
2,102
2,080
2,063
2,051
2,041
2,033
2,022
2,013
2,007
2,002
1,998
1,979
1,973
1,970
1,967
1,954
1,960
0,99
4,287
3,713
3,459
3,308
3,205
3,130
3,073
3,024
2,986
2,954
2,926
2,903
2,882
2,864
2,848
2,834
2,821
2,809
2,799
2,789
2,751
2,725
2,706
2,691
2,679
2,669
2,655
2,644
2,636
2,629
2,624
2,601
2,593
2,589
2,585
2,581
2,576
а*(п, а,/3), являющиеся решением уравнения
Ф[ ui+a —=
—^= - a*(n,a,j3) ) = /3
приведены в табл. 202.
572 Проверка гипотез о значениях параметров распределений [Гл. 4
Задача 306. Имеется выборка из нормального распределения с известной дисперсией
а2 = 54 и неизвестным средним
Хг: 1, 3, 6, 14, 18, 24, 31, 41, 61, 63.
Необходимо найти односторонние толерантные пределы и двусторонний доверитель-
доверительный интервал при а = 0,95 и /3 = 0,90.
Имеем х = 26. Воспользовавшись табл. 201 и 202, находим значения множителей
а(п,а,/3) = аA0; 0,95; 0,90) = 1,802 и a*(n,a,j3) = а*A0; 0,95; 0,90) = 1,933.
Тогда односторонние толерантные пределы равны
тв = 26 + 1,802 • V54 = 39,24; тн = 26 - 1,802 • Vm = 12,76.
Для двустороннего интервала имеем
тв = 26 + 1,933 • \/ы = 40,20; тн = 26 - 1,933 • \/ы = 11,79.
Таким образом, можно утверждать с вероятностью а = 0,95, что в каждом из интер-
интервалов (-оо; 39,24]; [12,76; оо), [11,79; 40,20] находится 90% (/3 = 0,90) всей совокупности
значений случайной величины.
4.4.1.2.2. Среднее /л известно, дисперсия ст2 неизвестна
Односторонние доверительные интервалы находятся по формулам
тв = ц + 6(n, a, /3)s; тн = ц — Ь(п, а, /3)s,
где
Xi-a(n) ~ A ~ ск)-квантиль распределения хи~квадрат с / = п степенями свободы;
up — /3-квантиль стандартного нормального распределения.
Толерантные множители Ь(в,а,/3) приведены в табл. 203.
Двусторонний толерантный интервал определятся из соотношения
тв = /л + Ь*(в,а, /3) s; тн = /х - Ь*(п, а,/3) 5, где Ь*(п, а,/3) = wi+
Толерантные множители Ь*(п,а,/3) приведены в табл. 204.
Задача 307. Для данных задачи 306 найти толерантные пределы, исходя из того,
что среднее ц = 26 считается известным, а значение дисперсии неизвестно (а = 0,95,
/3 = 0,90).
1 ю
Вычисляем Я2 = — • J^(Xi ~ 26J = 49°596 (^ = 21Д)- Из табл- 203 и 204 находим
г=1
толерантные множители Ь(п,а,/3) = 6A0,0,95,0,90) = 2,042 для односторонних пределов
и b*(n,a,f3) = Ь* A0, 0,95; 0,90) = 2,620 для двустороннего интервала.
Окончательно имеем для односторонних толерантных пределов
тв = 26 + 2,042 • 21,7 = 70,31; тн = 26 - 2,042 • 21,7 = -18,31.
и для двустороннего интервала
тв = 26 + 2,620 • 21,7 = 82,85; тн = 26 - 2,620 • 21,7 = -30,85.
Следовательно, можно утверждать, что с вероятностью а = 0,95 в каждом из интер-
интервалов (-оо; 70,31]; [-18,31; оо); [-30,85; 82,85] находится 90% (/3 = 0,90) всей совокупно»
сти значений случайной величины х.
4.4]
Толерантные пределы
573
Таблица 203
Множители &(то9 о, /3) длм построения
односторонних толерантных пределов
в случае нормального распределения
(/л известно, и2 неизвестно) [56]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100
200
300
400
500
1000
оо
а
0,90
/з
0,90
3,948
2,904
2,485
2,258
2,114
2,014
1,940
1,883
1,837
1,800
1,768
1,741
1,718
1,698
1,680
1,664
1,650
1,637
1,625
1,579
1,547
1,523
1,504
1,489
1,476
1,456
1,441
1,430
1,420
1,412
1,371
1,353
1,343
1,336
1,320
1,282
0,95
6,067
3,727
3,190
2,898
2,714
2,586
2,491
2,417
2,358
2,310
2,269
2,235
2,205
2,179
2,156
2,136
2,117
2,101
2,085
2,026
1,985
1,954
1,930
1,911
1,895
1,869
1,850
1,835
1,823
1,812
1,759
1,737
1,724
1,709
1,694
1,645
0,99
7,167
5,271
4,511
4,099
3,838
3,657
3,522
3,418
3,335
3,267
3,210
3,161
3,119
3,082
3,049
3,020
2,994
2,971
2,949
2,866
2,807
2,764
2,730
2,702
2,680
2,644
2,617
2,595
2,578
2,563
2,488
2,456
2,438
2,417
2,395
2,326
0,95
0,90
5,659
3,742
3,040
2,677
2,455
2,303
2,193
2,108
2,042
1,987
1,942
1,904
1,871
1,842
1,817
1,794
1,774
1,756
1,740
1,676
1,632
1,600
1,574
1,554
1,537
1,511
1,491
1,475
1,462
1,445
1,397
1,374
1,361
1,352
1,331
1,282
0,95
7,263
4,803
3,902
3,437
3,151
2,956
2,814
2,706
2,620
2,551
2,492
2,443
2,401
2,364
2,332
2,303
2,277
2,254
2,233
2,152
2,095
2,053
2,020
1,994
1,973
1,939
1,913
1,893
1,877
1,863
1,793
1,764
1,747
1,735
1,708
1,645
0,99
10,272
6,793
5,519
4,860
4,455
4,181
3,980
3,827
3,706
3,607
3,525
3,456
3,396
3,344
3,298
3,257
3,221
3,188
3,158
3,043
2,963
2,904
2,858
2,821
2,790
2,742
2,706
2,678
2,654
2,635
2,536
2,495
2,471
2,455
2,415
2,326
4.4.1.2.3. Среднее /х и дисперсия и2 неизвестны
Односторонние доверительные интервалы находятся по формулам
тв = х + к (п, а, C) s; тн = х — к (п, а, /3) л,
где х = —
г=1
'"
1
, а, /3) = -^= t(n — 1,
^ а);
, q) —
г=1
574
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 204
Множители 6* (то, о, /3) для построения
двусторонних толерантных интервалов
в случае нормального распределения
(/л известно, и2 неизвестно) [56]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100
200
300
400
500
1000
оо
а
0,90
0,90
5,067
3,727
3,190
2,898
2,714
2,586
2,491
2,417
2,358
2,310
2,269
2,235
2,205
2,179
2,156
2,138
2,117
2,101
2,085
2,026
1,985
1,954
1,930
1,911
1,895
1,869
1,850
1,835
1,823
1,812
1,759
1,737
1,724
1,715
1,694
1,645
0,95
6,038
4,441
3,801
3,454
3,234
3,081
2,968
2,880
2,810
2,752
2,704
2,663
2,628
2,597
2,569
2,545
2,523
2,503
2,485
2,414
2,365
2,329
2,300
2,277
2,258
2,227
2,205
2,187
2,172
2,160
2,096
2,070
2,054
2,044
2,018
1,960
0,99
7,936
5,836
4,995
4,539
4,250
4,049
3,900
3,785
3,693
3,617
3,554
3,500
3,453
3,412
3,376
3,344
3,315
3,289
3,266
3,173
3,109
3,060
3,023
2,992
2,967
2,927
2,897
2,874
2,854
2,838
2,755
2,720
2,699
2,686
2,652
2,326
0,95
0,90
7,263
4,803
3,902
3,437
3,151
2,956
2,814
2,706
2,620
2,551
2,492
2,443
2,401
2,364
2,332
2,303
2,277
2.254
2,233
2,152
2,095
2,053
2,020
1,994
1,973
1,939
1,913
1,893
1,877
1,863
1,793
1,764
1,747
1,735
1,708
1,645
0,95
8,654
5,723
4,650
4,095
3,754
3,522
3,354
3,225
3,122
3,039
2,970
2,911
2,861
2,817
2,778
2,744
2,714
2,686
2,661
2,564
2,496
2,446
2,408
2,376
2,351
2,310
2,280
2,256
2,236
2,220
2,137
2,102
2,082
2,068
2,045
1,960
0,99
11,373
7,521
6,111
5,382
4,934
4,629
4,407
4,238
4,103
3,994
3,903
3,826
3,760
3,702
3,652
3,607
3,566
3,530
3,497
3,369
3,281
3,215
3,164
3,123
3,089
3,036
2,996
2,965
2,939
2,918
2,808
2,762
2,736
2,718
2,675
2,326
квантиль нецентрального t-распределения (см. раздел 1.1.23) с / = га степенями
свободы и параметром нецентральности S.
Толерантные множители к(п,а,/3) приведены в табл. 205.
При п ^ 50 справедлива аппроксимация [542]
k(n,a,p) =
2(r»-l)-t*|
4.4]
Толерантные пределы
575
Таблица 205
Множители Jfe(n, о,/3) для построения
односторонних толерантных пределов
в случае нормального распределения
(§л и <х2 неизвестны) [56]
п
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100
200
300
500
1000
сю
а
0,90
0,90
2,745
2,494
2,333
2,220
2,133
2,066
2,012
1,966
1,928
1,896
1,867
1,842
1,820
1,800
1,782
1,766
1,702
1,657
1,624
1,598
1,577
1,560
1,532
1,512
1,495
1,482
1,471
1,412
1,387
1,362
1,338
1,282
0,95
3,402
3,093
2,894
2,755
2,650
2,569
2,503
2,448
2,402
2,363
2,329
2,299
2,273
2,249
2,227
2,205
2,132
2,080
2,041
2,010
1,98 6
1,965
1,933
1,909
1,890
1,874
1,861
1,793
1,765
1,737
1,709
1,645
0,99
4,665
4,243
3,971
3,782
3,642
3,533
3,443
3,370
3,298
3,256
3,211
3,172
3,139
3,105
3,077
3,051
2,952
2,883
2,832
2,793
2,761
2,734
2,693
2,662
2,637
2,617
2,600
2,514
2,477
2,441
2,407
2,326
0,95
0,90
3,413
3,009
2,752
2,582
2,454
2,355
2,276
2,210
2,156
2,109
2,069
2,034
2,002
1,974
1,949
1,926
1,838
1,778
1,733
1,698
1,669
1,646
1,609
1,582
1,560
1,542
1,527
1,450
1,417
1,386
1,355
1,282
0,95
4,209
3,709
3,401
3,188
3,032
2,911
2,815
2,736
2,670
2,614
2,566
2,524
2,486
2,458
2,423
2,396
2,292
2,220
2,167
2,126
2,092
2,065
2,022
1,990
1,964
1,944
1,927
1,832
1,800
1,763
1,727
1,645
0,99
5,746
5,065
4,644
4,355
4,134
3,981
3,851
3,746
3,658
3,583
3,519
3,456
3,414
3,370
3,330
3,294
3,157
3,063
2,994
2,940
2,897
2,862
2,807
2,765
2,732
2,706
2,684
2,569
2,521
2,475
2,430
2,326
Двусторонний доверительный интервал определяется из соотношения
тв = х + к* (п, а, C) s; тн = х — к* (п, а, C) s,
где к*(п,а, C)—толерантные множители, приведенные в табл. 206.
Для множителей &*(п,а,/3) справедливо соотношение
где с — решение уравнения Ф ( —= + с
/п
Ф ( —= — с
V v n
= C.
576
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 206
Множители Jfe*(n, а,/3) для построения
двусторонних толерантных интервалов
в случае нормального распределения
2
и <х неизвестны) [56]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
40
45
50
60
70
80
90
100
200
300
400
500
1000
оо
а
0,90
Р
0,90
15,980
5,847
4,166
3,494
3,131
2,902
2,743
2,626
2,535
2,463
2,404
2,355
2,314
2,278
2,246
2,219
2,194
2,172
2,152
2,077
2,025
1,988
1,959
1,935
1,916
1,887
1,865
1,848
1,834
1,822
1,764
1,740
1,726
1,717
1,695
1,645
0,95
18,800
6,979
4,943
4,152
3,723
3,452
3,264
3,125
3,018
2,933
2,863
2,805
2,756
2,713
2,676
2,643
2,614
2,588
2,564
2,474
2,413
2,368
2,334
2,306
2,284
2,248
2,222
2,202
2,185
2,172
2,102
2,073
2,057
2,046
2,019
1,960
0,99
24,170
8,974
6,440
5,423
4,870
4,521
4,278
4,098
3,959
3,849
3,758
3,682
3,618
3,562
3,514
3,471
3,433
3,399
3,368
3,251
3,170
3,112
3,066
3,030
3,001
2,955
2,920
2,894
2,872
2,854
2,762
2,725
2,703
2,689
2,654
2,326
0,95
/5
0,90
32,020
8,380
5,369
4,275
3,712
3,369
3,136
2,967
2,839
2,737
2,655
2,587
2,529
2,480
2,437
2,400
2,366
2,337
2,310
2,208
2,140
2,090
2,052
2,021
1,996
1,958
1,929
1,907
1,889
1,874
1,798
1,767
1,749
1,737
1,709
1,645
0,95
37,670
9,916
6,370
5,079
4,414
4,007
3,732
3,532
3,379
3,259
3,162
3,081
3,012
2,954
2,903
2,858
2,819
2,784
2,752
2,631
2,549
2,490
2,445
2,408
23,379
2,333
2,299
2,720
2,251
2,233
2,143
2,106
2,084
2,070
2,036
1,960
0,99
48,430
12,860
8,299
6,634
5,775
5,248
4,891
4,631
4,433
4,277
4,150
4,044
3,955
3,878
3,812
3,754
3,702
3,656
3,615
3,457
3,350
3,272
3,213
3,165
3,126
3,066
3,021
2,986
2,958
2,934
2,816
2,767
2,739
2,721
2,676
2,326
При п ^ 50 может быть использовано приближение Боукера [541]
fc*(n,a,/3) =
Yin
Подробные сведения о толерантных пределах для нормального распределения
содержатся в [557, 558], где рассмотрены оценки объема выборки п по заданным /3
и а, оценки толерантных интервалов для нескольких выборок с равными диспер-
дисперсиями [558].
4.4]
Толерантные пределы
577
Задача 308. Для ряда значений (п = 20)
хц 2, 4, 5, 7, 8, 11, 13, 17, 20, 24, 23, 25, 18, 18, 17, 17, 14, 11, 8, 1
найти толерантные пределы при а = 0,95 и C = 0,95.
Вычисляем х = — • ]Г хг = 13,15; s2 =
- 13Д5J = 53,50 (s = 7,314).
20 ^^ь —' —' ~ 20^1 .
г=1 г=1
Из табл. 205 и 206 для га = 20, а = 0,95 и /3 = 0,95 находим толерантные коэффици-
коэффициенты к(п,а,Р) = 2,396 и к*(п,а,Р) = 2,752. Тогда имеем для односторонних толерантных
пределов:
тв = х + к (га, а, /3) • s = 13,15 + 2,396 • 7,314 = 30,67;
тн = ж - к (га, а, /3) • s = 13,15 - 2,396 • 7,314 = -4,374.
Для двустороннего толерантного интервала:
тв =ж + ^*(п,а,/3) -s = 13,15 + 2,752-7,314 = 33,28;
тн = ж - к*(п,а,Р) • s = 13,15 - 2,752 • 7,314 = -6,98.
Следовательно, с вероятностью а = 0,95 в каждом из интервалов (—оо; 30,67];
[—4,37;оо); [—6,98; 33,28] будет находиться 95% (/3 = 0,95) всей совокупности значений
случайной величины.
4.4.1.2.4. Толерантные пределы, основанные на выборочном размахе
Для быстрой оценки толерантных пределов без предварительной выбороч™
ной оценки стандартного отклонения s можно использовать выборочный размах
ujn = хп — Х\ или среднее нескольких выборочных размахов, вычисляемых для т
п 1 т
подвыборок равного объема п' = — [543^545], штп = — J^ Ш{. Границы двусторон-
г=1
Таблица 207
Мнохсители d(l, n, а, /3) для определения
двустороннего толерантного интервала
с использованием размахов
(при га = 1, без разбиения на подвыборки) [543]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
а
0,90
Р
0,90
10,381
2,860
1,753
1,331
1,108
0,970
0,875
0,805
0,752
0,709
0,674
0,645
0,621
0,600
0,95
12,427
3,440
2,118
1,613
1,347
1,182
1,069
0,985
0,922
0,871
0,829
0,795
0,765
0,740
0,99
16,262
4,534
2,806
2,147
1,800
1,583
1,435
1,326
1,243
1,177
1,122
1,077
1,038
1,005
0,95
Р
0,90
20,811
4,109
2,270
15639
1,325
1,137
1,011
0,920
0,852
0,798
0,755
0,719
0,688
0,662
0,95
24,908
4,939
2,738
1,983
1,607
1,382
1,232
1,123
1,042
0,977
0,925
0,882
0,846
0,815
0,99
32,593
6,505
3,642
2,635
2,143
1,848
1,650
1,509
1,401
1,317
1,249
1,193
1,145
1,104
19 А. И. Кобзарь
578
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 208
Множители d(j?ij то', ск, /3) для определения
двустороннего толерантного интервала
с использованием размахов [543]
ТП
а
0,90
Р
0,90
0,95
0,99
0,95
0,90
0,95
0,99
п1 = Ъ
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1,008
0,897
0,838
0,801
05775
0,755
05740
0,727
0,717
0,708
0,700
0,694
0,688
0,683
0,631
0,584
0,558
0,541
0,528
0,519
0,512
0,506
0,501
0,496
0,493
0,489
0,486
0,484
1,237
1,107
1,039
0,996
0,965
0,942
0,924
0,910
0,898
0,888
0,879
0,871
0,865
0,859
0,782
0,727
0,697
0,677
0,663
0,652
0,644
0,637
0,631
0,626
0,622
0,618
0,615
0,612
1,669
1,505
1,418
1,363
1,325
1,296
1,273
1,255
1,240
1,227
1,216
1,206
1,198
1,190
п> = 1С
1,067
0,998
0,960
0,935
0,917
0,903
0,893
0,884
0,877
0,871
0,865
0,861
0,856
0,853
1,154
0,997
0,917
0,867
0,832
0,806
0,786
0,770
0,756
0,745
0,736
0,727
0,720
0,713
)
0,689
0,626
0,592
0,570
0,555
0,543
0,533
0,526
0,520
0,514
0,510
0,506
0,502
0,499
1,412
1,227
1,133
1,075
1,034
1,004
0,980
0,961
0,946
0,933
0,921
0,911
0,903
0,895
0,852
0,778
0,738
0,713
0,694
0,681
0,670
0,661
0,654
0,647
0,642
0,637
0,633
0,630
1,901
1,664
1,543
1,468
1,416
1,377
1,347
1,323
1,303
1,286
1,272
1,260
1,248
1,239
1,160
1,066
1,015
0,982
0,959
0,941
0,927
0,916
0,907
0,899
0,892
0,886
0,881
0,876
него толерантного интервала имеют вид
Тв = х + d(m, п\ а, C)штп; тн = х - d(m, n1', а, 0)штп,
где d (га, в;, а, /3)—толерантные коэффициенты, значения которых приведены
в табл. 207 (при отсутствии разбиения на подвыборки, т. е. когда т = 1) и в табл. 208
(при га > 1).
Задача 309. Для ряда значений задачи 308 построить двусторонний толерантный
интервал с помощью размахов.
Учитывая, что при п ^ 20 существенно уменьшается эффективность оценки s
с помощью размаха, разобьем выборку на две подвыборки (т = 2) равного объема
п = 10 (п = п ] га = 2). Для а = 0,95 и /3 = 0,95, воспользовавшись табл. 208, находим
dB; 10; 0,95; 0,95) = 0,946.
4.4] Толерантные пределы 579
Для подвыборок имеем размахи ил = 24 — 2 = 22, изч = 25 — 1 = 24 и средний размах
22 + 24
a;mn == = 23. Далее вычисляем
тв = 13,15 + 0,946 • 23 = 34,908; тн = 13,15 - 0,946 • 23 = -8,608.
Следовательно, с вероятностью а = 0,95 в интервале [—8,61; 34,91] будет находиться
95% ф = 0,95) всей совокупности значений случайной величины.
Отсюда видно, что толерантный интервал близок к интервалу, полученному в зада-
задаче 308, что свидетельствует о достаточной эффективности использования размахов.
4.4.1.2.5. Толерантные пределы для выборочных дисперсий
Будем искать интервал, который с вероятностью а включает /3-ю часть сово™
кугшости выборочных дисперсий
л ГЦ л Пг
2 1 \~~^ / - \2 - 1 х~^
st = -—т- 22 (xij - х^) > где х* = тг zJ хч-
Очевидно, что Д^квантиль распределения sf есть
¦ = <т
П-1
(п -1) si
так как — j1— имеет распределение хи-квадрат с / = п — 1 степенями свободы.
а
Для оценки а2 используем среднюю оценку по совокупности значений s\, s|, ..., s2^.
Тогда оценкой а будет величина
т(п — 1) т ^ г'
Оценке s2 соответствует f = т(п — 1) степеней свободы. Тогда толерантный
интервал, включающий в себя /3-ю часть всей совокупности значений s\, s|, ..., s2^
(каждая оценка s2 получена по выборке равного объема п) будет равен [546]
отношениями [546] тв = < — ^ \ ; тн = 0.
Для стандартного отклонения s = vs2 толерантный интервал определятся со™
1I.
I су
Напомним, что при / > 30 справедлива аппроксимация %д = - {\/%f — 1 + up) •
Задача 310. В результате наблюдений над т = 10 выборками из нормального распре-
распределения получены следующие выборочные значения дисперсий:
s2: 25, 41, 48, 37, 21, 64, 91, 49, 59, 78.
Оценки sf получены на выборках равного объема п = 20. Необходимо найти толе™
рантный интервал для значений s^ при а = 0,95 и /3 = 0,90.
¦^ ю
Имеем s = — • ^^ s$ = 51,3. По табл. 55 х -распределения (или используем аппрок-
аппроксимации из раздела 1.1.8):
xlin - 1) = Хо,9оA9) = 27,202; Х?-а["» • (» " 1)] = Xo,osA90) = 159,11.
19*
580
Проверка гипотез о значениях параметров распределений
[Гл.4
Вычисляем тв =
10 • 0,946 • 23
159,11
51,3 = 87,71. Следовательно, можно утверждать, что
с вероятностью а = 0,95 в интервале [0; 87,71] находится 90% (/3 = 0,9) всей совокуп-
совокупности значений s'f. Соответствующий интервал для стандартного отклонения s будет
[0; л/ЩТЦ = [0;9,36].
4.4.2. Непараметрические толерантные пределы
Иногда представляет интерес при неизвестном непрерывном распределении
определить тот минимальный объем выборки nmin, при котором можно утверждать,
что с вероятностью а для любой непрерывной совокупности между минимальным
(хш'ш) и максимальным (жтах) значениями выборки, извлеченной из нее, заключена
/3-я доля всей совокупности. В этом случае мы говорим о двустороннем непарамет™
рическом толерантном интервале.
Если через п^п обозначить такой минимальный объем выборки, при котором
можно утверждать, что с вероятностью а в каждом из интервалов (^оо;жтах),
(^min? оо) содержится /3-я доля любой непрерывной совокупности, то говорят о непа-
непараметрических односторонних толерантных интервалах. Между nmin, а и /3 для
двустороннего толерантного интервала справедливо соотношение Уилкса [547]
nmin/3"^-1 - (nmin - 1) 0"»» ^ 1 - а.
Для односторонних интервалов справедливо неравенство /3Пт1п ^ 1 —а. Значения
nmin и в^п, удовлетворяющие приведенным неравенствам приведены в табл. 209.
Таблица 209
Минимальные объемы выборок для построения
непараметрических (двустороннего, пт'1П — верхняя
строка и одностороннего, Timin — нижняя строка)
толерантных интервалов, основанных на
наибольших и наименьших
выборочных значениях [56]
а
0,90
0,95
0,99
0,50
7
4
8
5
11
7
0,70
12
7
14
9
20
3
0,75
15
9
18
11
33
17
0,80
18
11
22
14
31
21
0,90
38
22
46
29
64
44
0,95
77
45
93
59
130
90
0,99
388
30
473
299
662
459
Практический интерес представляет и обратная задача: для заданных значений
п и а определить наименьшую долю C совокупности, относительно которой можно
утверждать, что с вероятностью а эта доля заключена между крайними членами
выборки объема в, либо превосходит наименьшее значение выборки (жт1п), либо
меньше наибольшего значения выборки (жтах).
к
Для двусторонних интервалов при п ^ 50 справедливо соотношение /3 = 1 ,
п
где к является решением уравнения
1 + fc- (l-a)ek = 0.
4.4]
Толерантные пределы
581
Некоторые решения этого уравнения для наиболее употребительных значений а
таковы:
а
к
0,9
3,8897
0,95
4,7439
0,99
6,6384
Для односторонних интервалов справедливо соотношение
В табл. 210 и 211 приведены значения /3, соответствующие различным а и п,
соответственно для двустороннего и одностороннего толерантных интервалов.
Таблица 210
Наименьшая доля /3 совокупности, заключенная внутри
непараметрического двустороннего толерантного интервала
(между жт1п и жтах в выборке объема п) [56]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
Доверительная
вероятность
0,90
0,0513
0,1958
0,3205
0,4101
0,4897
0,5474
0,5938
0,6316
0,6632
0,6898
0,7125
0,7322
0,7493
0,7644
0,7778
0,7898
0,8005
0,8102
0,8190
0,8271
0,8344
0,8412
0,8474
0,8531
0,8585
0,8634
0,8681
0,8724
0,8764
0,8802
0,8838
0,8872
0,95
0,0253
0,1354
0,2486
0,3426
0,4182
0,4793
0,5293
0,5709
0,6058
0,6356
0,6613
0,6873
0,7033
0,7206
0,7360
0,7499
0,7623
0,7736
0,7839
0,7933
0,8019
0,8098
0,8171
0,8239
0,8302
0,8360
0,8415
0,8466
0,8514
0,8559
0,8602
0,8641
а
0,99
0,0050
0,0589
0,1409
0,2221
0,2943
0,3566
0,4101
0,4560
0,4956
0,5302
0,5605
0,5872
0,6109
0,6321
0,6512
0,6684
0,6840
0,6982
0,7112
0,7232
0,7342
0,7443
0,7538
0,7625
0,7707
0,7783
0,7854
0,7923
0,8004
0,8043
0,8099
0,9152
п
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
60
70
80
90
100
200
300
400
500
600
700
800
900
1000
5000
Доверительная
вероятность
0,90
0,8903
0,8934
0,8962
0,8989
0,9015
0,9039
0,9062
0,9084
0,9105
0,9125
0,9145
0,9163
0,9181
0,9197
0,9214
0,9229
0,9244
0,9367
0,9456
0,9952
0,9575
0,9617
0,9807
0,9871
0,9903
0,9922
0,9935
0,9945
0,9951
0,9957
0,9961
0,9992
0,95
0,8679
0,8715
0,8749
0,8781
0,8811
0,8840
0,8868
0,8894
0,8920
0,8944
0,8967
0,8989
0,9010
0,9030
0,9049
0,9068
0,9086
0,9234
0,9340
0,9421
0,9484
0,9534
0,9765
0,9843
0,9882
0,9905
0,9921
0,9932
0,9941
0,9947
0,9953
0,9991
а
0,99
0,8202
0,8249
0,8294
0,8337
0,8377
0,8416
0,8453
0,8488
0,8521
0,8554
0,8584
0,8614
0,8642
0,8669
0,8695
0,8721
0,8745
0,8944
0,9089
0,9199
0,9285
0,9355
0,9673
0,9781
0,9835
0,9868
0,9890
0,9906
0,9917
0,9926
0,9934
0,9987
582
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 211
Наименьшая доля совокупности /3, заключенная внутри
непараметрического одностороннего толерантного интервала
(больше жт1п или меньше жтах в выборке объема п) [56]
п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Доверительная
вероятность
0,90
0,3162
0,4642
0,5623
0,6310
0,6813
0,7197
0,7499
0,7743
0,7943
0,8110
0,8254
0,8377
0,8483
0,8577
0,8660
0,8733
0,8799
0,8859
0,8913
0,8962
0,9006
0,9047
0,9085
0,9120
0,9152
0,9183
0,9211
0,9237
0,9261
0,9284
0,9306
0,95
0,2236
0,3684
0,4729
0,5493
0,6070
0,6518
0,6877
0,7169
0,7411
0,7791
0,7791
0,7942
0,8074
0,8190
0,8293
0,8384
0,8467
0,8541
0,8609
0,8671
0,8727
0,8779
0,8827
0,9871
0,8912
0,8950
0,8985
0,9010
0,9050
0,9079
0,9106
а
0,99
0,1000
0,2154
0,3162
0,3981
0,4642
0,5179
0,5623
0,5995
0,6310
0,6813
0,6813
0,7017
0,7197
0,7356
0,7499
0,7627
0,7743
0,7848
0,7943
0,8031
0,8111
0,8185
0,8254
0,8318
0,8377
0,8432
0,8483
0,8532
0,8577
0,8620
0,8660
п
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
60
70
80
90
100
200
300
400
500
700
800
900
1000
Доверительная
вероятность
0,90
0,9326
0,9345
0,9363
0,9380
0,9397
0,9412
0,9427
0,9441
0,9454
0,9467
0,9479
0,9490
0,9501
0,9512
0,9522
0,9532
0,9541
0,9550
0,9624
0,9676
0,9716
0,9747
0,9772
0,9886
0,9924
0,9943
0,9954
0,9967
0,9971
0,9974
0,9977
0,95
0,9132
0,9157
0,9180
0,9202
0,9222
0,9242
0?9261
0,9278
0,9295
0?9312
0,9327
0,9342
0,9356
0,9370
0,9382
0,9395
0,9407
0,9418
0,9513
0,9581
0,9632
0,9673
0,9705
0,9851
0,9901
0,9925
0,9940
0,9957
0,9963
0,9967
0,9970
а
0,99
0,8697
0,8733
0,8767
0,8799
0,8830
0,8859
0,8886
0,8913
0,8938
0,8952
0,8984
0,9006
0,9027
0,9047
0,9067
0,9085
0,9103
0,9120
0,9261
0,9363
0,9441
0,9501
0,9550
0,9772
0,9848
0,9886
0,9908
0,9934
0,9943
0,9949
0,9954
Задача 311. Определить объем выборки х\,хъ, ...,жп, для которой с вероятностью
а = 0,95 между жтт и жтах будет заключаться не менее /3 = 0,99 всей совокупности
значений х.
Из табл. 209 для а = 0,95 и /3 = 0,99 находим nmin = 473, т. е. в выборке объема
п = 473 между жт1П и жтах будет располагаться не менее 99% всех значений х%, извле-
извлеченных из любой непрерывной совокупности.
Задача 312. Определить минимальный объем выборки в условиях задачи 311 для
одностороннего толерантного интервала.
Из табл. 209 находим nmin = 299. Следовательно, для выборки объема п = 299 можно
утверждать, что левее жтах либо правее хт-1П будет находиться 99% всей совокупности.
4.4] Толерантные пределы 583
Задача 313. Определить долю членов непрерывной совокупности^ которая с вероят-
вероятностью а = 0,90 будет заключена между хт\п и жтах в выборке объема п = 49.
Из табл. 210 для п = 49 и а = 0,90 находим /3 = 0,9229. Следовательно, в выборке
объема п = 49 между xmin и xmax будет находиться не менее 92,29% всей совокупности
случайных величин.
По аналогии для одностороннего интервала из табл. 211 получаем для а = 0,90
и п = 49: /3 = 0,9541, т.е. в выборке объема п = 49 справа от жт1п либо слева от жтах
будет располагаться 95,41% всей совокупности.
4.4.3. Толерантные пределы длм будущих наблюдений и прогнозирование
4.4.3.1. Прогнозные интервалы Холла-Прейри
Иногда в практических задачах анализа надежности и долговечности техниче-
технических систем требуется определить границы интервалов, аналогичных толерантным,
но имеющих смысл „предсказывающих".
Сформулируем следующую задачу. Имеется выборка объема п из нормально
распределенной совокупности, по которой определены выборочные среднее х и стан-
стандартное отклонение s. Необходимо найти границу интервала [х ~~ r(ra, n, fc,a); оо)
для которого справедливо утверждение, что с вероятностью а не менее га из к
последующих наблюдений будут превышать значение х — г(гп^ n, k, a)s.
Эта задача рассмотрена в [548]. Коэффициенты оценок r(m1n,kJa)J рассчитан™
ные авторами работы, приведены в табл. 212.
Аналогичная задача рассмотрена в упомянутой работе [548] и для экспонен-
экспоненциального распределения. В этом случае искомый интервал определяется как
п
[Ь(га, п, к, а) ]Р Xi\ оо). Коэффициенты Ь(га, в, &, а) приведены в табл. 213. Табл. 213
г=1
применима и для решения задачи при распределении Вейбулла с известным пара-
параметром /3 (см. раздел 1.1.5). В этом случае искомый интервал будет равен
b (га, n, А;, а) V^ ж •
i=l
; oo
Задача 314. В результате испытаний п = 10 приборов получены следующие резуль-
результаты Xi'. 12, 13, 17, 21, 29, 35, 46, 57, 61, 70. Необходимо определить значение ж@,95),
которое с вероятностью а = 0,95 будет превзойдено не менее^ чем т = 4 приборами из
k = 8 испытанных дополнительно. Задачу решить, исходя из предположений нормаль-
нормальности и экспоненциальности распределения случайной величины х.
Рассмотрим сначала случай нормального распределения.
п
Вычисляем по выборке \°^ х% = 361; s = 21,247. Из табл. 212 для т = 4, п = 10, к = 8
г=1
и а = 0,95 находим коэффициент гD; 10; 8; 0,95) = 1,3.
Следовательно, искомое значение равно жо,э5 = х — rs = 36,1 — 1,3 • 21,747 = 8,479, т. е.
с достоверностью а = 0,95 из 8 испытанных прибора 4 будут иметь параметр х > 8,479.
п
В случае экспоненциального распределения имеем J^ Xi = 361, находим из табл. 213
г=1
коэффициент 6D; 10; 8; 0,95) = 0,030. Тогда искомая величина равна ж@,95) = Ь х
71
х J^ a?i = 0,030 • 361 = 10,83. Следовательно, с вероятностью а = 0,95 у 4 приборов из
г=1
будущих 8 испытываемых значение параметра ж@,95) будет превышать 10,83.
584
Проверка гипотез о значениях параметров распределений
[Гл.4
Таблица 212
Коэффициенты r(m, n, fe, а), для которых вероятность того, что в т или
более из будущих к наблюдений нормального распределения величина ж
будет превышать х — г (га, n, fe, ex.)8, равна ex. [548]
т
п
к
г
т
п
к
г
т
п
к
г
т
п
к
г
а = 0,90
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
2
2
2
2
2
2
2
2
4
4
4
4
4
4
6
6
6
6
8
8
8
8
10
10
10
10
12
12
12
14
14
16
16
16
18
18
20
20
22
24
2
3
4
5
6
8
10
12
4
5
6
8
10
12
8
10
12
16
8
10
12
16
10
12
16
20
12
16
20
16
20
16
20
25
20
25
20
25
25
25
2
1
0,7
0,4
0,2
-ОД
-0,25
-0,3
2,8
2,1
1,5
0,75
0,5
0525
1,6
1
0,75
0,4
3,4
1,9
1,3
0,8
3,5
2
1,2
0575
3,75
1,75
1,1
2,3
1,5
3,5
2
1,25
2,1
1,5
4
2
2,5
3,5
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
2
2
2
2
2
2
2
2
4
4
4
4
4
4
6
6
6
6
6
8
8
8
8
10
10
10
10
12
12
12
14
14
16
16
16
18
18
20
20
22
2
3
4
5
6
8
10
12
4
5
6
8
10
12
6
8
10
12
16
8
10
12
16
10
12
16
20
12
16
20
16
20
16
20
25
20
25
20
25
25
2
1
0,6
0,25
0
-0,2
-0,3
-0,5
2,3
1,5
1,2
0,6
0,3
0,2
2,5
1,5
1
0,6
0,25
2,7
1,5
1
0,5
2,8
1,5
0,9
0,5
2,9
1,3
0,75
1,8
1,1
3
1,5
0,95
2
1,3
3,2
1,5
1,9
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
2
2
2
2
2
2
2
2
4
4
4
4
4
4
6
6
6
6
8
8
8
8
10
10
10
10
12
12
12
14
14
16
16
16
18
18
20
20
22
24
2
3
4
5
6
8
10
12
4
5
6
8
10
12
8
10
12
16
8
10
12
16
10
12
16
20
12
16
20
16
20
16
20
25
20
25
20
25
25
25
1,8
1,1
0,5
0,3
0,15
0
-0,2
-0,4
2,5
1,5
1
0,55
0,3
0,05
1,25
0,75
0,5
0,2
2,5
1,4
1
0,45
2,5
1,5
0,8
0,5
2,5
1,2
0,7
1,6
1
2,3
1,3
0,7
1,7
1
2,5
1,25
1,6
2,2
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
2
2
2
2
2
2
2
2
4
4
4
4
4
4
6
6
6
6
6
8
8
8
8
10
10
10
12
12
12
14
14
16
16
16
18
18
20
20
22
24
2
3
4
5
6
8
10
12
4
5
6
8
10
12
6
8
10
12
16
8
10
12
16
10
12
16
12
16
20
16
20
16
20
25
20
25
20
25
25
25
1,7
1,2
0,6
0,4
0,2
-0,1
-0,3
-0,5
2,1
1,3
1
0,5
0,2
0
2,3
1,25
0,8
0,5
0,15
2,5
1,5
1
0,45
2,5
1,5
0,7
0,5
1,2
0,7
1,7
1
2,5
1,4
0,8
1,8
1
2,5
1,4
1,7
2,3
а = 0,95
5
5
5
5
5
5
2
2
2
2
2
2
2
3
4
5
6
8
3
2,5
1,5
1
0,6
0,4
5
5
5
5
5
5
12
14
14
16
16
16
20
16
20
12
16
20
1
2
1,3
3
1,7
1,15
15
15
15
15
15
15
6
8
8
8
8
10
16
8
10
12
16
10
0,3
2,8
1,7
1,2
0,6
2
20
20
20
20
20
20
4
4
4
4
4
4
4
5
6
8
10
12
2,5
1,7
1,2
0,7
0,4
0,2
4.4]
Толерантные пределы
585
то
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
п
2
2
4
4
4
4
4
4
6
6
6
6
6
8
8
8
8
10
10
10
10
12
12
к
10
12
4
5
6
8
10
12
6
8
10
12
16
8
10
12
16
10
12
16
20
12
16
г
0,1
-од
3,5
2,5
2
1,3
0,8
0,5
4
2,5
1,7
1,2
0,6
4,5
2,7
1,8
1,1
3,5
2
1
0,7
2,5
1,5
то
5
5
5
5
5
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
п
18
18
20
20
24
2
2
2
2
2
2
2
2
4
4
4
4
4
4
6
6
6
6
к
16
20
16
20
25
2
3
4
5
6
8
10
12
4
5
6
8
10
12
6
8
10
12
г
а =
2,1
1,1
3,7
1,7
2,7
2,5
1,5
0,9
0,5
0,3
0,05
-0,1
-0,4
2,5
2
1,3
0,75
0,5
0,2
2,8
1,5
1
0,6
то
0,95
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
20
20
20
20
20
20
20
20
п
10
10
12
12
12
14
14
16
16
16
18
18
20
20
22
2
2
2
2
2
2
2
2
Ок
к
ончание
г
то
12
16
12
16
20
16
20
16
20
25
20
25
20
25
25
2
3
4
5
6
8
10
12
1,8
1
0,6
3,1
1,5
2
1,25
3,2
1
1
2
1,2
3,4
1,55
2
2,5
1,7
1
0,6
0,5
0,2
0
-0,2
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
таблицы 212
п
6
6
6
6
6
8
8
8
8
10
10
10
10
14
14
16
16
16
18
18
20
20
22
к
г
6
8
10
12
16
8
10
12
16
10
12
16
20
16
20
16
20
25
20
25
20
25
25
2,7
1,5
1
0,7
0,3
3
1,5
1,1
0,6
3
1,7
1
0,6
1,9
1,15
3,4
1,5
1
2
1,3
3,2
1,5
2
Таблица 213
Коэффициенты 6(га, n, fe, «), для которых вероятность того, что в т или
более из будущих к наблюдений экспоненциального распределения
п
величина ж будет превышать b(m^nJk1 «) J^ жг, равна ol [548]
т
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
п
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
к
1
2
3
4
5
6
8
10
12
16
20
3
4
5
6
8
Ь
0,015
0,035
0,070
0,100
0,15
0,18
0,20
0,22
0,26
0,28
0,32
0,006
0,015
0,040
0,080
0,100
то
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
п
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
2
3
4
5
6
8
10
12
16
20
25
4
5
6
8
10
ь
а =
0,004
0,021
0,040
0,050
0,070
0,090
0,100
0,111
0,114
0,116
0,118
0,003
0,012
0,020
0,040
0,055
то
= 0,90
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
п
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
2
3
4
5
6
8
10
12
16
20
25
4
5
6
8
10
Ъ
0,004
0,012
0,022
0,032
0,050
0,060
0,070
0,080
0,100
0,110
0,130
0,0015
0,007
0,017
0,028
0,038
т
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
п
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
4
к
3
4
5
6
8
10
12
16
20
25
4
5
6
8
10
12
Ъ
0,010
0,020
0,026
0,030
0,045
0,052
0,060
0,070
0,080
0,090
0,0015
0,005
0,009
0,020
0,028
0,035
586
Проверка гипотез о значениях параметров распределений
[Гл.4
т
п
к
Ъ
т
п
к
Ъ
т
Продолже
п
к
Ь
н и е
т
табли
п
к
цы 213
b
а = 0,90
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
4
4
4
4
6
6
6
6
6
6
6
8
8
8
8
8
8
10
10
10
10
10
12
12
12
12
14
14
14
16
16
16
18
18
20
20
24
10
12
16
20
5
6
8
10
12
16
20
6
8
10
12
16
20
8
10
12
16
20
10
12
16
20
12
16
20
12
16
20
16
20
16
20
20
0,13
0,18
0,20
0,23
0,004
0,030
0,065
0,080
0,120
0,150
0,180
0,003
0,021
0,045
0,075
0,110
0,150
0,002
0,018
0,050
0,080
0,110
0,001
0,030
0,056
0,085
0,011
0,040
0,068
0,015
0,024
0,050
0,010
0,036
0,001
0,026
0,004
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
4
4
4
4
6
6
6
6
6
6
6
8
8
8
8
8
8
10
10
10
10
10
12
12
12
12
14
14
14
16
16
16
18
18
20
20
22
12
16
20
25
6
8
10
12
16
20
25
8
10
12
16
20
25
10
12
16
20
25
12
16
20
25
16
20
25
16
20
25
20
25
20
25
25
0,070
0,090
0,100
0,120
0,002
0,016
0,030
0,040
0,060
0,075
0,095
0,0015
0,012
0,021
0,040
0,055
0,071
0,001
0,009
0,028
0,040
0,058
0,001
0,016
0,030
0,045
0,0065
0,020
0,035
0,001
0,012
0,026
0,005
0,020
0,001
0,014
0,070
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
20
4
4
4
4
6
6
6
6
6
6
6
8
8
8
8
8
8
10
10
10
10
10
12
12
12
12
14
14
14
16
16
18
18
20
22
2
12
16
20
25
6
8
10
12
16
20
25
8
10
12
16
20
25
10
12
16
20
25
12
16
20
25
16
20
25
20
25
20
25
25
25
2
0,046
0,065
0,075
0,090
0,001
0,011
0,020
0,028
0,044
0,054
0,068
0,001
0,009
0,017
0,030
0,040
0,052
0,001
0,0065
0,020
0,030
0,040
0,001
0,012
0,021
0,033
0,005
0,015
0,027
0,009
0,020
0,037
0,017
0,009
0,049
0,002
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
4
4
4
6
6
6
6
6
6
6
8
8
8
8
8
8
10
10
10
10
10
12
12
12
12
14
14
14
16
16
16
18
18
20
20
22
16
20
25
6
8
10
12
16
20
25
8
10
12
16
20
25
10
12
16
20
25
12
16
20
25
16
20
25
16
20
25
20
25
20
25
25
0,045
0,058
0,068
0,0009
0,009
0,015
0,020
0,030
0,040
0,050
0,0007
0,005
0,010
0,021
0,030
0,040
0,0005
0,004
0,016
0,022
0,030
0,0004
0,008
0,017
0,024
0,003
0,011
0,019
0,0002
0,006
0,015
0,0025
0,010
0,0002
0,006
0,003
а = 0,95
5
5
5
5
5
5
5
5
5
5
5
5
2
2
2
2
2
2
2
2
2
2
2
4
2
3
4
5
6
8
10
12
16
20
25
4
0,004
0,030
0,052
0,080
0,100
0,130
0,180
0,190
0,210
0,250
0,270
0,002
5
5
5
5
5
5
5
5
5
5
5
5
12
12
14
14
14
16
16
16
18
18
20
20
20
25
16
20
25
16
20
25
20
25
20
25
0,050
0,070
0,010
0,033
0,058
0,001
0,020
0,044
0,008
0,031
0,001
0,020
10
10
10
10
10
10
10
10
10
10
10
10
8
8
8
8
8
8
10
10
10
10
10
12
8
10
12
16
20
25
10
12
16
20
25
12
0,001
0,010
0,020
0,036
0,050
0,065
0,001
0,0075
0,022
0,036
0,050
0,001
15
15
15
15
15
15
15
15
15
15
15
15
4
4
4
4
6
6
6
6
6
6
6
8
12
16
20
25
6
8
10
12
16
20
25
8
0,040
0,050
0,061
0,075
0,0006
0,0085
0,019
0,024
0,036
0,047
0,059
0,0005
4.4]
Толерантные пределы
587
т
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
п
4
4
4
4
4
4
4
4
6
6
6
6
6
6
6
8
8
8
8
8
8
10
10
10
10
10
12
12
к
5
6
8
10
12
16
20
25
6
8
10
12
16
20
25
8
10
12
16
20
25
10
12
16
20
25
12
16
Ь
0,020
0,033
0,060
0,090
0,118
0,150
0,180
0,200
0,002
0,022
0,045
0,061
0,097
0,130
0,160
0,001
0,016
0,033
0,065
0,090
0,130
0,001
0,015
0,044
0,070
0,090
0,001
0,025
т
5
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
10
п
22
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
4
4
4
4
6
6
6
6
6
6
6
к
25
2
3
4
5
6
8
10
12
16
20
25
4
5
6
8
10
12
16
20
25
6
8
10
12
16
20
25
Ь
а =
0,012
0,002
0,010
0,029
0,040
0,050
0,070
0,080
0,100
0,130
0,150
0,160
0,002
0,010
0,016
0,030
0,046
0,058
0,078
0,095
0,110
0,001
0,012
0,024
0,036
0,051
0,070
0,080
т
0,95
10
10
10
10
10
10
10
10
10
10
10
10
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
п
12
12
12
14
14
14
16
16
18
18
20
22
2
2
2
2
2
2
2
2
2
2
2
4
4
4
4
4
О
к
16
20
25
16
20
25
20
25
20
25
25
25
2
3
4
5
6
8
10
12
16
20
25
4
5
6
8
10
конча
Ь
0,012
0,026
0,040
0,0045
0,018
0,030
0,010
0,022
0,004
0,017
0,010
0,005
0,0018
0,010
0,020
0,030
0,040
0,050
0,060
0,070
0,080
0,090
0,100
0,0008
0,006
0,010
0,025
0,030
Н И €
т
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
15
т а б л и
п
8
8
8
8
8
10
10
10
10
10
12
12
12
12
14
14
14
16
16
16
18
18
20
20
22
к
10
12
16
20
25
10
12
16
20
25
12
16
20
25
16
20
25
16
20
25
20
25
20
25
25
цы 213
Ь
0,0065
0,014
0,025
0,035
0,045
0,0004
0,006
0,018
0,026
0,036
0,0003
0,009
0,018
0,028
0,003
0,013
0,022
0,0002
0,0075
0,013
0,003
0,013
0,0001
0,008
0,004
4.4.3.2. Прогнозные интервалы в задачах испытаний на надежность
В [549] рассмотрена задача прогнозирования r-й порядковой статистики хг
в выборке объема п, основанная на величине первых к порядковых наблюдений из
выборки (к < г ^ п). Доверительный интервал для хг может быть использован для
прогнозирования оставшегося времени испытаний на долговечность. Показано [549],
г имеет ^распределение с Д = 2 и /2 = 2 (У — 1)
Xi + ( — к)хк
что статистика U =
г1
степенями свободы. Следовательно, двусторонний интервал для хг с доверительной
вероятностью а будет
¦Fl-g
2
(n — к)
г=1
Fl+g
-•i + (п - к)
„ 1 + а 1 — а
Для односторонних интервалов вместо или используются величи-
ны а или A — а) соответственно.
Хан [550] рассмотрел задачу прогнозирования будущих выборок из экспоненци-
экспоненциального распределения. Задача формулируется следующим образом. По имеющим™
ся данным моментов отказов т изделий необходимо найти нижний доверительный
588
Проверка гипотез о значениях параметров распределений
[Гл.4
интервал с вероятностью а для среднего времени до отказа для к будущих выборок
j т
объема п. Если х = — J^ ж^, то нижняя доверительная граница для средних к вы™
борок объема п будет равна хс(к, га, п, а), где с(к, га, п, а) — коэффициенты оценки.
Справедливы аппроксимации
с(к,т,п,а) ~ —у рг-; c(fc,ra, n, )
(
2m; 2n; A - a) k
F [2m; 2ra; 1 - ^
/i = a
где F(a,b, 7) — 7-квантиль распределения Фишера (см. раздел 1.1.10) с
и /2 = 5 степенями свободы.
Первая аппроксимация точнее, однако весьма затруднен поиск A — а)
лей F-распределения (имеющиеся таблицы недостаточны). Вторая аппроксимация
менее точна, но может быть получена с помощью имеющихся таблиц F-распреде™
ления. Некоторые значения коэффициентов с(&, п, га, а), полученные с помощью
первой аппроксимации, приведены в табл. 214.
Таблица 214
Значения c(fc, тг, ти, а) для прогнозирования при ск = 0,95
нижней границы средней наработки в к выборках объема п
по т ранним моментам отказов [550]
га
3
5
10
20
п = 2
2
0,8
0,5
0,2
0,1
3
1,1
0,7
0,4
0,2
5
1,4
0,9
0,4
0,2
8
1,5
0,8
0,4
0,2
12
1,7
0,9
0,5
09,
п = 5
к
2
1,9
1,1
0,5
0,3
3
2,8
1,6
0,8
04
5
3,6
2,1
1,0
0,5
8
4,0
2,5
1,1
0,5
12
4,7
2,7
1,3
06
п = 10
к
2
3,3
2,0
1,0
0,5
3
4,9
3,0
1,5
0,7
5
6,5
4Д
2,0
0,9
8
7,9
4,9
2,3
1,0
12
9,0
5,6
2,6
1,2
В заключение приведем ряд имеющих практический интерес соотношений, осно™
ванных на гипергеометрическом распределении (см. раздел 1.2.6). Вероятность
того, что среди будущих га наблюдений не менее с величин будут превышать г-й
член упорядоченного по возрастанию ряда в выборке объема п, равна
г —1
\~~^ (с + г — iy.n\ (га + п — с —- г + 1)!га!
Р =
(с + г - 1 - г)\{п - i)\i\ (т + п)\(т - с - г + 1 + г)! *
Вероятность р* того, что среди будущих га наблюдений не менее с величин будут
заключены между крайними значениями ряда, построенного по выборке объема п,
равна
* _ (га-с+2)Ы (п + с-2)\т\
Р ~ (т-с+1)!(га-1)! (ш + га)!(с-1)!'
Задача 315. В результате испытаний п = 10 приборов первые к = 7 отказов получе-
получены в моменты времени t%: 10, 12, 18, 24, 31, 35, 41. Необходимо найти доверительные
интервалы^ в которых находится момент отказа девятого прибора (г = 9), пргх cfeee-
рительной вероятности а = 0,95.
Имеем tfc = ?7 = 41. Из таблиц F-распределения (либо используя аппроксимации из
раздела 1.1.10) имеем (при Д = 2 и /2 = 2 • (9 — 1) = 16)
Fa = F0,95 = 3,63; Fi_a = F0,05 = 0,0515; Fi+a = F0,975 = 4,96;
4.4] Толерантные пределы 589
F 1 = FO!o25 = 0,0253.
1 —а
7
Далее находим J^ U + A0 — 7) 41 = 171 + 13 = 294. Для двустороннего интервала
имеем
41 + 294 • 0,253 = 48,438 <: t9 <: 1419,86 = 41 + 294 • 4,69.
Для односторонних интервалов имеем
t9 ^ 41 + 294 • 0,0515 = 56,141; t9 ^ 41 + 294 • 3,63 = 1108,22.
Задача 316. Для т = 10 изделий получены моменты отказов U: 158, 171, 192, 211,
241, 256, 278, 292, 312, 341. Необходимо с достоверностью а = 0,95 найти нижний
доверительный интервал для средней наработки на отказ в к = 5 выборках объема
п = 10 каждая.
Имеем для а = 0,95 из табл. 214 коэффициент еE,10,10) = 2,0.
1 10
Далее i = — • J^ t% = 245,2, и нижняя граница оценки равна
г=1
t-c(k,n,m,a) = 245,2 • 2,0 = 490,4.
Следовательно, с вероятностью 0,95 средняя наработка на отказ в 5 будущих выбор-
выборках не будет превышать 490,4.
Задача 317. Для данных задачи 316 определить вероятность того^ что среди буду-
будущих трех наблюдений не менее двух будут превышать по величине 5-е наблюдение
U = 241 в
Имеем п = 10, г = 5, т = 3ис = 2. Далее вычисляем
г — 1
1г-л (с + 7* —1)!п! (га + п — с — г + 1)!га!
(с + г - 1-г)! (п-г)!г! (га + п)! (га - с - г + 1 +г)!
6!10! 7!3! =0137
^ F-г)!A0-г)!г! 13! (г - 3)!
Следовательно, с вероятностью р = 0,437 среди трех будущих наблюдений не менее
двух будут превышать величину t$ = 241.
Задача 318. Для данных задачи 316 вычислить вероятность того^ что среди будущих
т = 3 наблюдений не менее с = 2 величин будут заключены между крайними значени-
значениями выборки объема п = 10 (га. е. между t\ = 158 г/ ?ю = 341).
Имеем
C-2 + 2I10! , (Ю + 2-2)!3! =
F C-2 + l)!9! A0 + 3)! B™ г)!
Следовательно, с вероятностью р* = 0,895 из будущих трех наблюдений не менее двух
будут находиться между минимальным t\ = 158 и максимальным ?ю = 341 значениями
выборки объема п = 10.
ГЛАВА 5
МЕТОДЫ ИССЛЕДОВАНИЯ СВЯЗЕЙ
МЕЖДУ СЛУЧАЙНЫМИ ВЕЛИЧИНАМИ
Общие положения. В предыдущих главах были рассмотрены различные
методы и приемы математической статистики, позволяющие оценить параметры
статистических совокупностей, сравнивать их между собой. При этом, как прави-
ло, предполагалась взаимная независимость сравниваемых совокупностей. В на-
настоящей главе рассматриваются вопросы оценки связей между статистическими
совокупностями.
Подробно описываются основы и методы дисперсионного, корреляционного и ре™
грессионного анализов, являющиеся последовательными ступенями при исследова-
исследовании связей между случайными величинами.
Методами дисперсионного анализа устанавливается наличие влияния заданно™
го фактора на изучаемый процесс, отображаемый наблюдаемой статистической
совокупностью выборочных данных. Корреляционный анализ позволяет оценить
силу такой связи, а методами регрессионного анализа можно выбрать конкретную
математическую модель и оценить адекватность отражения ею установленной вза-
взаимосвязи случайных величин.
В последние годы стремительно развивается самостоятельное прикладное на™
правление математической статистики — математическая теория активного экспе-
эксперимента. Базируясь на комбинации методов дисперсионного и регрессионного ана-
анализов, методы математического планирования эксперимента дополняют их.
В настоящей главе даются основные понятия и определения математической те-
теории планирования активного эксперимента применительно к изучению механизма
наблюдаемого процесса и построению его статистической модели.
Автор счел уместным изложить в настоящей главе основные сведения по технике
контрольных карт, как самой распространенной форме применения математической
статистики в производстве при предупредительном статистическом контроле каче™
ства продукции. Приводится краткое описание известных методов и примеры их
применения.
5.1. Дисперсионный анализ
Дисперсионный анализ является статистическим методом анализа результатов
наблюдений, зависящих от различных одновременно действующих факторов, с це-
целью выбора наиболее значимых факторов и оценки их влияния на исследуемый
процесс.
Влияние различных факторов на изучаемые случайные величины (например,
влияние технологического способа изготовления или режима нагрузки на долго™
вечность технического изделия) приводит к изменению значений параметров рас-
распределения вероятностей этих величин — среднего, дисперсии или моментов более
высокого порядка.
5.1]
Дисперсионный анализ
591
С помощью дисперсионного анализа устанавливаются изменения дисперсии ре™
зультатов эксперимента при изменении уровней изучаемого фактора. Если диспер-
дисперсии будут отличаться значимо, то следует вывод о значимом влиянии фактора на
среднее значение наблюдаемой случайной величины.
Классические методы дисперсионного анализа основываются на следующих
предпосылках: распределение исходных случайных величин нормально; дисперсии
экспериментальных данных одинаковы для всех условий эксперимента (т. е. для
экспериментов, выполненных на различных уровнях изучаемого фактора).
Поэтому при проведении дисперсионного анализа следует предварительно про™
верить нормальность распределения изучаемой случайной величины (методами,
изложенными в разделе 2.2) и неразличимость дисперсий изучаемых совокупностей
(методами, изложенными в разделе 4.1.1.4).
Подробно теория дисперсионного анализа изложена в [20, 401].
5.1.1. Классический дисперсионный анализ нормально распределенных
случайных величин
5.1.1.1. Однофакторный дисперсионный анализ
Предположим, что анализируется влияние фактора А, изучаемого на к уровнях
(Ai, A2, • • •, Ak). На каждом уровне Ai проведены п наблюдений (хц, з^2, • • •, %in)-
Следовательно, на всех к уровнях фактора А произведены кп наблюдений.
Поясним суть и последовательность проведения дисперсионного анализа. Рас-
Расположим экспериментальные данные в виде таблицы:
Номер
наблюдения
1
2
j
п
Е
Аг
Х\\
Х\2
X!j
Xi
Уровни
А2
Х21
Х22
x2j
Х2п
Х2
фактора А
А{
Хц
Xi2
Xij . . .
Xin . . .
хг
Ак
Xkl
Xk2
Xkj
Хкп
хк
Рассмотрим оценки различных дисперсий, возникающие при анализе таблицы
результатов наблюдений. Для дисперсии, характеризующей изменение данных на
уровне Ai (по строкам таблицы), имеем
1
- 1
Y^
- \2
1
n- 1
1
Из предпосылок дисперсионного анализа следует, что должно иметь место ра™
венство Sf = Я| = ... = 5^, что проверяется соответствующим критерием сравне™
ния (см. раздел 4.1.1.4).
При выполнении условия Sf = const при г = 1, 2, ..., к (что, повторяем весьма
настойчиво, обязательно), находим оценку дисперсии, характеризующей рассеяние
592
Методы исследования связей между случайными величинами
[Гл. 5
значений Xij вне влияния фактора А, по формуле
к п
г=1
г=17=1
(x..^x-f - -
{lJ г) к(п-1)
к п
ъ=13=1
Легко видеть, что, если при оценке Sf мы имеем (п — 1) степеней свободы, то
оценка Sq имеет к (п — 1) степеней свободы.
Общая выборочная дисперсия всех наблюдений равна
s2 г
кп — '.
Следовательно,
с
к п
,2 1
кп-1
к к
ЕЕ
где
4-
j к
г=1
1 1" " ж
1 п
= — У^ х
¦I1
Введем теперь оценку дисперсии SA, характеризующей изменение средних ж^,
связанное с влиянием фактора А:
г=1
Очевидно, что при оценке 5^| используется (Aj — 1) степеней свободы. Теперь
проверка влияния фактора А на изменение средних может быть сведена к сравне™
нию дисперсий S\ и Sq. Влияние фактора А признается значимым, если значимо
S2 S2
отношение —^. Отношение —^. признается значимым с вероятностью а, если
Sq Sq
где i^a(/ij /2) — a-квантиль i^-распределения с /1 и /2 степенями свободы (для нахо-
нахождения .Fa(/i, /2) могут быть использованы либо специальные таблицы, например,
из [24, 25, 29], либо аппроксимации из раздела 1.1.10).
S2
Если влияние фактора А признается незначимым (т.е., когда —^ ^ ^«(/ъ/))?
Sq
то для оценки дисперсии Sq может быть использована более точная оценка 52,
имеющая (кп — 1) степеней свободы против к (п — 1) для Sq.
Для упрощения вычислений приведем алгоритм их выполнения. Вычисляем
последовательно суммы
Далее находим
к-1 '
Сравнением 5^| и Sq устанавливаем наличие влияния фактора А.
5.1]
Дисперсионный анализ
593
Ьсли
к (п — 1)
—^—г^
1
^ 1;
^ l)j, то влияние фактора А признается
ц1 ц2
значимым. В ином случае всю выборку наблюдений можно считать однородной
с общей дисперсией S2 = —^ -^.
fcn — 1
Ранее (см. раздел 4.1.1.2), однофакторный дисперсионный анализ использовался
для проверки гипотезы о равенстве нескольких выборочных средних из нормально-
нормального распределения. Однофакторный дисперсионный анализ и сравнение нескольких
средних являются различными приемами решения одной и той же задачи. Когда
на различных уровнях фактора А проводятся различные количества наблюде-
наблюдений, формулы дисперсионного анализа имеют вид (щ — число экспериментов на
к
уровне
i, N = J2 ni):
г=1
= ??
X
к-1
Отношение —^ сравнивается с Fa(k — 1;N — к).
So
Задача 319. Провести дисперсионный анализ данных, представленных таблицей, при
доверительной вероятности а = 0,95:
1
2
3
4
5
6
Е
Уровни фактора Ai
Аг
3,2
3,1
3,1
2,8
3,3
3,0
18,5
А2
2,6
3,1
2,7
2,9
2,7
2,8
16,8
2,9
2,6
3,0
3,1
3,0
2,8
17,4
А4
3,6
3,4
3,2
3,3
3,5
3,3
20,3
А5
3,0
3,4
3,2
3,5
2,9
3,1
19,1
Вычисляем
= Е Е 4 = 28
x2i=\- A8'5
^° 5-6
Далее вычисляем дисперсии
« 284,87-284,025 =00338;
1
30
284,025 - 282,747
= 284,025;
=282'7
S2A
0,319
= 9,45.
S°- 5.F-1)
Из таблиц для Д = fc — 1 = 4 и /2 = /г • (п — 1) = 25 находим ^о,9бD; 25) = 2,8. Так как
-^ = 9,45 > ^о,95 D; 25) = 2,8, влияние фактора А на поведение наблюдаемых случайных
величин следует признать значимым.
594
Методы исследования связей между случайными величинами
[Гл. 5
5.1.1.2. Двухфакторный дисперсионный анализ
Рассмотренный ранее однофакторный дисперсионный анализ обладает инфор™
мативностью, не большей, чем методы множественного сравнения средних (см. раз-
раздел 4.1.1.2). Информативность дисперсионного анализа возрастает при одновремен™
ном изучении влияния нескольких факторов.
Рассмотрим случай, когда анализируется влияние одновременно двух факторов
А и В на уровнях А\, Ач, ..., А^ и Bi, i^25 • • •, Вт соответственно. Пусть результаты
эксперимента представлены таблицей:
в
Вг
в2
в,
вт
Е
4
4i
хц
#12
xlm
Хг
А2
Х2\
Х2з
Х2т
х2
Хг1
Хг2
х1т
Xi
Хк3
Xkl
Xk2
xkj
Хкт
хк
Е
Xv
Х41
Ху
Дисперсионный анализ для двухфакторных таблиц проводится в следующей
последовательности. Вычисляются суммы
к т
Далее находятся оценки дисперсий
О2 Q1+Q4-Q2- Яз
1 j=i
S2
Если —2" > Fa(fi, /2M где Д = Aj — 1 и /2 = (Aj — 1)(т — 1), то влияние фактора А
So
с достоверностью а признается значимым.
Аналогично значимым признается влияние фактора В^ если
я2
Fa
(/ь /2), где Д = m - 1 и /2 = (А; - 1) (ш - 1) .
Приведенный анализ предполагает независимость факторов А ш В. Если они зави™
симы, то взаимодействие факторов С = АВ также является фактором, которому
соответствует своя дисперсия. Для того, чтобы выделить такое взаимодействие,
необходимы параллельные наблюдения в каждой клетке таблицы, т. е. при каждом
сочетании факторов А и В на уровнях А{ и Bj соответственно необходимо не
одно наблюдение, а серия наблюдений ж^д, Хц2^ ..., хцп. Пусть Xij теперь является
5.1]
Дисперсионный анализ
595
средним из п наблюдений, т. е. Xij =
= — У]
^. Для оценки влияния взаимодействия
17=1
факторов АВ вычисляем дополнительную сумму
к т п
On — V V V X2-
Далее анализ проводится, как и ранее, с той лишь разницей, что в клетках
таблицы вместо отдельных значений Xijv используются их средние значения Xij.
Вычисляется дисперсия
Sab = тк (п - 1)'
и проверяется значимость взаимодействия факторов АВ критерием
r->Fa{fuh),
где
= (к - 1)(т - 1) и /2 = тк(п - 1).
С добавлением каждого нового фактора принципиальная основа дисперсной™
ног о анализа не изменяется, но существенно усложняются формулы и таблицы
для расчетов. Подробное изложение прикладных методов дисперсионного анализа
для случая трех, четырех и более факторов с анализом различных практических
ситуаций содержится в [20, 559].
Задача 320. Провести двухфакторный дисперсионный анализ данных, представлен-
представленных следующей таблицей^ при доверительной вероятности а = 0,95:
В
Вг
в2
Вз
в4
3,6
4,2
3,8
3,4
Аг
3,8
4,0
3,5
3,2
4,1
4,1
3,6
3,2
2,9
3,3
3,6
3,4
А
А2
зд
2,9
3,7
3,6
3,0
3,2
3,5
3,5
2,6
3,7
3,2
3,6
А3
2,5
3,5
3,0
3,8
2,9
3,
3,
з,
6
4
7
Заменяя в клетках таблицы серии значений их средними, получаем следующую
таблицу:
В
Вг
в2
в3
в4
Е
А
Аг
3,83
4,10
3,63
3,27
14,83
А2
3,00
3,13
3,60
3,50
13,23
А3
2,67
3,60
3,20
3,70
13,17
Е
9,50
10,83
10,43
10,47
41,23
Используя данные таблицы, вычисляем суммы
3 4 1 3
х% = 143,34; Q2 = - • J2 Xi = 142,102675;
г=1
i = 141,98157;
4-3
Е xi = 141,6594; Q5 = Е Е Е 4- = 430,79.
г=1j=lu=l
596 Методы исследования связей между случайными величинами [Гл. 5
Далее вычисляем:
а2 Qi + Q4 - Q2 - Q3 143,3745 + 141,6594 - 142,102675 - 141,98157
О _
on :=::::
'=:i 0,15821
(fc-l)-(ra-l) 2-3
Я2 _ Q2 - Qa _ 142,3745 - 141,6594
^ к — 1 2
= Qj^Q* = 141,98157-141,6594 =
771—1 3
= Q.-n.ft = 430,79-3-143,3745 =
rafc • (п - 1) 4-3-2 '
fi| = 0,223675 = 4 = ^^^=0,679; ^# = 3 ' °'1582 = 17,09.
Sg 0,1582 ' ' Si 0,1582 ' ' S2AB 0,02777
Из таблиц (см. раздел 1.1.10) имеем
Fo,95[fc - 1; (А; - 1) • (ш - 1)] = Fo,95B; 6) = 5,1; F0^[m - l; (A; - 1) • (m - 1)] = 458;
^о,95[(^^ 1) -(т- 1);тк- (п - 1)] =F0,95F;24) = 2,5.
Сравнивая, получаем
% = 1,41 < Fo,95B; 6) = 5,1; % = 0,679 < Fo!95C; 6) = 4,8;
о2
^^ = 17,09 > F0,95F; 24) = 2,5.
Следовательно, влияние факторов А и В должно быть признано незначимым. Однако
существенно значимым является взаимодействие факторов А ж В. Это поучительный
пример эффективности двухфакторного дисперсионного анализа по сравнению с про-
простым последовательным повторением однофакторных экспериментов.
5.1.2. Дисперсионный анализ с использованием размахов
Рассмотрим схему двухфакторного дисперсионного анализа с к уровнями фак-
фактора А ж т уровнями фактора В (при каждом сочетании уровней факторов одно
наблюдение или среднее из нескольких наблюдений). В [119] рассмотрено приме-
применение „стьюдентизированного" размаха, как статистики для выявления значимости
влияния изучаемых факторов
max Xi — min
q ъ
Статистика q распределена как статистика „стьюдентизированного" размаха (см.
раздел 4.1.1.2.2), критические точки которой приведены в табл. 123 для различ™
ных т (в табл. 123 следует вместо п использовать т) и /. Количества эквивалент-
эквивалентных степеней свободы / для нашего случая и значения коэффициента с приведены
в табл. 215.
Средний размах ш вычисляется следующим образом. Для каждого уровня Ai
находим
1 т
Х4 = — У^ Xij. г = 1, 2, ..., к.
т ^^ J
i=t
Затем для всех уровней фактора В при г-м уровне фактора А вычисляем т
разностей Axij = x^j — х^, j = 1,2, ..., га. Далее находим
1 т
ujj = max Ахц — min Аж?-7- и ш = — \^ о;,-.
J l^i^k J l^i^k J m f^
5.1]
Дисперсионный анализ
597
Таблица 215
Масштабный коэффициент с и эффективное число степеней
свободы / для двухфакторного дисперсионного анализа [119]
т
2
3
4
5
6
7
8
9
10
20
т
2
3
4
5
6
7
8
9
10
20
/
1,00
1,90
2,70
3,60
4,50
5,40
6,30
7,10
8,10
16,70
i
f
4,70
9,30
13,90
18,50
23,00
27,60
32,10
36,60
41,00
86,00
>
с
1,00
1,05
1,07
1,08
1,09
1,09
1,10
1,10
1,10
11,10
с
1,89
2,12
2,23
2,30
2,34
2,37
2,39
2,41
2,42
2,48
3
/
2,00
3,70
5,40
7,20
8,90
10,70
12,50
14,30
16,10
33,90
7
/
5,50
11,30
16,90
22,40
27,90
33,30
38,70
44,00
49,30
103,00
с
1,35
1,48
1,54
1,57
1,59
1,61
1,62
1,63
1,63
1,66
с
2,00
2,26
2,38
2,45
2,49
2,52
2,55
2,57
2,58
2,64
к
4
f
2,90
5,60
8,20
10,90
13,60
16,30
19,00
21,70
24,40
51,50
к
8
/
6,30
13,40
20,10
26,60
33,00
39,30
45,60
51,80
57,90
119,00
с
1,58
1,76
1,84
1,88
1,91
1,93
1,95
1,96
1,97
2,02
с
2,10
2,37
2,50
2,57
2,62
2,65
2,68
2,70
2,71
2,78
5
/
3,80
7,40
11,00
14,60
18,20
21,80
25,40
29,00
32,60
68,80
с
1,75
1,96
2,06
2,12
2,15
2,18
2,20
2,21
2,22
2,28
9
/
7,00
15,70
23,60
31,10
38,30
45,40
52,50
59,60
66,60
134,00
с
2,18
2,46
2,60
2,68
2,73
2,76
2,79
2,81
2,83
2,90
Превышение выборочной статистикой q ее критического значения qa(mi f)
(из табл. 123) приводит к признанию значимости влияния изучаемых факторов.
Задача 321. Провести дисперсионный анализ в условиях задачи 320 с помощью раз-
махов.
Таблица данных имеет следующий вид:
В
Вг
в2
в4
А
Аг
3,83
4,10
3,63
3,27
А2
3,00
3,13
3,60
3,50
А3
2,70
3,50
3,20
3,70
Имеем к = 3, т = 4. Из табл. 215 для к = 3, т = 4 находим с = 1,54 и / = 5,4.
Далее средние по столбцам (при уровне а» фактора А) равны
3,83 + 4,10 + 3,63 + 3,27
= 3,7075;
3,00 + 3,13 + 3,60 + 3,50
х2 = = 3,3075;
2,70 + 3,50 + 3,20 + 3,70
= 3,275.
Следовательно, max х% — min х% = х\ — хз = 3,7075 — 3,275 = 0,4325.
598
Методы исследования связей между случайными величинами
[Гл. 5
Теперь вычислим т = 4 разностей Axij = хц — xi для всех j = 1, 2, ..., т. Таблица
этих разностей для нашего случая имеет вид.
В
Вг
в2
в3
в4
А
Аг
0,1225
0,3925
-0,0775
^0,4375
А2
-0,3075
-0,1775
0,2925
0,1925
Аз
-0,5750
0,2250
-0,0750
0,4250
0,6975
0,5700
0,3700
0,8625
Для каждого j значения ujj = max Ax^j — min Ax^ приведены в последнем столбце
таблицы. Далее находим
0,6975 + 0,570 + 0,37 + 0,8625 Г 0,4325
ш = = 0,625; q = 1,54 • V4 •
0,625
= 2,13.
Из табл. 123 находим для т = 4 (входим в таблицу с п = 3) / = 5,4 (используем
интерполяцию) и при а = 0,95 находим до,95 D; 5,4) = 5,2.
Так как q = 2,13 < до,9бD;5,4) = 5,2, этот критерий не выявил влияния факторов
А и В на наблюдаемый процесс. К сожалению, выделить влияние взаимодействия фак-
факторов А и В с помощью этого критерия невозможно.
5.1.3. Непараметрический дисперсионный анализ
Использование для однофакторного дисперсионного анализа вместо значений слу™
чайных величин их рангов, назначенных определенным образом, рассмотрено в раз-
разделе 4.2.1.2.15, где приведена подробная информация о критерии Фридмана-Кендал-
ла—Бэбингтона Смита, применяемом в этом случае. Мы отсылаем читателя к разде-
разделу 4.2.1.2.15, где этот критерий рассмотрен применительно к задаче сравнения не-
нескольких средних, что аналогично задаче однофакторного дисперсионного анализа.
Поэтому мы сосредоточимся на изложении пока малоизвестных и в силу этого
обстоятельства редко применяемых методов двухфакторного непараметрического
дисперсионного анализа для неполных данных. Для более глубокого изучения
проблем неполных данных отсылаем заинтересованного читателя к сравнительно
недавно переведенной на русский язык монографии [385].
5.1.3.1. Двухфакторный непараметрический дисперсионный анализ
длм неполных данных
Предположим, имеется таблица дисперсионного анализа с к уровнями факто-
фактора А (г = 1, 2, ..., к) и т уровнями фактора В (j = 1, 2, ..., га). Ранее мы рас-
рассматривали ситуацию, когда в каждой ячейке таблицы было одно наблюдение xij.
Однако в практике часто могут быть случаи, когда часть требуемых значений xij
может по тем или иным причинам отсутствовать: например, когда в эксперименте
не все сочетания факторов Ai и Bj могут быть реализованы. Обычно при обработке
неполных данных используется замена отсутствующих данных средними наблюде-
наблюдениями или средними рангами, вычисленными по некоторому множеству наблюде-
наблюдений. Однако это может приводить к ошибкам. В настоящем разделе приведены
более точные критерии для такой ситуации.
5.1.3.1.1. Критерий Принтиса
Предположим, что двухфакторная таблица имеет т строк и к столбцов, и в каж-
каждой (i^j)-M ячейке находится либо одно наблюдение, либо ни одного. Пусть riij —
число наблюдений в ячейке, расположенной на пересечении j-й строки и г-го столб-
5.1]
Дисперсионный анализ
599
ца (г = 1, 2, ...,1с; j = 1, 2, ..., га). Очевидно, что п^- = 1 или п^- = 0. Обозначим
rij = ^ n^j. В каждой j-й строке ранжируем по возрастанию все гг^ наблюдений
и получаем последователвности рангов Rji, Rj2? • • • ? ^'п^ Для всех j = 1,2,..., га.
Пусть Si — множество строк (а, следовательно, и ранжировок), в которых есть
наблюдение над г-м столбцом (т.е. ранг, относящийся к г~му столбцу). Далее вы™
числяем
% - 1
1
'12
1
% + 1
Построим матрицу W = ||ги^/||, без i/-ro столбца и iz-й строки, где 1 ^ v ^ fc
(т. е. матрица W строится вычеркиванием произвольно выбранных столбца
и строки с одним и тем же номером из матрицы ||ги^'||)- Строим вектор
а = (ai, ..., a^-i, a^+i ..., a^), т. е. удаляется компонента с номером v вычеркнутых
строки и столбца. Вычисляем матрицу W, обратную к матрице W, и квадратич™
ную форму с = aFF^1a/, где а; — вектор-столбец, получаемый транспонированием
вектора-строки а.
При достаточно больших выборках (га ^8, к ^ 6) имеет место приближение
[560, 561], из которого следует, что если с ^ Х«(^ ~~ 1M то гипотеза об отсутствии
влияния исследуемых факторов отклоняется с вероятностью а (здесь Х«(^ ~ 1) —
a-квантиль распределения хи™квадрат с f = к — 1 степенями свободы).
При малых значениях га и к приближение действует плохо, однако таблицы
критических значений этого критерия отсутствуют.
Задача 322. Для данных, представленных в таблице, провести дисперсионный анализ
критерием Принтиса при доверительной вероятности а = 0,95:
3
1
2
3
г
1
3,7
5,6
2
8,2
6,4
2,3
3
7,5
Имеем т = k = 3 ш rij = 2,j = 1,2,3. Производим ранжирование наблюдений по всем
строкам и получаем таблицу рангов:
3
1
2
3
г
1
1
2
2
2
1
1
3
2
Множество строк Si, в которых имеются наблюдения в первом (г = 1) столбце, будет
= {1,3}, и по аналогии S2 = {1,2,3}, S3 = {2}.
Далее вычисляем
ai=
i=i,3
пз +1
Дп
ni + 1
600
Методы исследования связей между случайными величинами
[Гл. 5
а2
= Е
j = l,2,3
Rj2 l\ _ 2 1 1 1 1 1 _ 1
n,- + 1 2/^3 2 3 2 3 2^6'
= ?
3 = 2
Вычислим теперь диагональные элементы матрицы:
1 v^ п7- - 1 1 /l l
12 ^ гц + 1
022 = S ;
.7 = 1,2,3
1
12
12 \3 3
l l :
2
36'
з ш
~ 36'
12
1 1
12 * 3
1
зб7
Далее вычисляем остальные элементы матрицы:
1 ^^ 1 1 v^ 1
12 ^ те,- + 1
ii3 J
W\2 = "Ш21 = * ?
12 ^ rij + 1
jes1ns2 J
= 0
i=i,3
П S2 —пустое мно^кество) ;
12
1 1
" 12 * 3
Таким образом, получаем матрицу
wa =
36
2
36
3
36
о
36
1
36
W21 W22 W23
W31 W32 W33
0
36 36
Отбросим 3-ю строку и 3-й столбец (у = 3), тогда имеем матрицу
2 2
36 36
w =
2
~36
3
36
2
36'
Соответственно имеем вектор а = ( 0, 1 (вместо а = ( 0, , - 1 —так как вычерки-
V 6/ V 6 6/
вается третье значение).
Теперь вычисляем матрицу W", обратную матрице W. Напомним, что обратная
матрица W^1 связана с основной W соотношением W • W^1 = I. Обратная матрица
, где det W — определитель матрицы W, А —
рассчитывается по формуле ,,
присоединенная матрица, являющаяся транспонированной матрицей алгебраических до-
дополнений.
Алгебраическое дополнение Ац элемента aij матрицы равно определителю матрицы,
полученной вычеркиванием в первоначальной матрице г-й строки и j-ro столбца, умно-
женному на (™1)*+J'.
Транспонирование матрицы достигается перестановкой ее строк и столбцов.
Для нашего случая
36-36 I зб/ \ 36/ 36-36
36
2
36
36
3
36
5.1]
Дисперсионный анализ
601
Для матрицы W =
2
36
2
36
2
~36
3
36
матрица алгебраических дополнений имеет вид
3 2
36 36
2 2
36 36
3
36
2
36
2
36
2
36
. Присоединенная матрица получается транспонированием матрицы
Окончательно получаем
A
detW
3
36
2
36
36
2
36
2
36
2
¦36
3-36-36 2-36-36
36-2 36-2
2-36-36 2-36-36
36-2
36
54 36
36 36
Далее вычисляем квадратичную форму (и)ц/ — элементы матрицы W
0 • 36 +0 • \-\) • 36
•36 = 1.
Критическое значение из табл. 55 Xo,9sB) = 5,99.
Так как с = 1 < Xo,9sB) = 5,99, влияние факторов в таблице следует признать незна-
незначимым.
5.1.3.1.2. Критерий Мака—Скиллингса
Обозначения те же, что и в предыдущем разделе. В каждой ячейке допускается
любое число наблюдений riji (j = 1, ..., га; г = 1, ..., к); N = ^2,пз*-- Пр°ЦеДУРа
hi
построения статистики критерия включает в себя следующие шаги. Все наблюдения
к
j-is. строки ранж:ируются по возрастанию от 1 до rij = ^%'i- Обозначим через
г=1
rjiu — ранг наблюдения Xjiv в общей последовательности (j = 1, ..., га; г = 1, ..., к;
у = 1, • • -,riji).
Вычисляем
Будем рассматривать случай пропорциональных частот, т. е. когда п™ =
N
31 тк
т
-, где щ = Y^ riji. Для этого (достаточно распространенного) случая стати-
статистика критерия имеет вид [562]
к
Т =
12
N(N
г=1
J=1
602
Методы исследования связей между случайными величинами
[Гл. 5
При N =
оо (N > 15) справедлива %2™аппроксимация. Влияние изуча™
емых факторов на поведение случайной величины с достоверностью а признается
значимым, если Т ^ ^(к — \).
Критические значения Ta(rn,k,nji) статистики Мака—Скиллингса приведены
в табл. 216.
Таблица 216
Критические значения Та (га, fe, rtji)
статистики Мака^Скиллингса [560, 562]
тп
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
ил
2
3
4
5
2
3
4
5
2
3
4
5
2
3
4
5
Доверительная
0,90
к
2
2,700
3,429
4,375
4,142
3,200
3,571
2,778
3,058
3,750
3,048
3,000
3,153
3,000
2,752
2,817
2,987
3
5,143
4,578
4,635
4,530
4,667
4,662
4,625
4,654
4,587
4,571
4,622
4,580
4,629
4,604
4,669
4,572
4
6,083
6,128
6,243
6,160
6,167
6,231
6,231
6,265
6,250
6,231
6,325
6,243
6,267
6,179
6,287
6,147
5
7,418
7,500
7,664
7,617
7,527
7,633
7,776
7,714
7,500
7,700
7,761
7,782
7,702
7,673
7,746
7,704
вероятность а
0,95
к
2
4,800
4,667
4,167
4,276
5,000
4,587
4,000
3,060
5,400
3,857
4,083
3,938
4,320
4,200
2,267
4,034
3
5,571
5,733
5,846
5,880
6,000
5,896
5,936
5,927
5,786
5,956
5,984
5,955
5,886
5,920
5,977
5,844
4
7,250
7,615
7,577
7,686
7,444
7,479
7,757
7,750
7,625
7,667
7,737
7,717
7,733
7,779
7,747
7,583
5
8,727
8,967
9,036
9,338
9,018
9,089
9,300
9,263
8,918
9,200
9,354
9,404
9,251
9,347
9,317
9,250
Задача 323. Выполнить дисперсионный анализ данных, приведенных в таблице, кри-
критерием Мака-Скиллингса при доверительной вероятности а = 0,95:
3
1
2
3
1
1,2
1,3
1,4
1,5
2,2
2,1
1,5
1,7
1,7
1,6
2,8
2,4
г
2
2,3
2,5
3,7
3,2
1,9
1,6
2,4
2,6
зд
3,4
1,1
1,4
3,1
3,5
2,9
2,2
3,7
3,1
3
3,4
3,3
2,1
2,4
3,9
3,3
Проведя ранжирование данных по строкам, получаем таблицу рангов
3
1
2
3
1
3
1
2
6
5
1
2
4
4
3
8
7
г
2
5
7
12
10
4
3
6
8
9
11
1
2
3
9
11
8
6
11
9
12
10
5
7
12
10
5.1]
Дисперсионный анализ
603
В нашем случае riji = 4; т = 3 и к = 3.
4
Суммы рангов Rji = ]P г^ приведены в следующей таблице:
3
1
2
3
1
10
10
26
2
26
42
10
3
42
26
42
Имеем
N
mk
т. е. имеет место вариант пропорциональных частот.
Далее находим
Вычисляем статистику критерия
Т =
12
N-(N + m) fr{
12- 12
36 ¦ C6 + 3)
11,5-
36 + 3
+ ... + 27,5 -
36 + 3
= 13,128.
Для m = к = 3, riji = 4 и a = 0595 из табл. 216 имеем Т0;95C, 3, 4) = 5,936.
Так как Т = 13,128 > ТЬ,Э5C, 3, 4) = 5,936, следует признать влияние изучаемых фак-
факторов значимым.
5.1.3.1.3. Критерий Лемана-Мака
Обозначения аналогичны критерию Мака^Скиллингса. Ранжируем все
к
rij = ^ riji наблюдений внутри j-й строки и обозначим через Rjiv ранг наблюдения
г=1
Xjiv {и = 1, ... ,га).
Вычисляем сумму и средний ранг наблюдения над j-м столбцом в г-й строке
^i* = ~ Yl Riil/i 3 = 1? • • • 5 т; г = 1, ..., fc.
Далее, вычисляем значение статистики Крускала-Уоллиса (см. раздел 4.2.1.2.1):
2 к
к
щ
1 = 1
12
% К- +1)
Vz^=l
Наконец вычисляем статистику критерия (сумму статистик Крускала-Уоллиса)
604
Методы исследования связей между случайными величинами
[Гл. 5
Громоздкие таблицы критических значений статистики Н приведены в [563].
Для частного случая rij = n (постоянное число наблюдений по строкам)
(т
Обозначим через Zj число пустых ячеек в j'-й строке и введем величины
Тогда статистика Лемана^Мака имеет вид
L =
Ее критические значения равны
m(n-l)f1Fn(f1J2)
/2+/lF«(/i,/2) '
где i^a (/l?/2) — a-квантиль i^-распределения с /1 и /2 степенями свободы; для
нахождения .Fa рекомендуется пользоваться специальными таблицами ([24, 25, 29]
и особенно [87]).
Влияние изучаемого фактора на случайные величины признается значимым
с вероятностью а, если L > La(/i, /2).
Рассмотрим теперь случай, когда хотя бы два числа наблюдений в строках не
равны: rij1 ф rij2; ji,j2 € {1, . ..,га}, j\ /j*2- В этом случае гипотеза о влиянии
факторов принимается, если Н ^ Xa(/i), где X«(/i) — a-квантиль распределения
хи™квадрат с Д степенями свободы.
Задача 324. Выполнить дисперсионный анализ данных^ приведенных в задаче 323,
критерием Лемана-Мака при доверительной вероятности а = 0,95.
Имеем riij =4, rij =n^ = 12,
дены в таблице (см. задачу 323):
= 3. Суммы рангов по ячейкам таблицы приве-
приве3
1
2
3
г
1
10
10
26
2
26
42
10
3
42
26
42
я1 =
Вычисляем
12
т ¦ (щ + 1)
-3-
12
• - • (Ю2 + 262 + 422) - 3 • A2 + 1) = 9,8461.
12-13 4
з
Очевидно, чтоЯ1=Я2=Я3иЯ=У]^=3- 9,8461 = 29,5383.
5.1] Дисперсионный анализ 605
Далее при rij = п = 12 имеем
ЯГ = Я2* = Щ = ^—^ • Нг = 13 • 9,8461 = 127,9993;
ЯГ* = Я2** = Я3** = ^^ • A2 - 1 - 9,8461) = 15,0007.
Число непустых ячеек в j-й строке равно lj = 3 (j = 1, 2, 3).
Находим
? Я** = 45,0021; /i = Е (I, - 1) = 6; /2 = ? A2 - I,) = 27.
j=i i=i j=i
383 9979
Окончательно имеем L = = 38,398. Из таблиц находим Fq 95F,27) = 2,459
6-45,00021 ' ' V ' ;
3 ¦ A2 - 1) ¦ 6 • 2,459
= 11,0.
27 + 6-2,459
Так как L = 38,398 > Lg,95 F,27) = 11,66, влияние изучаемых факторов следует с до-
достоверностью а = 0,95 признать значимым.
606 Методы исследования связей между случайными величинами [Гл. 5
5.2. Корреляционный анализ
Корреляционный анализ предполагает изучение зависимости между случайны™
ми величинами с одновременной количественной оценкой степени неслучайности их
совместного изменения.
Изменение случайной величины у, соответствующее изменению случайной ве-
величины ж, разбивается на две составляющие — стохастическую, связанную с неслу™
чайной зависимостью у от ж, и случайную (или статистическую), связанную со
случайным характером поведения самих у и х.
Стохастическая составляющая связи между у is. x характеризуется коэффици-
коэффициентом корреляции
_ Щ[х-Щх)][у-Щу)]}
Р
где M(z) и D(z) — соответственно математическое ожидание и дисперсия случайной
величины z.
Коэффициент корреляции показывает, насколько связь между случайными ве-
величинами близка к строго линейной. Если у и х распределены нормально, равенство
р = 0 указывает на отсутствие линейной связи между ними. Значение р = =Ы со-
соответствует строго линейной связи между у и х (знак указывает на направление
связи).
Однако коэффициент корреляции р не учитывает возможной криволинейной
связи между случайными величинами. Для учета таких связей используется кор-
корреляционное отношение, введенное К. Пирсоном.
Для двумерного ряда наблюдений, когда на каждом уровне одной переменной у^
наблюдаются щ значений другой переменной Xij (j = 1, ..., щ), корреляционное
отношение определяется следующим образом
где Sq — дисперсия рассеяния значений Х{j, связанная с влиянием группировки
значений X{j по г уровням переменной у\ S2—дисперсия рассеяния значений X{j
без учета их группировки по уровням переменной у.
В нашем случае определено корреляционное отношение х по у. Перестановкой
переменных по аналогии может быть определено г}2 — корреляционное отношение
у по х (тогда на каждом уровне переменной Х{ наблюдается группа значений другой
переменной y%j). В общем случае г}^у ф f]yX.
Если у и х связаны строго линейно, то г]2 = р2 = 1. Если между х и у существует
линейная стохастическая связь, то р2 = г}2 < 1. При нелинейной стохастической свя-
зи р2 < г}2 < 1. В любом случае имеет место неравенство 0 ^ р2 ^ г]2 ^ 1 (равенство
достигается только при строгой линейной связи между у ж х).
5.2.1. Классический корреляционный анализ
нормально распределенных случайных величин
5.2.1.1. Оценка коэффициента корреляции
Рассматриваются нормально распределенные случайные величины у is x —
(#1, т/1), (#2,2/г), • • •; 0*4, Уг)-> - - - ? (xni Уп)- Выборочной оценкой коэффициента корре-
5.2] Корреляционный анализ 607
ляции р является случайная величина
п
J2(Xi ~^){Vi - У)
где х = — > Xi\ у = — > i/«i ^ — объем выборки.
При малых значениях тг (п < 15) лучшей оценкой коэффициента корреляции
является
г* = г|1 +
2(п-3)
При п > 200 распределение выборочного коэффициента корреляции удовлетво-
рительно аппроксимируется нормальным законом [1] со средним М(г) и дисперси™
ей D(r):
M(r) = p; D(r) = ^.
При п > 5 распределение случайной величины [5]
1 1 — г
z = - In = arcth(r)
2 1+r у J
удовлетворительно аппроксимируется нормальным распределением с параметрами
При п > 10 распределение случайной величины [564]
(г — р)\/п — 2
удовлетворительно аппроксимируется распределением Стьюдента с / = п — 2 сте-
степенями свободы.
Приведенные аппроксимации распределения выборочного коэффициента корреля-
корреляции позволяют строить статистические критерии для проверки гипотез о существен-
существенности корреляционной связи и о возможных значениях коэффициента корреляции.
На практике наибольший интерес представляет задача проверки гипотезы о зна-
значимости корреляционной связи между случайными величинами, т. е. значимости
отклонения коэффициента корреляции р от нуля. В принятых обозначениях прове-
проверяется нулевая гипотеза Hq : \р\ =0 против альтернативы Hi: \р\ ф 0.
Эта гипотеза проверяется сравнением выборочного значения коэффициента кор-
корреляции г с его критическим значением га, являющимся а-квантилью распределе-
распределения г при р = 0. Корреляция между случайными величинами признается значимой,
если \r\ ^ га. Критические значения га приведены в табл. 217.
Использование рассмотренных выше аппроксимаций приводит к следующим
оценкам:
— при п > Б
ехр(
та =
ехр(
608
Методы исследования связей между случайными величинами
[Гл. 5
— при п > 10
— при п > 200
гп =
\
п - 2 + t\+a
2
Здесь иа и ta — «-квантили соответственно стандартного нормального распределе-
распределения и распределения Стьюдента с / = п — 2 степенями свободы.
Таблица 217
Мритические значения га
выборочного коэффициента корреляции для р = О [25]
п
3
4
5
6
7
8
9
10
11
12
Доверительная
вероятность а
0,90
0,988
0,900
0,805
0,729
0,669
0,621
0,582
0,549
0,521
0,497
0,95
0,997
0,950
0,878
0,811
0,754
0,707
0,666
0,632
0,602
0,576
0,99
1,000
0,990
0,959
0,917
0,874
0,834
0,798
0,765
0,735
0,708
п
13
14
15
16
17
18
19
20
21
22
Доверительная
вероятность а
0,90
0,476
0,457
0,441
0,426
0,412
0,400
0,389
0,378
0,369
0,360
0,95
0,553
0,532
0,514
0,497
0,482
0,468
0,456
0,444
0,433
0,423
0,99
0,684
0,661
0,641
0,623
0,606
0,590
0,575
0,561
0,549
0,537
Если гипотеза о значимости корреляции между случайными величинами не
отклоняется, то можно построить доверительный интервал для истинного коэффи-
коэффициента корреляции по его выборочному значению. Впрочем, для корреляционного
анализа это уже не столь важно, ибо его основная цель — установление значимости
наблюдаемой связи.
Задача 325. В результате наблюдений над случайными величинами х и у получена
следующая совокупность данных (п = 10):
ж: 2 4 1 7 3 11 14 15 21 4
у: 7 6 4 11 2 21 31 23 40 15.
Необходимо проверить гипотезу о наличии корреляции меэюду случайными величинами
х и у с достоверностью а = 0,95.
Находим
10
г=1
10
г=1
= 8,2;
и - уJ = 1422;
Xi ~~ ж) = 405,6; у = —
ю
= 16,0;
- (Xi - х) ¦ (у* - у) = 723.
Далее получаем оценки коэффициента корреляции
723
г = =
V405,6 ¦ 1422
= 0,952; г* = 0,952 • 1 +
- 0,952"
2-7
= 0,958.
5.2] Корреляционный анализ 609
Из табл. 217 для п = 10 и а = 0,95 находим го,э5 = 0,632.
Так как г (г*) = 05952 @,958) > го,95 = 0,632, наличие зависимости между величинами
х и у следует признать значимой с достоверностью а = 0,95.
Если воспользоваться аппроксимациями (имея в виду, что tti+o,95 = ^о,975 = 1,96),
2
получим
/2- 1,96
ехР —/=
exp
л/7
что близко к точному значению го,95 = 0,632.
С помощью ^-приближения получим (ti+g (/ = п — 2) = to,975(8) = 2,31)
2
1
о 95 =
tg>975(8) J / 2,312
Ю - 2 + tgf975 (8)
— 0,632,
что совпадает с табличным значением.
Наконец, приближение для больших выборок дает
«0,975 1,96
Го,95 = > = ^^ = 0,653.
\/п — 1 3
5.2.1.2. Оценка корреляционного отношения
Предположим, что мы имеем п значений случайной величины у: 2/i, 2/2? • • • ,Ук-
к
При у = yi наблюдаются щ значений случайной величины х. Если п = У^ п^;
1 п'?
ж^-—j™e значение величины ж, наблюдаемое при у = yi (j = 1, 2,..., щ)\ xi = — J^ ж^-;
г j=i
ж = — J^ ж^, то выборочная оценка корреляционного отношения х по у равна [132]
2 г=1
Проверка гипотезы iifg: f}2 = 0 против альтернативы i?i: ?]2 7^ 0 производится
, rj (п — к)
с помощью статистики I = . 9Ч .
(fc-l)(l-r,2)
Если I ^ Fa(fi1 /2), то нулевая гипотеза отклоняется с достоверностью а. Здесь
-Ра(/ъ /2) — а-квантиль i^-распределения cfi = k^lwf2 = n^k степенями сво-
свободы. При линейной связи между случайными величинами tj2 = р2 и 77^ = ^ж-
Следовательно, разность rj2 — р2 может служить мерой нелинейности корреляцион-
корреляционной связи. Проверка гипотезы Щ : 7]2 — р2 = 0 против альтернативы Нi: т]2 — р2 / 0
может быть осуществлена с помощью статистики
_ (ту2 - р2) (п - к)
" (^2)A^2) '
20 А. И. Кобзарь
610 Методы исследования связей между случайными величинами [Гл. 5
имеющей при справедливости нулевой гипотезы ^-распределение с /х = & — 2
и /2 = п — к степенями свободы. Если I* ^ Fa(fi, /2), то с вероятностью а гипотеза
линейности корреляционной связи отклоняется. Следует помнить, что для оценки
корреляционной связи х по у необходимо иметь несколько наблюдений х для
различных у (и наоборот).
Задача 326. Проверить линейность корреляционной связи для выборки
уц 2 4 9 13 15
Xiji 1,3,4 7,8,12 14,19,21 11,9,6 8,7,3
при доверительной вероятности а = 0,95.
Имеем к = 5,Пг = Зшп = 15. Вычисляем далее:
1 + 3 + 4
5 3
X! = — — = 2,66; х2 =9; х3 = 18; х4 = 8,67; х5 = 6; J2J2 ХЬ = 1641'
3 i=ij=i
= 8,864; ^ п* • ж? = 3 • B,662 + 92 + ... + б2) = 1569,2136.
Тогда
, = 1569,2136-15.8,864^ =
у 1641 - 15 • 8,8642
Из таблиц находим Fo^5(fiJ2) = ^0,95 E ~~ 1; 15 — 5) = F0,9sD; 10) = 3,5.
jy j r?-{n-k) 0,845-10
Вычисляем далее I = (fc _ 1} . (l _ ^2) = 4 . A _ Q?845) = 13,629.
Полученная величина больше критического значения i*b,95 D; 10) = 3,5, следователь-
следовательно, необходимо признать наличие существенной нелинейной связи между х и у.
Оценим теперь отклонение связи между жиг/от линейной, для чего оценим коэффи-
коэффициент корреляции. Вместо значений хц на каждом уровне yi будем использовать средние
значения х%. Тогда ряд будет следующим:
хп 2,66 9 18 8,66 6
уц 2 4 9 13 15.
Используя формулы из предыдущего раздела, получаем
1 1 5 5
ж = - • V ж» = 8,864; y=-.\^yi = 8,6; Y" fe - IJ = 130,2187; \" (yi - у) = 125,5;
5 5 »=1 »=1
5
5^ (ж* - ж) • (t/i - у) = (-6,204) • (-6,6) + ... + (-0,204) • 6,4 = 24,775.
г=1
Тогда
24,775
+ _
-v/130,2187- 125,2
@,8448 - 0,0376) ¦ A5 - 5)
=0,194 (г2 = 0,0376);
г
E - 2) • A - 0,8448)
Из таблиц имеем F0,95E - 2; 15 - 5) = F0,95C; 10) = 3,7.
Так как I* = 17,337 > i*o,95C; 10) = 3,7, следует отклонить гипотезу о наличии линей-
линейной корреляционной связи между случайными величинами.
Отсюда следует поучительный вывод — незначимость коэффициента корреляции не
означает отсутствия связи между исследуемыми величинами. Следует говорить об от™
сутствии линейной зависимости, так как незначимость коэффициента корреляции не
исключает наличия нелинейной связи между случайными величинами.
5.2] Корреляционный анализ 611
5.2.1.3. "Частная и множественная корреляции
При необходимости исследования связи между ^ 3 случайными величинами
исполвзуются частные и множественные коэффициентв! корреляции. Рассмотрим
случай трех переменных — ж, у и z (при числе переменнв1х больше трех выражения
для коэффициентов корреляции могут быть выписаны по аналогии).
Зависимость между двумя переменными х ж у при фиксированной третьей
переменной — z оценивается с помощью частного коэффициента корреляции pxy,z-
По аналогии можно определить частные коэффициенты корреляции по остальным
парам переменных pXZiV и pzy^x.
Выборочные частные (парные) коэффициенты корреляции определяются с по-
помощью соотношений
fZy
Так же, как и простые коэффициенты корреляции, парные коэффициенты прини-
мают значения от — 1 до +1. Гипотеза Н®: pxy^z = 0 для коэффициента корреляции
Pxy,z (для остальных аналогично) проверяется с помощью статистики
t =
/1 — г2
' x ' xy,z
где к — число переменных (в нашем случае к = 3).
При справедливости Hq величина t распределена в соответствии с распределе-
распределением Стьюдента при / = п — к степенях свободы.
При \t\ > ti+a (n — к) нулевая гипотеза Hq отклоняется с вероятностью а. Мно-
2
жественная корреляция исследуется в случае, когда необходимо установить су-
существенность взаимосвязи одной переменной с совокупностью остальных. Выбо-
Выборочные множественные коэффициенты корреляции обозначаются rXiVZ1 ry^XZJ rz^xy
и выражаются через парные коэффициенты корреляции с помощью соотношений
1 X
>yz
2
1 xy
h r2xz - 2rxyrZx'i
1-r2
r2 rz
1 z,xy
x ^ i zy
1
2 Г
2
2.2
1
~~ ^VyxVyzTzx
-r2
1 XZ
Между частными, множественными и обыкновенными парными коэффициента-
коэффициентами корреляции имеют место так называемые контрольные соотношения:
г2 = 1- (l^r2 )(l^r2 ) = 1- (l^r2 Ul-
x,yz x V ' rcz/ \ ' xy,z/ х V xy/\
Т„
r2 =1- (l~r2 )(l-r2 ) = 1- (l-r2 Hl-
Г2 = 1- (l^r2 )fl^r2 ) = 1- (l^r2 )fl^r2 )
z,xy ^ V ^2// V zx,yj ^ V 2Ж/ V- zy,xj *
Для проверки гипотезы Uq : px?2/z = 0 используется статистика
rl,yz n-k
имеющая при справедливости Hq i^-распределение cfi = k^lwf2 = n^k степе-
степенями свободы {к — число переменных, в нашем случае к = 3).
20*
612
Методы исследования связей между случайными величинами
[Гл. 5
Таблица 218
Критические значения 7*1,23...fe коэффициента множественной
корреляции (к — число переменных, п — объем выборки)
т U
П К
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
Доверительная
0,95
к
3
0,999
0,975
0,930
0,881
0,836
0,795
0,758
0,726
0,697
0,671
0,648
0,627
0,608
0,590
0,574
0,559
0,545
0,532
0,520
0,509
0,488
0,470
0,454
0,439
0,425
0,373
0,308
4
0,999
0,983
0,950
0,912
0,874
0,839
0,807
0,777
0,750
0,726
0,703
0,683
0,664
0,646
0,630
0,615
0,601
0,587
0,575
0,563
0,542
0,523
0,506
0,490
0,476
0,419
0,348
5
0,999
0,987
0,961
0,930
0,898
0,867
0,838
0,811
0,786
0,763
0,741
0,722
0,703
0,686
0,670
0,655
0,641
0,628
0,615
0,604
0,582
0,562
0,545
0,529
0,514
0,455
0,380
6
1,000
0,990
0,968
0,942
0,914
0,886
0,860
0,835
0,812
0,790
0,770
0,751
0,733
0,717
0,701
0,687
0,673
0,660
0,647
0,636
0,614
0,594
0,576
0,560
0,545
0,484
0,406
вероятность а
0,99
к
3
1,000
0,995
0,977
0,949
0,917
0,886
0,855
0,827
0,800
0,776
0,753
0,732
0,712
0,694
0,677
0,662
0,647
0,633
0,620
0,607
0,585
0,565
0,546
0,529
0,514
0,454
0,377
4
1,000
0,997
0,983
0,962
0,937
0,911
0,885
0,860
0?837
0,814
0,793
0,773
0,755
0,737
0,721
0,706
0,691
0,678
0,665
0,652
0,630
0,609
0,590
0,573
0,557
0,494
0,414
5
1,000
0,997
0,987
0,970
0,949
0,927
0,904
0,882
0,861
0,840
0,821
0,802
0,785
0,768
0,752
0,738
0,724
0,710
0,697
0,685
0,663
0,643
0,624
0,607
0,591
0,526
0,442
6
1,000
0,998
0,990
0,975
0,957
0,938
0,918
0,898
0,878
0,859
0,841
0,824
0,807
0,791
0,776
0,762
0,749
0,736
0,723
0,712
0,690
0,669
0,651
0,633
0,618
0,552
0,467
Если F > Fa(fi, /2), то соответствующая корреляция признается значимой. Кри-
Критическое значение коэффициента множественной корреляции равно
п - к + (к - 1) Fa(fu f2)'
Корреляция признается значимой при rx^yz ^ TXiyz(a). Критические значения
1,23...fc (для общего случая к переменных) приведенв! в табл. 218.
Задача 327. Вычислить коэффициенты частной и множественной корреляций и про-
проверить их значимость при доверительной вероятности а = 0,95 для данных, приведен-
приведенных ниэюе (п = 10, к = 3):
Хг\ 1 3 4 7 12 4 19 21 1 3
уц 12 42 58 71 68 50 49 85 18 26
гн 41 12 7 3 14 27 38 13 64 75.
Найдем парные коэффициенты корреляции. Вычисляем коэффициент гху:
10 10 10
J2 (хг ~ xf = 484,5; ]Р (у{ - уJ = 6882,1; J2 (ж* ~ ^) * Ьл ~ у) = 1О915
г=1 г=1 г=1
5.2] Корреляционный анализ 613
10
1 loq
г = 7,5; у = — - Y Уг = 47,9; гху = = = 0,597.
' ' У Ю ^ ' ' ХУ /4845 68821
Y Уг = 47,9; гху = =
Ю ^ ' ' ХУ ^/484,5 • 6882,1
Вычисляем коэффициент rxz:
10 10 10
J2 (%i ~ xf = 484,5; ]Г (z* - zf = 5498,4; ^(ж* - x){Zi - z) = ^519;
i=l i=l г=1
ж = 7,5; z = 29,4; гЖ2 = . 519 = = -0,318.
х/484,5 • 5498,4
ВыЧИСЛЯеМ Туг!
10 10 10
? (Уг - У)" = 6882,1; J2 & ~ zf = 5498,4; ^(г/г - у) • (Zi - z) = -3172,66;
г=1 г=10 г=1
^ = 47,9; z = 29,4; гуг =
Вычислим теперь частные коэффициенты корреляции:
0,597- (-0,318) • (-0,516)
Гху
V
,z
,У
' ху
Гху
— rzx
У2
'ГУХ
= 0,533;
= 0,014;
= -0?429.
J(l - 0,3182) ¦ A - 0,5162)
-0,318-0,597- (-0,516)
^/A-0,5Э72) ¦ A-0,5162)
-0,516- (-0,318) -0,597
yjA ~ Г1х) • i1 ~ гЪх) ^/A-0,3182)-A-0,.
Вычислим множественные коэффициенты корреляции:
2 _ 0,5972 + 0,3182 - 2 • 0,597 • (-0,18) • (-0,516) _
Гх,уг - 1_ Q55162 - »
г2 = °-5972 + °-5162 " 2 • °-597 • ("°'516) • ("°'318) = 0 475 (г =0 689)-
y,xz г _0;3182 ' v y'xz ' ; '
rl xy = 0.3182+0,516^-2-(-0,318). 0,597. (-0,516) = =
' у 1 - 0,5972 V ' У ;
Вычисляем t-статистики для проверки значимости частных коэффициентов корре-
корреляции
л/Ю - 3 • 0,533
— для проверки rXy z: txy z = —, =^~ = 1,667;
л/l - 0,5332
л/7-(-0,014) ллоГ7
— для проверки rxz y: txz у = — = = —0,037;
V1 - 0,0142
\/7-(-0,429)
— для проверки rzv ж: t2t/ ж = — = = —1,256.
л/l - 0,4292
Для а = 0,95 и f = п — к = 7 из табл. 118 для t-распределения имеем 11+0,95 =
= to,975G) = 2,37. Видим, что \txy,z\ , \txzj , \tzy,x\ < 2,37.
Следовательно, наличие частной корреляции отклоняется с достоверностью а = 0,95.
Для коэффициентов множественной корреляции находим критическое значение из
табл. 218 при к = 3, п- к = 7 ш а = 0,95. Имеем гч,2з@,95) = 0,758.
Так как ни один множественный коэффициент корреляции (rx,yz = 0,596,
ry,xz — 0,689 и rZixy — 0,516) не превышает критическое значение 0,758, то и наличие
множественной корреляции отклоняется с достоверностью 0,95.
В заключение проверим правильность вычислений, используя контрольные соотно-
соотношения:
rl,yz = 0,5962 = 0,356 = 1 - A - r2xz) • A - r2xyjZ) = 1 - (l - 0,3182) • (l - 0,5332) = 0,356.
614
Методы исследования связей между случайными величинами
[Гл. 5
5.2.2. Непараметрический корреляционный анализ
Рассмотренные в разделе 5.2.1 методы корреляционного анализа предполагали
нормальность распределения исследуемых величин. Для других распределений бо-
лее эффективны методы изучения связи между случайными величинами, основан-
основанные на применении порядковых статистик, либо на замене наблюдаемых величин
их рангами.
Такие методы, обладая повышенной устойчивостью к отклонениям распреде-
распределения от нормального, в большинстве случаев позволяют упростить вычисления,
оставляя на приемлемом уровне статистические характеристики получаемых за™
ключений по гипотезам.
5.2.2.1. Оценивание корреляции с помощью порядковых статистик
5.2.2.1.1. Оценка корреляции с помощью тренда
Оценка наличия корреляции с помощью критериев тренда основано на сле-
следующей идее. Если значения одной переменной (например, х) предварительно
упорядочить (например, по возрастанию), то поведение второй переменной (напри-
(например, у) может служить индикатором искомой корреляции. В самом деле, наличие
корреляции должно приводить к упорядочиванию значений второй переменной (т. е.
к их тренду), отсутствие корреляции не должно изменять случайный характер
поведения значений у при их размещении вдоль упорядоченной последовательности
значений х.
Отсюда следует, что проверка ряда значений у на тренд любым из критериев
тренда, изложенных в разделе 3.3, эквивалентно проверке наличия корреляции.
5.2.2.1.1.1. Критерий Кенуя
Рассмотрим некоторые из критериев, предложенных Кенуем [121] и предполагав
ющих использование „быстрых" критериев сравнения средних. Значения перемен-
переменной х предварительно проранжируем по возрастанию: х\ ^J X2 ^ •. • ^ хп и зафик-
зафиксируем ряд значений у^, соответствующих Х{. Затем проверим наличие тренда в ря-
ряду значений yi одним из „быстрых" критериев Кенуя [121] или Кокс^Стюарта [565].
Для применения „быстрого" критерия Кенуя поступаем следующим образом.
Разбиваем проверяемую совокупность величин у^ объема п на к групп
У11,У12, • • • ,У\т', У 21, У 22, -", У 2т', •••] У%1, У12 , • • • , Угт\ •••]
Ук1,Ук2, • • •, Укт, (т = п/к) .
В каждой группе фиксируем крайние значения ym{ni и t/maXi для г = 1, ...,&.
Затем отбираем значения max ym{ni и mm ymaXi. Вычисляем количество наблю-
наблюдений п~, для которых yi < max t/min., и п+, для которых ^ > mm ymaXi.
Таблица 219
Критические значения па критерия Кенуя
(а — доверительная вероятность) [121]
а
0,95
0,99
к
2
8
12
3
17
22
4
27
33
5
37
45
6
47
57
8
70
83
10
93
110
5.2]
Корреляционный анализ
615
Статистикой критерия является число п = п + п+. Гипотеза о наличии кор™
реляции принимается с достоверностью а, если п > па. Критические значения па
приведены в табл. 219.
5.2.2.1.1.2. Критерий Коке—Стюарта
Рассмотрим теперь применение критерия Кокс-Стюарта для установления кор™
реляции. Ряд наблюдений yi, соответствующих упорядоченному ряду наблюде™
ний Xi, разбивается на 3 приблизительно равные подвыборки (если в/3— дробное
число, то центральная подвыборка уменьшается (увеличивается) на 1). Сравниваем
попарно п1 ^ п/3 первых и п1 « n/З последних наблюдений. Если наблюдение из
первой трети больше соответствующего наблюдения третьей трети, то поставим
знак +1, в ином случае — 1. Статистикой критерия является сумма Т получаемых
+ 1 и -1.
Корреляция между изучаемыми величинами с вероятностью а признается зна-
значимой, если \Т\ > Та. Значения Та приведены в табл. 220.
Таблица 220
Критические значения Та критерия Кокс^Стюарта
(а — доверительная вероятность)
п'
6
7
8
9
10
11
а
0,95
6
7
8
7
8
9
0,99
8
9
10
11
п'
12
13
14
15
16
17
OL
0,95
8
9
10
9
10
9
0,99
10
11
12
11
12
13
п'
18
19
20
21
22
23
а
0,95
10
11
10
11
12
11
0,99
12
13
14
13
14
15
п'
24
25
26
а
0,95
12
11
12
0,99
14
15
14
Эффективность этого критерия по сравнению с классическим корреляционным
?3 50%, т. е. для обеспечения одинаковых статистических характеристик при провер-
проверке гипотез рассматриваемый критерий требует в 2 раза большего объема выборки.
Задача 328. Для ряда пар случайных величин
(xi,yi): A,51), A9,52), B,48), A9,14), E,51), A7,14), (8,49),
A0,50), A3,33), E1,16), B0,42), B2,31), D8,19), D7,21),
B6,41), B6,53), C0,58), C1,43), D6,21), D5,1), D2,11),
C3,43), C3,51), C5,47), C6,30), D0,19), D1,32), D4,31)
установить наличие корреляции „быстрыми" критериями Кенуя и Кокс-Стюарта.
Ранжируем величины х% по возрастанию и получаем совместный ряд:
Xi
1
2
5
8
Уг
51
48
51
49
Xi
10
13
17
19
Уг
50
33
14
52
хг
19
20
22
26
Уг
14
42
31
41
Xi
26
30
31
33
Уг
53
58
43
43
Xi
33
35
36
40
Уг
51
47
30
19
Xi
41
42
44
45
Уг
32
11
31
1
Xi
46
47
48
51
Уг
21
21
19
16
Используем критерий Кенуя. Разбиваем ряд yi на 4 подвыборки:
2/i: 51 48 51 49 50 33 14
уг: 52 14 42 31 41 53 58
2/з: 43 43 51 47 30 19 32
2/4: 11 31 1 21 21 19 16
616
Методы исследования связей между случайными величинами
[Гл. 5
Имеем
2/mini —
2/min4 = 1; г/тах4 =31; max г/mini = 19;
min г/тах7- =31.
Далее сравнением устанавливаем количество значений, меньших, чем тахут\щ =
= 19 (п~ = 5), и больших, чем mlnt/maxi = 31 (п+ = 16).
Тогда статистика критерия равна Т = п~~ + п+ = 21.
Из табл. 219 для а = 0595 и к = 4 находим То,95 = 27.
Так как Т = 21 < ТЬ,95 = 27, корреляция с достоверностью а = 0,95 признается незна-
незначимой.
Используем теперь критерий Кокс—Стюарта.
Имеем п = 28. Выделим 28/3 ps 9 первых наблюдений г/г и 9 последних наблюдений.
Сравнивая их попарно, получаем последовательность
+1, +1, +1, +1, +1, +1, -1, +1, -1
и Г = 5. Из табл. 220 находим для п = 9 ш а = 0,95: T0)95 = 7.
Так как \Т\ = 5 < То,95 = 7, корреляцию следует признать незначимой на уровне
значимости 0,05.
5.2.2.1.2. Знаковый корреляционный критерий Нелсона
Критерий, предложенный Нелсоном [566], позволяет установить наличие кор-
реляции, непрерывно анализируя совместное поведение пар (#г>2/г) по мере их
появления в эксперименте (в процессе). Критерий основан на числе знаков после-
последовательного изменения величин пар (xi,yi).
Если Xi > Xi-i, yi > yi-i или Х{ < #г-ъ У% < 2/г—1? то паре (xi.yi) приписыва™
ется знак +, в ином случае знак —. Другими словами, если значения пар (а^,у^)
изменились в одном направлении, то это отображается знаком +, в разных направ-
направлениях— знаком —. Если в паре одно или оба значения (xi,yi) не изменились, то
этой паре приписывается значение 0. Статистикой критерия является наименьшее
количество S знаков одного вида (+ или —). Корреляция признается значимой при
S > Sa(Sa—критическое значение, приведенное в табл. 221, п — число анализиру-
анализируемых знаков).
Таблица 221
Критические значения Sa знакового критерия
корреляции Нелсона (а, — доверительная вероятность) [566]
11
12
13
14
15
16
17
18
19
20
21
22
23
а
0,95
2
2
3
3
3
4
4
5
5
5
6
6
7
0,99
1
2
2
2
3
3
3
4
4
5
5
5
6
ТЬ
24
25
26
27
28
29
30
31
32
33
34
35
36
а
0,95
7
7
8
8
9
9
9
10
10
11
11
12
12
0,99
6
7
7
7
8
8
9
9
9
10
10
11
11
ТЬ
37
38
39
40
50
55
60
65
70
75
80
85
90
а
0,95
12
13
13
14
18
20
22
25
27
29
31
34
36
0,99
11
12
12
13
17
19
21
23
25
28
30
32
34
5.2]
Корреляционный анализ
617
При п > 90 сумма S распределена асимптотически нормально [566] и Sa « —
у
Эффективность этого метода ~ 50% от классического. Однако основные его
достоинства — простота и возможность анализировать корреляцию непрерывно (по
мере поступления данных) делает его весьма привлекательным для практического
применения.
Задача 329. Проверить гипотезу корреляции по данным задачи 328 критерием Нел-
сона при доверительной вероятности а = 0,95.
Введем данные анализа появления пар в таблицу:
г
1
2
3
4
5
6
7
Xi
1
19
2
19
5
17
8
Уг
51
52
48
14
51
14
49
Знак
+
+
-
-
-
i
8
9
10
11
12
13
14
Xi
10
13
51
20
22
48
47
Уг
50
33
16
42
31
19
21
Знак
+
-
-
-
-
-
г
15
16
17
18
19
20
21
Xi
26
26
30
31
46
45
42
Уг
41
53
58
43
21
1
11
Знак
-
0
+
-
-
+
г
22
23
24
25
26
27
28
33
33
35
36
40
41
44
Уъ
43
51
47
30
19
32
31
Знак
-
0
-
-
-
+
Из таблицы видим, что наименьшее количество знаков одного вида (в нашем слу-
случае +) равно S = 6. Критическое значение из табл. 221 для а = 0,95 и общего количества
знаков любого вида (в нашем случае оно равно 25, в том числе 6 плюсов и 19 минусов)
равно So,95 = 7.
Так как S = 6 < So,95 = 7, корреляция признается незначимой.
Для нормальной аппроксимации имеем
25
что близко к табличному значению Яо,95 = 7.
5.2.2.1.3. Квадрантный критерий
Рассматривается последовательность случайных величин х и у с выборочными
медианами х и у. Введем обозначения
I 1, если Xi > х и yi > у;
\ 0 в остальных случаях;
1 „
-, если Xi > х и yi = у;
0 в остальных случаях;
1/2, если Xi = х и yi > у;
0 в остальных случаях;
1 „
. -, если Xi = х и yi = у;
0 в остальных случаях.
Статистика S = S± + S2 + *^з + $4 моясет быть использована для оценки корре™
ляции между случайными величинами х и у [365] (при п четном очевидно, что
S = Si). Критерий называется квадрантным, так как статистика S основана на
числе наблюдений в квадрантах, на которые плоскость ху делится прямыми х = х
ж у = у.
Гипотеза о наличии корреляции отклоняется, если Si (a) < S < ^(ск) (критиче-
(критические значения Si (а) и $2 (ок) приведены в табл. 222).
618
Методы исследования связей между случайными величинами
[Гл. 5
Таблица 222
Критические значения Si (а) и ^(ок) квадрантного критерия
корреляции (а — доверительная вероятность) [121]
п
8-
10-
12-
14-
16-
18-
20-
22-
24-
26-
28-
30-
32-
34-
36-
38-
40-
42-
44-
46-
48-
50-
52-
54-
56-
58-
60-
62-
64-
66-
68-
70-
72-
-9
- 11
-13
-15
- 17
-19
-21
-23
-25
-27
-29
-31
-33
-35
-37
-39
-41
-43
-45
-47
-49
-51
-53
-55
-57
-59
-61
-63
-65
-67
-69
-71
-73
а
0,
Si
0
0
0
1
1
1
2
2
3
3
3
4
4
5
5
6
6
6
7
7
8
8
8
9
9
10
10
11
11
12
12
12
13
Э5
s2
4
5
6
6
7
8
8
9
9
10
11
11
12
12
13
13
14
15
15
16
16
17
18
18
19
19
20
20
21
21
22
23
23
0 99
Si
—
0
0
0
0
1
1
2
2
2
3
3
3
4
4
5
5
5
6
6
7
7
7
8
8
9
9
9
10
10
11
11
12
s2
—
5
6
7
8
8
9
9
10
11
11
12
13
13
14
14
15
16
16
17
17
18
19
19
20
20
21
22
22
23
23
24
24
n
74-
76-
78-
80-
82-
84-
86-
88-
90-
92-
94-
96-
98-
100-
110-
120-
130-
140-
150-
160-
170-
180-
200-
220-
240-
260-
280-
300-
320-
340-
360-
380-
-74
-77
-79
-81
-83
-85
-87
-89
-91
-93
-95
-97
-99
-101
- 111
- 121
-131
-141
- 151
-161
-171
-181
-201
-221
-241
-261
-281
-301
-321
-341
-361
-381
400
OL
0,
Si
13
14
14
15
15
16
16
16
17
17
18
18
19
19
21
24
26
28
31
33
35
37
42
47
51
56
61
66
70
75
80
84
89
95
s2
24
24
25
25
26
26
27
28
28
29
29
30
30
31
34
36
39
42
44
47
50
53
58
63
69
74
79
84
90
95
100
106
111
0,
Si
12
12
13
13
14
14
15
15
15
16
16
17
17
18
20
22
24
26
29
31
33
35
40
44
49
54
58
63
67
72
77
81
86
99
s2
25
26
26
27
27
28
28
29
30
30
31
31
32
32
35
38
41
44
46
49
52
55
60
66
71
76
82
87
93
98
103
109
114
При п > 100 может быть использована аппроксимация
S(a) =
при n = 2k — 1.
Гипотеза наличия корреляции в этом случае отклоняется с достоверностью а,
если \S\ < S(a) (u7—7™квантиль стандартного нормального распределения). Кри™
терий обладает эффективностью ^ 41% от классического корреляционного крите-
критерия, однако он очень прост для вычислений.
5.2] Корреляционный анализ 619
Напомним, что медиана упорядоченного ряда z\ ^ z^ ^ ... ^ zn определяется
соотношением
при n = 2Aj — 1;
при п = 2к.
Несколько иная версия квадрантного критерия рассмотрена в [567, 568] — кри™
терий Эландта. Его статистикой при п четном является
и = ±иг, где иг = { р (хг - 5) (Уг - у) > 0;
*=1 [0 ПРИ (xi - Я) (yi -у) ^0.
При справедливости гипотезы о наличии корреляции
Если Р(С/ ^ С/*) > а, то с достоверностью а наличие корреляции отклоняется
(U* —выборочное значение статистики U).
Задача 330. Проверить гипотезу корреляции для данных задачи 328 квадрантным
критерием при доверительной вероятности а = 0,95.
Для упорядоченного ряда значений
хц 1 2 5 8 10 13 17 19 19 20 22 26 26 30
31 33 33 35 36 40 41 42 44 45 46 47 48 51
имеем медиану х = - • (жм + х\$) = = 30,5.
Для упорядоченного ряда
уц 1 11 14 16 19 19 21 21 30 31 32 33
41 42 43 43 48 49 50 51 51 52 53 58
2/14+2/15 33 + 41
имеем у = = = 37. Далее находим количества пар, для которых xi > х
a Vi > у; Xi = х ж yi > у; Xi > х ш yi = у; Xi = х ш yi = у: соответственно Si = 4, S2 = 0,
S3 = 0, S4 = 0. Тогда S = Si = 4. Из табл. 222 для п = 28 и а = 0,95 имеем Si@,95) = 3
и 52@,95) = 11.
Так как Si @,95) = 3 < S = 4 < S2@,95) = 11, с достоверностью а = 0,95 наличие кор-
корреляции отклоняется. Используем теперь аппроксимацию
Так как S = 4 < S@,95) = 9,6, то и в этом случае наличие корреляции отклоняется.
Применим теперь критерий Эландта. Имеем последовательность значений
0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.
Тогда получаем U* = ]>^ Щ = 4. Вычисляем далее
(912 + 3642 + 10012 + ... + 912 + 142 + I2) = 0,999.
40116600
Так как Р(С/ ^ 4) = 0,999 > а = 0,95, гипотеза корреляции отклоняется.
620
Методы исследования связей между случайными величинами
[Гл. 5
5.2.2.1.4. Угловой критерий Олмстеда-Тьюки
Сущность критерия сводится к следующему. Двумерная диаграмма (ж, у) сна-
сначала делится вертикальной прямой х = х на две части и горизонтальной прямой
у = у на две части (ж, i/ — медианы).
Если п — нечетное число, то медианы проходят через одну из точек (ж^,^),
которую следует исключить из рассмотрения. В результате получаем четыре ква-
квадранта. Квадрантам, для которых (xi — ж) (yi — у) > 0 (правый верхний и левый
нижний), приписываем знак +, а квадрантам, для которых (xi — x)(yi — у) < 0
(левый верхний и правый нижний) — знак —.
Затем, двигаясь слева направо (от xmin к жтах), подсчитываем количество встре-
встречающихся подряд точек ai, для которых у^ > у (yi < у). По аналогии, двигаясь
справа налево (от жшах к жт1П), подсчитываем количество встречающихся подряд
точек а2, для которых yi < у (yi > у). Затем, двигаясь сверху вниз (от утах к t/min)?
подсчитываем количество встречающихся подряд точек аз, для которых Х{ < ж
(xi > ж), и, наконец, двигаясь снизу вверх (от ymin к |/тах), подсчитываем количество
встречающихся подряд точек а^^ для которых Xi > ж (ж^ < ж). Знаки значениям ai,
а2? о,з, «4 присваиваются в зависимости от квадранта, в котором располагаются
отобранные точки.
Статистикой критерия является абсолютная сумма
Q =
г=1
критические значения которой приведены в табл. 223.
Таблица 223
Критические значения Qa угловой статистики
Олмстеда—Тьюки
(а — доверительная вероятность) [24]
а
Qa
0,90
9
0,95
11
0?99
14-=-15
0,999
18-=-21
Меньшая величина Qa применяется для выборок большого объема, большая
величина — для выборок малого объема.
При Q > Qa наличие корреляции признается значимым с вероятностью а. Если
Q > 2п при п ^ 6, то критерием Олмстеда-Тьюки пользоваться не рекомендуется.
Критерий обладает низкой эффективностью (« 25% по сравнению с класси-
классическими оценками) и рекомендуется к применению при больших объемах выбо-
выборок (п > 50). При п > 50 вероятность того, что Q > Qa, оценивается по формуле
9Q
168Q + 208
2162-2^
Задача 331. Проверить наличие корреляции мемсду исследуемыми данными крите-
критерием Олмстеда-Тьюки при доверительной вероятности а = 0,95 в условиях задачи 328.
В нашем случае х = 30,5 и у = 37. Движемся слева направо (от жт1п = 1 к жтах = 51)
и подсчитываем количество встречающихся подряд точек (xi,yi), для которых yi < у.
Видим, что таких точек а\ = 5 — это точки A,51), B,48), E,51), (8,49), A0,50). Все эти
точки расположены в левом верхнем квадранте (так как Xi < х и yi > у), значение а\
долж:но учитываться со знаком —.
Движемся теперь справа налево (от жтах = 51 к xmin = 1) и подсчитываем количество
встречающихся подряд точек, для которых у% < г/, — их количество п2 = 10 — это точки
E1,16), D8,19), D7,21), D6,21), D5,1), D4,31), D2,11), D1,32), D0,19), C6,30).
5.2] Корреляционный анализ 621
Так как все эти точки расположены в правом нижнем квадранте (ра > х и yi < у),
то сумма п2 = 10 должна учитываться со знаком —.
Далее движемся сверху вниз (от 2/тах = 58 к ymin = 1) и подсчитываем количество
встречающихся подряд точек аз, для которых xi < x: это точки C0, 58), B6, 53), A9, 52),
A,51). Так как эти точки находятся в левом верхнем квадранте, то значение аз = 4
учитывается со знаком —.
И, наконец, движемся снизу вверх (от t/min = 1 к ушах = 58) и подсчитываем коли-
количество встречающихся подряд точек, для которых Xi > ж, их ац = 2. Это точки D5,1),
D2,11). Все они располагаются в правом нижнем квадранте, и поэтому а^ = 2 также
учитывается со знаком —.
Окончательно имеем Q = \а\ + п2 + аз + ск| = |—5 — 10 — 4 — 2| = 21.
Легко видеть, что критерий приводит к принятию гипотезы о наличии корреляции,
так как Q = 21 > Qo,95 = И- Однако не следует этот вывод считать достоверным, так как
для принятия решения критерием Олмстеда-Тыоки рекомендуется использовать выбор-
выборки объема п > 50 -f- 100 в силу малой эффективности критерия. Здесь мы рассмотрели
пример только для демонстрации вычислительной техники критерия.
Теперь вычислим вероятность
9.213+9.21^168.21 + 208 =
216-221
Так как а = 0,9998 > 0,95, гипотеза корреляции принимается (комментарий см. выше).
5.2.2.1.5. Приближенный критерий Шахани
В совокупности значений пар (x-i^yi) выделим порядковые статистики
Я[о,Зп]>#[о,7п]>У[о,Зп]>2/[о,7п]? т-е- значения хну, которые в упорядоченных по
возрастанию рядах Х{ и yi занимают места с номерами [0,Зп] и [0,7п].
Далее обозначим количество наблюдений, попавших в угол, для которого
Xi < Ж[о,зп]> У > 2/[о,7п]> ч^рез а\] количество наблюдений, попавших в угол х^ > Ж[о,7п]?
У > 2/[о,7п]> через п2] количество наблюдений, попавших в угол х^ > Ж[0,7гф У% < У[о,3п]?
через аз; количество наблюдений в угле Xi < Х[0^п^ yi < У[о,зп] через а±. Статистика
критерия равна q = \а\ + аз — «2 — сц|. Критическое значение g-статистики равно
4
> г/i+a, где w7 — 7-квантиль стандартного нормального распределен
U=i J 2
ПИЯ.
При q > qa корреляция между исследуемыми величинами признается значимой.
Эффективность критерия по сравнению с классическим коэффициентом корреля-
корреляции ^0,67 [121].
Задача 332. Проверить гипотезу корреляции для данных задачи 328 критерием
Шахани.
Имеем Ж[о,зп] — ж[о,з-28] = %9 = 19 ([а]—ближайшее большее целое к а). Далее
X[oj.n] = ^20 = 40; У[0,з-п] = Уэ = 21; г/[0,7п] = 2/20 = 48.
Имеем в угле Xi < 19, у% > 48: ai = 5; в угле х% > 40, у% > 48: аг = 0; в угле Xi > 40,
2/г < 21: аз = 4; в угле ж^ < 19, г/« < 21: а± = 1 точку. Тогда
q = |5 + 4 - 0 - 1| = 8; до,95 = \/Ъ + 4 + 0 + lixo,975 = 3,16 • 1,96 = 6,2.
Так как q = 8 > go,95 :=: 6,2 корреляция признается значимой.
5.2.2.1.6. Сериальный критерий Шведа-Эйзенхарта
Совокупность п пар (xi,yi) разбивается на две равные совокупности, отвечаю™
щие условиям yi > у и yi < у (у — медиана ряда г/^, при п нечетном значение yi = у
исключается). Затем наблюдения ранжируются по возрастающим значениям Х{.
622
Методы исследования связей между случайными величинами
[Гл. 5
Для последовательных пар значений (xi,yi) с yi > у будем применять символ а, для
последовательных пар (жг?2/«) ct/i < у — символ Ь. В результате получим последова™
тельность элементов вида а, 6, 6, а, а, а, 6, .... Последовательность элементов одного
вида, ограниченная с двух сторон элементами другого вида (замыкающие интервал
последовательности одного вида ограничены с одной стороны последовательностям
ми другого вида), называется серией. Количество т серий является статистикой
рассматриваемого критерия [121].
Корреляция признается значимой, если т ^ та (критические значения та
приведены в табл. 224).
Таблица 224
Критические значения пга критерия Шведа^Эйзенхарта
(а — доверительная вероятность) [121]
п
8^9
10-=- 11
12-=-13
14-=-15
16-=-17
18-=-19
а
0,95
2
3
3
4
5
6
0,99
2
2
3
4
4
п
20^21
22^23
24^25
26^27
28^29
30^31
а
0,95
6
7
8
9
10
11
0,99
5
6
7
7
8
9
п
32^33
34^35
36^37
38^39
40^41
а
0,95
11
12
13
14
15
0,99
10
10
11
12
13
При четных п > 40 можно использовать приближения
п + 1 _Л / -1 Г^+ 1
,99 —
где [z] —ближайшее меньшее целое к z.
Задача 333. Проверить гипотезу корреляции для данных задачи 328 критерием
Шведа-Эйзенхарта.
В нашем случае у = 37. Будем обозначать пары (ж^, t/i), в которых yi ~> у = 37, симво-
символом а, а пары, в которых г/^ < у = 37, символом 6. Располагая пары в порядке увеличения
значений ж^,получаем последовательность
ааааа, 66, а, 6, а, 6, ааааааа, ЬЬЬЬЬЬЬЬЬ.
Видим, что в полученной последовательности содержится т = 8 серий D серии
элементов а и 4 серии элементов Ь). Из табл. 224 для п = 28 и а = 0,95 находим
mo5g5 = 10. Так как т = 8 < mo,95 = 10, корреляция признается значимой. Приближение
9Q _|_ 1 1
0,82 • ^28 — 1 = 10 дает такой же результат.
5.2.2.1.7. Критерий автокорреляции Кенуя
Критерий позволяет установить наличие корреляции в ряду пар значений (ж^, г/^),
расположенных по возрастанию одной из величин (например, х). Под автокорреля™
цией понимается наличие зависимости значений переменной величины от порядко-
порядкового номера ее расположения в ряду данных. Проверке такой зависимости и служит
критерий Кенуя.
Критерий строится следующим образом. Все (п—1) пар значений располагаются
в порядке возрастания Xi от хш{п до жтах и разбиваются на две группы, с yi > у
и yi < у (у — медиана). Затем последовательно рассматриваем пары, для которых
справедливо
(xi,yi > y),(xi+uyi+i > у) или (xi,yi < y),{xi+uyi+1 < у).
5.2]
Корреляционный анализ
623
Другими словами, определяется количество последовательных пар точек, на™
ходящихся по какую-либо одну сторону от медианы. Количество таких пар N
является статистикой критерия. Если N > naj то корреляция признается значимой.
Критические значения па приведены в табл. 225.
Таблица 225
Критические значения Na критерия автокорреляции Кенуя
(а — доверительная вероятность) [121]
п
8-
10-
12-
14-
16-
18-
20-
22-
24-
26-
28-
30-
32-
34-
36-
38-
-9
- 11
-13
-15
-17
-19
-21
-23
-25
-27
-29
-31
-33
-35
-37
-39
а
0,95
6
7
9
10
11
12
14
15
16
17
18
19
21
22
23
24
0,99
—
8
10
11
12
14
15
16
17
19
20
21
22
24
25
26
п
40^41
42-
44-
46-
48-
50-
52-
54-
56-
58-
60-
62-
64-
66-
68-
70-
-43
-45
-47
-49
-51
-53
-55
-57
-59
-61
-63
-65
-67
-69
-71
а
0,95
25
26
27
29
30
31
32
33
34
35
36
37
39
40
41
42
0,99
27
28
30
31
32
33
34
35
37
38
39
40
41
42
44
45
п
72-73
74-
76-
78-
80-
82-
84-
86-
88-
90-
92-
94-
96-
98-
100-
-75
-77
-79
-81
-83
-85
-87
-89
-91
-93
-95
-97
-99
- 101
а
0,95
43
44
45
46
47
48
49
51
52
53
54
55
56
57
58
0,99
46
47
48
49
50
51
53
54
55
56
57
58
59
60
62
Задача 334. Проверить наличие автокорреляции для данных задачи 328 критерием
Кенуя.
Для у = 37 и упорядоченной последовательности х\ ^ Х2 ^ ...
вательность пар точек, находящихся по одну сторону от медианы:
хп имеем последо-
последоA,51),
B,48),
E,51),
(8,49),
A3,33),
Всего таких пар
Так как N =
B,48);
E,51);
(8,49);
A0,50);
A7,14);
точек N
20 > По g
B6,41),
B6,53),
C0,58),
C1,43),
C3,43),
= 20. В
B6,53);
C0,58);
C1,43);
C3,43);
C3,51);
табл. 225
C3,51),
C6,30),
D0,19)
D1,32)
D2,11)
для п = 28
C5,47);
D0,19);
D1,32);
D2,11);
D4,31);
находив
D4,31),
D5,1),
D6,21),
D7,21),
D8,19),
I По,95 =
is = 18, корреляция признается значимой.
D5,1);
D6,21);
D7,21);
D8,19);
E2,16).
18.
5.2.2.1.8. Критерий Блума-Кифера-Розенблатта
Статистика критерия, предложенного Блумом, Кифером и Розенблаттом [570],
строится следующим образом. Имеется совокупность точек (ж^, t/i), i = 1, ..., п. Че~
рез точку с координатами (а^, у{) проводятся прямые, параллельные осям координат
(ж, 2/), и подсчитывается количество точек mi (г), находящихся в первом квадранте
(для которого Xj > Xi и i/j > |/i), rri2(i)—находящихся во втором квадранте (для
которого Xj < Х{ и yj > г/^), тз(ъ)—в третьем квадранте (для которого Xj < Х{
и Уз ^ Vi)i rm4(i) —в четвертом квадранте (для которого Xj > Xi и yj < yi).
Статистикой критерия является величина
~1
- m2(i)m3(i)}
г=1
624
Методы исследования связей между случайными величинами
[Гл. 5
Критические значения В (а) при п
В@,95) = 0,0584; В @,99) = 0,868. При В
с вероятностью а.
> ос (п > 30) равны: 5@,90) = 0,0469;
В (а) корреляция признается значимой
Задача 335. Для совокупности п = 10 пар величин
(xi,yi): A,12), B,17), D,8), A2,14), G,1), B,4), A,13), A3,6), D,1), A0,9)
установить наличие корреляции критерием Блума-Кифера-Розенблатта при довери-
доверительной вероятности а = 0,95.
Для пар (жг,г/г) имеем следующие значения mi (г), 777,2B), 7тгз(*) и 7714B):
г
1
2
3
4
5
1
2
4
12
7
12
17
8
14
1
mi (г)
0
0
3
1
6
7712 (г)
2
0
3
0
3
газ (г)
0
2
0
8
0
т4(г)
6
6
2
1
0
г
6
7
8
9
10
Xi
2
1
13
4
10
Уъ
4
13
6
1
9
mi (г)
2
0
6
4
3
7712 (г)
4
2
0
3
1
газ (г)
0
0
3
0
4
т±(ъ)
2
6
0
0
1
Статистика критерия равна
= КГ3 • [@ . 6 - 2 • ОJ + @ • 6 - 0 • 2J + ... + C • 1 - 1 • 4J] = 0,054.
Так как В = 0,054 < 5@,95) = 0,0584, с вероятностью а = 0,95 гипотеза о наличии
корреляции между х и у отклоняется.
5.2.2.2. Ранговая корреляция
Понимая под рангом выборочного значения случайной величины его номер
в упорядоченной по возрастанию выборке, можно рассматривать для оценки силы
связи случайных величин не их численные значения, а соответствующие им ранги.
Подробно методы ранговой корреляции изложены в работе Кендалла [422].
5.2.2.2.1. Коэффициент ранговой корреляции т Кендалла
Предположим, имеется выборка пар случайных величин (ж, у) объема в, кото-
которым соответствуют последовательности рангов R (для ряда х^) и R* (для ряда yj).
Расположим ряд значений Xi в порядке возрастания величины: х\ ^ х^ ^ •. • ^ хп.
Тогда последовательность рангов R будет представлять собой последовательность
натуральных чисел 1,2, ..., п. Значения г/, соответствующие значениям ж, образуют
в этом случае некоторую последовательность рангов R*.
Рассмотрим несколько способов оценки корреляции величин х и у, предложен™
ных Кендаллом [422]. Назовем пару рангов R* и it!* (j < v) инверсией, если в после™
довательности рангов R* наблюдаем R* > iZ* (j = 1, ..., п — 1). Обозначим через Q
число таких пар. Тогда коэффициент корреляции, предложенный Кендаллом [422],
равен
п(п — 1)
Второй способ вычисления т заключается в следующем. В последовательности
рангов R* подсчитываем количество членов, расположенных справа от R* = 1. За-
Затем вычеркиваем R* = 1 и подсчитываем число членов последовательности, распо-
расположенных справа от R* = 2, и т. д. Обозначим сумму чисел, полученных с помощью
5.2] Корреляционный анализ 625
указанной процедуры, через К. Тогда т вычисляется по формуле
1
п(п — 1)
Иногда используются эквивалентные формы записи т:
2S где S = K-Q = 2K-^^^ =
1 - п(п-1У
Коэффициент т принимает значения от — 1 до +1. Равенство т = 1 указывает
на строгую линейную корреляцию. При п ^ 10 распределения т, S и К удовлетво™
рительно аппроксимируются нормальным распределением с параметрами, соответ-
соответственно:
п(п- 1)Bп + 5)ш
М(г) = 0; Р(т)=Г: ¦ 7/; M(S) = 0; DE) =
18
Следовательно, при п ^ 10 наличие корреляции признается значимым с досто-
достоверностью а, если выполняется любое из следующих неравенств:
Яа = г/а
«J;
где ia7 — 7-квантиль стандартного нормального распределения.
Если среди значений х и у есть совпадающие значения (т. е. Xi = ж^ при i ф v или
г/j = у^, при j ф z/), то им приписываются средние ранги (например, если значения 3
и 4-го членов ранжированной выборки совпадают, то им приписывается одинаковый
средний ранг C + 4) : 2 = 3,5). Если наблюдается q связей в ряду х и / связей
в ряду у, то оценка т корректируется следующим образом:
S
1 q I f
где Т = - ]Г ti (U - I); U = -J2ui (ui ~ 1) ; ** (^*) "~ Длина г-й связи в ряду х (у).
г=1 г=1
В случае выборок из нормального распределения коэффициент т может быть
использован для быстрой оценки обычного коэффициента корреляции г по формуле
. Т7Г
Г = Sin .
Задача 336. Имеется последовательность пар (xi, уi):
хц 2 4 7 1 5 9 11 12 17 8
у»: 6 3 5 7 1 2 4 14 18 21.
Используя коэффициент корреляции Кендалла, установить наличие корреляционной
зависимости между х и у с достоверностью а = 0,95.
"Упорядочим ряд значений х% по возрастанию:
хц 1 2 4 5 7 8 9 11 12 17
2/j-: 7 6 3 1 5 21 2 4 14 18.
626 Методы исследования связей между случайными величинами [Гл. 5
Заменяя значения Xi и yj их рангами, получаем последовательность рангов:
Rii 1 2 3 4 5 6 7 8 9 10
Д-: 7 6 3 1 5 10 2 4 8 9.
Далее находим для Ri = 7 число инверсий (когда Ri > R^,, и > 1) равно 6, для
R* = 6 —> 5, для Дз = 3 —» 2, для Д| = 1 —>> 0, для Д| = 5 —» 2, для Rq = 10 —» 4, для
Д? = 2 ->> 0, для Rt = 4 -^ 0, для Дд = 8 -^ 0.
Таким образом, общее число инверсий равно B = 6 + 5 + 2 + 2 + 4 = 19.
4 • 19
Следовательно, т = 1 = 0,155.
' 10-9
Теперь рассмотрим второй способ оценки т. Для первоначальной последовательности
рангов
Rji 7, 6, 3, 1, 5, 10, 2, 4, 8, 9
определяем количество членов, находящихся справа от R% = 1— получаем 6 членов.
Теперь вычеркиваем RX = 1 и получаем ряд
Щ\ 7, 6, 3, 5, 10, 2, 4, 8, 9.
Справа от Rq = 2 находятся 3 члена. Вычеркиваем Rq = 2 и получаем ряд
Rji 7, 6, 3, 5, 10, 4, 8, 9,
в котором справа от R? = 3 находятся 5 членов. Далее, действуя по аналогии, находим
— в ряду R*
— в ряду R*
— в ряду R*
— в ряду R*
— в ряду R*
— в ряду R*
7, 6, 5, 10, 4, 8, 9 справа от R§ = 4 находятся 2 члена;
7, 6, 5, 10, 8, 9 справа от R% = 5 находятся 3 члена;
7, 6, 10, 8, 9 справа от i?J = 6 находятся 3 члена;
7, 10, 8, 9 справа от RI = 7 находятся 3 члена;
10, 8, 9 справа от i?2 = 8 находится 1 член;
10, 9 справа от R% = 9 находятся 0 членов.
Окончательно имеем Ж = 6 + 3 + 5 + 2 + 3 + 3 + 3 + 1 + 0 = 26.
4 • 26
Коэффициент г равен т = 1 = 0,155, что и следовало ожидать.
Далее S = J^Q = 26~19 = 7ht= —2'S . = ^-^ = 0,155.
п • (п — 1) 10-9
Для нормальной аппроксимации находим
= 2- Bп + 5) = ^^ = = n-(n-l)-Bn + 5) = 10-9-25 =
v 7 9п ¦ (п - 1) 9 ¦ 10 • 9 v ; 18 18
= n-(n-l)-Bn + 5) = 10-9-25 = = п ¦ (п - 1) = 10J =
v у 72 72 ' l ; 4 4 '
Далее для гго,95 :=: 1,645 имеем
ГО595 = 1,645 • ^/0,0617 = 0,409; 50,95 = 1,645 • VnE = 18,39;
Жо,95 = 22,5 + 1,645 • д/31,25 = 31,69.
Так как г = 0,155 < го,95 = 0,409; S = 7 < So,95 = 18,39; К = 26 < Ж0,95 = 31,69, с веро-
вероятностью а = 0,95 можно утверждать об отсутствии корреляции между х и у. Оценка
обычного коэффициента корреляции равна
тг • т тг • 0,155
г = sin = sin = 0,241.
2 2 '
5.2.2.2.2. Коэффициент корреляции р Спирмена
Рассматриваем последовательность рангов Ri (величин х^ и R* (величин yj).
Необходимости упорядочивать какую-либо совокупность рядов Х{ и yj нет. Находим
разность рангов di = Ri — Kj, соответствующую паре (жг>2/г)« Коэффициент корре-
5.2] Корреляционный анализ 627
ляции Спирмена определяется формулой [422] р = 1 ^™ .
п(п — 1)
Его значения находятся в интервале от — 1 до +1 (р = О указывает на отсутствие
корреляции).
При п ^ 10 распределение р удовлетворительно описывается нормальным рас-
распределением с параметрами М(р) = 0 и D(p) = -.
Иногда в качестве статистики для проверки значимости р используется сумма
квадратов отклонений рангов
г=1 г=1
При п ^ 10 ее распределение также аппроксимируется нормальным распределе-
распределением с параметрами
DE) = ^
Корреляция признается значимой при \р\ > ра или S > Sai где ра и ?а—кри-
?а—критические значения, равные при п ^ 10
гзт' -« 6
Более точная аппроксимация критических точек р предложена Иманом и Коно-
вером [571]. В соответствии с их аппроксимацией используется статистика
'га-2
. v •- - ¦ л/ 2 1 критические значения которой равны J (а) = —г/а
2 \ V !-Р / 2
+ т^а (^ — 2), где г^а — «^квантиль стандартного нормального распределения; ta —
а-квантиль распределения Стьюдента с / = п — 2 степенями свободы. Если
/1 + оД
J ^ J —-— или J < —J
то гипотеза о наличии корреляции принимается с вероятностью а.
Для выборки из нормальных распределений может быть получена оценка для
обычного коэффициента корреляции г = 2 sin —p.
В заключение приведем ряд полезных соотношений, связывающих между собой
значения коэффициента корреляции тир: неравенство Дэниелса [422]
или при в^оо: — 1 ^ Зт — 2р ^ 1;
неравенства Дарбина^Стюарта
1 1 3 1
при т < 0: -т2 + г - - ^ р ^ -г + -.
628 Методы исследования связей между случайными величинами [Гл. 5
Из приведенных соотношений следует, что хотя коэффициенты гири связаны
между собой, но эта связь не столь элементарна. На практике чаще всего, если
значения обоих коэффициентов не слишком близки к единице, то р « 1,5т.
У читателя может возникнуть вопрос: стоит ли пользоваться коэффициентом г,
если вычисление коэффициента р значительно проще? Почему же тогда коэффици-
коэффициент т применяется на практике чаще? Это связано с тем, что если необходимо учесть
вновь поступившие значения случайных величин, то р в отличие от т приходится
рассчитывать заново по всем выборочным значениям.
Задача 337. Используя данные задачи 336, проверить наличие корреляции с помощью
коэффициента р Спирмена при доверительной вероятности а = 0,95.
Имеем последовательность рангов для х% и г/$:
Rii 2, 3, 5, 1, 4, 7, 8, 9, 10, 6;
Щ: 6, 3, 5, 7, 2, 2, 4, 8, 9, 10.
Вычисляем
J2 (Ri - Ri*J = B - бJ + C - ЗJ + ... + F - 10J = 120; р = 1 ¦ = 0,273.
При а = 0,95 имеем щ+а = ги+0,95 = г^о,975 = 1,96 и
2 2
1,96 „ 10-99 1,645 • 10 ¦ 11 • V9
ро,95 = -Lr= 0,653; So;95 = —— + = 255,47.
Л/9 Ь о
Так как р = 0,273 < ро,95 = 0,653 ш S = 120 < So,95 = 255,47, корреляция незначима. Рас-
Рассмотрим теперь аппроксимацию Имана—Коновера. Находим
=0,811.
2 V V 1-pV 2
При г^о,975 :=: 1,96 и to,975(8) = 2,306 имеем
j (l±EL j = J @,975) = — + ^55 = 2ДЗЗ.
Так как J = 0,811 < J@,975) = 2,133, гипотеза корреляции отклоняется.
Оценка обыкновенного коэффициента корреляции равна
г-= 2. sin"'0'273 =0,285.
6
Легко убедиться теперь, что неравенства Дэниелса и Дарбина—Стюарта выполняются:
3-(п + 2) 2-(п + 1) 3-12-0,155 2-11-0,273
-1 ^ —V ; • т v J • р <J 1; -1 ^ ! ! = ^0,0532 ^ 1;
п-2 w-2r' 8 8
р ^ 1 1^Т • [(п - 1)A - г) + 4] ; 0,273 ^ 1 - Х ~ °ДБ5 • [9 • A - 0,155) + 4] = 0,554;
Зп • т — (п — 2) 3 • 10 • 0,155 — 8
р ^ -^—г-^; 0,273 ^ ¦ = -0,152.
^ 2 • (п + 1) 2-11 '
5.2.2.2.3. Критерий Гёфдинга
Критерий Гёфдинга является ранговым аналогом критерия Блума^Кифера™
Розенблатта (см. раздел 5.2.2.1.8). Статистика критерия строится следующим об-
образом [572]: значения Х{ и у^ предварительно ранжируются, а затем заменяются их
рангами Щ и Щ соответственно.
5.2]
Корреляционный анализ
629
Обозначим через Ci число пар из выборок (xv,yv)i для которых одновременно
xv < Xi и yv < уг:
п I 1, при а < Ь;
Ct = J2 ^(ж^' х^) Ч> {VvtVi) ? г = 1, ..., п, где ср (а, Ь) = I 1/2, при а = Ь;
VjJ^i ^0, при а < Ь.
Положим
Q =
i - 2
* - 1) (R* - 2);
г=1
- 2) (Д* - 2);
г=1
г=1
- 2 (гг - 2) К + (уг - 2) (п - 8) Я
~ п (п - 1) (п - 2) (п - 3) (п - 4)
Гипотеза корреляции принимается, если ?) ^ Da, где Da—критическое значе™
ние, приведенное в табл. 226.
Таблица 226
Критические значения Da критерия независимости
Гёфдинга (а — доверительная вероятность) [18]
0
0
0
а
,90
,95
,99
5
0,03330
6
0,01660
0,03330
0
0
0
п
7
,00635
,00992
,01900
8
0,00476
0,00773
0,01488
0
0
0
9
,00403
,00635
,01217
При п —>• оо может быть использовано предельное распределение для критерия
Блума-Кифера-Розенблатта В, исходя из того, что случайная величина D + ^—
имеет такое же распределение, как и В.
Корреляция признается значимой:
— с вероятностью а = 0,90, если D > 0,0469 -\ ;
— с вероятностью а = 0,95, если D > 0,0584 -\ ;
Збп
— с вероятностью а = 0,99, если D > 0,0868 -\ .
Збп
Задача 338. Для выборочных пар данных
(xi,yt): G,3), G,2), (8,3), (9,4), A0,5), A1,6)
установить наличие корреляции критерием Гёфдинга при доверительной вероятности
а = 0,95.
Находим
d =
C2 =
<p(x5, Xl) • <p(y5,yi)
,x2) • ^B/1,2/2) + (p(x
(x5, x2) • ^B/5,2/2)
- <p(ye,yi) =
+0+0
) • ^ B/4,2/2)
630 Методы исследования связей между случайными величинами [Гл. 5
С3 = (р(х!,х3) • ^р (у 1, Уз) + ^(Ж2,ж3) • у? B/2,2/з) + (р(х4,х3) • <р B/4,2/3) +
+ с^(ж5, ж3) • <р(у5,Уз) + ^(^6, ж3) • <р(уб,Уз) = 1-- + Ы + 0-0 + 0-0 + 0-0 = 1,5.
Вычисляя дальше по аналогии, получаем С4 = 3, С б = 4, Се = 5.
Теперь ранжируем ряд х%:
хц 7 7 8 9 10 11
Ri-. 1,5 1,5 3 4 5 6
и ряд уi:
уц 3 2 3 4 5 6
Д*: 2,5 1 2,5 4 5 6.
(одинаковым значениям присвоены средние ранги).
Далее находим
Q = JZ (Ri ~ 1) • № " 2) • (Щ - 1) • (Я? - 2) =
г=1
= A,5 - 1) • A,5 - 1) • B,5 - 1) • B,5 - 2) + ... + F - 1) • F - 2) • F - 1) • F - 2) = 581,3125;
е
К = J2Ci'(Ri~2)- (Ri ~ 2) = ° • i1^ ~ 2) • B?5 - 2) + • • • + 5 * F - 2) • F - 2) = 128,75;
г=1
6
Я = J^ Сг • (с» - 1) = 0 • (-1) + 0 • (-1) + 1,5 • 0,5 + 3 • 2 + 4 • 3 + 5 • 4 = 38,75;
D = 581,3125-2-4-128,25 + 4-3-38,75 =
6-5-4-3-2 '
Из табл. 226 для п = биа = 0,95 находим Do,95 = 0,0166.
Так как D = 0,0282 > Do,95 = 0,0166, корреляция между жиг/ должна быть признана
значимой.
5.2.2.2.4. Критерий Ширахатэ
Критерий Ширахатэ [573] является аналогом критерия Спирмена (см. раз-
раздел 5.2.2.2.2), асимптотически ему эквивалентен, но обладает большей эффектив-
эффективностью для малых выборок.
Определим ранги случайных величин (а^, г/^), г = 1, ..., в, следующим образом:
п п
R{ = J2 {u(%i - Xj) + u(xi - yj)}; Rn+i = ]Г {и(у{ - x3) + u(y{ -
3=1 j=i
1 при x ^ 0,
где u(a) = <
[0 при x < 0.
Если случайные величины Х{ и у± коррелируют, то будут коррелировать и ранги
Ri и Rn+i.
Статистикой критерия Ширахатэ является сумма
г=1
Если бы мы определили ранги обычным способом:
п п
Ri = J2 U (Xi ~ Хз) И Кг+г = ^2и(У^^ Уз) '
J=l J=l
n
то сумма S* = ^2 ЩЩь+i являлась бы статистикой Спирмена, уже рассмотренной
г=1
ранее в разделе 5.2.2.2.2.
5.2]
Корреляционный анализ
631
Статистики S и S* асимптотически эквивалентны, но если значения статиста-
ки S* находятся в интервале
n(n+l)(n + 2) * n(n+l)Bn+l)
6 ^ ^ 6 '
то статистка S ограничена интервалом
то размах статиста-
Таким образом, если размах статистки 5* равен
-1)
ки S есть
2п(п2 -
6
-, т.е. больше в 4 раза. Следовательно, S-критерий может дать
больше информации, чем критерий, основанный на статистике S*.
При Si(a) < S < 5*2(«) корреляция признается незначимой (критические значе-
значения Si (а) и 5г (а) приведены в табл. 227).
Таблица 227
Критические значения Sa критерия Ширахатэ [573]
п
4
5
6
7
8
9
Доверительная вероятность а
0,90
Si
62
116
199
313
467
664
s2
96
175
195
456
666
932
0,95
Si
61
114
194
302
450
642
s2
97
181
302
468
683
955
n
10
12
14
16
18
20
Доверительная вероятность а
0,90
Si
911
1575
2506
3748
5349
7353
s2
1259
2125
3314
4877
6863
9311
0,95
Si
881
1528
2436
3649
5214
7177
s2
1289
2173
3386
4977
6999
9501
Задача 339. Используя данные и условия задачи 336, проверить наличие корреляции
с помощью критерия Ширахатэ.
Имеем данные (xi,yi)\
хц 1 2 4 5 7 8 9 11 12 17;
Уг\ 7 6 3 1 5 21 2 4 14 18.
Для г = 1 находим
Ri = Yl in ' (Xl ~ хз) +п
= п • (xi - xi) + п - (xi -yi)+n- (xi - x2)
+ n • (xi - 1/2) + n - (xi -хз)+п- (xi - 2/3) + гг • (xi - x4) + n • (xi - г/4) + • • •
... + n • (xi — Ж1О + n • (a?i — 2/i0)) =
= 1 + 0 + 0 + 0 + 0 + 0 + 0 + 1 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 + 0 = 2.
Далее находим:
R2 =4; Я3 = 7; Д4 = 9; R5 = 12; Д6 = 13; R7 = 14; R8 = 15; Д9 = 16; Rm = 18;
10
#10+1 = #11 + ]P [n - (t/i - ж^) + n • B/1 - 2/j)] =
i=i
= 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 1 + 0 + 1 + 0 + 0 + 0 + 0 = 12;
Д12 = 10; Д13 = 5; Д14 = 2; Д5 = 9; ,Ri6 = 20; R17 = 4; i?i8 = 7;
Д19 = 17; R20 = 19.
632 Методы исследования связей между случайными величинами [Гл. 5
В результате получаем ряды:
Rii 2 4 7 9 12 13 14 15 16 18;
Rn+i: 12 10 5 2 9 20 4 7 17 19.
Тогда
S = it Ri ' Ri+1 = 2 • 12 + 4 • 10 + 7 • 5+9-2+12-9+13-20+14-4+15-7+16-17+18-19 = 1260.
Из табл. 227 для п = 10 и а = 0,95 находим Si = 881 и S2 = 1289.
Так как Si = 881 < S = 1260 < Si = 1289, корреляция признается незначимой.
5.2.2.2.5. Критерий корреляции Фишера-Йэйтса
Определяется формулой [574]
где ап(г)—математическое ожидание г-й порядковой статистики в вв1борке объ-
объема п из стандартного нормального распределения.
Значения р* заключены между — 1 и +1. Наибольшей эффективностью приме-
применение р* обладает при исследовании зависимости между случайными величинами,
имеющими распределение, близкое к нормальному.
При п ^ 10 распределение статистики
стремится к нормальному со средним М(Я*) = 0 и дисперсией
Корреляция признается значимой с достоверностью а при
\S*\> S(a)Ul±sl^±=jra2n(i).
Здесь, как и ранее, Ri и R* обозначают ранги величин Xi и yi в упорядоченных
рядах х ж у соответственно.
Для нахождения величин ап(г) можно пользоваться либо специальными табли-
таблицами (например, [24] — с. 150), либо аппроксимацией
ап{г) « 4,91 •
Следует учитывать соотношение ап{г) = ап(п + 1 — г), что значительно снижает
необходимый объем вычислений.
5.2]
Корреляционный анализ
633
Задача 340. Используя данные задачи 336, проверить наличие корреляции с помощью
критерия Фишера-Йэйтса.
Для наших данных
Xii 1 2 4 5 7 8 9 11 12 17
уц 7 6 3 1 5 21 2 4 14 18
последовательность рангов будет иметь вид:
Rii 1 2 3 4 5 6 7 8 9 10
Д-: 7 6 3 1 5 10 2 4 8 9
Используя аппроксимацию
ою(г) =4,91
3
0,14
3
г — —
- 1-
вычисляем значения
LV10+4,
и aio(-R*). Результаты сводим в таблицу:
г
1
2
3
4
5
Яг
1
2
3
4
5
Щ
7
6
3
1
5
alo(Ri)
-1,547980
-0,998750
-0,653292
-0,373926
-0,122033
ою(Д?)
0,373926
0,122033
-0,653292
-1,547980
-0,122033
г
6
7
8
9
10
Яг
6
7
8
9
10
Щ
10
2
4
8
9
аю(Д»)
0,122033
0,373926
0,653292
0,998750
1,547980
1,547980
-0,998750
0,373926
0,653292
0,998750
Вычисляем
ю
S* = J2 aio(
= (-1,54798) • 0,373926 + ... + 1,54798 • 0,99875 = 2,44965;
a?o@ = 7,95049;
2 44965
= 0,308.
Для a = 0,95 имеем ио,975 = 1,96 и Я @,95) =
/п-1
= 5,194.
Так как S* = 2,44965 < 5@,95) = 5,194, корреляция признается незначимой.
5.2.2.2.6. Коэффициент корреляции Ван дер Вардена
У^ U r. U щ
Определяется формулой [365] р = %^ п —, где иа — a-квантиль стандарт-
Е2
U_i_
г=1 п + 1
ного нормального распределения. Коэффициент оптимален для оценки корреляции
нормально распределенных случайных величин.
п
При п ^ 10 распределение S = ^ и я^ и r* стремится к нормальному с пара-
метрами
г=1
МE)=0;
634
Методы исследования связей между случайными величинами
[Гл. 5
Отсюда: если \S\ > S(a) = ui
то с вероятностью а корреляция
признается значимой. Для поиска иа могут быть использованы таблицы, либо
аппроксимации (см. раздел 1.1.1), например,
Следует помнить, что иа = —и\-а.
Задача 341. Используя данные задачи 336, проверить наличие корреляции с помощью
критерия Ван дер Вардена.
Используя аппроксимацию и j = 4,91 •
n+l
-
0,14
0,14
, вычисля-
вычисляем значения
в таблицу:
^ (значения FU и В* используем из задачи 340). Результаты сводим
г
1
2
3
4
5
Яг
1
2
3
4
5
Щ
7
6
3
1
5
U Ri
11
-1,335080
^0,906470
-0,602509
^0,347309
^0,113674
ТГ
0,347309
0,113674
-0,602509
-1,335080
-0,113674
г
6
7
8
9
10
Кг
6
7
8
9
10
Щ
10
2
4
8
9
U Ri
11
0,113674
0,347309
0,602509
0,906470
1,335080
11
1,335080
-0,906470
-0,347309
0,602509
0,906470
Вычисляем
10
S = Y1 иЛ^ ' uRi± = (-1,33508) • 0,347309 + (-0,90647) • 0,113674 + ...
i=1 n + l n+l
... + 1,33508 • 0,90647 = 1,65687;
= 6,201377;
6,201373
= - = И0,875.6,201377 =
l ' ; 3
Так как S = 1,656 < Я @,95) = 4,051, гипотеза о наличии корреляции отклоняется
с вероятностью 0,95.
5.2.2.2.7. Коэффициент конкордации Кендалла-Бэбингтона Смита
До сих пор рассматривалась корреляция двух случайных величин. Часто воз-
возникает необходимость исследовать корреляцию нескольких последовательностей
значений случайных величин. Предположим, имеется к последовательностей рангов
с равным числом рангов п в каждой последовательности
R22 ...
Ri
Ri
R.
¦kn-
5.2]
Корреляционный анализ
635
В качестве меры связи к последовательностей Кендалл и Б. Смит [575] предло™
жили коэффициент конкордации (согласованности)
W =
12SW
к2 (п3 — п) '
где Sw = V < V
к(п-
)
Легко видеть, что Sw является суммой отклонений рангов от их среднего
значения. Значения W располагаются в интервале от 0 до 1.
Для п ^ 20 величины W и Sw распределены приблизительно нормально [25]
с параметрами
M(W) = p B(W) = 23(fc ~ ^ ;
В силу несимметричности распределение W при п ^ 20 лучше аппроксимирует™
ся бета-распределением [25].
Точные критические суммы Sw(^) приведены в табл. 228. Если Sw > *5V(a)? TO
наличие согласованности признается значимым с вероятностью а.
Таблица 228
Критические значения Sw(ol) для коэффициента конкордации W [422]
к
3
4
5
6
8
10
15
20
Доверительная вероятность а
= 0,95
п
3
48,1
60,0
89,8
119,7
4
49,5
62,6
75,7
101,7
127,8
192,9
258,0
5
64,4
88,4
112,3
136,1
183,7
231,2
349,8
468,5
6
103,9
143,3
182,4
281,4
299,0
376,7
570,5
764,4
7
157,3
217,0
276,2
335,2
453,1
571,0
864,9
1158,7
Доверительная вероятность а -
= 0,99
п
3
66,8
85,1
131,0
177,0
4
61,4
80,5
99,5
137,4
175,3
269,8
364,2
5
75,6
109,3
142,8
176,1
242,7
309,1
475,2
641,2
6
122,8
176,2
229,4
282,4
388,3
494,0
758,2
1022,2
7
185,6
265,0
343,8
422,6
579,9
737,0
1129,5
1521,9
При п > 10 -т- 15 и отсутствии корреляции величина к(п — 1)W распределена
приблизительно как %2 с / = п — 1 степенями свободы. Отсюда следует, что крити-
2
-V/
ческое значение равно Wa = т / а ^ .
к(п — 1)
Если W > Wai то с вероятностью а корреляция между изучаемыми последова™
тельностями признается значимой.
Если среди последовательностей рангов есть совпадения, то коэффициент кон™
кордации следует вычислять по формуле
W =
12SV
где
(t% — tj}, tj —количество совпавших рангов в j-й последовательности.
Совпавшим рангам, как и ранее, присваиваются средние ранги.
636
Методы исследования связей между случайными величинами
[Гл. 5
Задача 342. Предположим^ что имеются к = 4 последовательности числовых рядов,
объемом п = 10 каждая:
Щ-
z%\
h:
1
7
11
-1
3
8
12
0
7
6
7
1
9
1
6
12
12
4
5
4
14
2
4
5
18
7
3
7
19
0
1
3
21
3
0
2
26;
1;
-i;
-4.
Необходимо проверить согласованность рядов с помощью коэффициента конкордации
Кендалла-Б, Смита при доверительной вероятности а = 0,95.
Имеем совокупность рангов
и квадратов вида
2
fc- (ri-
(riij - 22
J=1
i
1
2
3
4
5
6
7
8
9
10
Rid
j
l
l
2
3
4
5
6
7
8
9
10
2
8,5
10
7
2,5
6
4
8,5
1
5
2,5
3
9
10
8
7
6
5
4
3
2
1
4
2
3
4
10
7
8
9
6
5
1
e
2,25
9
0
2,25
4
1
42,25
16
1
56,25
Далее
fe ¦ (n + 1)
= 134; W = 2 12'134 =0,101.
42 • A000 - 10)
Имея в виду, что Хо,9б(9) = 16,919 (см. табл. 55), получаем
Xo,95 _ 16,919
4-9
36
= 0,470.
Так как W = 0,101 < Wo,95 = 0,470, с вероятностью а = 0,95 можно признать согла-
согласованность рангов незначимой.
5.2.2.2.8. Коэффициент конкордации Шукени-Фроли
Для случая двух групп экспертов Шукени и Фроли [576] предложили аналог
коэффициента конкордации Кендалла—Б. Смита (см. раздел 5.2.2.2.7). Пусть две
группы экспертов численностями тип ставят перед собой задачу проранжиро™
вать к объектов. Обозначим через R^j (г = 1, ..., m; j = 1, ...,&) —ранги, предло™
женные т экспертами первой группы; через R*, A = 1, ..., щ j = 1, ... ^к) —ранги,
предложенные п экспертами второй группы (Rj =
Статистика Шукени—Фроли равна
и R* =
5.2]
Корреляционный анализ
637
Значение статистики L находится в интервале [455]
тпк (к + 1) (к + 2)
тпк (к + 1) Bк + 1)
6 "
Известно [455], что
тпк(к + 1)
M(L) =
Обобщенный коэффициент конкордации Шукени-Фроли определяется соотно™
L - M(L)
шением W =
Z,max-M(L)'
Если p^j—коэффициент корреляции Спирмена (см. раздел 5.2.2.2.2) для i-ro
1 п т
эксперта первой группы и j-ro эксперта второй группы, то [455] W = ]Р ]Р Pij.
j=li=l
Предельное распределение коэффициента Шукени^Фроли отлично от нормаль™
ного и неудобно для применения. Значение W вблизи +1 означает высокую степень
согласованности внутри обеих групп экспертов и между группами; вблизи — 1 —
высокую степень согласия внутри групп и сильное несогласие между группами;
вблизи 0 — либо несогласие внутри групп экспертов, либо согласие внутри групп
экспертов при несогласии между ними.
Задача 343. Две группы экспертов в количествах т = 6 и п = 8 провели ранжи-
ранжирование к = 5 объектов (результаты приведены в таблице). Необходимо проверить
согласованность мнений экспертов критерием Шукени-Фроли.
Номер
эксперта
Ранжировка объектов
Группа 1
1
2
3
4
5
6
Е
1
1
4
1
2
5
Ri = 14
3
2
3
2
1
4
R2 = 15
4
3
2
3
3
3
Rs = 18
2
4
1
4
4
2
#4 = 17
5
5
5
5
5
1
Rb = 26
Группа 2
1
2
3
4
5
6
7
8
Е
1
3
4
1
5
1
3
1
Rl = 19
2
2
5
2
4
2
2
5
Rl = 24
3
1
1
3
2
3
4
4
Rl =21
4
5
2
4
3
4
5
3
Rl =30
5
4
3
5
1
5
1
2
R% = 26
Вычисляем L=J2RJ- Щ = 14 • 19 + 15 • 24 + 18 • 21 + 17 • 30 + 26 • 26 = 2190.
Границы изменения L: = 1680 ^ L ^ 5040 = .
638 Методы исследования связей между случайными величинами [Гл. 5
Далее вычисляем
M(L)=6-845-62=2160;
W = 219°-216° =0,00729.
5040 - 2160
Так как W = 0,00729 ^ 0, согласованность внутри группы экспертов либо между
ними очень низка.
5.2.2.3. Точечно-бмсериальная корреляция
При проведении некоторых исследований часто сталкиваются с проблемой вы™
яснения взаимосвязи между характеристиками, одна из которых может бытв ран™
жирована, а вторая допускает только группировку в две группы по качественному
признаку (дихотомия).
Приведем известные результаты для оценки зависимости в такой ситуации.
Одной из таких оценок является коэффициент точечно-бисериальной корреляции
П = S
где 7ii, П2 — объемы двух групп; п = rii-\-П2', #1, х^— средние значения первой
характеристики в двух группах, образованных в соответствии со второй характе-
характеристикой;
= \2.
г=1 г=1
Значимость корреляции определяется так же, как и для обычного коэффициента
корреляции (см. раздел 5.2.1.1). Если \г$\ > га, то корреляция признается значимой.
Рассмотрим теперь аналогичную задачу для ранговой корреляции, примени™
тельно к коэффициенту ранговой корреляции т Кендалла (см. раздел 5.2.2.2.1).
Напомним, что в случае отсутствия дихотомии
- 2S
п(п — 1) *
Предположим, что дихотомия реализуется в разделении данных по двум при™
знакам в группы объемов п\ и п^ (п\ + П2 = п).
В этом случае коэффициент точечно™бисериальной корреляции Кендалла равен
1
= S I j
1
Проверка значимости т$ проводится аналогично проверке значимости т (см. раз™
дел 5.2.2.2.1).
Задача 344. В нашем распоряжении имеются следующие данные (xi — количествен-
количественный признак^ у —качественный признак^ обозначаемый символом + или —):
хг: 1 2 3 4 5 6 7 8 9 10;
1/:+ + --- + - + --.
Необходимо оценить наличие зависимости между х и у при достоверности а = 0,95.
Используем коэффициент точечно-бисериальной корреляции т§. Имеем гц = 4, п2 = 6
(п\ + П2 = п = 10). Находим далее
1 + 2 + 6 + 8 _ 3 + 4 + 5 + 7 + 9 + 10
Ж1 = = 4,25: Х2 = = 6,33:
4 6
1 4 -.6
Sl = -^2(xi~ ^iJ = Ю?916; Si = - J2 (ж* - ж2J = 9,085; S = 3,014;
3 il 5 il
5.2] Корреляционный анализ 639
3,014
Для а = 0,95 и п = 10 из табл. 217 имеем го,эб = 0,632.
Так как \г$\ = 0,322 < 7*0,95 = 0,632, корреляция признается незначимой.
Теперь вычислим точечнобисериальный коэффициент корреляции Кендалла (см.
раздел 5.2.2.2.1). Имеем последовательность рангов
Rji 1 2 3 4 5 6 7 8 9 10
Rji 2,5 2,5 7,5 7,5 7,5 2,5 7,5 2,5 7,5 7,5
Поясним подсчет рангов Щ. Имеем последовательность членов
что эквивалентно наличию п\ = 4 и П2 = 6 равных элементов, которым приписываем
равные средние ранги. Элементы +, имеющие (условно) номера 1, 2, 3 и 4, получают
1+2+3+4 о^
равный средний ранг = 2,5. Аналогично и элементы — получают равные
5 + 6 + 7 + 8 + 9 + 10 „ к ^ ~
ранги = 7,5. Теперь подсчитаем сумму Q по алгоритму, изложенному
6
в разделе 5.2.2.2.1 (т. е. число инверсий, когда R* < Rt): Q = 6 + 6 + 3 + 2 = 17.
Далее вычисляем
п • (п - 1) 10-9 11
о = J4 = J4 = 11: тл = —, = и.ооо:
I- • 10-9- A0-9-4-3-6-5)
го,95 = ЗД,95 • ХР^Ц = 1,645 • J2-^ = 0,409.
V 9п • (те — 1) V 90 • 9
Так как т$ = 0,335 < 7о,95 = 0,409, точечно-бисериальная корреляция незначима.
5.2.2.4. Статистическая оценка свмзи между качественными признаками
(таблицы сопряженности признаков)
Предположим, что наблюдаемая случайная величина может изменяться в зави™
симости от некоторых признаков — например, долговечность электронного прибора
может зависеть от технологии изготовления, применяемых материалов. По резуль-
результатам наблюдений над случайной величиной, классифицированным по наличию или
отсутствию исследуемых признаков, необходимо ответить на вопрос, существует ли
взаимосвязь между ними, иными словами: связано ли обладание одним признаком
с обладанием другим признаком (в условиях приведенного примера — существует
ли связь между технологией изготовления и применяемыми материалами).
По существу, в данном случае мы имеем переход от точечно-бисериальной кор™
реляции к изучению зависимости между двумя (или несколькими) качественными
признаками.
Таблицы, в которых представлены значения исследуемой случайной величины,
классифицированные по качественным признакам, называются таблицами сопря-
сопряженности признаков.
5.2.2.4.1. Оценка связи признаков в таблицах сопряженности 2x2
Если исследуется взаимосвязь двух признаков А и Л, то таблица сопряженности
называется таблицей 2x2, или четырехклеточной таблицей и имеет вид
а Ь
с d
640
Методы исследования связей между случайными величинами
[Гл. 5
где а — число элементов выборки, обладающим признаками А и В одновременно;
Ь — число элементов выборки, обладающих признаком А, но не обладающих призна-
признаком В; с — число элементов выборки, обладающих признаком В, но не обладающих
признаком A; d — число элементов выборки, не обладающих ни одним из признаков
А и В.
5.2.2.4.1.1. Меры связи в таблицах сопряженности 2x2
Рассмотрим три известнвге меры связи, позволяющие грубо оценить ее наличие.
5.2.2.4.1.1.1. Коэффициент ассоциации [132]
Находится по формуле
_ _ ad — be
^ ~ ad + Ъс
Если признаки А ж В независимы, то Q = 0. В случае полной связи между
признаками Q = ±1. Дисперсия Q равна [132]
Сравнение Q с полученным значением дисперсии (с учетом масштаба
позволяет получить хотя бы первое приближение по оценке связи.
5.2.2.4.1.1.2. Коэффициент коллигации Юла [132]
Находится по формуле
К =
vad — vbc
с дисперсией
fad + vbc
Между Q ж К существует связь
v{k) = Ui-k>)(\ + 1-
Q =
2К
Задача 345. Предположим, что после перепроверки партии электронных ламп из
п = 110 шт., изготовленных по двум технологиям, получены результаты, приведенные
в таблице. Необходимо оценить связь качества ламп с технологией их изготовления
с помощью оценок, изложенных в разделе 5.2.2.4.1.1.
Технология
1
2
Итого
Число
дефектных ламп
95
70
165
Число годных
ламп
15
40
55
Всего ламп
110
110
220
В нашем случае имеем а = 95, b = 15, с = 70, d = 40.
Вычисляем коэффициент ассоциации
95 • 40 - 15 • 70
95 • 40 + 15 • 70
= 0,567;
5.2] Корреляционный анализ 641
Находим коэффициент коллигации Юла
Т>(К) = — . A - 0,3112) • [ — + — + — + — ) = 0,00675 (л/ЩК) = 0,082).
16 v y \95 15 70 40 x
Из анализа полученных оценок можно сделать оценочный вывод о том, что по
вероятности существует связь между технологией изготовления и качеством продукции,
так как коэффициенты Q = 0,567 и К = 0,311 достаточно велики по сравнению со своими
среднеквадратическими отклонениями (превышают их более, чем в три раза).
5.2.2.4.1.1.3. Коэффициент контингенции (сходства) [132]
Основан на формуле
ad — be
На практике для проверки гипотезы о существовании взаимосвязи между изу™
чаемыми признаками используется величина %2 = nF2, имеющая при отсутствии
связи распределение х2 с / = 1 степенью свободы.
С учетом поправки на непрерывность статистика критерия контингенции для
проверки связи признаков имеет вид
Х (а + Ъ) (а + с) (Ъ + d){c + dY
где п — общее число данных в таблице: n = a + 5 + c + d.
Если х2 > ХаA)? то с достоверностью а зависимость признаков А и В признает™
ся значимой. Приведем некоторые полезные значения: Хо 9о(-0 = 2,70; Xq 95A) = 3,85;
Х§,в9A) = 6,58.
Задача 346. Проверить значимость связи признаков в таблице сопряженности 2x2
в условиях задачи 344 коэффициентом контингенции при доверительной вероятности
а = 0,95.
Имеем V = 95 ' 4° " 15 ' 7° = 0,262.
л/ИО- 165-55110
^ 2 220-(95-40-15-70-НОJ
Далее при п = 220 имеем у = = 14,07.
М Р Л 100-165-55-110
Так как х2 = 14,07 > Хо 95 A) =:: 3,85, связь признаков в задаче должна быть признана
значимой.
5.2.2.4.1.1.4. Точный критерий Фишера
Критерий х^х = п^2 применим при п ^ 40 и а, Ь, с, d ^ 5. Если эти условия не
выполняются, то следует воспользоваться точным критерием Фишера, основанном
на статистике
Р =
(а + Ь + с + d)\ f-' {а + Ъ- i)\(a + с - i)\(a + d - i)\
Если р > 1 — а, то с достоверностью а связь признаков признается значимой.
21 А. И. Кобзарь
642
Методы исследования связей между случайными величинами
[Гл. 5
Задача 347. Имеется следующая таблица сопряженности признаков 2x2:
Е
Е
11 6
13 10
24 16
17
23
40
Необходимо при доверительной вероятности а = 0,95 оценить значимость связи при-
признаков в таблице точным критерием Фишера.
_
Вычисляем
A1 + 6)? A3 + 10)! A1 + 13)! F + 10)!
A1 + 6 + 13 + 10)!
f^Q i\ A1 + 6 - г)! A1 + 13 - г)! (И + 10- г)!
= 0,227.
Так как р = 0,227 > 1 — а = 1 — 0,95 = 0,05, связь признаков в таблице следует считать
значимой.
5.2.2.4.1.1.5. Быстрые критерии оценки свмзи в таблицах сопряженности 2x2
При a + 5 + c + d^ 25 и при условии а + Ъ = с + d или а + с = Ъ + d критерием
является величина , ч , ч
_ (а + d) - (b + с)
Va + 6 + с + d
Связь признаков в таблице с достоверностью а признается значимой при z > иа
(иа — «^квантиль стандартного нормального распределения).
При a + Ъ ^ 10 при условии a + 6 <С с + d или а + с <С Ь + d справедлив критерий
(а + с — Ь — а) (а + 6)
a+6+c+d
Если z > гла, то связь признаков признается значимой.
Задача 348. Для таблицы сопряженности
Е
Е
14 28
6 36
20 64
42
42
84
проверить гипотезу о согласованности признаков при доверительной вероятности
а = 0,95.
Имеем а = 14, Ь = 28, с = 6, d = 36. Так как a + 6 = 42 =
36)^B8
d, используем критерий
/84
= 1,745.
Так как z = 1,745 > ^0,95 = 1,645, связь признаков следует признать значимой. Сле-
Следует помнить, что всегда при z берется знак + (это не меняет результат).
Задача 349. Для таблицы сопряженности
15 4
85 77
100 81
19
162
181
проверить гипотезу о согласованности признаков при доверительной вероятности
а = 0,95.
5.2]
Корреляционный анализ
643
В нашем случае
=19<Cc + d = 162, поэтому используем критерий
85-77) ¦ A5 + 4)
= 1,97.
15-4-
15 + 4 + 85 + 77
Так как z = 1,97 > 110,95 = 1,645, связь признаков в таблице следует признать значи-
значимой.
5.2.2.4.1.1.6. Модифицированный критерий знаков Мак-Нимара
Предположим, что над одной и той же группой объектов производятся два экс-
эксперимента и необходимо установить — меняется ли распределение частот от одного
эксперимента к другому. В этом случае мы имеем также таблицу сопряженности
2x2, однако составляющие ее данные, вообще говоря, уже не будут независимыми.
Мак-Ыимар [577] предложил простой критерий проверки изменения соотноше-
соотношения частот в таблице при изменении условий опыта. Пусть мы имеем таблицу:
Опыт 1
+
Опыт 2
+
а
с
b
d
Из нее следует, что значения and соответствуют неизменным условиям опыта
(а — когда и опыт 1 и опыт 2 действуют на объект, d — когда ни один из опытов
не действует на объект). Значения Ъ и с соответствуют условиям, когда действует
только один из опытов. Если Ь « с, то, следовательно, опыты не оказывают влияния
на объект.
Для проверки равенства Ъ = с Мак™Нимар предложил критерий [577]
^/2 — — —, а при Ь + с < 30: х2 =
Ь + с+1' г ' А Ь + с+1 '
Если х2 > Ха (-'-)? РазниЦа меясду Ь и с признается значимой
распределения хи-квадрат с / = 1 степенью свободы).
A) — «-квантиль
Задача 350. Предположим, 30 пациентов начали применять два препарата. При
этом 8 пациентов признали сильным действие как первого, так и второго препаратов;
11 ^слабым действие обоих препаратов; 16 признали действие первого препарата силь-
сильным, а второго слабым] 5 пациентов — наоборот. Необходимо проверить критерием
Мак-Нимара при достоверности а = 0,95 гипотезу о различии в действии препарата.
Имеем таблицу:
Препарат 1
сильное
слабое
Препарат 2
сильное
(а) 8
(с) 5
слабое
1б(ь)
и (d)
Разница между препаратами проявляется в разнице частот (Ь) и (с), так как именно
они фиксируют впечатления пациентов, связанные с различием воздействия исследуе-
исследуемых препаратов. Имеем
2=
Х
(\Ь-С\-1
Ь+с+1
A6- 5^ IJ
16 + 5 + 1
= 4,54.
Так как Хо,9бA) — 3,84 (см. табл. 55), а %2 — 4,54 > Хо,95? то с вероятностью 0,95
следует признать значимой разницу в воздействии препаратов на различных пациентов.
21*
644
Методы исследования связей между случайными величинами
[Гл. 5
5.2.2.4.1.1.7. G-критерий Вулфа
Критерий Вулфа [578] используется вместо критерия х2 Для четыреклеточных
таблиц (см. раздел 5.2.2.4.1.1.3). Он позволяет уменьшить количество вычислений
и лучше обоснован теоретически, чем %2™критерий [9].
Критерий строится следующим образом. В таблице
а Ь
с d
сначала наименьшая из величин увеличивается на 1/2 (так называемая поправка
Йэйтса). Затем соответствующим образом меняются все остальные значения в та™
блице с тем, чтобы величины а + 6, c + d, а + си 5 + cf не менялись. Тогда таблица
принимает следующий вид (считаем, что d является минимальным значением):
Статистика критерия Вулфа равна
чьи
c-fWc-l
- (а + е) ln(a + с) - (Ы- d) 1п(Ь + d) + (а + Ь + с + d) In (а + Ь + с + d) >.
Если G >
), то связь признаков в таблице признается значимой.
Задача 351. Для данных задачи 345 проверить сопряженность признаков в таблице
критерием Вулфа при а = 0,95.
Имеем таблицу:
95^1/2 15 + 1/2
70 + 1/2 40 - 1/2
165
55
110
110
220
Вычисляем
G = 2 • {94,5 • In 94,5 + 15,5 • In 15,5 + 70 • In 70 + 39,5 • In 39,5-
- 110 • In 110 - 110 • In 110 - 165 • In 165 - 55 • In 55 + 220 • In 220 } = 14,337.
Из табл. 55 имеем Xo,9s(l) — 3,85. Так как G = 14,337 > Хо,9бA) = 3,85, следует при™
знать связь частот в таблице значимой.
5.2]
Корреляционный анализ
645
5.2.2.4.1.1.8. Критерий Ле Ром для сравнения двух таблиц сопряженности 2x2
Предположим, что мы имеем в своем распоряжении две таблицы данных 2x2:
a
Необходимо проверить гипотезу о том, что оое таолицы статистически не раз-
различимы и являются выборками из единой совокупности.
Ле Рой [579] предложил для проверки такой гипотезы критерий, основанный на
статистике
R = (аг
¦ а2 + Ь2 + С2 + d2) x
G-2 ~~Ь &2 ~~Ь С2 + 6^2
1
2
а2
а2
с2
+
ь\
- с2
k+d2
- 1
Гипотеза о статистической неразличимости таблиц отклоняется с достоверно™
стью а, если R > Х^(^)ч (Ха(^) — «-квантиль ^-распределения с / = 3 степенями
свободы). Для употребляемых значений а укажем
Хо,9оC) = 6,251; хо)95C) = 7,815; Хо,9вC) = 11,345.
Следует помнить, что ^-критерий применим, если все числа в таблицах превы-
превышают 3.
Задача 352. Проверить гипотезу о статистической неразличимости двух таблиц
сопряженности 2x2 критерием Ле Роя при доверительной вероятности а = 0,90:
Е
15 48
21 71
36 122
Е
63
95
158
Е
27 94
112 456
139 550
Е
121
568
689
Имеем oi = 15, Ьх = 48, а = 21, di = 74, а2 = 27, Ь2 = 94, с2 = 112, d2 = 456.
Вычисляем
R = A5 + 48 + 21 + 74 + 27 + 94 + 112 + 456) х
272
27 + 94 + 112 + 456 \15 +27 48 + 94 21 + 112 74 + 456/
1
1 - li =37,938.
J
15 + 48 + 21 + 74 \15 + 27 48 + 94 21 + 112 74 + 456 у
Так как R = 37,938 > Хо,эоC) = 6,251, следует признать, что таблицы статистически
различимы.
5.2.2.4.1.1.9. Выбор числа наблюдений для анализа
таблиц сопряженности 2x2
Сформулируем следующую задачу. Необходимо для заданных допустимых уров™
ней ошибок — первого рода а (вероятность отклонить верную гипотезу) и второго
646
Методы исследования связей между случайными величинами
[Гл. 5
рода /3 (вероятность принять неверную гипотезу) и заданных значениях р± = —
и р2 = -; при
¦ b = с + d = n определить необходимое число наблюдений — п, ко™
торое требуется провести, чтобы сравнить относительные частоты р\ и р2 между
собой.
Необходимое число наблюдений п рассчитывается по формуле [9] (берется бли™
жайшее целое число): п = ; ; ^ гДе К — коэффициент, приве™
(arcsin у/рг —- arcsin л/р^)
денный в табл. 229.
Таблица 229
Значения коэффициента К [9]
а
0,05
0,01
0,001
0,2
12885
16474
19172
ОД
17250
21369
24426
0,01
30161
35537
43945
Задача 353. Найти объем выборки, позволяющий сравнить относительные частоты
в таблице сопряженности признаков 2 х 2: р\ = 0,61 и р2 = 0,38 при уровнях ошибки
первого рода а = 0,05 и второго рода C = 0,1.
Из табл. 229 имеем К = 17250.
Тогда
= 1™ -2 = 97,55.
E1,3545 - 38,0567)^
Таким образом, необходимо иметь 98 наблюдений. Проверка разницы в таких табли-
таблицах обеспечивает мощность критерия %2, равную 1 — /3 = 0,90.
5.2.2.4.2. Оценка связи признаков в многоклеточных
таблицах сопряженности г X с
Если результаты наблюдений могут быть классифицированы по трем или более
качественным признакам, рассматриваются так называемые таблицы сопряженно-
сопряженности г х с [132]:
Е
П\\
П21
Пг1
П22
ПГ2
Не
П2с
пгс
Ъ
ii
П2
пг
п
Здесь riij—число результатов наблюдений из общего числа в, обладающих
признаками i и j одновременно. В качестве меры связи между признаками
г и с (либо между г и с градациями двух признаков А л В) использует™
/_^ /-^ —^ ~~ I' имеюЩая ПРИ независимости признаков
=ij=i J /
2
ся статистика X п
5.2]
Корреляционный анализ
647
Х2™распределение с / = (г —1)(с—1) степенями свободы. Следовательно, если
X2 > Ха[(г ~~ -0(с ~~ 1)L то с вероятностью а признается зависимость между изучае-
изучаемыми признаками. Однако статистика %2 неудобна при оценке связи признаков, так
как ее значения не нормированы и при п —> оо %2 —> оо (в отличие от рассмотренных
ранее коэффициентов корреляции, значения которых при любых п заключены меж™
ду — 1 и +1). Поэтому для оценки связей в таблицах г х с используются специальные
коэффициенты сопряженности, предложенные Пирсоном и Чупровым [132]. Пирсон
предложил коэффициент сопряженности в виде Кр =
. Значения Кр
зависят от числа изучаемых признаков, что не позволяет использовать его для
сравнения связей в таблицах с различными значениями г ж с. Этого недостатка
лишен коэффициент сопряженности Чупрова [132]
Коэффициент Кr становится равным ±1 в случае полной связи признаков только
при г = с. Так, как коэффициенты сопряженности выражаются через %2, то про-
проверка их значимости может быть осуществлена с помощью критических значений
X2 -распределения.
Если Кр > Кр(а) или К л > Кц{а), то связь признаков признается существен-
существенной.
Задача 354. Предположим, что в результате проверки партии электронных дамп
трех типов (по 100 шт. каждого типа), изготовленных на пяти заводах, получены
следующие количества годных ламп:
Тип
лампы
1
2
3
Е
Завод-изготовитель
1
70
80
30
180
2
60
90
40
190
3
20
100
30
150
4
40
90
20
150
5
30
70
50
150
Е
220
430
170
820
Необходимо проверить гипотезу о наличии связи между качеством ламп различного
типа и заводом-изготовителем при доверительной вероятности а = 0,95.
Имеем г = 3, с = 5, (г - 1) • (с - 1) = 8. Тогда
3 5 2
= 820-
¦ +
180 • 220 190 ¦ 220 150 • 220 150 • 170 150 • 170
.2 /о\ 1С КП7 TU-^ т,«т, ,w2 г л о Л Л \ -.,2
- 1 = 51,244.
Имеем из табл. 55: х§;95(8) = 15,507. Так как %2 = 51,244 > Хо,9б(8) = 15,507, гипотеза
о наличии связи между признаками подтверждается.
Вычислим теперь коэффициенты сопряженности:
51,244
820 + 51,244
= 0,242; KR =
51,244
820 -л/^
= 0,149.
648 Методы исследования связей между случайными величинами [Гл. 5
5.3. Регрессионный анализ
Рассмотренные ранее методы дисперсионного и корреляционного анализа позво-
ляют выявить наличие связи между случайными величинами и оценить силу этой
связи.
Следующей ступенью является выявление конкретного функционального вида
связи между случайными величинами.
При наличии корреляционной связи между х и у имеет место соотношение
F(y) = F(x, у), т. е. функция распределения случайной величины у зависит от зна™
чения случайной величины х. Любая функция распределения полностью определя™
ется своими параметрами. Изменение функции распределения случайной величины
у от х можно задать зависимостями
называемыми соответственно-регрессионной, скедастической, клитической и сина-
гической. На практике обычно предполагается, что дисперсия и моменты высших
порядков распределения у не зависят от значения х. Наибольший практический
интерес представляет определение зависимости \х\у = /(ж), описывающей истинную
зависимость между у и х. Зависимость средних значений у(/лу) называется регрес-
сией у по ж, а методы нахождения таких зависимостей и оценки их статистических
свойств составляют содержание регрессионного анализа.
По выборочным данным можно найти только оценку истинной регрессии, со-
содержащую ошибку, связанную со случайностью выборки.
В основе регрессионного анализа лежит принцип наименьших квадратов, в соот-
соответствии с которым в качестве уравнения регрессии у = f(x) выбирается функция,
п
доставляющая минимум сумме квадратов разностей s = ]Р [yi — / (х{)} . Как пра™
вило, вид функции f(x) определяется заранее, а методом наименьших квадратов
определяются ее коэффициенты, минимизирующие s. Количественной мерой рас-
рассеяния значений yi вокруг регрессии f(x) является дисперсия
где к— число коэффициентов, входящих в аналитическое выражение регрессии
(например, если f(x) — многочлен степени I, то к = I + 1).
В зависимости от вида уравнения регрессии у = f(x) различают линейную
(f(x)—многочлен первой степени) и нелинейную (f(x) — многочлен степени ^ 2)
регрессии.
Вид функции f(x) выбирается исходя из особенностей исследуемого явления
(процесса), а также из общего графического анализа зависимости между у и х.
Подробно выбор формы функциональной зависимости для регрессии рассмотрен
в [9, 14, 580].
Чаще всего ограничиваются рассмотрением линейной регрессионной модели,
а при нелинейной зависимости у = f(x) используют различные линеаризующие пре-
преобразования переменных у жх. Наиболее распространенные из этих преобразований
приведены в табл. 230.
Схема регрессионного анализа включает в себя последовательное решение сле-
следующих задач: нахождение выборочной оценки истинной регрессии; оценки стати-
статистической значимости выборочной регрессии в сравнении с безусловным разбросом
значений у^, характеризующимся дисперсией а2; определение доверительных обла™
стей, с заданной вероятностью включающих в себя истинную регрессию.
5.8]
Регрессионный анализ
649
Таблица 230
Линеаризующие функциональные преобразования
(у* = а* + Ь*х')
Исходная зависимость
У fix)
Ъ
у = а+ -
а
У — и ,
Ь + х
ах
У ~ Ь + х
X
У — . и
а + ох
у = abx
у = ахъ
у = аеЪх
у = а + Ьхп
Преобразование
переменных
2/*
У
1
У
1
У
X
У
Чу
lgy
In у
In у
У
ж*
1
X
X
1
X
X
X
\gx
X
1
хп
Преобразование
коэффициентов
а*
а
а
Ь
Ь
а
а
Iga
Iga
In a
In a
а
Ь*
Ь
1
а
1
а
ь
Ig6
b
ъ
ь
ь
Среди дополнительных задач, позволяющих получить полную статистическую
картину изучаемой регрессии, отметим: анализ так называемых регрессионных
остатков (разница между выборочной регрессией и выборочными значениями функ™
ции); анализ наличия грубых отклонений от регрессии (выбросов); построение
толерантных границ для регрессии.
Эти задачи практически не используются в повседневной работе инженеров
и исследователей, поэтому им далее уделяется необходимое внимание.
Разработанный в настоящее время аппарат регрессионного анализа предпола-
предполагает, что значения у^ взаимно независимы и нормально распределены. Выполне-
Выполнение этих условий должно быть предварительно проверено с помощью критери-
критериев нормальности (см. раздел 3.2.2) и критериев сравнения дисперсий (см. раз-
раздел 4.1.1.4). Наиболее полное изложение прикладного регрессионного анализа со-
содержится в [581].
5.3.1. Линейный регрессионный анализ
Линейный регрессионный анализ исходит из наличия зависимости у = а + /Зж,
где а и C — неизвестные коэффициенты регрессии. Выборочные оценки а и /3
в дальнейшем будем обозначать а и Ь соответственно.
5.3.1.1. Оценка коэффициентов регрессии
5.3.1.1.1. Оценка наименьших квадратов
Оценки наименьших квадратов являются решениями системы нормальных урав-
уравнений, строящихся по совокупности наблюдаемых значений у^ для совокупности
значений xf.
г=1
4=1
650 Методы исследования связей между случайными величинами [Гл. 5
из которой следует система
г=1
г=1 г=1 г=1
Решение системы дает искомые оценки коэффициентов регрессии:
I г=1 г=1 г=1 г=1
6= т^^; а=
г=1 \г=1
Для проверки правилвности вычислений можно использовать соотношения
1 п 1 п
у = а + Ьх, где У=-^У»; ^ = z;l>2xi°
Пг=1 П г=1
Вычисления а и Ъ существенно упрощаются, если интервалы между зна™
чениями независимой переменной х постоянны, т.е., если a^+i — ж^ = / = const
(г = 1, 2,... ,п — 1). Наиболее эффективен метод оценки, предложенный автора-
авторами в [582]. Пусть Xi = ~^— hi, т.е. последовательность #i,#2, • • - ^хп транс-
трансформируется непосредственно в последовательность г = 1,2, . ..,п и зависимость
у = а + Ьх трансформируется в завсимость у = а + 6г. Оценки для этого случая
имеют вид
12f>i-6(n + l)f> E2/i-bE*
7 г=1 г=1 7- г=1 г=1
6 = / 2 ; а = у — ох = ^^^-^^^.
п(п2 - 1) п
Дисперсии этих оценок равны: DF) = ст2: D(a) = 2^^ тт®'2? где сг2—дю>
п — п п(п — 1)
персия остатков.
Для вычисления оценок а и 6 необходимо вычисление сумм J^|/i и Е*2/Ь что
требует п умножений и 2п сложений. Авторы работы [582] предложили более
экономичный линейный метод оценивания, который при незначительной потере
в точности позволяет существенно сократить время вычислений. Эти оценки имеют
вид:
7 4,5 ,„ „ч _ 1 f гу гу гч
Ь = -т (S3 - Si); о = - Si + S2 + S3 -
n n \
к n-k n n
где Si = ]T y- S2 = E 2/*5 ^з = E 2/*' ^^ ближайшее целое к -.
i=l i=fc+l г=п-А;+1
Расчет на ЭВМ этим способом занимает в « 3,2 раза меньше времени, а диспер™
сия оценок возрастает на 12,5% и 9,4% соответственно.
В заключение отметим характерную особенность регрессионных уравнений,
о которой следует помнить инженерам и исследователям. Регрессия у по х:
у = а + /Зх не эквивалентна в общем случае регрессии х по у: ^х = а* + /3*2/.
Если Sy и S^ — стандартные отклонения совокупностей значений у ж х соот™
ветственно (S| = ^—j- J^ (^ -у) ; 52 = ^—у ^ (^ - ж) ), то регрессии у = f(x)
5.3] Регрессионный анализ 651
и х = (р(у) можно записать следующим образом:
S S
У = у + г-^- (х — х) ] х = х + г-^ (г/ — г/) ,
где г — коэффициент корреляции.
Отсюда видно, что регрессии у по х ш х по у совпадают только в одном случае,
когда существует абсолютная корреляция между у ж х^ т.е. когда \г\ = 1. При г = О
S S
прямые регрессии у по х и х по у перпендикулярны. Тогда /3 = г-^~; /3* = ^тг-
При 5^ = ?у коэффициенты корреляции и регрессии совпадают.
Задача 355. В результате наблюдений за зависимостью у = f(x) получены следую-
следующие данные:
ун 2 3 7 10 11 13 18 21 25 31;
хц 8 11 14 18 4 26 31 32 34 41.
Необходимо найти оценку коэффициентов регрессии у по х методом наименьших ква-
квадратов.
10 10 10 10
Находим Y,Xi = 2195 Yl yi = 1415 Y1 ж? = 62195 I] ЖШ = 406°-
г=1 г=1 г=1 г=1
Далее вычисляем оценки
10 • 4060 - 219 • 141 141-0,68318-219
Ь = 5— = 0,68318; а = = ^0,86164.
10-6219-2192 10
Следовательно, уравнение регрессии у по х имеет вид
у = -0,86164 + 0,68318 -ж.
Задача 356. В результате наблюдения за зависимостью у = f(x) получены следую-
следующие данные:
Vi: 13 18 24 21 25 31 36 41 35 41 48 56 61 60 70;
xv 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30.
Необходимо найти оценки коэффициентов регрессии у по х.
Введем замену переменных xi = — Ь 1 = — Ь 1-
Вычисляем оценки наименьших квадратов
15 15
12-У;г.2/*-6.A5 + 1).у>
7 i=i i=i 12 • 5704 -6-16-580
о = ; = = о,о;
15 • B25 - 1) 15 • 224 ' '
580 3,8-A5 + 1)
а = ¦—-—^^ = 8,266.
15 2 '
Воспользуемся теперь линейными оценками. Примем к = п/3 = 5 и вычисляем
5 11 15
г=1 г=6 г=11
b=^--(S -S) = 4l5 'B95 ~ 101) = 3 88-
152 Ч 3 1} 225 ' '
а= — • A01 + 184 + 295-3,88- 15ji? } =7,626.
Видим, что при существенно меньшем количестве вычислений результат практически
не отличается от предыдущего (естественно, что наибольший выигрыш во времени
и наиболее точный результат будут достигнуты при больших объемах выборок).
652 Методы исследования связей между случайными величинами [Гл. 5
5.3.1.1.2. Простейшие оценки коэффициентов регрессии
5.3.1.1.2.1. Метод Бартлеиа—Кенуя
Пары наблюдений (yi,Xi) упорядочиваются по ж и разбиваются на 3 примерно
равные группы (причем первая и последняя группы должны быть обязательно
равного объема). В каждой группе находятся суммы J^2/i и ^#г (обозначим их
соответственно Yi, Y2, У3 и -^"ъ -^2> -^з)-
Тогда коэффициент регрессии оценивается с помощью соотношения [121, 583, 584]:
Ь = — — с ошибкой S^ =
я п I
гдаs = 9 Е Уг wy'+1; а = г/ - ьг-
г=1
Если п пар наблюдений разбиваются на четыре группы, содержащие в себе 1/6,
1/3, 1/3 и 1/6 часть наблюдений, то
с ошибкой ?
\ + Л2 — Аз — ОЛ4 ОЛ1 + А2 — Аз — ОА4
Эти оценки применимы для больших выборок при п ^ 100.
Задача 357. Для данных задачи 356 найти оценку коэффициентов регрессии методом
Бартлетта-Кенуя.
Разбиваем пары наблюдений (г/^, Xi) на три части и находим соответствующие суммы
„ ~ хг
для переменной х% = —.
Xi = 15, Х2 = 40, Хз = 65, Yi = 101, Y2 = 184, F3 = 295.
Тогда имеем
что очень близко к полученному ранее в задаче 355 значению Ь = 3,8.
5.3.1.1.2.2. Метод Керрича
Для частного случая зависимости у = Ьх (а = 0) Керрич [585] предложил еле™
дующий простой метод оценки. Вычисляем разности
г^ gy% gXt1 ~п^г И d^^n(n~l)
Так как любое отношение yi/xi является оценкой 5, то любое значение di явля-
является оценкой lg Ь.
Когда S^/d <^ 1, оценкой lg 6 является величина d. Следовательно, оценка будет
равна Ь = 10d.
Задача 358. Для совокупности значений
хн 1 2 3 4 5 6 7 8 9 10;
ун 3 8 6 16 15 18 21 29 28 32
найти оценку коэффициента регрессии методом Керрича.
Вычисляем последовательность значений di = lg yi -— lg Xi:
dn 0,477; 0,602; 0,301; 0,602; 0,477; 0,477; 0,559; 0,559; 0,493; 0,505.
Далее d = 0,497 и b = Ю0'497 = 3,14, что близко к обычной оценке Ъ = 3,23.
5.8]
Регрессионный анализ
653
5.3.1.1.3. Робастные методы оценки параметров регрессии
Напомним, что одним из важнейших исходных требований регрессионного ана-
анализа является обязательная нормальность распределения наблюдаемых случайных
величин. В связи с тем, что эта предпосылка не всегда выполняется, разработаны
специальные методы, устойчивые (робастные) к отклонениям распределения ис-
исходных величин от нормального распределения. Среди них можно отметить оценки
коэффициентов регрессии с помощью коэффициентов корреляции Кендалла т [586],
„повторных" медиан [587], метода областей Дениэлса [588].
Мы рассмотрим два критерия, наиболее полно отображающих суть подходов
к построению робастных методов оценки параметров регрессии.
5.3.1.1.3.1. Медианный критерий Брауна-Муда
Предположим, мы имеем п пар (п — четное) наблюдений (ж^,^). Разбиваем все
наблюдения на две группы по значению х: группу значений, превышающих ж,
и группу значений Х{ < х. Предположим, что мы располагаем априорными оценками
коэффициентов регрессии ад и Ьд. Для них можно найти регрессию щ = а$ + bgXi
и вычислить регрессионные остатки Ayi = yi — щ. Затем определим количества
положительных (Ayi > 0) остатков mi и т2 в двух группах.
Статистикой критерия Брауна—Муда [589] является величина
2 / \ 21
-?| +
п
ГГЦ--
Гипотеза адекватности регрессии, а следовательно, пригодность выбранных ко-
коэффициентов а® и Ъд отклоняется, если А > %^ (х^, — а-квантиль %2-распределения
с / = 2 степенями свободы). В ряде случаев более эффективной может быть моди-
модификация ^-критерия Брауна—Муда
Критические значения А*»статистики равны Aq 95 = 2,237, Aq 99 = 2,806 [589].
При А* > т4^ гипотеза о пригодности а® и 6q отклоняется с вероятностью а. В этом
случае оценки а® и Ьо заменяются на другие, и итерации продолжаются до тех пор,
пока критерии не будут отклоняться критическими значениями.
Задача 359. При условиях задачи 358 провести оценку коэффициентов регрессии с по-
помощью критериев Брауна-Муда (а = 0,95).
Выберем оценки «о = 1 и bo = 3 и вычислим
щ = q0 + Ь • Xi -+ 4, 7, 10, 13, 16, 19, 22, 25, 28, 31;
Ау{ = у{^у{ -^ -1, +1, -4, +3, -1, -1, -1, +4, 0, -1.
5 + 6
Медиана равна х =
= 6,5. Для Xi > х имеем гп\ = 2 значения Ау > 0 (это 4 и 1).
Для Xi < х имеем ТП2 = 2 (это 1 и 3). Тогда
А= — •
10
А* =
л/т
2 -
10
4
+
2 -
10
4
:-f I 1=0,4;
= 0,632.
Так как А = 0,4 < Хо,9бB) = 6 и А* = 0,632 < А^95 = 2,237, принятые оценки а0 = 1
и Ьо = 3 не отклоняются критерием Брауна-Муда.
654
Методы исследования связей между случайными величинами
[Гл. 5
5.3.1.1.3.2. Оценка Тейла
По п парам (ж^Уг)? где среди значений xi нет повторяющихся, построим
7V = п(п — 1) пар оценок угловых коэффициентов
_ Уз ~ У г
Kj.
Оценкой коэффициента регрессии /3 является медиана [590] b =
N
Так как N — четное , то Ь = - (/Й + /Й+1), где fc = ^-.
Двусторонний а • 100%™й доверительный интервал для оценки Тейла имеет
вид [590]
ГДе Са =
(п- 1)Bга + 5)
18
(при > 10); и7—7™квантиль стандартного нормаль™
ного распределения.
Задача 360. В условиях задачи 358 найти оценку Тейла для регрессионного коэффици-
коэффициента /3 и вычислить его 95%-й двусторонний доверительный интервал.
n-(ra-l) 10-9
=
Найдем
Вычисляем 45 оценок /3ij(i < j) вида (Зц =
в таблицу:
= 45 пар значении (xi,Xj) для различных г:
Уз
-. Результаты вычислений сводим
г
1
2
3
4
5
6
7
8
9
1
-
-
-
-
-
2
5
-
-
-
-
3
3/2
2
-
-
-
-
4
13/3
4
10
-
-
-
5
3
7/3
9/2
1
-
-
-
6
3
10/4
4
1
3
-
-
7
3
13/5
15
5/3
3
3
-
8
26/7
21/6
23/5
13/4
14/3
11/2
8
-
9
25/8
20/8
22/6
12/5
13/4
10/3
7/2
1
10
29/9
24/9
26/7
16/6
17/5
14/4
11/3
3/2
4
Ранжированный по возрастанию ряд значений /3ij имеет вид
3 3 5 7 12 5 5 5 13 13 24 25 29 13
5 ' ' 2' 2' 3 3 5 2' 2' 2' 5 5 9 '894'
13 10 17 7 7 7 11 22 22 22 15 ^ 13 9 14 14 11 п 1П
—, —, —, —, —, —, —, —, —, —, —, 4, 4, 4, —, —, —, —, 5, —, 8, 10.
4 3 5 2 2' 2' 3 6 6 6 4' ' ' ' 3 2 3 3 2'
Медиана этого ряда равна 23-му порядковому значению, т. е. Ъ =
5.3] Регрессионный анализ 655
Для двусторонней оценки при а = 0,95 получаем
10'9'25 =1,96-11,18 = 21,91.
Находим /3 с номерами = — = 11 (ближайшее меньшее целое число)
N + С 45 + 21 91
и — = — = 34 (ближайшее большее целое число).
Имеем /Зц = 2,5 и /З34 = 3,75. Следовательно, искомый доверительный интервал для
коэффициента регрессии равен 2,5 ^ Ь ^ 3,75.
5.3.1.2. Статистическое оценивание регрессии
Статистическое исследование регрессии включает в себя:
— проверку гипотез о значениях коэффициентов регрессии (т.е. о статистиче-
статистической неразличимости выборочных значений у± и у^, вычисляемых по уравнению
регрессии);
— построение доверительных интервалов для коэффициентов регрессии и дове-
доверительных областей для регрессии;
— анализ статистической однородности регрессии (отсутствие выбросов);
— анализ независимости регрессионных остатков.
Ниже рассматриваются различные методы решения перечисленных задач.
5.3.1.2.1. Статистический анализ коэффициентов регрессии
5.3.1.2.1.1. Оценки наименьших квадратов
Статистические выводы относительно коэффициента C регрессии у = а + (Зх
могут быть получены с помощью статистики
t = Ь~Р
где
— а — bxi) ;
г=1
E — истинное значение коэффициента регрессии; Ь — выборочная оценка коэффици-
коэффициента регрессии.
Статистика tp при справедливости нулевой гипотезы Hq : f3 = Ъ имеет распреде-
распределение Стьюдента с / = п — 2 степенями свободы.
Следовательно, с помощью квантилей распределения Стьюдента можно прове-
проверить гипотезу равенства f3 заданному значению, гипотезу о значимости коэффици-
коэффициента регрессии (существенности его отклонения от нуля), построить доверительный
интервал для коэффициента C. Значение коэффициента C регрессии является зна-
значимым с достоверностью а, если \Ъ\ > ti+а Sq.
2
Гипотеза о равенстве коэффициента C заданному значению f3g принимается, если
\Р-Ъ\ <h+ggfl.
2
И, наконец, двусторонний а • 100%-й доверительный интервал для C имеет вид
Ь — Setl + Ot ^/3^6+ Sfttl + QL .
2 2
656 Методы исследования связей между случайными величинами [Гл. 5
Статистические выводы относителвно коэффициента а могут бытв полученв!
с помощвю статистики
гДе ~« - ,, „ ¦ , ,ч c-z:
, — I) Dx
а, а — соответственно выборочная оценка и истинное значение коэффициента а;
S и Sx определены выше для tp.
При Но: а = а статистика ta имеет распределение Стьюдента с / = п — 2 сте-
степенями свободы. Проверка гипотез о значениях коэффициента а и построение
доверительных интервалов для него выполняются по аналогии с коэффициентом /3.
Задача 361. Для совокупности данных
хц 1,2 2,4 2,8 4,2 5,9 6,8 8,1 9,2 10,1 11,0;
ун 7 12 17 24 29 38 46 45 54 68
найти оценки коэффициентов а и /3 регрессии у = а + j3x и провести их статистиче-
статистический анализ при доверительной вероятности а = 0,95 (не путать с а — коэффициен-
коэффициентом регрессии!).
\~^ \~^ \~^
Вычисляем оценку /3 (см. раздел 5.3.1.1.1): b =
Имеем
ю / ю \ 2 ю ю ю
^ ж* = 61,7; ^^ =3806,89; ^ х\ = 486,99; ^ у* = 340; ^ ж^^ = 2695,1.
г=1 \г=1 / г=1 г=1 г=1
Тогда
10 10
10-2695,1^61,7-340 г=1^ i=i^ 340^5,6189-61,7
о = = 5,6189: а = = = ^0,668.
10 ¦ 486,99 - 3806,89 п 10
Проверим теперь значимость полученных коэффициентов (существенность их откло-
отклонения от нуля). Вычислим предварительно
х = 6,17; S2X = ^— -Jt(Xi^ ^f = П?8112; (Sx = 3,3467).
i=l
1 n
Далее вычисляем значение дисперсии S2 = ^2(Уг ~~ УгJ ^ гДе У г = а + Ъ - xi.
П~2 г=1
В нашем случае
щ -л 6,075; 12,818; 15,065; 22,932; 32,484; 37,541; 44,846; 51,027; 56,084; 61,141.
Вычисляем далее
ю
X
= 0,125 • [G - 6,075J + A2 - 12,818J + ... + F8 - 61Д41J] = 13,4755;
я
Sx ¦ л/ri^l 3,3467 -3
+2 3'671 \ + 2'486-
п (n-l)-Sl у 10 9 • 11,8112
Для уровня достоверности а = 0,95 имеем ti~o,95 (п — 2) = to,975(8) = 2,306.
2
5.3] Регрессионный анализ 657
Проверяем значимость коэффициента /3:
\Ъ\ = 5,1689 > to,97s(8) • Яд = 2,306 • 0,3656 = 0,843,
следовательно, с достоверностью 0,95 делаем вывод о значимости коэффициента регрес-
регрессии.
Проверяем гипотезу Н: /3 = /Зо = 5 (о равенстве коэффициента регрессии C® = 5):
|5,619 - 5| = 0,619 < to,975(8) • S$ = 0,843,
т. е. гипотеза о равенстве /3 = 5 не отклоняется.
И, наконец, доверительный интервал для C равен
5,9 - 2,306 • 0,3656 = 4,776 ^ /3 ^ 6,462 = 5,619 + 2,306 • 0,3656.
Аналогичные задачи решаем теперь для коэффициента а. Проверим гипотезу
Но: а = 0 \а\ = 0,668 < to,975 • Sa = 2,306 • 2,485 = 5,73.
Следовательно, коэффициент а с вероятностью 0,95 не отличается значимо от нуля,
т. е. его значение может быть приравнено к нулю.
Двусторонний доверительный интервал для а имееет вид
о, — to,975 -So. ^ а ^ а + to,975 * Sa;
-0,668 - 2,306 • 2,485 = -6,398 <: а ^ 5,602 = -0,668 + 2,306 • 2,485.
Таким образом, уравнение регрессии у по х адекватно отображается уравнением
у = 5,619-ж.
5.3.1.2.1.2. Робастные оценки Тейла
Для робастных оценок f3 Тейла (см. раздел 5.3.1.1.3.2) проверку гипотезы
Hq : /3 = /Зо о равенстве углового коэффициента регрессии /3 заданному значению /3q
проводим следующим образом. Ввгчисляем разности Ayi = у^ — Дзж^ (г = 1, 2, ..., п).
Статистикой критерия для проверки нулевой гипотезв! является величина
1, если х > 0;
С = ]Г 5(Ayj - Ау{), где 5(х) = I 0, если х = 0;
i<3 1^-1, если х < 0.
Гипотеза Н®: C = Cq отклоняется с достоверностью а, если (при п > 10) [18]
га (га- 1)Bга + 5)
Построение доверительного интервала для C рассмотрено в разделе 5.3.1.1.3.2
(см. задачу 360).
Задача 362. Для данных задачи 358 проверить гипотезу о равенстве нулю коэффици-
коэффициента регрессии Но: C = 0 (т. е. гипотезу о значимости регрессии) при доверительной
вероятности а = 0,95.
В нашем случае п разностей Ayi совпадают с п значениями у{. Имеем
ю
«^=«0,975 = 1,96; Н"*);> +5) = 11>180.
2 V 18
Тогда с| = 39 > 1,96-11,180 = 21,913, т. е. значение коэффициента /3 следует признать
отличным от нуля.
658 Методы исследования связей между случайными величинами [Гл. 5
5.3.1.2.2. Статистический анализ уравнения регрессии
Целью статистического анализа уравнения регрессии является установление
его адекватности наблюдаемым экспериментальным данным. Под адекватностью
уравнения регрессии понимается статистическая неразличимость результатов вы-
вычислений по уравнению регрессии и наблюдаемых случайных величин.
5.3.1.2.2.1. Оценка адекватности регрессии
Количественной мерой адекватности является отношение дисперсии S2, опреде-
ляемой рассеянием значений у^ вокруг линии регрессии, к дисперсии *S? естествен-
естественного рассеяния значений у^ вокруг своих средних щ. На привычном для инженера
и исследователя языке это можно сформулировать так: ошибки, обусловленные
заменой истинной зависимости на выборочную регрессию, находятся на уровне
естественного разброса наблюдаемых случайных величин.
S2
Если — > Fa, где Fa — а-квантиль распределения Фишера с /х = п — 2
Sy
и /2 = т — 1 степенями свободы, то ошибка в определении регрессии с доверитель-
доверительной вероятностью а признается статистически значимой (га — объем выборки, по
которой выполнена оценка дисперсии S2 т.е. число дублируемых наблюдений для
каждой серии у±).
Если дисперсия S2 известна заранее (что бывает весьма редко), то /2 —> оо. Если
дисперсия Sy определяется по дублируемым значениям г/^, то ее оценкой является
средневзвешенная дисперсия
¦л п т га
il
Напомним, что S2 =
г=1
Задача 363. Проверить адекватность регрессии для данных задачи 361 при довери-
доверительной вероятности а = 0,95, если для оценки Sy предварительно проводилась серия
наблюдений над случайной величиной у при неизменной величине х (т = 10):
yiji 12 14 11 10 8 6 7 15 13.
Ранее (ем. задачу 361) мы получили S2 = 13,4755. По отдельной серии наблюдений
находим оценку Sy = • ^2(y%j ^ У г) = 11,733 (Sy = 3,425).
С<2 z|75i
Далее имеем F = — = —' = 1,148. Из таблиц ^-распределения находим
Sy 11,733
^0,95 (/1 =n^2 = 8;/2 = m^2 = 8) = 3,438.
Так как F = 1,148 < I7!),95 (8,8) = 3,438, с вероятностью а = 0,95 следует сделать вывод
о статистической неразличимости сравниваемых дисперсий, а следовательно, об адекват-
адекватности уравнения регрессии.
5.3.1.2.2.2. Анализ регрессионных остатков
Определенную информацию об адекватности уравнения регрессии дает иссле-
исследование остатков вида е^ = yi — щ, где щ = а + bxi. Если выборочная регрессия у
удовлетворительно описывает истинную зависимость между у и ж, то остатки е\
должны быть независимыми нормально распределенными случайными величинами
5.8]
Регрессионный анализ
659
с нулевым средним и в значениях в{ должен отсутствовать тренд. Нормальность
распределения остатков е^ может быть установлена одним из критериев согласия
(см. раздел 3.2.2).
Гипотезу о равенстве М(е) = 0 можно проверить любым параметрическим или
непараметрическим критерием сравнения среднего с заданным значением (в нашем
случае с нулем), изложенным в главе 4; гипотезу об отсутствии тренда — одним из
критериев тренда и случайности (см. раздел 4.3).
Независимость в последовательности значений е^ (г = 1, ..., п) может быть про-
проверена с помощью сериального коэффициента корреляции Дарбина-Ватсона [591].
Статистика сериального коэффициента корреляции Дарбина^Ватсона имеет вид
Если D > D\{a) или D > 4 —.Di(a), то с достоверностью а принимается гипотеза
о наличии соответственно отрицательной или положительной корреляции остатков.
Если D2{pt) > D > Di(a) или 4 — D\ (a) > D > 4 — ^(ск), то критерий не по™
зволяет принять решение по гипотезе о наличии или отсутствии корреляции
остатков. Если D2(ol) < D < 4 — D2(ог), то гипотеза корреляции остатков откло-
отклоняется. Критические значения D\{a) и D2(cx) для различных а и числа к ко-
коэффициентов в регрессии (имеется в виду число коэффициентов в регрессии
^ = a + bix + 52X + ... + bkX — такого вида множественную регрессию мы рассмо-
рассмотрим позже), приведены в табл. 231.
Таблица 231
Критические значения статистики Дарбина^Ватсона
(а — доверительная вероятность, к — число коэффициентов
в модели у = а + bixi + 62^2 + ... + bkXk) [591]
п
15
20
25
30
40
50
60
80
100
а
0,95
0,99
0,95
0,99
0,95
0,99
0,95
0,99
0,95
0,99
0,95
0,99
0,95
0,99
0,95
0,99
0,95
0,99
к
]
Вг
1,08
0,81
1,20
0,95
1,29
1,05
1,35
1,13
1,44
1,25
1,50
1,32
1,55
1,38
1,61
1,47
1,65
1,52
L
D2
1,36
1,07
1,41
1,15
1,45
1,21
1,49
1,26
1,54
1,34
1,59
1,40
1,62
1,45
1,66
1,52
1,69
1,56
г
Вг
0,95
0,70
1,10
0,86
1,21
0,98
1,28
1,07
1,39
1,20
1,46
1,28
1,51
1,35
1,59
1,44
1,63
1,50
>
D2
1,54
1,25
1,54
1,27
1,55
1,30
1,57
1,34
1,60
1,40
1,63
1,45
1,65
1,48
1,69
1,54
1,72
1,58
3
Вг
0,82
0,59
1,00
0,77
1,12
0,90
1,21
1,01
1,34
1,15
1,42
1,24
1,48
1,32
1,56
1,42
1,61
1,48
D2
1,75
1,46
1,68
1,41
1,66
1,41
1,65
1,42
1,66
1,46
1,67
1,49
1,69
1,52
1,72
1,57
1,74
1,60
Вг
0,69
0,49
0,90
0,68
1,04
0,83
1,14
0,94
1,29
1,10
1,38
1,20
1,44
1,28
1,53
1,39
1,59
1,46
t
D2
1,97
1,70
1,83
1,57
1,77
1,52
1,74
1,51
1,72
1,52
1,72
1,54
1,73
1,56
1,74
1,60
1,76
1,63
5
Dt
0,56
0,39
0,79
0,60
0,95
0,75
1,07
0,88
1,23
1,05
1,34
1,16
1,41
1,25
1,51
1,36
1,57
1,44
D2
2,21
1,96
1,99
1,74
1,89
1,65
1,83
1,61
1,79
1,58
1,77
1,59
1,77
1,60
1,77
1,62
1,78
1,65
660 Методы исследования связей между случайными величинами [Гл. 5
Задача 364. Для полученных в результате эксперимента данных (п = 15)
хц 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15;
уц 7 8 6 9 11 10 14 13 18 19 11 14 18 16 16
проверить наличие корреляции регрессионных остатков критерием Дарбина-Ватсона
при доверительной вероятности а = 0,95.
Вычислим оценки регрессии методом наименьших квадратов (см. раздел 5.3.1.1)
n-Y^Xi-yi-^Xi-^yi J2vi^b'J2Xl
6 =
Тогда
|>г = 120; X; ж? = 1240; ( ]Г хг) =14400; ]Г хг • уг = 1733;
г=1 г=1 \г=1 / г=1
15-1733-120.190 190-0,7607-120 =
15 ¦ 1240 - 14400 15
Находим регрессионные остатки а = г/г — у% = 6,581 + 0,7607 • жг- — у%\
0,3417; 0,1024; 2,8631; 056238; ™056155; 1,1452; -2,0941; -0,3334;
^4,5727; ^4,8120; 3,848; 1,7094;-1,5299; 1,2308; 1,9915.
Вычисляем статистику Дарбина—Ватсона
15
]Р (а ~~ е^гJ = @,1024 ~~ 0,3417J + B,8631 - 0Д024J + ...
г=2
... + A52308 + 1,5299J + A,9915 - 1,2308J = 149,4087;
Ее? =856,3012; D = ^^ = 1,7515.
^г г ' 85,3012
Из табл. 231 для а = 0,95, & = 1 (так как регрессия у = а + 6 • х имеет один коэф-
коэффициент регрессии 6, не считая свободного члена а) и п = 15 имеем Di@,95) = 1,08
и Аг@,95) = 1,36.
В нашем случае D2@,95) = 1,36 < D = 1,7515 < 4 - ?>i@,95) = 4 - 1,08 = 2,92.
Следовательно, наличие корреляции остатков регрессионной модели
у = 6, 581+ 0,7606-ж
с достоверностью а = 0,95 отклоняется.
5.3.1.2.2.3. Оценка выбросов в регрессии
Наличие грубых отклонений (промахов, выбросов) в значениях у^, не связанных
с естественным разбросом, может приводить к большим ошибкам при построении
регрессии. Учитывая, что в практике регрессионная модель часто используется
для предсказания поведения исследуемой случайной величины, то наличие выброса
в данных может привести к грубым ошибкам прогноза.
Ниже рассмотрены некоторые методы выявления выбросов в регрессии. Бу~
дем использовать следующие обозначения: е^ = г/^ — у{ — остатки в точке х = а^,
5.3]
Регрессионный анализ
661
5.3.1.2.2.3.1. Критерий Эктона
Статистикой критерия является величина [592] V =
-, где ek — остаток
от предполагаемого выброса; е =
среднее по всем другим остаткам;
г=1
гфк
S^ — дисперсия отклонения экспериментальных точек линии регрессии с учетом
отбрасывания подозрительного (fc-го) наблюдения.
Критерий Эктона применим при п ^ 30 для выделения только одного выброса
в простейшей линейной модели у = а + Ъх.
Предположим, что при каждом значении независимой переменной xi получе-
получено mi значений зависимой переменной у^. Тогда оценка для S^ в нашем случае
имеет вид
sl =
гфк
i=l
гфк
г» -2
г=1
гфк
Остаток в{ с вероятностью а признается выбросом, если V > Va, где Уа
критическое значение, приведенное в табл. 232.
Таблица 232
Критические значения Va критерия выбросов Эктона
(а — доверительная вероятность) [14]
п
3
4
5
6
а
0,95
123
7,17
5,05
4,34
0,99
31,4
16,27
9
6,85
п
7
8
9
10
а
0,95
3,98
3,77
3,63
3,54
0,99
5,88
5,33
4,98
4,75
п
15
20
25
а
0,95
3,34
3,28
3,26
0,99
4,22
4,02
3,94
Задача 365. В результате эксперимента были получены следующие значения
соответствующие различным значениям независимой переменной xf.
Xil
Vi-
т
1,2
3,1
4,1
5,6
4,27
2,7
6,1
8,4
9,2
7,9
з,
12
16
9,
12
9
Д
,1
3
,5
5,1
21,3
19,4
18,1
19,6
7,2
27,4
21,5
19,8
22,9
9,
31
36
27
31,
4
,2
,4
,3
63
11,1
41,1
38,2
31,4
36,9
12,4
51,2
48,1
31,4
43,56
16,1
71,1
59,2
63,5
64,6
19,1
91,2
81,2
79,4
83,93.
Необходимо проверить наличие выброса в регрессионной модели при доверительной
вероятности а = 0,95 критерием Эктона.
Вычислим параметры регрессионной модели (см. раздел 5.3.1.1.1):
10
¦г = 88,2; I У" Xi I = 7779,24; V" х\ = 1091,14;
Ш = 4230,223;
Х> = 327,79;
662
Методы исследования связей между случайными величинами
[Гл. 5
10 • 4230,223 - 88,2 ¦ 327,79 327,79 - 4,275 • 88,2
b = ¦ ¦ — = 4,275: а = ' = -4,9265.
10 • 1091,14 - 7779,24 ' 10
Остатки равны а = у г — у г • (у г = —4, 9265 + 4, 275 • хг):
4,066; 1,284; 0,754; 2,724; -2,953; -3,628; -5,626; -4,523; 0,699; 7,204.
Проверяем на выброс максимальный по модулю остаток ею = 7,204. Исключая соот-
соответствующую ему точку хю = 19,1, вычисляем Sw(rrii = 3):
- mf = C,1 - 4,27J + D,1 - 4,27J
¦ F3,5 - 64,6J = 459,2302;
i=lj=l
9
г=1
= 301,9509; S?o = ^02 + 301,9509 = ^ ^ = 55Щ
Среднее по (п —- 1) остаткам, не считая потенциального выброса, равно
\ ¦ ? е{ = -0,80.
г=1
г-л 7,204 + 0,80 i Ae
Вычисляем статистику критерия Эктона V = = 1,45.
5,518
Из табл. 232 для п = 10 и а = 0,95 имеем Fo,95 = 3,54.
Так как V = 1,45 < Fo,95 = 3,54, гипотезу о наличии выбросов в регрессии следует
отклонить.
5.3.1.2.2.3.2. Критерий Титьена-Мура-Бекмана
В работе Титьена-Мура-Бекмана [593] предложен критерий обнаружения одно™
го выброса в линейной модели у = а + кс, основаннвш на статистике
R = max
, где Sf =
гс-2
1- - -
xj - жJ
Если R > Raj то yi, соответствующее максимальному значению отношения —,
признается с вероятностью а выбросом. Критические значения Ra приведены
в табл. 233.
Таблица 233
Критические значения Ra критерия выбросов
в регрессии Титьена—Мура—Бекмана [593]
п
4
5
6
7
8
9
10
11
12
14
Доверительная
вероятность а
0,90
1,41
1,69
1,88
2,01
2,10
2,18
2 24
2,30
2,35
2,43
0,95
1,41
1,71
1,92
2,07
2,19
2,28
2,35
2,43
2,48
2,57
0,99
1,41
1,73
1,97
2,16
2,31
2,43
2,53
2,64
2,70
2,80
п
16
18
20
24
30
36
48
60
100
Доверительная
вероятность а
0,90
2,50
2,56
2,60
2,69
2,79
2,86
2,97
3,04
3,22
0,95
2,64
2,71
2,76
2,85
2,97
3,03
3,15
3,21
3,40
0,99
2,92
2,99
3,06
3,17
3,28
3,35
3,41
3,50
3,75
5.8]
Регрессионный анализ
663
Задача 366. Для данных задачи 365 проверить наличие выброса в регрессионной мо-
модели критерием Титьена-Мура-Бекмана при а = 0,95.
Имеем (используем значения е*, вычисленные ранее в задаче 365)
ю
10
х{ - xf
152,5479
1-0,1
xj - xf
313,216
Вычисляем последовательность значений —:
ei _ 4,066
= 17,1616 - 0,06088 • (Xi - 8,82J .
V17,1616 - 0,06088 • A,28,82)
^ = 0,333; ^ = 0,190; ^ = 0,674; ^ = -0,716;
= 1,01 и по аналогии
Per ft\
- = -0,876;
f = -1,371; f = -1,117; f = 0,187;
0 O
= 2,199.
Находим R = max
= 2,199. Из табл. 233 для а = 0,95 и п = 2,35 находим
^q,95 = 2,35. Так как R = 2,199 < До,95 = 2,35, гипотеза о наличии выброса отклоняется.
5.3.1.2.2.3.3. Критерий Прескотта-Лунда
Прескотт [594] и Лунд [595], учитывая близость значений Si (собственно, эта
близость является одной из предпосылок регрессионного анализа — см. вводную
часть раздела 5.3), предложили упрощенную модификацию критерия Титьена—
Мура—Бекмана, основанную на статистике
R* = max
где S —оценка средней дисперсии остатков I S = S
V п
q — количество пара-
метров в регрессионной модели.
Более удобна эквивалентная форма критерия Прескотта^Лунда
R* =
шах
Гипотеза наличия выброса в линейной регрессионной модели с к параметра-
параметрами (ранее рассматривался случай простейшей модели, когда к = 2; случай к > 2
параметров — множественная регрессия — будет рассмотрен далее в разделе 5.3.2)
отклоняется, если R* < i?^, где R*a—критическое значение, равное
F- 1-
(п - k)F
-квантиль .F-распределения Фишера
= п-^-1 сте-
степенями свободы.
Таблицы критических значений R^ приведены Лундом [595] и воспроизведены
в табл. 234.
664
Методы исследования связей между случайными величинами
[Гл. 5
Таблица 234
Критические значения JR^ критерия выбросов
в регрессии Прескотта^Лунда [595]
п
к
1
2
3
4
5
6
8
10
Доверительная вероятность а = 0,90
5
6
7
8
9
10
12
14
16
18
20
25
30
35
40
45
50
60
70
80
90
100
1,87
2,00
2,10
2,18
2,24
2,30
2,39
2,47
2,53
2,58
2,63
2,72
2,80
2,86
2,91
2,95
2,99
3,06
3,11
3,16
3,20
3,23
1,89
2,02
2,12
2,20
2,26
2,37
2,45
2,51
2,57
2,62
2,72
2,79
2,85
2,91
2,95
2,99
3,06
3,11
3,16
3,20
3,23
1,90
2,03
2,13
2 21
2^33
2,42
2,50
2,56
2,61
2,71
2,77
2,85
2,90
2,95
2,99
3,05
3,11
3,15
3,19
3,23
1,91
2,05
2,15
2,29
2,39
2,47
2,54
2,59
2,70
2,78
2,85
2,90
2,95
2,99
3,05
3,11
3,15
3,19
3,23
1,92
2,06
2,24
2,36
2,45
2,52
2,58
2,69
2,77
2,84
2,90
2,94
2,98
3,05
3,11
3,15
3,19
3,23
1,92
2,17
2,31
2,42
2,50
2,56
2,68
2,77
2,84
2,89
2,94
2,98
3,05
3,11
3,15
3,19
3,23
1,93
2,19
2,34
2,44
2,52
2,66
2,75
2,82
2,88
2,93
2,98
3,05
3,10
3,15
3,19
3,23
1,94
2,23
2,35
2,46
2,63
2,73
2,81
2,87
2,93
2,97
3,04
3,10
3,15
3,19
3,22
Доверительная вероятность а = 0,95
5
6
7
8
9
10
12
14
16
18
20
25
30
35
40
45
50
60
70
80
90
100
1,92
2,07
2,19
2,28
2,35
2,42
2,52
2,61
2,68
2,73
2,78
2,89
2,96
3,03
3,08
3,13
3,17
3,23
3,29
3,33
3,37
3,41
1,93
2,08
2,20
2,29
2,37
2,49
2,58
2,66
2,72
2,77
2,88
2,96
3,02
3,08
3,12
3,16
3,23
3,29
3,33
3,37
3,41
1,94
2,10
2 21
2^31
2,45
2,55
2,63
2,70
2,76
2,87
2,95
3,02
3,07
3,12
3,16
3,23
3,28
3,33
3,37
3,40
1,94
2,10
2,22
2,39
2,51
2,60
2,68
2,74
2,86
2,94
3,01
3,07
3,12
3,16
3,23
3,28
3,33
3,36
3,40
1,95
2,11
2,33
2,47
2,57
2,65
2,72
2,84
2,93
3,00
3,06
3,11
3,15
3,22
3,28
3,33
3,37
3,40
1,95
2,24
2,41
2,53
2,62
2,70
2,83
2,93
3,00
3,06
3,11
3,15
3,22
3,28
3,33
3,38
3,40
1,96
2,25
2,43
2,55
2,64
2,80
2,90
2,98
3,05
3,10
3,14
3,22
3,27
3,32
3,36
3,40
1,96
2,26
2,44
2,57
2,76
2 88
2 97
3,03
3,09
3,14
3,21
3,27
3,32
3,36
3,40
5.8]
Регрессионный анализ
665
Задача 367. Для данных задачи 365 проверить наличие выброса в регрессионной мо-
модели критерием Прескотта-Лунда при доверительной вероятности а = 0,90.
Пользуясь оценками и расчетами, выполненными в задаче 365, получим ряд значений
L (г = 1,2, ...,n) ^
\
0,3292; 0,2563; 0,0610; 0,2200; 0,2390; 0,2937; 0,4555; 0,3662; 0,0566; 0,5830.
Имеем
, *.\ ,
1-0,583 = 1,844.
R* =
Из табл. 234 для а = 0,90, к = 2 и п = 10 имеем Д5,9о = 2,26.
Так как R* = 1,844 < 1?о,эо :=: 2,26, гипотеза о наличии выброса в регрессии отклоня-
отклоняется.
Воспользуемся квантилями ^-распределения.
Находим по таблицам F-распределения (при необходимости интерполяцией)
=F0)99(/1 = 1;/2 =n-2-l) = Fo,9
= 12,246.
Тогда Щу90 =
(n-k)-F
— fe — 1 + F
к табличному значению До,эо = 2,26.
A0 - 2) ¦ 12,246
0 - 2 - 1 + 12,246
= 2,256, что достаточно близко
5.3.1.2.3. Доверительные области и толерантные границы регрессии
5.3.1.2.3.1. Доверительная область простой линейной регрессии
Для линейной регрессии у = а + Ъх доверительная область (с доверительной
вероятностью а ) на заданном отрезке будет ограничена гиперболами
¦ + К
где
С =
и = п —
Х\ ^ X
А Г 1 Г-1 1 + пС
п — 2: А = < - 1 — , 9Ч ,
\Ч A + пС2)A
nCD
D =
(Xi - X)
-nD2
If
u(y, a, A) — коэффициент, зависящий от z/, а и А.
Значения tx(z/, а. А) приведены в табл. 235.
Доверительная зона, рассчитанная по приведенным выше соотношениям, яв™
ляется геометрическим местом доверительных интервалов для различных значе-
значений х.
666
Методы исследования связей между случайными величинами
[Гл. 5
Коэффициенты и{у, «, А) для построения
V
Л
0
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
а = 0,90
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
50
100
оо
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
15753
15746
1,740
1,734
1,729
1,725
1,708
1,676
1,660
1,645
6,625
3,022
2,425
2,192
2,071
1,995
1,944
1,908
1,880
1,859
1,841
1,827
1,815
1,805
1,797
1,789
1,783
1,777
1,772
1,767
1,750
1,716
1,700
1,684
6,922
3,121
2,494
2,250
2,123
2,044
1,991
1,953
1,925
1,902
1,884
1,869
1,857
1,847
1,838
1,830
1,823
1,817
1,811
1,807
1,789
1,753
1,736
1,720
7,203
3,216
2,561
2,306
2,173
2,091
2,036
1,997
1,967
1,944
1,925
1,909
1,897
1,886
1,876
1,868
1,861
1,855
1,849
1,844
1,825
1,789
1,771
1,754
7,470
3,308
2,625
2,360
2,222
2,136
2,079
2,038
2,007
1,983
1,963
1,947
1,934
1,923
1,913
1,905
1,897
1,891
1,885
1,880
1,860
1,823
1,804
1,786
7,724
3,397
2,687
2,412
2,268
2,180
2,120
2,078
2,046
2,021
2,001
1,984
1,970
1,959
1,948
1,940
1,932
1,925
1,919
1,914
1,894
1,855
1,836
1,817
7,965
3,482
2,747
2,463
2,313
2,222
2,160
2,116
2,083
2,057
2,036
2,019
2,005
1,993
1,982
1,973
1,965
1,959
1,952
1,947
1,926
1,886
1,866
1,847
8,192
3,564
2,805
2,511
2,357
2,263
2,199
2,153
2,119
2,092
2,071
2,053
2,038
2,026
2,015
2,006
1,998
1,990
1,984
1,978
1,957
1,915
1,895
1,875
8,407
3,642
2,860
2,558
2,399
2,302
2,236
2,189
2,153
2,126
2,104
2,086
2,070
2,058
2,046
2,037
2,029
2,021
2,015
2,009
1,986
1,943
1,923
1,902
8,609
3,717
2,914
2,604
2,440
2,340
2,272
2,224
2,287
2,159
2,136
2,117
2,102
2,089
2,077
2,067
2,059
2,051
2,044
2,038
2,015
1,971
1,950
1,929
а = 0,95
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
50
100
оо
12,700
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,132
2,120
2,110
2,101
2,093
2,086
2,060
2,009
1,984
1,960
13,320
4,445
3,271
2,847
2,633
2,504
2,418
2,357
2,312
2,277
2,249
2,226
2,207
2,191
2,177
2,165
2,154
2,145
2,137
2,129
2,102
2,049
2,023
1,998
13,920
4,582
3,356
2,915
2,692
2,558
2,469
2,406
2,358
2,322
2,293
2,269
2,250
2,233
2,219
2,206
2,195
2,186
2,177
2,170
2,141
2,086
2,060
2,034
14,480
4,715
3,438
2,978
2,748
2,609
2,517
2,452
2,403
2,365
2,335
2,311
2,290
2,273
2,258
2,245
2,234
2,224
2,215
2,207
2,178
2,121
2,094
2,068
15,010
4,844
3,518
3,040
2,802
2,659
2,563
2,496
2,445
2,406
2,375
2,350
2,329
2,331
2,295
2,282
2,271
2,260
2,251
2,243
2,213
2,154
2,126
2,099
15,520
4,968
3,594
3,101
2,854
2,706
2,607
2,538
2,485
2,445
2,413
2,387
2,365
2,347
2,331
2,317
2,305
2,295
2,285
2,277
2,246
2,186
2,157
2,128
16,000
5,087
3,668
3,159
2,904
2,751
2,650
2,578
2,524
2,482
2,449
2,422
2,400
2,381
2,365
2,351
2,338
2,328
2,318
2,309
2,277
2,215
2,186
2,156
16,460
5,202
3,740
3,215
2,953
2,795
2,691
2,616
2,561
2,518
2,484
2,456
2,433
2,414
2,397
2,383
2,370
2,359
2,349
2,340
2,307
2,244
2,213
2,183
16,890
5,312
3,809
3,270
3,000
2,838
2,730
2,654
2,597
2,552
2,517
2,489
2,466
2,446
2,429
2,414
2,401
2,389
2,379
2,370
2,336
2,271
2,240
2,209
17,290
5,417
3,875
3,332
3,045
2,879
2,769
2,690
2,632
2,586
2,500
2,521
2,497
2,476
2,459
2,444
2,431
2,419
2,408
2,399
2,364
2,297
0,265
2,234
5.8]
Регрессионный анализ
667
Таблица 235
доверительной
[ области линейной регрессии [25]
Л
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
а = 0,90
8,799
3,788
2,965
2,647
2,480
2,377
2,308
2,258
2,220
2,191
2,168
2,148
2,132
2,119
2,107
2,088
2,080
2,073
2,067
2,044
1,998
1,976
1,954
8,976
3,855
3,015
2,689
2,517
2,412
2,341
2,290
2,252
2,222
2,198
2,178
2,162
2,148
2,136
2,125
2,116
2,108
2,101
2,095
2,071
2,024
2,002
1,979
9,142
3,919
3,061
2,728
2,554
2,446
2,374
2,322
2,283
2,252
2,227
2,207
2,190
2,176
2,164
2,154
2,144
2,136
2,128
2,122
2,097
0,050
2,026
2,004
9,294
3,978
3,105
2,766
2,588
2,478
2,405
2,352
2,312
2,281
2,256
2,235
2,218
2,203
2,191
2,191
2,171
2,162
2,155
2,148
2,123
2,074
2,050
2,027
9,434
4,033
3,146
2,801
2,620
2,509
2,434
2,381
2,340
2,308
2,283
2,262
2,244
2,229
2,217
2,217
2,196
2,187
2,180
2,173
2,147
2,098
2,074
2,050
9,561
4,083
3,184
2,834
2,650
2,538
2,462
2,407
2,366
2,333
2,308
2,287
2,269
2,254
2,241
2,241
2,220
2,211
2,203
2,196
2,170
2,120
2,096
2,072
9,674
4,129
3,218
2,864
2,678
2,564
2,487
2,432
2,390
2,357
2,331
2,310
2,292
2,276
2,263
2,263
2,242
2,233
2,225
2,218
2,192
2,141
2,116
2,092
9,772
4,169
3,248
2,891
2,703
2,587
2,509
2,453
2,411
2,378
2,352
2,330
2,312
2,297
2,283
2,283
2,262
2,253
2,245
2,238
2,211
2,160
2,135
2,110
9,854
4,202
3,274
2,913
2,724
2,607
2,529
2,472
2,430
2,397
2,370
2,348
2,330
2,314
2,301
2,301
2,279
2,270
2,262
2,255
2,228
2,176
2,151
2,126
9,916
4,228
3,294
2,931
2,740
2,623
2,545
2,487
2,444
2,411
2,384
2,362
2,343
2,328
2,314
2,314
2,293
2,284
2,276
2,268
2,241
2,189
2,164
2,139
9,950
4,243
3,305
2,941
2,749
2,632
2,552
2,495
2,452
2,418
2,392
2,269
2,351
2,335
2,322
2,322
2,300
2,291
2,283
2,276
2,249
2,196
2,171
2,146
а = 0,95
17,670
5,517
3,939
3,373
3,089
2,919
2,806
2,726
2,666
2,618
2,582
2,552
2,527
2,506
2,488
2,473
2,459
2,447
2,437
2,427
2,392
2,323
2,290
2,258
10,025
5,612
4,000
3,422
3,132
2,958
2,842
2,760
2,699
2,650
2,613
2,582
2,557
2,536
2,517
2,501
2,487
2,475
2,464
2,455
2,418
2,348
2,314
2,281
18,355
5,701
4,059
3,469
3,173
2,995
2,877
2,793
2,731
2,681
2,643
2,612
2,586
2,564
2,545
2,529
2,515
2,502
2,491
2,481
2,444
2,372
2,338
2,304
18,661
5,785
4,114
3,514
3,212
3,031
2,911
2,826
2,762
2,712
2,673
2,641
2,614
2,592
2,573
2,556
2,542
2,529
2,518
2,508
2,470
2,396
2,361
2,327
18,941
5,864
4,166
3,556
3,249
3,065
2,943
2,856
2,792
2,741
2,701
2,669
2,642
2,619
2,599
2,583
2,568
2,555
2,543
2,533
2,494
2,419
2,384
2,349
19,195
5,935
4,214
3,596
3,284
3,097
2,974
2,886
2,820
2,768
2,728
2,695
2,668
2,645
2,625
2,608
2,593
2,579
2,568
2,577
2,518
2,442
2,405
2,370
19,422
6,000
4,258
3,632
3,316
3,127
3,002
2,913
2,846
2,794
2,753
2,720
2,692
2,669
2,649
2,631
2,616
2,603
2,591
2,580
2,540
2,463
2,426
2,390
19,619
6,058
4,297
3,664
3,345
3,154
3,028
2,938
2,870
2,818
2,777
2,743
2,715
2,691
2,671
2,653
2,638
2,624
2,612
2,601
2,561
2,483
2,446
2,409
19,782
6,107
4,330
3,692
3,371
3,178
3,051
2,959
2,891
2,838
2,797
2,763
2,734
2,710
2,690
2,672
2,657
2,643
2,631
2,620
2,579
2,501
2,463
2,426
19,907
6,144
4,356
3,714
3,390
3,197
3,068
2,976
2,908
2,855
2,813
2,779
2,750
2,726
2,706
2,688
2,672
2,658
2,646
2,635
2,594
2,515
2,248
2,440
19,975
6,164
4,371
3,727
3,402
3,207
3,078
2,986
2,918
2,865
2,823
2,788
2,759
2,735
2,714
2,696
2,680
2,666
2,654
2,643
2,602
2,523
2,485
2,448
668
Методы исследования связей между случайными величинами
[Гл. 5
Для единичного значения щ доверительный интервал будет равен
Щ ±tl±a ± Si,
2
где
i — х)
У2 (xi - xf
J
Легко видеть, что этот интервал будет намного шире, чем границы доверитель-
доверительной зоны для всей регрессии.
Задача 368. По данным задачи 365 построить 95%-к? доверительную зону для регрес-
регрессии на интервале от х\ = 3 до Х2 = 10 и доверительный интервал для yi при Xi = 5,1
(ж = 8,82).
Имеем
3 - 8,82
i/ = 10-2 = 8; С= —
17,6979
— = ^0,329;
D =
17,6979
= 0,066;
п-2
= 30,447; Sy = 5,518;
~~
A + 10 • (-0,329) • 0,0666)
1 -
0,780886
2,08241 ¦ 0,04435
= 0,566.
A + 10 • 0,3292) • A + 10 • 0,06662) _
Из табл. 235 для и = 8, а = 0,95 и Л = 0,566 находим (интерполяцией)
и(8; 0,95; 0,566) = 2,660.
Тогда доверительная зона для регрессии имеет вид (ранее в задаче 365 было получено
уравнение у = —4,9265 + 4,275 • х): г/н ^ у ^ yBj где
^^2
Уш = ^4,9265 + 4,275 • х - 2,66 • 5,518 •
1
1 ] 2
Уъ = ^4,9265 + 4,275 • х + 2,66 • 5,518 •
313,2156 10
(х^хJ , 1
313,2156 10
Для значения yi = 2/E,1) имеем (при / = п — 2 = 8 степенях свободы) t(i+0,95)/2 =
= tO,975 = 2,306 И
1
2
10
313,2156
= 5,902;
- 0,9265 + 4,275 • 5,1 - 2,306 • 5,902 =
= 3,266 ^ у E,1) ^ 30,486 = -4,9265 + 4,275 • 5,1 + 2,306 • 5,902.
Соответствующие границы доверительной зоны будут (подставляем х = 5,1 в урав-
уравнение гиперболы):
у 2 -4,9265 + 4,275 • 5,1 - 14,678
у $ -4,9265 + 4,275 • 5,1 + 14,678 •
^} = 11,30;
1
{ ^^f + ± } * = 22,449.
5.3] Регрессионный анализ 669
Видим, что длина доверительного интервала в этом случае уменьшается в
30,486 - 3,266
22,449^ 11,30 =2-
5.3.1.2.3.2. Оценка обращенного уравнения регрессии
Иногда возникает так называемая обращенная задача оценивания, заключающа-
заключающаяся в ответе на вопрос: если найдена оценка линии регрессии, то каким образом по
некоторому измеренному значению у можно предсказать значение переменной х®^
не являющейся случайной величиной? Браунли [559] и Хальд [51] показали, что а™
доверительный интервал для оценивания значения х® определяется выражением
E"*ft
1+а «
- xf
p= - + —1т+,г "' ; ** = *V^; s2 = ^i^
i=i
m^ — количество наблюдений у± при ж = Х{; то — количество наблюдений ^ при
ж = х®; у о — среднее по т® наблюдениям у^ при х = х®; ta — «^квантиль распреде™
ления Стьюдента при / = п — 2 степенях свободы.
Приведенный доверительный интервал основан на совместном распределении
линии регрессии и у®. Он неприменим для вычисления значений ж, соответствую™
щих ряду значений у, если используется одна и та же линия регрессии.
Укажем еще один способ оценки х®^ предложенный Крючковым и Эйзенхартом
[14], в соответствии с которым оценкой х® служит величина x® = c-^dy®^ где
-у)
d =
Задача 369. По данным задачи 365 найти 95%™й доверительный интервал для вели-
величины хо, если при х = xq были получены следующие значения уст 28,1; 29,2; 25,6.
Имеем
ю
х = 8,82; пи = 3; у= ^ = — • J2 У* = 32,779; S2 = 30,447 E = 0,518);
г=1
10
то = 3; Ь- 4,275; to,975(8) = 2,306; J2 mi ' (ж* ~ ^f = 939,638;
г=1
28,1 + 29,2 + 25,6
2/о = = 27,633.
670 Методы исследования связей между случайными величинами [Гл. 5
Далее
* Уо^У
Ь
Вычисляем:
27,633 -
- 32,779
75
+ зоу *
4,2347
4,275 '
4,275 ^2,3062
' ' 4,275 • 939
G,616 ^8,82J 0о6175
939,638 <Vb475.
• 30,447
,638
¦ g ¦ ^ = 8,82
_ f 1+o .1 • УР = 8,82 + 27'633 32'779 - 2'3°6 5'518 ^^ = 5,990.
^р Ь* VF ' 42347 42347
еду с I —{—¦ f V \ / № ——— vy щ KJ* ju
b* ^p b* vr ' 4,2347 4,2347
Следовательно, 95%-й доверительный интервал для значения жо, соответствующий
измеренным значениям г/ог? имеет вид 5,790 ^ xq ^ 9,419.
Для нахо^кдения оценки Крючкова-Эйзенхарта вычислим
^ т^ • (xi -x)-(yi-y)=3- [A,2 - 8,82) • D,27 - 32?779) + ...
г=1
... + A9,1 - 8,82) • (83,93 - 32,779)] = 4017,3456;
ю
J2 mi • {Ш - yf = 3 . [D,27 - 32,779J + ... + (83,93 - 32?779J] = 17633,3396.
г=1
Тогда имеем
4017,3456
17633,3396
= 0,2278; с = х - d • у = 8,82 + 0,2278 • 32,779 = 1,3529.
Следовательно, хо = 1,3529 + 0,2278-27,633 = 7,65, что очень близко к середине дове-
довела ю / . 9,419 + 5,790
рительного интервала Хальда-Брауна (см. предыдущую задачу, где х = =
= 756045).
5.3.1.2.3.3. Толерантные интервалы длм линейной регрессии
Ранее (см. раздел 4.4) были подробно рассмотрены методы вычисления толе™
рантных пределов для совокупности случайных величин. Напомним, что 7 • 100%-м
толерантным интервалом называется интервал, в границах которого находится
7 • 100% всех возможных значений случайной величины.
В настоящем разделе рассматривается методика построения толерантных ин-
интервалов для линейной регрессии.
Для того, чтобы вычислить толерантные пределы для линейной регрессии, необхо-
необходимо знать дисперсию величины для разных значений независимой переменной х [596].
Эта дисперсия задается формулой Воркинга^Хотеллинга [597]
/ -\2
\Х — X)
+
г=1
Здесь эффективное число наблюдений для некоторой величины х равно
п
n^(Xi -X)
а — хJ + п (х — хJ
5.3] Регрессионный анализ 671
Другими словами, для некоторой величины х средняя величина у определяется
расчетом по линии регрессии столь же точно, как если бы было сделано п* наблю-
наблюдений при заданной величине х.
Теперь для того, чтобы найти толерантный интервал, о котором мы могли бы
с вероятностью а утверждать, что внутри него лежит по крайней мере /Участь
популяции, необходимо найти толерантные интервалы для каждого значения х.
Искомая толерантная область будет геометрическим местом точек толерантных
интервалов для отдельных Х{.
Для определения частных толерантных интервалов следует воспользоваться
методами, изложенными в разделе 4.4.1.2.3 для случая выборок из нормального
распределения с обоими неизвестными параметрами. Односторонние толерантные
интервалы равны (см. раздел 4.4.1.2.3):
верхний: ув = у(х) + S(x)k(n*(x), a,/?);
нижний: |/н = у(х) — 5(ж)&(п*(ж),а,/3).
Двусторонний толерантный интервал имеет вид:
у(х) - k{n*(x),a,p)S(x) ^ у(х) < у(х) + k(n*(x),a,0)S(x).
Эффективный объем выборки п*(х) рассчитывается по вышеприведенной фор™
п
муле, исходя из значений п и ^Р (xi — х) .
г=1
Значение S (х) рассчитывается по формуле
Значения коэффициентов fc(n,a,/3) и fc*(n,a,/3) приведены в табл.203 и 204
соответственно (входом в таблицы являются значения п*). Для п* > 50 справедливо
приближение
к*(п*(х),а,/3) =
Задача 370. Для данных задачи 365 найти двустороннюю толерантную область^
в которой с вероятностью не менее а = 0,95 будет находиться не менее /3 = 0,90 всех
возможных реализаций уравнения регрессии.
Для значения х = 1,2 имеем
ю
Si = 30,447 (Sy = 5,518); х = 8,82; ]Г (х{ - жJ = 313,216;
= 5,518 -\l^+ A 313 2162) = 2'948; п = ^4'9265; b = 4'275;
уA,2) = -4,9276 + 4,275 • 1,2 = 0,2024; п*A,2) = : ; ^ = 3,5.
313,216 + 10- A,2 - 8,2J
Из табл. 204 для а = 0,95, /3 = 0,90 и п* = 3,5 (используем интерполяцию) получаем
к* = 6,885.
Тогда 0,2035 - 2,948 • 6,885 = -20,09 ^ у A,2) ^ 20,50 = 0,2035 + 2,948 • 6,885.
672
Методы исследования связей между случайными величинами
[Гл. 5
По аналогии получаем толерантные интервалы для остальных значений независимой
переменной х. Результаты сведем в таблицу:
X
1,2
2,7
3,9
5,1
7,2
11,1
12,4
16,1
19,1
у{х)
0,202
6,616
11,746
16,876
25,853
42,526
48,083
63,900
76,726
Sy(x)
2,948
2,586
2,323
2,095
2,816
1,884
2,071
1,863
3,649
те*
3,500
4,550
5,640
6,930
9,230
8,580
7,090
3,710
2,290
к*
6,885
4,767
3,914
3,360
3,497
3,040
3,346
6,230
25,160
2/в(ж)
20,500
18,943
20,838
23,915
32,203
48,253
55,010
81,736
168,535
Уш(х)
-20,090
-5,711
2,654
9,837
19,502
36,529
41,150
46,060
-15,083
5.3.1.3. Сравнение линейных регрессий
Сравнение двух регрессионных моделей включает в себя проверку нулевой гипоте-
гипотезы Hq : у\ = у2 о статистической неразличимости линейных регрессий у\ = а\ + Ь\Х
и 2/2 = (i2 + Ь^х. Для проверки If о необходимо последователвно проверить три гипо-
гипотезы: о неразличимости коэффициентов а\ и п2 (Hq : а± = а2)] Ь\ и 62 (Hq : Ъ\ =62)?
и о равенстве остаточных дисперсий, характеризующих разброс значений у^ вокруг
линии регрессии (Hq' : S\ = 5|).
В первую очередь проверяется гипотеза Hq' : Sf = Sf. Для поверки гипотезы
сначала подсчитываются соответствующие дисперсии
S2 =
где rii, гг-2 — объемы выборок, по которым найдены регрессии у\ и г/2 соответственно;
хц (г = 1, ..., ni) и X2i (г = 1, ..., тгг) —значения переменной х в двух выборках.
Затем дисперсии Sf и *S*f сравниваются между собой с помощью критерия
Sf
Фишера. Если —|- > Fa, где .Fa — «-квантиль распределения Фишера с Д = п\ — 2
и /2=П2^2 степенями свободы, то гипотеза Hq' о равенстве двух регрессий
отклоняется, и регрессии признаются статистически различимыми (в числителе
всегда должна быть большая дисперсия).
Если гипотеза Hq' не отклоняется, можно приступить к проверке гипотез H'Q
и Hq . Для проверки равенства угловых коэффициентов Ь\ и ^2 (гипотеза Hq)
используется статистика
h - ъ2
S*
1 ^|
1 i=l
- 1) SZX1 (п2 - 1) St2
1 п2
- \2 • С2 _ ! v^ /
^1 / ч ^г — 7" / \X2i
По — 1 ^
- \2
ni
+ П2 — 4
5.3] Регрессионный анализ 673
При справедливости нулевой гипотезы Hq (т. е. при Ь\ = 62) статистика % имеет
распределение Стьюдента e/ = rii+B2^4 степенями свободы. Если
\tb\ ^ tl + a,
2
то с доверительной вероятностью а гипотеза Hq отклоняется и сравниваемые
угловые коэффициенты Ь\ и ?»2 признаются различными. Если гипотеза Hq не
отклоняется, то проводится проверка гипотезы Hq (проверка равенства а\ = п2)-
Для проверки этой гипотезы используется статистика
tn =
S
Т _ (П1 — 1) ^Х1Ь\ + (П2 — 1) SX2b2 ^ I _ у\ — У2 t
s = ~* ' г
1 ^ 1) Я"х + (П2 - 1) S (Ж1 - Ж2
S**, S^, S^2 определены выше при проверке гипотезы Hq .
При справедливости Hq статистика ta имеет распределение Стьюдента
с/ = щ+В2^4 степенями свободы.
Следовательно, при справедливости \ta\ > ti+a (f) гипотеза Hq отклоняется.
2
Если все гипотезы Н^ Hq и Hq' не отклоняются, то сравниваемые регрессии yi
и у2 признаются неразличимыми.
Задача 371. В результате двух независимых экспериментов получены следующие
результаты (щ = 10, П2 = 6):
хщ 2 4 6 9 11 16 17 20 25 31; х2ц 12 16 21 23 28 31;
ущ 9 19 22 41 49 61 69 83 98 128; y2i: 54 68 87 93 112 130.
Проверить гипотезу о статистической неразличимости регрессионных моделей, полу-
полученных по обеим выборкам при вероятности а = 0,95.
Вычисляем для первой выборки
ю / ю \ ю ю
5^Ж1г = 141; XI = 14,1; Р>] хц \ =19881; ^ а& = 2789; ^ уи = 589;
г=1 \г=1 / г=1 г=1
10
У! = 57,9; ^ хц • у^ = 11361;
г=1
10 ¦ 11361 - 141 • 579 179^3,992-14,1
3; ° 1613;
61 =
10 • 2789 - 19881 10
i «-1
г^2 -1 Ж V
J2
1 г=1
(Xli - п) = 88,989 (Sx! = 9,439).
Аналогично для элементов второй выборки имеем
53^2* = 131; х2 = 21,83; \Y,X2i) = 171615
»=i V=i /
Я|2 = 50,967 (Sx2 = 7,39);
22 А. И. Кобзарь
674 Методы исследования связей между случайными величинами [Гл. 5
б б
J2 2/2* = 5446; у2 = 90,667; ]Г x2i • y2i = 12868;
г=1 г=1
6-12688-131-544 = 544-3,887-131 =
6-3115-17161 6
Далее вычислим дисперсии рассеяния значений yi вокруг линии регрессии:
1 ni 1 10
Я? = • У^ (i/ii — 1,613 — 3,992 • хцJ = - • У^ (г/i* — 1,613 — 3,992 • хцJ = 10,056:
ni - 1 г^ ; 8 г^ ' у ' '
1 1 6 2
Яз = - • У" (уз» - 5,80 - 3,887 • х2%) = 7,0271; Ях = 3,171; S = 2,651.
Проверим гипотезу i/g" • «S'i = Я|. Имеем —|- = — = 1,431. Так как —j = 1,43 <
< -^0,95(8; 4) = 3,838, гипотеза Hq" принимается и дисперсии Si и Я2 с вероятностью
а = 0,95 признаются статистически неразличимыми.
Проверяем теперь гипотезу Hq , для чего вычислим
Далее
Из
таблиц
f («1
1
/
^ 2) ¦ 5?
7?1 +
1
/ (щ - 1) • 5^
находим ti+c
+ (тг2 -
¦ 712 ™" 4
(тг2 -
Af = n1
2)-
1
¦1)
+
J
¦Sx2
1
2
4)
(8 ¦ 10,056 + 4-
ч
7,0271
у 9 • 88,988 5 ¦
= to,975 A2) = 2Д7.
V
)
1
50,967
= 0,0078.
2
Так как \Ьъ\ = 0,0078 < to,975A2) = 2,179, гипотеза Hq не отклоняется, и угловые
коэффициенты Ь\ и &2 признаются неразличимыми с достоверностью а = 0,95. Проверим
гипотезу Hq". Находим:
т 9 • 88,989 • 3,992 + 5 ¦ 50,967 • 3,887 о Л_ ~ у\ - m 57,9 - 50,667
о = = 3,967: о = = = 4,239:
9-88,989 + 5-50,967 Ж1 - ж2 14,1-21,83
5 = 3,008 • 1 + ^ • ( — + - ) Г = 0,2212;
[ 9 • 88,989 + 5 ¦ 50,967 A4,1 - 21,83J \10 6/J
_ 3,967^4,239 _
ta " 0,2212 " ~МЗ-
Сравнивая |to| с to,975A2), имеем \ta\ = 1,230 < to,975A2) = 2,170.
Следовательно, и гипотеза Но" не отклоняется. Таким образом, сравнением эмпи-
эмпирических уравнений регрессий убеждаемся, что они с достоверностью не менее 0,95
статистически эквивалентны.
5.3.1.4. Некоторые специальные задачи линейного регрессионного анализа
В этом разделе мы рассмотрим некоторые частные задачи, возникающие в ли™
нейном регрессионном анализе. В связи с их специфичностью они не рассматрива-
рассматриваются в классических курсах регрессионного анализа.
5.3.1.4.1. Оценка вершины кусочно-ломаной линии регрессии
Предположим, что имеются две пересекающиеся линии регрессии и требуется
определить доверительную зону для точки их пересечения.
Алгоритм получения такой оценки включает в себя ряд последовательных
операций. Сначала строится двусторонний а;-доверительный интервал для двух
5.3]
Регрессионный анализ
675
угловых коэффициентов Ь\ и Ь2 регрессии рассматриваемых прямых у\ = а\ + Ь\х
и у2 = а2 + Ь2х соответственно. С помощью методов, изложенных в разделе 5.3.1.2.1.1,
находим [106]
2 22 2
где t7 — 7~квантиль распределения Стьюдента с / = п — 2 степенями свободы (п —
объем выборки, будем считать его одинаковым для обеих выборок); &i, 62 — оценки
наименьших квадратов соответственно для угловых коэффициентов Ь\ и Ъ2, равные
(см. раздел 5.3.1.1.1)
п п
г=1 г=1
п п
г=1 г=1
V""v 2
nZ_^xu ~
i=i
1 "^^г
Где #1г = ^ 5]
г=1
Spi =
^/32 =
Sx2 yn — 1
1П
sk = 7—J J2 (X
Оценки ai и a2 равны
2
1П 1П
= - J2x^ si = 7—^ J2
Тогда двусторонние «-доверительные интервалы для средних
-< п
и ^2 = — У^ Шг будут иметь вид:
2/1
где
2/1
2 V п
>i ~ Ч Sli
n ~ 1) Sln 2 !
г
22*
676
Методы исследования связей между случайными величинами
[Гл. 5
mi — число параллельных наблюдений над у\ и у2 на уровне Х{ (будем считать для
простоты, что wii = const для всех х^ у\ и у2).
Легко видеть, что S^ и S2i—это дисперсии, характеризующие рассеяние вели™
чин 2/1 и у2 на каждом уровне Х{; Я? и Я|2 — средневзвешенные дисперсии величин
г/1 и у2 по всем Х{.
Следует помнить, что для оценки дисперсий 5|х и 5|2 необходимы параллельные
наблюдения над у на каждом уровне х. В нашем случае t1+a" —соответствующая
квантиль распределения Стьюдента с / =
^ — 1 степенями свободы.
Теперь через каждую точку с координатами (xi,f/f) и (xi,f/J) проведем по две
прямые с угловыми коэффициентами Ь^ и bf (г/J, yf^bfmb® — соответственно нижние
и верхние границы доверительных интервалов). То же самое выполняем и для
второй регрессии — т.е. проведем прямые через точки (х2,у2) и (х2,у2).
Через максимальную область, охватываемую прямыми
y = yl + V?(x-x1); y = yl + bl(x- хг),
будет с вероятностью /3 = afa/f проходить линия регрессии у\ = а\ + Ь\ • х.
По аналогии через максимальную область, охватываемую прямыми
У = §2
2 (X ^ Х2) ; У = У
У = VI + Щ {х - х2); у = у
^ Х2)
- х2) ,
будет с вероятностью /3 = а'а" проходить линия регрессии у2 = а2 + Ъ2х.
Пересечение этих двух областей представляет собой неправильный многоуголь-
многоугольник, который и служит доверительной областью для точки пересечения прямых
регрессии при доверительной вероятности j = j32.
Задача 372. В результате наблюдений были получены две выборки результатов^
представленных в таблице. Необходимо найти 90%-ю доверительную область для
точки пересечения линий регрессии^ пороэюдаемых двумя выборками.
2
3
5
9
11
14
17
20
25
31
Уи
19,21,16
26,21,38
41,38,49
70,61,82
84,71,99
105,91,116
125,109,141
145,131,160
180,161,201
210,191,231
Уи
18,67
28,33
42,67
71,00
84,67
104,00
125,00
145,33
180,67
210,67
о2
6,33
76,33
32,33
111,00
196,33
157,00
256,00
210,33
400,33
400,33
%2i
0,8
1,2
2,0
3,0
4,8
6,9
8,2
10,1
12,0
14,0
У2г
15; 13; 17,1
17; 16,1; 18, 2
18; 17,1; 19,4
21; 19,8; 23,1
27,5; 26; 29
34; 31; 37
38; 36; 41
44; 41,2; 46,1
50; 39; 62
56; 41; 69
Vii
15,03
17,10
18,17
21,30
27,50
34,00
38,33
43,76
50,33
55,33
о2
^2г
4,203
1,110
1,343
2,750
2,250
9,000
6,333
6,043
132,330
196,330
Имеем 7 = Р2 = 0,90 и/3 = л/(Щ « 0,95. Выбираем а = а" = а = л/Р = л/(Щ) « 0,975.
Выполняя необходимые расчеты, получаем
хи
=18769;
уи = 1011,01;
5.3] Регрессионный анализ 677
10 10 10 / 10
Y хц -Ун = 19441,17; V x2i = 63; V ж^ = 594,98; Га
г=1 г=1 г=1 \г=1
10 10
23 Шг = 320,185; 2] ж^ ' У^ = 2634,246.
г=1 1=1
Находим оценки коэффициентов регрессии:
- 10-19441,17-137-1011,01 л 1011,01-6,702-137
bi = ¦ 5 = 6,702; oi = ! ! = 9,2836;
10 - 2711 - 1372 10
- 10 ¦ 2634,246 - 63 ¦ 320,85 ^ ^Л л 320,85 - 3,094 -63
Ъ2 = = 3,094; а2 = = 12,593.
10-594,98-3969 ' 10
Вычисляем дисперсии
Sl = ^— • 23 (Уи - oi - bi • жнJ = 10,6703 (St = 3,2665);
S22 = ^— • jh (y2i -а2-Ъ2> x2if = 0,2737 (S2 = 0,52317);
Slx = ^— • J2 (x^ - ^iJ = 92,678 (SX1 = 9,627);
1 n
/^/ ж "* ( ~ \^ rjf) ллл / Q a Ci.r\-\ \
у \x2i — x2) = 22.uu9; (оЖо = 4,o91);
n
Sl 3,2665 Я2 0,52317
= O.llol; Ь
O.llol; Ьй2 ,
9,627-3 ' ' P2 Sx2-y/n=l 4,691-3
Теперь из табл. 118 (или аппроксимацией из раздела 1.1.9 для а = 0,975) находим
(интерполируя) ?(i+0,975)/2 = ^0,9875 (/ = 8) = 2,798.
Для двустороннего доверительного интервала имеем
Ь" = Ьг - to,9875 • SCi = 6,702 - 2,798 • 0,1131 = 6,385;
bl = bi + to,9875 • S/3! = 6,702 + 2,798 • 0,1131 = 7,018;
Щ = b2 - to,9875 • Я/32 = 3,094 - 2,798 • 0,03717 = 2,990;
Ь1 = Ь2 + to,9875 • SC2 = 3,094 + 2,798 • 0,03717 = 3,198.
Теперь вычислим дисперсии (rrii = 3):
23 таг —
г=1
23 mi — п
г=1
= 184,6313 EЛ = 13,
5^2 = 6,014).
Так как оценки Sy1 и Sy2 используют все 2^ mi ~~ n — 20 степеней свободы, то
г=1
t1 + a// = 11+0,975 = *0,987б(/ = 20 - 1 = 19) = 2,465.
2 2
Далее вычисляем
10
Ш=У1- ^о,9875 • -т= = тт: • У 2/н - 2,465 • ^^ = 101,101 - -> '-==>¦ = 90,509;
л/Г). 10 ^—J л/1П л/1П
% ^ V уи 2,465 ^
/п 10 ^ V10
= уг + to,9875 • % = 101,101 + 2,465 • Щ^- = 111,693;
у/п VI0
678 Методы исследования связей между случайными величинами [Гл. 5
й = ш - w • 5f = й • |>< -2'645 ¦ ^ = 32'085" ^7W^ = 27'397;
= у2 + *0>9875 . % = 32,085 + 2,465 • ^t = 36,773.
/^г VI0
Максимальная область, охватываемая прямыми
у = 90,509 + 6,385 • (х - 13,7); у = 90,509 + 7,018 • (х - 13,7);
у = 111,693 + 6,385 • (ж - 13,7); у = 111,693 + 7,018 • (ж - 13,7) ,
содержит линию регрессии у\ = 9,2836 + 6,702 • х с вероятностью
/3 = а' • а" = 0,9875 • 0,9875 = 0,975.
По аналогии, максимальная область, охватываемая прямыми
у = 27,397 + 2,990 • (ж - 6,3); у = 27,397 + 3,198 • (ж - 6,3);
у = 36,773 + 2,990 • (ж - 6,3); у = 36,773 + 3,198 • (х - 6,3),
содержит линию регрессии у2 = 12,593 + 3,094 • х с вероятностью
/3 = а • а" = 0,9875 • 0,9875 = 0,975.
Поясним максимальную область для первой прямой регрессии — она ограничивается:
-дляж > 13,7 прямыми 2/1 = 111,93 + 7,018-(ж - 13,7) и у[ = 90,509 + 6,385-(ж - 13,7);
-дляж < 13,7 прямыми ух = 111,93 + 6,385-(ж - 13,7) ш у[ = 90,509 + 7,018-(ж - 13,7).
Аналогично, для второй линии регрессии имеем максимальную область:
— для ж > 6,3 между линиями у2 = 36,773 + 3,198 • (ж - 6,3); у'2 = 27,397 + 2,99 х
х (ж -6,3);
— для ж < 6,3 между линиями у2 = 36,773 + 2,99 • (ж - 6,3); у2 = 27,397 + 3,198 х
х (ж -6,3).
Из анализа максимальных областей линий регресии видим, что они пересекаются при
ж < 6,3.
Теперь осталось найти четыре точки пересечения четырех линий, ограничивающих
максимальные области пересекающихся линий регрессии.
Для ж < 6,3 имеем следующие линии:
2/1 = 111,693 + 6,385 • (ж - 13,7); у[ = 90,509 + 7,018 • (ж - 13,7);
у2 = 36,773 + 2,99 • (ж - 6,3); у2 = 27,397 + 3,198 • (ж - 6,3) ,
или
2/i = 24,2185 + 6,385 -ж; у[ = -5,6376 + 7,018 • ж;
у2 = 17,936 + 2,99 -ж; у'2 = 7,2496 + 3,198 • ж.
Находим попарные точки пересечения прямых (г/1,2/2) ?(?/i>2/2) 5(yi52/2) 5B/1? 2/2) , попа-
попадающие в область определения х < 6,3. Прямые г/i и у2 пересекаются в точке ж = -—5,32,
прямые г/i и у2 в точке ж = —1,85, прямые г/i и г/2 в точке х = 5,85, прямые у[ и у2 в точке
ж = 3,37.
Таким образом, мы имеем для описания области пересечения прямых регрессии
четыре точки с координатами (ж = —5,32; у = —9,75), (ж = —1,85; у = 12,4), (ж = 5,85;
у = 35,43), (ж = 3,37; у = 18,01).
С вероятностью 7 = Р2 = @,95 • 0,95J = 0,90 в области, ограниченной этими точками,
находится точка пересечения двух линий регрессии. Отметим, что искомая область
может быть описана и большим количеством точек пересечения.
5.3.1.4.2. Определение объема испытаний для получения заданной точности
оценки коэффициента регрессии
Задача рассмотрена в [598] и формулируется следующим образом. Для извест-
известной заранее стандартной ошибки отдельного наблюдения Уг(сг) необходимо так
спланировать наблюдения, чтобы ошибка в определении углового коэффициента
5.3]
Регрессионный анализ
679
регрессии методом наименьших квадратов при заданной доверительной вероят™
ности а не превышала АЬ (при этом желательно, чтобы число наблюдений п
и интервал изменения независимой переменной х{1) были минимальными).
При наиболее неблагоприятном экстремальном расположении наблюдений (по-
(половина на одном конце интервала, половина на другом) минимально допустимое
соотношение между числом наблюдений п и длиной интервала I для достижения
заданной точности А5 в определении коэффициента регрессии имеет вид [598]
д^КП^ ' ГД6
2ta(n)
2ta(n)
п —
п(п —
1
2)'
п
п = 2т;
п = 2т-1
— коэффициент, зависящий от доверительной вероятности а и числа наблюдений п
(его значения приведены в табл. 236).
Таблица 236
Значения коэффициента fe(a,n) [598]
п
3
4
5
6
7
8
9
10
11
12
13
14
15
Доверительная
вероятность
0,90
10,93
3,58
2,48
1,94
1,69
1,48
1,36
1,25
1,17
1,10
1,04
0,99
0,95
0,95
22,01
18,49
3,35
2,54
2,15
1,87
1,70
1,55
1,44
1,35
1,28
1,21
1,16
а
0,99
55,11
48,58
4,78
3,42
2,82
2,40
2,15
1,94
1,80
1,68
1,58
1,49
1,42
п
16
17
18
19
20
21
22
23
24
25
26
30
60
Доверительная
вероятность
0,90
0,91
0,88
0,85
0,82
0,79
0,77
0,75
0,73
0,72
0,70
0,68
0,63
0,48
0,95
1,11
1,07
1,03
1,00
0,97
0,94
0,91
0,89
0,86
0,85
0,83
0,76
0,52
а
0,99
1,36
1,30
1,25
1,21
1,17
1,14
1,10
1,08
1,05
1,03
1,00
0,92
0,62
По заданным а и АЪ можно найти соотношения между I и А5, между I и п
и, задаваясь одним, выбирать другое.
Задача 373. Известно, что стандартная ошибка измерений у равна а = 5,27. Необ-
Необходимо определить:
— количество наблюдений, обеспечивающих ошибку оценки коэффициента регрессии
не более АЬ = 3,2 на интервале изменения х длиной I = 10 при доверительной вероят-
вероятности а = 0,95;
— наименьшую длину интервала изменения переменной ж, обеспечивающую точ-
точность оценки АЬ = 1,1 с помощью п = 25 наблюдений при доверительной вероятности
а = 0,90.
Отвечаем на первый вопрос. Имеем I = — • к(а,п) и для I = 10, а = 0,95, а = 5,27
АЪ
ж АЪ = 3,2 получаем fc@,95; п) = 10 • 3,2/5,27 = 6,07. Из табл. 236 имеем п = 5.
Отвечаем на второй вопрос. Для п = 25, АЬ = 1,1, а = 0,90 из табл. 236 имеем
^@,90; 25) = 0,70. Тогда I =
= з?35.
680 Методы исследования связей между случайными величинами [Гл. 5
5.3.2. Множественная линейная регрессия
Ранее рассматривались методы оценки и анализа линейной регрессии у = f{x).
Если случайная величина у может зависеть одновременно от двух и более переменных,
возникает задача оценки и анализа множественной регрессии у = f{x\1x2i • • • ->хк)^
где Xj (j = 1, 2, ..., к) —независимые переменные.
Рассмотрим в качестве примера регрессию у = а + f3\Xi + /?2Ж2 для случая двух
независимых переменных х\ и х2. Для большего числа переменных оценки могут
быть получены по аналогии. Для нашего случая оценки коэффициентов f3\ , f32 и а
имеют вид:
_ S(xl)S(xuy)-S(x1x2)S(x2y) _ S(xj) S(x2y) - S(xlX2) S(xiy)
г~ S(x21)S(x22)^[S(x1x2)]2 5 2^ S(x21)S(x22)-[S(x1x2)]2 5
a = y - btxt - b2x2i где
Дисперсия, характеризующая разброс значений у^ вокруг линии регрессии, рав-
равна
1 п 1
52 -L v^4 / г. l \2 J- Го/ 2\ ? о/ Л г. а ( \Л
= > (г/7- — а — Ь\Х\ — Ь2х2) = \Ь[у — bib(xiy) — Ь2Ь\х2у)\ .
п — 3-"-^ n™3L ч 7 J
Проверка гипотез iJq • &i = ^ю и -^о' • ^2 = ^20 (^10? ^20—некоторые заранее за™
данные значения) производится с помощью статистик
ti = ^ъ—^5 h = ^^——, где
i_ 1
( Я(т>2\ 12 f Я(т2\ 1 2
о _ с J у 2/ I а _ с J ^y^ij I
О^! *-> Л / 2\ о/ 2\ го/ \i2 I ' ^2 ^ I о/ 2\ о/ 2\ го/ \т2 f
[ 5(X!J Я(Ж2) "" [S{XlX2)\ J [ D^i) Я(Ж2) — [S (X\X2)\ J
Статистики t\ ж t2 при справедливости гипотез Hq и Uq7 имеют распре-
распределение Стьюдента с / = п^3 степенями свободы. Отсюда: если |5i| >ti±aSb1
2
и |&2| > ti+g Sh2, то коэффициенты 6i и Ъ2 признаются значимыми.
2
Сама регрессия признается значимой, если -^- < Faj где S2.—дисперсия зна-
значений |/г, оцененная ранее или оцениваемая по дублируемым наблюдениям (для Fa
используются степени свободы f\ =n — Зи/2=?71—1, где m — объем выборки, по
которой производилась оценка S2).
Для обнаруясения и устранения выбросов при множественной линейной регрес-
регрессии применяются статистики Прескотта-Лунда (см. раздел 5.3.1.2.2.3.3) с исполь-
использованием соответствующего значения к (в нашем случае к = 3).
Для большего числа независимых переменных расчеты и анализ множествен™
ной регрессии существенно усложняются. Однако в настоящее время разработаны
специальные методы планирования регрессионных экспериментов, позволяющие
упростить оценки коэффициентов регрессии и сократить число необходимых экс™
периментов.
5.3] Регрессионный анализ 681
Некоторые из них будут рассмотрены далее, однако в целом этот обширнейший
раздел современной прикладной статистики останется за бортом нашего труда, так
как он заслуживает самостоятельного скрупулезного и пространного изложения.
В самых общих чертах (на уровне элементарного введения) мы рассмотрим эти
вопросы в разделе, посвященном методам активного планирования эксперимента.
5.3.3. Нелинейный регрессионный анализ
Если линейное уравнение регрессии неадекватно описывает имеющийся стати-
статистический материал, необходимо найти нелинейное уравнение регрессии, удовле-
удовлетворительно описывающее истинную зависимость. Различные приемы нахождения
таких зависимостей рассматриваются ниже.
5.3.3.1. Линеаризация нелинейной модели заменой переменных
Смысл метода ясен из названия — нелинейное уравнение преобразуется в линей-
линейное переходом от исследуемых переменных к новым переменным. Некоторые из
таких преобразований приведены в табл. 230. Обработка результатов наблюдений,
вычисление регрессии и ее статистический анализ для линейно преобразованного
уравнения выполняются методами линейного регрессионного анализа, рассмотрен-
рассмотренными выше. Следует, однако, помнить исходные предпосылки регрессионного ана-
анализа, основная из которых — нормальность распределения изучаемых случайных
величин — должна теперь быть справедлива не для самой случайной величины,
а для ее функционального преобразования, что, к сожалению, далеко не всегда
выполняется. Подбор необходимого линеаризующего преобразования выполняется
первоначально „на глаз" графически. Поясним методику вычисления нелинейной
регрессии примером.
Задача 374. В результате исследования зависимости между случайными величина-
величинами х и у получены следующие результаты (п = 10):
Хц 1 2 3 4 5 6 7 8 9 10
ун 81 19 9 8,5 7 6,6 5 5,8 5,6 5,4.
Необходимо найти регрессию у = f(x) и провести ее статистический анализ.
Предварительным анализом убеждаемся, что можно использовать линеаризующее
преобразование для функции типа у = аех .
Обозначим у* = In г/ и ж* = —. Тогда будем искать линейную регрессию у* = а* +Ь*ж*.
Для х* и у* имеем ряд
* 111111111
23456789 10
у* -+ 4,39 2,94 2,20 2,14 1,94 1,89 1,79 1,76 1,72 1,69
Находим
ю / ю \ 2
J2 xl = 2,92896; ]Г х* \ = 8,578806;
i=l \i=l /
10 10 10
J2 xf = 1,549768; ]Г у* = 22,46; J2 ж** * 2/** = 8,6671587.
г=1 г=1 г=1
Тогда
L* 10-8,6671587™ 2,92896-22,46 orii^ * 22,46-3,019-2,92896
о = = 3,019; а = = 1,361.
10 • 1,549768 - 8,578806 ' 10
682 Методы исследования связей между случайными величинами [Гл. 5
Следовательно, искомая регрессия имеет вид
I 3,019
у* = 1,361 + 3,019 -ж*, или In у = 1,361 + 3,019- -; у = 3,9 • е х .
х
Проверяем значимость коэффициентов регрессии. Имеем
S2 = —!— • V" (у* • 1,361 - 3,019 • ж*J = 0,004 (S = 0,067) ;
! (х* - ж*J = 0,0768 (Sx* = 0,2772); Sb* = S, = 0,0805.
5 Vn^T
п — 1 _
Из табл. 118 для а = 0,95 имеем ?(i+o,95)/2(/ = 8) = to,975(8) = 2,31.
Так как \Ъ*\ = 3,019 > to,97s(8) • Sb* = 2,31 • 0,0805 = 6,186, коэффициент регрессии
признается значимым. Для дисперсии коэффициента а* имеем
1 «Г*2 ) 2 fin 9Q9HQU2 1 2
- + ^} = 0,067 J—+' } =0,0317.
п (п - 1) • S2X* ) X Ю 9 - 0,0768 /
Тогда |а*| = 1,361 > to,975(8) • Яа* = 2,31 • 0,0317 = 0,073, что также приводит к выво-
выводу о значимости коэффициента а* с достоверностью а = 0,95.
5.3.3.2. Полиномиальная нелинейная регрессия (полиномы Чебышева)
При невозможности замены переменных приходится искать оценки нелинейной
регрессии непосредственно по экспериментальным данным.
Как правило, любая нелинейная регрессия может быть представлена полиномом
п
вида у = 5^ сцхг. Если степень полинома к выбрана заранее, то оценки коэффициен-
коэффициента
тов ао, ai, ..., а^ находятся непосредственно методом наименьших квадратов. При
неизвестной степени аппроксимирующего полинома уравнение регрессии ищется
путем последовательных уточнений (последовательного повышения степени по-
полинома). Критерием для прекращения процедуры уточнения степени полинома
является величина остаточной дисперсии
Если *S^+1 > S|, то в качестве регрессии принимается полином степени к. Зна-
Значимость дисперсий S% , х и S% проверяется .F-критерием Фишера при Д = п — к
af2=n^k^l степенях свободы.
При увеличении степени полинома необходимо пересчитывать все коэффициен-
коэффициенты регрессии. Расчеты упрощаются, если значения Х{ являются равноотстоящими
(xi+i — xi = const). Тогда уравнение регрессии к-то порядка может быть представ-
представлено в виде у = ЬоРо(х) + biPi(x) + ... + bkPk(x), где Рк(х) —полиномы Чебышева,
определяемые соотношениями
Р*(гр\ 1 . Р, (~\ гу. ' Р, (~\ Р, (™\ Р- л (гр\ __ V L Р, ^fr}
0\х) — Li Г1\х) — х о ? -гк\х) — ^1\х) гк-1\х) ./.,2 п\ ±к — 2\<Ь)-
* А\4:к — 1]
Коэффициенты регрессии вычисляются по формуле
5.3] Регрессионный анализ 683
Если х* = Ь 1 (х2 — х\ = ... = а^+1 — Xi = ... = хп — хп^\ = const), то х* = г
и уравнение регрессии принимает вид
У = b0P0(i) + biPi(z)(a; -?) + ...+ Ь/ЛООО - x)fc + ..., г = 1, 2, ..., n,
Значения
^ „2,.л (feO
где Bk - 1)!! = 1 • 3 • 5 • ... • Bfc - 1),
можно заранее табулировать для разных п и к, а значения Pj(i) также вычис™
лить, пользуясь приведенными формулами. Для некоторых значений к и п по™
п
линомы Чебышева Pj(i) и ^^-Р^(^) приведены в табл.237. В ней учтено, что
i=l
Рк(г) = —Pk{n + 1 — г) для нечетных Aj, и Pk(i) = Pk(n + 1 ~~ *) Для четных Aj. Оста™
точная дисперсия уравнения регрессии равна
^jdbr5*2' где ^ = ^-1-^1:^@; So^E^if
г=1 г=1 \г=1
Проверка гипотез о значениях коэффициентов регрессии осуществляется с по-
помощью статистик
3 sk
имеющих распределение Стьюдента с f = п — к — 1 степенями свободы.
1
ЕСЛИ \tj\ > tl+a ИЛИ \bj\ > t l+a 5fc
, то с доверительной вероятно™
L»=i
стью а коэффициент регрессии bj является значимым (т. е. существенно отличным
от нуля).
Основным практическим преимуществом полиномов Чебышева является то, что
при повышении степени полинома необходимо вычислять только один дополнитель-
дополнительный коэффициент регрессии без пересчета всех остальных.
Последовательность анализа нелинейной регрессии с помощью полиномов Чебы-
Чебышева состоит в следующем. Сначала находится линейная регрессия низшего поряд™
ка (к = 1) и соответствующая ей дисперсия Sf. Далее вычисляется еще один коэф™
фициент регрессии ?»2 и дисперсия S|, соответствующая квадратичной регрессии.
Затем критерием Фишера проверяется значимость уменьшения дисперсии Щ по
Я2
сравнению с дисперсией Sf. Если -~-j ^ Fa (/i = n — 2; /2 = п — 3), то квадратичная
регрессия предпочтительнее линейной.
S2
Кубическая регрессия предпочитается квадратичной, если -^ ^ F@ (/1 = п — 3;
/2 = п-4).
684
Методы исследования связей между случайными величинами
[Гл. 5
Таблица 237
Полиномы Чебышева
i) ш значения Р* = ^ Р% (г)
г=1
п
3
4
5
6
7
8
9
10
11
i
1
2
3
Р*
1
2
3
4
Р*
1
2
3
4
5
Р*
1
2
3
4
5
6
Р*
1
2
3
4
Р*
1
2
3
4
Р*
1
2
3
4
5
Р*
1
2
3
4
5
Р*
1
2
3
4
5
6
-1
0
1
2
-3
-1
1
3
20
-2
-1
0
1
2
10
-5
-3
-1
1
3
5
70
-3
-2
-1
0
28
-7
-5
-3
-1
168
-4
-3
^2
-1
0
60
-9
-7
-5
-3
-1
330
-5
-4
-3
_2
-1
0
1
-2
1
6
1
-1
-1
1
4
2
-1
-2
-1
2
14
5
-1
-4
-4
-1
5
84
5
0
-3
-4
84
7
1
-3
-5
168
28
7
-8
-17
-20
2772
6
2
-1
-3
-4
132
15
6
-1
-6
-9
-10
-1
3
-3
1
20
-1
2
0
-2
1
10
-5
7
4
-4
-7
5
180
-1
1
1
0
6
-7
5
7
3
264
-14
7
13
9
0
990
-42
14
35
31
12
8580
-30
6
22
23
14
0
Р4(г)
1
-4
6
-4
1
70
1
-3
2
2
-3
1
28
3
— 7
1
6
154
7
-13
-3
9
616
14
-21
-11
9
18
2002
18
-22
-17
3
18
2860
6
-6
-6
-1
4
6
п
11
12
13
14
15
16
17
г
Р*
1
2
3
4
5
6
Р*
1
2
3
4
5
6
7
Р*
1
2
3
4
5
6
7
Р*
1
2
3
4
5
6
7
Р*
1
2
3
4
5
6
7
8
Р*
1
2
3
4
5
6
7
8
9
А К»
110
-11
-9
-7
-5
-3
-1
572
-6
-5
-4
-3
-2
-1
0
182
-13
-11
-9
-7
-5
-3
-1
910
-7
-6
-5
-4
-3
-2
0
280
-15
-13
-11
-9
-7
-5
-3
-1
1360
-8
—7
-6
-5
-4
-3
-2
-1
0
P2(i)
858
55
25
1
-17
-29
-35
12012
22
11
2
-5
-10
-13
-14
2002
13
7
2
-2
-5
-7
-8
728
91
52
19
-8
-29
-44
-56
37128
35
21
9
-1
-9
-15
-19
-21
5712
40
25
12
1
-8
-15
-20
-23
-24
^з(г)
4290
-33
3
21
25
19
7
5148
-11
0
6
8
7
4
0
572
-143
-11
66
98
95
67
24
97240
-91
-13
35
58
61
49
0
39780
-455
-91
143
267
301
265
179
63
1007760
-28
-7
7
15
18
17
13
7
0
Р4»
286
33
-27
-33
-13
12
28
8008
99
-66
-96
-54
11
64
84
68068
143
-77
-132
-92
-13
63
108
136136
1001
-429
-869
-704
-249
251
756
6466460
273
-91
-221
-201
-101
23
129
189
470288
52
-13
-39
-39
-24
-3
17
31
36
5.3]
Регрессионный анализ
685
п
17
18
19
г
Р*
1
2
3
4
5
6
7
8
9
Р*
1
2
3
4
5
6
РФ)
408
-17
-15
-13
-11
-9
—7
-5
-3
-1
1938
-9
-8
-7
-6
-5
-4
7752
68
44
23
5
-10
-22
-31
-37
-40
23256
51
34
19
6
-5
-14
3876
-68
-20
13
33
42
42
35
23
8
23256
-204
-68
28
89
120
126
р4@
16796
68
-12
-47
-51
-36
-12
13
33
44
28424
612
-68
-388
-453
-354
-168
п
19
20
г
7
8
9
10
Р*
1
2
3
4
5
6
7
8
9
10
Р*
О]
Pi(i)
-3
-2
-1
0
570
-19
-17
-15
-13
-11
-9
-7
-5
-3
-1
2660
(онча
Р2(г)
-21
-26
-29
-30
13566
57
39
23
9
-3
-13
-21
-27
-31
-33
17556
ние таблицы 237
Рз(г)
112
83
44
0
213180
-969
-357
85
377
539
591
553
445
287
99
4903140
P4(i)
42
227
352
396
2288132
1938
-102
-1122
-1402
-1187
-687
-77
503
948
1188
22881320
Процесс вычислений заканчивается, как толвко
S^<Fa (f = n-k-l;f2=n-k-2).
^к + 1
Так как поввинение степени полинома от к до к + 1 не уменвшает дисперсию
регрессии, принимается уравнение регрессии, описываемое полиномом степени к.
Задача 375. В результате исследований получена следующая зависимость:
хц 1,1; 3,2; 5,3; 7,4; 9,5; 11,6; 13,7; 15,8; 17,9; 20,0
уц 1,3; 4,75; 6,8; 1,86; -15,6; -51,1; -110,3; -198,6; -321,8; -485,2.
Необходимо найти уравнение регрессии и определить порядок его нелинейности, приняв
достоверность а = 0,95.
ж-1,1 х
Имеем ж* =
1,1
2,1
—, тогда х* = i. Результаты вычислений сводим в та-
таблицу, там же приводим значения полиномов Чебышева для п = 10 и к = 1,2,3,4 из
табл. 237:
xi =i
1
2
3
4
5
6
7
8
9
10
Е
10
ЕА2@
г=1
Уг
1,30
4,75
6,80
1,86
-15,60
-51,10
-110,30
-198,60
-321,80
-485,20
-1167,89
Pi(i)
-9
-7
-5
-3
-1
1
3
5
7
9
330
УгРг(г)
-11,70
-33,25
-34,00
-5,58
15,60
-51,10
-330,90
-993,00
-2252,60
-4366,80
-8063,33
Р2«
6
2
-1
-3
-4
-4
-3
-1
2
6
132
УгР2(г)
7,80
9,50
-6,80
-5,58
62,40
204,40
330,90
198,60
-643,60
-2911,20
-2753,58
Рз(г)
-42
14
35
31
12
-12
-31
-35
-14
42
8580
УгРз(г)
-54,60
66,50
238,00
57,66
-187,20
613,20
3419,30
6951,00
4505,20
-20378,40
-4769,34
Р4«
18
-22
-17
3
18
18
3
-17
-22
18
2860
У iP4.il)
23,40
-104,50
-115,60
5,58
-280,80
-919,80
-330,90
3376,20
7079,60
-8733,60
-0,42
686 Методы исследования связей между случайными величинами [Гл. 5
ю
Вычисляем bo = — • ^ Vi = — • (-1167,89) = -116,79; Ъг = -^ = -8°63;33 =
= -24,4343.
Уравнение регрессии имеет вид
у = -116,79 - 24,434 • (ж* - ж*) = 17,597 - 24,434 • ж*.
Находим дисперсию
2
52 = —Ц-, где Я2 = Sq — Ь2 •
где ?>
г=1
Имеем
Яо = 393510,8521 - — • 1167,892 = 257114,1469;
о ' 10 ' '
\ = 257114,1469 - 24,4342 • 330 = 60097,42942; Я2 = - • 60097,42942 = 7512,1787.
8
Вычислим коэффициент bo = ¦™::= = — = —20,86.
г=1
Далее находим
Si = 60097,42942 - 20,862 • 132 = 2659,002; S% = - - 2659,002 = 379,857.
Из таблиц находим Fq^sC/i = 8, /2 = 7) = 3,726.
й2 7512 1787
Так как -=^ = = 19,776 > ^о,95 (8; 7) = 3,726, следует признать, что диспер-
Sn 379,857
сия §2 значимо меньше, чем Sf. Следовательно, квадратичная регрессия предпочти-
предпочтительнее линейной и на этом этапе следует принять уравнение регрессии у = —106,569 —
- 24,434 х (ж* - ж*) - 20,86 • (ж* - ж*J.
Выполним теперь вычисления для кубической регрессии:
Ьз = ^ = -*™*± = -0,5558;
Ер|« 858°
г=1
10
Si = Sl - bl • J2 рз (*) = 2659,002 - 0,55582 • 8580 = 8,52297;
г=1
Sl = \ ¦ 8,52297 = 1,42049; || = Щ^~ = 267,5.
s2
Отноюаение -^ существенно превышает критическое значение -Fb,95 (/1 = 7,/2 = 6) =
= 4,20.
Продолж:аем вычисления:
0,420 = _ . 4
2860
5.3] Регрессионный анализ 687
ю -,
S2A = Si - A,468 • 10~4) • J2 pl № = 8,5229; §1 = - • 8,5229 = 1,704.
rp Si 1,42
1огда -=2" = < 1, что означает, что увеличение степени регрессионного полинома
свыше трех не уменьшает, а увеличивает дисперсию регрессии.
Поэтому следует принять в качестве адекватной кубическую регрессионную модель
у = ^106,569 - 24,434 • (ж* - ж*) - 20,86 • (ж* - ж*J - 0,5558 • (ж* - ж*K .
х 11
При переходе к натуральной переменной ж* = — имеем
у = -106,569 - 24,434 • ( — - — - 5,5 J - 20,86 • ( — - — - 5,5 J -
- 0,5558 Л — - М _ 5,5 J = -588,328 + 77,344 • ж - 2,36 • ж2 - 0,0581
Проверяем значимость коэффициентов регрессии.
Для Ь\ имеем / = п — 2 = 8, to,975(8) = 2,31 (см. табл. 118) и
|6i| = 24,434 < 2,31 • . 1 = 2,31 • v ^^1Г~" = 31,17.
ю V330
Следовательно, коэффициент Ь\ незначимо отличается от нуля и линейный член
может быть исключен из уравнения регрессии. Далее для коэффициента &2 имеем
/ = п - 3 = 7, to,97sG) = 2,45 и
= 20,86 > 2,37 .
^
/132
Следовательно, коэффициент регрессии &2 значимо отличается от нуля.
Для Ьз имеем / = п — 4 = 6, to,975F) = 2,45 и
|Ьз| = 0,5558 > 2,45 • V**»523 = Q ?^
л/8580
Следовательно, коэффициент регрессии Ьз так^ке значимо отличается от нуля. Итак,
с учетом значимости коэффициентов регрессии, окончательное уравнение регрессии
будет иметь вид
/т 11 \2 /т 11 \3
у = -106,569 - 20,86 • [ - 5,5 1 - 0,5558 • - 5,5 =
у \2,1 2,1 ' у ' \2,1 2,1 ' )
= 735,518 + 88,852 • ж - 2,36 • ж2 - 0,0581 • ж3.
5.3.4. Выбор наилучшей регрессионной модели по Вильямеу—Клуту
Ранее (см. раздел 5.3.1.3) были рассмотрены методы сравнения регрессий в слу™
чае их одинакового функционального вида и одинаковых независимых переменных.
Рассмотрим теперь задачу сравнения любых двух или более регрессий независимо
от их функционального вида и количества независимых переменных.
Из двух любых регрессий наилучшей признается та, которая имеет меньшую
остаточную сумму квадратов (меньшую дисперсию рассеяния зависимой перемен™
ной вокруг линии регрессии).
Вильяме и Клут [14] для сравнения двух любых регрессий у\ и у2 без трудоем-
трудоемкого предварительного подсчета их остаточных дисперсий предложили критерий,
688 Методы исследования связей между случайными величинами [Гл. 5
основанный на оценке с помощью обычной линейной регрессии углового коэффи™
циента Л линии
2/1+2/2 w ч
У 2 = ^2 ~2/!)'
где у — наблюдаемое значение зависимой переменной; t/i, у2—предсказываемые
сравниваемыми регрессиями значения зависимой переменной.
Значимые отрицательные значения углового коэффициента Л указывают на то,
что регрессия у\ лучше, чем регрессия г/2- Значимые положительные значения Л
указывают на предпочтительность регрессии г/2. Если Л незначимо отличается
от нуля, то модели у\ и у2 признаются равноценными. Значимость отклонения
Л от нуля проверяется методами обычного регрессионного анализа для простой
линейной модели. В этом случае испытываемой линейной регрессионной моделью
является
z = Хх, где 2 = у--B/1+2/2); х = |/2- Ш•
Оценка углового коэффициента линейной регрессии подсчитывается по формуле
(см. раздел 5.3.1.1.1)
\ = ^±
п
г=1
Далее находим
— х) : S\ =
г=1 '" " г=1 ^ж
Тогда, если:
—А < —taS\^ то регрессия г/2 предпочитается регрессии г/i;
А > taS\, то регрессия у\ предпочитается регрессии г/2 5
—t l+g *S*a < А < ti+g Яд, то обе регрессии признаются эквивалентными.
2 2
Здесь ta —а-квантиль распределения Стьюдента с / = п — 2.
Задача 376. Выбрать критерием Вильямса-Клута при доверительной вероятности
а = 0,95 лучшую из двух регрессий
2/2 = 1,61 + 3,99 -ж м 2/1 = 1,24 + 2,81 • ж + 0,2 • ж2
для следующего набора данных:
Хц 2 4 6 9 11 16 17 20 25 31;
ун 9 19 22 41 49 61 69 83 98 128.
Результаты промежуточных расчетов приведены в таблице. Имеем ж* = г/2 г — Уи
_ _ УН + У1г ,
10 10 /10 \2
53 4 = 378,845; ]Г ж*2 = 38861,13893; Р>] ж* = 134523,534;
г=1 г=1 \г=1 /
10 10
J2 zi = ^199,55; J2 х*г ' zi = ^19245,586.
г=1 г=1
10 ¦ (-19345,586) - 378,845 ¦ (-199,55) = = _Q
10 • 38861,13893 - 143523,534 ' ' '
5.8]
Регрессионный анализ
689
2
4
6
9
11
16
17
20
25
30
Уг
9
19
22
41
49
61
69
83
98
128
У2г
9,59
17,57
25,55
37,52
45,50
65,45
69,44
81,41
101,36
125,30
У\г
7,66
15,68
25,30
42,73
56,35
97,40
106,81
137,44
196,49
280,55
У 1г + 2/2 г
2
8,625
16,625
26,425
40,125
50,925
81,425
88,125
109,425
148,925
202,925
У2г У\г
-1,930
-1,890
-0,125
5,210
10,850
31,950
37,370
56,030
95,130
155,250
У И + 2/2 г
*г Уг 2
0,375
2,375
-3,425
0,875
-1,925
-20,425
-19,125
-26,425
-50,925
-74,925
378,845
-193,55
Для а = 0,95 и/ = п-2 = 10-2 = 8из табл. 118 имеем ?0,95(8) = 1,86.
Далее вычисляем
S2X* =
п I
- ж*J = 2647 (Sx* = 51,45);
S2 =
- Х •
(S = 3,205) ;
3,205
= 0,027.
Имеем Л = -0,497 < -?0,э5 • 5Л = -1,86 • 0,0207 = -0,039. Следовательно, линейная
регрессия г/2 предпочтительнее квадратичной у\.
5.3.5. Прогнозирование по регрессии
Имеется регрессия у = /(ж), оцененная по равноотстоящим значениям Х{
(г = 1,2, ..., п). Требуется найти значение зависимой переменной уп+/ при х = жп+|
(I — глубина экстраполяции) и оценить ошибку прогноза. Двусторонний а-довери™
тельный интервал для уп+/ имеет вид [600]
f{xn+i) - t±±as\(n,l) = у^+г ^ уп+г ^ 2/°+г = f{xn+i) -\-ti±as\(n,l),
2 2
где f(xn+i) = yn+i—значение г/, вычисленное по регрессии при ж = xn^i; ta —
«^квантиль распределения Стьюдента при / = п — к — 1 степенях свободы;
S2 = —- ^2[yi — f(%i)} —дисперсия регрессии; к — порядок регрессии; Л —
г=1
коэффициент, зависящий от п и I.
Коэффициент Л(п, I) равен:
— для линейной регрессии
Х(п
¦«-{*
'¦У-
-для квадратичной регрессии
Х(щ1) =
1 +
(n±ff
п (п — 1)
i4 - 2 (п + IJ ]Г i2 + п (п +
690
Методы исследования связей между случайными величинами
[Гл. 5
Для удобства вычислений напомним, что
^ .2 _ п (п + 1) Bтг + 1)
4 * б ;
J2
г=1
п(п + 1) Bп + 1) (Зп2 + Зп - 1)
зо
Задача 377. 17о данным эксперимента:
хц 1 2 3 4 5 6 7 8 9 10;
уц 7 9 10 6 6 -4 -10 -22 -33 -47
найти 95%-й доверительный интервал для у = f(x) при х = 15.
Учитывая, что в нашем случае х% = г, применим непосредственно технику полино-
полиномов Чебышева (см. раздел 5.3.3.2). Результаты вычислений (с применением табл. 237
для Pk(i)) приведены в таблице:
Xi = г
1
2
3
4
5
6
7
8
9
10
Е
Уг
7
9
10
6
2
-4
-10
-22
-33
-47
-82
Mi)
-9
-7
-5
-3
-1
1
3
5
7
9
330
ViPi(i)
-63
^63
-50
-18
-2
-4
-30
-110
-231
-423
-994
P2(i)
6
2
-1
-3
-4
-4
-3
-1
2
6
132
ViP2(i)
63
18
-10
-18
-8
16
30
22
-66
-282
-235
Ps(i)
-42
14
35
31
12
-12
-31
-35
-14
42
8580
УгРз(г)
-294
126
350
186
24
48
310
770
462
-1974
8
18
-22
-17
3
18
18
3
-17
-22
18
2860
ViP^i)
126
-198
-170
18
36
-72
-30
374
726
-846
-36
Вычисляем bo = = —8,2; Ъ\ = ^—^—
= = -3,01.
330
Для линейной регрессии (ж = 5,5 —» у = —8,2 — 3,01 • (ж — 5,5)) находим
2
10
10
= $>?"-• (У>1 =4168-672,4 =
Pt{i) = 3495,6 - 3,0Г • 330 = 505,767; S( =
Вычисляем дальше:
132
52 _ ^i _ 505,767
n- 2
= 63,22.
?2 = ^i2 - Я- Т,р2 @ = 505,767 - 1,782 • 132 = 87,538; S22 = 52 ^ 87'538
п - 3
= 12,505.
Критическое значение .Fo,95(/i = 8; /2 = 7) = 3.
5.3] Регрессионный анализ 691
Так как -^ = —-— = 5,055 > .Fo,95(8;7) = 3,7, следует признать, что квадратичная
регрессия предпочтительнее линейной.
Далее находим
ю
10 о2
Sl=Sl^bl'Yl рз № = 87,538 - (9,32 • 1СГ4) • 8580 = 87,530; S| = -^ = 14,588.
i=l
m So 12,505
Так как -^ = < 1, следует признать, что квадратичная регрессия предпочти-
jSo 14,588
тельнее линейной.
Далее находим
2/ = bo + 6i • (ж — х) + &2 • (х — ж) =
= -8,2 - 3,01 • (х - 5,5) - 1,78 • (х - 5,5J = -45,48 + 16,57 - 1,78 • ж2.
Из уравнения регрессии для жю+5 = х\5 = 15 вычисляем yx=i5 = —197,44.
Ранее мы имели Я| = 15,318 (§2 = 3,913). Далее вычисляем:
^=Ю-11-21 g.= Ю-11-21.C00 + 30-1) =
^Ч 6 ' f-? зо
А(Ю,5) = A + ^ + 25333 45° ' 385 + 5Ов25° }1 = 2,234.
I 385 10 • 25333 - 148225 J
Из табл. 118 находим ti+o,95 (/ = п — к — 1); to,975G) = 2,37 (здесь /г = 2 — степень
полинома). Окончательно получаем искомый доверительный интервал:
-197,44 - 2,37 • 3,913 • 2,234 = -218,158 ^ ух=15 ^ -176,722 = -197,44 + 2,37 • 3,913 • 2,234.
5.3.6. Специальные методы сглаживания экспериментальных данных
Рассмотренные в предыдущих разделах оценки коэффициентов регрессии мето-
методом наименьших квадратов хороши только тогда, когда остатки распределены нор™
мально. Если же это не так, если „хвосты" распределения „тяжелы" или в выборке
присутствуют грубые выбросы, то эти оценки быстро теряют свою эффективность.
В таких ситуациях предпочтительнее использовать иные специальные методы
устойчивой (робастной) регрессии.
Для робастной регрессии оценки уравнения регрессии являются решениями
( \
задачи [620] ^ {Р\Уъ~О'0~ J^ ujXij I = mm, где ц>(е) — функция потерь.
V 3=1 )
Очевидно, что (f{s) = ?2 соответствует обыкновенному методу наименьших ква-
квадратов. В некоторых ситуациях более эффективными могут быть иные функции
потерь:
<р{е) = \е
= \е
— метод наименьших модулей;
^, 1 < I/ < 2 — итеративный метод Форсайта [605];
1 — cosf - I , если е < стг:
Vе/
0, если \е > стг (с = 1,5 или 2,1)
. 1 — cosj - I , если е < стг;
(р(?) = < \су —метод Андрюса.
692 Методы исследования связей между случайными величинами [Гл. 5
По скорости вычислений и простоте использования метод наименьших квадра™
тов — наилучший, однако по точности оценивания регрессии такой вывод сделать
нельзя [527, 603]. Сравнение различных методов оценки регрессии приведено в [601].
Ниже мы рассмотрим некоторые из робастных методов оценки регрессии и другие
специальные приемы сглаживания экспериментальных данных.
5.3.6.1. Метод наименьших модулей
В отличие от метода наименьших квадратов, при котором оценка коэффици-
коэффициентов регрессии ищется из условия минимизации суммы квадратов отклонений
экспериментальных точек от выборочной регрессии, в [604, 606, 607, 609] развит
метод наименьших модулей таких отклонений (МНМ). В соответствии с МНМ оцен-
оценки коэффициентов регрессии ищутся из условия минимизации суммы абсолютных
величин отклонений экспериментальных точек от выборочной регрессии.
Для линейной регрессии у = а + /Зх метод наименьших квадратов соответствует
)
= mm.
условию ^2(yi — ol — /Зх{) = min, а МНМ условию 5 = ^2\yi — а — f3x
Замена квадратов отклонений абсолютными вел ч на in в ряде случаев может
оказаться предпочтительнее. Прежде всего, использование МНМ позволяет осла-
ослабить влияние больших отклонений (в методе наименьших квадратов они возводятся
в квадрат). В случае метода наименьших квадратов прямая регрессии имеет вид
- . ху — ху , ч
У = У + q2 (х-х).
В случае же МНМ уравнение линейной регрессии есть
Л _ xkyi - xiyk Ук - yi
хк - хг хк - xi '
где (хк^Ук) и (%i,yi)—некоторые две выбранные из условия S = min эксперимент
тальные точки.
Задача отыскания минимума является типичной задачей кусочно-выпуклого
линейного программирования. В настоящей работе мы не будем излагать основы
линейного программирования, а любопытного читателя отправим к специальной
литературе, например, [610]. Здесь мы опишем только один простейший алго-
алгоритм решения задачи для случая линейной регрессии, рассмотренный в [606]. Для
последовательности пар (#i,i/i), • • •, (хП1 уп) сначала предполагаем, что регрессия
проходит через последнюю точку (xnj yn). Будем искать к ней пару — точку (ж/, у/),
минимизирующую сумму абсолютных величин отклонений S. Для этого вычислим
(п — 1) угловых коэффициентов
о _ Уп -2/1 о _ Уп -2/2 о _ Уп - Уп^1
Л - т Т15 Р2 - ; •••; Рп^г - —7
J XI Х Х2 L Ь l
и упорядочим их по величине (например, C\ < ^2 < • • • < /3n-i)-
Затем в соответствии с упорядоченным рядом /% выстраиваем знакоперемен-
знакопеременный ряд =Ь(жп — #i), =Ь(жп — Х2), • • •, ±(жп — xn-i) и ищем минимум (по абсолютной
величине) суммы величин i(xn — а^), * = 1, ... ,п — 1, с одной переменой знака
в последовательности, выбирая соответствующим образом знаки у суммируемых
величин (у первой величины всегда выбираем +). Фиксируем номера величин /%
и А+ъ меж:ду которыми происходит перемена знака у суммы знаменателей пары
(xi,yi). Если сумма величин ±(жп^з^) отрицательна, то в качестве пары к последней
точке (хП1 Уп) берется точка (ж|, г//), соответствующая угловому коэффициенту A+i,
если сумма полож:ительна, то точка, соответствующая /3{. Если сумма равна нулю,
то берется любая точка ft ^ /3 ^ ft+i-
5.3] Регрессионный анализ 693
На втором этапе считаем, что прямая регрессии проходит через точку (ж/,у/),
и в соответствии с описанным алгоритмом ищем пару к ней. Перебор продолжается
до тех пор, пока не будет получена уже найденная однажды точка. Тогда она
и предпоследняя найденная являются теми двумя точками, через которые проходит
искомая прямая регрессии. Аналитическое описание алгоритма весвма усложнено,
поэтому дадим пояснение его реализации на количественном примере. Напомним
пользователю, что задачи в предлагаемой книге — это не только иллюстрации к из-
изложенному, но и способ пояснения методов и приемов, изложение которых иным
способом слишком громоздко.
Следует отметить, что методы статистического анализа уравнений МНМ-регрес™
сий отсутствуют. Если для способа наименьших квадратов изучены распределения
параметров регрессии и их основные статистические свойства, что, собственно,
и позволяет выполнить необходимый статистический анализ, то для МНМ эти рас-
распределения неизвестны. Поэтому ничего нельзя сказать о статистических свойствах
регрессии, полученной МНМ-методом. Это является существенным недостатком
МНМ-метода, ограничивающим его применение в статистической практике.
Задача 378. Для набора данных:
хц 1 2 3 4 5;
у С 38 24 31 39 48
найти прямую регрессии методом наименьших модулей.
Выбираем в качестве начальной точки последнюю точку с координатами (ж = 5,
у = 48). Вычисляем угловые коэффициенты
48-38 ^ 48-24 ^ 48-31 „ 48-39
А = ——г = 2,5; /32 = ——- =8; /33 = ——- = 8,5; /34 = ——Г = 9'
5—1 5—2 5—3 5—4
Ранжируя полученные значения /3i по возрастанию, получаем знакопеременный ряд
для знаменателей ±4, ±3, ±2, ±1. Его минимальная (по абсолютной величине) сумма
равна +4 — 3 — 2 — 1 = — 2. Перемена знака происходит между j3\ и Д, а так как сумма
отрицательна, то выбираем /З2, т.е. в пару к последней точке E,48) берем пару, соответ™
ствующую 02 —это точка B, 24).
Далее, предполагая, что регрессия проходит через точку B, 24), подбираем пару к ней.
Имеем
38-24 „ 31-24 „ 39-24 „ 48-24
^ 14 * 7 ^ 75 ^ 8
Ранжированием по возрастанию полученного ряда Д приходим к знакопеременному
ряду знаменателей ±1, ±1, ±2, ±3, минимальная сумма которого равна +1+1+2—3=
= +1. Перемена знака в сумме происходит между /Зз и /З4.
Так как сумма положительна, выбираем /Зз и соответствующую точку с координатами
х = 4 и у = 39. Для этой точки имеем ряд /3i
39-38 1 „ 39-24 ^ 39-31 „ 39-48
Для ранжированного по возрастанию ряда /3i получаем знакопеременный ряд ±3, ±2,
=Ы, ±1, для которого наименьшая сумма равна +3 — 2 — 1 — 1 = —1.
Перемена знака происходит между /3\ и 02, и, так как сумма отрицательна, то
выбираем 02 и точку с координатами B,24), но эта точка уже встречалась. Следова-
Следовательно, искомая прямая проходит через две точки — предыдущую D, 39) и полученную
повторением B,24). Отсюда имеем Xk =4, г/д. = 39 и х\ = 2, у\ = 24. Тогда уравнение
прямой регрессии имеет вид
4-24-2-39 39-24 Л
У = 13^ + ^Т^ • я = 9 + 7,5 . я,
694 Методы исследования связей между случайными величинами [Гл. 5
Для нее сумма модулей отклонений от экспериментальных точек равна
5
yi - 9 - 7,5 • х\ = |38 - 9 - 7,5| + |24 - 9 - 7,5 • 2| + ... + [48 - 9 - 7,5 • 5| = 23,5
Для примера: прямая регрессии, полученная методом наименьших квадратов, была
бы у = 25,5 + 3,5 • ж, и для нее
5
J2\Vi - 25,5 - 3,5жг| = |38 - 25,5 - 3,5| + ... + |48 - 25,5 - 17,5| = 36.
г=1
Суммы квадратов отклонений равны
5 5
J2(Vi - 9 - 7'5 • xif = 464,75, и ^2(yi - 25,5 - 3,5 • Xif = 311,5,
г=1 г=1
что соответствует назначению обеих оценок регрессии.
5.3.6.2. Метод последней точки
В ряде задач, в основном связанных с прогнозами в экономике, для линии
регрессии важно получить наибольшее приближение к последним точкам, что
позволяет использовать ее с большей эффективностью для прогноза последующего
поведения изучаемого процесса.
В [606] рассмотрен метод последней точки, когда уравнение прямой регрессии
принудительно приводится в последнюю точку (хП1 уп) за счет некоторого увеличе-
увеличения остаточной дисперсии регрессии. При этом надежда возлагается на то, что
увеличение остаточной дисперсии будет скомпенсировано повышением точности
прогноза в области последней точки. Уравнение регрессии для метода последней
точки имеет вид [606]
^2 Xi ~ ПХп
*=1
У =
Следует отметить, что метод последней точки может быть эффективно ис-
использован совместно с методом наименьших модулей (см. раздел 5.3.6.1). Тогда,
выбрав последнюю точку (жп, уп) в качестве начальной, методами МНМ к ней ищут
оптимальную пару.
Задача 379. Для данных задачи 378 найти прямую регрессии методом последней
точки.
5 / 5 \2
Имеем хп = 5; уп = 48; ]Р хъ = 15; ]Р Vi = 180; ?>г = 225.
г=1 г=1 \г=1 /
Получаем
32 • 150 - 5 ¦ 44 • 32 - 5 ¦ 12 • 150 + 25 ¦ 12 • 44 ,
у = 44 Н • (ж - 12) = 14 + 2,5 • ж.
У 1024 - 2 ¦ 5 • 12 ¦ 32 + 25 ¦ 144 v ; '
5.3.6.3. Метод однозначной аппроксимации
Рассмотренные ранее методы регрессионного анализа на основе принципа наи-
наименьших квадратов не позволяют получить обратимые уравнения регрессии, т. е.
совокупность экспериментальных точек (ж, у) не аппроксимируется однозначно.
5.8]
Регрессионный анализ
695
Регрессии у по х и х по у для одного и того же набора экспериментальных данных
не совпадают.
В [608] рассмотрен метод однозначной аппроксимации, основанный на миними-
минимизации суммы площадей:
S = Е S? = Ё {Уг - Я**)] [*i - ГЧуг)]
где Xi,yi—координаты г-й экспериментальной точки; f(x)—искомая функция;
f~1{x)—функция, обратная к функции f(x).
Для модели у = а-\- /Зх оценки коэффициентов а и C находятся из условия
(
В соответствии с [608] оценки а и /3, удовлетворяющие сформулированным
требованиям, равны соответственно
Ь = ±
а = у — Ъх
(знак + или — выбирается исходя из знака корреляции между переменными у и х).
При оценке коэффициентов по методу однозначной аппроксимации регрессии
у по х и х по у совпадают.
В [602] рассмотрена модификация метода однозначной аппроксимации, пред™
полагающая минимизацию суммы квадратов расстояний от экспериментальных
точек до искомой прямой (ортогональная регрессия). Для случая ортогональной
регрессии оценки равны
Ъ =
г=1 г=1 г=1
л
= ; а = |/ — 6ж.
nGSxSy (SI - SI) + 4 In
тг п
г=1 г=1
Коэффициенты уравнения ортогональной регрессии зависят от масштаба пере-
переменных, в то время как для обычной регрессии и метода однозначной аппрокси-
аппроксимации такая зависимость отсутствует. Корректное обобщение метода однозначной
аппроксимации (и ортогональной регрессии) приведено в работе [638], содержащей
исследование уравнения регрессии в форме нормального уравнения прямой.
Задача 380. Для набора данных (п = 10):
хц 2 4 5 7 6 9 14 21 32 29;
2/»: 8 15 14 16 18 25 31 50 65 61
найти оценки коэффициентов регресии методом однозначной аппроксимации.
Имеем
10 1 10 / 10 \ 10
]Гз^ = 303; х = - • ^ ж» = 30,3; МР хЛ =91809; ]Г х\ = 13097;
*=1 П г=1 \г=1 / г=1
696 Методы исследования связей между случайными величинами [Гл. 5
ю -.ю / ю \ 2 ю
^ = 129; t/ = — • 22 У* = 1^,9; I zJ 2/г I = 16641; ]>J уг = 2713;
г=1 П г=1 \г=1 / г=1
10 -I 10
Y*Xi-yi = 5924; S2X = • У4ж» - жJ = 435,122 (Яж = 20,86);
S2 = ^^ • Y^(yi - yf = 116,54 (Sy = 10,79);
Вычисляем оценки методом однозначной аппроксимации (выбираем знак +, так как
корреляция между у и х положительна)
i_
= 0,517; а = у - Ьх = 12,9 - 0,517 • 30,3 = -2,765.
Следовательно, получаем уравнение регрессии у = ^2,765 + 0,517 • х. Из него можно
непосредственно получить уравнение регрессии х по у: х = 5,348 + 1,934 • у.
Оценки уравнения регрессии у по ж, полученные методом наименьших квадратов
(см. раздел 5.3.1.1.1), привели бы к уравнению у = ^2,701 + 0,515ж.
Легко видеть, что оценки методом однозначной аппроксимации достаточно близки к
оценкам наименьших квадратов.
5.3.6.4. Метод обратных разделенных разностей
Метод предложен в [637]. Его авторы предлагают искать математическую мо-
модель регрессии в классе цепных дробей
Однако приведенные авторами работы [637] численные эксперименты не позво™
ляют сделать вывод о предпочтительности этого метода по сравнению с класси™
ческим методом наименьших квадратов. По крайней мере, возможный выигрыш
в частных задачах никоим образом не компенсируется резко возрастающей слож-
сложностью расчетов.
5.3.6.5. Метод условно-относительных разностей
Завершая настоящий раздел достаточно „экзотичных" методов получения эм™
пирических зависимостей, дополним его кратким указанием на еще один метод,
предложенный недавно — метод условно-относительных разностей [635, 636]. Этот
метод предполагает минимизацию не суммы квадратов вида ^^[уг ~~ f(xi)] =
а квадратов относительных разностей
Естественно, что применение метода условно-относительных разностей обес-
обеспечивает повышение точности аппроксимации в области малых значений г/^, но
снижает ее в области больших значений у^.
Имея некоторые преимущества при решении частных задач, этот метод, в силу
вычислительной сложности и неясности статистических свойств оценок такого вида,
вряд ли может быть рекомендован для широкого применения.
5.4] Контрольные карты 697
5.4. Контрольные карты
Этот раздел обращен прежде всего к инженерам и специалистам производства,
для которых контроль качества создаваемой ими продукции — один из важнейших
заключительных этапов длительного цикла изготовления изделия.
Совокупность контролируемых показателей качества изделия представляется,
если отвлечься от их физической природы, потоком случайных величин, в непре-
непрерывно меняющемся хаосе которого контролер должен своевременно рассмотреть
тревожные симптомы ухудшения качества изделия или признаки нарушения тех-
технологического процесса его изготовления.
Ознакомившись с предыдущими разделами книги, читатель справедливо мо-
жет заключить, что мы рассмотрели столько всевозможных методов сравнения
случайных совокупностей, обнаружения тренда и всего другого, что этого должно
быть вполне достаточно для решения любых задач, в том числе и задач контроля
качества производства. Он будет по сути прав.
Контрольные карты — это прежде всего самая распространенная форма приме™
нения статистики в производстве. Сегодня статистические карты контроля каче-
качества стали настолько общепринятыми, что любая достаточно большая фирма, не
пользующаяся ими в том или ином виде, оказывается в невыгодном положении по
сравнению с конкурентами.
Идея контрольной карты состоит в следующем. Делается предположение о рас-
распределении совокупности или выборочных статистик совокупности. Отбираются
независимые случайные повторные выборки из текущей продукции. Подсчитывав
ются и наносятся на специально подготовленную контрольную карту выборочные
значения контролируемых статистик вместе с дву- или односторонними (в за-
зависимости от специфики контроля) доверительными интервалами. Если текущие
измерения показателей качества продукции находятся внутри доверительного ин-
интервала— процесс производства статистически управляем, качество продукции на-
находится в допустимых пределах; если нет — требуется регулирующее вмешательство
в производственный процесс.
По сути метод контрольных карт — это многократное повторение во времени
метода доверительных интервалов, но в отличие от него он более динамичен.
Динамичность контрольных карт дает возможность фиксировать, когда и где
наблюдаемые величины выходят за рамки случайных колебаний, указывая на необ-
необходимость регулирования технологического процесса.
Техника контрольных карт, организация их внедрения достаточно широко осве-
освещены в литературе [14, 22, 97, 611]. Мы приведем краткие математические и та-
табличные описания наиболее распространенных методов, которые могут служить
кратким введением для инженера или специалиста, не знакомившегося ранее с ни-
ними, и позволят применять их в своей практике.
5.4.1. Контрольные карты Шухарта
Первые контрольные карты предложены Шухартом [612] в 1931 г. Он предложил
состав таких карт, технологию их составления, методы расчета и правила пользо-
пользования.
Контрольные карты можно рассматривать как многократное применение кри-
критерия значимости. Суть контрольных карт состоит в следующем. На карту нано-
наносятся контрольные границы параметра, соответствующие выбранной достоверно-
достоверности контроля. Затем на карту наносятся выборочные значения контролируемого
параметра. Если его положение выходит за контрольные границы — это сигнал
к необходимости вмешательства в процесс.
698
Методы исследования связей между случайными величинами
[Гл. 5
5.4.1.1. х- и Л-карты
Предположим, что в последовательно контролируемых выборках объема п из-
измеряется некоторая характеристика изделия — х. В каждой выборке вычисляется
среднее значение контролируемого признака х и его размах R = жтах — xmin. Обо™
значим их для г-й выборки через Х{ и Щ. В ж™карте контрольные границы для
среднего при достоверности а = 0,997 будут
хш = х — AR (нижняя граница);
- AR (верхняя граница),
где х = — J^ X{ — среднее по к текущим выборка]
мах по к текущим выборкам; А — коэффициент, с
в табл. 238.
1 _
ц — средний раз™
которого приведены
Таблица 238
Коэффициенты для вычисления
границ регулирования контрольных карт Шухарта [1]
Объем
выборки, п
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
ж-карта
А
1,880
1,023
0,729
0,577
0,483
0,419
0,373
0,337
0,308
0,285
0,266
0,249
0,235
0,223
0,212
0,203
0,194
0,187
0,180
0,173
0,167
0,162
0,157
0,153
jR-карта
Вг
0
0
0
0
0
0,076
0,136
0,184
0,223
0,256
0,284
0,308
0,329
0,348
0,364
0,379
0,392
0,404
0,414
0,425
0,434
0,443
0,452
0,459
D2
3,267
2,575
2,282
2,115
2,004
1,924
1,864
1,816
1,777
1,744
1,716
1,692
1,671
1,652
1,636
1,621
1,608
1,596
1,586
1,575
1,566
1,557
1,548
1,541
S- карта
Вг
0
0
0
0
0,085
0,158
0,215
0,262
0,302
0,336
0,365
0,392
0,414
0,434
0,454
0,469
0,486
0,500
0,513
0,525
0,536
0,546
0,556
0,566
в2
2,298
2,111
1,982
1?889
1,817
1,762
1,715
1,676
1,644
1,616
1,589
1,568
1,548
1,530
1,514
1,499
1,486
1,472
1,461
1,451
1,440
1,432
1,422
1,414
С
0,798
0,886
0,921
0,940
0,951
0,960
0,965
0,969
0,973
0,976
0,977
0,980
0,981
0,982
0,984
0,984
0,986
0,986
0,987
0,988
0,988
0,989
0,989
0,990
Для Д-карты средним уровнем (центральным) является R, нижние и верхние
границы регулирования равны соответственно
где D\ и D2—коэффициенты, приведенные в табл. 238.
5.4]
Контрольные карты
699
Задача 381. В результате контроля 25 выборок изделий, при объеме каждой выборки
п = 5, получены следующие значения контролируемого параметра х:
Номер
выборки г
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Выборочные значения Xij
Х\
1
-2
0
1
2
2
-2
1
0
-1
1
2
0
0
-3
0
3
-1
0
0
2
0
3
1
-1
х2
-1
0
0
2
1
-1
-1
1
-2
-1
-1
2
-2
-1
0
-1
1
-2
0
-5
-1
0
1
-3
0
^2
^2
1
-1
-1
2
0
0
1
0
2
-1
2
1
0
0
-3
-1
0
2
-1
-3
4
0
1
2
2
-1
2
1
-1
-2
1
-1
^2
-1
-1
-2
-1
0
1
^2
-1
1
2
0
2
-2
1
0
0
0
3
^2
0
0
0
-1
4
1
0
0
0
2
-1
2
0
0
1
0
0
-3
-1
-1
1
Статистики
Щ
0,0
-0,4
0,6
0,4
0,6
0,4
-1,0
0,4
0,4
-0,6
0,2
0,4
-0,4
0,2
-0,8
0,4
-0,2
-1,0
0,4
-0,2
0,4
-0,8
1,0
-0,4
0,2
R%
4
4
4
4
3
3
2
2
6
3
3
3
4
3
3
3
6
2
1
7
3
5
6
4
2
2,5
2,8
2,3
3,3
1,3
2,3
1,0
0,8
5,3
1,3
1,7
2,3
2,8
1,7
1,7
1,3
5,7
0,5
0,3
8,2
1,3
4,7
6,5
2,8
0,4
Si
1,58
1,67
1,52
1,82
1,14
1,52
1,00
0,89
2,30
1,14
1,30
1,52
1,67
1,30
1,30
1,14
2,39
0,71
0,55
2,86
1,14
2,17
2,55
1,67
0,63
Вычислить границы для контрольных х- и R-карт Шухарта (к = 25).
Имеем х = —
^=0,008;Д=1.
90
25
Контрольные границы для среднего (для п = 5 из табл. 238 находим А = 0,577) будут
равны
хш=й-А-Я = 0,008 - 0,577 • 3,60 = -2,069;
жв = х + А • R = 0,008 + 0,577 • 3,60 = 2,085.
Мы видим, что нигде х% не вышли за контрольные границы.
Теперь для Д-карты из табл. 238 имеем D\ = 0 и D^ = 2,115.
Тогда Ra = 0 и RB = 2,115 • 3,60 = 7,61. Видим, что ни одно значение Ri не выходит
за эти пределы, т. е. процесс статистически управляем.
х- и R-карты Шухарта рекомендуется применять при п < 10 -f- 20.
5.4.1.2. s-карта
s-карта для выборочного контроля среднего квадратичного отклонения более
чувствительна к изменению рассеяния, чем Декарта. Алгоритм построения и ис™
пользования s-карты состоит в следующем. По текущим к выборкам вычисляется
оценка дисперсии контролируемого признака
где
- \2
х)
3=1
700
Методы исследования связей между случайными величинами
[Гл. 5
Если объемы выборок щ одинаковы, то s2 = 7
f. Центральная линия s-
1=1
карты равна s4 = Cs, а границы зоны регулирования равны sH = B\s и sB =
где Bi, B2 и С — коэффициенты, приведенные в табл. 238.
Задача 382. Для данных задачи 381 построить контрольные границы S-карты Шу-
харта.
л 25
Имеем s2 = — • V" S1 = 2,592 (s = 1,610).
25 ^ V ;
Следовательно, для контрольных границ имеем s4 = 0,940 • 1,610 = 1,513;
sH = 0 • 1,610 = 0; sB = 1,889-1,610 = 3,041 (предварительно из табл.238 для п = 5
получили С = 0,940, Вг = 0 и В2 = 1,889).
Видим, что из всех выборок только Si в 20~й выборке близко к sB = 3,04 (впрочем, то
же самое было и для R-карты).
5.4.1.3. ж- и s-карты для выборок неравного объема
Пусть имеем к выборок объемами щ (г = 1, 2, ..., к). Если объемы выборок не
равны между собой, то, естественно, границы регулирования х- и s-карт будут
меняться от выборки к выборке. В этом случае следует поступать следующим
образом. По всем выборкам находим
к к ni k
х =
к
\ п-
i=l
к
\™^ п-
/ v %
г=1
И S =
Для ж^карты имеем
хц = х — центральная линия; хш = х — AiS — нижняя граница;
хв = х + AiS — верхняя граница;
для s-карты имеем
5Ц = CiS — центральная линия; sH = Вцв — нижняя граница;
5В = B2iS — верхняя граница.
Здесь С^, Вц, B2i —коэффициенты из табл. 238, определяемые для объема каждой
выборки; Ai — коэффициенты, приведенные в табл. 239.
Таблица 239
Значения коэффициентов Ai для ж-карт
Щухарта при неравных объемах
контролируемых выборок
щ
2
3
4
5
6
7
8
9
Ai
2,121
15732
1,500
1,342
1,225
1,134
1,061
1,000
щ
10
11
12
13
14
15
16
17
Аг
0,949
0,905
0,866
0,832
0,802
0,775
0,750
0,728
щ
18
19
20
21
22
23
24
25
Ai
0,770
0,688
0,671
0,655
0,640
0,626
0,612
0,600
5.4]
Контрольные карты
701
Задача 383. В результате контроля получены результаты измерений парамет-
параметра х (средние значения и дисперсии, полученные в результате контроля в выборках
разного объема^ приведены в таблице). Необходимо найти контрольные границы для
х~ и s-карт.
Номер
выборки, г
1
2
3
4
5
6
7
8
9
10
Объем
выборки, щ
8
10
12
7
10
6
8
6
5
12
ж-карта
Xi
1356
1380
1448
1358
1372
1430
1356
1426
1444
1404
si
1281
2570
1901
1384
1430
1672
1354
643
3418
1608
35,8 1353
50,7 | 1357,6
43,6 | 1361
37,2 | 1350
37,8 | 1357,6
40,9 | 1346,3
36,8 | 1353
25,3 | 1346,3
58,5 | 1341,5
40,1 | 1361
Xni
1440
1435.4
1432
1443
1435.4
1446.7
1440
1446л
1451.5
1432
s- карта
39.55
39.88
40,05
40.57
40.21
40,25
40.33
40,33
40,42
40,42
Sni
8.18
12.38
14.96
16.07
16.97
17,79
18.61
19.22
19,92
20,49
SBi
70,30
67.39
65» 13
64.27
63.45
62.71
62.06
61.44
60.91
60,34
Для ж-карты имеем среднюю линию
X] Щ • Xi 8 ¦ 1356 + 10 ¦ 1380 + ... + 12 • 1404
Хи =
¦ 10 + ... + 12
= 1396,5.
Коэффициенты А% определяются для каждой выборки по табл. 239. Например, для
первой выборки имеем п\ = 8 и А\ = 1,061, для второй выборки п<2 = 10 и А2 = 0,949,
и т.д.
Находим оценку средней дисперсии
ЕК -1) ¦
= 1680,4 (Я = 40,99).
Тогда для первой выборки имеем
Жн1 = й-A-L-s = 1396,5-1,061-40,99 = 1353; хв1 = Ш+Аг-s = 1396,5+1,061-40,99 = 1440.
Полученные по аналогии результаты для других объемов выборок приведены в таблице.
Для расчета средней линии и контрольных границ s-карты пользуемся коэффициен-
коэффициентами Сг, Вц и B^i из табл. 238, взятыми для соответствующих объемов выборок щ.
Например, для первой выборки имеем щ = 8, С\ = 0,965, Вц = 0,215 и В21 = 1,75.
Следовательно, средняя линия равна
5Ц1 = Сг • s = 0,965 • 40,99 = 39,55,
а границы регулирования равны:
sHi =Bu-s = 0,215 • 40,99 = 8,18; sBl = B2i • s = 1,715 • 40,99 = 70,30.
Вычисленные по аналогии значения Лщ, sH« и sBi для остальных выборок приведены
в таблице.
Из анализа видно, что среднее значение в третьей выборке выходит за границы регу-
регулирования, а все стандартные отклонения находятся в пределах границ регулирования.
5.4.1.4. Контрольная карта для доли дефектных изделий (р-карта)
Предположим, наблюдается к выборок объемами тц, причем в г-й выборке
фиксируется ТП{ дефектных изделий A ^ г ^ к). Оценкой доли дефектных изделий
в г-ж выборке является величина pi = —.
П
702
Методы исследования связей между случайными величинами
[Гл. 5
Оценка среднего значения доли дефектных изделий р =
является цен™
тральной линией р-карты. Границы регулирования определяются формулами
Если все значения щ отличаются друг от друга незначительно, то используется
единая пара контрольных границ
1 1
п, .,. ,- , \n[l-V]> ¦ ГД6 П=1
'}*'
где гс=-
Задача 384. В результате контроля различных партий получены результаты, при-
приведенные в таблице. Найти границы регулирования р~карты.
Номер
партии, г
1
2
3
4
5
6
7
8
9
10
Объем
выборки, щ
981
1422
1174
1524
1353
847
1535
1248
1296
985
Число
дефектов, rrii
27
87
87
76
80
25
37
19
49
42
Доля
дефектных
изделий, pi
0,028
0,061
0,074
0,050
0,059
0,030
0,024
0,015
0,038
0,043
Границы регу-
регулирования
Рт
3,0234
3,0449
),0568
3,0344
3,0425
¦),0091
3,0085
31H22
"),0211
3,0236
Рвг
13,13622
0,0771
0,0917
13,13655
0,0755
0,0509
0,0395
01K22
0,0549
0,0623
Имеем оценку средней доли дефектных изделий
ю
i=i l
27 + 87 + 87 + ... + 42
981 + 1422 + ... + 985
= 0,0428.
Далее, для каждой выборки вычисляется граница регулирования pMi и pBi. Например,
для г = 1 имеем п\ = 981 и
Рн1 = 0,0428 - 3
рв2 = 0,0428 + 3 •
0^28.A-0,0428) | \
}l
981
= 0,0622.
Рассчитанные по аналогии величины для остальных выборок приведены в таблице,
из которой видно, что доли дефектных изделий во всех выборках находятся в пределах
границ регулирования.
5.4]
Контрольные карты
703
5.4.1.5. Контрольная граница числа дефектов (с-карта)
В серии последовательных выборок фиксируются количества дефектных из-
изделий С{. Контрольная карта для регулирования процесса по числу дефектных
изделий включает в себя:
к
1
центральную линию сц = с = —
— нижнюю границу регулирования сп = с — 3-у/с;
— верхнюю границу регулирования св = с-\- 3-\/с.
Рекомендуется при объеме выборок п ^ 30.
Задача 385. Для данных задачи 384 вычислить параметры с~карты.
с* = 52,9; сн = 52,9-3-^52^) = 31,08; св = 52,9 + 3-^52^=74,72.
Имеем с = — • ^
10 '
Видим, что процесс находится в контролируемом состоянии.
5.4.1.6. Карты индивидуальных значений и скользящего размаха
Карты этого типа используются для контроля индивидуальных значений пара-
параметра х и их колеблемости.
Пусть Xi — г-е текущее значение контролируемого параметра, a Ri = \xi-i — Xi\
(г > 1) — абсолютная величина разностей последовательных пар значений х. Кон™
троль значений Х{ и Ri выполняется с помощью карты скользящего размаха.
Абсолютные значения разностей \xi-i ~~ Xi\ можно рассматривать как размахи
последовательных выборок объема п = 2.
Центральной линией карты Xi является величина
ее нижние и верхние границы равны соответственно
хш = х - 2,59675Й; хв = х + 2,5967511
Для R имеем центральную линию Нц = R =
нияснюю границу
г=1
Rn = 0 и верхнюю границу RB = 3,267Й.
Карты индивидуальных значений (з^~карты) и скользящего размаха (i^-карты)
наиболее удобны в тех случаях, когда наблюдения берутся через большие проме™
ясутки времени. Особенно это важно для изделий, выпускаемых штучно, из которых
формирование контролируемых выборок затруднено.
Задача 386. В результате контроля параметра Х{ десяти изделий получены резуль-
результаты, приведенные в таблице. Найти параметры Xi- и Ri-карт и проверить по ним
стабильность параметра изделия.
Номер
изделия, г
1
2
3
4
5
Значение
параметра, Х{
20,1
19,4
18,2
27,4
17,1
Скользящий
размах
Ri = Xi-i — Xi
0,7
1,2
4,2
5,3
Номер
изделия, г
6
7
8
9
10
Значение
параметра, х^
15,1
21,2
24,3
25,1
20,0
Скользящий
размах
Ri = Xi-i - Xi
2,0
6,1
3,1
0,8
5,1
704 Методы исследования связей между случайными величинами [Гл. 5
Находим
х = - • V Xi = — • 202,9 = 20.29: R = - • Y" R{ = — = 3,167.
я g 10 9 ^ 9
Для жi-карты имеем
Жц = § = 20,29; жн = I - 2,6596 • Л = 20,29 - 2,6596 • 3,167 = 11,867;
хв = Ш + 2,6596 • R = 20,29 + 2,6596 • 3,167 = 28,172.
Видим, что все индивидуальные значения Xi находятся в поле регулируемого состо-
состояния.
Для Ri-карты получаем (из таблицы имеем R4 = R = 3,167): RM = 0 и RB = 3,267 х
х 3,167 = 10,346. Ни одно из текущих значений Ri не выходит за пределы зоны
регулируемого состояния.
5.4.2. Контрольные карты накопленных сумм (ККНС)
Контрольные карты накопленных сумм получили широкое применение в послед™
ние 30 лет. Карты этого типа более чувствительны, чем карты Шухарта, к скачко-
скачкообразным изменениям параметров. Теория и практика применения ККНС рассмо-
рассмотрены в [613-615].
Техника ККНС по существу является реализацией последовательной выбороч-
выборочной процедуры. Если в рассмотренных выше картах Шухарта на них наносятся
точки, соответствующие отдельным наблюдениям, то точки, наносимые на ККНС,
не соответствуют отдельным наблюдениям, вычисленным по одной выборке. Все
они, начиная с исходного, дают информацию о наблюдениях от первого до послед-
последнего. В ККНС рассматриваемая точка равняется значению текущего наблюдения
плюс значение некоторой статистики, вычисленной по предшествующей выборке.
Рассмотрим алгоритм формирования ККНС и принятия решения с их помощью.
Через yi будем обозначать значение контролируемого параметра в г-й выборке,
а через Щ —нижние (верхние) контрольные границы, с которыми сравнивается
полученное значение у^.
В отличие от карт Шухарта контролируемый параметр yi является суммой всех
предыдущих наблюдений, а контрольные границы у^ меняются с каждым вновь
полученным наблюдением. Контрольные границы являются линейной функцией
каждого наблюдения, т. е.
?QB' = аш =р Ьг, г = 1, ..., га, где ат = уш =Ь Ь(т + d).
Таким образом, для каждой новой га-й выборки находятся параметры ат и Ь
контрольных границ, с которыми сравниваются все предыдущие значения у±
(г = 1, ..., га — 1) контролируемого параметра.
Если контролируется нижнее значение параметра (т. е. требуется, чтобы хп ^ /л,
где /л — нормативное значение параметра), то используется контрольная граница
Ут = ат - hi = Ут + Ь (ш + d) - Ы
(хп — некоторый контролируемый параметр, например, среднее или дисперсия).
Если при любом г = 1, ..., га — 1 будет наблюдаться неравенство у^ > у^, то
в точке га следует признать значимый сдвиг вниз контролируемого параметра. По
аналогии для контроля верхнего значения (т. е. требуется, чтобы хп ^ /л) использу-
используется неравенство у± < у^ = ут — Ъ (га + d) + Ы (тогда в га-й выборке фиксируется
значимый сдвиг контролируемого параметра вверх).
В случае двустороннего контроля (т. е. когда необходимо фиксировать хп = /л)
используется интервальная оценка у^ < у{ < у^.
5.4] Контрольные карты 705
Если неравенство удовлетворяется, то равенство хп = /л не отклоняется, если
нет — фиксируется значимый сдвиг параметра либо вверх, либо вниз. Параметр Ъ
в уравнении для ут определяется минимальным сдвигом параметра, который дол™
ясен быть выявлен в процессе контроля, и масштабным коэффициентом Aj, равным
отношению числа единиц ординаты ^, приходящихся на единицу абсциссы Х{.
Параметр d определяется выбранным значением ошибки первого рода а (веро-
ятностью отвергнуть правильную гипотезу), а также разбросом значений контроли-
контролируемого параметра хп (при этом предполагается, что ошибка второго рода /3 < 0,01,
т. е. мощность процедуры A — /3) > 0,99). Подробнее технику ККНС продемонстри-
продемонстрируем на примерах конкретных контрольных карт.
5.4.2.1. ККНС для среднего значения
Пусть Xi—среднее г-й выборки объема п. Величиной, подлежащей контролю,
является накопленная сумма
Уг = —
где /л — нормативное значение контролируемого параметра и % — стандартное от-
отклонение среднего. Обычно рекомендуется выполнить оценку % по первым т
выборкам
d = —2 ^па5 гДе ^ = —' а — ошибка первого рода.
S S
п — объем выборки (предполагается, что все выборки равного объема п). Если
тп(п ~~ 1) > 30 ^ 40, то оценка достаточно точна.
Величина D = A/i определяется минимальным недопустимым сдвигом сред-
среднего относительно нормативного значения /л. Параметры Ъ и d равны: Ъ = —,
2 , D
Если производится односторонний контроль (т. е. контроль того факта, что х > /л
или х < /i), то используется значение а. Если контролируется уход среднего в лю-
любую сторону (т. е. контроль того, что х Ф //), то вместо а используется величина 2а.
Таким образом, контрольные границы, полученные после появления га-й выбор-
выборки равны
— для одностороннего контроля
~н- D ( 2 \ D ' " - 1
т т 2 ^ E2/2'
~в _ ^^ 2 I А ^ • • _ 1 о
2/m "~ 2^w о" 1Т7г^72'^11а) "I" "^"г5 г — 1, 2, ..., ??г — 1;
— для двустороннего контроля
Если для некоторого значения yi имеет место одно из неравенств yi > у^;
У г < Ут") Ут < У г ^ ^т? ТО в выборке с номером тп признается соответственно сдвиг
среднего значения вниз, вверх или в любую сторону с вероятностью 1 — а.
Легко видеть, что сдвиг в каждой zz-й выборке контролируется вычислением
~н(в)
по полученному значению yv новых контрольных границ yv и сравнением их
с ранее полученными значениями ^, г < v. Легче всего, естественно, использовать
23 А. И. Кобзарь
706
Методы исследования связей между случайными величинами
[Гл. 5
специальные шаблоны [14, 97], которые позволяют избежать вычислений. Мы же
поясним технику применения ККНС для среднего на конкретном примере.
Задача 387. По данным, приведенным в таблице, найти параметры для ККНС сред-
среднего и проверить стабильность среднего по отношению к нормативному значению
\i = 27, полагая, что недопустимым является отклонение D = А/л = 5 единиц. При-
Принять а = 0.1 и п = 5.
Номер
выборки, i
1
2
3
4
5
Xi
25
36
21
9
31
л
2,4
6,1
4,2
3,8
2,9
Уг
-1,04
3,65
0,52
1,56
2,65
Номер
выборки, г
6
7
8
9
10
Xi
34
16
28
30
24
л
si
3,2
2,1
4,1
4,2
Q Q
О,О
Уг
7,30
1,56
2,08
3,65
2,08
Имеем т = 10 и находим s% = — • ]Р S% = 3,68 (s& = 1,918).
Имеем Ь = D/2 = 5/2 = 2,5. Далее рассмотрим задачу одностороннего контроля ниж-
нижнего значения х% (т. е. контролем должен быть выявлен факт снижения х по сравнению
с /л = 27 более, чем на 5 единиц).
Имеем 5 = — = 2,607; d = —~ • In а = =¦ * 1п0Д = 0,677.
sx <Г 2,6072
Тогда для контроля некоторой j-ш (j = 2,3, ...) выборки имеем порождаемые ею
верхние контрольные границы для г = 1, ..., j — 1 предыдущих значений yi:
В нашем случае они равны
j = 2(i = 1): yf = 3,65 + 2,5 • B + 0,677) - 2,5 • г = 10,34 - 2,5 • г;
yf = 0,52 + 2,5 • C + 0,677) - 2,5 • г = 9,71 - 2,5 • г;
yf = 1,56 + 2,5 • D + 0,677) - 2,5 • г = 13,25 - 2,5 • г;
yf = 3,5 + 2,5 • E + 0,677) - 2,5 • г = 17,84 - 2,5 • г;
yf = 7,30 + 2,5 • F + 0,677) - 2,5 • г = 16,9 - 2,5 • г;
yf = 1,56 + 2,5 • G + 0,677) - 2,5 • г = 29,75 - 2,5 • г;
yf = 2,08 + 2,5 • (8 + 0,677) - 2,5 • г = 23,77 - 2,5 • г;
yf = 3,05 + 2,5 • (9 + 0,677) - 2,5 • г = 27,84 - 2,5 • ц
•, 9): 2/iJ = 2,08 + 2,5 • A0 + 0,677) - 2,5 • г = 28,77 - 2,5 • г.
Порождаемые этими уравнениями переменные верхние контрольные границы
приведены в таблице:
J = 3
j = 4
3 = 5
j = 6
3 = 7
J = 8
j=9
(» = 1
(i = l
(» = 1
(i = l
(г = 1
(i = l
(« = 1
j = 10 (г =
,2):
,2,3)
, • • •
, • ¦ ¦
, ...
, ...
, • • •
1, ..
,4):
,5):
,6):
,7):
,8):
.,9
j
2
3
4
5
6
7
8
9
10
l/i
-1,04
7,84
7,21
10,75
15,34
14,19
18,25
21,27
25,34
26,27
У2
3,65
4,71
8,25
12,84
11,69
15,75
18,77
22,84
23,77
Экспериментальные значения у
Уз
0,52
5,75
10,34
9,19
13,25
16,27
20,34
21,27
2/4
1,56
7,84
6,69
10,75
13,77
17,84
18,77
2/5
3,65
4,19
8,25
11,27
15,34
16,27
2/6
7,30
5,75
8,77
12,84
13,77
2/7
1,56
6,27
10,34
11,27
2/8
2,08
7,84
8,77
2/9
3,65
6,27
5.4]
Контрольные карты
707
Из таблицы видно, что значимый сдвиг среднего вниз произошел в седьмой вы-
выборке, так как ув = 7,3 > t/?6 = 5,75 (выпадающее наблюдение в таблице выделено). Из
примера следует одно основное преимущество ККНС — она фиксирует сдвиг среднего
вниз по двум последовательным значениям контролируемых сумм, что очень важно
при непрерывном контроле производства и позволяет непрерывно и оперативно на него
воздействовать. Уменьшение среднего в седьмой выборке до 16 уверенно выявляется
контролем с помощью ККНС.
Теперь по аналогии (для демонстрации техники и развития навыков вычисления
и анализа ККНС) рассмотрим задачу сдвига среднего вверх. В этом случае необходимо
использовать контрольные границы
У? = Уз - 2,5 • (j + 0,677) + 2,5 • г, г < j.
В нашем случае это приводит к контрольным границам
j = 2(i = l):
j = 3(z = l,2):
3 =4 (i = 1,2,3):
j = 5 (г = 1, ...,4):
j = 6(i = l, ...,5):
j = 7 (i = 1,2, ...,6):
j = 8B = l,...,7):
j = 9(z = l, ...,8):
j = 10 (г = 1, ...,9):
$P = 3,65 - 2,5 • 2,677 + 2,5 • г = -3,04 + 2,5 • г;
Уз'
У?
ш
= 0,52-2,5-3,677-
= 1,56- 2,5 -4,677-
2,5 • г = -8,67 + 2,5 • г;
2,5 • г = -10,13 + 2,5 • ц
= 3,65 - 2,5 • 5,677 + 2,5 • г = -10,54 + 2,5 • г;
уТ = 7,30 - 2,5 • 6,677 + 2,5 • г = -9,39 + 2,5 • г;
у^ = 1,56 - 2,5 • 7,677 + 2,5 • г = -17,63 + 2,5 • г;
Уз* = 2,08 - 2,5 • 8,677 + 2,5 • г = -19,61 + 2,5 • г;
Уэ* = 3,65 - 2,5 • 9,677 + 2,5 • г = -20,54 + 2,5 • г;
yio = 2,08 - 2,5 • 10,677 + 2,5 • г = -24,61 + 2,5 • г.
Вычисленные контрольные границы Щг приведены в таблице:
i
2
3
4
5
6
7
8
9
10
Экспериментальные значения гц
2/1
-1,04
-0,54
-6,17
-7,63
-8,04
-6,89
-15,13
-17,11
-18,04
-22,11
2/2
3,65
-3,67
-5,13
-5,54
-4,39
-12,63
-14,61
-15,54
-19,61
2/з
0,52
-2,63
-3,04
-1,89
-10,13
-12,11
-13,04
-17,11
2/4
1,56
-0,54
-0,61
-7,63
-9,61
-10,54
-14,61
2/5
3,65
-3,11
-5,13
-7,11
-8,04
-12,11
2/6
7,30
-2,63
-4,61
-5,54
-9,61
2/7
1,56
-2,11
-3,04
-7,11
2/8
2,08
-0,54
-4,61
2/9
3,65
-2,11
Из таблицы видно, что сдвиг среднего значения вверх происходит во второй выборке
(г/1 = —1,4 < у\ = —0,54). Таким образом, увеличение среднего с 25 в первой выборке
до 36 во второй выборке является значимым, что и выявила контрольная карта.
5.4.2.2. ККНС выборочных размахов
Карты этого типа используются для контроля изменчивости рассеяния в выбор-
выборках. Контролируемым параметром является сумма размахов
Уъ = 5^^г5 гДе ^i = ^imax ~~ %i min —размах г-Й Выборки.
г
Параметры уравнения для контрольных границ вычисляются по формулам
In —
Ь = а®сь>~
(То
d= -2
In a
(Т\
и ш —
23*
708
Методы исследования связей между случайными величинами
[Гл. 5
Здесь сто — нормативное значение стандартного нормального отклонения (опреде™
ляется предварительно по специально проведенным испытаниям); изменение
значения стандартного нормального отклонения, которое должно быть выявлено
с достоверностью не менее 1 — а; а — ошибка первого рода; с, v — коэффициенты,
зависящие от п (приведены в табл. 240).
Таблица 240
Коэффициенты с и и для ККНС выборочного размаха [97, 617]
п
с
V
3
0,233
7,27
4
0,188
10,95
5
0,16
14,49
6
0,142
17,86
7
0,128
21,08
8
0,118
24,11
9
0,11
27,01
10
0,103
29,82
Практически важно контролировать увеличение разброса значений, чтобы во™
время принять меры для стабилизации контролируемого параметра. Поэтому будем
рассматривать односторонние ККНС для выявления сдвига вверх значения а.
Уравнение для контрольной границы в этом случае имеет вид
Щ = Уз ^Ь (j + d)
Ы,
г <
или для нашего случая
У] = Уз
In —
сто
i-2-
In a
0~\
и ш —
0"о .
1 al
In —
GQ ¦
¦ <JqCI/ —I.
0"!
Если уi < Щ для какого-либо i < j, то в j-й выборке происходит значимое
увеличение разброса значений контролируемой величины.
Задача 388. В результате испытаний т = 10 выборок изделий объемом п = 5 каэюдая
получены следующие результаты:
г
Ri
1
1,4
1,4
2
1,6
3,0
3
1,5
4,5
4
1,8
6,3
5
0,9
7,2
6
3,1
10,3
7
1,5
11,8
8
1,6
13,4
9
1,8
15,2
10
1,4
16,6
Предварительно известно^ что ао = 0,5 и критическое значение <л = 0,72. Выбираем
а = 0,1. Необходимо найти параметры ККНС для размахов и проанализировать с ее
помощью полученные данные.
Выбираем к = 2 и для п = 5 находим из табл. 240 с = 0,160 и v = 14,49.
Далее вычисляем
(П Л 0,72
In — In
ао • с • v
Ь =
= 0,5 • 0,160 • 14,49 •
= 1,384; d = ——¦ = 0,871.
1 -
0,50
14,49 • In
0,72
0,72 0,50
Тогда уравнения для контрольных границ имеют вид
щ = Уз ^ 1,384 • (j + 0,871) + 1,384 • i.
Результаты расчета граничных значений Щ приведены в таблице:
5.4]
Контрольные карты
709
3
2
3
4
5
6
7
8
9
10
У\
1,4
0,41
0,53
-0,86
0,46
2,17
2,29
2,50
2,92
2,94
2/2
3,0
1,91
0,53
1,84
3,56
3,67
3,88
4,30
4,32
Экспериментальные
2/3
4,5
1,91
3,22
4,94
5,06
5,27
5,69
5,70
2/4
6,3
4,61
6,32
6,44
6,65
7,07
7,09
2/5
7,2
7,71
7,83
8,04
8,46
8,47
значения
2/6
10,3
9,21
9,42
9,84
9,85
Уг
2/7
11,8
10,80
11,22
11,24
2/8
13,4
12,61
12,61
2/9
15,2
14,00
Из нее видно, что разброс существенно возрастает в шестой выборке, что фиксируется
переходом значений у г в критическую зону (отмечено жирным курсивом в таблице).
5.4.2.3. ККНС для выборочных дисперсий
Рассматриваем, как и в предыдущем разделе, одностороннюю контрольную кар-
карту, выявляющую увеличение (сдвиг вверх) дисперсии. Контролируемым парамет-
параметром является теперь у^ =
sf, где /^ = п^ — 1, в^ —объем г-й выборки. На оси аб-
сцисс откладывается величина Xi = ]P fi. Параметры для уравнения контрольной
границы находятся по формулам [97], где а^ о\—как и выше (см. раздел 5.4.2.2),
соответственно нормативное (<Tq) и допустимое (erf) значения дисперсии.
Уравнение для контрольной границы имеет вид
В нашем случае Щг = yj —
yf =У3-Ь (Xj + d) + Ьхг, i < j.
In a
О 2 i °
2cr0 In —
In —
(TO .
Если yi < yj1 (i < j), то сдвиг дисперсии вверх (рост разброса контролируемых
величин) признается значимым.
Задача 389. Для данных, приведенных в таблице, найти параметры ККНС для дис-
дисперсий и провести анализ данных при а = 0,1:
Номер
выборки, %
1
2
3
4
5
6
7
8
9
10
щ
5
10
8
9
8
5
5
7
6
7
?(*t -1)
4
13
20
28
33
37
41
47
52
58
3,12
4,10
3,90
5,10
9,20
4,80
4,10
3,80
4,50
5,00
ЕК - 1)*?
12,48
49,38
76,68
117,48
163,48
182,68
199,08
224,16
246,66
276,66
Известно, что сг% = 2 и а\ = 2,5.
710
Методы исследования связей между случайными величинами
[Гл. 5
Вычисляем параметры уравнения контрольных границ:
b =
1- I —
1 -
\ = 4,959; d = -^^ = 10,319.
2,5
Тогда получаем yf = yj - 4, 959 • (j + 10, 319) + 4, 959 • г, г < j.
Результаты расчета контрольных границ у™ приведены в таблице.
3
2
3
4
5
6
7
8
9
10
2/1
3,12
-1,79
^53,80
-52,70
-31,50
-32,10
-35,57
^40,24
-42,50
-42,30
2/2
49,38
^9,20
-8,08
13,13
12,49
9,05
4,38
2,09
2,33
Экспериментальные значения у
Уз
76,68
26,63
47,84
47,12
47,77
39,09
44,63
37,05
2/4
117,48
87,51
86,86
83,44
78,76
79,34
76,72
2/5
163,48
111,71
108,23
103,56
119,02
101,51
2/6
182,68
128,07
123,40
143,81
121,35
г
2/7
199,08
143,24
163,65
141,18
2/8
224,16
193,40
170,94
2/9
246,66
195,73
Из таблицы видно, что все опытные значения лежат выше критической границы.
Следовательно, смещение дисперсии вверх не обнаруживается.
5.4.2.4. ККНС для доли дефектных изделий
В качестве контролируемой величины используется
= ^ Х{, где Х{ — число
i
дефектных изделий в выборке объема п. Так как практический интерес предста™
вляет случай превышения некоторой нормативной доли дефектных изделий ро5 то
будем рассматривать одностороннюю контрольную карту. Цель такой карты — свое-
своевременно зафиксировать превышение нормативной долей дефектных изделий р® ее
допустимого уровня pi.
Параметры такой контрольной карты вычисляются по формулам
nln
ро
ъ =
1~Pi . л^
d= —
In a
In-
nln
1 -po *
po A -po) """ 1-pi
Уравнения для контрольных границ имеют вид
nln
1- Ро
1-Р1
In a
nln
1 ^
1-pi ,
In
Po A -pi)
nln
1 - Po
1-PI
In
Po A -pi)
< j-
Если yi < Щ% ч то следует вывод о значимом росте доли дефектных изделий
в производстве.
5.4]
Контрольные карты
711
Задача 390. В результате испытаний т = 10 партий изделий объема п = 100 каждая
получены количества дефектных изделий в каждой выборке (данные приведены в та-
таблице). Найти параметры ККНС для доли дефектных изделий при а = ОД, ро = 0,02
и р\ = 0,03.
Номер
выборки, i
Xi
1^ хг
1
3
3
2
1
4
3
1
5
4
00 СО
5
2
10
6
2
12
7
5
17
8
1
18
9
3
21
10
2
23
Вычисляем параметры ККНС для доли дефектных изделий
-0,02 х
In 0,1
100 • lr
b =
In
1 - 0,03
0,03 • A - 0,02)
= 2,46716; d= —
100 ¦ In
- 0,02
- 0,03
[0,02- A -0,03),
Следовательно, yf = y, - 2,467 • (j + 2,245) + 2,467 • i.
Расчеты значений контрольных границ у*-г сведем в таблицу.
= 2,245.
J
2
3
4
5
6
7
8
9
10
У1
3
-4,00
-5,47
-4,94
-5,41
-5,87
-3,34
-4,80
-4,27
-4,74
У2
4
-3,00
-2,47
-2,94
-3,41
-0,87
-2,34
-1,81
-2?27
Экспериментальные
Уз
5
-0,01
-0,47
-0,94
1,59
0,13
0,66
0,19
2/4
8
1,99
1,53
4,06
2,59
3,13
2,66
2/5
10
3,99
6,53
5,06
5,59
5,13
значения
2/6
12
8,99
7,53
8,06
7,59
Ш
2/7
17
9,99
10,53
10,06
2/8
18
12,99
12,53
2/9
21
14,99
Из таблицы следует, что ни одно значение yi не попадает в зону контроля, следова-
следовательно, нет оснований считать, что доля дефектных изделий в выборках отличается от
нормативной.
5.4.2.5. ККНС для числа дефектных изделий, основанная на распределении
Пуассона
Координаты точек ККНС те же, что и в предыдущем разделе (г, J^a^). Пара-
Параметры ККНС вычисляются по формулам
In a
b =
d= —
где /jLq — нормативное значение числа дефектных изделий; \i\ — сдвиг числа дефект™
ных изделий, который должен быть обнаружен контролем; а — ошибка первого рода
(рекомендуемые значения 0,01; 0,05; 0,1).
Уравнение для контрольной границы односторонней ККНС с контролем сдвига
вверх числа дефектных изделий имеет вид
Щ% = Uj ~ Ь (j + d) + 6i, i < j.
Если yi < Щг (i < j) , то увеличение количества дефектных изделий признается
значимым.
712
Методы исследования связей между случайными величинами
[Гл. 5
Задача 391. Результаты испытаний партии изделий приведены в таблице. Норма-
Нормативное значение fio = 3, допустимое \х\ = 5, а = ОД. Найти параметры ККНС для
числа дефектных изделий и провести анализ полученных результатов.
Номер
выборки, г
Число
дефектов, xi
?*.
1
3
3
2
4
7
3
2
9
4
2
11
5
3
14
6
4
18
7
9
27
8
3
30
9
2
32
10
2
34
Вычисляем
Ь= — =3,915;
5-3
Тогда t/f = yj - 3,915 • (j + 1,151) + 3,915 • г, г < j
Расчеты контрольных границ t/J* сведем в таблицу.
3
2
3
4
5
6
7
8
9
10
3
-1,42
^3,33
-5,25
-6,17
-6,08
-1,00
-1,91
-3,82
-5,74
2/2
7
0,58
-1,34
-2,25
-2,17
-2,92
2,00
0,09
-1,82
Экспериментальные
2/3
9
2,58
1,66
1,75
6,83
5,92
4,00
2,09
2/4
11
5,58
5,66
10,75
9,83
7,92
6,00
2/5
14
9,58
14,66
13,75
11,83
9,92
значения
2/6
18
18,58
17,66
15,75
13,83
Уг
2/7
27
21,58
19,66
17,75
2/8
30
23,58
21,66
2/9
32
25,58
Из таблицы видим, что в седьмой выборке значимо выросло количество дефектных
изделий B/5 = 15 < f/y = 14,66 и у% = 18 < у? = 18,58). Применение ККНС позволило
оперативно выявить этот сдвиг.
5.4.3. Относительная эффективность контрольных карт
У инженера производства может возникнуть закономерный вопрос: которую из
контрольных карт следует применять? Вообще говоря, для того, чтобы дать более
полный ответ на вопрос, следовало бы знать, чего же хочет инженер: упростить
вычисления, обеспечить высокую эффективность контроля, какие изменения кон™
Таблица 241
Относительная эффективность различных контрольных карт [14]
Причина изменения
Отклонение с пересечением (грубое)
Сдвиг среднего
Сдвиг дисперсии
Медленная флуктуация (тренд)
Быстрая флуктуация (колебания)
Карты Шухарта
ж-карта
1
2
2
i?-карта
2
2
1
1
«s-карта
3
2
ККНС
3
1
1
5.4] Контрольные карты 713
тролируемого процесса хотел бы он зафиксировать? Ответы на эти вопросы может
дать только консультация, проводимая специалистом с учетом всех особенностей
и специфики решаемой задачи. Однако самые общие рекомендации можно дать —
они представлены в табл. 241. В таблице приняты следующие оценки: 1 — наибо™
лее эффективна; 2 — следующая по эффективности; 3 — наименее эффективна; 4 —
(прочерк) неприменима.
5.4.4. Контроль без использования контрольных карт
Для администратора не являющегося статистиком, контрольные карты Шухар-
та, а тем более ККНС, являются трудно усвояемыми, так как требуют привлече™
ния специальных терминов, вычислений по формулам, применения специальных
таблиц. Поэтому были предприняты попытки создать простейшие методы стати-
статистического анализа, которые не требуют ни таблиц, ни вычислений.
Один из таких методов описан в [618]. Правила и логика метода состоят в еле™
дующем. Для непрерывного производства, т. е. когда можно говорить о производ-
производстве с определенной „настройкой", оператор-контролер, работающий с контроль-
контрольным устройством, снабжается следующей инструкцией. На контрольном устройстве
отмечаются красным цветом зоны, соответствующие браку: для одностороннего
контроля — одна зона, для двустороннего контроля — две. Далее на контрольном
устройстве помечаются зеленым и желтым цветами зоны контроля в соответствии
с диаграммой:
— для двустороннего контроля
100%
Красная зона
Желтая зона
25%
Зеленая зона
50%
Желтая зона
25%
Красная зона
-для одностороннего контроля
100%
Зеленая зона
50%
Желтая зона
50%
Красная зона
Для контроля используется правило двух последовательных изделий. Если без
изменения настройки производства последовательно получаем два „зеленых" или
одно „зеленое" и одно „желтое" изделие, то работа продолжается без изменений.
Однако всегда в начале смены и после поступления новой партии изделий
работу следует начинать только после получения пяти последовательных „зеленых"
изделий. Если получается „желтый" результат, следует начать подсчет „зеленых"
изделий заново, и так до тех пор, пока не будут получены пять последовательных
„зеленых" изделий.
Если после настройки в процессе работы получены подряд два „желтых" ре-
результата на одной и той же стороне допуска, то требуется „регулировка в центр"
(это должен уметь делать оператор производства). Затем обязательна проверка по
правилу — пять „зеленых" подряд.
Появление двух „желтых" по разные стороны от центра требует вмешательства
руководителя производства (увеличилось рассеяние результата). После устранения
причины этого увеличения требуется опять получить пять „зеленых" изделий под-
подряд.
714 Методы исследования связей между случайными величинами [Гл. 5
Коротко повторим основные правила метода системв! контроля стабилвности
производства:
— начинать с пяти „зеленых";
— продолжать работу всегда, если подряд получены два „зеленых" либо „зеле-
„зеленое" и „желтое" изделия;
— если получены подряд два „желтых" изделия, регулировать настройку произ™
водства;
— после регулировки снова требуется получить пять „зеленых" изделий подряд.
Естественно, такой метод контроля наиболее эффективен в поточном массовом
производстве однотипных изделий, к производству которых применимо понятие
„настройка".
5.5] Математика-статистические методы планирования эксперимента 715
5.5. Математико-статистичесжие методы
планирования эксперимента
Планирование эксперимента предполагает определение наиболее эффективной
стратегии его проведения с целью получения статистического материала, обладаю-
обладающего заранее заданными свойствами.
С примером такого планирования мы уже встречались в разделе 5.3.3.2 (исполь-
(использование равноотстоящих значений независимой переменной при поиске нелинейной
регрессии).
Планирование эксперимента применяется при решении таких задач, как оценка
параметров распределения, проверка статистических гипотез при заданной мощ-
мощности критерия, нахождение математической модели процесса с заданными ста-
статистическими свойствами, поиск оптимальных по заданным критериям условий
протекания изучаемого процесса.
Многие из методов уже рассматривались нами в соответствующих разделах.
В настоящем разделе мы уделим особое внимание математическим методам плани-
планирования эксперимента для изучения механизма наблюдаемого процесса и построе-
построения его статистической модели.
В последние годы математическая теория активного эксперимента, бурно раз-
развиваясь, оформилась в самостоятельное прикладное направление математической
статистики [619, 620]. Автор далек от мысли изложить стройные основы теории
планирования эксперимента. Скорее всего, он в состоянии предложить читателю
введение в „прихожую" таких основ. Однако автор надеется дать основные понятия
и изложить простейшие прикладные методы планирования эксперимента, вполне
доступные специалистам с общим высшим образованием.
5.5.1. Планирование регрессионных экспериментов
при изучении механизма явленим (статистическое моделирование)
Задача планирования эксперимента может быть сформулирована следующим
образом: требуется получить некоторое представление о поверхности отклика, опи-
описываемой моделью у = /(#1, #2, • • • ? хп) ? гДе У— зависимая переменная-отклик (на-
(например, долговечность изделия); Х{ — независимые переменные — влияющие на от-
отклик факторы, которые можно варьировать в ходе эксперимента (например, пара-
параметры режима нагружения изделия).
Неизвестная функция отклика чаще всего представляется полиномом Aj-й степени
к к к
У = bO + J2 biXi + J2 b^jxixj + J2 ЬИХ1 + * * * >
где 5q, &i> biji bu— коэффициенты полинома.
Планирование эксперимента заключается в выборе на каждом этапе исследова-
исследования оптимального в принятых критериях расположения экспериментальных точек
в пространстве факторов. В качестве критериев оптимальности планов использу-
используются:
— минимизация числа опытов;
— простота вычислений коэффициентов функции отклика;
— независимость оценок коэффициентов функции отклика (ортогональность
плана);
— однородность дисперсий отклика относительно центра плана (ротатабель-
ность плана);
— минимизация объема эллипсоида рассеяния оценок коэффициентов модели
(D-оптимальность плана).
716 Методы исследования связей между случайными величинами [Гл. 5
Наибольшее применение нашли ортогональные планы в сочетании с критериями
D-оптимальности.
Как правило, исследователь ищет поверхность отклика в какой-то определенной
области изменения факторов. Наиболее широко применяется планирование на двух
уровнях (экстремальный эксперимент), когда в эксперименте используются значе-
значения факторов, соответствующие верхней и нижней границам интервала его варьи-
рования. Эти значения называются верхним и нижним уровнями и обозначаются
+1 и — 1 соответственно (или просто + и —). Экспериментальные планы, в которых
все факторы варьируются только на двух уровнях, называются планами 2fe, где к —
число варьируемых факторов.
При построении плана эксперимента исследователь должен исходить из некото™
рого априорного представления о возможном виде функции отклика (линейность,
монотонность и т.п.). Сначала область варьирования факторов определяется исхо-
дя из предположения о линейности поверхности отклика внутри этой области. Если
линейная поверхность отклика описывает экспериментальный материал неадекват-
но, то проводятся дальнейшие эксперименты по уточнению ее вида с помощью
полиномов более высокого порядка.
Более полное изложение математической теории планирования эксперимента
содержится в [621—625].
5.5.1.1. Линейные ортогональные планы (планирование первого порядка)
5.5.1.1.1. Полный факторный эксперимент
Примером плана, позволяющего получить независимые оценки коэффициентов
поверхности отклика, является полный факторный эксперимент (ПФЭ), реализую-
реализующий все возможные неповторяющиеся комбинации уровней независимых факторов
(ранее планы такого типа мы обсуждали применительно к задачам дисперсионного
анализа).
В настоящем разделе ПФЭ рассматриваются применительно к условиям актив-
активного экстремального эксперимента.
Рассмотрим в качестве примера ПФЭ для трех факторов (к = 3). Поверхность
отклика в этом случае имеет вид
У = bo + ^2
г=1
Пусть каждый фактор Х{ варьируется от основного уровня ж^о на величину
. Тогда с помощью преобразования Х{ = —Ц—— можно перейти к кодирован-
ным переменным ж^, принимающим на границах интервала варьирования х\ значе-
значения ±1. План экстремального эксперимента принято записывать в виде матрицы,
определяющей в кодированных переменных Х{ условия проведения эксперимента
(в дальнейшем под Х{ будем понимать кодированные переменные без специаль-
ных оговорок). Пример матрицы ПФЭ для трех факторов приведен в табл. 242.
В литературе принято ^-факторный ПФЭ с изменением факторов на двух уровнях
называть планом типа 2к.
В дальнейшем будем обозначать через y^v значение отклика, полученное в i/-m
эксперименте при условиях (сочетании уровней факторов а^), соответствующих j-й
точке плана, и через хц — значение фактора х\ в j-й точке плана.
5.5]
Математика-статистические методы планирования эксперимента
717
Таблица 242
Матрица полного факторного эксперимента (ПФЭ) 23
Номер точки
плана, j
1
2
3
4
5
6
7
8
Хо
+
+
+
+
+
+
+
+
XI
—
+
+
+
+
х2
—
+
+
+
+
—
+
+
+
+
Х\Х2
+
+
+
+
Х\Х%
+
+
+
+
Ж2Ж3
+
+
+
+
Ж1Ж2Ж3
—
+
+
+
+
Отклик
Уз
2/1
2/2
2/з
2/4
2/5
2/6
2/7
2/8
Для ПФЭ имеют место соотношения (n = 2fc —число точек плана):
что соответствует свойству ортогоналвности столбцов матрицвх плана.
Любой план 2к мож:ет быть построен по следующему простому правилу: в столб-
столбце, соответствующем фактору ж^, знаки + и — чередуются через 2г—1. План 2к
позволяет оценить 2к коэффициентов регрессии Ь\. Однако использовать ПФЭ для
оценки коэффициентов при членах с кратностью нельзя, так как оценки для bo и Ьц
смешиваются (например, столбцы xq и Х{Х{ неразличимы).
Основным преимуществом ПФЭ является ортогональность матрицы плана, что
позволяет существенно упростить вычисление коэффициентов уравнения отклика.
Для любого числа факторов к выборочные оценки bi вычисляются по форму-
формулам [621]
г=1
-I
т — число параллельных опытов в j-й точке плана; п — общее число точек плана.
Дисперсия, характеризующая разброс значений yjv при постоянных условиях экс™
z/=l
перимента (т.е. в одной точке плана), находится по формуле 5| =
Общая дисперсия, характеризующая разброс отклика безотносительно к условиям
-j n -j n m
эксперимента, равна S$ = - J2 S] = п(т^в J2 J2 (Уз» ~ Уз? •
3 = 1
Если количество параллельных опытов в точках плана различно, то
?2 _ J = 1
-, где nij — число опытов в j-й точке плана.
718
Методы исследования связей между случайными величинами
[Гл. 5
Предварительно однородность дисперсий 5| должна быть проверена одним из
методов, изложенных в разделе 4.1.1.4.
Дисперсия коэффициента регрессии bi определяется формулой
n(m-
г Si
Коэффициент Ь{ уравнения отклика с достоверностью а признается значи™
мым, если \bi\ > ti+g (/) Shi•> гДе ^i+<*—квантиль распределения Стьюдента при
2 Ъ 2
f = п(т — 1) степенях свободы.
Для проверки адекватности математической модели отклика используется дис™
п
— Vj) i где d — число коэффициентов аппроксимирующего
персия S2 =
i
полинома; yj—значение отклика, предсказываемое регрессионной моделью. Аде-
Адекватность модели устанавливается сравнением дисперсий S2 и
S
терия Фишера F = — при
S
y с помощью кри-
=n~dnf2 = n (га — 1) степенях свободы.
y
Если все коэффициенты линейной регрессии (в том числе и все коэффициенты
при взаимодействиях) являются значимыми, то d = п и не остается степеней свобо-
свободы для проверки гипотезы адекватности. В этом случае рекомендуется поставить
эксперименты в центре плана (т.е. при значении фактора Xi = 0). Тогда, если
|&о ~~ Уо| < Sy, где |/о — среднее значение отклика в центре эксперимента, линейная
модель признается адекватной.
Задача 392. Построить матрицу ПФЭ 25.
При построении матрицы плана эксперимента будем исходить из правила чередова-
чередования для фактора Xi знаков + и — через каждые 2*™1 знаков. Например, для фактора ж 4
знаки должны чередоваться через 24™1 = 8 знаков. Следуя этому правилу, получаем
матрицу плана эксперимента ПФЭ 25:
3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
XQ
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
XI
+
—
+
—
+
—
+
—
+
—
+
—
+
—
+
Х2
+
+
—
—
+
+
—
—
+
+
—
—
+
+
—
хз
+
+
+
+
—
—
—
—
+
+
+
+
—
—
—
Х4
+
+
+
+
+
+
+
+
—
—
—
—
—
—
—
Х5
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
3
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
XI
+
—
+
—
+
—
+
—
+
—
+
—
+
—
+
х2
+
+
—
—
+
+
—
—
+
+
—
—
+
+
—
хз
+
+
+
+
—
—
—
—
+
+
+
+
—
—
—
Х4
+
+
+
+
+
+
+
+
—
—
—
—
—
—
—
Х5
—
—
—
—
—
—
—
—
—
—
—
—
—
—
5.5]
Математика-статистические методы планирования эксперимента
719
Задача 393. Для ПФЭ 23, приведенного в таблице, найти уравнение отклика и про-
провести его статистический анализ.
Уровни факторов и
Уровни факторов
Основной
Интервал варьирования
Верхний
Нижний
интервалы варьирования
Обозначение
0
Axi
+1
-1
Х\
7
4
11
3
х2
2
2
4
0
жз
4
3
7
1
3
1
2
3
4
5
6
7
8
ж0
+
+
+
+
+
+
+
+
XI
+
—
+
—
+
—
+
ж2
+
+
—
—
+
+
—
-
Матрица
жз
+
+
+
+
—
—
—
Х\Х2
+
—
—
+
+
—
—
+
ПФЭ
Ж1Ж3
+
—
+
—
—
+
—
+
2 и результаты
Ж2Ж3
+
+
—
—
—
—
+
+
Ж1Ж2Ж3
+
—
—
+
—
+
+
эксперимента
Уз
34,38,42
15,20,25
19,21,23
30,33,36
-33, -38,-43
28,31,34
-19,-23,-27
10,12,14
Уз
38
20
21
33
-38
31
-23
12
щ
16
25
4
9
25
9
16
4
Уз
37,5
18,5
21,5
34,5
-38,5
29,5
-22,5
13,5
Вычисляем коэффициенты регрессии (уравнения отклика)
94
' Уз = у =
1
&i = -
8
1
Ьо = - ' J
i=
_ 38-20 + 21-33-38-31-23-12
8
38 + 20-21-33-38 + 31 + 23-12
= —12,25:
38 + 20 + 21 + 33 + 38-31 + 23-12
= 1,0;
= 16,25;
1 А
bl2 = о ' /Z
8 з=1
38-20-21 + 33-38-31 + 23 + 12
8
38-20 + 21-33 + 38 + 31 + 23 + 12
= 13,75;
38 + 20 - 21 - 33 + 38 - 31 - 23 + 12
023 = = 0;
8
1 ®
123 = - • J2
_
' хз * х^з ' Уз =
8
38-20-21 + 33 + 38 + 31-23-12
Далее вычисляем S] (значения приведены в таблице) и
2 _ 1 JU ^2 _ 16 + 25 + 4 + 9 + 25 + 16 + 4
о . о
Находим дисперсию коэффициентов регрессии:
я2 —
• Sl = ^т+-т = 0,844 (Я = 0,918).
bi п • (m - 1) у 8 • C - 1)
720 Методы исследования связей между случайными величинами [Гл. 5
Выбираем а = 0,95 и находим из таблиц ti+g = to,975 при / = 8 • C — 1) = 16 степенях
2
свободы: to,975 A6) = 2,12. Вычисляем статистики Стьюдента для коэффициентов модели:
|Ьо| П,75 \h\ 12,25 |Ь2| 1,0
to = ^7 = ^Гв =12'8- h = ^7 = да =13'3' h = ^7 = ^Ts =1'09'
^ 1^ ^ 177 ^ ^ ^=0,54; tl8 = M = ?? = 14,98;
0,918 Sbi 0,918 5Ь. 0,918
, |62з| СЗ |bi23| 8,0
t3 " ^Г " 5Д5 " 0; tl23 " ^7 " 5^S " 8'71-
Видим, что ^2 = 1,09; t\2 = 0,54; ?23 = 0 < to,975A6) = 2,12. Следовательно, коэффи-
коэффициенты &2, &12 и &23 незначимо отличаются от нуля. Тогда уравнение регрессии принимает
вид
у = 11,75 - 12,25 • xi + 16,25 • х3 + 13,75 • xix3 + 8 •
Вычислим теперь ^^{yj — yj) = 10. В нашем случае число значимых коэффициентов
J с О2 т А/- * 42 3-10
модели равно « = 5 и Ь = • > \Vj —- Vj) = = 10.
F n-d t^i 8-5
S2 10
Теперь находим F = — = = 0,74, что, очевидно, меньше критического значения
Sy 13,5
(которое всегда больше единицы). Запишем искомую модель в натуральных переменных:
\ -4Ч
у = 11,75 - 12,25- [ ^^)+ 16,25- (*^*) + 13,75
+ 8- | ^—^ ) Л^—\ • ( ^^li ) = 11,75-12,25-@,25ж1 - 1,75) + 16,25-@,ЗЗж3 - 1533) +
\4/\2/\3/
+ 13,75 • @,25ж1 - 1,75) • @,ЗЗж3 - 1,33) + 8 • @,25xi - 1,75) • @,5ж2 - 1) • @,ЗЗж3 - 1,33) =
= 24,958 - 4,974 • ал + 9,31 • х2 + 2,042 • х3 - 1,33 • xi • х2 +
+ 0,473 • х\ • хз — 2,31 • Х2 - хз + 0,33 • х\ • Ж2 • жз-
5.5.1.1.2. Дробный факторный эксперимент
Если некоторыми взаимодействиями можно пренебречь, то регрессионная мо-
модель, связывающая отклик с основными факторами, может быть получена при
меньшем, чем в ПФЭ, количестве экспериментов с помощью дробного факторного
эксперимента (ДФЭ).
Например, в случае ПФЭ 23, если взаимодействиями х\Хъ-> х\х$, Х2Х% и х 1Ж2Ж3
можно пренебречь, то можно либо использовать 4 оставшихся столбца матрицы
плана для определения коэффициентов регрессионной модели при четырех но-
новых факторах, либо найти модели для трех факторов с помощью четырех, а не
восьми экспериментов. Часть матрицы ПФЭ 2fc, в которой v линейных эффектов
(факторов) приравнены к эффектам взаимодействия, называется дробной репликой
вида 2^.
Соотношения, определяющие правила построения дробных реплик ПФЭ, и ука-
указывающие, какие факторы приравнены к взаимодействиям, называются генериру™
ющими. Например, дробные реплики ПФЭ 23^1 могут быть получены с помощью
генерирующих соотношений х% = Х\Х2 и х% = ^Х\Х2- Матрицы планов, соответствую
ющих этим дробным репликам, приведены в табл. 243.
Очевидно, можно получить еще 4 матрицы дробных реплик 23™1 с помощью
генерирующих соотношений для факторов х\ и х^-
5.5]
Математико-статистические методы планирования эксперимента 721
Таблица 243
Дробные реплики 23
Х3 = Х!Х2
3
1
2
3
4
Х\
+ 1 + 1
Х2
+ 11 +
хз
\
Ж1Ж2ЖЗ
Х3 = ~Х1Х2
j
1
2
3
4
+ 1 + 1
Х2
+ 11 +
хз
хгх2хз
1 1 1 1
Для различения смешанных эффектов по матрице дробной реплики использу™
ется понятие определяющего контраста, характеризующего комбинацию тех фак-
факторов, столбец произведения которых состоит только из плюсов или только из ми-
минусов.
Определяющий контраст J может быть равен +1 или — 1. Например, для дроб-
дробных реплик (табл. 243)
J =
= +1 ИЛИ J =
= —1.
Определяющий контраст позволяет установить систему смешивания основ-
основных факторов с эффектами взаимодействия. Например, если J = Ж1Ж2Ж3 = +1, то
xi = xfx2X% = Ж2Ж3 (так как всегда х\ = +1), т. е. оценка Ь\ смешана с оценкой 623-
Если к эффектам взаимодействия приравнивается не один, а несколько основных
факторов, причем каждому из них соответствует свой частный определяющий
контраст, для полного описания разрешающей способности дробной реплики ПФЭ
используется обобщающий определяющий контраст. Он включает в себя частные
определяющие контрасты и их произведения.
Например, при исследовании 5 факторов можно поставить не 25 = 32 опыта,
а только 8, если реализовать дробную реплику 25^2, т.е. приравнять два фактора
к эффектам взаимодействия. Предположим, что выбраны варианты смешивания
ж4 = Жх^з и Ж5 = Х\Х2Х% с определяющими контрастами J = х\х^х^ и J = x\X2X^x^
соответственно. Тогда обобщающий определяющий контраст может быть записан
следующим образом
J = Ж1Ж3Ж4 = Ж1Х2Ж3Ж5 = Ж2Ж4Ж5.
Теперь для того, чтобы выявить, с чем смешана та или иная оценка коэффици-
коэффициента модели, необходимо умножить комбинацию факторов, соответствующих ей, на
обобщающий определяющий контраст. Например, определим систему смешивания
для оценки коэффициента Ь\2 эффекта взаимодействия Х\Х2- Имеем
т.е. оценка Ъ\2 будет смешанной с оценкой коэффициентов 6234? ^35, ^145- В об-
общем случае получается сложная система смешивания эффектов взаимодействия.
Наиболее эффективными дробными репликами от ПФЭ являются реплики,
у которых линейные эффекты смешаны с взаимодействиями наивысшего порядка.
Различают регулярные и нерегулярные дробные реплики. Регулярные реплики
образуются из ПФЭ делением на число частей, кратное двум. Например, 25™1 —
полуреплика, 25™2—четверть реплики, 27~4 —1/16 реплики от ПФЭ 27. Реплики
типа 3/4, 5/8 и т.д. называются нерегулярными. Дробные реплики позволяют
существенно сократить число факторов и экспериментов для моделирования про™
цесса. Особенно эффективно их применение при планировании экспериментов для
отыскания оптимума отклика.
722 Методы исследования связей между случайными величинами [Гл. 5
5.5.1.2. Нелинейные планы второго порядка
Если линейная регрессионная модель оказывается неадекватной, то в боль-
большинстве практических случаев удовлетворительная аппроксимация поверхности
отклика достигается при использовании полинома второй степени. Математическая
модель поверхности отклика в этом случае имеет вид
к к к
у = Ъ0 + ^2 biXi + Е bijXiXj + J2 Ъцх\.
г=1 i<j i=l
План эксперимента должен обеспечивать получение раздельных (несмешанных)
оценок коэффициентов регрессии Ъ{. Для этого необходимо, чтобы между числом
опытов плана п и числом коэффициентов модели к выполнялось соотношение
(fc + 2)(fc + l) ^ „ ,
п > , и чтобы каждый фактор варьировался не менее, чем на трех
уровнях.
5.5.1.2.1. Симметричные планы второго порядка
Наиболее широкое распространение нашли симметричные планы второго поряд-
порядка [621]. Под симметричным планом понимается план, удовлетворяющий соотноше-
соотношениям
п п
J2 Xij =0; ]Г XeiX^Xvi = 0 (е, 7, ^ = 1, 2, ..., fc; е ф j ф г/ ф е) ;
п п п
Y, %ei%ji = 0 (е Ф 7); Y, x%xii = ° G Ф v); Y1 х% = пХ^
i=l г=1 i=l
г=1 г=1
где п — общее число опытов, выполняемое по плану; j — порядковый номер опыта.
Если в каждой точке плана проводится nij параллельных опытов, то должно
иметь место
п п
п\2 = Y, rrijX^ п\3 = J2 m3x\Jx2lj (e ф 7);
i=i 3=1
где h и n = ^ TBj — соответственно число точек плана и общее число опытов.
Оценки коэффициентов регрессии для симметричного плана второго порядка
вычисляются по формулам
п 1 к п
3=1
j
^ " Е mJ^ij2/i - " Е m3xi3V^
3=1 3=1 3=1
1 п Iй
Ь* = Д^ Е тЗХг03 (* / 0); Ь*е = д^ Е Щ^Хе^ (I ф е),
з=1 3 3=1
5.5] Математико-статистические методы планирования эксперимента 723
1 ^ k\l 1
'J JZ^ A4 — Лз -f- /СЛз — /€A2 ^4 — Аз
A2 , Аз — А2
А4 — Аз + ^Аз — к\2 (А4 — Аз) (А4 — Аз^Аз — к\2)
Контроль правильности вычислений оценок коэффициентов регрессии может
п
быть выполнен с помощью равенства J^ (t/j — yj) = 0, где ijj—предсказываемое
моделью значение отклика.
Выборочные дисперсии и ковариации оценок коэффициентов модели определя™
ются формулами
cov (Ьо, hi) = -~sl', cov iP%u bjj) = ~^sl (i Ф J) 1
где Sy—выборочная дисперсия отклика у, связанная с ошибкой эксперимента.
Значение S2 находится по формуле
- \2
У)
что справедливо в случае однородности дисперсий 5| по точкам плана (эта одно™
родность должна быть предварительно проверена).
Дисперсия 5| предсказываемого моделью значения отклика у определяется
формулой
п
Неадекватность модели второго порядка характеризуется дисперсией
1 " 2
S2 = ^ rrij (tjjyj) , где I — число коэффициентов модели (в случае квадра-
i=i
(fc
тичнои модели / =
S2
Модель с вероятностью а признается адекватной, если — < Fai где Fa — а-
Sy
квантиль распределения Фишера с /i = n -1 и /2 = ^(^' ~ 1) степенями свободы.
i=i
Значимость коэффициентов модели проверяется с помощью статистики ti = 77^ ?
п
имеющей при bi = 0 распределение Стьюдента с / = J^ (г?г^- — 1) степенями свободы.
724 Методы исследования связей между случайными величинами [Гл. 5
5.5.1.2.2. Ортогональные симметричные планы
Наиболее простыми симметричными планами второго порядка являются орто™
гональные планы, предложенные Боксом и Уилсоном [626]. Ортогоналвный план
позволяет найти независимые оценки коэффициентов поверхности отклика. Постро™
ить ортогональный план для получения модели
к к к
У = Ьо + ^2 biXi + J2 hjXiXj + J2 ЬИХ1
i=l i<j i=l
нельзя, так как столбцы матрицы плана, соответствующие х\ и фиктивной не-
ременной ж0? будут неразличимы (оба будут состоять из +1) и, следовательно,
неразличимы будут также оценки bo и Ъц. Для устранения этого смешивания
используется преобразование модели к виду [621]
к к к
где br0 = b0 + A2 Y1 Ь«; (%'iJ = xf - A2;
г=1
Условие ортогональности плана имеет вид Аз = А|. Оценки коэффициентов
регрессии на основе ортогонального плана получаются независимыми и находятся
по формулам:
?'
• / \
Дисперсии оценок коэффициентов регрессии вычисляются по формулам
ь0\, ^«П(л4-Лз)^' ^^^
Оценка коэффициента Ьо находится по формуле
к
h = b'o - А2 Е^«'
г=1
5.5]
Математика-статистические методы планирования эксперимента
725
ее выборочная дисперсия равна
л2
Л2
г=1
S2y (Л4 - Аз + k\l)
п (Л4 — Аз)
Дисперсия предсказываемого значения отклика определяется по формуле
п
г=1
1
А^
т2т2
1
л!
г=1
Проверка значимости коэффициентов регрессии и адекватности поверхности
отклика проводится по аналогии с обычным симметричным планом.
Большинство известных ортогональных планов второго порядка строится по
композиционному принципу, путем достройки ортогонального плана первого по-
порядка. Сначала реализуются опыты, соответствующие полуреплике 23, и опыты
в центре плана для проверки линейности модели. Если модель неадекватна, ставят-
ставятся опыты во второй полу реп лике и в 6 звездных точках. Условие ортогональности
Л3 = А| обеспечивается специальным выбором числа опытов в центре эксперимента
По и величиной звездного плеча а, определяющего координаты звездных точек
плана. Композиционный ортогональный план содержит п = 2к^р + 2к + bq опытов,
где 2к~р — число опытов в звездных точках (дробная реплика ПФЭ, в котором р
линейных эффектов приравнены к эффектам взаимодействия). Для композицион-
композиционного плана имеют место соотношения
Значения %иа, обеспечивающие ортогональность плана, удовлетворяют соот-
соотношению
Bк~р + 2к
2a2J
Параметры и численные значения вспомогательных коэффициентов для ортого-
ортогональных композиционных планов второго порядка при щ = 1 приведены в табл. 244.
Вычисление коэффициентов модели и статистический анализ поверхности отклика
проводятся по формулам для симметричного плана второго порядка.
Таблица 244
Параметры ортогональных композиционных планов
2
3
4
5
fc
2
3
4
5
0
0
0
1
а2
1,000
1,477
2,000
2,392
пХ2
6,000
10,954
20,000
20,785
Распределение опытов
9
15
25
27
пХз
4,000
8,000
16,000
16,000
пХ4
6,000
12,364
24,000
27,446
1
1
1
1
Вершина
куба
4
8
16
16
а
5,000
6,499
9,000
7,989
Ь
3,000
2,510
2,500
1,816
Звездные
точки
4
6
8
10
с
4,500
3,437
3,125
2,359
d
0
0
0
0
726
Методы исследования связей между случайными величинами
[Гл. 5
Задача 394. Для трех переменных был реализован ортогональный план второго по-
порядка, результаты которого приведены в таблице. Найти статистическую модель,
описывающую результаты опытов.
Уровни факторов
Уровни
+ 1
0
-1
XI
15,1
14,7
14,3
х2
36
32
28
жз
1,4
1,2
1,0
Из табл. 244 для по = 1 (один опыт в центре плана) и к = 3 имеем величину звездного
плеча а = ^1,477 = 1,215. Общее число точек плана п = 15, число опытов в каждой точке
плана было rrij =3 (т. е. п = п • rrij = 45). План состоит из 8 точек ПФЭ 23, 6 звездных
точек и одной точки в центре плана (см. табл. 244).
Далее имеем
Л2 =
0,73; Л3
15 15
Матрица плана эксперимента имеет вид:
Л4 =
15
= 0,824.
3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Х\
-1
+ 1
-1
+ 1
-1
+ 1
-1
+ 1
-1,215
+1,215
0
0
0
0
0
х2
-1
-1
+ 1
+ 1
-1
-1
+ 1
+ 1
0
0
-1,215
+1,215
0
0
0
хз
-1
-1
-1
-1
+1
+1
+1
+1
0
0
0
0
-1,215
+1,215
0
Ж1Ж2
+ 1
-1
-1
+ 1
+ 1
-1
-1
+ 1
0
0
0
0
0
0
0
х\хз
+1
-1
+1
-1
-1
+1
-1
+1
0
0
0
0
0
0
0
Ж2Ж3
+1
+1
-1
-1
-1
-1
+1
+1
0
0
0
0
0
0
0
Ж1Ж2ЖЗ
0,27
0,27
0,27
0,27
0,27
0,27
0,27
0,27
0,75
0,75
-0,73
-0,73
-0,73
-0,73
-0,73
х12 - Л2
0,27
0,27
0,27
0,27
0,27
0,27
0,27
0,27
-0,73
-0,73
0,75
0,75
-0,73
-0,73
-0,73
Ж22 — А2
0,27
0,27
0,27
0,27
0,27
0,27
0,27
0,27
-0,73
-0,73
-0,73
-0,73
0,75
0,75
-0,73
Уз
16
5
9
5
14
10
17
9
14
8
11
8
16
16
17
Вычисляем коэффициенты модели:
j " X'lj ' Vj =
lj -Л2) -Уз =
611 п • (Л4 - Аз) § mj Xlj Vj 45 • @,824 - 0,53) ^
= 0,227 • [A6 + 5 + 9 + 14 + 10 + 17 + 9) + 0,75 • A4 + 8) -
-0,73 • A1 + 8 + 16 + 16 + 17)] = -2,31;
Ъ22 = 0,227 • [0,27 • A6 + 5 + 9 + 14 + 10 + 17 + 9) -
- 0,73 • A4 + 8 + 16 + 16 + 17) + 0,75 • A1 + 8)] = -3,32;
Ьзз = 0,227 • [0,27 • A6 + 5 + 9 + 14 + 10 + 17 + 9) -
- 0,73 • A4 + 8 + 11 + 18 + 17) + 0,75 • A6 + 16)] = 1,05.
5.5] Математика-статистические методы планирования эксперимента 727
Далее вычисляем
= 0,274 • (-16 + 5-9 + 5™ 14 + 10™ 17 + 9™ 1,215 • 14 + 1,215 • 8) = -9,39;
Ь2 = 0,274 • (-16 - 5 + 9 + 5 - 14 - 10 + 17 + 9 - 1,215 • 11 + 1,215 • 8) = -2,39;
Ьз = 0,274 • (-16 ^5^9 +14+ 10+17+ 9^ 1,215 • 16 + 1,215 • 16) = 4,11;
1 15
Ь12 = — • J2 тз ' Xli ' х*э ' Уз =
п' 3 i=i
3 15
= - ' Yl Xli ' х*э • Уз = О,375 ' A6 - 5 + 9 - 5 + I4 - Ю - 17 + 9) = 1,125;
i=i
Ь13 = 0,375 • A6 - 5 + 9 - 5 + 14 - 10 - 17 + 9) = 1,125;
&2з = 0,375 • A6 + 5 - 9 - 5 - 14 - 10 - 17 + 9) = 3,375.
Искомая модель имеет вид
У = ^о + Ь\ • х\ + Ь2 • х2 + Ь3 - х3 + 6i2 • xix2 + 6i3 • хгхз + b23 • х2х3 +
~~ Л2) + Ь22 • (x\ - Л2) + Ьзз • (х\ - Л2) =
= 11,67 - 9,39xi - 2,39ж2 + 4,11ж3 + 1,12Ъх1х2 + 1,125ж1Ж3 + 3,375ж2ж3 -
- 2,31 • (xl - 0,73) - 3,32 • {х% - 0,73) + 1,05 • (х% - 0,73) = 15,01 - 9,39xi - 2,39ж2 +
+ 4,11ж3 + 1,215ж1Ж2 + 1,215алжз + 3,375ж2ж3 - 2,31ж? - 3,32ж2 + 1,05жз-
5.5.1.2.3. Ротатабельные планы
Существенным недостатком ортогональных планов является то, что полученная
на их основе модель с разной точностью предсказывает значения отклика в раз-
различных точках факторного пространства — т.е. дисперсии 5|. неодинаковы для
различных точек факторного пространства, равноудаленных от центра плана.
Этого недостатка лишены так называемые ротатабельные планы [621], которые
позволяют получить модели с одинаковой дисперсией отклика во всех точках фак-
факторного пространства, равноудаленных от центра плана. Условие ротатабельности
плана имеет вид
п п
А4 = ЗА3, ИЛИ ]Г xfj =^J2 XiJXej'
3=1 3=1
Формулы регрессионного анализа для симметричных планов второго порядка
сохраняются и для ротатабельных планов с учетом условия ротатабельности. Свой™
ство ротатабельности не зависит от числа п® опытов в центре плана (общее число
опытов должно удовлетворять соотношению -—- = [621]).
Д2 к -f- 2
Бокс и Хантер [627] предложили выбирать по, исходя из равномерности дис™
персии предсказания. Такие планы называются униформ-ротатабельными и имеют
\ * Аз
место при значениях А3 = —, удовлетворяющих условию
А2
2А* (А* - 1) (к + 2) + A* (fe + 1) - (fe - 1) = 0.
Например, если ? = 2,3,4,5, то Ад должно соответственно равняться 0,7844;
0,8385; 0,8705; 0,8918. В этом случае отклик оценивается с примерно одинаковой
дисперсией во всех точках шара с радиусом р = л/Х^.
728
Методы исследования связей между случайными величинами
[Гл. 5
Можно выбирать по, исходя из обеспечения ортогональности ротатабельного
плана. Это условие соответствует требованию А| = 1.
Для композиционных планов условие ротатабельности обеспечивается соответ-
соответствующим выбором звездного плеча а = 2 4 .
Число центральных опытов для композиционного ротатабельного ортогональ™
ного плана определяется соотношением
= А* =
42
4} -
- 2к.
При соответствующих значениях А^ можно найти п® для униформ™ и ортого-
ортогональных ротатабельных планов. Параметры и вспомогательные коэффициенты для
некоторых ротатабельных планов приведены в табл. 245.
Таблица 245
Параметры униформ-ротатабельных планов
к
2
3
4
5
к
2
3
4
5
Р
0
0
0
1
а2
2
2,828
4
4
8,000
13,657
24
24
пАз
4
8
16
16
Распределение опытов
п
13
20
31
32
12
24
48
48
а
2,600
3,327
4,429
5,091
по
5
6
7
6
Ь
15300
1,136
1,107
1,091
Вершины
куба
4
8
16
16
с
15625
15250
0,969
1,000
Звездные
точки
d
-0,2438
-0,1378
-0,1153
-0,0900
4
6
8
10
0,81
0,86
0,86
0,89
5.5.1.2.4. D-оптимальные планы
Ортогональность и ротатабельность являются свойствами планов, а не крите™
риями их оптимальности. Эти свойства не имеют количественных оценок.
Кифер [628] предложил выбирать в качестве критериев оптимальности величи-
величины, достигающие экстремума при выборе наилучшего способа обработки экспери-
экспериментальных данных.
Такой величиной может быть объем эллипсоида рассеяния оценок парамет-
параметров математической модели. Планы, минимизирующие объем эллипсоида рассе-
рассеяния, т. е. планы, которые позволяют получить квадратичную модель с наибо-
наиболее точными оценками коэффициентов, называются D-оптимальными. Различа-
Различаются D-оптимальные планы с ограничениями на кубе (—1^з^^+1) и на шаре
Условия
2к + 1^
D-оптимальности плана на
кубе
имеют
вид
лДк2 + 12к + 7
[629]
А2
Последнее равенство выполняется, если план эксперимента содержит только
точки с координатами —1,0, +1. Симметричные D-оптимальные планы построены
Кифером (для к ^ 5) и Коно (для к ^ 9) [629]. Планы Кифера содержат 2к точек
в вершинах куба, к • 2к~1 точек в серединах ребер куба и — L2k~2 точек
5.5]
Математика-статистические методы планирования эксперимента
729
в центрах двумерных граней. Планы Коно включают в себя 2к точек в верши™
нах куба, к • 2к^г точек в серединах ребер куба и одну центральную точку. При
к = 2 планы Кифера и Коно совпадают, D-оптимальность плана обеспечивается
некоторым оптимальным распределением общего числа опытов по точкам плана,
для точного соблюдения которого требуется большое число экспериментов. В связи
с этим возникла задача построения планов, мало отличающихся от D-оптимальных
и содержащих меньшее число опытов. Такие планы называются почти D-оптималь-
ными и обозначаются Bi (г — число параметров модели) [630]. Матрицы планов В±
и В$ приведены в [630].
План второго порядка D-оптимален на шаре только тогда, когда он ротатабелен.
Условия ?)™оптимальности на шаре имеют вид
(* + l)(fc + 2)'
(fc + 1) (fc + 2)
Ал — ЗАч —
3 (к + 3)
D-оптимальным планом на шаре будет композиционный план, включающий
в себя 2к точек в вершинах куба, вписанного в сферу единичного радиуса, 2к точек
на единичной сфере и одну центральную точку. При этом на каждую вершину
* а - (fc + 3) к2
куба должна приходиться доля наблюдении, равная 2~к> на кажДУю
звездную точку — доля
-^ина центральную точку — доля
" (к + 1) (к + 2J .—г-—., ^ ,,— (fc + !) (fc + 2) •
Практически обеспечение требуемого соотношения числа опытов в точках такого
плана связано с необходимостью проведения большого количества экспериментов.
Поэтому для обеспечения D-оптимальности на шаре обычно используется ротата™
бельное планирование, в котором число опытов в центре плана выбирается из усло-
условия ^оптимальности с отказом от требований ортогональности и униформности.
Характеристики ротатабельных планов с числом центральных опытов, выбранным
из условия Х)™оптимальности, приведены в табл. 246.
Таблица 246
Характеристики D-оптимального плана
к
2
3
4
5
к
2
3
4
5
Р
0
0
0
1
с
п\2
8
13,657
24
24
:к2
2
8
4
4
Распределение опытов
п
11
16
26
27
пЛз
4
8
16
16
пХ4
12
24
48
48
710
3
2
2
1
а
3,667
7,953
13
21
Вершины
куба
4
8
16
16
6
1,833
2,715
3,25
4,5
Звездные
точки
4
6
8
10
с
1,3750
1,0000
0,8125
0,8438
d
-0,5729
-0,7270
-0,6770
-0,8438
5.5.1.2.5. Несимметричные планы второго порядка
Симметричные планы второго порядка позволяют большую часть оценок коэф-
коэффициентов регрессионной модели определить независимо друг от друга (коррели™
руются только оценки коэффициентов 5q и Ъц, Ьц и bjj^ i / j). Отказ от требования
730 Методы исследования связей между случайными величинами [Гл. 5
симметричности позволяет в некоторых случаях получитв более эффективные пла™
ны. Наибольшее распространение получили несимметричные планы второго поряд™
ка, предложенные Хартли [631]. Планы Хартли экономичны, число экспериментов
в них равно числу коэффициентов модели или ненамного превосходит его. Они
близки к D™ оптимальным, построены по композиционному принципу и состоят
из дробной реплики ПФЭ, звездных точек и опытов в центре, число которых
выбирается из условия D-оптимальности.
Планы Хартли нельзя сделать ортогональными или ротатабельными (кроме
случая к = 5) выбором звездного плеча а. Если план Хартли образован на основе
дробной реплики с генерирующим соотношением, не содержащим тройного вза-
взаимодействия, то он становится симметричным и регрессионный анализ функции
отклика проводится по формулам симметричного планирования второго порядка.
Коэффициенты Ьд, Ьц, а также Ь{ и Ь?1/ для переменных ж^, же и ж^, не входящих
в тройное взаимодействие генерирующего соотношения, подсчитываются по фор-
формулам
к п 7 п п 7 к
= - Е Уз - - Е Е хиу^ ь» = -- Е Уз + - Е хпУз - - Е Е хи
п 1 к п 7 п
Е Уз Е Е иу^ ь» Е Уз + Е хпУз - - Е Е х
j = l i=l j=l j=i jz=i
Ф
где a, 6, c, d — коэффициенты, определенные ранее для симметричных планов.
Оценки коэффициентов hi и Ь?1/, входящих в тройное взаимодействие определя™
ющего контраста J = XiX?xv1 вычисляются по формулам
\i=i
1 - Аг Аг
где е = ; / = — е =
Л2 — Аз Аз A3 (A2 — Аз]
Дисперсии этих оценок равны соответственно S^ = е— и ^~ = — Я^. Диспер™
сии остальных коэффициентов модели вычисляются по формулам
q _ о _ о _ _
Ь0 - -\; йь„ - -^-Лу; bbi - —; йЬу - —.
Дисперсия предсказываемого значения отклика определяется формулой
q2
п
Параметры и вспомогательные коэффициенты некоторых планов Хартли для
к
ограничений на кубе (—1 ^ Х{ ^ +1) и на шаре {^2,xi ^ ¦'-) пРивеДены в табл. 247.
г=1
Матрицы планов Хартли приведены в [630] для к = 5 и к = 6, там же приведены
экономичные несимметричные планы Вестлейка (к = 5), Дрейпера, Хартли—Коно.
5.5]
Математика-статистические методы планирования эксперимента
731
Таблица 247
Параметры планов Хартли
к
3
4
5
к
3
4
5
Р
1
1
1
1
1
пХ2
10
10
16
18
28
сг
3
1
4
1
5
пХз
4
8
8
16
16
2
Генератор
Х1х2х3
хгх2х3
Ж1Ж2ЖЗ
Ж1Ж2ЖЗЖ4Ж5
Ж1Ж2ЖЗЖ4Ж5
пА4
22
10
40
18
66
а
11
3,247
17
3,727
27
Распределение опытов
п
Ь
3,667
0,955
4,25
0,818
5,4
11
17
17
27
27
с
0,611
8,5
0,531
13,5
0,54
по
1
1
1
1
1
-1,14
1,719
-0,996
2,455
-1,014
Куб
4
8
8
16
16
е
1,833
8,5
2,125
-
Звезда
6
8
8
10
10
f
4,5833
10,625
4,25
-
Тип
плана
сфера
куб
сфера
куб
сфера
Задача 395. Для плана Хартли на кубе для пяти переменных построить матрицу
плана и по результатам его реализации найти поверхность отклика (в каждой точке
плана проводились rrij = 3 измерения).
Из табл. 247 находим для к = 5 (куб) п = 27, по = 1, куб—16, звезда—10, т. е. всего
проводятся 27 экспериментов, в том числе 1 — в центре плана, 16 — в точках куба, 10 —
в звездных точках (звездное плечо а2 = 1, а = 1).
Матрица плана и результаты эксперимента приведены в таблице:
3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
XI
+
—
—
+
—
+
+
—
—
+
+
—
—
+
х2
+
—
+
—
+
—
+
—
+
—
+
—
+
хз
+
+
—
—
—
—
+
+
+
+
—
—
+
+
Ж4
+
+
—
—
+
+
—
—
+
+
—
—
—
-
Х5
+
+
—
—
+
+
—
—
—
—
+
+
+
+
Уз
1320
257
434
465
451
467
1222
257
511
493
407
183
471
442
Уз
1288
265
443
478
445
465
1205
280
509
494
386
202
460
435
3
15
16
17
18
19
20
21
22
23
24
25
26
27
XI
+
—
0
+
—
0
0
0
0
0
0
0
0
х2
+
—
0
0
0
+
—
0
0
0
0
0
0
хз
—
—
0
0
0
0
0
+
—
0
0
0
0
Х4
+
+
0
0
0
0
0
0
0
+
—
0
0
Х5
—
—
0
0
0
0
0
0
0
0
0
+
—
Уз
1015
202
427
511
293
498
312
475
379
412
337
329
508
Уз
1002
230
380
590
266
591
230
513
353
431
330
381
468
Вычисляем оценки коэффициентов регрессии (в нашем случае п = п • rrij = 27 • 3 = 81).
Тогда имеем из табл. 247
Л2 = — = 0,667; Аз = — = 0,592; А4 = — = 0,667;
Вычисляем:
* Уз
а = 3,727; 6 = 0,818; с = 13,5; d = 2,455.
3,727 iZ,o_ 0,818 ^
' Уз • тз =
27
хЬ • Уз =
732 Методы исследования связей между случайными величинами [Гл. 5
0,818 Л, 13,5 ^* _ 2,455 * Л, 2 _
?j~ Е 3Уз + "^- ' Z) 3x*i ' Уз ~ "^ ¦ J2 Е 3хИ ¦ Уз\
3=1 3=1 i=lj=l
|1 13,5 Л, _ 2Д55 * ^ 2 _
^ Z, 32/i + "?f * 2^ Зж^' ' Уз ^р * Z, Z, 3xii * 2/i = 27'95
i=i j=i i=ij=i
622 = 30,9; Ьзз = 52,9; 644 = 0,4; b55 = 44,4;
27 27
* Уз = °5°555 • J2 х*зуэ ; fei = 0,0555 • ^ XU ' Уз = 18254; &2 = 180?6;
bi J2
18 i=i j=i 3=1
b3 = 80,3; b4 = 50,6; b5 = 43,3;
¦^ 27 27 27
^' = 7^^ * 1Z 3xi3 ' х*з ' Уз = 0,0625 • J2 xiJ ' х^з ' Уз*ч bl2 = °,0625 • J2 XlJ ' Х2з ' Уз =
lb'S 3 = 1 3 = 1 3 = 1
bis = 56,1; бы = 42,7; b15 = ^32,3; b23 = 67,8; b24 = 43,2;
b25 = -29,1; 634 = -28?6; b5 = 38,4; b45 = 71,8.
Искомая регрессионная модель имеет вид
у = 380,1 + 182,4xi + 180,6ж2 + 80,Зж3 + 50,6ж4 + 4353ж5 + 27,9^? + 30,9^2 +
+ 52,9жз + 0,4^4 + 44,4^5 + 7
+ 67,8ж2ж3 + 43,2ж2ж4 - 29,1ж2ж5 - 28,6ж3ж4 + 38,4ж3ж5 + 71,8ж4ж5.
Вычисленные по полученной регрессионной модели значения отклика близки к экс-
экспериментальным реализациям наблюдаемой случайной величины.
5.5.2. Планирование экспериментов по поиску оптимума
Традиционные методы экспериментального нахождения оптимума функции нес-
нескольких переменных у = /(#i, #2, • • • 5 хп) предполагают последовательное изучение
зависимостей у = fi(xi) от каждого из факторов при фиксированных значениях
остальных. Недостатком таких методов является большое количество необходимых
экспериментов и невозможность учесть взаимодействие факторов.
В последние годы разработаны специальные методы поиска оптимума, базиру™
ющиеся на математической теории экстремального эксперимента. Подробное изло-
изложение таких методов содержится в [631, 632].
5.5.2.1. Метод крутого восхождения
Бокс и Уилсон [626] предложили метод планирования экспериментов по поиску
оптимума, сочетающий движение по градиенту функции отклика с ортогональным
линейным планированием, — метод крутого восхождения. В соответствии с этим ме-
методом сначала проводится ПФЭ или ДФЭ с центром в некоторой точке факторного
пространства с координатами Жю,Ж2о, • • • ?хко- Методами линейного регрессионно™
го анализа вычисляются оценки коэффициентов модели отклика bi (г = 1, ...,&).
Дальнейшее движение к оптимуму осуществляется изменением интервалов варьи-
варьирования основных факторов в соответствии с уравнением
причем используются некодированные значения переменных. Параметр А выби-
выбирается следующим образом. Вычисляются произведения 5^Аж^, и определяется
базовый фактор х§, для которого biAx§ является наибольшим по абсолютной
величине в сравнении с остальными факторами. Выбирается значение А = Ai = .-=—г,
5.5]
Математика-статистические методы планирования эксперимента
733
где 0 < е < 1 (рекомендуется выбирать е = 0,5 + 0,8), Ь? —коэффициент линейной
модели при факторе х?. Затем вычисляются шаги и координаты первой точки
крутого восхождения по формуле xj = Ai (Ъ{Ах{) + ж^о- Шаги и координаты по-
последующих точек на линии крутого восхождения подечитываются по формуле
х\ = jAi {b\Ax\) + Xio^ где j = 1,2, ... —номер шага в направлении крутого вос-
восхождения.
Из всех реализованных опытов выбирается тот, который дал наилучшие резуль-
результаты (например, максимальный отклик). Условия наилучшего опыта принимаются
за основной уровень факторов, и цикл крутого восхождения повторяется до тех
пор, пока все коэффициенты линейной модели Ъ{ не будут признаны незначимыми.
При движении к оптимуму значения параметра А должны уменьшаться от цикла
к циклу. Выбор величины шага при движении по градиенту производится из пред-
представлений исследователя о возможном характере оптимума.
При достижении оптимума для описания функции отклика используются ме™
тоды планирования экстремальных экспериментов второго порядка. Движение по
градиенту наиболее эффективно для симметричных регрессионных моделей, у ко-
которых коэффициенты Ь{ различаются несущественно.
Задача 396. Необходимо найти оптимум отклика у в зависимости от трех фак-
факторов (ж1,Ж2,жз) методом крутого восхождения Бокса-Уилсона. Результаты после-
последовательного экспериментирования по реализации крутого восхождения приведены
в таблице:
Реализация трехфакторного крутого восхождения
Номер по
порядку
1
2
3
4
5
6
7
8
9
10
11
12
Последовательность операций
крутого восхождения
Основной уровень, хю
Интервал варьирования, Axi
Верхний уровень
Нижний уровень
Кодовое значение переменных
Опыты ПФЭ 23
1
2
3
4
5
6
7
8
h
hAxi
Ai = O,S/\bs
Шаг « Ai(biAA?i)
,1ты на линии восхождения
9
3
Факторы
132
7
139
125
хг
+ 1 1 + 1 + + 1
80
560
3
135
138
141
16
5
21
11
х2
+ + + 1 1 + 1 1
136
680
0,8/136
4
20
24
28
0585
0,10
0,95
0,75
х3
+ + 1 1 + 1 + 1
97
9,7
0,06
0,91
0,97
..L03
Отклик
Уг
251
303
310
324
434
470
490
1127
1455
1627
1594
734
Методы исследования связей между случайными величинами
[Гл. 5
По результатам ПФЭ 23 находим коэффициенты регрессии при линейных парамет-
параметрах:
1
Ь\ = —
Xl ' Уз = 80;
= 136; b3 = -
n
= 97.
Далее вычисляем произведения (указаны в таблице). Наибольшее значение произве-
произведения ^2 • Аж2 = 680. Поэтому выбираем фактор Х2 за базовый.
тэ * , Л 0,8 0,8
Выоираем для первого шага А = Ai = ;—- = .
\bs\ 136
136
Тогда шаг в направлении крутого восхождения равен Ai
{Ь\
П Я ЯП 7
—
lot)
= 3,0;
А2 • (Ь2 • Аж2) =
Координаты
\
= 4,0; Ai • (Ь3 • Аж3) = 0,06.
136
точек крутого восхождения рассчитываем следующим образом:
х\ = Ai • (bi • Axi) + жю = 3 + 132 = 135; ж^ = 4 + 16 = 20; х\ = 0,06 + 0,85 = 0,91.
Второй шаг: х\ = 2Ai • (Axi) + жш = 2 • 3 + 132 = 138, и т.д. Результаты опытов при™
ведены в таблице, из которой видно, что второй опыт на линии крутого восхождения дает
наибольший результат. Следовательно, максимум достигается при значениях координат
точки х\ = 138, Х2 = 24 и хз = 0,97. В окрестности этой точки можно теперь строить
план второго порядка для уточнения поверхности отклика.
5.5.2.2. Симплексное планирование
Эффективным методом планирования эксперимента по поиску оптимума явля™
ется последовательный симплексный метод, предложенный Спендли, Хексто и Хим~
суортом [634].
^мерным симплексом называется выпуклый многогранник, образованный (к + 1)
вершинами в fc-мерном пространстве. Например, на плоскости (к = 2) симплек-
симплексом будет треугольник. Симплекс называется правильным, или регулярным, если
все его ребра равны между собой (например, равносторонний треугольник на
плоскости). Из любого правильного симплекса можно, заменив одну точку на ее
зеркальное отображение относительно границы или ребра симплекса, построить
новый симплекс. Путем последовательной замены вершин можно осуществить пе-
перемещение симплекса в факторном пространстве.
Координаты вершин правильного ^-мерного симплекса с единичным ребром
и центром в начале координат определяются строками матрицы
Ri -r2 -r3
0 R2 -r3
0
0
1
/( ) J{)
Координата новой вершины симплекса после замены определяется формулой
Xik+2 = т yZ xij ~ xii ГДе xi — координата заменяемой вершины; — У^ж^- —среднее
3 3
значение координат всех точек симплекса, кроме заменяемой; Xik+2 — координата
новой верп1ины.
Последовательное симплексное планирование эксперимента осуществляется еле™
дующим образом. Сначала ставятся эксперименты в вершинах симплекса (их число
5.5]
Математика-статистические методы планирования эксперимента
735
на единицу больше числа факторов). Затем выявляется и отбрасывается верши™
на с минимальным (если необходимо найти максимум) или максимальным (если
необходимо найти минимум) значением отклика. На оставшейся грани строится
симплекс с новой вершиной, являющейся зеркальным отображением отброшенной.
Затем проводится эксперимент в новой вершине симплекса, и цикл его перемещения
повторяются до тех пор, пока симплекс не начнет „вращаться" вокруг вершины
с экстремальным значением отклика.
Симплексное планирование имеет ряд существенных достоинств — оно обладает
свойством самоконтроля, исключает влияние ошибок эксперимента на конечный
результат оптимизации; на любом этапе экспериментирования можно включить
в рассмотрение еще один фактор, добавив только одну вершину (эксперименталь-
(экспериментальную точку), увеличивающую размерность симплекса на единицу.
Метод не предъявляет жестких требований к точности фиксирования значений
отклика (он требует только ранжирования их по величине). Отсутствует необходи-
необходимость описания поверхности отклика. Симплекс-планирование безразлично к фор-
форме поверхности отклика. Подробно метод симплекс-планирования изложен в [621].
Задача 397. Рассмотрим пример поиска оптимума симплекс-планированием. Пред-
Предположим^ имеются два фактора х\ и х2 с основными уровнями хю = 1000 и х2о = 1
и интервалы варьирования Axi = 500 и Ах2 = 0,2 соответственно.
Симплексом в нашем случае является треугольник ABC. Будем ставить эксперимент
в точке А с координатами в кодированной форме
Х\ =
х2 =
Затем ставим экспериментв! в точках В с координатами х\ = 0,5 ж х2 = 0,86 и в точ-
точке С с координатами х\ = 1 и х2 = 0.
Дальнейшее движение симплекса приведено в таблице:
Номер
опыта, j
1
2
3
4
5
6
7
8
Симплекс
ABC
ABC
ABC
ВСА1
ВС А'
В'С'А1
В'С'А"
В'С" А"
Вершина, в которой
ставится опыт
А
В
С
А'
С
В1
А"
С"
Код
0
0,5
1
1,5
1
2
1,5
2,5
Значение
1000
1250
1500
1750
1500
2000
1750
2250
Х2
Код
0
0,86
0
0,86
1,72
1,72
2,58
2,58
Значение
1
1,172
1
1,172
1,344
1,344
1,516
1,516
Отклик,
Уз
9
13
11
17
18
21
24
20
Видим, что из точек стартового комплекса ABC наименьший отклик имеется в точ™
ке A (yj = 9). Так как ищется максимум, то будем искать точку А\ симметричную
к точке А относительно грани ВС симплекса. Имеем координаты искомой точки
Ж14 = ^ • @,5 + 1) - 0 = 1,5; ж24 = ^ • @,86 + 0) - 0 = 0,86.
¦л / \ Х\ X\Q „ а ~
he натуральные (некодированные) координаты равны х±4 = z ш х± = i\x\ x
х Ж14 = 500 • 1,5 + 1000 = 1750; х2 = Ах2 • х24 + х20 = 0,86 • 0,2 + 1 = 1,172.
Далее по аналогии рассчитываются остальные точки симплекс-планирования (ре-
(результаты последовательного симплекс-планирования приведены в таблице).
Видим из таблицы, что наибольшее значение достигается в точке А" с координатами
X! = 1,5; х2 = 2,58.
Очень короткое послесловие
Уважаемый читатель! Лежащая перед тобой книга — не классическое исследова-
исследование, по окончании которого уместно делать вывод о том новом, что автору удалось
вырвать у природы. Эта книга — и не учебник, призванный системно ввести тебя,
мой читатель, в предмет. Скорее всего, эта книга — справочник с комментариями,
заменяющими изложение основ теории обработки результатов наблюдений.
Однако пространные комментарии, большое число и подробное описание приме-
примеров позволяют автору надеяться на то, что его труд может претендовать на статус
пособия или руководства, т. е. быть чем-то средним между классическим учебником
и ординарным справочником.
Автор хотел бы ограничиться одной ремаркой, цель которой — ответить на веро-
ятный вопрос оппонента-профессионала: почему пропущены (или недостаточно пол-
полно изложены) некоторые разделы прикладной математической статистики? Такие,
например, как многомерная статистика, временные ряды, методы распознавания
незрительных образов, теория обслуживания и очередей и т. п.
Вопрос естествен. Однако автор хотел бы обратить внимание оппонента на
вводную часть книги. Цель книги — дать инструмент в руки инженера или ис-
исследователя, не имеющего горячего стремления погружаться в математические
глубины теории вероятностей и математической статистики. Автор исходил из
того, что математика перечисленных выше разделов прикладной статистики весьма
„тяжела" для среднего инженера или исследователя и вряд ли будет им воспринята.
Впрочем, может быть, это слабый аргумент, и дело скорее в неспособности автора
соответствующим образом изложить эти разделы прикладной статистики.
Так или иначе, автор сделал всё, что мог, и надеется, что тем самым внес свой
скромный вклад во введение инженеров и исследователей в увлекательный мир
обработки результатов наблюдений.
Последние строки книги автор считает своим долгом посвятить словам благо-
благодарности ее научному редактору B.C. Ароловичу, чей напряженный труд немало
способствовал превращению исходного авторского текста в книгу, достойную вни™
мания читателя.
Список литературы
1. Крамер Г. Математические методы статистики / Пер. с англ. — М.: Мир, 1975.
2. Ван дер Варден Б. Л. Математическая статистика / Пер. с нем. — М.: ИЛ, 1960.
3. Колмогоров А.Н. Основные понятия теории вероятностей. — М.: Наука, 1974.
4. Гнеденко Б. В, Курс теории вероятностей. — М.: Наука, 1965.
5. Кендалл М., Стъюарт А. Теория распределений / Пер. с англ. — М.: Наука, 1966.
6. Уилкс С. С. Математическая статистика / Пер. с англ. — М.: Наука, 1967.
7. Юл. Д. Э., Кендалл М. Д. Теория статистики / Пер. с англ. — М.: Госстатиздат, 1960.
8. Джини К. Средние величины / Пер. с итал. — М.: Статистика, 1970.
9. Закс Л. Статистическое оценивание / Пер. с нем. — М.: Статистика, 1976.
10. Митрополъский А. К. Техника статистических вычислений. — М.: Наука, 1971.
11. Идье В., Драйад Д., Дмсеймс Ф., Рус М., Садуле Б. Статистические методы в экспе-
экспериментальной физике. — М.: Атомиздат, 1976.
12. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической
статистики. — М.: Наука, 1969.
13. Хан Г1., Шапиро С. Статистические модели в инженерных задачах / Пер. с англ.—
М.: Мир, 1969.
14. Химмельблау Д. Анализ процессов статистическими методами / Пер. с англ. — М.:
Мир, 1970.
15. Шторм Р. Теория вероятностей. Математическая статистика. Статистический кон-
контроль качества / Пер. с нем. — М.: Мир, 1970.
16. Справочник по надежности. Т. 1 / Пер. с англ. — М.: Мир, 1969.
17. Хастингс Н., Пикок Дмс. Справочник по статистическим распределениям / Пер.
с англ. — М.: Статистика, 1980.
18. Холлендер М., Вулф Д. Непараметрические методы статистики / Пер. с англ. — М.:
Финансы и статистика, 1983.
19. Йэйтс Ф. Выборочный метод в переписях и обследованиях. — М.: Статистика, 1965.
20. Пустылъник Е. И. Статистические методы анализа и обработки результатов наблю-
наблюдений. — М.: Наука, 1968.
21. Мот Ж. Статистические предвидения и решения на предприятии.—М.: Прогресс,
1966.
22. Коуден Д. Статистические методы контроля качества / Пер. с англ. — М.: Наука, 1961.
23. Абезгауз Г. Г. и др. Справочник по вероятностным расчетам.—М.: Воениздат, 1970.
24. Оуэн Д. Н. Сборник статистических таблиц / Пер. с англ. — М.: ВЦ АН СССР, 1966.
25. Большее Л. Н., Смирнов Н.В. Таблицы математической статистики.—М.: Наука,
1965.
26. Келли Т. Л. Статистические таблицы / Пер. с англ. — М.: ВЦ АН СССР, 1966.
27. Митрополъский А. К. Интеграл вероятностей. Л.: Изд-во ЛГУ, 1972.
28. Таблицы нормального интеграла вероятностей, нормальной плотности и ее нормиро-
нормированных производных. — М.: Изд-во АН СССР, 1960.
29. Янко Я, Математико-статиетические таблицы / Пер. с чеш. — М.: Госстатиздат, 1961.
30. Дьяконов В. Л. Справочник по расчетам на микрокалькуляторах. — М.: Наука, 1986.
31. Цветков A. Н., Епанечников В. А. Прикладные программы для микро-ЭВМ „Элек-
„Электроника БЗ-34", „Электроника-МК-56", „Электроника МК-54".— М.: Финансы и ста-
статистика, 1984.
32. Справочник по специальным функциям / Под ред. М. Абрамовица и И. М. Стиган. —
М.: Наука, 1979.
33. Епанечников В. А., Цветков А.Н. Справочник по прикладным программам для
микрокалькуляторов. — М.: Финансы и статистика, 1980.
24 А. И. Кобзарь
738 Список литературы
34. Градштейн И. С, Рыжик И. М. Таблицы интегралов, сумм, рядов и произведений. —
М.: Наука, 1971.
35. Hastings С. Approximations for digital computers, Princeton Univ.Prtss., 1955.
36. Казакавичюс К. А. Приближенные формулы для статистической обработки резуль-
результатов механических испытаний // Завод, лаб. 1988. Т. 54, № 12. С. 82—85.
37. Надежность и эффективность в технике. Справочник / Под ред. Б. В. Гнеденко. —
Т. 2. —М.: Машиностроение, 1987.
38. Kennedy W.«/., Gentle J. E. Statistical computing, Marcel Dreker Inc., New York and
Basel, 1980.
39. Joiner B. I., Rosenblatt J. R. Some properties of the in samples from Tukey's symmetric
lambda distribution // JASA. 1971. V. 66. P. 394-399.
40. Lin Jinn-Ту an. Approximating the normal tall probability and Its inverse for use on a
pocket calculator // JRSS. Sec. С 1989. V. 38, №1. P. 69-70.
41. Goldwaite L. R. Failure rate study for the lognormal lifetime model // Proc. Symp.
Reliability Quality Control, Philadelphia, 1961.
42. Aitchison J., Brown J. The lognormal distribution. London: Cambridge Univ. Press, 1951.
43. Венецкий И. Г., Венецкая В. И. Основные математико-статистические понятия и фор-
формулы в экономическом анализе. — М.: Статистика, 1982.
44. Шор Я. Б., Кузьмин Ф. И. Статистические методы анализа и контроля качества
и надежности.—М.: Сов. радио, 1968.
45. Пагурова В. И. Таблицы неполной гамма-функции. — М.: ВЦ АН СССР, 1963.
46. Шор Я. Б. Статистические методы анализа и контроля качества и надежности. — М.:
Сов. радио, 1962.
47. Слуцкий Е. Е. Таблицы для вычисления неполной Г-функции и функции вероятно-
вероятностей. — М.: Изд-во АН СССР, 1950.
48. Лившиц И. Г. Обобщенное гамма-распределение // Надежность и контроль качества.
1975. №7. С. 28-34.
49. Stacy E. W. A generalization of the gamma-distribution // AMS. 1962. V. 28. P. 1187-1192.
50. Пирсон К. Таблицы неполной бета-фукнции.— М.: ВЦ АН СССР, 1974.
51. Хальд А. Математическая статистика с техническими приложениями. —М.: ИЛ, 1956.
52. Cadwell L, H, An approximation to the symmetrical incomplete beta function // Biometri-
ka. 1952. V. 39. P. 204-207.
53. Wise M. E. The Incomplete bet a-function, as a contour Integral and a quickly conversing
series for Its inverse // Biometrika. V. 37. 1950. P. 208-218.
54. Wise M. E. On normalizing the Incomplete bet a-function for fitting to dosage response
curves // Biometrika. 1969. V. 47. P. 173-175.
55. Molenar W. Approximations to the Polsson, binomial and hypergeometric distribution
function, Math. Center tracts., 31, Amsterdam, 1970.
56. Мюллер П., Нойман П., Шторм Р. Таблицы по математической статистике. — М.:
Финансы и статистика, 1982.
57. Ликеш Ж., Ляга Й. Основные таблицы математической статистики. — М.: Финансы
и статистика, 1985.
58. Boyd W. С. A nomogram for chl-square // JASA. 1965. V. 60. №309. P. 344-346.
59. Fisher R. A., Yates F. Statistical tables for biological, agriculture and medical research.
Edinburgh & London: Oliver and Boyd, 1963.
60. Fisher R. A. Statistical tables for research workers. Edinburgh: Oliver and Boyd, 1925.
61. Wilson Т. В., Hilferty M. M. The distribution of chi-square // Proc. of the national
Academy of sciences. 1931. V. 17, № 12. P. 684-688.
62. Hawkins D, M., Wixley R.A.J, A note on the transformation of the normality // AS.
1986. V. 40, №4. P. 296-298.
63. Hernandes F., Johnson R. A, The large-sample behavior of transformations to normality
// JASA. 1980. V. 75. P. 855-861.
64. Taylor J. M. G. Power transformations to symmetry // Biometrika. 1985. V. 72. P. 145-152.
65. Goldstein R. B. Chi-square quantlles, Algorithm 51 // Commun. Assoc. Сотр. 1973.
V. 16. P. 483-485.
Список литературы 739
66. Sever о N. С, Zelen V. Normal approximation to the chi-square and non-central
Improbability function // Biometrika. 1960. V. 47. P. 411-416.
67. Haldane J. B. S. The approximate normalization of the class of frequency distribution //
Biometrika. V. 29, 1937. P. 392-404.
68. Golberg H., Levine H. Approximate formulas for the percentage points and normalization
of t and x2 // AMS. 1945. V. 17. P. 216-225.
69. Gilbert R. J. A sample formula for cuterpolating tables of x2 // Biometrics. 1977. V. 33.
P. 383-385.
70. Hoagling D. C. Direct approximations for chi-square percentage points // JASA. 1977.
V. 72, №359. P. 508-515.
71. Aroian L. A. A new approximation to the levels of significance of the chi-square distribu-
distribution // AMS. 1973. V. 14. P. 93-95.
72. Peizer D. В., Pratt J. W. A normal approximation for binomial, F, beta and other
common, related tall probability, 1 // JASA. 1968. V. 63, №324. P. 1416-1456.
73. Pratt J. W. A normal approximate for binomial, F, beta and other common, related tall
probability, 2 // JASA. 1968. V. 63, №324. P. 1457-1483.
74. Ling R. F. A study of the accuracy of same approximations for ?, x2 and F tail probability
// JASA. 1978. V. 73, №362. P. 274-283.
75. Zar J. H, Approximations for the percentage points of the chi-square distribution // JRSS.
Sec. C. 1978. V. 27, №3. P. 280-290.
76. Fisher R. A. Expansion of „Student's" integral in power of n^1 // Metron. 1926. №5.
P. 109-112.
77. Koechler K. J. A simple approximations for the percentage of t distribution, // Techno™
metrics. 1983. V. 25, №1. P. 103-105.
78. Koechler K. J. A simple approximations for the percentage of t distribution // JRSS.
Sec. C. 1978. V. 27, №3. P. 280-290.
79. Nelson L. S. Same notes of Student's // J. of Quality Techn. 1984. V. 16, № 1. P. 64-65.
80. Nelson L. S. Standardizing Student's t // AS. 1973. V. 27. P. 93.
81. Gentleman W. M., Jenkins M. A. An approximation for Student's ^-distribution // Bio-
Biometrika. 1968. V. 55. P. 571-572.
82. Scott A., Smith T.M.E. A note on Moran's approximation to Student's // Biometrika.
1970. V. 57, №3. P. 681-682.
83. Dawson F. H. Alternatives to the use of tabulated values of distribution In statistical
programs // Nature. 1975. V. 256. P. 148.
84. Мог an P. A. P. Accurate approximation for t-test, in Festschrift for J. Nayman: Research
papers in statistics, ed. F. N. David. — N. Y.: Wiley, 1966. P. 225-230.
85. Wang Y. Y. Probability the type 1 errors of the Welch tests for the Behrens-Fisher
problem // JASA. 1971. V. 66. P. 605-608.
86. Fenstad G. U. A comparison between the U and V tests In the Behrens-Fisher problem
// Biometrika. 1983. V. 70, №1. P. 300-302.
87. Мардиа К., Земроч П. Таблицы F-распределений и распределений, связанных с ни™
ми.^М.: Наука, 1984.
88. Paulson E. An approximate normalization of the analysis of variance distribution // AMS.
1942. V. 13. P. 233-235.
89. Haines P. D. A closed form approximation for calculating the percentage points of the F
and t distributions // JRSS. Sec. C. 1988. V. 37, №1. P. 95-100.
90. Carter A. H. Approximation to percentage points of the z-dlstrlbution // Biometrika.
1947. V. 34. P. 352-358.
91. Hald A. D. Statistical tables and formulas, New York, 1952. P. 47-59.
92. Cochran W. G. Note on an approximate formula for the significance levels of z // AMS.
1940. V. 11. P. 93-95.
93. Бородачев Н. А., Абдрашитов Р. М., Веселова И. М. Точность производства в маши™
построении и приборостроении. — М.: Машиностроение, 1973.
94. Гумбель Э. Статистика экстремальных значений.—М.: Мир, 1965.
24*
740 Список литературы
95. Капур if., Ламберсон Л. Надежность и проектирование в технике. — М.: Мир, 1980.
96. Owen D. В. The power of Student's t-test // JASA. 1965. V. 60, №309. P. 320-333.
97. Джонсон H., Лион Ф. Статистика и планирование эксперимента в технике и науке.
Методы обработки данных. — М.: Мир, 1980.
98. Pearson E. S. Note on an approximation to the distribution of non-central %2 // Biometri-
ka. 1959. V. 46. P. 364-366.
99. Patnaik E. S. The norbcentral %2 and F distribution and their applications // Biometrika.
1949. V. 36. P. 202-232.
100. Pearson E. S., Hartley H. O. Charts of the power function for analysis of variance test,
derived from the non-central iF-distribution // Biometrika. 1951. V. 38. P. 112—130.
101. Tiku M.L. Laguerre series forms of non^central x2 and F distribution // Biometrika.
1965. V. 52. P. 415-427.
102. Tiku M. L. A note on approximating to the non^central F distribution // Biometrika.
1966. V. 53. P. 603-610.
103. Судаков Р. С. и др. Статистические задачи обработки систем и таблицы для числовых
расчетов показателей надежности. — М.: Высшая школа, 1975.
104. Большее Л. Н. Асимптотические пирсоновские преобразования // Теор. вероятн. и ее
примен. 1963. №8. С. 129-155.
105. Браунли К. А. Статистическая теория и методология в науке и технике. — М.: Наука,
1977.
106. Рао С. Р. Линейные статистические методы и их приложения. — М.: Наука, 1968.
107. Anscomb F. J. The transformation of Poisson, binomial and negative-binomial data //
Biometrika. 1948. V. 35. P. 246-254.
108. Черницкий П. И. Таблицы вероятностей. — М.: Воениздат, 1957.
109. Binns M. R. Approximating the negative binomial via the positive binomial // Techno-
metrics. 1974. V. 16. P. 323-324.
110. Best D. J., Gipps P. G. An improved gamma approximation to the negative binomial //
Technometrics. 1974. V. 16. P. 621-624.
111. Liberman G. J., Owen D. B. Tables of the hypergeometric probability distribution. Stan-
Stanford Univ. Press, Stanford, Calif., 1961.
112. Vilaplana J. H. A tables of the hypergeometric probability distribution, Publ. Lab. Ing.
Ind. Panama, s. B, r. 2, 1976, P. 1-2095.
113. Беляев Ю.К. Вероятностные методы выборочного контроля. — М.: Наука, 1975.
114. Локтев А. Л. Аппроксимационные формулы для распределений нормального, Стыо-
дента, хи-квадрат // Надежность и контроль качества. 1990. №5. С. 22-25.
115. Редько М. Ю. Об аппроксимациях нецентральных F-распределений центральным //
Надежность и контроль качества. 1990. №5. С. 52-59.
116. Вульфович Б. А. Оценивание параметров малой выборки. — Деп. во ВНИЭРХ 22.10.91,
№1180-рх9.
117. Dixon W. J. Estimation of the mean and standard deviation of a normal population //
AMS. V. 28. P. 806-809.
118. Боярский Э.А. Порядковые статистики.—M.: Статистика, 1972.
119. Введение в теорию порядковых статистик / Пер. с англ. — Под ред. А. Сархана
и Б. Гринберга. — М.: Статистика, 1970.
120. Pearson E. S., Tukey J. W. Approximable means and standard deviations based on
distances between persenage points of frequency // Biometrika. 1965. V. 52. P. 533-546.
121. Кенуй М. Г. Быстрые статистические вычисления. "Упрощенные методы оценивания
и проверки. — М.: Статистика, 1979.
122. Дэйвид Г. Порядковые статистики / Пер. с англ. — М.: Наука, 1979.
123. Eisenberger /., Posner E. S. Systematic statistics used for data compression in space
telemetry // JASA. 1965. V. 60. P. 97-133.
124. Walsh J. E. Some significance tests for the median, which are valid under very general
conditions // AMS. 1949. V. 20. P. 64-81.
125. Ашмарин И. П., Васильев Н. Н., Амбросов В. А. Быстрые методы статистической
обработки и планирования экспериментов.—Л.: Изд-во ЛГУ, 1971.
Список литературы 741
126. Фишбейн В. И. Номограмма, реализующая функцию биномиального распределения
// Надежность и контроль качества. 1972. № 12. С. 51-63.
127. Herrey E. M. J. Confidence intervals based on the mean absolute deviation of normal
sample // JASA. 1965. V. 60. P. 257-269.
128. Krutchkoff F. G. The correct use of the sample mean absolute deviation In confidence
intervals for a normal variate // Technometrics. 1966. V. 8. P. 663-67.
129. Peters C. A. F. Uber die Bestimmung des Wahrscheinlichen Fehlers einer Beobachtung aus
den Abweichungen der Beobachtungen von ihrem arithmetischen Mittel // Astronomische
Nachrichten. 1956. 44. S. 30-31.
130. Gutterman H. E. An upper bound for the sample standard deviation // Technometrics.
1962. V. 4. P. 134-135.
131. Dawton F. Linear estimates with polynomial coefficients // Biometrlka. 1966. V. 53.
P. 129-141.
132. Кендалл М.Дою., Стьюарт А, Статистические выводы и связи. — М.: Наука, 1973.
133. Зелингер Г. Я. Построение кратчайших доверительных интервалов для ереднеквадра-
тического отклонения нормального распределения // Завод, лаб. 1983. №3. С. 64—66.
134. Iliescu D. F., Voda V. Ch. On the estimation of standard deviation for a normal popula-
population, Trab. estadlst, J. Invest. Oper. 1974. V. 25. P. 71-98.
135. Gohen A. C. Tables for maximum likelihood estlmates-singly truncated and singly cen-
censored samples // Technometrics. 1961. V. 3. P. 535-541.
136. Schmee J., Gladsiein D., Nelson W. Confidence limits for parameters of a normal distri-
distribution from singly censored samples, using maximum likelihood // Technometrics. 1985.
V. 27. P. 119-128.
137. Gupta A. K. Estimation of the mean and standard deviation of a normal population from
a censored sample // Biometrika. 1952. V. 39. P. 260-273.
138. Sarhan A. E., Greenberg B. G. Estimation of location and scale parameters by order
censored sample, part 3, Techn. Report, 4, OOR Project, 1957.
139. Dixon W. J. Simplified estimation from censored normal samples // AMS. 1954. V. 25.
P. 610-614.
140. Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математические методы в теории
надежности. — М.: Наука, 1965.
141. Pandley В. Ж., Srivostava R. A shrinkage estimator for scale parameter of an exponential
distribution // Microelectron Reliability. 1987. V. 27. P. 949-951.
142. Barter H. L. Estimating the parameters of negative exponential populations from one or
two order statistics // AMS. 1961. V. 32. P. 1078-1090.
143. Epstein B. Estimation from life test data // Technometrics. 1960. V. 2. P. 447-454.
144. Ogawa J. Determination of optimal spacing for the estimation of the side parameters of
an exponential distribution based on sample quantiles // Ann. Inst. St. Mat. 1960. V. 12.
P. 11-155.
145. Harber H. L. Best linear unbiased under symmetric censored of the parameters of a double
exponential population // JASA. 1961. V. 32. P. 1078-1084.
146. Kuldorff G. Estimation of one or two parameters of exponential distribution on the basis
of suitably chosen order statistics // AMS. 1963. V. 34. P. 1419-1431.
147. Siddiqui M. M. Optimal estimators of the parameters of negative exponential distribution
from one or two order statistics // AMS. 1963. V. 34. P. 117-121.
148. Saleh A. K., Ali M. M. Aslmptotic optimum quantiles for the estimation of the parameters
of the negative exponential distribution // AMS. 1966. V. 37. P. 143-151.
149. Hassanein К. М. Estimation of the parameters of the extreme values distribution by use
of two or three order statistics // Biometrika. 1969. V. 56. P. 429-436.
150. Weissman I. Estimation of parameters and large quantiles based on the К largest
observations // JASA. 1978. V. 73. P. 812-815.
151. Kubai P., Epstein B. Estimation of quantiles of location-scale distribution based on two
or three order statistics // Technometrics. 1980. V. 22. P. 575-581.
152. Кудлаев Э. М. Оценивание параметров распределения Вейбулла-Гнеденко (обзор) //
Изв. АН СССР: Техн. кибернет. 1986. №6. С. 5-18.
742 Список литературы
153. Мартыненко Ю. Н. Ускоренная оценка параметров распределения Вейбулла мето-
методом максимального правдоподобия // Надежность и контроль качества. 1987. №6.
С.11-13.
154. Подольский Ю. М. О точном вычислении некоторых решеточных функций Грина //
Укр. физ. ж. 1972. Т. 17, №2. С. 240-260.
155. Тonaka S., Ichiakawa М. Approximate formula of coefficient of variation for Weibull
distribution // Reliability Eng. 1983. V. 4. P. 141-143.
156. Глушко В. Т., Бобро Н. Т., Рубец Г. Т., Гажемон Л. И. Некоторые методы оценки
параметров обобщенного распределения Вейбулла // Надежность сложных техниче-
технических систем: Сб. — Киев: Наукова думка, 1974. С. 83-91.
157. Один И. М. Определение параметров распределения Вейбулла методом наименьших
квадратов // Надежность и контроль качества. 1975. №7. С. 45—48.
158. Багно А. Н. Об одном методе оценки параметров распределения Вейбулла // Надеж-
Надежность и контроль качества. 1975. №7. С. 25-32.
159. Балицкая Е. О., Золотухина Л. А. Асимптотическая эффективность моментных
и квантильных оценок параметров распределения Вейбулла // Завод, лаб. 1988. Т. 54,
№3. С. 92-96.
160. Bain L. J. Inferences based on censored sampling from the Weibull or extreme-value
distribution // Technometrics. 1972. V. 14. P. 693-702.
161. Engelhart M. On simple estimation of the parameters of the Weibull or extreme™value
distribution // Technometrics. 1975. V. 17. P. 369-373.
162. Mann N. R., Fertig K. W. Simplified efficient point and Interval estimators for Weibull
parameters // Technometrics. 1975. V. 17. P. 361-368.
163. Engelhart M., Bain L, J. Some complete and censored sampling results for the Weibull or
extreme-value distribution // Technometrics. 1973. V. 15. P. 541-549.
164. Engelhart M., Bain L. J. Some results on point estimators for the two-parameter Weibull
or extreme-value distribution // Technometrics. 1974. V. 16. P. 49-56.
165. Mann N. R. Best linear invariant estimation for Weibull parameters under progressive
censoring // Technometrics. 1971. V. 13. P. 521-533.
166. Балицкая Е. О., Золотухина Л. А. Оценка параметров распределения Релея // Завод,
лаб. 1992. Т. 58, №5. С. 54-57.
167. Мапп N. Д., Fertig К. W. Tables for obtaining Weibull confidence bounds and tolerance
bounds on best linear invariant estimates of parameters of the extreme™value distribution
// Technometrics. 1973. V. 15. P. 87-101.
168. Stasy E. W. Quasymaximum likelihood estimations for two-parameter gamma-distribution
// IBM J. Res. And Develop. 1973. V. 17. P. 115-124.
169. Shenton L. IL, Bowman К. О. Further remarks on maximum likelihood estimator for
gamma-distribution // Technometrics. 1972. V. 14. P. 725-733.
170. Рудых Г. А. Оценки максимального правдоподобия двухпараметрического гамма-
распределения // Надежность и контроль качества. 1977. №1. С. 60-65.
171. Мартыненко Ю. Н. Ускоренная оценка параметров гамма-распределения // Надеж-
Надежность и контроль качества. 1984. №12. С. 10—11.
172. Буймов А. Г., Буймова Н. А. Об имитации и оценивании параметров гамма-распреде-
гамма-распределения // Исследование корреляционно-экстремальных систем, Томск, 1987, С. 8—11.
173. Wang Wenjun. Scale parameter of gamma-distribution and its autocovariance estimation
// Chin. J. Appl. Prob. and Stat. 1987. V. 3. P. 193-202.
174. Clopper C. /., Pearson E. S. The use of confidence or fiducial limits illustrated in the case
of the binomial // Biometrika. 1934. V. 26. P. 404-413.
175. Чурилов В. И, Об использовании приближенных зависимостей для определения до-
доверительных границ параметра биномиального распределения // Надежность и кон-
контроль качества. 1972. №12. С. 51-63.
176. Blyth С. R. Approximate binomial confidence limits // JASA. V. 81, 1986. P. 843-855.
177. Hall P. Improving the normal approximation when constructing one-sided confidence
intervals for binomial and Poisson parameters // Biometrika. 1982. V. 69. P. 647-652.
Список литературы 743
178. Paulson E. An approximate normalization of the analysis of variance distribution // AMS.
1942. V. 13. P. 233-235.
179. Camp В. Н. Approximation to the point binomial // AMS. 1951. V. 22. P. 130-131.
180. Pratt J. W. A normal approximation for binomial, F, beta, and other common related tail
probabities. 2 // JASA. 1968. V. 63. P. 1457-1483.
181. Титенко И. М. Оценка доверительных границ параметра биномиального распреде-
распределения // Надежность и контроль качества. 1983. № 12. С. 31—36.
182. Дамидович Н. О., Курский И.Ю. и др. О приближенных формулах вычисления
доверительных границ вероятностей при биномиальном плане испытаний // Завод.
лаб. 1988. Т. 54, №3. С. 95-98.
183. Noether G. E. Some simple distribution free confidence intervals for the center of a
symmetric distribution // JASA. 1973. V. 68. P. 716-719.
184. Багдонавичюс В., Адоменас В. Исследование одного распределения и оценок его
параметров // Применение теории вероятностей и математической статистики: Сб.
Вып. 5. Вильнюс, 1983.^ С. 123-130.
185. Hahn G. J. A simultaneous prediction limit on the means of future samples from an
exponential distribution // Technometrics. 1975. V. 17. P. 341-345.
186. Nelson W.B. Two-sample prediction, General Elect. Сотр., TIS Rep., 68-C-40.
187. Green J. Asymptotic sample size for given confidence intervals length // JRSS. Sec. C.
1982. V. 31. P. 298-300.
188. Нейман Ю. Вводный курс теории вероятностей и математической статистики / Пер.
с англ. — М.: Сов. Радио, 1962.
189. Леман Э.Л. Проверка статистических гипотез / Пер. с англ. — М.: Физматгиз, 1964.
190. Чернов Г., Мозес Л. Е. Элементарная теория статистических решений / Пер. с англ. —
М.: Сов. Радио, 1962.
191. Закс III. Теория статистических выводов / Пер. с англ. — М.: Мир, 1975.
192. Де Гроот М. Оптимальные статистические решения. — М.: Мир, 1974.
193. Pearson К. Experimental discussion of the (x , p) test for goodness-of-fit // Biometrika.
1932. V. 24. P. 351-381.
194. Gochran W. G. The chi-squared test of goodness-of-fit // AMS. 1952. V. 23. P. 315-345.
195. Gochran W. G. Some methods for strengthening the common chi-squared tests // Bio-
Biometrika. 1954. V. 10. P. 417-451.
196. Kallenberg W. C. M., Oosterhoff J., Schrever B. F. The number of classes in chi-squared
goodness-of-fit tests // JASA. 1985. V. 80, №392. P. 959-968.
197. Mann H. В., Wald A. On the choice of number of intervals in the application of the chi-
square test // AMS. 1942. V. 18. P. 50-54.
198. Щербинин А. Ф. Об относительной эффективности критерия хи-квадрат и его ана-
аналогах // Надежность и контроль качества. 1986. №2. С. 13-17.
199. Dahiya R. С, Gurland J. How many classes in the Pearson chi-square test? // JASA.
1973. V. 68, №343. P. 707-712.
200. Hamdan M. A, The number and width of classes in the chi-square test // JASA. 1963.
V. 58, №303. P. 678-679.
201. Best D. J., Rayner J.G.M. Are two classes enough for the goodness-of-fit test? //
Statistica Neerlandica. 1981. V. 35. P. 157-163.
202. Dahya R. C, Gurland J., Pearson K. Chi-squares test of fit with random intervals //
Biometrika. 1972. V. 59, №1. P. 147-153.
203. Lawal H. J9., Upton G. J. G. An approximation to the distribution of the %2 goodness-of-fit
statistic for the use with small expectations // Biometrika. 1980. V. 67, №2. P. 447-453.
204. Larntz K. Small-sample comparisons of exact levels for chi-square goodness-of-fit statistics
// JASA. 1978. V. 73. P. 253-263.
205. Yarnold J. K. The minimum expectation in %2 goodness-of-fit tests and the accuracy of
approximations for the accuracy of approximations for the null distribution // JASA.
1970. V. 65. P. 864-886.
206. Wishart J. x2 probabilities for large number of degrees of freedom // Biometrika. 1956.
V. 43. P. 92-95.
744 Список литературы
207. Романовский В. И. Элементарный курс математической статистики. — M.-JL: Госпла-
низдат, 1939.
208. Barnett A., Eisen E. A quartile test for differences in distribution // JASA. 1982. V. 77,
№377. P. 47-51.
209. Орлов А, И, Распространенная ошибка при использовании критериев Колмогорова
и омега-квадрат // Завод, лаб. 1985. Т. 51, №1. С. 60-62.
210. Kolmogorov А. N. Confidence limits for an unknown distribution function // AMS. 1941.
V. 12. P. 461-463.
211. Смирнов Н. В. Оценка расхождения между эмпирическими кривыми распределений
в двух независимых выборках // Бюллетень МГУ. Сер. А. Вып. 2. 1939. С. 13—14.
212. Stephens M. A. Use of Kolmogorov-Smirnov, Oramer-von Mises and related statistics
without extensive tables // JRSS. S. B. 1970. V. 32. P. 729-731.
213. Chandra M., Singpurwalla N. D., Stephens M. A. Kolmogorov statistics for tests of fit for
the extreme»value and Weibull distributions // JASA. 1981. V. 76, №375. P. 729-731.
214. Koziol J. A., Byar D. P. Percentage points of the asymptotic distributions of one and two
sample K—S statistics for truncated or censored data // Technometrics. 1975. V. 17, №4.
P.507-510.
215. Stephens M. A. EDF statistics for goodness-of-fit and some comparisons // JASA. 1974.
V. 69. P. 730-737.
216. Смирнов Н. В, О распределении пш -критерия Мизеса // Математический сб. 1937.
2D4), №5. С. 973-993.
217. Смирнов Н. В. О критерии Крамера—фон Мизеса // Успехи матем. наук (новая
серия). 1949. Т. 4, №4C2). С. 196-197.
218. Мартынов Г. В. Критерии омега-квадрат. — М.: Наука, 1978.
219. Tiku M. L. Ohi-square approximation for the distributions of goodness-of-fit statistics UN
and Wjj /I Biometrika. 1965. V. 52, №3-4. P. 630-633.
220. Renyi A. On the theory of order statistics // Acta Mathem. Acad. Scientiarum Hungarical.
1953. V. 4. P. 191-232.
221. Залесский Б, А., Ольшевская О. В. О функции распределения статистики омега-
квадрат при малых выборках // Завод, лаб. 1989. №7. С. 103-105.
222. Goto Ishii. On the exact probabilities of Renyi tests // Annal. Inst. Stat. Math. 1959.
V. 2. P. 17-24.
223. Anderson T. W., Darling D. A. A test for goodness-of-fit // JASA. 1954. V. 49. P. 765-769.
224. Lewis P. A. W. Distribution of the Anderson-Darling statistic // AMS. 1961. V. 32.
P. 1118-1123.
225. Watson G. S. Goodness-of-fit tests on a circle // Biometrika. 1961. V. 48, №1-2.
P. 109-114.
226. Щербинин А. Ф. Критерии согласия омега-квадрат по группированным наблюдениям
// Надежность и контроль качества. 1983. №1. С. 11-18.
227. Sinclair CD., Spurr В. D., Ahmad V.I. Modified Anderson-Darling test // Commun.
Stat.-Theor. Meth. 1990. V. 19, №10. P. 3677-3686.
228. Мардиа К. Статистический анализ угловых наблюдений.—М.: Наука, 1978.
229. Kuiper N. Н. Tests concerning random points on a circle // Proc. Konikl. Nederl. Akad.
Van Wettenschappen. 1960. S. A. V. 63. P. 38-47.
230. Stephens M. A. The goodness-of-fit statistic Fn-distribution and significance points //
Biometrika. 1965. V. 52. №3-4. P. 309-321.
231. O'Reilly F. J., Stephens M. A. Characterization and goodness-of-fit tests // JRSS. 1982.
232. Darling J. The Kolmogorov-Smirnov, Cramer-von Mises tests // AMS. 1957. V. 28.
P. 823-838.
233. Durbin J. Some methods of constructing exact tests // Biometrika. 1961. V. 48, №1-2.
P. 41-57.
234. Pearson K. On a method of determining whether a sample of size n supposed to have
been drawn from a parent population having a known probability integral has probably
been drown of random // Biometrika. 1933. V. 25. P. 379-410.
Список литературы 745
235. Pearson E. S. The probability integral transformation for testing goodness-of-fit and
combining independent tests of significance // Biometrika. 1939. V. 30. P. 134-148.
236. Kaizenbeisser W., Hackl P. An alternation to the Kolmogorov-Smirnov two-sample test
// Commun. Stat.-Theor. Meth. 1986. V. 15, №4. P. 1163-1177.
237. Anderson T. W. On the distribution of the two-sample Cramer-von Mises criterion //
AMS. 1962. V. 33. P. 1148-1159.
238. Frozini B. V. A survey of a class of goodness-of-fit statistics // Metron. 1978. V. 36, № 1-2.
P. 3-49.
239. Frozini B. V. On the distribution and power of a goodness-of-fit statistic with paramet-
parametric and nonparametric applications, „Goodness-of-fit" / Ed. by Revesz P., Sarkadi K.,
Sen P. K., Amsterdam-Oxford-New York: North-Holland. Publ. Сотр., 1987, P. 133-154.
240. Shapiro S. S., Wilk M. B. An analysis of variance test for normality (complete samples)
// Biometrika. 1965. V. 52, №3. P. 591-611.
241. Lloyd E. N. Least-squares estimation of location and scale parameters using order statistics
// Biometrika. 1952. V. 39. P. 88-95.
242. Shapiro S. 5., Wilk M. B. Approximations for the null distribution of the W statistic //
Technometrics. 1968. V. 10, №4. P. 861-866.
243. Shapiro S. 5., Wilk M. В., Chen H. J. A comparative study of various tests for normality
// JASA. 1968. V. 63, №324. P. 1343-1372.
244. Shapiro S. Я., Francia R. S. An approximate analysis of variance test normality // JASA.
1972. V. 67, №337. P. 215-216.
245. Weisberg S., Bingham C. An approximate analysis of variance test for non-normality
suitable for machine calculation // Technometrics. 1975. V. 17, №1. P. 133-134.
246. Royston J. P. Correcting the Shapiro-Wilk test W for ties // J. Stat. Comput. Simul.
1989. V. 31, №4. P. 237-249.
247. Vasicek O. A test for normality based on sample entropy // JRSS. 1976. V. 38, №1.
P. 54-59.
248. Prescott P. On a test for normality based on sample entropy // JRSS. 1976. V. 38, №3.
P. 254-256.
249. Hegazy Y. A. S., Green J. R. Some new goodness-of-fit tests using order statistics // Appl.
Statist. 1975. V. 24, №3. P. 299-308.
250. С sorgo H., Revesz P. Quantile processes and sums of weighted spasing for composite
goodness-of-fit. In: Statistics and Related Topics, North Holland, Amsterdam, N. Y., 1981.
P. 69-87.
251. Aly E.-E., С sorgo M. Quadratic nuisance parameter-free goodness-of-fit tests in the
presence of location and scale parameters // CJS. 1985. V. 13. P. 53-70.
252. Aly E.-E., Shayib M. A. On some goodness-of-fit tests for the normal, logistic and extreme-
value distributions // Commun. Stat.-Theor. Meth. 1992. V. 21, №5. P. 1297-1308.
253. Filliben J. J. The probability plot correlation coefficient test for normality // Technomet-
Technometrics. 1975. V. 17, ЛН. P. 111-117.
254. Gulledge T. Rn Looney S. W. An alternative test for normality Comput. Sci. And Statist //
Proc. 16-th Symp. Interface, Atlanta, Ga, Marth 1984, Amsterdam e.a., 1985. P. 265-267.
255. La Brecque J. Goodness-of-fit tests based on nonlinearity in probability plots // Techno-
Technometrics. 1977. V. 19, №3. P. 293-306.
256. Locke C, Spurrier J. D. The use of [/-statistics for testing normality against nonsymmetric
alternative // Biometrika. 1976. V. 63, №1. P. 143-147.
257. Locke C, Spurrier J. D. The use of [/-statistics for testing normality against alternatives
with both tails heavy or both tails light // Biometrika. 1977. V. 64, №3. P. 638-640.
258. Oja H. Two location and scale goodness-of-fit tests // Biometrika. 1981. V. 68, №3.
P. 637-640.
259. Davids С. Е., Quade D. [/-statistics for skewness or symmetry // Commun. Stat.-Theor.
Meth. 1978. V. A7, №5. P. 413-418.
260. Oja H. New tests for normality // Biometrika. 1983. V. 70, №1. P. 279-299.
261. Geary R. C. The ratio of the mean deviation to the standard deviation as a test of
normality // Biometrika. 1935. V. 27. P. 310-322.
746 Список литературы
262. Geary R. С. Moments of the ratio of the mean deviation to the standard deviation for
normal samples // Biometrika. 1936. V. 28. P. 295-307.
263. Geary R. С Testing for normality // Biometrika. 1947. V. 34. P. 209-242.
264. David H. A., Hartley H. 0., Pearson E. S. The distribution of the ratio, in a single normal
sample, of range to standard deviation // Biometrika. 1954. V. 41. P. 482-493.
265. Pearson E. S., Stephens M. A. The ratio of range to standard deviation in the same normal
sample // Biometrika. 1964. V. 512, №3-4. P. 484-487.
266. Thomson G. W. Bounds for the ratio of range to standard deviation // Biometrika. 1985.
V. 42, №1-2. P. 268-269.
267. Spiegelhalter D. J. A test for normality against symmetric alternatives // Biometrika.
1977. V. 64, №2. P. 415-418.
268. Spiegelhalter D. J. An omnibus test for normality for small samples // Biometrika. 1980.
V. 67, №2. P. 493-496.
269. Sarkadi K. On testing for normality, A Magyar Tud. Akad., Matem. Kutato Intezet.
KozlemenyeL, V. A5, 1960. P. 269-275.
270. Золотухина Л. А., Винник Е. В. Эмпирическое исследование мощности критерия
Саркади и его модификации // Завод, лаб. 1985. Т. 52, №1. С. 51-55.
271. Kawata Т., Sakamoto H. On the characterization of the normal population by the
independence of the sample mean and the sample variance // J. Math. Soc. Japan. 1949.
ЛН. P. 111-115.
272. Заингер А. А. О независимых выборках из нормалвной совокупности // Успехи
матем. наук. 1951. Т. VI. Вып. 5. С. 172-175.
273. Коган А. М., Ландеман Э. М. Информационный аналог теоремы о независимости
среднего и дисперсии // Проблемы устойчивости стохастических систем: Тр. семи-
семинара. — М.: ВНИИСИ, 1985. —С. 763-767.
274. Lin Ch.-Ch.y Mudholkar G. S. A simple test for normality against asymmetric alternatives
// Biometrika. 1980. V. 67, №2. P. 455-461.
275. Nelson B. B. Testing for normality // J. of Quality Technology. 1983. V. 15, №3.
P.141-143.
276. Nelson L. S. A simple test for normality // J. of Quality Technology. 1983. V. 13. P. 76-77.
277. Mudholkar G. 5., Lin G. C. On two applications characterization theorems to goodness™
of-fit // Goodness-of-fit, Amsterdam, 1987. P. 395-414.
278. Martinez J., Iglewicz B. A test for departure from normality based on a biweight estimator
of scales // Biometrika. 1981. V. 68, № 1. P. 331-333.
279. DyAgostino R.B. An omnibus test of normality for moderate and large size samples //
Biometrika. 1971. V. 58, №2. P. 341-348.
280. DyAgostino R. B. Small sample probability points for the D-test of normality // Biometri-
Biometrika. 1972. V. 59, №1. P. 219-221.
281. Dawton F. Linear estimates with polynomial coefficients // Biometrika. 1966. V. 53.
P. 129-141.
282. D'Agostino R. B. Monte Carlo power comparisons of the Wf and D tests of normality //
Common. Stat. 1973. V. 1. P. 545-551.
283. Pearson E. S. A further development of tests for normality // Biometrika. 1930. V. 22.
P. 239-249.
284. D'Agostino R. В., Pearson E. S. A further development of tests departure from normality.
Empirical results for the distribution of 62 and \fb\ // Biometrika. 1973. V. 60, №3.
P. 613-622.
285. D'Agostino R. B. Transformation to normality of the null distribution of gi // Biometrika.
1970. V. 57. P. 679-681.
286. Anscombe F. J., Glynn W. J. Distribution of the kurtosis statistic bi for normal samples
// Biometrika. 1983. V. 70, №1. P. 227-234.
287. Bowman K. 0., Stenton L. R. Omnibus test contours for departures from normality based
on л/К and b2 II Biometrika. 1975. V. 62, №2. P. 243-249.
288. Littele R. G., Folks J. L. Asymptotic optimality on Fisher's method of combining inde-
independent tests. 11 // JASA. 1973. V. 68. P. 193-194.
Список литературы 747
289. Jarque С. М., Вега А. К. A test for normality of observation and regression residuals //
Internat. Stat. Review. 1987. V. 55, Ш2. P. 163-172.
290. Fenerverger A., Mureika R. A. The empirical characteristic function and its application
// Annal. Statist. 1977. V. 5. P. 88-97.
291. Heaihote C. R. A test of goodness-of-fit for symmetric random variables // Austr. J.
Statist. 1972. V. 14. P. 172-181.
292. Kontrouvelis LA. A goodness-of~fit test of simple hypothesis based on the empirical
characteristic function // Biometrika. 1980. V. 67. P. 138-240.
293. Murota K., Takeuchi K. The Studentized empirical characteristic function and its appli-
application to test for the shape of distribution // Biometrika. 1981. V. 68. P. 55-65.
294. Wilk M. В., Shapiro S. S. The joint assessment of normality of several independent samples
// Technometrics. 1968. V. 10, №10. P. 825-839.
295. Винник Е. Вп Золотухина Л. А. Применение модифицированного критерия Саркади
для проверки гипотезы нормальности по совокупности малых выборок // Завод, лаб.
1987. Т. 53, №7. С. 51-54.
296. Wald A., Wolfowitz J. An exact test of randomness in the nonparametric case based on
serial correlation // AMS. 1943. V. 14. P. 378-388.
297. Арлей Н., Бух К. Введение в теорию вероятностей и математическую статистику /
Пер. с англ.^М.: ИЛ, 1951.
298. Shapiro S. S., Wilk M.B. An analysis of variance test for the exponential distribution
(complete samples) // Technometrics. 1972. V. 14. P. 355-370.
299. Samanta M., Schwarz С J. The Shapiro-Wilk test for exponentiality based on censored
data // JASA. 1988. V. 83, №402. P. 528-531.
300. Stephens M. A. On the W test for exponentiality with origin known // Technometrics.
1978. V. 20. P. 353-357.
301. Spinelli J. J., Stephens M. A. Tests for exponentiality when origin and scale parameters
are unknown // Technometrics. 1987. V. 29, №4. P. 471-476.
302. Spurrier J. D. On overview of tests of exponentiality // Commun. Stat.-Theor. Meth.
1984. V. 13. P. 1635-1654.
303. Sarhan A. E. Estimation of the mean and standard deviation by order statistics // 1954.
AMS. V. 25. P. 317-328.
304. Peitit A, N. Tests for the exponentiality distribution with censored data using Cramer-
von Mises statistics // Biometrika. 1977. V. 64, №3. P. 629-632.
305. Brain C. W., Shapiro S. S. A regression test for exponentiality: censored and complete
samples // Technometrics. 1983. V. 25, №1. P. 69-76.
306. Kimber A. C. Tests for the exponential, Weibull and Gumbel distributions based on the
stabilized probability plot // Biometrika. 1985. V. 72, №3. P. 661-663.
307. Michael J. R. The stabilized probability plot // Biometrika. 1983. V. 70. P. 11-17.
308. Coles S. G. On goodness-of-fit tests for the two-parameter Weibull distribution derived
from the stabilized probability plot // Biometrika. 1989. V. 76, №3. P. 593-598.
309. Moran P. A. P. The random division of an interval, 11 // JRSS. 1951. V. 13. P. 147-150.
310. Кокс С, Льюис П. Статистический анализ последовательностей событий / Пер.
с англ. — М.: Мир, 1969.
311. Klimko L, Л., Antle С. Е., Rademaker A. W., Rockette H. E. Upper bounds for the power of
invariant tests for the exponential distribution with Weibull alternative // Technometrics.
1975. V. 17, №3. P. 357-360.
312. Tanaka S., Ichikawa M. Approximate formula of coefficient of variation for Weibull
distribution // Reliability Engineering. 1983. V. 4, №3. P. 141-143.
313. Hollander M., Proshan F. Testing whether new is better than used // AMS. 1972. V. 43.
P. 1136-1146.
314. Siurges H. A. The choice of a class interval // JASA. 1926. V. 21. P. 65-66.
315. Kochar S. C. Testing exponentiality against monotone failure rate average // Commun.
Stat.-Theor. Meth. 1985. №2. P. 381-392.
316. Klefsjo B. Some tests against aging based on the total time on test transform // Commun.
Stat.-Theor. Meth. 1983. V. 14, №12. P. 917-927.
748 Список литературы
317. Deshande J. V. A class on tests for exponentiality against Increasing failure rate average
alternative // Blomertlka. 1983. V. 70. P. 514-518.
318. Barlow R. E. Likelihood ratio tests for restricted families of probability distributions //
AMS. 1968. V. 39. P. 547-560.
319. Bickel P. J., Doksum K. Tests for monotone failure rate based on normalized spacing //
1969. AMS. V. 40. P. 1216-1235.
320. Klefsjo B. Testing exponentiality against HNBUE // Scand. J. Statist. 1983. V. 10.
P. 67-75.
321. Hollander M., Proshan F. Tests for the mean residual life. A methods and corrections //
Biometrika. 1980. V. 67. P. 259-261.
322. Epps T. W., Pulley L. B. A test of exponentiality vs. monotone-hazard alternatives from
the empirical characteristics function // JRSS. Sec. B. 1986. V. 48, №2. P. 206-216.
323. Bergman B. On the replacement and the total time on test concept // Scand. J. Statist.
1979. V. 6. P. 161-168.
324. Bergman B. Crossings In the total time on test plot // Scand. J. Statist. 1977. V. 4.
P. 171-177.
325. Barlow R. E., Campo R. Total time on test processes and applications to failure data
analysis // Reliability and fault free analysis (ed. Barlow, Fussel and Singpurwalla), SIAM,
Philadelphia, 1975.
326. Dipankar Bandyopadhyay^ Basu A. P. К note on tests for exponentiality by Deshpande
// Biometrika. 1989. V. 76, №2. P. 403-405.
327. Sherman B. A random variable related to the spacing of sample values // AMS. 1950.
V. 21, №3. P. 339-361.
328. Sherman B. Percentlles of the шп statistic // AMS. 1957. V. 28, №1. P. 257-261.
329. Bartholomew D. J, Note on the use of Sherman's statistics as a test for randomness //
Biometrika. 1954. V. 41. P. 556-558.
330. Hartley H. O. The maximum F^ratio as a short-cut test of heterogeneity of variance //
Biometrika. 1950. V. 37. P. 308-312.
331. Greenwood V. The statistical study of Infection disease // JRSS. Sec. A. 1946. V. 109.
P. 85-110.
332. Stephens M. A. Further percentage points for Greenwood's statistics // JRSS. Sec. A.
1981. V. 144. P. 364-366.
333. Burrows P. M. Selected percentage points of Greenwood's statistics // JRSS. Sec. A. 1981.
V. 142. P. 256-258.
334. Deshpande J. V. A class of tests for exponentiality against increasing failure rate average
alternatives // Biometrika. 1983 V. 70. P. 514-518.
335. Engelhardt M. E., Bain L. J. Uniformly more powerful unbiased tests for the parameters
of the gamma distribution // Theory and Applications of Reliability. V. 1. N. Y.: Acad.
Press. — P. 307-314.
336. Lawless J. F. Statistical models and methods for lifetime data. — N. Y.: J. Welley, 1982.
337. Keating J. P., Glaser R. E., Ketchum N. S. Testing hypotesis about the shape parameter
of a gamma distribution // Technometrics. 1990. V. 32, № 1. P. 67-82.
338. Kimball B. F. Some basic theorems for developing tests of fit for the case of the non-
parametric probability distribution function. 1 // AMS. 1947. V. 18. P. 540-548.
339. Moran P. A. P. The random division of an Intervals // JRSS. 1947. Sec. B. V. 9. P. 92-98.
340. Smirnoff N. Sur la distribution de nuj2 // Compte Rendus de l'Academie des Sciences.
Paris, 1932. №202. P. 449.
341. Cheng R.C.H., Thornton K.M. Selected percentage points of the Moran statistic //
J. Stat. Comput. Simul. 1988. V. 30. P. 189-194.
342. Cheng R. С. Н., Stephens M. A. A goodness~of™fit using Moran's statistic with estimated
parameters // Biometrika. 1989. V. 76, №2. P. 385-392.
343. Cheng S. W., Spiring F. A. A test to Identify the uniform distribution with applications
to probability plotting and other distributions // IEEE Trans. Reliability. 1987. V. R-36,
№1. P. 98-105.
Список литературы 749
344. Kosik P., Sarkadi К. A new goodness-of-fit test // Proc. of 5-th Pannonian Symp. of
Math. Stat., Visegrad, Hungary, 20-24 May, 1985. P. 267-272.
345. Dudewicz E.«/., van der Meulen E. C. Entropy-based tests of uniformity // JASA. 1981.
V. 76, №376. P. 967-974.
346. Neyman J. „Smooth" tests for goodness-of-flt // Scand. Aktuarietidsrlft. 1937. V. 20.
P.149-199.
347. Young D. L. The linear nearest neighbour statistic // Biometrika. 1982. V. 69, №2.
P. 477-480.
348. Clark P. J., Evans F. C. Distance to nearest neighbour as a measure of spatial relationships
in populations // Ecology. 1954. V. 35. P. 445-457.
349. Finder D. A., Witherick M.E. Nearest-neighbour analysis of linear point patterns //
Tijdshrlft voor Economischl th social Geografie. 1973. V. 64. P. 160-163.
350. Quesenherry G. P., Miller F. L. Power studies of some tests for uniformity // J. Statist.
Comput. Simul. 1977. V. 5. P. 169-191.
351. David F. N. On Neyman's „smooth" test for goodness-of-fit // Biometrika. 1939. V. 31.
P.191-199.
352. Miller F. L., Quesenberry G. P. Power studies of some tests for uniformity, 11 // Commun.
Stat.-Simul. Comput. 1979. S. B. V. 8, №3. P. 271-290.
353. Solomon H., Stephens M. A. On Neyman's statistics for testing uniformity // Commun.
Stat.-Simul. Comput. 1983. V. 12. P. 127-134.
354. Смирнов H. В. О критерии симметрии закона распределения случайной величины //
ДАН СССР. 1947. Т. 56, №1. С. 13-16.
355. Wilcoxon F. Individual comparisons by ranking methods // Biometrics, Bull. 1945. V. 1.
P. 80-83.
356. Antille A., Kersting G., Zucchini W. Testing symmetry // JASA. 1982. V. 77, №379.
P. 639-646.
357. Bhaitacharya P. K., Gastwirth J. L., Wright A, L. Two modified Wilcoxon tests for sym™
metry about an unknown location parameters // Biometrika. 1982. V. 69, № 2. P. 377-382.
358. Antille A., Kersting G. Tests for symmetry // Zeitschrift fur Wahrscheinliehkeitstheorie
und Verwandte Gebiete. 1977. V. 39. P. 235-255.
359. Finch S. J. Robust univariate test of symmetry // JASA. 1977. V. 72, №358. P. 387-392.
360. Boos D. D. A test for symmetry associated with the Hodges-Lehmann estimator // JASA.
1982. V. 77, №379. P. 647-651.
361. Gupta M.K. An asymptotically nonparametric test of symmetry // AMS. 1967. V. 38.
P. 849-866.
362. Moses L. E. Query: Confidence limits from rank tests // Technometrics. 1965. V. 7.
P. 257-260.
363. Frazer D. A. S. Most powerfull rank-type tests // AMS. 1957. V. 28. P. 1040-1043.
364. Klotz J. Smoll sample power and efficiency for the one sample Wicoxon and normal scores
test // AMS. 1963. V. 34. P. 624-632.
365. Гаек Я., Шидак 3. Теория ранговых критериев / Пер. с англ. — М.: Наука, 1971.
366. Johnson N. L. Systems of frequency curves generated by methods of translation //
Biometrika. 1946. V. 36. P. 146-148.
367. Висленев Ю. С, Самосейко В. Ф. О выборе закона распределения по моментам слу-
случайной величины // Надежность и контроль качества. 1987, №5. С. 21-24.
368. Бостандэюиян В. А. Распределение Джонсона (препринт), ИХФ АН СССР, Черного™
ловка, 1978.
369. Johnson N. L. Tables to facilitate fitting Su frequency curves // Biometrika. 1965. V. 52.
P.547-558.
370. Демаков И. П., Потепун В. Е. Графоаналитический метод построения полуэмпири-
полуэмпирических функций распределения малых выборок // Труды метрологических институ-
институтов СССР. Общие вопросы метрологии: Сб.^Л.: ВНИИМ, 1972.^ С. 96-102.
371. Статистические методы оценки качества и надежности промышленных изделий по
результатам малого числа испытаний: Методологические указания.—Уфа: Изд-во
УАИ им. С. Орджоникидзе, 1983.
750 Список литературы
372. Демаков И. П. Проблема принятия решения по малому числу наблюдений (обзор
состояния и перспективы) // Методы статистического анализа и обработки малого
числа наблюдений при контроле качества и надежности приборов и машин: Сб. — Л.:
ЛДНТП, 1974. —С. 4-18.
373. Гаскаров Д. В., Шаповалов В. И. Малая выборка. — М.: Статистика, 1978.
374. Королькова Л. И. Непараметрическое оценивание функции распределения по малой
выборке. — Челябинск, 1988, ВИНИТИ, №6602-888.
375. Корольков И. В., Королькова Л. И. Оценивание по малой выборке с использованием
бета-распределения // Проблемы разработки и использования гибких автоматизиро-
автоматизированных производств на предприятиях уральского региона: Сб. — Свердловск: УНЦ
АН СССР. —С. 12.
376. Горский Л. К. Статистические алгоритмы исследования надежности. — М.: Наука,
1970.
377. Алгоритмы и программы восстановления зависимостей / Под ред. В. Н. Вапника. —
М.: Наука, 1984.
378. Еременко И. В., Свердлик А. Н. Об одном методе построения законов распределения
величин при малом числе испытаний // Некоторые вопросы специального приме-
применения вычислительной техники: Сб.—Л.: ЛВИКА им. А. Ф. Можайского, 1963.—
С.18-29.
379. Демидович Б. П., Марон И. А., Шувалова Э. 3. Численные методы анализа. — М.:
Физматгиз, 1963.
380. Попов С. А., Шаповалов В. И. Об оценивании закона распределения по ограниченным
данным // Надежность и контроль качества. 1982. №11. С. 29-32.
381. Дружинин Г. В., Воронова О, В. Сравнение методов построения эмпирической функ-
функции распределения по малому числу наблюдений // Надежность и контроль качества.
1983. №1. С. 11-18.
382. Чавчанидзе В. В., Кумсенишвчлч В. А. Об определении законов распределения на
основе малого числа наблюдений // Применение вычислительной техники для авто™
матизации производства. — М.: Машгиз, 1961.
383. Гаскаров Д. В., Голинкевич Т. А., Мозгалевский А. В. Прогнозирование технического
состояния и надежности радиоэлектронной аппаратуры. — М.: Сов. радио, 1974.
384. Гаскаров Д. В., Мозгалевский А. В., Шаповалов В. И. Некоторые вопросы прогнози-
прогнозирования по ограниченной информации // Электронная техника. 1975, с. 8, вып. 4C4).
С.15-20.
385. Диттл Р. Даю. А., Рубин Д. Б. Статистический анализ данных с пропусками / Пер.
с англ. — М.: Финансы и статистика, 1991.
386. Cochran W. G., Сох СМ. Experimental design. N.Y.: J. Willey a. Sons, 1957.
387. Satterwaite R. An approximate distribution of estimates of variance components //
Biometrics. 1946. V. 2. P. 110.
388. Welch B. L. The generation of „Student's" problems when several different population
variance are involved // Biometrika. 1947. V. 34. P. 28-35.
389. Lord E. The use of range in place of standard deviation, in the t-test // Biometrika. 1947.
V. 34. P. 41-67.
390. Daly J. F. The use of the sample range in an analogue of Student's t-test // AMS. 1946.
V. 17. P. 71-74.
391. Walsh J.E. Some significance tests based on order statistics // AMS. 1946. V. 17, №1.
P. 44-52.
392. Wolfe D.A. Two-stage two^sample median test // Technometrics. 1977. V. 19, №4.
P. 495-501.
393. Артемьев Е. JO., Мартынов Е. М. Вероятностные методы в психологии. — М.: Изд-во
МГУ, 1975.
394. Paulson E. On optimum solution to the ^-sample slippage problem for the normal
distribution // AMS. 1952. V. 23, 4. P. 610-616.
395. Baily R. Tables of the Bonferroni t statistic // JASA. 1977. V. 72, №358. P. 469-478.
Список литературы 751
396. Nelson P. R. Exact critical points for the analysis of means // Oommun. Stat.-Theor.
Meth. 1982. V. 11, №6. P. 699-709.
397. Hochberg Y. Some generalization of the T-method in simultaneous inference // J. Multi-
var. Anal. 1974. №4. P. 224-234.
398. Stoline M.R., Ury H. K. Tables of the studentIzed maximum modules distributions and
an application to multiple comparisons amond means // Technometrics. 1978. V. 21, № 1.
P. 87-93.
399. Half G. J., Hendricson R. W. A table of percentage points of the largest absolute value
of k Student t variates and its applications // Biometrika. 1971. V. 58. P. 323-332.
400. Pillai К. С S., Ramachandran K. V. On the distribution of the ratio of the г-th observation
In an ordered sample from a normal population to an Independent estimate of the standard
deviation // AMS. 1954. №3. P. 565-572.
401. Шеффе Г. Дисперсионный анализ. — М.: Физматгиз, 1963.
402. Newman D. The distribution of the range in samples from normal populations, expressed
In terms of an Independent estimate of standard deviation // Biometrika. 1939. V. 31.
P. 20-30.
403. Keuls M. The use of the studentized range in connection with an analysis of varianse //
Euphytlca. 1952. V. 1. P. 112-122.
404. Duncan D. B. Multiple range and multiple F test // Biometrics. 1955. V. 11. P. 1-42.
405. Link R. F., Wallace D. L. Some short cuts to allowances, Princeton Univ., March, 1957.
406. Kurtz Т.Е., Link R. F., Tukey J. W., Wallace D.L, Short-cut multiple comparisons for
balanced single and double classification: part 1, Results // Technometrics. 1965. V. 7.
P. 95-161.
407. Pearson E. S. The analysis of variance in classes of non-normal variation // Biometrika.
1931. V. 23. P. 114-134.
408. Geary R. C. Testing for normality // Biometrika. 1947. V. 23. P. 209-241.
409. Gay en A. K. The distribution of the variance ratio in random samples of any size drawn
from non-normal universes // Biometrika. 1950. V. 37. P. 236-255.
410. Arizono /., Ohia M. A test of homogeneity of variances based on sample entropy // Bull.
Osaka Prefect. A, v. 36, №1, 1987. P. 29-37.
411. Bartlett M. S. Properties of sufficiency of statistical tests // Proc. Roy. Soc. 1937. A 160.
P. 268-287.
412. Box G. E. P. A general distribution theory for a class of likelihood criteria // Biometrika.
1949. V. 36. P. 317-346.
413. Wallis W. A., Moore G. H. A significance test for time series analysis // JASA. 1941.
V. 36. P. 401-409.
414. Cochran W. G. The distribution of the largest of a set of estimated variances as a fraction
of their total // Annals of Eugenics. 1941. V. 11. P. 47-52.
415. Bliss G. /., Gohran W. G., Tukey J. W. A rejection criterion based upon the range //
Biometrika. 1956. V. 43. P. 418-422.
416. Hartley H. O. The maximum F-ratio as a short-cut test of heterogeneity of variance //
Biometrika. 1950. V. 37. P. 308-312.
417. Gadwell J. H. Approximating to the distributions of measures of dispersion by a power
of x2 // Biometrika. 1952. V. 40. P. 336-346.
418. Leslie R. Т., Brown В. М. Use of range In testing heterogeneity of variance // Biometrika.
1966. V. 53. P. 221-227.
419. Samiuddin M., Atiqullah M. A test for equality of variance // Biometrika. 1976. V. 63,
№1. P. 206-208.
420. Samiuddin M., Hanif M., Asad H. Some comparisons of the Bartlett and cube root tests
of homogeneity of variance // Biometrika. 1978. V. 65, № 1. P. 218-221.
421. David H. A. The ranking of variance in normal population // JASA. 1956. V. 51.
P. 112-116.
422. Кэндэлл М. Ранговые корреляции. — M.: Статистика, 1975.
423. Nagarsenker P. B. On a test of equality of several exponential survival distributions //
Biometrika. 1980. V. 67, №2. P. 475-478.
752 Список литературы
424. Chen H. J. A new range statistic for comparisons of several exponential location parame-
parameters // Biometrika. 1982. V. 69, ЛН. P. 257-260.
425. Sukhatme P. V. On the analysis of k sample from exponential populations with especial
reference to the problems of random intervals // Statist. Reseach. Memoric. 1936. V. 1.
P. 94-112.
426. Epstein В., Tsao С. К. On the tests based on ordered observation from two exponential
populations // AMS. 1953. V. 24. P. 458-466.
427. Perng S. K. A test for equality of two exponential distributions // Statist. Neerlandica.
1978. V. 32. P. 93-102.
428. Hseih H. K. On testing the equality of two exponential distributions // Technometrics.
1981. V. 23. P. 265-269.
429. Hogg R. V., Tanis E, A, An iterated procedure for testing the equality of several exponen™
tial distributions // JASA. 1963. V. 58. P. 435-443.
430. Singh N., Nagaran P. The likelihood ratio test for the equality of k [^ 2] two parameters
exponential distributions based of type 2 censored samples // J. Stat. Comput. Simul.
1983. V. 18. P. 373-381.
431. Epstein В., Sohel M. Some theorems relevant to life testing from on exponential popula-
populations // AMS. 1954. V. 25. P. 373-381.
432. Singh N. A simple and asymptotically optimal test for the equality of k [^ 2] exponential
distributions based on type 2 censored samples // Commun. Stat.-Theor. Meth. 1985.
V. 14, №7. P. 1615-1625.
433. Вальд А. Последовательный анализ / Пер. с англ. — М.: Физматгиз, 1960.
434. Башаринов А. Е., Флейшман Б. С. Об эффективности метода последовательного ана-
анализа в устройствах обнаружения слабых сигналов в шумах // Радиотехн. и электрон.
1958. Т. 3, №8. С. 42-47.
435. Крапивин В. Ф. Таблицы распределения Вальда. — М.: Наука, 1965.
436. Mann H. Bn Whitney D. R. On a test of whether one of two random variables is stochas-
stochastically larger than the other // AMS. 1947. V. 18. P. 50-60.
437. Singh N. The ratio test for the parameters exponential distributions // Commun. Stat.™
Theor. Meth. 1985. V. 13, №6. P. 116-119.
438. Iman R. L. An approximation to the exact distribution of the Wilcoxon-Mami-Whitney
rank sum test statistic // Commun. Statist. 1976. A5. P. 587-598.
439. Iman R. L. Use of a t-statistic as an approximation to the exact distribution of the
Wilcoxon signed rank test statistic // Commun. Statist. 1974. V. 3. P. 795-806.
440. Fisher R. A., Yates F. Statistical tables for biological, agricultural and medical research.
Edinburgh & London: Oliver and Boyd, 1946.
441. Terry M.E. Some rank order test which are most powerfull against specific parametric
alternatives // AMS. 1952. V. 23. P. 346-366.
442. Hoeffding W. Optimum non-parametric tests // Proc. 11-th Berkley Symp., 1950. P. 83-92.
443. Sidak Z. Tables for two normal-scores rank tests for two-sample location problem // Appl.
Math. 1973. V. 18, №5. P. 333-345.
444. Бернстейн Ф. Сборник статистических таблиц / Пер. с англ. — М.: Статистика, 1968.
445. Mosteller F. A ^-sample test for an extreme population // AMS. 1948. V. 19. P. 58-65.
446. Rosenbaum S. Tables for a nonparametric test of location // AMS. 1954. V. 25. P. 146-150.
447. Haga T. A two-sample rank test on location // Annal. Inst. Stat. Math. 1959/60. V. 11.
P.211-219.
448. Hojek S. Tables for the two-sample Haga test of location // Aplikate Mat. 1978. V. 23,
№4. P. 237-247.
449. Sidak Z., Vondrauek J. A sample non-parametric test of the difference in location of two
populations // Appl. Mat. 1957. V. 2. P. 215-221.
450. Sidak Z. Tables for the two-sample location E-test based on exceeding observations //
Appl. Mat. 1977. V. 22, №3. P. 166-175.
451. Kruskal W. H., Wallis A. Use of ranks in one criterion variance analysis // JASA. 1952.
V. 47. P. 583-621.
Список литературы 753
452. Iman R. L., Davenport J. M. New approximations to the exact distribution at the Kruskal-
Wallis test statistic // Commun. Stat.-Theor. Meth. 1976. V. 5. P. 1335-1348.
453. Nemenyi P. Distribution-free multiple comparisons. New York, State Univ., Downstate
Medical Center, 1963.
454. Wilcoxon F., Wilcox R. A. Some rapid approximate statistical procedures, Lederle Labo-
Laboratories, Ptarl River, New York, 1964.
455. Хеттманспергер Т. Статистические выводы, основанные на рангах / Пер. с англ. —
М.: Финансы и статистика, 1987.
456. Terpstra Т. J. The asymptotic normality and consistency of Kendall's test against trend,
when ties are present In one ranking // Indagationes Math. 1952. V. 14. P. 327-333.
457. Jonckheere A.R. A distribution™free Ic-sample test against ordered alternatives //
Biometrlka. 1954. V. 41. P. 133-145.
458. Odeh R. E. On Jonckheere's Ic-sample test against ordered alternatives // Technometrics.
1971. V. 13, №4. P. 912-918.
459. Lewis J. L. A k sample test based on range Intervals // Biometrika. 1972. V. 59, №1.
P.155-160.
460. Bhapkar V. P., Deshpande J. V. Some nonparametric tests for multisample problems //
Technometrics. 1968. V. 10, №3. P. 578-585.
461. Deshpande J. V. Some nonparametric tests of statistical hypotheses, Dissertation submit™
ted for the Ph. D. degree to the Univ. of Poona, 1965.
462. Deshpande J. V. A nonparametric test based on [/-statistics for the problem of several
samples // J. Indian Statist. Assoc. 1965. V. 3. P. 20-29.
463. Barbur A. D., Cartwright D. /., Donnely J. В., Eagleson G.K. A new rank test for the
fc-sample problem // Commun. Stat.-Theor. Meth. 1985. V. 14, №6. P. 1471-1484.
464. Usawa H. Locally most powerfull rank tests for two-sample problems // AMS. 1960. V. 31.
P. 685-702.
465. Crouse C. F. Distribution free test based on the sample distribution function // Biometri-
ka. 1966. V. 53. P. 99-108.
466. Page E. B. Ordered hypotheses for multiple treatments: A significance test for linear ranks
// JASA. 1963. V. 58. P. 216-230.
467. Frideman M. The use of ranks to avoid the assumption of normality implicit in the analysis
of variance // JASA. 1937. V. 32. P. 675-701.
468. Kendall M. G., Babington Smith. The problem of m rankings // AMS. 1939. V. 10.
P. 275-287.
469. Iman R. L., Davenport J. M. Approximations of the critical region of the Friedman statistic
// Commun. Stat.-Theor. Meth. 1980. V. 9. P. 571-595.
470. Anderson R. L. Use of contingency tables In the analysis of consumer preference //
Biometrics. 1959. V. 15. P. 582-590.
471. Kanneman K. An incidence test for k related samples // Blom. Zeitschrift, ed. 18, 1976.
S. 3-11.
472. Schach S. An alternative to the Friedman test with certain optimality properties // Annal.
of Statistics. 1979. V. 7, P. 537-550.
473. Quade D. Analyzing randomized blocks by weighted rankings, Report SW 18/72, Math.
Center Amsterdam, 1972.
474. Quade D. Using weighted ranking In the analysis of complete blocks with additive block
effects // JASA. 1979. V. 74, №370. P. 680-683.
475. Quade D., Silva С Evaluting of weighted rankings using expected significance level //
Commun Stat.-Theor. Meth. 1980. V. 9. P. 1087-1096.
476. Ehrenberg A. S. C. On sampling from a population of a rankers // Biometrlka. 1952. V. 39.
P. 82-87.
477. Alvo M., Cabilio P., Feigin P. D. Aslmptotlc theory for measures of concordance with
special reference to average Kendall tau // Annal. of Stat. 1982. V. 10, №4. P. 1269-1276.
478. Нискина Н. 17., Тейман А. И., Шмерлинг Л. С. Непараметрические методы статисти-
статистики, основанные на рангах, их применение. — Препринт / ВНИИ системных исследо-
исследований. — М., 1986.
754 Список литературы
479. Ansari A. R., Bradley R. A. Rank-tests for dispersions // AMS. 1960. V. 31, №4.
P. 1174-1189.
480. Siegel S., Tukey J. W. A nonparametric sum of ranks procedure for relative spread in
unpaired samples // JASA. 1960. V. 55, №291. P. 429-445.
481. Capon J. Asymptotic efficiency of certain locally most powerfull rank tests // AMS. 1961.
V. 32, №1. P. 88-100.
482. Sidak Z. Tables for two normal-scores tests for the two-sample scale problem // Aplik.
Matematlky. 1973. V. 18, №5. P. 346-363.
483. Klotz J. Nonparametric tests for scale // AMS. 1962. V. 33, P. 498-512.
484. Savage I. R. Contributions to the theory of rank order statistics — the two-sample case //
AMS. 1956. V. 27. P. 590-615.
485. Sidak Z. Tables for the two-sample Savage rank test optimal for exponential densities //
Aplik. Mat. 1973. V. 18, №5. P. 364-374.
486. Sukhatme B. V. On certain two-sample nonparametric tests for variances // AMS. 1957.
V. 28, №1. P. 188-194.
487. Mood A. On the asymptotic efficiency of certain nonparametric tests // AMS. 1954. V. 25.
P. 514-522.
488. Laubsher N. F., Sieffenc F. E., De Lange E. M. Exast critical values for Mood's distri-
distribution-free test statistic for dispersion and its normal approximation // Technometrics.
1968. V. 10, №3. P. 497-507.
489. Welchser S. Mood's test for dispersion as a counting of triplets // Commun. Stat.-Theor.
Meth. 1985. V. 14, №2. P. 303-306.
490. Sukhatme B. V. A two-sample distribution™free test for comparing variances // Biometri-
ka. 1958. V. 45. P. 544-548.
491. Sukhaime B. V. Testing the hypothesis that two population differ only In location // AMS.
1958. V. 29, №1. P. 60-78.
492. Sukhatme B. V. On certain two-sample nonparametric tests for variances // AMS. 1957.
V. 28, №1. P. 188-199.
493. Sandvik L., Olsson B. A nearly distribution-free test for comparing dispersion in paired
samples // Biometrlka. 1982. V. 69, 32. P. 484-485.
494. Krauih J., Lieneri G.A. Eln lokatlonslnsensltlver DIspersIontest fur zwel unabhanglge
Stichproben [DP-test] // Biometr. Z. 1974. V. 16, №2. S. 83-90.
495. Krauih J., Lienert G.A. Ein lokatlonslnsensitlver DIspersiontest fur zwel abhangige
Stichproben // Biometr. Z. 1974. V. 16, №2. S. 91-95.
496. Kamat A. R. A two-sample distribution-free test // Biometrika. 1956. V. 43. P. 377-387.
497. Bush J. R., Wieand H.S. An asymptotically optimal nonparametric statistic for testing
equally of two normal population means and variances // Commun. Stat.-Theor. Meth.
1982. V. 11, №1. P. 1-12.
498. Bhapkar V. P., Deshpande J. V. Some nonparametric tests for multlsample problems //
Technometrics. 1968. V. 10, №3. P. 578-585.
499. Bhapkar V. P. A nonparametric test for the problem of several samples // AMS. 1961.
V. 32. P. 1108-1117.
500. Ljung G. M., Box G. E. P. On a measure of lack of fit In time-series models // Biometrika.
1978. V. 65. P. 197-203.
501. Dufor J.-Af., Roy R. Some robust exact results on sample for randomness // J. of
Econometrics. 1985. V. 29. P. 257-273.
502. Bhapkar V. P. A nonparametric test for the several sample location problem, Univ. of
North Carolina, Inst. of Statistics, MImeo series, №411, 1964.
503. Foster F. G., Stuart A. Distribution-free tests In tlmeserles dated on the breaking of
records // JRSS. 1954. V. B16, №1. P. 1-22.
504. Cox D. R., Stuart A. Quick sing tests for trend In location and dispersion // Biometrika.
1955. V. 42. P. 80-95.
505. Hsu D. A. Tests for variance shift at an unknown time point // Appl. Statist. 1977. V. 26,
№3. P. 279-284.
Список литературы 755
506. Hsieh Н. К. Nonparametric tests for scale shift at a unknown time point // Commun.
Stat.-Theor. Meth. 1984. V. 13, №11. P. 1335-1355.
507. Wald A., Wolfowitz J. On a test whether two samples are from the some populations //
AMS. 1940. V. 11. P. 147-162.
508. Ramachandran G., Ranganathan J. // J. Madras Univ. 1953. Sec. B. V. 8. P. 76. (Цит.
no [14]).
509. Olmsted P. S. Runs determined in a sample by an arbitrary cut // Bell. System. Techni-
Technical J. 1958. V. 37. P. 55-82.
510. Shaughnessy P. W. Multiple runs distributions: Recurrence and critical values // JASA.
1981. V. 76, №375. P. 732-736.
511. Anderson R.L. Distribution of the serial correlation coefficient // AMS. 1942. V. 13.
P. 34-43.
512. Knoke J. D. Testing for randomness against autocorrelation: Alternative tests // Biometri-
ka. 1977. V. 64, №3. P. 523-529.
513. Knoke J. D. Testing for randomness against autocorrelation: The parametric case //
Biometrika. 1975. V. 62. P. 571-575.
514. Wald A., Wolfowitz J. An exact test for randomness in the non^parametric case based on
serial correlation // AMS. 1943. V. 14. P. 378-388.
515. Stuart A. The efficient of tests on randomness against normal regression // JASA. 1956.
V. 51. P. 285-287.
516. Bariels R. The rank version of von Neimann's ratio test for randomness // JASA. 1982.
V. 77, №377. P. 40-46.
517. Me Gielchrist C. A., Woodyer K. D. Note on a distribution-free CISIM technique //
Technometrics. 1975. V. 17, №3. P. 321-325.
518. Woodward R. H., Goldsmith P. L. Cumulative sum techniques, ICI Monograph., №3,
Oliver and Boyd, London, 1964.
519. Шенк X. Теория инженерного эксперимента / Пер. с англ. — М.: Мир, 1972.
520. Уорсинг Ф., Геффнер Л. Методы обработки экспериментальных данных / Пер.
с англ. —М.: ИЛ, 1949.
521. Irwin J. О. On a criterion for the rejection of outlying observations // Biometrika. 1925.
V. 17. P. 238-250.
522. Grubbs F. E. Simple criteria for testing rejection of outlying observations // AMS. 1950.
V. 21. P. 27-58.
523. David H. A. Revised upper percentage points of the extreme studentized deviate from the
sample mean // Biometrika. 1956. V. 43. P. 450-461.
524. Dixon W. J. Rations involving extreme values // AMS. 1956. V. 22. P. 68-76.
525. Hoaglin D. C, Iglewicz B. Fine-tuning some resistant rules for outlier labeling // JASA.
1987. V. 82, №400. P. 1147-1149.
526. Tietjen G., Moore H. Some Grubb's type statistics for the detection of several outliers //
Technometrics. 1972. V. 14. P. 583-597.
527. Смоляк С. А., Титаренко Б. П. Устойчивые методы оценивания. — М.: Статистика,
1980.
528. Rosner В. On the detection of many outliers // Technometrics. 1975. V. 17. P. 221-227.
529. Rosner B. Percentage points for the RST many outlier procedure // Technometrics. 1977.
V. 19, №3. P. 307-312.
530. Goodness~of-fit techniques, ed. D'Agostino R. B. and Stephens M. A., Marcel Dekker Inc.,
New York and Basel, 1986.
531. Бродский Я. С, Быцань Н. Н., Власенко В. М. Об исключении экстремальных значе-
значений // Завод, лаб. 1975. №7. С. 847-849.
532. Kimber А. С. Tests for many outlier on a exponential sample // JRSS. Sec. C; Appl. Stat.
1982. V. 31. №3. P. 263-271.
533. Fung Karen Yuen, Paul S. R. Comparisons of outlier detection procedures in Weibull
or extreme™value distributions // Commun. Stat.-Simul. Comput. 1985. V. 14, №4.
P. 895-917.
756 Список литературы
534. Mann N. R. Optimal outlier tests for a Weibull model-to identify process changes or
predict failure times // Studies in the Management Sciences. 1982. V. 19. P. 261-270.
535. Bartlett V., Lewis T. Outlier in statistical data // N. Y.: J. Willey, 1978.
536. Dixon R. J. Analysis of extreme values // AMS. 1950. V. 21. P. 488-506.
537. Beckman R. J., Cook R. D. „Outlier... s" // Technometrics. 1983. V. 25. P. 119-163.
538. Darling D. A. On a test for homogeneity and extreme values // AMS. 1952. V. 23, №3.
P. 450-456.
539. Аронов И. З., Золотарев А. О. К вопросу оценки однородности экспериментальных
данных об отказах изделий // Надежность и контроль качества. 1987. №7. С. 3—6.
540. Бахмутов В. Ф., Аронов И. 3. Общий критерий оценки однородности и методика
обработки результатов усталостных испытаний // Надежность и контроль качества.
1986. №5. С. 25-29.
541. Bowker A. H. Computation of factors for tolerance limits on a normal distribution when
sample is large // AMS. 1946. V. 17. P. 238-240.
542. Stange K. Angewandte Statistik, 1 und 2, Berlin-Heidelberg-New York, 1970/1971.
543. Frawwley W. H., Kapadia C. H., Rao J. N., Owen D. B. Tolerance limits based on range
ang mean range // Technometrics. 1971. V. 13. P. 651-655.
544. Mitra S. K. Tables for tolerance limits for normal population based on sample mean or
mean range // JASA. 1957. V. 52. P. 88-94.
545. Resnikoff G. L. Two-sided tolerance limits for normal distribution using the range, Appl.
Mathem. And Statistics Laboratory, Stanford Univ. Technical Report, №33, 1957.
546. Tietjen G. L., Johnson M.E. Exact statistical tolerance limits for sample variances //
Technometrics. 1979. V. 21, №1. P. 107-110.
547. Wiles S. S. Statistical prediction with special reference to the problem of tolerance limits
// AMS. 1942. V. 13. P. 400-409.
548. Hall I. J., Prairie R. R. One-sided prediction interval to contain at least m out of к future
observations // Technometrics. 1973. V. 15, №4. P. 897-914.
549. Lawless J. F. A prediction problem concerning samples from the exponential distribution,
with application in life testing // Technometrics. 1971. V. 13, №4. P. 725-730.
550. Hahn G. J. A simultaneous prediction limits on the means of future samples from an
exponential distribution // Technometrics. 1975. V. 17, №3. P. 341-345.
551. Мог an P. A. P. Some theorems on time series 2: The significance of the serial correlation
coefficient // Biometrika. 1948. V. 35. P. 255-260.
552. Hollin M"., Ingeubleek J.-F., Puri M. L. Linear serial rank tests for randomness against
ARMA alternatives // Ann. Statist. 1985. V. 13. P. 1156-1181.
553. Hollin M., Ingenbleek J.-F., Puri M. L. Linear and quadratic serial rank tests for random-
randomness against social dependence // J. Of Time Serial Annal. 1987. V. 8. P. 409-424.
554. Hollin M., Merald G. Rank-tests for randomness against first order serial dependence //
JASA. 1988. V. 83. P. 1117-1129.
555. Hollin M., Puri M. L. Optimal rank-based procedures for time series analysis: Testing on
ARMA model against other ARMA models // Annal. Statist. 1988. V. 16. P. 402-432.
556. Hollin M., Laforet A., Merald G. Distribution-free tests against dependence: signed or
unsigned ranks? // J. of Stat. Planning and Inference. 1990. V. 24. P. 151-165.
557. Mee R. W. Simultaneous tolerance intervals for normal population with common variance
// Technometrics. 1990. V. 32, №1. P. 83-92.
558. Odeh R. E., Chou Youn-Min, Owen D. H. Sample-size determination for two-sided
/3-expectation tolerance intervals for a normal distribution // Technometrics. 1989. V. 31,
№4. P. 461-468.
559. Браунли К. А. Статистические исследования в производстве. — М.: ИЛ, 1949.
560. Нискина Н. П., Тейман А. И., Шмерлинг Л. С. Двухфакторный дисперсионный ана-
анализ для неполных данных / Препринт. — М.: ВНИИСИ, 1986.
561. Prentice M. J. On the problem of m incomplete ranking // Biometrika. V. 66, P. 167-177.
562. Mack D. A., Skillings J. H. A Friedman-type rank test for main effects in a two-way
ANOVA // JASA. 1980. V. 75, 3372. P. 941-947.
Список литературы 757
563. Mack D. A. A quick and easy distribution-free test for main effects in a two-way ANOVA
// Commun. Stat. 1981. V. 10, №6. P. 571-591.
564. Stange K. Uber einen zweiseitigen Test fur die Korrelationszahle einer zweidimensionalen
Normaverteilung // Statist. H. 1973. V. 14, №3. S. 206-236.
565. Cox D. Д., Stuart A. Quick tests for trend in location and dispersion // Biometrika. 1955.
V. 42. P. 80-95.
566. Nelson L.S. A sign test for correlation // J. of Quality Technology. 1983. V. 15, №4.
P.199-200.
567. Elandt R. С Exact and approximate power function of the non-parametric test of tendency
// AMS. 1962. V. 33, №2. P. 471-481.
568. Kruskal W. H. Ordinal measures of association // JASA. 1958. V. 53. P. 814-861.
569. Olmstead P. S., Tukey J. W. A comer test for association // AMS. 1947. V. 18. P. 495-513.
570. Blum J. R.^ Kiefer J., Rosenblatt M. Distribution-free tests of independence based on the
sample distribution function // AMS. 1961. V. 32. P. 485-498.
571. Iman R. L., Conover W. J. Approximation of the critical region for Spierman's rho with
and without ties present // Commun. Stat.-Simul. And Comput. 1978. V. 7. P. 269-282.
572. Hoeffding W. A non-parametric test of independence // AMS. 1948. V. 19. P. 546-557.
573. Shirahate S. Intraclass rank tests for independence // Biometrika. 1981. V. 68, №2.
P. 451-456.
574. Fieller E. C, Pearson E. S. Tests for rank correlation coefficients. 2 // Biometrika. 1961.
V. 48, №1-2. P. 29-40.
575. Kendall M. G., Babington Smith. The problem of m rankings // AMS. 1939. V. 10.
P. 275-287.
576. Schucany W. R., Frawley W. H. A rank test for two group concordance // Psichometrika.
1973. V. 38. P. 249-258.
577. McNemar Q. Note on sample error of the differences between correlated proportions or
percentages // Psychometrika. 1947. V. 12. P. 153-154.
578. Woolf B. The log likelihood ratio test [the G-test]. Methods and tables for tests of
heterogeneity in contingency tables // Ann. Human Genetics. 1957. V. 21. P. 397-409.
579. Le Roy H. L. Ein einfacher x -Test fur den Simultanvergleich der inneren Struktur
von zwei Analogen 2x2, Haufigkeitstabellen mit freien Kolonnen und Zeilentotallen,
Schweizer. Landw. Forchg., 1, 1962, S. 451-454.
580. Kvetom K. Formation of empirical regression curves and surfaces using power function //
Acta Technica. 1988. №2. P. 141-157.
581. Дрейпер Н.у Смит Г. Прикладной регрессионный анализ / Пер с англ. — М.: Стати-
Статистика, 1973.
582. Иоала В., Ольман В. Метод оценивания коэффициентов линейной одномерной ре-
регрессии // Изв. АН ЭССР: Физика. Математика. 1987. Т. 36, №4. С. 422-424.
583. Маслов П. П. Замена способа наименьших квадратов простейшим расчетом // Вест-
Вестник статистики. 1973. №5. С. 18-20.
584. Bartlett M. S. Fitting a straight line when both variables are subject to error // 1949.
Biometrics. V. 5. P. 207-212.
585. Kerrich J. E. Fitting the line у = b • x when errors of observation are present in both
variables // The Amer. Statistician. 1966. V. 20. P. 24.
586. Sen P. K. Estimates of the regression coefficient based on Kendall's tau // JASA. 1968.
V. 63, №324. P. 258-264.
587. Siegel A. F. Robust regression using repeated medians // Biometrika. 1982. V. 69, №1.
P.242-244.
588. Daniels H. F. F distribution-free test for regression parameters // AMS. 1953. V. 25, №3.
P. 499-513.
589. Brown G. W., Mood A. M. On median tests for linear hypotheses // Proc. of the Second
Berkeley Symp. on Math. Stat. And Prob., Univ. of Calif. Press., 1950. P. 159-166.
590. Theil H. A rank-invariant method of linear and polynomial regression analysis. 1 // Proc.
Kon. Ned. Akad. V. Weetenseh. 1950. A53. P. 386-392.
758 Список литературы
591. Durhin J., Watson G. S. Testing for serial correlation in least-squares regression //
Biometrika. 1951. V. 38. P. 159-178.
592. Acton F.S. Analysis of straight line data.^N.Y.: Welly, 1959.^ P. 261.
593. Tietjen G. L., Moore R. H., Beckman R. J. Testing for a single outlier in simple linear
regression // Technometrics. 1973. V. 15, №4. P. 717-721.
594. Prescoti P. An approximate test for outlier in linear models // Technometrics. 1975.
V. 17, №1. P. 129-132.
595. Lund R. E. Tables for an approximate test for outliers in linear models // Technometrics.
1975. V. 17, №4. P. 473-476.
596. Wallis W. A. Tolerance intervals for linear regression // Proc. of the Second Berkley Symp.
on Math. Statist. And Probability, Univ. of Calif. Press., Berkley and Los Angeles, 1951.
P. 43-51.
597. Working H., Hotelling H. Applications of the theory of error to the interpretation of trends
// JASA. 1929. V. 24. P. 73-85.
598. Пустылъник Е. И. Две задачи, связанные с обработкой линейных зависимостей //
Завод, лаб. 1981. Т. 47, №3. С. 52-53.
599. Янкаускас В. Модель регрессии с автокоррелированными остатками в условиях ма-
малых выборок // Применение теории вероятностей и математической статистики: Сб.
1983. Вып. 5. Вильнюс, 1983.^ С. 86-94.
600. Четыркин Е.М. Статистические методы прогнозирования. — М.: Статистика, 1975.
601. Петрович С. Л., Шлеч Г. К. Робастная регрессия: оценки и сравнения методом
Монте-Карло // Завод, лаб. 1987. №3. С. 41-48.
602. Айвазян С, Л., Енюков И. С, Мешалкин Л. Д. Прикладная статистика. Исследование
зависимостей.—М.: Финансы и статистика, 1985.
603. Демиденко Е. 3, Линейная и нелинейная регрессия. — М.: Статистика, 1981.
604. Мудрое В. Ж., Кушко В. Л. Метод наименьших модулей. — М.: Знание, 1971.
605. Forsythe А. В. Robust estimation of straight line regression coefficients by minimizing
p-th power deviations // Technometrics. 1972. V. 14. P. 159-166.
606. Епишин Ю. Р. Регрессионный метод наименьших абсолютных отклонений // Завод,
лаб. 1974. № 10. С. 1227-1232.
607. Епишин Ю. Г. Об оценках параметров наименьших абсолютных отклонений // Эю>
номика и математические методы. 1974. Т. X, №54. С. 1023. Р. 1028.
608. Дронов В, С, Целищев В. Д. О сглаживании экспериментальных зависимостей мето-
методом однозначной аппроксимации // Завод, лаб. 1975. Т. 41, №7. С. 844-846.
609. Планирование эксперимента в исследовании технологических процессов / Хартман К.
и др. — Под ред. Э.К. Лецкого. — М.: Мир, 1977.
610. Шиндовский Э., Щюрц О. Статистические методы управления качеством. — М.: На-
Наука, 1964.
611. Дэюонсон Н., Мюн Ф. Статистика и планирование эксперимента в технике и науке.
Методы обработки данных / Пер. с англ. — М.: Мир, 1980.
612. Shewhart W. A. Economic control of quality of manufactured product, van Nostrond, New
York, 1931.
613. Barnard G. A. Cumulative charts and stochastic processes // JRSS. Ser. B. 1959. V. 21.
P.148-159.
614. Goldsmit P. L., Whitfield H. Average run lenght in cumulative sum chart when a F™mask
is used // Technometrics. 1961. V. 3. P. 441-447.
615. Johnson N. L., Leone F. C. Cumulative sum control charts // Industr. Quality Contr.
1962. V. 18-19 [three papers].
616. Page E. S. Cumulative sum charts // Technometrics. 1961. V. 3. P. 511-518.
617. Cox D. R. The use of range in sequential analysis // JRSS. 1949. Ser. B, V. 11. P. 921-929.
618. Shainin D. How to improve upon the benefits of the good old and control charts // Proc.
World Quality Congress, Braiton, 1984, V. 2. P. 48-56.
619. Налимов В. В. Планирование эксперимента. — М.: Наука, 1971.
620. Налимов В. В., Голикова Т. И. Логические основания планирования эксперимента. —
М.: Изд-во МГУ, 1971.
Список литературы 759
621. Налимов В. В., Чернова Н. А. Статистические методы планирования экстремальных
экспериментов. — М.: Наука, 1965.
622. Адлер Ю.П. Введение в планирование эксперимента. — М.: Металлургия, 1969.
623. Финни Д. Д. Введение в теорию планирования эксперимента. — М.: Наука, 1970.
624. Федоров В. В. Теория оптимального эксперимента (планирование регрессионных экс-
экспериментов).— М.: Наука, 1971.
625. Хикс Ч. Р. Основные принципы планирования эксперимента. — М.: Мир, 1967.
626. Box G. E. P., Wilson К. В. On the experimental attainment of optimum conditions //
JRSS. 1951. V.B13, №1. P. 1-17.
627. Box G. E. P., Hunter J. S. Condensed calculation for evolutionary operation programs //
Technometrics. 1959. V. 1. P. 77-84.
628. Kiefer J. // JRSS. 1959. V.B21. P. 272.
629. Голикова Т. Ж., Микешина Н. Г. Свойства 1)™оптимальных планов и методы их по-
построения // Новые идеи в планировании эксперимента: Сб. — М.: Наука, 1969.—
С.21-58.
630. Андрукович П. Ф., Голикова Т. И., Костина С. Г Планы второго порядка на ги-
гиперкубе, близкие по свойствам к D-оптимальным // Новые идеи в планировании
экспериментов: Об.^М.: Наука, 1969.^0. 140-153.
631. Hariey H. О. Smallest composite design for quadratic response surfase // Biometrics. 1959.
V. 15. P. 611-622.
632. Адлер Ю. П., Маркова E. Bn Грановский JO. В, Планирование эксперимента при по-
поиске оптимальных условий. — М.: Наука, 1970.
633. Уайльд Д. Дж. Методы поиска экстремума / Пер. с англ. — М.: Наука, 1967.
634. Spendley W., Hext G. R., Himsworth F. R. Sequential application of simplex design in
optimization and evolutionary operations // Technometrics. 1962. V. 4. P. 441.
635. Копаев Б. В. К вопросу использования относительных разностей в методе наимень-
наименьших квадратов // Геодезия и картография. 1991. №6. С. 9—13.
636. Копаев Б. В. Использование условно-относительных разностей при определении ко-
коэффициентов полинома методом наименьших квадратов // Надежность и контроль
качества. 1991. №12. С. 3-12.
637. Штефан В. В., Карташев В. Я. Исследование статистических зависимостей методом
обратных разделенных разностей. — Препринт / ВИНИТИ. №1105-В 92. — С. 2—19.
638. Абдуллаева В. Г., Володченко А. П. Определение параметров уравнения регрессии
в форме нормального уравнения прямой. — Препринт / ВИНИТИ. №1246-1989.
1989. —С. 2-11.
Сокращенные названия использованных журналов
AMS — The Annals of Mathematical Statistics
JRSS — Journal of the Royal Statistical Society
JASA — Journal of the American Statistical Association
CS — Communication In Statistics
JSCS — Journal of Statistical Computation and Simulation
RISI — Review of the International Statistical Institute
SJS — Scandinavian Journal of Statistics
SASJ — South African Statistical Journal
SN — Statistical Neerlandica
JIS — Journal of the Institute of Statisticians
AS — The American Statistican
AISM — Annals of the Institute of Statistical Mathematics
CJS — The Canadian Journal of Statistics
Перечень демонстрационных задач
Стр.
Исходная информация
Содержание задачи
1. Вычисление вероятностей для полностью определенных
законов распределения вероятностей
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
28
30
31
32
34
35
36
38
39
43
43
44
48
54
59
60
62
Нормальное распределение
Нормальное распределение
Нормальное распределение
Нормальное распределение
Равномерное распределение
Логарифмически нормальное расп-
ределение
Экспоненциальное распределение
Распределение Вейбулла
Гамма-распределение
Бета-распределение
Бета-распределение
Бета-распределение
X2-распределение (распределение
Пирсона)
Распределение Стьюдента (t-pacn-
ределение)
Распределение Фишера (F-pacnpe-
деление)
Распределение Фишера (F-pacnpe-
деление)
Усеченное нормальное распределе-
распределение
Вь числение значения ф> нкц - \ ас™
пределения
Вь числение квантилей
Вь числение математическ х с ж ' да™
н t порядковых статист к
Комплексное вычислен' е вероят-
ностных характеристик
Комплексное вычисление вероят-
ностных характеристик
Вычисление значения функции рас™
пределения
Вычисление вероятностных характе™
ристик применительно к испытани-
испытаниям приборов
Вычисление вероятностных характе-
характеристик
Вычисление вероятностных характе-
характеристик
Вычисление квантилей распределе-
распределения
Вычисление квантилей распределе-
распределения
Вычисление квантилей распределе-
распределения
Вычисление квантилей распределе-
распределения
Вычисление квантилей распределе-
распределения
Вычисление квантилей распределе-
распределения
Вычисление квантилей распределе-
распределения
Вычисление изменения параметров
при усечении нормального распре-
распределения
762
Перечень демонстрационных задач
Продолжение таблицы
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Стр.
63
64
66
68
69
71
72
72
73
74
78
78
79
79
79
Исходная информация
Распределение модуля случайной
величины, i аспределенно" нср-
мально
Распределен е, п рождае ое нср-
мальной плотностью с линейным
дрейфом среднего
Распределение, порождаемое нор-
нормальной плотностью с линейным
дрейфом среднеквадратического
отклонения
Распределение Рэлея
Распределение Максвелла
Распределение экстремального зна-
значения
Треугольное распределение (расп-
(распределение Симпсона)
Распределение Коши
Логистическое распределение
Распределение Парето
Композиции законов распределе-
распределения вероятностей случайных вели-
величин, возникающие при расчете на-
надежности по схеме „нагрузка^на-
пряжение"
Композиции законов распределе-
распределения вероятностей случайных вели-
величин, возникающие при расчете на-
надежности по схеме „нагрузка^на-
пряжение"
Композиции законов распределе-
распределения вероятностей случайных вели-
величин, возникающие при расчете на-
надежности по схеме „нагрузка-на-
пряжение"
Композиции законов распределе-
распределения вероятностей случайных вели-
величин, возникающие при расчете на-
надежности по схеме „нагрузка^на-
пряжение"
Композиции законов распределе-
распределения вероятностей случайных вели-
величин, возникающие при расчете на-
надежности по схеме „нагрузка^на-
пряжение"
Содержание задачи
Вычисление вероятностей и парамет-
параметров распределен я
Вь ч слен е ве] оя не с нь х xaj ак-
теристик
Вычисление вероятностных харак-
характеристик
Вычисление функции распределения
и квантилей
Вычисление функции распределения
Вычисление функции распределения
и квантилей
Вычисление функции распределения
Вычисление вероятностных харак-
характеристик
Вычисление функции распределения
и квантилей
Вычисление вероятностных харак-
характеристик
Вычисление вероятности безотказ-
безотказной работы, когда прочность и на-
нагрузка распределены нормально
Вычисление вероятности безотказ-
безотказной работы, когда прочность и на-
нагрузка распределены логарифмиче-
логарифмически нормально
Вычисление вероятности безотказной
работы, когда прочность и нагрузка
распределены экспоненциально
Вычисление вероятности безотказ-
безотказной работы, когда прочность рас-
распределена нормально, нагрузка —
экспоненциально
Вычисление вероятности безотказ-
безотказной работы, когда прочность имеет
гамма-распределение, нагрузка рас-
распределена экспоненциально
Перечень демонстрационных задач
763
Продолжение таблицы
33
34
35
36
37
38
39
40
41
42
43
С р.
79
80
81
82
86
88
89
91
91
92
94
Исходная нфор > ац я
Ко по^ ц законов распределе-
распределения вероятностей случайных ве-
величин, возникающие при расчете
надежности по схеме „нагрузка-
напряжение"
Нецентральное распределение
Стьюдента (нецентральное ^рас-
^распределение)
Нецентральное распределение Пир™
сона (нецентральное хи-квадрат
распределение)
Нецентральное распределение Фи-
Фишера (нецентральное F-распреде-
ление)
Биномиальное распределение (рас-
(распределение Бернулли)
Биномиальное распределение (рас-
(распределение Бернулли)
Распределение Пуассона
Отрицательное биномиальное расп-
распределение
Распределение Паскаля
Геометрическое распределение
(распределение Фарри)
Гипергеометрическое распределе-
распределение
Содержан е зада11 '
Вь ч слен е ве!оятнсст без тказ-
ной работы, когда прочность име-
имеет распределение Вейбулла, нагрузка
распределена нормально
Вычисление параметра нецентраль-
нецентральности
Вычисление квантили распределе-
распределения
Вычисление квантили распределе-
распределения
Вычисление функции распределения
Вычисление функции распределения
аппроксимацией Моленара
Вычисление функции распределения
Вычисление функции распределения
Вычисление функции распределения
Вычисление плотности и функции
распределения
Вычисление функции распределения
2. Оценка параметров распределения вероятностей
44
45
46
47
48
49
50
51
103
109
116
121
131
131
132
137
Нормальное распределение
Нормальное распределение
Нормальное распределение
Нормальное распределение
Нормальное распределение (усечен-
(усеченная выборка)
Нормальное распределение (непол-
(неполностью определенная выборка)
Нормальное распределение (цензу™
рированная выборка)
Экспоненциальное распределение
Точечная оценка среднего значения
Интервальная оценка среднего зна-
значения при неизвестной дисперсии
Точечная оценка дисперсии и стан-
стандартного отклонения
Интервальная оценка стандартного
отклонения
Оценка параметров распределен я
Оценка параметров распределения
Оценка параметров распределен я
Точечная оценка интенсивности от-
отказов при испытании партии прибо-
приборов до заданной наработки с заменой
отказавших приборов
764
Перечень демонстрационных задач
Продолжение таблицы
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
Стр.
137
137
137
139
139
144
144
144
144
145
145
173
173
174
175
Исходная информация
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
(цензурированная выборка)
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
Экспоненциальное распределение
Распределение Вейбулла
Распределение Вейбулла
Распределение Вейбулла
Распределение Вейбулла
Содержание задачи
Точечная оценка интенсивности от-
отказов при испытании партии прибо-
приборов до заданного числа отказов с за-
заменой отказавших приборов
Точечная оценка интенсивности от™
казов при испытании партии прибо-
приборов до заданной наработки без заме-
замены отказавших приборов
Точечная оценка интенсивности от-
отказов при испытании партии прибо-
приборов до заданного числа отказов без
замены отказавших приборов
Двухстадийная оценка среднего зна-
значения
Точечная оценка параметра (средне-
(среднего значения) с помощью порядковых
статистик
Интервальная оценка среднего зна-
значения
Интервальная оценка интенсивности
отказов при испытании партии при-
приборов до заданной наработки с заме-
заменой отказавших приборов
Интервальная оценка интенсивности
отказов при испытании партии при-
приборов до заданного количества отка-
отказов с заменой отказавших приборов
Интервальная оценка интенсивности
отказов при испытании партии при-
приборов до заданного количества отка-
отказов без замены отказавших приборов
Интервальная оценка интенсивности
отказов при испытании партии при-
приборов до заданной наработки без за-
замены отказавших приборов
Интервальная оценка наработки на
отказ
Точечная оценка параметра а при
известном параметре /3
Совместная точечная оценка пара-
параметров распределения
Совместная точечная оценка пара-
параметров распределения (метод момен-
моментов)
Совместная точечная оценка пара-
параметров распределения по одной по-
порядковой статистике
Перечень демонстрационных задач
765
Продолжение таблицы
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
Стр.
175
176
177
177
177
178
178
178
178
181
187
191
193
194
195
196
Исходная информация
Распределение Вейбулла
Распределение Вейбулла
Распределение Вейбулла
Распределение Вейбулла (выборка
цензурирована)
Распределение Вейбулла
Распределение Вейбулла
Распределение Вейбулла (выборка
цензурирована)
Распределение Вейбулла
Экспоненциальное распределение.
Распределение Вейбулла с из-
известным параметром /3 (выборка
цензурирована)
Гамма-распределение
Биномиальное распределение
Гипергеометрическое распределе-
распределение
Закон распределения вероятностей
неизвестен (известна только
дисперсия)
Закон распределения вероятностей
неизвестен (известна только
дисперсия)
Экспоненциальное распределение
с изменяющейся интенсивностью
отказов
Экспоненциальное распределение
Содержание задачи
Точечная оценка параметров рас™
пределения методом наименьших
квадратов
Точечная оценка параметров распре™
деления методом аппроксимации
Точечная оценка параметров распре™
деления
Точечная оценка параметров распре-
распределения
Интервальная оценка параметра а
при известном параметре /3
Совместная интервальная оценка па-
параметров распределения
Интервальная оценка квантили рас-
распределения
Интервальная оценка квантили рас-
распределения
Оценка экономии в продолжительно-
продолжительности испытаний приборов при цензу-
цензурировании выборов
Точечная оценка параметров а и f3.
Интервальная оценка параметра /3
при известном параметре а
Интервальная оценка параметра
распределения
Оценка верхней границы количе-
количества дефектных изделий изделий
в партии
Интервальная оценка центра рас-
распределения
Оценка квантили распределения
Оценка интенсивности отказов изде-
изделия в период приработки
Прогнозирование средней наработки
для будущих испытаний
3. Определение объема выборки, необходимого для оценки
параметра распределения с заданной точностью
83
197
Нормальное распределение (дис-
(дисперсия известна)
Определение объема выборки, необ-
необходимого для оценки среднего значе-
значения с заданной абсолютной ошибкой
766
Перечень демонстрационных задач
Продолжение таблицы
84
85
86
87
88
89
90
Стр.
198
198
200
200
200
201
201
Исходная информация
Нормальное распределение (дис-
(дисперсия неизвестна)
Распределение Вейбулла (параметр
формы /3 известен)
Биномиальное распределение
Биномиальное распределение
Биномиальное распределение
Экспоненциальное распределение
Гамма-распределение
Содержание задачи
Определение объема выборки, необ-
необходимого для оценки среднего значе-
значения с заданной предельной относи-
относительной ошибкой
Определение объема выборки, необ-
необходимого для оценки среднего зна-
значения с заданной относительной
погрешностью
Определение объема выборки, необ-
необходимого для контроля заданной до-
доли дефектных изделий в партии
Определение объема выборки, обес-
обеспечивающего заданную длину дове-
доверительного интервала для оценки
параметра распределения
Определение объема выборки, необ-
необходимого для прогнозирования чис-
числа дефектных изделий в партии
Определение объема выборки для
оценки интенсивности отказов
Определение объема выборки, необ-
необходимого для оценки среднего значе-
значения с заданной предельной ошибкой
4. Проверка согласия эмпирического распределения
с предполагаемым теоретическим законом
91
92
93
94
95
96
207
211
212
215
217
219
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно (две выборки)
Распределение вероятностей неиз-
неизвестно (две выборки)
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно (одна выборка)
Проверка критерием % гипотезы
о согласии эмпирического распреде-
распределения с нормальным законом
Проверка гипотезы согласия эмпири-
эмпирического распределения с экспоненци-
экспоненциальным с помощью критерия числа
пустых ячеек. Проверка совпадения
распределений в двух выборках
Проверка совпадений эмпирических
распределений в двух выборках кри-
критерием Барнетта-Эйсена
Проверка совпадения эмпирического
распределения с нормальным (при
заданных параметрах) критерием
Колмогорова-Смирнова
Проверка совпадения эмпирического
распределения с нормальным зако-
законом критерием Смирнова-Крамера-
фон Мизеса
Проверка совпадения эмпирического
распределения с нормальным зако-
законом критерием Реньи
Перечень демонстрационных задач
767
Продолжение таблицы
97
98
99
100
Стр.
221
223
224
226
Исходная информация
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно (одна выборка)
Содержание задачи
Проверка совпадения эмпирического
распределения с нормальным зако-
законом критерием Андерсона—Дарлинга
Проверка совпадения эмпирического
распределения с нормальным зако-
законом критерием Ватсона
Проверка совпадения эмпирического
распределения с нормальным зако-
законом критерием Купера
Проверка совпадения эмпирического
распределения с нормальным зако-
законом критерием Дарбина
5. Проверка совпадения функций распределения вероятностей
в двух выборках
101
102
103
228
229
230
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Проверка совпадения эмпирических
распределений критерием Колмого-
Колмогорова-Смирнова
Проверка совпадения эмпирических
распределений критерием Катцен-
байссера-Хакля
Проверка совпадения эмпирических
распределений критерием Андер-
Андерсона
6. Проверка совпадения эмпирического распределения вероятностей
с нормальным законом
104
105
106
107
108
109
110
232
234
235
239
242
243
245
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Проверка нормальности эмпиричес-
эмпирического распределения критерием х2
Проверка нормальности крите! я-
ми Колмогорова—Смирнова и пш^ с
оценкой параметров гипотетического
распределения по выборке
Проверка нормальности эмпири-
эмпирического распределения критерием
Фроцини
Проверка нормальности эмпиричес-
эмпирического распределения критерием Ша-
пиро-Уилка
Проверка нормальности эмпири-
эмпирического распределения критерием
Васичека
Проверка нормальности эмпиричес-
эмпирического распределения критерием Хега-
зи—Грина
Проверка нормальности эмпиричес-
эмпирического распределения критерием Али-
Чёрго-Ревеса
768
Перечень демонстрационных задач
Продолжение таблицы
111
112
113
114
115
116
117
118
119
120
121
122
123
124
Стр.
246
252
253
256
258
260
260
262
264
265
268
270
272
276
Исходная информация
Распределение вероятностей неиз-
неизвестно (одна выборка)
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно (совокупность выборок ма-
малого объема)
Содержание задачи
Проверка нормальности эмпири-
эмпирического распределения критерием
Филлибена
Проверка нормальности эмпиричес-
эмпирического распределения критерием Ла
Брека
Проверка нормальности эмпиричес-
эмпирического распределения критерием Лок-
ка-Спурье
Проверка нормальности эмпиричес-
эмпирического распределения критерием Оя
Проверка нормальности эмпиричес-
эмпирического распределения критерием Гири
Проверка нормальности эмпиричес-
эмпирического распределения критерием Дэви-
да^Хартли-Пирсона
Проверка нормальности эмпири-
эмпирического распределения критерием
Шпигельхальтера
Проверка нормальности эмпири-
эмпирического распределения критерием
Саркади
Проверка нормальности эмпиричес-
эмпирического распределения критерием Ли-
на-Мудхолкара
Проверка нормальности эмпиричес-
эмпирического распределения критерием Мар-
тинеса-Иглевича
Проверка нормальности эмпири-
эмпирического распределения критерием
Д'Агостино
Проверка нормальности эмпириче-
эмпирического распределения критериями
асимметрии и эксцесса
Проверка нормальности эмпиричес-
эмпирического распределения критерием Му-
роты-Такеучи
Проверка нормальности эмпиричес-
эмпирического распределения по совокупности
независимых выборок малого объема
7. Проверка совпадения эмпирического распределения
с экспоненциальным законом
125
281
Распределение вероятностей неиз-
неизвестно
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Шапиро-Уилка
Перечень демонстрационных задач
769
Продолжение таблицы
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
Стр.
282
284
287
288
289
291
293
293
294
295
297
299
301
302
304
Исходная информация
Распределение вероятностей неиз-
неизвестно (выборка цензурирована)
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно (выборка цензурирована)
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно (выборка цензурирована)
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Содержание задачи
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Шапиро-Уилка
Проверка экспоненциальности эмпи-
эмпирического распределения критерями
типа Колмогорова-Смирнова
Проверка экспоненциальности эмпи-
эмпирического распределения критери-
критериями типа Смирнова-Крамера-фон
Мизеса и Колмогорова-Смирнова
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Фроцини
Проверка экспоненциальности рас-
распределения корреляционным крите-
критерием
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Брейна—Шапиро
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Кимбера-Мичела
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Фишера
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Бартлетта-Морана
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Климко-Антла-Радемакера^Рокетта
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Холлендера-Прошана
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Кочара
Проверка экспоненциальности рас-
распределения критерием Эппса—Палли
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Бергмана
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Шермана
25 А. И. Кобзарь
770
Перечень демонстрационных задач
Продолжение таблицы
141
142
143
144
145
146
147
148
Стр.
304
305
306
307
310
311
316
317
Исходная информация
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Содержание задачи
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
наибольшего интервала
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Хартли
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
экспоненциальных меток
Проверка экспоненциальности эмпи-
эмпирического распределения критерия-
критериями независимости интервалов
Проверка экспоненциальности эмпи-
эмпирического распределения критерия-
критериями Un Гринвуда
Проверка гипотезы согласия эмпи-
эмпирического распределения с двухпа-
раметрическим распределением Вей-
булла (частный случай экспоненци-
экспоненциального распределения) критерием
Манна-Фертига-Шуера
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Дешпанде
Проверка экспоненциальности эмпи-
эмпирического распределения критерием
Лоулесса
8. Проверка совпадения эмпирического распределения
с равномерным законом
149
150
151
152
153
154
319
322
323
324
326
327
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Проверка равномерности эмпири-
эмпирического распределения критерием
Шермана
Проверка равномерности эмпири-
эмпирического распределения критерием
Морана
Проверка равномерности эмпиричес-
эмпирического распределения критерием Чен-
га—С пиринга
Проверка равномерности эмпиричес-
эмпирического распределения критерием Сар-
кади-Косика
Проверка равномерности эмпиричес-
эмпирического распределения критерием Дуде™
вича—ван дер Мюлена
Проверка равномерности эмпиричес-
эмпирического распределения критерием Хега-
зи—Грина
Перечень демонстрационных задач
771
Продолжение таблицы
155
156
157
158
159
Стр.
329
330
331
333
333
Исходная информация
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Содержание задачи
Проверка равномерности эмпиричес-
эмпирического распределения критерием Янга
Проверка равномерности эмпиричес-
эмпирического распределения критериями ти-
типа Колмогорова^Смирнова
Проверка равномерности эмпири-
эмпирического распределения критерием
Фроцини
Проверка равномерности эмпиричес-
эмпирического распределения критерием Грин-
вуда—Кэсенберри—Миллера
Проверка равномерности эмпириче-
эмпирического распределения „сглаженным"
критерием Неймана—Бартона
9. Проверка симметричности эмпирического распределеним вероятностей
160
161
162
163
164
165
166
167
168
169
336
337
339
340
341
343
345
346
349
351
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Проверка симметричности эмпири-
эмпирического распределения „быстрым"
критерием Кенуя
Проверка симметричности эмпири-
эмпирического распределения критерием
Смирнова
Проверка симметричности эмпири-
эмпирического распределения критерием
знаков
Проверка симметричности эмпири-
эмпирического распределения критерием
Вилкоксона
Проверка симметричности эмпири-
эмпирического распределения критерием
знаков Антилла—Керстинга—Цукки-
ни
Проверка симметричности эмпири-
эмпирического распределения критерием
Бхатачарья-Гаствирта-Райта
Проверка симметричности эмпири-
эмпирического распределения критерием
Финча
Проверка симметричности эмпири-
эмпирического распределения критерием
Бооса
Проверка симметричности эмпири-
эмпирического распределения критерием
Гупты
Проверка симметричности эмпири-
эмпирического распределения критерием
Фрезера
25*
772
Перечень демонстрационных задач
Продолжение таблицы
Стр.
Исходная информация
Содержание задачи
10. Подбор кривых распределения вероятностей по эмпирическим данным
170
171
172
173
174
175
176
177
178
179
180
181
353
356
366
373
375
377
379
380
381
383
384
386
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Распределение вероятностей неиз-
неизвестно
Аппроксимация эмпирического рас-
распределения кривой из семейства Sl
Джонсона
Аппроксимация эмпирического рас-
распределения кривой из семейства Sb
Джонсона
Аппроксимация эмпирического рас-
распределения кривой из семейства Su
Джонсона
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа I
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа II
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа Ш
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа IV
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа V
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа VI
Аппроксимация эмпирического рас-
распределения кривой Пирсона типа VII
Аппроксимация эмпирического рас-
распределения с помощью разложе-
разложения нормальной плотности распре-
распределения
Оценка плотности эмпирического
распределения методом бета-вкладов
11. Сравнение параметров нормально распределенных совокупностей
182
183
184
185
186
390
390
392
393
393
Нормальное распределение (две вы-
выборки с известными дисперсиями)
Нормальное распределение (две вы-
выборки с неизвестными, но равными
дисперсиями)
Нормальное распределение (две вы-
выборки с неизвестными и неравными
дисперсиями)
Нормальное распределение (две вы-
выборки)
Нормальное распределение (две
парные выборки)
Проверка гипотезы равенства сред-
средних в двух совокупностях
Проверка гипотезы равенства сред-
средних в двух совокупностях
Проверка гипотезы равенства сред-
средних в двух совокупностях
Проверка гипотезы равенства сред-
средних в двух совокупностях модифици-
модифицированным критерием Стьюдента
Проверка гипотезы равенства сред-
средних в двух совокупностях парным
t-критерием
Перечень демонстрационных задач
773
Продолжение таблицы
187
188
189
190
191
192
193
194
195
196
197
198
199
Стр.
394
396
397
398
399
401
402
403
405
407
407
408
412
Исходная информация
Нормальное распределение (одна
выборка и одно независимое значе-
значение случайной величины)
Нормальное распределение (две вы-
выборки)
Нормальное распределение (две вы-
выборки с равными дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок с равными дисперси-
дисперсиями)
Нормальное распределение (более
двух выборок равного объема с рав-
равными дисперсиями)
Нормальное распределение (более
двух выборок равного объема с рав-
равными дисперсиями)
Нормальное распределение (более
двух выборок равного объема с рав-
равными дисперсиями)
Содержание задачи
Проверка гипотезы о принадлежно-
принадлежности независимого выборочного зна-
значения к первичной выборке крите-
критерием Уолша
Проверка гипотезы равенства сред-
средних в двух совокупностях двухсту-
двухступенчатым критерием Волфа
Проверка гипотезы равенства сред-
средних в двух совокупностях ^-крите-
^-критерием
Проверка гипотезы равенства сред-
средних в более, чем двух совокупно-
совокупностях модифицированым критерием
Стьюдента
Проверка гипотезы равенства сред-
средних в более, чем двух совокупно-
совокупностях критерием „стьюдентизирован-
ного" размаха
Проверка гипотезы равенства сред-
средних в более, чем двух совокупностях
дисперсионным критерием
Проверка гипотезы равенства сред-
средних в более, чем двух совокупностях
критерием Полсона
Проверка гипотезы равенства сред-
средних в более, чем двух совокупностях
методом прямого сравнения Тькжи
Проверка гипотезы равенства сред-
средних в более, чем двух совокупно-
совокупностях критерием „стьюдентизироваы-
ного" максимума (обобщенный кри-
критерий Тьюки)
Проверка гипотезы равенства сред-
средних в более, чем двух совокупностях
критерием Шеффе
Проверка гипотезы равенства сред-
средних в более, чем двух совокупно-
совокупностях критерием Стьюдента-Ньюме-
на^Кейлса
Проверка гипотезы равенства сред-
средних в более, чем двух совокупностях
критерием Дункана
Проверка гипотезы равенства сред-
средних в более, чем двух совокупностях
критерием Линка—Уоллеса
774
Перечень демонстрационных задач
Продолжение таблицы
200
201
202
203
204
205
206
207
208
209
210
211
Стр.
413
413
414
415
416
417
418
420
421
422
423
423
Исходная информация
Нормальное распределение (две вы-
выборки)
Нормальное распределение (две вы™
борки)
Нормальное распределение (две вы-
выборки)
Нормальное распределение (две вы-
выборки)
Нормальное распределение (две вы-
выборки)
Нормальное распределение (более
двух выборок)
Нормальное распределение (более
двух выборок равного объема)
Нормальное распределение (более
двух выборок равного объема)
Нормальное распределение (более
двух выборок равного объема)
Нормальное распределение (более
двух выборок равного объема)
Нормальное распределение (более
двух выборок равного объема)
Нормальное распределение (более
двух выборок)
Содержание задачи
Проверка гипотезы равенства дис-
дисперсий в двух совокупностях крите-
критерием Фишера
Проверка гипотезы равенства дие-
персий в двух совокупностях крите-
критерием Романовского
Проверка гипотезы равенства дис-
дисперсий в двух совокупностях крите-
критерием отношения размахов
Проверка гипотезы равенства дис-
дисперсий в двух совокупностях кри-
критерием „стьюдентизированного" раз-
размаха
Проверка гипотезы равенства дис-
дисперсий в двух совокупностях крите-
критерием Аризоно-Охты
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Бартлетта
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Кохрана
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Неймана—Пирсона
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Блисса-Кохрана-Тьюки
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Хартли
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Кэдуэлла—Лесли—Брауна
Проверка гипотезы равенства дис-
дисперсий в более, чем двух выборках
критерием Самиуддина
12. Сравнение параметров
экспоненциально распределенных совокупностей
212
213
425
425
Экспоненциальное распределение
(две выборки)
Экспоненциальное распределение
(две выборки)
Проверка гипотезы равенства сред-
средних в двух совокупностях критерием
Фишера
Проверка равенства интенсивностей
отказов критерием Фишера
Перечень демонстрационных задач
775
Продолжение таблицы
214
215
216
217
218
219
220
221
222
223
224
Стр.
426
428
428
428
429
429
430
430
431
431
432
Исходная информация
Экспоненциальное распределение
(две выборки)
Экспоненциальное распределение
(одна выборка и заданное значение
интенсивности отказов)
Экспоненциальное распределение
(одна выборка и заданное значение
интенсивности отказов)
Эксп ненц альное распределен е
(одна выборка и заданное значение
интенсивности отказов)
Экспоненциальное распределение
(одна выборка и заданное значение
интенсивности отказов)
Экспоненциальное распределение
(одна выборка и заданное значение
интенсивности отказов)
Экспоненциальное распределение
(более двух выборок равного
объема)
Экспоненциальное распределение
(более двух выборок). Фиксируются
моменты наступления заданного
количества отказов
Экспоненциальное распределение
(более двух выборок). Фиксируются
количества отказов в выборках за
заданное время испытаний
Экспоненциальное распределение
(более двух выборок равного
объема)
Экспоненциальное распределение
(более двух выборок равного
объема)
Содержание задачи
Проверка равенства интенсивностей
отказов в двух совокупностях двух»
выборочным пуассоновским крите-
критерием
Сравнение интенсивности отказов
с заданным значением при испыта-
испытании приборов до заданной наработки
с заменой отказавших приборов
Сравнение интенсивности отказов
с заданным значением при испыта-
испытании приборов до заданного количе-
количества отказов с заменой отказавших
пр сборов
Вариант решения задачи 216 без за-
замены отказавших приборов
Сравнение интенсивности отказов
с заданным значением при испыта-
испытании приборов до заданной наработки
без замены отказавших приборов
Сравнение интенсивности отказов
с заданным значением при испыта-
испытании приборов до заданного количе-
количества отказов без замены отказавших
Проверка гипотезы равенства интен-
интенсивностей отказов в более, чем двух
совокупностях критерием Дэвида
Проверка гипотезы равенства ин-
интенсивностей отказов в более, чем
двух совокупностях критерием мак-
максимального правдоподобия
Проверка гипотезы равенства ин-
интенсивностей отказов в более, чем
двух совокупностях критерием мак-
максимального правдоподобия
Проверка гипотезы равенства ин-
интенсивностей отказов в более, чем
двух совокупностях критерием от-
отношения правдоподобия (критерий
Нагарсенкера)
Проверка гипотезы равенства пара-
параметра положения (гарантийной нара-
наработки) в более, чем двух совокупно-
совокупностях критерием Чена
776
Перечень демонстрационных задач
Продолжение таблицы
225
Стр.
434
Исходная информация
Экспоненциальное распределение
(более двух выборок)
Содержание задачи
Проверка гипотезы равенства пара-
параметра положения (гарантийной нара-
наработки) и параметра масштаба (сред-
(средней наработки, отсчитываемой от га-
гарантийной наработки) в более, чем
двух совокупностях комбинирован-
комбинированным критерием Сингха
13. Сравнение параметров биномиально распределенных совокупностей
226
227
228
436
437
438
Биномиальное распределение (две
выборки)
Биномиальное распределение (одна
выборка и заданное значение пара-
параметра)
Биномиальное распределение (бо-
(более двух выборок)
Сравнение параметров распределе-
распределений в двух совокупностях
Сравнение параметра распределения
с заданным значением
Сравнение параметров распределе-
распределения в более, чем двух совокупностях
14. Проверка гипотезы о значениях параметров распределения
методом последовательного анализа Вальда
229
230
231
232
445
447
448
450
Нормальное распределение с из-
известным стандартным отклонением
Нормальное распределение с из-
известным средним
Экспоненциальное распределение
Биномиальное распределение
Проверка гипотезы о значении сред-
среднего нормально распределенной со-
совокупности. Вычисление параметров
последовательной процедуры
Проверка гипотезы о значении дис-
дисперсии нормально распределенной
совокупности. Вычисление парамет-
параметров последовательной процедуры
Проверка гипотезы о значении пара-
параметра экспоненциально распределен-
распределенной совокупности (средняя наработ-
наработка на отказ). Вычисление параметров
последовательной процедуры
Проверка гипотезы о значении пара-
параметра биномиально распределенной
совокупности (доля дефектных из-
изделий в партии приборов). Вычис-
Вычисление параметров последовательной
процедуры
15. Непараметрические (свободные от распределения) критерии сдвига
233
234
235
452
453
457
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Проверка гипотезы сдвига меж-
между двумя совокупностями быстрым
(грубым) критерием Кенуя
Проверка гипотезы сдвига меж-
между двумя совокупностями быстрым
(грубым) ранговым критерием
Проверка гипотезы сдвига между
двумя совокупностями критериями
группы Манна—"Уитни—Вилкоксона
Перечень демонстрационных задач
777
Продолжение таблицы
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
Стр.
460
461
463
464
464
465
465
468
469
471
473
473
475
476
476
Исходная информация
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Содержание задачи
Проверка гипотезы сдвига между
двумя совокупностями критерием
Фишера—Йэйтса—Терри—Гёфдинга
Проверка гипотезы сдвига между
двумя совокупнс стя ' кр тер е
Ван дер Вардена
Проверка гипотезь сдв' а ежду
двумя совокупностями медианным
критерием
Проверка гипотезы сдвига между
двумя совокупностями критерием
Мостеллера
Проверка гипотезы сдвига между
двумя совокупностями критерием
Розенбаума
Проверка гипотезы сдвига между
двумя совокупностями критерием
Хаги
Проверка гипотезы сдвига между
двумя совокупностями .Е-критерием
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Крускала-Уоллиса
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Неменьи
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Вилкоксона-Вил-
кокс
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями „быстрым" критерием Кенуя
Проверка гипотезы сдвига между
несколькими (более двух) совокуп-
совокупностями критерием Фишера—Терри—
Йэйтса-Гёфдинга
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Ван дер Вардена
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями медианным критерием
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями против порядковой альтерна-
альтернативы критерием Хеттманспергера
778
Перечень демонстрационных задач
Продолжение таблицы
251
252
253
254
255
256
257
258
259
260
261
Стр.
477
479
479
480
482
483
486
487
488
490
491
Исходная информация
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Распределение совокупности неиз-
неизвестно (более двух выборок равного
объема)
Содержание задачи
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями против порядковой альтерна-
альтернативы критерием Терпстры-Джонк-
хира
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Мостеллера
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Левиса
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями L-критерием, основанным на
[/-статистиках
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Краузе
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Пейджа
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Фридмеыа-Кендал-
ла—Бэбингтона Смита
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Андерсона—Канне-
мана-Шэча
Проверка гипотезы сдвига между
несколькими (более двух) совокуп-
совокупностями критерием Даны Квейд со
взвешенными ранжировками
Проверка гипотезы сдвига меж-
между несколькими (более двух) со-
совокупностями критерием Кендалла—
Эренберга
Проверка гипотезы сдвига между
несколькими (более двух) совокупно-
совокупностями критерием Ходжеса—Демана—
Сена
16. Непараметрические (свободные от распределения) критерии масштаба
262
494
Распределение совокупности неиз-
неизвестно (две выборки)
Проверка гипотезы равенства пара-
параметров в двух совокупностях крите-
критерием Ансари—Вредли
Перечень демонстрационных задач
779
Продолжение таблицы
263
264
265
266
267
268
269
270
271
272
273
274
Стр.
496
497
500
501
502
504
507
508
509
511
513
515
Исходная информация
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно, но известно, что оно огра-
ограничено полупрямой (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две парные выборки равно-
равного объема)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (две выборки)
Распределение совокупности неиз-
неизвестно (более двух выборок)
Содержание задачи
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Сижела—Тьюки
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Кейпена
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Клотца
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях квартальным критерием
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Сэвиджа
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Муда
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Сукхатме
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Сэндвика—Олсона
Проверка гипотезы равенства пара-
параметров масштаба в двух совокуп-
совокупностях критерием Краута-Линерта,
нечувствительным к сдвигу
Проверка гипотезы равенства пара-
параметров масштаба в двух совокупно-
совокупностях критерием Камата
Проверка комбинированной гипоте-
гипотезы равенства положения и масштаба
в двух выборках комбинированным
критерием Буша^Винда
Проверка гипотезы равенства пара-
параметров масштаба в нескольких (бо-
(более двух) совокупностях критерием
Бхапкара—Дешпанде
17. Оценка случайности эмпирических данных, выявление тренда в них
(критерии тренда и случайности)
275
518
Ряд взаимонезависимых нормаль™
но распределенных случайных ве-
величин с одинаковыми (неизвестны-
(неизвестными) дисперсиями
Проверка гипотезы случайности эм-
эмпирического ряда критерием Аббе—
Линника
780
Перечень демонстрационных задач
Продолжение таблицы
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
Стр.
520
521
523
525
529
530
532
532
535
536
538
539
540
541
542
Исходная информация
Ряд нормально распределенных
случайных величин
Ряд нормально распределенных
случайных величин
Ряд нормально распределенных
случайных величин с одинаковыми
средними
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд нормально распределенных
случайных величин
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с неизвест-
неизвестным законом распределения
Ряд случайных величин с не звест-
ным законом распределения
Содержание задачи
Проверка гипотезы наличия трен-
тренда в средних и дисперсиях эмпи-
эмпирического ряда критерием Фостера—
Стюарта
Проверка гипотезы наличия тренда
в средних и дисперсиях эмпиричес-
эмпирического ряда критерием Кокс—Стюарта
Проверка гипотезы наличия сдвига
дисперсии в неизвестной точке кри-
терием Хсу
Проверка гипотезы наличия сдвига
дисперсии в неизвестной точке ран-
ранговым критерием
Проверка гипотезы случайности эм-
эмпирического ряда критерием Валь-
да-Волфовитца
Проверка гипотезы случайности эм-
эмпирического ряда критерием Рама-
чандрана-Ранганатана
Проверка гипотезы случайности эм-
эмпирического ряда критерием Шах-
несси
Проверка гипотезы случайности эм-
эмпирического ряда критерием Олм-
стеда
Проверка гипотезы случайности эм-
эмпирического ряда критерием числа
серий знаков первых разностей
Проверка гипотезы случайности эм-
эмпирического ряда критерием инвер-
инверсий
Проверка гипотезы случайности эм-
пирического ряда критерием авто-
автокорреляции
Проверка гипотезы случайности эм-
эмпирического ряда критерием ранго-
ранговой сериальной корреляции Вальда™
Волфовитца
Проверка гипотезы случайности эм-
эмпирического ряда критерием Бар-
телса
Проверка гипотезы случайности эм-
эмпирического ряда критерием куму-
кумулятивной суммы
Проверка гипотезы случайности эм-
п рического ряда знаково-ранговым
кр fтерием Холлина
Перечень демонстрационных задач
781
Продолжение таблицы
Стр.
Исходная информация
Содержание задачи
18. Выявление грубых результатов наблюдений (выбросов) в выборке
291
292
293
294
295
296
297
298
299
300
301
302
303
304
544
545
546
547
548
550
552
556
557
559
561
563
565
568
Выборка нормально распределен™
ных случайных величин
Выборка нормально распределен-
распределенных случайных величин с известной
дисперсией
Выборка нормально распределен™
ных случайных величин (вариан-
(варианты— дисперсия известна и неиз-
неизвестна)
Выборка нормально распределен-
распределенных случайных величин
Выборка нормально распределен-
распределенных случайных величин (дисперсия
оценивается по отдельной выборке)
Выборка нормально распределен-
распределенных случайных величин
Выборка нормально распределен-
распределенных случайных величин
Выборка нормально распределен-
распределенных случайных величин (число вы™
бросов принимается заранее)
Выборка нормально распределен-
распределенных случайных величин (число вы-
выбросов заранее не известно)
Выборка экспоненциально распре-
распределенных случайных величин
Выборка экспоненциально распре-
распределенных случайных величин
Выборка экспоненциально распре-
распределенных случайных величин
Выборка случайных величин, име-
имеющих распределение Вейбулла
Выборка случайных величин из
непрерывного распределения с из-
известными параметрами
Проверка гипотезы наличия выброса
в выборке критерием Шовене
Проверка гипотезы наличия выброса
в выборке критерием Ирвина
Проверка гипотезы наличия выброса
в выборке критериями Груббса
Проверка гипотезы наличия выбро-
выброса в выборке критерием наибольшего
абсолютного отклонения
Проверка гипотезы наличия выброса
в выборке критерием Дэвида
Проверка гипотезы наличия выброса
в выборке критерием Диксона
Проверка гипотезы наличия выбро-
выброса в выборке критериеями Хоглина—
Иглевича
Проверка гипотезы наличия несколь-
нескольких выбросов в выборке критерием
Титьена-Мура
Проверка гипотезы наличия несколь-
нескольких выбросов в выборке критерием
Роснера
Проверка гипотезы наличия выбро-
выбросов в выборке критерием Смоляка™
Титаренко
Проверка гипотезы наличия выбро-
выбросов в выборке критерием Бродского™
Быцаня—Власенко
Проверка гипотезы наличия несколь-
нескольких выбросов в выборке критерием
Кимбера
Проверка гипотезы наличия выбро-
выбросов в выборке критериями Груббса
и Диксона
Проверка гипотезы наличия выбро-
выбросов в выборке критерием Дарлинга
19. Вычисление толерантных пределов, содержащих заданную долю
генеральной совокупности
305
569
Выборка случайных величин, име-
имеющих нормальное распределение
с известными параметрами
Вычисление толерантных пределов
для совокупности случайных вели-
величин
782
Перечень демонстрационных задач
Продолжение таблицы
306
307
308
309
310
311
312
313
314
315
316
317
318
Стр.
572
572
577
578
579
582
582
583
583
588
589
589
589
Исходная информация
Выборка случайных величин, име-
имеющих нормальное распределение
с неизвестным средним и известной
дисперсией
Выборка случайных величин, име-
имеющих нормальное распределение
с известным средним и неизвестной
дисперсией
Выборка случайных величин, име-
имеющих нормальное распределен' е
с неизвестными параметра
Выборка случайных вел - ^ н, - е-
ющих нормальное распределение
Выборка случайных величин, име-
имеющих нормальное распределение
Выборка случайных величин с неиз-
неизвестным распределением
Выборка случайных величин с неиз-
неизвестным распределением
Выборка случайных величин с неиз-
неизвестным распределением
Выборка случайных величин, име-
имеющих нормальное или экспоненци-
экспоненциальное распределение
Выборка случайных величин, име-
имеющих экспоненциальное распреде-
распределение
Выборка случайных величин, име-
имеющих экспоненциальное распреде-
распределение
Выборка случайных величин, име-
имеющих экспоненциальное распреде-
распределение
Выборка случайных величин, име-
имеющих экспоненциальное распреде-
распределение
Содержание задачи
Вычисление толерантных пределов
для совокупности случайных вели-
величин
Вычисление толерантных пределов
для совокупности случайных вели-
величин
Вычисление толерантных пределов
для совокупности случайных вели-
ч н
Вь ч сление толерантных пределов
для совокупности случайных вели-
величин с помощью выборочного размаха
Вычисление толерантных интерва-
интервалов для выборочных дисперсий
Вычисление объема выборки, в ко-
которой с заданной вероятностью бу-
будет находиться заданная доля сово-
совокупности
Вычисление минимального объема
выборки для одностороннего толе-
толерантного интервала
Вычисление доли непрерывной сово-
совокупности, которая с заданной веро-
вероятностью будет находиться между
крайними членами выборки
Определение границ интервала, в ко-
котором будут находиться т из к буду-
будущих наблюдений
Вычисление прогнозных интервалов
для нижней границы средней нара-
наработки по ранним моментам отказов
Вычисление нижнего доверительно-
доверительного интервала для средней наработки
на отказ
Вычисление вероятностей появле-
появления заданных величин в будущих
наблюдениях
Вычисление вероятности попадания
будущих наблюдений в заданный
интервал
20. Дисперсионный анализ данных
319
593
Совокупность данных, полученных
при различных уровнях изучаемого
фактора (распределение нормаль-
нормально)
Однофакторный дисперсионный ана-
анализ данных
Перечень демонстрационных задач
783
Продолжение таблицы
320
321
322
323
324
Стр.
595
597
599
602
604
Исходная информация
Совокупность данных, полученных
при различных уровнях двух фак-
факторов (распределение нормально)
Совокупность данных, полученных
при различных уровнях двух фак-
факторов (распределение нормально)
Совокупность данных, полученных
при различных уровнях двух фак-
торов (распределение неизвестно,
в данных возможны пропуски)
Совокупность данных, полученных
при различных уровнях двух фак-
факторов (распределение неизвестно,
в данных возможны пропуски)
Совокупность данных, полученных
при различных уровнях двух фак-
факторов (распределение неизвестно,
в данных возможны пропуски)
Содержание задачи
Двухфакторный дисперсионный ана-
анализ данных
Двухфакторный дисперсионный ана-
анализ данных с помощью размахов
Двухфакторный дисперсионный не-
непараметрический анализ для непол-
неполных данных критерием Принтиса
Двухфакторный дисперсионный не-
непараметрический анализ для непол-
неполных данных критерием Мака-Скил-
лингса
Двухфакторный дисперсионный не-
непараметрический анализ для непол-
неполных данных критерием Лемана—
Мака
21. Корреляционный анализ данных
325
326
327
328
329
330
331
332
333
334
608
610
612
615
617
619
620
621
622
623
Две выборки нормально распреде-
распределенных случайных величин
Две выборки нормально распреде-
распределенных случайных величин
Несколько (более двух) выборок
нормально распределенных случай-
случайных величин
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Проверка гипотезы о наличии кор-
корреляции между случайными вели-
величинами
Оценка корреляционного отношения
(оценка линейности корреляционной
связи)
Вычисление показателей частной
и множественной корреляции и оцен-
оценка их значимости
Установление значимости корреля-
корреляции „быстрыми" критериями Кенуя
и Кокс—Стюарта
Установление значимости корреля-
корреляции знаковым критерием Нелсона
Установление значимости корреля-
корреляции квадрантным критерием
Установление значимости корреля-
корреляции угловым критерием Олмстеда—
Тькжи
Установление значимости корреля-
корреляции между случайными величинами
приближенным критерием Шахани
Установление значимости корреля-
корреляции между случайными величинами
критерием Шведа-Эйзенхарта
Установление значимости корреля-
корреляции между случайными величинами
критерием автокорреляции Кенуя
784
Перечень демонстрационных задач
Продолжение таблицы
335
336
337
338
339
340
341
342
343
344
345
346
347
Стр.
624
625
628
629
631
633
634
636
637
638
640
641
642
Исходная информация
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Две выборки случайных величин
с неизвестным распределением
Несколько (больше двух) выборок
случайных величин с неизвестным
распределением
Несколько (больше двух) выборок
случайных величин с неизвестным
распределением
Одна выборка случайной вели™
t 'Ны — количественная, и соответ-
соответствующая ей выборка, содержащая
качественные признаки
Таблица сопряженности признаков
2x2
Таблица сопряженности признаков
2x2
Таблица сопряженности признаков
2x2
Содержание задачи
"Установление значимости корреля-
корреляции между случайными величина-
величинами критерием Блума-Кифера^Ро-
зенблатта
Установление значимости корреля-
корреляции между случайными величинами
с помощью рангового коэффициента
корреляции Кендалла
Установление значимости корреля-
корреляции между случайными величинами
с помощью рангового коэффициента
корреляции Спирмена
Установление значимости корреля-
корреляции между случайными величинами
критерием Гёфдинга
Установление значимости корреля-
корреляции между случайными величина -
критерием Ширахатэ
Установление значимости корреля-
корреляции между случайными величинами
критерием Фишера—Иэйтса
Установление значимости корреля-
корреляции между случайными величинами
критерием Ван дер Вардена
Установление корреляции между
несколькими совокупностями слу-
случайных величин с помощью коэф-
коэффициента конкордации Кендалла-
Вэбингтона Смита
Установление корреляции между
несколькими совокупностями слу-
случайных величин критерием Шуке-
ни-Фроли
Установление значимости точечно-
бисериальной корреляции (зависи-
(зависимости между качественным и коли-
количественным признаками)
Установление связи признаков в та-
таблицах 2x2
Установление значимости связи при-
признаков в таблицах сопряженности
2x2 с помощью коэффициента
контингенции
Установление значимости связи при-
признаков в таблицах сопряженности
2x2 точным критерием Фишера
Перечень демонстрационных задач
785
Продолжение таблицы
348
349
350
351
352
353
354
Стр.
642
642
643
644
645
646
647
Исходная информация
Таблица сопряженности признаков
2x2
Таблица сопряженности признаков
2x2
Таблица сопряженности признаков
2x2 (наблюдения проводятся над
одним и тем же объектом)
Таблица сопряженности признаков
2x2
Две таблицы сопряженности при-
признаков размера 2x2 каждая
Допустимые уровни ошибок перво-
первого и второго рода при принятии ре-
решения о наличии связи между ка-
качественными признаками
Таблица сопряженности признаков
г х с
Содержание задачи
"Установление значимости связи при-
признаков в таблицах сопряженности
2x2
Установление значимости связи при-
признаков в таблицах сопряженности
2x2
Установление значимости связи при-
признаков в таблицах сопряженности
2x2 модифицированным критерием
знаков Мак-Нимара
Установление значимости связи при-
признаков в таблицах сопряженности
2x2 критерием Вулфа
Проверка гипотезы о статистической
неразличимости двух таблиц соп-
сопряженности размером 2x2 каждая
критерием Ле Роя
Определение объема выборки, по-
позволяющего сравнить относительные
частоты в таблицах 2 х 2 с заданны-
заданными ошибками первого и второго рода
Проверка гипотезы о наличии связи
в таблице сопряженности г х с
22. Регрессионный анализ данных
355
356
357
358
359
651
651
652
652
653
Совокупность выборочных значе-
значений случайной величины, получен-
полученных при фиксированных значена ях
второй случайной величины
Совокупность выборочных зна11 е-
ний случайной величины, получен-
полученных при фиксированных значениях
второй случайной величины
Совокупность выборочных значе-
значений случайной величины, получен-
полученных при фиксированных значениях
второй случайной величины
Совокупность выборочных значе-
значений случайной величины, получен-
полученных при фиксированных значениях
второй случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение неизвестно), полученных при
фиксированных значениях второй
случайной величины
Оценка коэффициентов регрессии
методом наименьших квадратов
Вь числение коэффициентов регрес-
с с помощью линейных оценок
Оценка коэффициентов регрессии
методом Бартлетта—Кенуя
Оценка коэффициентов регрессии
методом Керрича
Оценка коэффициентов регрессии
с помощью робастного критерия
Брауна-Муда
786
Перечень демонстрационных задач
Продолжение таблицы
360
361
362
363
364
365
366
367
368
369
Стр.
654
656
657
658
660
661
663
665
668
669
Исходная информация
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение неизвестно), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение неизвестно), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины получен-
полученных при фиксированных значениях
второй случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второ"
случайной величины
Содержание задачи
Оценка регрессионного коэффициен-
коэффициента с помощью метода Тейла
Вычисление и статистический ана-
анализ оценок коэффициентов регрес-
регрессии
Проверка гипотезы о равенстве нулю
коэффициента регрессии, оцененно-
оцененного с помощью метода Тейла
Проверка адекватности регрессион-
регрессионной модели
Проверка гипотезы о наличии корре-
корреляции регрессионных остатков кри-
критерием Дарбина—Ватсона
Проверка гипотезы о наличии вы-
выброса в регрессионной модели крите-
критерием Эктона
Проверка гипотезы о наличии вы-
выброса в регрессионной модели крите-
критерием Титьена-Мура-Бекмана
Проверка гипотезы о наличии вы-
выброса в регрессионной модели крите-
критерием Прескотта-Лунда
Построение доверительной зоны для
уравнения регрессии
Оценка обращенного уравнения ре-
регрессии (с заменой переменных)
Перечень демонстрационных задач
787
Продолжение таблицы
370
371
372
373
374
375
376
377
378
379
380
Стр.
671
673
676
679
681
685
688
690
693
694
695
Исходная информация
Совокупность выборочных значе-
значений случайной величины (распреде-
(распределение нормально), полученных при
фиксированных значениях второй
случайной величины
Две выборки случайных величин,
полученные при фиксированных
значениях другой случайной вели-
величины
Две выборки случайных величин,
порождающие регрессионные моде-
модели
Известно стандартное отклонение
изучаемой регрессионной последо-
последовательности
Совокупность выборочных значе-
ний случайной величины (нормаль-
(нормальное распределение), полученных
при фиксированных значениях вто-
второй случайной величины
Совокупность выборочных значе-
значений случайной величины (нормаль-
(нормальное распределение), полученных
при фиксированных значениях вто-
второй случайной величины
Две регрессионные модели и неза-
независимая выборка значений случай-
случайной величины
Совокупность выборочных значе-
значений случайной величины, получен-
полученных при фиксированных значениях
второй случайной величины
Двумерная выборка случайных ве-
величин
Двумерная выборка случайных ве-
величин
Двумерная выборка случайных ве-
величин
Содержание задачи
Вычисление толерантной области
для линейной регрессии
Проверка гипотезы о неразличи-
неразличимости регрессионных моделей, по-
полученных по двум независимым
выборкам
Оценка доверительной области для
точки пересечения двух линий ре-
регрессии
Определение объема испытаний для
получения заданной точности оцен-
оценки коэффициента регрессии
Построение нелинейной регрессион-
регрессионной модели и ее статистический
анализ
Построение и статистический анализ
нелинейной регрессии с помощью по-
полиномов Чебышева
Выбор лучшей регрессионной моде-
модели критерием Вильямса-Клута
Вычисление прогнозируемых значе-
значений случайной величины по уравне-
уравнению регрессии
Вычисление регрессии методом наи-
наименьших модулей
Вычисление прямой регрессии мето-
методом последней точки
Вычисление регрессии методом одно-
однозначной аппроксимации
23. Вычисление параметров контрольных карт
381
382
383
699
700
701
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Вычисление границ для контроль-
контрольных карт х и jR-карт Шухарта
Вычисление границ для контроль-
контрольных Я-карт Шухарта
Вычисление контрольных границ
для х- и Я-карт Шухарта по выбор-
выборкам неравного объема
788
Перечень демонстрационных задач
Окончание таблицы
384
385
386
387
388
389
390
391
Стр.
702
703
703
706
708
709
711
712
Исходная информация
Выборочные значения контр л ру-
емого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Выборочные значения контролиру-
контролируемого параметра
Содержание задачи
Вь *- ' слей е границ для контроль-
контрольных карт доли дефектных изделий
(Р-карта Шухарта)
Вычисление границ для контроль-
контрольных карт числа дефектных изделий
(С-карта Шухарта)
Вычисление границ для контроль-
контрольных карт индивидуальных значе-
значений и скользящего размаха (xi- и
Ri-карты Шухарта)
Вычисление параметров контроль-
контрольной карты накопленных сумм для
контроля среднего значения
Вычисление параметров контроль-
контрольной карты накопленных сумм для
контроля разброса по выборочным
размахам
Вычисление параметров контроль-
контрольной карты накопленных сумм для
контроля разброса по выборочным
дисперсиям
Вычисление параметров контроль-
контрольной карты накопленных сумм для
контроля доли дефектных изделий
Вычисление параметров контроль-
контрольной карты накопленных сумм для
контроля доли дефектных изде-
изделий, основанного на распределении
Пуассона
24. Математическое планирование эксперимента,
построение планов и анализ моделей
392
393
394
395
396
397
718
719
726
731
733
735
Число изучаемых независимых па-
параметров-факторов
Матрица и результаты реализац
полного факторного эксперимента
Матрица и результаты реализации
ортогонального плана второго по-
порядка
Построение матрицы полного фак-
факторного эксперимента
Определение уравнения отклика
проведение его статистического
анализа
Определение статистической модели,
описывающей результаты опытов
Построение матрицы плана Хартли на кубе для пяти переменных и вы-
вычисление поверхности отклика
Результаты последовательного экс-
экспериментирования при поиске оп-
оптимума
Результаты последовательного экс-
экспериментирования при поиске оп-
оптимума
Определение оптимума отклика (три
фактора) методом крутого восхо-
восхождения Бокса-Уилсона
Поиск оптимума отклика методом
симплекс-планирования
Перечень математико-статистических таблиц
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Стр.
26
41
47
67
76
100
101
102
102
105
106
107
107
108
112
Наименование
Квантили стандартного нормаль-
нормального распределения
Значения (р(у)
Значения функции Gi (ж)
Значения функции F(z\ А)
Значения A — R), умноженные
на 104
Оптимальные порядковые стати-
статистики Диксона
Значения коэффициентов оценки
Огавы для различного числа оп-
тимально расположенных порядко-
порядковых статистик
Оценка /г по двум статистикам
Оценка /i по четырем совместным
квантилям
Значения коэффициентов k(pi,p2)
Критические значения G1
Значения R1
Значения Жо,э75
Доверительный интервал для ме-
медианы (номера порядковых стати-
статистик)
Значения А
Область применения
Общее применение
Аппроксимация Кэдуэлла для бета-
распределения
Аппроксимация Корниша—Фишера
для распределения хи-квадрат
Вычисление функции распределе-
распределения, порождаемой нормальной
плотностью с линейным дрейфом
среднеквадратического отклонения
Вычисление вероятности отказа из-
изделия, прочность которого распре-
распределена по закону Вейбулла, а напря-
напряжение распределено нормально
Точечная оценка среднего нормаль-
нормальной совокупности
Точечная оценка среднего нормаль-
нормальной совокупности
Оценка среднего нормальной сово-
совокупности
Оценка среднего нормальной сово-
совокупности
Оценка среднего нормальной сово-
совокупности
Интервальная оценка среднего нор-
нормальной совокупности по выбороч-
выборочному размаху
Интервальная оценка среднего нор-
нормальной совокупности по интер-
квартильной широте
Интервальная оценка среднего нор-
нормальной совокупности по среднему
абсолютному отклонению
Интервальная оценка среднего нор-
альной совокупности по медиане
Оценка среднеквадратического от-
отклонения нормальной совокупности
по выборочной дисперсии
790
Перечень математике™ статистических таблиц
Продолжение таблицы
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Стр.
112
113
114
114
115
116
118
119
119
120
122
124
124
125
126
127
Наименование
Значения 1/d
Значения коэффициента f(pi,P2)
Значения к% • (—10 ) для оптималь-
не " л не " но " с ценки а
она^ ен я Хг /Зг для оценки Огавы
Оценки а по подразмахам
Оценка а по двум статистикам
Значения it7
Значения квантилей распределен
ния размаха а; G)
Значения квантилей распределе-
распределения среднего абсолютного отклоне-
отклонения 771G)
о In - 1
Значения * / —^— для интерваль-
ной (двусторонней) оценки а
Коэффициенты z\ и Z2 кратчайших
доверительных интервалов
Значения функции z = f{y)
Значения функции g(z)
Значения функции z = f{h^y)
Значения функции t/j(z)
Значения k(h,j)
Область применения
Оценка среднеквадратического от-
отклонения нормальной совокупности
по выборочному размаху
Оценка среднеквадратического от-
отклонения нормальной совокупности
по шаблону
Оценка среднеквадратического от™
клонения нормальной совокупности
с помощью порядковых статистик
Оценка среднеквадратического от-
отклонения нормальной совокупности
с помощью порядковых статистик
Оценка среднеквадратического от-
отклонения нормальной совокупности
по размахам
Оценка среднеквадратического от-
отклонения нормальной совокупности
Квантили стандартного нормаль-
нормального распределения для вероятно-
вероятностей, используемых в раз л' ^ нь х
аппроксимациях
Оценка и проверка статист '^есК'Х
гипотез, основанных на при енен
размахов
Интервальная оценка среднеквадра-
среднеквадратического отклонения нормальной
совокупности
Интервальная оценка среднеквадра-
среднеквадратического отклонения нормальной
совокупности
Интервальная оценка среднеквадра-
среднеквадратического отклонения нормальной
совокупности
Оценка параметров усе^ енно не \ -
мального распределения
Оценка параметров усе^ енно не \ -
мального распределения
Оценка параметров в неполностью
определенных выборках
Оценка параметров в неполностью
определенных выборках
Оценка параметров нормального
распределения в цензурированных
выборках
Перечень математика-статистических таблиц
791
Продолжение таблицы
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
Стр.
128
129
130
138
141
142
143
148
149
150
153
163
167
168
170
Наименование
Коэффициенты х'(а:,7г,71) и
X (а, п, г)
Коэффициенты t;(a,n,r) и
(-1) -t"(a,n,r)
Коэффициенты к% и к[ для п = 10
Значения коэффициентов bi и Si
Значения коэффициентов кш и кв
Значения коэффициентов ca(d) и
c'a(d) для а = 0,90
Значения коэффициентов bfa(d) и
b'a(d) для а = 0,95
Зависимость параметра /3 распре-
распределения Вейбулла от коэффициен-
коэффициента вариации v = s/x
Значения аз,/3,6 и с, используемые
при оценке параметров распределе-
распределения Вейбулла
Значения G, /3 и Ь; для оценки па-
параметров распределения Вейбулла
Значения коэффициентов щ и q
Значения коэффициентов к\ и fe
Значения коэффициентов с'а и с^
Значения коэффициентов d'a и d^
Коэффициенты к'{е,а) и fc/;(e,a)
Область применения
Оценка параметров нормального
распределения в цензурированных
выборках
Оценка параметров нормального
распределения в цензурированных
выборках
Оценка параметров нормального
распределения в цензурированных
выборках с помощью порядковых
статистик
Оценка параметров экспоненциаль-
экспоненциального распределения с помощью по-
порядковых статистик
Интервальная оценка наработки на
отказ
Интервальная оценка интенсивно-
интенсивности отказов
Интервальная оценка интенсивно-
интенсивности отказов
Оценка параметров распределения
Вейбулла
Оценка параметров распределения
Вейбулла
Оценка параметров распределения
Вейбулла
Оценка параметров распределения
Вейбулла с помощью порядковых
статистик
Оценка параметров распределения
Вейбулла с помощью порядковых
статистик
Совместная интервальная оценка
параметров распределения Вейбул-
Вейбулла с помощью порядковых статис-
статистик
Совместная интервальная оценка
параметров распределения Вейбул-
Вейбулла с помощью порядковых статис-
статистик
Интервальная оценка наработки
компонента при заданной вероят-
вероятности безотказной работы
792
Перечень математике™ статистических таблиц
Продолжение таблицы
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
Стр.
173
196
198
199
200
201
215
217
219
220
222
224
231
232
233
233
Наименование
Значения г) = — -
; t(r,r)
Значения 1' = Fy 2m, 2n; a^ J для
а = 0,95
гл tot М
Значения —)=*-
л/п
Значения п для распределения
Вейбулла
Значения а (г, а)
Значения Ь(г, а)
Процентные точки статистик Dn и
Квантили распределения пш2
Квантили распределения %2
Квантили предельного распределе-
распределения статистики nQ2
Нижние критические точки стати™
стики Ватсона U2
Критические значения V^ (а) для
верхних процентных точек стати™
стики Купера
Значения коэффициентов ci моди-
модифицированного х -критерия нор-
нормальности для к = 3 -^ 15
Критические значения dkict) моди-
модифицированного %2-критерия нор-
нормальности
Критические значения статистики
пш2 для проверки нормальности
распределения
Критические значения статисти-
статистики Колмогорова—Смирнова, моди-
модифицированной для проверки нор-
нормальности распределения
Область применения
Оценка сокращения продолжитель-
продолжительности испытаний за счет цензуриро-
цензурирования испытываемой выборки
Прогнозирование средней наработ-
наработки до отказа в экспоненциальных
выборках
Определение объема выборки для
оценки среднего нормального рас-
распределения при неизвестной дис-
дисперсии
Определение объема выборки, необ-
необходимого для оценки среднего рас-
распределения Вейбулла
Планирование испытаний для оцен-
оценки интенсивности отказов с задан-
заданной точностью
Планирование испытаний для оцен-
оценки интенсивности отказов с задан-
заданной точностью
Проверка гипотезы нормальности
гипотетического распределения
Проверка гипотезы нормальности
гипотетического распределения
Проверка гипотезы согласия
Проверка гипотезы согласия
Проверка гипотезы согласия гипо-
гипотетического распределения с теоре-
теоретическим
Проверка гипотезы согласия гипо-
гипотетического распределения с теоре-
теоретическим
Проверка совпадения эмпирическо-
эмпирического распределения с нормальным
Проверка совпадения эмпирическо-
эмпирического распределения с нормальным
Проверки гипотезы нормальности
распределения
Проверка гипотезы нормальности
распределения
Перечень математика-статистических таблиц
793
Продолжение табл ць
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
Стр.
235
236
239
240
242
243
244
247
249
252
255
258
259
260
267
269
272
278
Наименование
Критические значения статистики
Фроцини Вп для проверки нори-
альности распределения
Коэффициенты an^j+i (xlO4) кри-
критерия Шапиро—У илка
Коэффициенты 77, j и е
Процентные точки критерия И7"(а)
Значения Ктп(а) для а = 0,05
Критические значения Ti(a) и
Т2(а)
Критические значения Мп(а) кри-
критерия нормальности Али—Чёрго—
Ревеса
Критические значения г (а) крите-
критерия Филлибена
Коэффициенты щ и Ь% для вычис-
вычисления статистик Ki, Ж~2, Кз
Критические точки критериев
Кг(а), К2(а) и К3(а)
Дисперсии статистик Оя
Критические значения di(a) и
d2{a) критерия Гири
Критические значения U\(ot) и
U2 (а) критерия Дэвида-Хартли-
Пирсона
Критические значения Т' (а) крите-
критерия Шпигельхальтера
Критические значения критерия
Д'Агостино
Значения коэффициентов 8 is. —
А
Критические значения а\ и п2 кри-
критерия Муроты—Такеучи на уровне
значимости а = 0,10
Сравнение критериев проверки
нормальности распределения слу-
случайных величин
Область применения
Проверка гипотезы нормальност
распределения
Проверка гипотезы нормальности
распределения
Аппроксимация критических точек
критерия Шапиро—"Уилка
Проверка гипотезы нормальности
распределения
Проверка гипотезы нормальности
распределения критерием Васичека
Проверка гипотезы нормальности
распределения критерием Хегази-
Грина
Проверка гипотезы нормальности
распределения
Проверка гипотезы нормальности
распределения
Проверка гипотезы нормальности
распределения
Проверка гипотезы нормальности
распределения
Проверка гипотезы нормальности
критерием Оя
Проверка гипотезы нормальности
критерием Гири
Проверка гипотезы о нормальности
распределения критерием Дэвида-
Хартли-Пирсона
Проверка гипотезы нормальности
распределения критерием Шпигель-
Шпигельхальтера
Проверка гипотезы нормальности
распределения
Аппроксимация распределения ко™
эффициента эксцесса нормального
распределения
Проверка гипотезы нормальности
распределения критерием Муроты—
Такеучи
Сравнение различных критериев
нормальности по мощности
794
Перечень математике™ статистических таблиц
Продолжение таблицы
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
Стр.
280
281
283
284
287
288
289
292
295
296
299
300
301
302
303
304
305
Наименование
Критические значения критерия
экспоненциальное™ We Шапиро™
Уилка
Критические значения критерия
экспоненциальное™ We0 Шапиро™
Уилка
Критические значения статистик
критериев согласия типа Колмого-
Колмогорова-Смирнова для проверки экс™
потенциальности распределения с
неизвестными параметрами
Процентные точки модифициро-
модифицированных критериев типа Колмогоро-
Колмогорова-Смирнова для проверки экспо-
ненциальности распределения
Критические значения статистики
W2
Критические значения Вп(а) кри-
критерия экспоненциальности Фроци-
ни
Критические значения K(z, га, а) и
K(zJm,a) корреляционного крите-
критерия экспоненциальности
Критические значения D(pt) стати-
статистики Кимбера-Мичела
Критические значения статистики
с = л/п(с — 1)
Граничные значения t\(a) и ?г(а)
критерия Холлендера-Прошана
Критические значен я Тг(а) кри-
критерия Кочара
Критические значения ci(ct) и сг(а)
критерия Эппса—Палли
Критические значения Мп(о) кри-
критерия Чёрго-Уэлча
Значения Р(ЬП ^ к)
Критические значения шп (а) стати-
статистики Шермана
Критические значения г]п(а) стати-
статистики Г]п
Критические значения ha (n) стати-
статистики Хартли
Область применения
Проверка гипотезы экспоненциаль-
экспоненциальности распределения критерием
Шапиро—Уилка
Проверка гипотезы экспоненциаль-
экспоненциальности распределения критерием
Шапиро—Уилка
Проверка гипотезы экспоненциаль-
экспоненциальности распределения критериями
типа Колмогорова-Смирнова
Проверка гипотезы экспоненциаль-
экспоненциальности распределения критериями
типа Колмогорова-Смирнова
Проверка гипотезы экспоненциаль-
экспоненциальности распределения критериями
типа Крамера-фон Мизеса-Смир-
нова по цензурированным выборкам
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Фроцини
Проверка гипотезы экспоненциаль-
экспоненциальности корреляционным критерием
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Кимбера-Мичела
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Климко—Антла—
Радемакера—Рокетта
Проверка гипотезы экспоненци-
экспоненциальности критерием Холлендера-
Прошана
Проверка гипотезы экспоненц аль-
ности критерием Кочара
Проверка гипотезы экспоненц аль-
ности критерием Эппса—Палли
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Чёрго-Уэлча
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Бергмана
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Шермана
Проверка гипотезы экспоненци-
экспоненциальности критерием наибольшего
интервала
Проверка гипотезы экспоненциаль-
экспоненциальности критерием Хартли
Перечень математика-статистических таблиц
795
Продолжение таблицы
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
Стр.
309
310
312
314
318
321
323
324
325
327
329
330
331
332
334
338
Наименование
Критические значения Ua стати-
статистики и
Критические значения G\(pt) и
G2{pt) статистики Гринвуда
Коэффициенты щ JiT-критерия со™
гласия Манн—Фертига—Шуера для
распределения Вейбулла
Критические значения Ка (г, п)
критерия Манн—Фертига—Шуера
Критические значения W\{a) и
И^(ск) критерия экспоненциально-
сти Лоулесса
Критические значения М\ (а) и
M2(ct) статистики Морана
Критические значения W\{a) и
W2 (а) критерия равномерности
Ченга-Спиринга
Критические значения J(a) крите-
критерия Саркади-Косика
Критические значения На(т,п)
статистики Дудевича—ван дер Мю-
лена
Критические значения Ti(a),
Ti(a), T2(ot) и Tj(a) критерия
равномерности Хегази-Грина
Критические значения Mi (a),
M2{pt) статистики Янга
Критические значения J9+, D~, D,
V критериев равномерности
Критические значения Вп(а) кри-
критерия Фроцини для проверки рав-
равномерности распределения
Критические значения Q(ot)
статистики Гринвуда—Кэсенберри—
Миллера для проверки равномер™
ности распределения
Критические значения Nk(cv)
критерия равномерности Неймана—
Бартона
Критические значения К (а) крите™
рия знаков
Область применения
Проверка гипотезы экспоненциаль-
ности критерием U
Проверка гипотезы экспоненциаль-
ности критерием Гринвуда
Проверка гипотезы согласия эмпи-
эмпирического распределения с распре-
распределением Вейбулла
Проверка гипотезы согласия эмпи-
эмпирического распределения с распре-
распределением Вейбулла
Проверка гипотезы экспоненциаль-
ности критерием Лоулесса
Проверка гипотезы равномерности
распределения критерием Морана
Проверка гипотезы равномерности
распределения критерием Ченга-
Спиринга
Проверка гипотезы равномерности
распределения критерием Саркади-
Косика
Проверка гипотезы равномерности
критерием Дудевича—ван дер Мю-
лена
Проверка гипотезы равномерности
распределения критерием Хегази—
Грина
Проверка гипотезы равномерности
распределения критерием Янга
Проверка гипотезы равномерности
критериями Колмогорова-Смирно-
Колмогорова-Смирнова
Проверка гипотезы равномерности
распределения критерием Фроцини
Проверка гипотезы равномерности
распределения критерием Гринву-
да-Кэсенберри-Миллера
Проверка гипотезы равномерности
распределения критерием Неймана—
Бартона
Проверка гипотезы симметрии эм-
эмпирического распределения крите-
критерием знаков
796
Перечень математике™ статистических таблиц
Продолжение таблицы
114
115
116
117
118
119
120
121
122
123
124
125
126
127
Стр.
339
346
358
370
391
393
395
396
398
400
403
404
406
409
Наименование
Критические значения Т+ (а) одно-
выборочного критерия Вилкоксона
Критические значения JB-критерия
Бооса
Оценки параметров j ш г] распреде-
распределения Su Джонсона
Значения квантилей уа = (ха — x)/s
нормированного распределения
Пирсона
Таблица квантилей распределения
Стьюдента t1
Критические значения модифици™
рованного критерия Стьюдента для
сравнения средних по двум выбор-
выборкам равного объема
Критические значения Nq (г, п)
для доверительной вероятности
а = 0,95
Значения г и No при п ^ 20
для двухступенчатого двухвыбо-
рочного критерия сравнения сред-
средних при доверительной вероятно-
вероятности а = 0,95
Критические значения Qa(k^n) мо-
модифицированного критерия Стью-
Стьюдента
Критические значения <?а(^,/)
„стьюдентизированного" размаха
Значения F^(l; kn — 2) для довери-
доверительной вероятности а = 0,95
Критические значения Та крите-
рия Тыоки
Критические значения rria,k*,v
„стьюдентизированного" максиму-
максимума
Множители g(ifc*,/,a) для кри-
критерия Стьюдента-Ньюмена-Кейл-
са при доверительной вероятности
а = 0,95
Область применения
Проверка гипотезы симметрии эм-
эмпирического распределения крите-
критерием Вилкоксона
Проверка гипотезы симметрии эм-
эмпирического распределения крите-
критерием Бооса
Аппроксимация эмпирического рас-
распределения кривой из семейства Su
Джонсона
Нахождение квантилей эмпиричес-
эмпирического распределения с помощью кри-
кривых распределения Пирсона
Проверка статистических гипотез
Сравнение средних значений двух
нормально распределенных выбо-
выборок модифицированным критерием
Стьюдента
Сравнение средних значений двух
нормально распределенных выборок
двухступенчатым критерием Волфа
Сравнение средних значений двух
нормально распределенных выборок
двухступенчатым критерием Волфа
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема критерием Полсона
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема методом прямого
сравнения (критерий Тьюки)
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема критерием „стью-
„стьюдентизированного" максимума
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема критерием Стью-
дента—Ньюмена—Кейлса
Перечень математика-статистических таблиц
797
Продолжение таблицы
128
129
130
131
132
133
134
135
136
137
138
139
Стр.
410
411
414
416
419
420
420
421
422
422
427
430
Наименование
Множители q(k*, /, с/) для крите-
критерия Дункана при доверительной ве-
вероятности а = 0,95
Критические значения К(п,к,а)
для критерия Линка—Уоллеса
при доверительной вероятности
а = 0,95
Критические значения F* (п, га) от-
отношения размахов
Критические значения К\(сх) и
К.2(ct) статистики Аризоно—Охты
для доверительной вероятности
а = 0,95
Критические значения ga(k,n) ста-
статистики Кохрана для доверитель-
доверительной вероятности а = 0,95
Критические значения На крите-
критерия Неймана-Пирсона для довери-
доверительной вероятности а = 0,95
Критические значения Ы^ крите-
критерия Неймана-Пирсона для довери-
доверительной вероятности а = 0,95
Критические значения са(п,к)
критерия Блисса-Кохрана-Тьюки
для доверительной вероятности
а = 0,95
Критические значения па(п^к)
критерия Хартли для доверитель-
доверительной вероятности а = 0,95
Критические значения Ка(п^к)
критерия Кэдуэлла-Лесли-Брауна
для доверительной вероятности
а = 0,95
Значения коэффициентов Ка(с)
Критические значения Da крите-
критерия Дэвида
Область применения
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема критерием Дункана
Сравнение средних нескольких (> 2)
нормально распределенных выборок
равного объема критерием Линка—
Уоллеса
Сравнение дисперсий двух нормаль-
нормальных выборок критерием отношения
размахов
Сравнение дисперсий двух нормаль-
нормально распределенных выборок крите-
критерием Аризоно-Охты
Сравнение дисперсий нескольких
(> 2) нормально распределенных
выборок равного объема критерием
Кохрана
Сравнение дисперсий нескольких
(> 2) нормально распределенных
выборок равного объема критерием
Неймана-Пирсона
Сравнение дисперсий нескольких
(> 2) нормально распределенных
выборок равного объема критерием
Неймана-Пирсона
Сравнение дисперсий нескольких
(> 2) нормально распределенных
выборок равного объема критерием
Блисса-Кохрана^Тькжи
Сравнение дисперсий нескольких
(> 2) нормально распределенных
выборок равного объема критерием
Хартли
Сравнение дисперсий нескольких
(> 2) нормально распределенных
выборок равного объема критерием
Кэдуэлла-Лесли-Брауна
Сравнение выборочной интенсивно-
интенсивности отказов (параметр экспоненци-
экспоненциального распределения) с заданным
значением
Сравнение параметров нескольких
(> 2) экспоненциальных распреде-
распределений
798
Перечень математике™ статистических таблиц
Продолжение таблицы
140
141
142
143
144
145
146
147
148
149
150
151
152
153
Стр.
431
432
440
455
457
459
461
462
465
466
470
472
473
478
Наименование
Критические значения La(n,k)
критерия отношения правдоподо-
правдоподобия для доверительной вероятности
а = 0,95
Критические значения са(к^п) ста-
статистики Чена
Функция распределения Wc(x)
Вальда
Критические значения U\(a) и
Ui (а) критерия Манна-Уитни
Критические значения статисти-
статистики Т знакового рангового критерия
Вилкоксона
Критические значения статистики
Фишера-Йэйтса-Терри-Гёфдинга
Критические значения Ха стати-
статистики Ван дер Вардена
Вспомогательные величины К кри-
критерия Ван дер Вардена
Критические значения Та крите-
критерия Хаги
Критические значения критерия
Крускала—"Уоллиса
Критические значения D^m(a)
критерия Неменьи
Критические значения Du,e(pL) кри-
критерия Вилкоксона-Вилкокс
Критические значения п(сч) крите-
критерия Кенуя
Критические значения Sa кри-
критерия Терпетры—Джонкхира для
к = 3
Область применения
Сравнение параметров нескольких
(> 2) экспоненциальных распреде-
распределений
Сравнение гарантийных наработок
нескольких экспоненциально рас-
распределенных выборок критерием
Чена
Последовательные методы проверки
гипотез о значениях параметров рас-
распределений критерием Вальда
Сравнение параметров сдвига двух
совокупностей критерием Манна-
Уитни
Сравнение параметров сдвига двух
совокупностей с неизвестным рас-
распределением критерием Вилкоксона
Сравнение параметров сдвига сово-
совокупностей с неизвестным распреде-
распределением критерием Фишера—Йэйтса—
Терри-Гёфдинга
Сравнение параметров сдвига двух
совокупностей с неизвестным рас-
распределением критерием Ван дер
Вардена
Вычисление статистики критерия
Ван дер Вардена (см. выше)
Сравнение параметров сдвига двух
совокупностей с неизвестным рас-
распределением критерием Хаги
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением критерием Круска-
Крускала—Уоллеса
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением критерием Неменьи
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением критерием Вилкок-
Вилкоксона—Вил коке
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением критерием Кенуя
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением критерием Терп-
стры—Джонкхира
Перечень математика-статистических таблиц
799
Продолжение таблицы
154
155
156
157
158
159
160
161
162
163
164
165
166
Стр.
478
480
483
485
489
494
497
498
499
500
503
505
510
Наименование
Критические значения Sa крите-
критерия Терпстры-Джонкхира для вы-
выборок равного объема
Критические значения La для
к = 3 и доверительной вероятности
а = 0,95
Критические значения La(k,n)
критерия Пейджа для доверитель™
ной вероятности а = 0,95
Критические значения Sa(n^k)
критерия Фридмана—Кендалла—
Бэбингтона Смита
Критические значения Ка(к1п)
критерия Кендалла-Эренберга
для доверительной вероятности
а = 0,95
Критические значения Si(a) и
&(«) статистики Ансари-Бредли
Метки a,N{i) критерия Кейпена
Критические значения К\(а) и
.Кг (ck) статистики Кейпена
Метки U i критерия Клотца
~N
Критические значения L\(ot) и
L2 (а) критерия Клотца
Критические значения С\{а) и
С2 (а) критерия Сэвиджа
Критические значения Mi (а) и
M2(pt) статистики Муда
Критические значения Di(ct) и
1>2(«) масштабного критерия Ка-
мата
Область применения
Сравнение нескольких (> 2) со-
совокупностей по выборкам равно-
равного объема критерием Терпстры—
Джонкхира
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением Ь-критерием
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением по выборкам равно-
равного объема критерием Пейджа
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением по выборкам рав-
равного объема критерием Фридмана—
Кендалла-Бэбингтона Смита
Сравнение параметров нескольких
(> 2) совокупностей с неизвестным
распределением по выборкам рав-
равного объема критерием Кендалла-
Эренберга
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Ансари-
Бредли
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Кейпена
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Кейпена
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Клотца
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Клотца
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Сэвиджа
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Муда
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Камата
800
Перечень математике™ статистических таблиц
Продолжение таблицы
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
Стр.
511
512
515
518
519
522
523
525
527
530
531
533
534
536
537
540
541
Наименование
Значения корректирующих коэф-
фициентов ifi@,95) и 1^@,95) кри-
критерия Камата
Критические значения Wmn(a) ста-
статистики Вуша-Винда для т = п
Критические значения La и Da для
fc = 3
Критические значения qa критерия
Дббе-Динника
Постоянные / и 1 критерия
Фостера-Стюарта
Критические значения (На) Н*-
критерия Хсу
Критические значения (Ga) G-кри-
G-критерия Хсу
Критические значения рангового
критерия обнаружения сдвига дис-
дисперсии
Критические значения JVi (a)
и N2{cx) сериального критерия
Вальда-Волфовитца
Критические значения R(a) крите-
критерия Рамачандрана—Ранганатана
Критические значения Na(ni, к) се-
сериального множественного крите-
критерия Шахнесси для к = 2 -f- 6
Критические значения na(li) кри-
терия случайности Олмстеда
Критические значения Ri(a) и
i?2 («) критерия числа серий знаков
первых разностей
Критические значения Д (а) и /г (а)
критерия инверсий
Критические значения г[^п(а) и
ri,n(a) критерия автокорреляции
Коэффициенты аппроксимации
критического значения критерия
Бартелса
Критические значения Ri(a) и
i?2 («) критерия кумулятивной сум™
мы
Область применения
Сравнение параметров масштаба
двух совокупностей с неизвестным
распределением критерием Камата
Сравнение параметров положения
и масштаба двух совокупностей с
неизвестным распределением ком-
комбинированным критерием Буша—
В инд а
Сравнение параметров положения
нескольких совокупностей с неиз-
неизвестным распределением
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы сдвига диспер-
дисперсии выборочного ряда в неизвестной
точке
Проверка гипотезы сдвига диспер-
дисперсии выборочного ряда в неизвестной
точке
Проверка гипотезы сдвига диспер-
дисперсии выборочного ряда в неизвестной
точке
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Перечень математика-статистических таблиц
801
Продолжение таблицы
184
185
186
187
188
189
190
191
192
193
194
195
196
197
Стр.
542
543
544
545
546
547
549
551
553
554
555
558
560
562
Наименование
Значения к для знаково-рангового
критерия случайности Холлина
Критические значения га знако-
во-рангового критерия случайно-
случайности Холлина
Критические значения К* крите-
критерия Шовене
Критические значения т(а) крите-
критерия Ирвина
Критические значения ri(a), Т2(а)
и тз(а) статистик Груббса
Критические значения т^а) крите-
критерия наибольшего абсолютного от-
отклонения
Критические значения т$(а) стати-
статистики Дэвида
Критические значения гю(ск),
гц(а), Г12 (а), г20(а), r2i(a) и
^22 (аг) статистик Диксона
Значения коэффициента к крите-
критерия Хоглина—Иглевича
Критические значения Lk{pt) и
L%(a) критерия Титьена-Мура
Критические значения Ek(cx) кри-
критерия Титьена—Мура
Критические значения т^ крите-
критерия Роснера
Критические значения С к (а) кри-
критерия Смоляка-Титаренко
Критические значения Sj (а) крите-
критерия Кимбера для выделения j верх-
н' х выбросов
Область применения
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы случайности вы-
выборочного ряда
Проверка гипотезы наличия выбро-
выброса в выборке, имеющей нормальное
распределение
Проверка гипотезы наличия вы-
выброса в выборке, имеющей нор-
нормальное распределение с известной
дисперсией
Проверка гипотезы наличия выбро-
выброса в выборке, имеющей нормальное
распределение
Проверка гипотезы наличия выбро-
выброса в выборке, имеющей нормальное
распределение
Проверка гипотезы наличия выбро-
выброса в выборке, имеющей нормальное
распределение
Проверка гипотезы наличия выбро-
выброса в выборке, имеющей нормальное
распределение
Проверка гипотезы наличия выбро-
выброса в выборке, имеющей нормальное
распределение
Проверка гипотезы наличия нес-
нескольких выбросов в выборке, имею-
имеющей нормальное распределение
Проверка гипотезы наличия нес-
нескольких выбросов в выборке, имею-
имеющей нормальное распределение
Проверка гипотезы наличия нес-
нескольких выбросов (количество вы-
выбросов априори неизвестно) в выбор-
выборке, имеющей нормальное распреде-
распределение
Проверка гипотезы наличия выбро-
выбросов в выборке, имеющей экспоненци-
экспоненциальное распределение
Проверка гипотезы наличия нес-
нескольких выбросов в выборке, име-
имеющей экспоненциальное распределе-
распределение
26 А. И. Кобзарь
802
Перечень математике™ статистических таблиц
Продолжение таблицы
198
199
200
201
202
203
204
205
206
207
Стр.
564
566
567
570
571
573
574
575
576
577
Наименование
Критические значения S* (а) кри-
терия Кимбера для выделения j
нижних выбросов
Критические значения G(a) и
Ri(a) критериев типа Груббса и
Диксона для выявления к верхних
выбросов в выборке, имеющей
распределение Вейбулла
Критические значения G* (а) и
R*(ot) критериев типа Груббса и
Диксона для выявления к нижних
выбросов в выборке, имеющей рас™
пределение Вейбулла
Множители а(п,а,/3) для постро-
построения односторонних толерантных
пределов в случае нормального
распределения (// неизвестно, а2
известно)
Множители а*(п,а,/3) для построе-
построения двусторонних толерантных ин-
тервалов в случае нормального
распределения (// неизвестно, а
известно)
Множители Ь(п,а,/3) для постро-
построения односторонних толерантных
пределов в случае нормального
распределения (/i известно, а2
неизвестно)
Множители Ь*(п, ск,/3) для постро-
построения двусторонних толерантных
интервалов в случае нормально-
нормального распределения (/i известно, а2
неизвестно)
Множители к(п,а, C) для постро-
построения односторонних толерантных
пределов в случае нормального
распределения (fi и а2 неизвестны)
Множители к*(п,а,/3) для построе-
построения двусторонних толерантных ин-
интервалов в случае нормального ра-
сределения (/i и а2 неизвестны)
Множители d(l,n,a,/3) для опреде-
определения двустороннего толерантного
интервала с использованием разма-
хов (при т = 1, без разбиения на
подвыборки)
Область применения
Проверка гипотезы налич я нес-
нескольких выбросов в выборке, име-
имеющей экспоненциальное распреде-
распределение
Проверка гипотезы наличия нес-
нескольких выбросов в выборке, имею-
имеющей распределение Вейбулла
Проверка гипотезы наличия нес-
нескольких выбросов в выборке, имею-
имеющей распределение Вейбулла
Вычисление толерантных пределов
нормально распределенной случай-
случайной величины (среднее неизвестно,
дисперсия известна)
Вычисление толерантных пределов
нормально распределенной случай-
случайной величины (среднее неизвестно,
дисперсия известна)
Вычисление толерантных пределов
нормально распределенной случай-
случайной величины (среднее известно,
дисперсия неизвестна)
Вычисление толерантных пределов
нормально распределенной случай-
случайной величины (среднее известно,
дисперсия неизвестна)
Вычисление толерантных пределов
нормально распределенной случай-
случайной величины (среднее и дисперсия
неизвестны)
Вычисление толерантных пределов
нормально распределенной случай-
случайной величины (среднее и дисперсия
неизвестны)
Вычисление толерантных интер-
интервалов нормально распределенной
случайной величины с помощью
размахов
Перечень математика-статистических таблиц
803
Продолжение таблицы
208
209
210
211
212
213
214
215
216
Стр.
578
580
581
582
584
585
588
597
602
Наименование
Множители cf(m,r/, а,/3) для опре-
определения двустороннего толерантно-
толерантного интервала с использованием раз-
махов
Минимальные объемы выборок
для построения непараметри-
непараметрических (двустороннего, nmin и
одностороннего, n^m) толерантных
интервалов, основанных на наи-
наибольших и наименьших выбороч-
выборочных значениях
Наименьшая доля /3 совокупности,
заключенная внутри непараметри-
непараметрического двустороннего толерантно-
толерантного интервала (между хт'1П и жтах в
выборке объема п)
Наименьшая доля /3 совокупности,
заключенная внутри непараметри-
непараметрического одностороннего толерант-
толерантного интервала (больше xmin или
меньше жтах в выборке объема п)
Коэффициенты г(т,п,к,а), для
которых вероятность того, что в
т или более из будущих к на-
наблюдений нормального распределе-
распределения величина х будет превышать
х — г (т, п, к, a) s, равна а
Коэффициенты Ь{т1 п,к,а), для
которых вероятность того, что в т
или более из будущих к наблюде-
наблюдений экспоненциального распреде-
распределения величина х будет превышать
п
Ь (га, п, к, a) Yl xij равна а
г=1
Значения с(к, п, т, а) для прогно-
прогнозирования при а = 0,95 нижней
границы средней наработки в к вы-
выборках объема п по т ранним мо-
моментам отказов
Масштабный коэффициент с и эф-
эффективное число степеней свобо-
свободы / для двухфакторного диспер-
дисперсионного анализа
Критические значения Та(т, к, fiji)
статистики Мака-Скиллингса
Область применения
Вычисление толерантных нте! -
валов нормально распределенной
случайной величины с помощью
размахов
Вычисление толерантных интерва-
интервалов для случайной величины с
неизвестным законом распределе-
распределения вероятностей
Вычисление доли совокупности с
неизвестным законом распреде-
распределения вероятностей, заключенной
между крайними значениями вы-
выборки
Вычисление доли совокупности с
неизвестным законом распределе-
распределения вероятностей, заключенной вне
крайних значений выборки
Прогнозирование значений будущих
наблюдений нормально распреде-
распределенной совокупности по результатам
наблюдения над выборкой
Прогнозирование значений будущих
наблюдений экспоненциально рас-
распределенной совокупности по ре-
результатам наблюдения над выбор-
выборкой
Прогнозирование результатов испы-
испытаний изделий на надежность
Двухфакторный дисперсионный
анализ с использованием размахов
Двухфакторный дисперсионный
анализ при неизвестном распре-
распределении данных и при наличии
пропущенных наблюдений
26*
804
Перечень математика-статистических таблиц
Продолжение таблицы
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
Стр.
608
612
614
615
616
618
620
622
623
629
631
635
646
649
659
661
662
664
Наименование
Критические значения га выбо-
выборочного коэффициента корреляции
для р = 0
Критические значения r*i?23...fe ко-
коэффициента множественной корре-
корреляции
Критические значения па крите-
критерия Кенуя
Критические значения Та крите-
рия Кокс-Стюарта
Критические значения Sa знаково-
знакового критерия корреляции Нелсона
Критические значения Si(a) и
5*2 (а) квадрантного критерия кор-
корреляции
Критические значения Qa угловой
статистики Олмстеда-Тыоки
Критические значения тпа крите-
критерия Шведа—Эйзенхарта
Критические значения Na крите-
критерия автокорреляции Кенуя
Критические значения Da крите-
критерия независимости Гёфдинга
Критические значения Sa крите-
критерия Ширахатэ
Критические значения Sw(<x) для
коэффициента конкордации W
Значения коэффициента К
Линеаризующие функциональные
преобразования (у* = а* + Ь*ж*)
Критические значения статистики
Дарбина-Ватеоыа
Критические значения Va крите-
критерия выбросов Эктона
Критические значения Ra крите-
критерия выбросов в регрессии Титьена-
Мура—Бекмана
Критические значения R^ крите-
критерия выбросов в регрессии Прескот-
та-Лунда
Область применения
Проверка гипотезы о наличии кор-
корреляции между случайными величи-
величинами
Проверка гипотезы о наличии мно-
множественной корреляции между слу-
случайными величинами
Оценка корреляции между пере-
переменными с помощью порядковых
статистик
Оценка корреляции между пере-
переменными с помощью порядковых
статистик
Оценка корреляции между случай-
случайными величинами
Оценка корреляции между случай-
случайными величинами
Оценка корреляции между случай-
случайными величинами
Оценка корреляции между случай-
случайными величинами
Оценка корреляции между случай-
случайными величинами
Проверка гипотезы о независимости
случайных величин
Проверка гипотезы о наличии
корреляции
Проверка гипотезы о наличии свя-
связей (согласованности) для несколь-
нескольких последовательностей
Выбор числа наблюдений для анали-
анализа таблиц сопряженности 2x2
Выбор типа кривой регрессии
Проверка гипотезы о наличии кор-
корреляции регрессионных остатков
Проверка гипотезы о наличии вы-
выброса в регрессионной моделили
Проверка гипотезы о наличии вы-
выброса в регрессионной модели
Проверка гипотезы о наличии вы-
выброса в регрессионной модели
Перечень математика-статистических таблиц
805
Окончание таблицы
235
236
237
238
239
240
241
242
243
244
245
246
247
Стр.
666
679
684
698
700
708
712
717
721
725
728
729
731
Наименование
Коэффициенты 11G,«, А) для по-
построения доверительной области
линейной регрессии
Значения коэффициента к(а,п)
Полиномы Чебышева Pj(i) и значе-
нияР-=;?р„2(;)
г=1
Коэффициенты для вычисления
границ регулирования контроль-
контрольных карт Шухарта
Значения коэффициентов Аг для
ж-карт Шухарта при неравных объ-
объемах контролируемых выборок
Коэффициенты ежи для ККНС
выборочного размаха
Относительная эффективность
различных контрольных карт
Матрица полного факторного экс-
эксперимента (ПФЭ) 23
Дробные реплики 2 ~~
Параметры ортогональных компо-
композиционных планов
Параметры униформ-ротатабель-
ных планов
Характеристики D-оптимального
плана
Параметры планов Хартли
Область применения
Построение доверительной области
для линейной регрессии
Определение объема испытаний для
получения заданной точности оцен-
оценки регрессии
Вычисление и анализ нелинейных
регрессионных моделей
Построение контрольных карт Шу-
Шухарта для регулирования технологи-
технологических процессов
Прстроение контрольных карт Шу-
Шухарта для регулирования техноло-
технологических процессов по выборкам
неравного объема
Построение ККНС для контроля
разброса случайной величины по
размаху
Выбор типа контрольной карты
для контроля технологического
процесса
Математическое планирование экс-
экстремального эксперимента
Математическое планирование экс™
тремального эксперимента
Математическое планирование экс-
экстремальных экспериментов
Математическое планирование экс-
экстремального эксперимента
Математическое планирование экс-
экстремального эксперимента
Математическое планирование экс-
экстремального эксперимента
Предметный указатель
Вейбулла распределение, оценка парамет-
ров 146
— интервальные оценки 165
— метод максимального правдоподобия
146
— метод моментов 147
— метод наименьших квадратов 150
— оценка а при известном /3 165
— оценка по квантилям 151
— оценка по порядковым статистикам 152
— планирование эксперимента по оценке
параметров 198
— совместная оценка параметров 166
— точечные оценки 146
Выбросы, критерии обнаружения 543
— для нормального распределения 544
— критерии для экспоненциального рас-
распределения 559
— критерий Бродского-Быцаня-Власенко
559
— критерий Диксона 548
— критерий для непрерывного распределе-
распределения (Дарлинга) 565
— критерий для распределения Вейбулла
564
— критерий Ирвина 544
— критерий Кимбера 561
— критерий наибольшего абсолютного от-
отклонения 547
— критерий Роснера 557
— критерий Смоляка-Титаренко 559
— критерий Титьена—Мура 553
— критерий Хоглина-Иглевича 550
— критерий Шовене 544
Гамма-распределение, оценка параметров
179
— /3 при известном а 179
— интервальная оценка /3 180
— оценка для малых выборок 180
— оценка максимального правдоподобия
179
— оценка методом моментов 180
— планирование эксперимента при оценке
параметра 201
— совместная оценка параметров 179
— точечные оценки 179
Гипергеометрическое распределение, оцен-
оценка параметров 191
Дискретные распределения вероятностей
84
— биномиальное 84
— геометрическое 92
— гипергеметрическое 92
— отрицательное биномиальное 90
— распределение Паскаля 91
— распределение Пуассона 88
Дисперсия (стандартное отклонение) нор-
нормального распределения 24
— интервальная оценка а по точечной
оценке 119
— интервальная оценка дисперсии а2 118
— интервальная оценка по среднему абсо-
абсолютному отклонению 118
— интервальная оценка стандартного от-
отклонения а по размаху 118
— оптимальная линейная оценка 113
— оценка Джини 115
— оценка Диксона 115
— оценка максимального правдоподобия
111, 123
— оценка Огавы 114
— оценка по выборочной дисперсии s2 111
— оценка по размаху 112
— оценка по среднему абсолютному откло-
отклонению 112
— оценка по шаблону 112
— оценки в неполных выборках 123
— точечная оценка 111
Интенсивность отказов с периодом прира-
приработки 195
Контрольные карты 697
Контрольные карты Шухарта 697
— карты с 703
— карты р 701
— карты s 699
— карты х и R 698
— карты индивидуальных значений и
скользящего размаха 703
Контрольные карты накопленных сумм
(ККНС) 704
— выборочных дисперсий 709
— выборочных размахов 707
— доли дефектных изделий 710
— среднего значения 705
Предметный указатель
807
Корреляционный анализ 606
— анализ по тренду 614
— квадрантный критерий 617
— корреляционное отношение 609
— коэффициент корреляции 606
— критерий Блума-Кифера-Розенблатта
623
— критерий Кенуя 614
— критерий Кенуя (автокорреляции) 622
— критерий Кокс-Стюарта 615
— критерий Олмстеда-Тьюки 620
— критерий Шахани 621
— критерий Шведа-Эйзенхарта (сериаль-
(сериальный) 621
— непараметрический корреляционный
анализ 614
— частная и множественная корреляции
611
Критерии согласия 204
— двухвыборочные критерии 227
— двухвыборочный критерий Колмогоро™
ва-Смирнова 227
— критерий х2 204
— критерий Андерсона 229
— критерий Андерсона™Дарлинга 220
— критерий Барнетта—Эйсена 211
— критерий Ватсона 222
— критерий Дарбина 224
— критерий Катценбайссера-Хакля 228
— критерий Колмогорова-Смирнова 227
— критерий Купера 223
— критерий Реньи 218
— критерий числа пустых интервалов 209
— одновыборочные критерии 204
Критерии нормальности 231
— критерий Али-Чёрго-Ревеса 244
— критерий асимметрии и эксцесса 268
— критерий Васичека 241
— критерий Гири 257
— критерий Д'Агостино 266
— критерий Дэвида—Хартли—Пирсона 258
— критерий Колмогорова-Смирнова 233
— критерий Ла Брека 248
— критерий Лина—Мудхолкара 263
— критерий Локка-Спурье 252
— критерий Мартинеса—Иглевича 265
— критерий Муроты-Такеучи 272
— критерий Оя 254
— критерий Саркади 261
— критерий Филлибена 245
— критерий Фроцини 235
— критерий Хегази-Грина 243
— критерий Шапиро-Уилка 238
— критерий Шпигельхальтера 260
— критерий, основанный на совокупности
малых выборок 273
— модифицированный %2-критерий 231
Критерии экспоненциальности 279
— корреляционный критерий 288
— критерий Бартлетта-Морана 294
— критерий Бергмана 301
— критерий Брейна-Шапиро 290
— критерий Дешпанде 316
— критерий Кимбера-Мичела 292
— критерий Климко-Антла-Радемакера-
Рокетта 294
— критерий Колмогорова-Смирнова 282
— критерий Кочара 298
— критерий Смирнова—Крамера—фон Ми-
зеса 286
— критерий Манна—Фертига—Шуера для
распределения Вейбулла 311
— критерий наибольшего интервала 304
— критерий показательных меток 305
— критерий типа Крамера-фон Мизеса 286
— критерий Фишера 293
— критерий Фроцини 288
— критерий Хартли 305
— критерий Холлендера—Прогнана 295
— критерий Шапиро-Уилка 279
— критерий Шермана 303
— критерий Эппса—Палли—"Чёрго—Уэлча
299
— ранговый критерий 306
— трансформация в равномерное распре-
распределение 308
Критерии равномерности распределения
319
— критерий Шермана 319
— критерий Гринвуда-Кэсенберри-Мил-
лера 332
— критерий Дудевича—ван дер Мюлена 324
— критерий Морана 320
— критерий Неймана—Бартона 333
— критерий Саркади-Косика 323
— критерий типа Колмогорова-Смирнова
330
— критерий Фроцини 331
— критерий Хегази—Грина 326
— критерий Ченга-Спирмена 322
— критерий Янга 328
Математическое планирование экспери-
эксперимента 715
— D-оптимальные планы 728
— линейные ортогональные планы 716
— метод крутого восхождения 732
— нелинейные планы второго порядка 722
— несимметричные планы 729
— ортогональные симметричные планы
724
— планы поиска оптимума 732
Предметный указатель
— ротатабельные планы 727
— симметричные планы 724
— симплексное планирование 734
Непараметрические критерии сдвига 452
— ^критерий 465
— Ь-критерий 480
— быстрый ранговый критерий 453
— критерий Левиса 479
— критерии сдвига для двух совокупностей
452
— критерии сдвига для нескольких (> 2)
совокупностей 466
— критерий Андерсона—Каннемана—Шэча
486
— критерий Ван дер Вардена 475
— критерий Вил коксона-Вил кокс 471
— критерий Даны Квейд 487
— критерий Кендалла—Эренберга 489
— критерий Кенуя 452
— критерий Краузе 481
— критерий Крускала—Уоллиса 466
— критерий Манна-Уитни-Вилкокеона
454
— критерий Мостеллера 464
— критерий Неменьи 469
— критерий Пейджа 482
— критерий Розенбаума 464
— критерий Фишера—Йэйтса—Терри—Гёф-
динга 459
— критерий Фишера-Терри-Йэйтса-Гёф™
динга 473
— критерий Фридмена-Кендалла-Бэбинг-
тона Смита 484
— критерий Хаги 464
— критерий Хеттманспергера 476
— критерий Ходжеса-Лемана-Оена 490
— медианный критерий 462
Непараметрические критерии масштаба
492
— квартальный критерий 501
— критерии масштаба для двух совокупно™
стей 492
— критерий Ансари-Бредли 492
— критерий Буша—Винда 511
— критерий Камата 509
— критерий Кейпена 496
— критерий Клотца 499
— критерий Краута—Линерта 508
— критерий масштаба для нескольких со™
вокупностей (> 2) 514
— критерий Муда 504
— критерий Сижела—Тьюки 495
— критерий Сукхатме 505
— критерий Сэвиджа 502
— критерий Сэндвика—Оллсона 507
Непрерывные распределения вероятно-
вероятностей 24
— Х2"неЦентРальное 80
— ^-нецентральное 81
— ^-распределение (Фишера) 56
— t-нецентральное 79
— ^-распределение (Стьюдента) 51
— бета-распределение 39
— Вейбулла 37
— гамма-распределение 38
— композиция распределений „нагрузка-
напряжение" 74
— Коши 72
— логарифмически нормальное 35
— логистическое 73
— Максвелла 68
— нормальное 24
— нормальное с линейным дрейфом сред-
среднего 64
— нормальное с линейным дрейфом сред-
неквадратического отклонения 65
— Парето 73
— равномерное 34
— распределение х (Пирсона) 44
— распределение модуля случайной вели-
величины, распределенной нормально 62
— распределение экстремального значения
70
— Рэлея 68
— треугольное 71
— усеченное нормальное 61
— экспоненциальное 36
Оценки при неизвестном законе распреде-
распределения вероятностей 192
— оценка Кантелли 192
— оценка Мей дел я 192
— оценка "Чебышева 192
— оценки Нётера 193
Параметр распределения 96
Подбор кривых распределения по экспери-
экспериментальным данным 352
— кривые Джонсона 352
— кривые Пирсона 368
— метод вкладов 385
— разложение теоретических распределе-
распределений 384
Последовательный анализ Вальда 438
— биномиальное распределение 449
— нормальное распределение 439
— экспоненциальное распределение 447
Ранговая корреляция 624
— коэффициент конкордации Кендалла-
Бэбингтона Смита 634
Предметный указатель
809
— коэффициент конкордации Шукени™
Фроли 636
— коэффициент корреляции Кендалла 624
— коэффициент корреляции Спирмена 626
— критерий Ван дер Вардена 633
— критерий Фишера-Йэйтса 632
— критерий Ширахатэ 630
— точечно-бисериальная корреляция 638
Регрессионный анализ 648
— анализ регрессионных остатков 658
— анализ уравнения регрессии 655
— выбросы в регрессии 660
— доверительные области и толерантные
границы регрессии 665
— линейный регрессионный анализ 649
— медианный метод Брауна-Муда 653
— метод Бартлетта—Кенуя 653
— метод Керрича 652
— метод наименьших квадратов 649, 655
— метод наименьших модулей 692
— метод однозначной аппроксимации, ме-
тод обратных разделенных разностей
694, 696
— метод последней точки 694
— метод Тейла 654
— метод условно-относительных разностей
696
— множественная регрессия 680
— нелинейная регрессия 681
— оценка коэффициентов регрессии 649
— оценка адекватности 655
— оценка наименьших квадратов 649
— оценка Тейла 654
— специальные методы сглаживания 691
— сравнение линейных регрессий 672
— статистический анализ коэффициентов
регрессии 655
Симметричность распределения, крите-
критерии оценки 336
— знаковый критерий 337
— критерий Антилла—Керстинга—Цуккини
340
— критерий Бооса 345
— критерий Бхатачарья—Гаствирта—Райта
342
— критерий Вилкоксона 339
— критерий Гупты 348
— критерий Кенуя 336
— критерий Смирнова 337
— критерий Финча 334
— критерий Фрезера 350
Сопряженность признаков, оценка таблиц
сопряженности 639
— 6?-критерий Вулфа 644
— коэффициент контингенции 641
— критерий Ле Роя 645
— критерий Мак-Нимара 643
— критерий Фишера 641
— оценка связей в таблицах г х с 646
— оценка связи в таблицах 2x2 642
Среднее нормального распределения,
сравнение средних 389
— ^-критерий 396
— дисперсионный критерий 399
— критерий „стьюдентизированного" раз-
размаха 399
— критерий Волфа 395
— критерий Дункана 408
— критерий Липка-Уоллеса 408
— критерий Полсона 402
— критерий Стьюдента—Ньюмена—Кейлса
407
— критерий Тькжи 403
— критерий Уолша 394
— критерий Шеффе 406
— модифицированный критерий Стьюден-
та 392
— парный ?-критерий 393
— сравнение средних двух совокупностей
389
— сравнение средних нескольких (> 2) со-
совокупностей 397
— сравнение средних при известных дис-
дисперсиях 389
— сравнение средних при неизвестных
неравных дисперсиях 391
— сравнение средних при неизвестных рав-
равных дисперсиях 390
Сравнение дисперсий нормально распреде-
распределенных совокупностей 412
— критерий „стьюдентизированного" раз-
размаха 415
— критерий Аризоно-Охты 415
— критерий Бартлетта 417
— критерий Блисса-Кохрана-Тьюки 421
— критерий Кохрана 418
— критерий Кэдуэлла-Лесли-Брауна 422
— критерий Неймана^Пирсона 419
— критерий отношения размахов 414
— критерий Романовского 413
— критерий Самиуддина 423
— критерий Фишера 412
— критерий Хартли 421
— сравнение дисперсий двух совокупно-
совокупностей 412
— сравнение нескольких (> 2) совокупно-
совокупностей 416
Сравнение параметров экспоненциальных
совокупностостей 424
— критерий Дэвида 429
810
Предметный указатель
— критерий максимального правдоподо-
правдоподобия 430
— критерий Нагарсенкера 431
— критерий Сингха 433
— критерий Фишера 424
— критерий Чена 432
— пуссоновский критерий 426
— сравнение параметров двух совокупно-
совокупностей 424
— сравнение параметров нескольких (> 2)
совокупностей 429
— сравнение с эталоном 426
Сравнение параметров биномиальных со™
вокупностей 435
— сравнение параметров двух совокупно-
совокупностей 435
— сравнение параметров нескольких (> 2)
совокупностей 437
— сравнение с заданным значением 436
Толерантные пределы 569
— для нормальных совокупностей 569
— ц и а2 неизвестны 569
— /i известно, а2 неизвестно 572
— известны /i и а2 569
— непараметрические пределы 580
— пределы в задачах испытаний на надёж-
надёжность 587
— пределы для будущих наблюдений 583
— пределы для выборочных дисперсий 579
— пределы Холла—Прейри 583
— пределы, основанные на размахе 577
Тренд и случайность, критерии оценки 517
— критерий Аббе-Линника 517
— критерий автокорреляции 536
— критерий Бартелса 540
— критерий Вальда-Волфовитца 526
— критерий знаков первых разностей 533
— критерий инверсий 535
— критерий Кокс-Стюарта 520
— критерий кумулятивной суммы 541
— критерий Олмстеда 532
— критерий Рамачандрана-Ранганатана
530
— критерий ранговой корреляции 539
— критерий Фостера-Стюарта 519
— критерий Холлина (знаково-ранговый)
542
— критерий Хсу 522
— критерий Шахнесси 530
— ранговый критерий оценки сдвига в дис-
дисперсии 524
— сериальный критерий 526
Экспоненциальное распределение, оценка
параметров 134
— двухстадийная оценка 135
— интервальная оценка параметра 141
— оптимальная линейная оценка 135
— оценка максимального правдоподобия
134
— оценка Огавы 137
— оценка по одной порядковой статистике
136
— оценка Эпштейна 119
— планирование эксперимента по оценке
параметра 200
— точечная оценка 134
Именной указатель
Аббе (Abbe) 517
Али (А1у) 244
Андерсон (Anderson) 213, 220, 229, 486
Ансари (Ansari) 492
Анскомб (Anscomb) 89
Антилл (Antille) 340
Антл (Antle) 294
Аризоно (Arizono) 415
Ароян (Arolan) 47
Байн (Bain) 317
Барнетт (Barnett) 211
Бартелс (Bartels) 540
Бартлетт (Bartlett) 294, 417, 652
Бартон (Barton) 333
Бекман (Beckman) 662
Бергман (Bergman) 301
Бернулли (Bernulli) 84
Блисс (Bliss) 421
Блум (Blum) 623
Бокс (Box) 727, 732
Боос (Boos) 345
Боукер (Bowker) 576
Браун (Brown) 422, 653
Браунли (Browlee) 669
Бредли (Bradley) 492
Брейн (Brain) 290
Бродский 559
Буш (Bush) 511
Бхапкар (Bhapkar) 514
Бхатачарья (Bhatacharya) 342
Быцань 559
Вальд (Wald) 438, 526, 539
Ван дер Варден (Van der Varden) 460, 475,
633
Васичек (Vasicek) 241, 324
Ватсон (Watson) 213, 222, 659
Вейбулл (Weibull) 36, 37, 146, 198
Вилкокс (Wilcox) 471
Вилкоксон (Wilcoxon) 339, 454, 471
Вилсон (Wilson) 45, 263
Винд (Wieand) 511
Власенко 559
Волф (Wolfe) 395
Волфовитц (Wolfowitz) 526, 539
Вонг (Wang) 53
Воркинг (Working) 670
Вулф (Woolf) 644
Гаек (Hajek) 465
Гаствирт (Gastwirh) 342
Гёфдинг (Hoeffding) 459, 473, 628
Гири (Geary) 257
Голдштейн (Goldstein) 45
Грин (Green) 243, 326
Гринвуд (Greenwood) 309, 332
Груббс (Grabbs) 545, 564
Гупта (Gupta) 348
Д'Агостино (D'Agostino) 266
Давенпорт (Davenport) 467, 485
Дарбин (Durbin) 224, 627, 659
Дарлинг (Darling) 213, 220, 565
Даусон (Dawson) 53
Даутон (Dawton) 115, 266
Дешпанде (Deshpande) 316, 514
Джини (Gini) 115, 213
Джонсон (Johnson) 107, 352
Джонкхир (Jonckheere) 477
Диксон (Dixon) 100, 115, 131, 548
Дудевич (Dudewicz) 324
Дункан (Duncan) 408
Дэвид (David) 258, 429
Дюфор (Dufor) 514
Закс (Sachs) 185
Мглевич (Iglewicz) 265, 550
Иман (Iman) 456, 467, 485, 627
Ирвин (Irwin) 544
Йэйтс (Yates) 459, 473, 632
Камат (Kamat) 509
Каннеман (Kanneman) 486
Кантелли (Cantelli) 192
Картер (Carter) 59
Катценбайссер (Katzenbeisser) 228
Квейд (Quade) 488
Кейлс (Keuls) 407
Кейпен (Capon) 496
Кендалл (Kendall) 484, 489, 535, 624
Кенуй (Kenuai) 101, 336, 452, 614, 622, 652
Керрич (Kerrich) 652
Керстинг (Kersting) 340
Кёхлер (КоесЫег) 52
812
Именной указатель
Кимбел (Kimball) 319
Кимбер (Kimber) 292, 561
Кифер (Kiefer) 623, 728
Климко (Klimko) 294
Клотц (Klotz) 499
Кокс Д. (Сох D.) 520, 616
Кокс К. (Сох С.) 391
Колмогоров 213, 214, 225, 234, 330
Коно (Копо) 730
Косик (Kosik) 323
Кохран (Cochran) 304, 391, 418
Кочар (Kochar) 298
Коши (Cauchy) 72
Крамер (Cramer) 213, 216, 286
Краузе (Crouse) 481
Краут (Krauth) 508
Крускал (Kruskal) 466
Крючков (Kruchkoff) 669, 670
Купер (Kulper) 213, 223, 330
Кэдуэлл (Cadwell) 41, 422
Кэмп (Camp) 186
Кэсенберри (Quesenberry) 332
Ла Брек (La Brecque) 248
Ле Рой (Le Roy) 645
Левис (Lewis) 479
Леман (Lehmann) 103, 490, 603
Лесли (Leslie) 422
Лин (Lin) 263
Линерт (Lienert) 508
Линк (Link) 408
Линник 517
Локк (Locke) 252
Локтев 54
Лоулесс (Lawless) 317
Лунд (Lund) 663, 680
Люнг (Ljung) 514
Мак (Mack) 601, 603
Мак-Нимар (McNemar) 643
Максвелл (Maxwell) 68
Манн Н. (Mann N.) 166, 311
Манн X. (Mann H.) 454
Мартинес (Martinez) 265
Мейдель (Meidel) 192
Мизес, фон (von Mises) 213, 216, 286
Миллер (Miller) 332
Мичел (Michael) 292
Моленар (Molenar) 85, 185
Моран (Moran) 294, 320
Мостеллер (Mosteller) 464, 479
Муд (Mood) 504, 653
Мудхолкар (Mudholkar) 263
Мур (Moore) 553, 662
Мурота (Murota) 272
Мюлен, ван дер (van der Meulen) 324
Нагарсенкер (Nagarsenker) 431
Нейман (Neyman) 261, 333, 419
Нелсон (Nelson) 616
Неменьи (Nemenyi) 469
Нётер (Noether) 193
Ньюмен (Newman) 407
Огава (Ogawa) 101, 114, 137
Олмстед (Olmsted) 532, 620
Олссон (Olsson) 507
Охта (Ohta) 415
Оя (Oja) 254
Палли (Pulley) 299
Парето (Pareto) 73
Паскаль (Pascal) 48, 91
Пейдж (Page) 482
Пейзер (Peizer) 47, 53, 58
Пирсон (Pearson) 44, 80, 101, 258, 368, 419,
647
Полсон (Paulson) 42, 57, 186, 402
Пратт (Pratt) 47, 53, 58, 186
Прейри (Prairie) 583
Прескотт (Prescott) 663, 680
Принтис (Prentice) 598
Прошан (Proshan) 295
Пуассон (Poisson) 48, 86, 88
Радемакер (Rademaker) 294
Райт (Wright) 342
Рамачандран (Ramachandran) 530
Ранганатан (Ranganathan) 530
Ревес (Revesz) 244
Реньи (Renyl) 218
Розенбаум (Rosenbaum) 464
Розенблатт (Rosenblatt) 623
Рокетт (Rockette) 294
Романовский 207, 413
Роснер (Rosner) 557
Рэлей (Rayleigh) 68
Самиуддин (Samiuddln) 423
Саркади (Sarkadi) 261, 274, 323
Сатервайт (Satterwaite) 391
Сен (Sen) 490
Сижел (Siegel) 495
Сингх (Singh) 433
Скиллингс (Skillings) 602
Смирнов 213, 214, 216, 225, 234, 275, 282,
330, 337
Смит Б. (Babington Smith) 484, 634
Смоляк 559
Спендли (Spendley) 734
Спиринг (Spiring) 322
Спирмен (Spierman) 626, 630
Именной указатель
813
Спурье (Spurrier) 252
Стьюдент (Student) 51, 79, 392, 407
Стюарт (Stuart) 519, 520, 615
Сукхатме (Sukhatme) 505
Сэвидж (Savage) 502
Сэндвик (Sandvik) 507
Такеучи (Takeuchi) 272
Тейл (Theil) 654, 657
Терпстра (Terpstra) 477
Терри (Terry) 459, 473
Тику (Tiku) 82
Титаренко 559
Титенко 186
Титьен (Tietjen) 553, 662
Тькжи (Tukey) 101, 403, 495, 620
Уайз (Wise) 42
Уилк (Wilk) 238, 274, 279
Уилкс (Wiles) 580
Уилсон (Wilson) 732
Уитни (Whitney) 454
Уоллес (Wallace) 408
Уоллис (Wallis) 466
Уолш (Walsh) 103, 394
Уэлч (Welch) 299, 392
Фертиг (Fertig) 166, 311
Филлибен (Filliben) 245, 288
Финч (Finch) 344
Фишер (Fisher) 40, 52, 56, 81, 293, 412, 424,
459, 473, 632, 641
Фостер (Foster) 519
Франчиа (Francia) 238
Фрезер (Frazer) 350
Фридмен (Friedman) 484, 488
Фроли (Frawley) 636
Фроцини (Frozini) 213, 235, 288, 331
Хага (Haga) 464
Хакль (Hackl) 228
Хальд (Hald) 669
Хан (Hahn) 587
Хантер (Hunter) 727
Хартер (Harter) 136
Хартли (Hartley) 258, 305, 421, 730
Хегази (Hegazy) 243, 326
Хейнс (Halnes) 58
Хекст (Hext) 734
Хеттманспергер (Hettmannsperger) 476
Хилферти (Hilferty) 45
Химсуорт (HImsworth) 734
Хоглин (Hoaglin) 550
Ходжес (Hodges) 103, 490
Холл (Hall) 184, 583
Холлендер (Hollander) 295
Холлин (Hollin) 542
Хотеллинг (Hotelling) 670
Хсу (Hsu) 522
Хэлден (Haldane) 46
Цуккини (Zucchini) 340
Чебышев 192, 682
Чен (Chen) 432
Ченг (Cheng) 322
Чёрго (Csorgo) 244, 299
Чупров 647
Шапиро (Shapiro) 238, 274, 279, 290
Шахани (Shahani) 621
Шахнесси (Shaughnessy) 530
Швед (Shved) 621
Шерман (Sherman) 303, 319
Шеффе (Scheffe) 406
Шидак (SIdak) 465
Ширахатэ (Shlrahate) 630
Шовене (Chauvenet) 544
Шпигельхальтер (Spiegelhalter) 260
Шуер (Shuer) 311
Шукени (Schucany) 636
Шухарт (Shewhart) 697
Шэч (Schach) 486
Эйзенхарт (Elsenhardt) 621, 669
Эйсен (Eisen) 211
Эктон (Acton) 661
Энгельгардт (Engelhardt) 317
Эппс (Epps) 299
Эпштейн (Epstein) 136
Эренберг (Ehrenberg) 489
Янг (Young) 328
Научное издание
КОБЗАРЬ Александр Иванович
ПРИКЛАДНАЯ МАТЕМАТИЧЕСКАЯ СТАТИСТИКА.
ДЛЯ ИНЖЕНЕРОВ И НАУЧНЫХ РАБОТНИКОВ
Редактор B.C. Аролович
Оригинал-макет: А.А. Пярнпуу
Оформление переплета: А.Ю. Алехина, Л.А. Гусева
Подписано в печать 05.05.06. Формат 70x100/16. Бумага офсетная.
Печать офсетная. Усл. печ. л. 65,79. Уч.-изд. л. 72,4. Тираж 1500 экз. Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997, Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru;
http://www.fml.ru
Отпечатано с готовых диапозитивов
в ОАО «Московская типография № 6»
115088, г. Москва, Ж-88, ул. Южнопортовая, 24
ISBN 5-9221-0707-0
9 785922 107075м