/
Text
Игорь Владимирович Никифоров
ПОСЛЕДОВАТЕЛЬНОЕ
ОБНАРУЖЕНИЕ
ИЗМЕНЕНИЯ СВОЙСТВ
ВРЕМЕННЫХ РЯДОВ
Утверждено к печати
•Ордена Ленина Институтом проблем управления
Редактор издательства Н. А. Ермолаева
Художник В. Ю. Кученков
Художественный редактор Н. Н. Власик
Технический редактор Т. В. Калинина
Корректоры Р. 3. Землянская, Н. И. Казарина
ИБ № 27550
Сдано в набор 06.04.83
Подписано к печати 18.VII.83
Т-16605 Формат 60х90*/г.
Бумага типографская № 1
Гарнитура обыкновенная
Печать высокая
Усл. печ. л. 12,5 Уч.-изд. л.13,5 Усл. кр. отт. 12,75
Тираж 2400 экв. Тип. зак. 2724
Цена 1 р. 40 к.
Издательство «Наука»
117864 ГСП-7, Москва В-485. Профсоюзная ул., SO
2-я типография издательства «Наука»
121099, Москва, Г-99, Шубинский пер., Ю
Академия наук СССР
Ордена Ленина Институт проблем управления
И. В. Никифоров
ПОСЛЕ ДОВА ТЕЛЬНОЕ
ОБНАРУЖЕНИЕ
ИЗМЕНЕНИЯ СВОЙСТВ
ВРЕМЕННЫХ РЯДОВ
8
Издательство «Наука»
Москва 1983
УДК 519.27
Никифоров И. В. Последовательное обнаружение изменения
свойств временных рядов. М.: Наука, 1983.
В книге дан анализ известных из литературы методов и синтезирует-
ся ряд новых эффективных алгоритмов для обнаружения изменения
свойств временных рядов, в частности моделей тина авторегрессии —
скользящего среднего и динамических моделей объект — возмущение.
Основное внимание уделяется исследованию свойств алгоритмов,
вопросам учета априорной информации и настройки алгоритмов по раз-
личным критериям. Разработан ряд практических примеров. Приве-
ден набор подпрограмм на языке Фортран — IV.
Для специалистов в области прикладного анализа временных ря-
дов, автоматизации обработки информации и управления производст-
вом.
Ответственный редактор
доктор технических наук
Р. Ш. ЛИПЦЕР
1502000000-425
Н 042 (02)-83
117—83—Ш
© Издательство «Наука», 1983 г.
ВВЕДЕНИЕ
Анализ временных рядов представляет собой одну из наибо-
лее интенсивно развивающихся областей математической ста-
тистики. В последнее время эти методы стали широко исполь-
зоваться при управлении производством, при обработке научных
наблюдений в эконометрии, геофизике и т. и.
Основное внимание в анализе временных рядов уделяется
построению и использованию параметрических моделей типа
авторегрессии — проинтегрированного скользящего среднего
(АРПСС) и динамико-стохастических моделей (объект—возмуще-
ние), в которых выход представляет собой аддитивную смесь
возмущения типа АРПСС и независимого входа, пропущенного
через линейное разностное уравнение.
Традиционным при анализе временных рядов является пред-
положение о том, что статистические свойства наблюдаемого ряда
или свойства порождающего его механизма сохраняют определен-
ное постоянство во времени или медленно изменяются. Вместе
с тем многие практические задачи текущего контроля производ-
ства, технической и медицинской диагностики, гидроакустики,
геофизики сводятся к последовательному (т. е. в темпе с поступ-
лением очередного наблюдения) обнаружению скачкообразного
изменения (разладки) свойств наблюдаемого временного ряда,
происходящего в неизвестный момент времени.
Впервые такая задача рассматривалась М. Гиршиком, Г. Ру-
биным и Е. С. Пейджем для независимой гауссовской случайной
последовательности и обнаружения изменения математического
ожидания наблюдаемой случайной величины. Затем в целом ряде
работ Е. С. Пейджа, К. Кемпа, А. Н. Ширяева и др. были раз-
виты оптимальные и субоптимальные (в смысле минимизации
среднего запаздывания в обнаружении разладки при заданном
уровне ложных тревог) алгоритмы, проведены исследования их
свойств.
В последние годы задаче о разладке в советской и зарубеж-
ной периодической печати посвящаются десятки публикаций.
Популярность этой проблематики несомненна. Вместе с тем со-
здается странная ситуация. Появление новых теоретических
результатов почти не отражается на методах построения конкрет-
ных систем контроля производства, обнаружения сигналов, диаг-
ностики и т. п. Во многом это объясняется трудностями, возника-
ющими при использовании оптимальных алгоритмов. Дело в том,
что предположения теоретических работ о независимости после-
довательности наблюдений, точном знании параметров модели,
наличии известного распределения момента изменения свойств
3
случайной последовательности, одномерности наблюдаемого сиг-
нала или параметра его распределения, хотя и обеспечивают
чистоту математического решения, сильно ограничивают класс
решаемых задач и препятствуют широкому практическому исполь-
зованию полученных результатов.
Целями настоящей книги являются: анализ существующих
подходов в задаче о разладке и методов ее решения; разработка
и исследование практически эффективных методов последова-
тельного обнаружения разладки для многомерных зависимых
временных рядов в условиях как полной, так и неполной априор-
ной информации о свойствах наблюдаемых сигналов; применение
этих методов для обнаружения изменения коэффициентов моде-
лей типа АРПСС и типа объект—возмущение; разработка методи-
ки настройки предлагаемых алгоритмов по различным критериям.
В первой главе рассмотрен круг практических задач, решение
которых сводится к обнаружению разладки временных рядов;
сформулированы основные требования к алгоритмам. Во второй
главе даны варианты формальной постановки задачи, классифи-
кация, обзор и анализ последовательных методов обнаружения
разладки для случая независимых наблюдений и краткий обзор
апостериорных (т. е. использующих всю выборку) методов об-
наружения разладки. Вторая глава заканчивается выбором и
обоснованием дальнейшего использования алгоритма кумулятив-
ных сумм (АКС). В третьей и четвертой главах рассмотрены моди-
фикация и исследование АКС применительно к зависимым последо-
вательностям. В пятой главе результаты двух предыдущих глав
применяются для моделей АРПСС и линейных моделей объект—
возмущение. Методика настройки АКС рассмотрена в шестой
главе. Предлагаются различные способы оптимизации АКС по
нескольким критериям. Особое внимание уделено сведению ми-
нимаксной настройки АКС к решению задачи квадратичного про-
граммирования. Завершается шестая глава описанием программ-
ного обеспечения и инструкциями к набору из пятнадцати под-
программ, которые реализуют рассматриваемые в книге методы.
В седьмой главе дается обзор некоторых работ по использованию
АКС в промышленности и при обработке научных наблюдений.
Подробно рассмотрено применение АКС при управлении произ-
водством цемента и при обработке сейсмических наблюдений.
Настройка АКС и его возможности демонстрируются путем срав-
нительных испытаний автоматической и ручной обработки сей-
смических наблюдений. Завершается книга списком литературы
и исходными текстами подпрограмм на Фортране — IV.
Автор выражает глубокую признательность Э. Л. Ицковичу,
А. Ф. Кушниру и И. Б. Мучнику, внимание и советы которых
способствовали формированию его точки зрения в вопросах об-
наружения изменения свойств временных рядов.
Глава I
КРУГ РЕШАЕМЫХ ЗАДАЧ
1. Общая классификация задач
Определим круг практических задач и типичные содержатель-
ные постановки, в которых естественно возникает потребность
обнаруживать изменение (разладку) свойств случайных последо-
вательностей. Можно сказать, что с точки зрения практики
существуют два основных типа задач, решаемых с помощью алгорит-
мов обнаружения разладки. В первом случае необходимо обнару-
живать разладку как можно быстрее после ее появления при за-
данном уровне ложных тревог, но не требуется точно указывать
момент времени, когда произошла разладка. Эта задача, именуе-
мая по А. Н. Ширяеву «задачей скорейшего обнаружения раз-
ладки», часто возникает при текущем контроле качества непре-
рывной продукции, в радиолокации, гидроакустике и т. д. Одним
словом, везде, где функция потерь зависит от времени между
моментом появления разладки и моментом ее обнаружения и ча-
стоты ложных тревог. Например, при непрерывном контроле
технологического процесса увеличение запаздывания в обнару-
жении разладки приводит к увеличению времени, в течение ко-
торого выпускается бракованная продукция, а увеличение частоты
ложных тревог приводит, в свою очередь, к уменьшению выпуска
продукции из-за остановок технологического процесса для его
наладки и т. д.
В рамках такой схемы часто удается придать ясную содер-
жательную интерпретацию статистическим свойствам алгоритма
обнаружения разладки, сводя все к единому экономическому кри-
терию (по А. Дункану), включающему в себя стоимость единицы
выпущенной продукции, цену потерь от брака, цену за примене-
ние алгоритма контроля и наладку оборудования и т. д. Макси-
мизации в этом случае подлежит общий средний доход от совмест-
ного функционирования системы контроля и производства.
Второй основной тип задач, решаемых методами обнаружения
разладки, сводится к оцениванию момента появления разладки
post factum. Здесь в отличие от задачи скорейшего обнаружения
конечная выборка наблюдений собирается заранее (до начала
решения задачи) и требуется оценить момент появления разладки
как можно точнее. В некоторых случаях сам факт наличия раз-
ладки в пределах анализируемой выборки заранее неизвестен
и проверка ее наличия также является предметом решения.
Приведем практический пример подобной постановки задачи.
Во многих геофизических приложениях требуется по распола-
гаемой выборке отсчетов сейсмоприемников точно определить
6
момент вступления сейсмических волн или их различных фаз.
От точности оценки этих моментов практически полностью зависит
качество последующей обработки сейсмозаписей, например точ-
ность локации координат эпицентра землетрясения. В этом и мно-
гих других приложениях качество решения задачи о разладке
можно характеризовать величиной среднего квадрата отклонения
оценки момента разладки от истинной величины.
Будем называть алгоритмы, предназначенные для решения
задач первого типа, последовательными, а для задач второго
типа апостериорными. Данная работа посвящена рассмотрению
алгоритмов первого типа, но, так как в некоторых практических
задачах после обнаружения факта разладки требуется уточнить
момент ее возникновения, обсудим, почему это не всегда можно
сделать только с помощью последовательных методов, и кратко
остановимся на использовании апостериорных методов обнаруже-
ния разладки совместно с последовательными.
Чтобы круг рассматриваемых вопросов был очерчен более
четко, в двух последующих разделах остановимся на типовых
примерах практических задач, которые решаются с помощью
методов обнаружения разладки. Понятно, что принятая группи-
ровка: «задачи текущего контроля производства» и «задачи авто-
матизации обработки научных наблюдений» — выбрана весьма
условно и специалисту нетрудно будет отнести свою конкретную
проблему под ту или иную рубрику.
2. Задачи текущего контроля производства
Выделим следующие задачи, возникающие в подсистемах
контроля в АСУ ТП (см. рис. 1): контроль показателей качества
исходного сырья, полуфабрикатов и готовой продукции; контроль
исправности функционирования технологических агрегатов и
установок; контроль исправности измерительных и исполни-
тельных цепей.
В первом случае предполагается, что контролируемое качество
непрерывной продукции связано со статистическими характери-
стиками наблюдаемого сигнала, такими, как среднее, дисперсия,
корреляция. Если выпускается штучная продукция, то в каче-
стве контролируемого параметра может выступать число годных
деталей в партии. Однако так или иначе суть задачи заключается
в скорейшем последовательном обнаружении изменения стати-
стических характеристик наблюдаемого сигнала при приемлемом
уровне ложных тревог. Существует и другая задача — построе-
ние переключающих правил для приемочного контроля с разными
степенями жесткости [6]. Такие правила, кроме обнаружения
разладки, должны еще подавать сигнал к возврату от усиленного
контроля к обычному, после того как разладка устранена.
При контроле показателей качества может быть необходимо
и апостериорное обнаружение разладки. Это происходит в тех
случаях, когда по данным о функционировании участка произ-
6
водства за прошедшую смену, сутки и т. д. необходимо обнару-
живать момент времени изменения значений показателей качества
сырья, полуфабрикатов и т. п. Например, для предприятий с соб-
ственной сырьевой базой случайное изменение химического со-
става поступающего на обработку сырья (связанное с условиями
выработки карьера) приводит к изменению сорта выпускаемой
продукции. Если разладку не обнаруживать, то всю выпущенную
продукцию придется принимать с более низкой маркой. Можно
представить себе и такую технологическую ситуацию, когда
требуется последовательно обнаруживать разладку, затем апо-
стериорно оценивать момент ее возникновения.
Для второго типа задач — контроль исправности функциони-
рования технологических агрегатов и установок — прежде всего
необходимо последовательно обнаруживать резкое изменение
коэффициентов динамической модели, связывающей входы и вы-
ходы определенного агрегата или даже целого участка производ-
ства. Если предположить, что входы и выходы, наблюдаемые
в дискретные моменты времени, описываются случайными по-
следовательностями, то статистические свойства такой системы,
рассматриваемой как единое целое, будут определяться, с одной
стороны, свойствами входов, а с другой — коэффициентами ди-
намической модели (чаще всего на практике такая система опи-
сывается линейным разностным уравнением типа объект воз-
мущение). В этом случае задача заключается в обнаружении
разладки собственно коэффициентов динамической модели при
наличии «мешающих» параметров модели случайной последова-
тельности, задающей входы объекта. Такая задача, пожалуй,
наиболее сложна, так как алгоритм обнаружения разладки дол-
жен быть инвариантен по отношению к вариациям мешающих
параметров. Трудностей, связанных с таким избирательным об-
наружением разладки, можно до некоторой степени избежать,
если в качестве наблюдаемых сигналов рассматривать последо-
вательность случайных ошибок регрессионных (или иных) урав-
нений, моделирующих объект. Поясним это на примере. Пусть
объект моделируется линейным регрессионным уравнением со
случайными входами xlt:
N
yt — 3 aixit + 8ti
i=l
где at — коэффициенты модели, подверженные скачкообразным
изменениям; е( — независимая случайная ошибка. Понятно,
что совместное распределение наблюдаемых сигналов полностью
описывает такой объект, но содержит много мешающих парамет-
ров, изменение которых будет влиять на обнаружение разладки
к;. С другой стороны, можно анализировать свойства последо-
вательности ошибок
X
i=l
7
Объект (УП)
Рис. 1. Система текущего контроля при управлении производством
игнорируя то, как они получены, и по изменению свойств ёг су-
дить об изменении аг-. Для некоторых задач этого будет достаточно.
Нетрудно видеть, однако, что такой подход страдает наличием
«мертвых зон» в параметрическом пространстве. Если, например,
изменению подвержены сразу два параметра аг и a,j (i, j = 1, N)
или свойства входов xit, то такая разладка может быть замаски-
рована и не проявится через наблюдения ёг.
Третий тип задач, т. е. задачи контроля исправности изме-
рительных и исполнительных цепей, характерен прежде всего
тем, что существуют две группы возможных отказов. Первая
группа отказов — это «засорение» наблюдаемого сигнала корот-
кими, резкими выбросами, составляющими небольшой процент
всех наблюдений. При этом свойства измерительных цепей в даль-
нейшем не изменяются. В такой ситуации необходимо сглаживать
наблюдения методами, устойчивыми к выбросам, а не пытаться
обнаружить разладку свойств измерительных цепей. К отказам
такого типа приводит, например, воздействие электрических
разрядов на электронные устройства.
Вторая группа отказов — это, если так можно выразиться,
«закономерное» изменение свойств измерительных и исполнитель-
ных цепей, происходящее в неизвестный момент времени и
являющееся следствием поломки датчика, преобразователя или
изменения функций измерительной системы, преобразующей сиг-
нал X} в его оценку xt. Целью системы контроля измерительных
средств является не только быстрейшее обнаружение факта на-
личия отказа в измерительной системе, но и его локализация,
т. е. обнаружение отказавшего элемента — датчика, преобразо-
вателя и т. п. Понятно, что с помощью только последовательных
алгоритмов обнаружения разладки в большинстве случаев про-
8
нести локализацию отказа невозможно. Дело в том, что при кон-
троле по наблюдениям необходимо отделять разладку измери-
тельных цепей от изменения статистических свойств измеряемого
сигнала xt (см. рис. 1). Поэтому без привлечения дополнительной
информации разладку измерительной цепи можно обнаружить
лишь в том случае, если статистические характеристики xt при
нормальной работе значимо отличаются от статистических ха-
рактеристик при разлаженной, несмотря на любые изменения
свойств наблюдаемого сигнала xt. Например, пусть наблюдаемому
сигналу xt всегда присущи флюктуации, тогда уменьшение дис-
персии оценки xt ниже некоторого уровня будет свидетельство-
вать об отказе измерительной системы.
Наличие информационной избыточности позволяет отделить
собственно разладку измерительной системы от изменения ста-
тистических свойств измеряемого сигнала. В простейшем случае
один параметр может оцениваться с помощью двух и более изме-
рительных цепей. Наблюдая последовательность разностей меж-
ду оценками %* и одного сигнала, получаемыми г-й и у-й
измерительными цепями, можно обнаруживать разладку одной
из них. Более эффективный способ учета информационной избы-
точности заключается в использовании функциональных или
статистических связей между измеряемыми параметрами. При этом
можно без увеличения числа датчиков контролировать правиль-
ность их работы [21, 171]. В таких системах, кроме алгоритмов
обнаружения разладки и уравнений взаимосвязей, используются
логические приемы, обычно базирующиеся на теории графов, ко-
торые позволяют провести локализацию отказа на основе инфор-
мации от последовательных алгоритмов обнаружения разладки.
Указанные методы находят применение в системах централизо-
ванного контроля предприятий химико-технологического типа,
где в качестве уравнений связи используются уравнения мате-
риального баланса [95].
Применение вышеуказанных алгоритмов обнаружения раз-
ладки в подсистемах контроля в АСУ ТП позволяет получить
технологический эффект за счет своевременного обнаружения
подачи на производство некондиционного сырья, оперативной
корректировки ведения технологического процесса с целью
поддержания заданного уровня качества полуфабрикатов и вы-
ходных продуктов, своевременного устранения неисправностей
и поломок технологического оборудования, настройки и замены
датчиков и исполнительных механизмов, автоматического вы-
явления нарушений, происходящих в измерительных и испол-
нительных цепях, и прекращения использования ложной инфор-
мации в системах управления.
&
3. Задачи автоматизации
обработки научных наблюдений
При автоматизированной обработке научных наблюдений
можно выделить следующие типы практических задач: обнаруже-
ние изменения характеристик наблюдаемого явления по времен-
ному ряду измеряемых параметров; автоматический отбор
участков записей, содержащих полезную информацию, для их на-
копления или передачи по каналам с ограниченной пропускной
способностью; контроль исправности измерительных цепей.
Задачи первого типа обычно сводятся к упомянутой ранее за-
даче скорейшего обнаружения разладки в специфической по-
становке. Последовательные алгоритмы, используемые для ре-
шения такой задачи, должны оставаться работоспособными при
отклонении истинных статистических характеристик наблюдаемых
сигналов от расчетных как до, так и после разладки. Связано
это с тем, что при обработке научных наблюдений в отличие от
технологических применений, где свойства контролируемого
процесса (во всяком случае в налаженном состоянии) задаются
нормами или известны из прошлого опыта, редко можно точно оп-
ределить статистические свойства как «фонового», так и полезного
сигнала, появление которого необходимо обнаруживать. Во-пер-
вых, обнаруживаемые события могут происходить довольно ред-
ко, что не позволяет накопить большой статистический материал,
и во-вторых, фон и полезный сигнал часто представляют собой
нестационарные процессы. Например, в сейсмологии колебания
статистических характеристик сейсмического фона и сигналов
связаны с сезонными изменениями, метеоусловиями, располо-
жением и глубиной очага землетрясения и т. п. При анализе
физиологических показателей человека характеристики как фона,
так и сигнала существенно зависят от индивидуальных особен-
ностей организма, времени суток и т. п. Большинство из перечи-
сленных факторов носит случайный характер и, следовательно,
не может быть полностью учтено при последовательном обнару-
жении разладки, что делает нечувствительность алгоритмов
к отклонению истинных статистических характеристик наблюда-
емых сигналов от расчетных важнейшим свойством при обнару-
жении разладки. В этих условиях оптимальность алгоритмов
(в смысле быстрейшего обнаружения разладки) для конкретных
значений статистических характеристик фона и полезного сиг-
нала вряд ли имеет’значение. Здесь требуется гарантированное
обнаружение разладки при всевозможных вариациях характе-
ристик полезного сигнала, в то время как ложные тревоги не
будут слишком частыми при самых неблагоприятных вариациях
характеристик фона. Поэтому в таких задачах целесообразно
применять минимаксные критерии или вводить весовые функции,
которые учитывали бы важность тех или иных ситуаций.
После того как произошло обнаружение разладки и наблюда-
ется участок, содержащий полезный сигнал, часто требуется уточ-
10
нить момент возникновения разладки. Например, точность оп-
ределения координат эпицентра землетрясения существенно за-
висит от погрешности определения моментов прихода продольных
и поперечных сейсмических волн на сейсмостанцию [114]. Поэтому
здесь, как и ранее, целесообразно применение апостериорных
алгоритмов для уточнения момента разладки.
Второй тип задач — автоматический отбор участков записей,
содержащих полезную информацию, возникает в тех случаях,
когда наблюдательная станция удалена от центра обработки ин-
формации или длительное время работает в автономном режиме.
Если при этом основное время наблюдается фон, а полезные сиг
налы появляются сравнительно редко, то нецелесообразно
(а чаще просто невозможно) передавать информацию в центр обра
ботки. В этом случае применение последовательных алгоритмов
обнаружения разладки позволяет начинать передачу данных по
каналу связи лишь после обнаружения вступления сигнала и за-
канчивать передачу после окончания участка, содержащего по-
лезный сигнал. При таком подходе канал связи большую часть
времени не используется, что, помимо прочего, позволяет ис-
пользовать ненадежные каналы связи или каналы с низкой про-
пускной способностью.
То же самое относится к случаю, когда наблюдаемые сигналы
регистрируются на накопитель для последующей обработки.
Длительность автономной работы станции в таком режиме часто
определяется емкостью накопителей. Применение последователь-
ного обнаружения сигналов позволит экономно расходовать эту
емкость, регистрируя лишь участки, содержащие полезные
сигналы, и существенно увеличить длительность автономного
режима наблюдения.
Для этого типа задач, видимо, не так актуально точно опре-
делять момент вступления сигнала и момент прекращения его
наблюдения, поэтому можно ограничиться грубыми последова-
тельными оценками этих моментов. Основная специфика здесь
заключается в еще более ограниченной априорной информации
о статистических характеристиках фона и полезного сигнала.
В этих условиях представляет интерес построение адаптирующихся
к медленно меняющемуся фону алгоритмов обнаружения разладки,
которые будут квалифицировать как вступление полезного сиг-
нала любые значимые отклонения статистических характеристик
от их фонового уровня. Адаптация к изменяющимся условиям
достигается совместным использованием рекуррентных алго-
ритмов оценивания моделей временных рядов и последователь-
ных алгоритмов обнаружения разладки.
Таким образом, при автоматизации научных экспериментов
Достигается повышение надежности и точности по сравнению
о ручной обработкой оценивания момента изменения характери-
стик наблюдаемого явления, что диктуется современными тре-
бованиями к проведению таких наблюдений, осуществляется
автономное накопление или передача данных с автоматическим
11
выделением участков, содержащих полезную информацию на фоне
интенсивных помех, увеличивается достоверность получаемой
от измерительных цепей информации при случайном появлении
неисправности в их работе.
4. Основные требования, предъявляемые
к алгоритмам обнаружения разладки
Суммируем характерные требования практических задач, сво-
дящихся к обнаружению разладки временных рядов. Как видно
из двух предыдущих разделов, эти требования можно сформули-
ровать следующим образом.
Во-первых, обнаружение разладки должно происходить до-
статочно быстро при заданном уровне ложных тревог и обеспе-
чивать устойчивую работу алгоритмов при отклонении истин-
ных характеристик (или параметров, моделей) временных рядов
от расчетных. При этом желательно оптимизировать работу по-
следовательных алгоритмов на заданном множестве изменения
параметров моделей как до, так и после разладки.
Во-вторых, во многих практических задачах априорное рас-
пределение момента появления разладки неизвестно или принци-
пиально не может быть введено из-за того, что момент появления
разладки не является случайной величиной. Поэтому нужны
алгоритмы, «равномерно» эффективные на всем множестве момен-
тов появления разладки.
В-третьих, временные ряды, как правило, зависимы по време-
ни, а если они многомерны, то зависимость может существовать
и между компонентами. Алгоритмы обнаружения разладки долж-
ны естественным образом учитывать и использовать статистиче-
скую зависимость указанных типов.
В-четвертых, во многих случаях после обнаружения разладки
требуется оценить момент ее возникновения. Поэтому в рамках
последовательных алгоритмов должна вырабатываться хотя бы
грубая оценка момента появления разладки, что позволит уточ-
нять ее при необходимости апостериорным алгоритмом.
В-пятых, алгоритмы, обладающие вышеуказанными свойства-
ми, должны допускать реализацию на мини- и микро-ЭВМ, при-
чем предполагается, что одновременно будут обрабатываться де-
сятки сигналов. Это заставляет искать разумный компромисс ме-
жду эффективностью обнаружения разладки временных рядов и
простотой реализации алгоритмов на ЭВМ.
Глава 2
КЛАССИФИКАЦИЯ АЛГОРИТМОВ
ОБНАРУЖЕНИЯ РАЗЛАДКИ
1. Варианты формальной постановки задачи
После того как рассмотрен круг практических проблем, при-
водящих к разладке, перейдем к основным вариантам ее формаль-
ной постановки.
Пусть дана случайная последовательность (одно- или много-
мерная) Хх, . . ХЛ-, далее {Xf}, которая в момент £0 скачком
меняет свои свойства, однозначно определяемые вектором пара-
метров 0, dim {0} = г. Это значит, что до момента t0 — 1 включи-
тельно 0 = 01, а начиная с t0 вектор 0 = 02- Наблюдая {Х^},
необходимо обнаруживать момент разладки tv. При последователь-
ном обнаружении последовательность {Xf} накапливается непре-
рывно (7V —> оо), и решение о появлении разладки (т. е. обнаруже-
ние момента t0) необходимо выполнять в темпе с появлением оче-
редной ТОЧКИ Xjy.
Рассмотрим различные варианты критериев оптимизации по-
следовательных алгоритмов. Пусть предполагается, что момент
появления разладки Zo — целочисленная случайная величина.
В работах [68—74] момент t0 априори распределен по известному
закону рк = Р {t0 = к}, к = 1, N. В качестве рк рассматривают-
ся относительно простые законы распределения [74], например
геометрический: Р {/0 ~ k/t0 )> 0} = а (1 — я)*-1, 1. До-
полнительно предполагается, что с вероятностью Р {i0 — 0} = л
разладка может иметь место до начала наблюдения. В этих усло-
виях известны следующие основные варианты критериев для син-
теза и сравнения алгоритмов [70]:
1. Необходимо отыскать правило подачи сигнала о разладке,
минимизирующее среднее время т запаздывания в обнаружении
разладки:
т = М {x!ta > to), (2.1.1)
где т = ta — to + 1, ta — момент подачи сообщения о разладке,
df ( ) — здесь и далее математическое ожидание, при заданном
математическом ожидании М (У) числа ложных тревог, подавае-
мых до момента появления разладки.
2. Необходимо минимизировать т (2.1.1) при заданной вероят-
ности а ложной тревоги
a = P{ta<to}. (2.1.2)
Кроме вариационных постановок, в работе [74] предлагается
байесовская постановка, при этом требуется отыскать критерий,
13
минимизирующий величину риска:
Р (л, fa) = РЯ {ta <1 to} “Ь сМя (ta — to/ta to) Рп {ta to},
(2.1.3)
где с — весовой коэффициент (в предположении, что момент t0
распределен согласно геометрическому закону, упомянутому
выше).
Однако с точки зрения практики не всегда целесообразно пред-
полагать, что известно априорное распределение t0 и даже что t0 —
случайная величина. Проще считать, что t0 — неизвестный мо-
мент времени. В этом случае удобен другой критерий [131], кото-
рого будем в основном придерживаться в дальнейшем.
3. Необходимо получить алгоритм, минимизирующий верх-
нюю границу т* среднего запаздывания в обнаружении разладки
-t * = sup т (to) (2.1.4)
по всем возможным моментам возникновения разладки, при за-
данном среднем времени
Т ±= М (ta/ta < to) (2.1.5)
от начала наблюдения до подачи ложной тревоги при условии, что
наблюдается неразлаженная последовательность.
Упомянутая ранее экономическая постановка задачи о разлад-
ке основана на оптимизации алгоритма по довольно сложному
критерию, куда, помимо экономических показателей, входят со
своими весами т (2.1.1) и Т (2.1.5) [97, 98]. С теоретической точки
зрения очевидно, что экономическая постановка задачи не имеет
самостоятельного значения и поэтому конкретный вид критерия
будет обсуждаться позднее.
Перейдем теперь к рассмотрению критериев оптимизации апос-
териорных алгоритмов разладки. Предполагается, что последова-
тельность {Xf} накапливается заранее (до решения задачи) и
N < сю. В этом случае требуется как можно точнее определить
момент to- К оценке i0 момента t0 предъявляются требования, не
отличающиеся от требований к прочим оценкам статистических
характеристик, т. е. несмещенность и эффективность. В некото-
рых практических задачах может потребоваться минимизация ве-
роятности Рп выхода оценки io из допусков: Рп = Р {| t0 — to | >
п}, где п > 0. Исследовать свойства оценок tfl при конечных N
удается не всегда, но если предположить, что N-^-oo, хотя апо-
стериорные алгоритмы имеют смысл только при конечном N, то
часто удается исследовать асимптотические свойства или получить
асимптотические распределения оценки t0. После того как рас-
смотрены варианты критериев оптимизации, перейдем к класси-
фикации последовательных и апостериорных алгоритмов обна-
ружения разладки согласно практическим требованиям, сформу-
лированным в разд. 4 гл. 1.
В качестве признаков классификации выделим следующие ос-
новине вопросы, с которыми неизбежно придется столкнуться при
решении практических задач: применяется параметрический или
непараметрический подход (т. е. обнаруживается момент измене-
ния функции распределения наблюдений без параметрического
задания этой функции); используется или нет информация о рас-
пределении момента появления разладки; размерность вектора
параметров 0; используется или нет информация о векторе пара-
метров 0 до и (особенно) после разладки; зависима или независи-
ма наблюдаемая случайная последовательность.
На рис. 2 приведена общая схема классификации методов об-
наружения разладки.
2. Последовательные методы обнаружения разладки
(независимые случайные последовательности)
В данном разделе рассмотрим известные последовательные па-
раметрические методы обнаружения разладки в предположении,
что наблюдается последовательность независимых случайных ве-
личин. Этот класс задач послужил основой для развития методов
обнаружения разладки временных рядов, предполагающих се-
риальную зависимость наблюдений. Непараметрические методы
обнаружения разладки в настоящее время развиты гораздо менее,
чем параметрические. Они будут упомянуты в соответствующей
части обзора, так как развиты на аппарате, используемом в пара-
метрических методах.
Раздел состоит из двух основных частей. Первая часть содер-
жит обзор известных последовательных алгоритмов обнаружения
разладки, вторая — обзор результатов по исследованию свойств
этих алгоритмов и их настройке.
Обзор алгоритмов последовательного обнаружения разладки.
Как видно из рис. 3, классификация насчитывает 16 групп работ.
Алгоритмы групп 1—8 используют информацию о распределении
момента появления разладки, а групп 9—16 не используют таковой.
Методы, использующие априорное распределение момента to
(группа 1 классификации). Впервые задача о статистическом конт-
роле производственного процесса, который может находиться в од-
ном из двух состояний, налаженном или разлаженном, и имеет
известные вероятности перехода из одного состояния в другое,
рассматривалась М. Гиршиком и Г. Рубиным в работе [103]. Там
же было предложено правило обнаружения разладки, согласно
которому на каждом шаге t необходимо рассчитывать апостериор-
ную вероятность лг того, что производство находится в разла-
женном состоянии. Ими было предложено правило подачи сигнала
о разладке следующего вида [103]:
ta = inf {t : л4 > X}, (2.2.1)
где % — порог.
Всестороннее теоретическое исследование, синтез оптималь-
ных и сравнение их с субоптимальными алгоритмами (для случая
15
Рис. 2. Общая классификация методов обнаружения разладки
Рис. 3. Классификация последовательных параметрических методов
непрерывного времени) в рамках постановок 1) и 2) разд. 1, было
выполнено А. Н. Ширяевым в работах [68—74] и затем целым ря-
дом исследователей [79, 164].
Пусть дана одномерная последовательность независимых
случайных величин {^}. Все случайные величины xlt . . х^г
до момента t0 — 1 включительно имеют плотность распределения
вероятностей «ц (хг), а с момента t0 все xttl1 . . ., xt имеют плот-
ность распределения ®2 (xt). В работах [68—70,74] рассматривает-
ся вариационная и байесовская постановка 1) и 2) в разд. 1. Для
вариационной постановки доказана возможность построения та-
кого правила, чтобы запаздывание (2.1.1) было бы минимальным
в классе правил, удовлетворяющих (2.1.2). Для байесовского под-
хода (2.1.3) показано [74], что оптимальный алгоритм должен дей-
16
СТБовать так, чтобы подавать тревогу в момент ta, определяемый
до правилу (2.2.1). Предполагается, что л 0, т. е. по правилу
(2.2.1) сигнал о разладке может быть подан так, что при этом не
было сделано ни одного наблюдения.
Пусть момент распределен по геометрическому закону
Р {to — М ~ а (1 — а)*'-1. В процессе наблюдения последователь-
ности {а:*1} апостериорную вероятность л( удобно рассчитывать
по рекуррентным формулам, простой вывод которых содержится
с работе [66]. В данном случае удобно моделировать разладку мар-
ковской цепью с двумя состояниями: 0 — нет разладки и 1 — есть
разладка. Переходная матрица Р в этом случае имеет вид
_||Р(°/°) Р(°/1)|_|1— а 0 II
||р(1/0) р (1/1)| “I а 1||
а вероятности начальных состояний р (0) — 1 — л, р (1) — л.
Рассмотрим вместо монотонную функцию
2f = Л,/(1 — Л,).
Для нее рекуррентная формула имеет вид
2/ = (1/(1 — а)) (2г-1 + а) (w2 (жг)/®1 (жД)
или, обозначая In z( = gt,
gt = In (a + eg(-i) — In (1 — a) + In (co2 (zf)/®i (2.2.2)
Последний член в соотношении (2.2.2) представляет собой лога-
рифм отношения правдоподобия, он обеспечивает учет информа-
ции, поступающей от очередного наблюдения.
Пусть наблюдаемая последовательность распределена по нор-
мальному закону L {ж/} ~ N (0, о2), где среднее 0 — 0Х при
tt0 и 0 = 02 при £ Да £0, а дисперсия о2 известна, тогда
In (о)2 (Л^Р/СО! (хР) = ((02 - ОД/O2) [xt - (02 + 00/2],
g t= In (a + e«f-i) - In (1 - a) + ((02 - ОД/а2) [xt - (02 -J- 0,)/2J.
(2.2.3)
Правило остановки (2.2.1) в этом случае применяется к решаю-
щей функции gt с новым значением порога: ta = inf {t : gt > h}.
В более поздних работах [2, 28, 60] авторами рассматривались
различные обобщения рассмотренной задачи. Например, в [60,
66] предполагалось наличие многократных переходов из налажен-
ного состояния в разлаженное и обратно. В этом случае переход-
ная матрица
pj1-61 b I
|| а 1 — b || ’
где а и Ъ — заданные вероятности переходов. Или [28] предпола-
галось, что форма случайно появляющегося полезного сигнала
изменяется во времени.
17
Методы, не использующие априорное распределение момента t0.
Скалярный параметр 0 (группы 9, И классификации). В этом раз-
деле остановимся на трех алгоритмах, представляющих наиболь-
ший практический и теоретический интерес. Первый из них — ал-
горитм кумулятивных сумм (АКС) — был предложен Е. С. Пей-
джем в работе [141]. АКС представляет собой многократно
применяемыйпоследовательныйанализ А. Вальда [11, 101], а кон-
кретно — последовательный критерий отношения вероятностей
(ПКОВ) для двух простых гипотез Н\ (нет разладки): 9 = 0Г и II2
(есть разладка): 0 = 02, где 9 — скалярный параметр плотности
распределения вероятностей o>(xt/Q) наблюдения xt.
Идея Е. С. Пейджа состоит в анализе поведения кумулятив-
ной суммы
St — S(si + In (и (ж*/02)/<» (a?f/6i)), (2.2.4)
которая в ПКОВ сравнивается на каждом шаге с двумя порога-
ми: — е и h (е, h )> 0). Если на шаге t сумма St h, то прини-
мается гипотеза Н2, если St — е, то принимается Hlt а если
— е < St < h, то выполняется t Д- 1 наблюдение. Однако прямо
применить ПКОВ к задаче о разладке нельзя, так как в ней на-
рушено предположение о принадлежности всей выборки к гипо-
тезе Нг или Н2. Поэтому Е. С. Пейдж предложил возобновлять
ПКОВ на шаге t из нуля (т. е. Sk = 0 при к = 0, где к — номер
шага ПКОВ в текущем цикле, начавшемся в момент i), после
того как на шаге t — 1 принята гипотеза IIИ так до тех пор, пока
не появится разладка. После того как t t0 (гипотеза Н2 сме-
нила Нг), математическое ожидание логарифма отношения прав-
доподобия в (2.2.4) будет положительное и сумма 51 начнет ра-
сти. Графическая иллюстрация многократного применения ПКОВ
показана на рис. 4. Порог 8 в таком ПКОВ Е. С. Пейдж предложил
установить равным нулю (А. Н. Ширяев и позднее Г. Лорден ус-
тановили оптимальность такого выбора). Таким образом, в ну-
ле установлен отражающий экран для 5» и АКС имеет простую
рекуррентную запись
gt = (gt-i + Agi)+, Agt = In (® (xt/02)/® (rrt/9i)), (2.2.5)
где
(#)+ = max (0, x), g0 = 0. При этом правило подачи сиг-
нала о разладке, как и ранее, имеет вид (см. рис. 5)
ta = inf {t > 1 : gt > h}. (2.2.6)
Существует и другое, быть может, более наглядное толкова-
ние АКС [149]. Так как до разладки St (2.2.4) в среднем дрей-
фует вниз (см. рис. 6), а после разладки вверх, то предлагается на
каждом шаге t сравнивать разницу St — min Sk и, как только
она станет значимой, т. е. превысит порог h, подавать сигнал о
разладке. В этом случае АКС имеет эквивалентную (2.2.5) за-
пись
gt = St — min5A., ta = inf {t > 1: gt
Если наблюдается последовательность гауссовских случайных
величин, L {xt} ~ N (0, о2) и под разладкой понимается изменение
и от 0т до 09, то формула (2.2.5) выглядит особенно просто:
gt = fe-i + ((02 - ©)i/a2) ~ (02 + 6i)/2))+, (2.2.7)
или
gt = St- min Sk, Sk = ((02 - 90/O2) [ S - A (02 + 00/2] .
i=l
Следующий метод основан на многократном использовании
процедуры проверки гипотезы Нх : 0 = 0Т против Н2 : 0 = 02
согласно критерию Неймана — Пирсона [34] для вспомогатель-
ной выборки {^+лг-1} объемом А из последовательности } [72].
Для этой выборки вычисляется кумулятивная сумма 5~ (2.2.4)
и сравнивается с порогом h, если 5~ h, то выдается сигнал о раз-
ладке, а если S~ < h, то процесс наблюдения продолжается и об-
рабатывается следующая вспомогательная выборка. В гауссов-
ском случае сумма S~ имеет вид
Д+*-1
3 -И - А (02 + 0с)/2 | •
Рис. 4. Многократное примене-
ние ПКОВ
Рис. 5. Типичное поведение ре-
шающей функции gt
Рис..6. Типичное поведение куму-
лятивной суммы St
19
18
В таком виде правило Неймана—Пирсона представляет собой
один из самых старых и известных методов текущего контроля
производства — карты Шьюхарта [96]. Сигнал о разладке подает-
t+X-i
ся, если x-х — т^> ка- (02 04, где У к — конт-
l=t
рольный предел, т — номинальное среднее, о| — дисперсия
оценки
Третий метод обнаружения разладки основан ла экспоненци-
альном сглаживании. Он приспособлен для обнаружения измене-
ния среднего уровня наблюдаемого процесса [156—158]. Опреде-
лим решающую функцию таким образом:
gt = (1 — к) gt-i + к (xt — т), g0 = 0, (2.2.8)
где 0 < к < 1 — коэффициент сглаживания, т — номинальное
среднее. Сигнал о разладке подается (в случае увеличения средне-
го) согласно правилу, упоминавшемуся ранее: ta ~ inf {t L>1:
gt > h}. Иногда [158] вместо xt в (2.2.8) используется среднее
получаемое в результате наблюдения партии некоторой про-
дукции.
Кроме уже перечисленных методов, существуют и другие, яв-
ляющиеся либо их модификациями, как, например, метод сколь-
зящего окна или адаптивное экспоненциальное сглаживание [108],
где коэффициент к в (2.2.8) зависит от прошлых значений gt, осу-
ществляя, таким образом, приспособление к изменению статис-
тических свойств последовательности {ж|}, либо методы, не нашед-
шие широкого применения.
Существуют непараметрические методы последовательного об-
наружения разладки, не зависящие от распределения xt. Напри-
мер, в работе [132] предлагается преобразовывать функцию gt
(2.2.5) следующим образом:
St = (g't-i + A S (xt — ^£))+>
( 1, если
где Д £(?) = [ ,-n к —номинальное значение ме-
( —— 1, если х и,
пианы. Тогда gt — простое одномерное случайное блуждание с от-
ражающим и поглощающим экранами. Такой тест позволяет об-
наруживать изменения медианы случайной величины х^
Рассмотрим теперь вопрос учета информации о 02 (скалярный
случай), величина 0! предполагается известной. Три основных
метода, которые рассматривались до сих пор,— АКС, метод Ней-
мана—Пирсона и метод экспоненциального сглаживания, вооб-
ще говоря, требуют информацию о значении 02, но правильной на-
стройкой алгоритмов можно ослабить эти требования.
Пусть 02 обозначает фактическую величину 0 после разладки
и известно направление изменения 0, т. е. 02 А 0Х. АКС (2.2.7)
сохраняет способность обнаруживать разладку, если 02 А
А (02 + 0J/2. Поэтому если известно, что величина 0 после раз-
20
ладки увеличивается, то, переписывая (2.2.7) с точностью до об-
щего множителя (92 — 9i)/o2, получаем
gt = (g^ + xt - 9, - к)+, (03 > 9Д, (2.2.9)
II
gt = (gt-1 — xt + 91 + ky, (91 > 02),
где > 0 — «допуск» на величину отклонения от 9Х. Если задать
/г == 0, то любой сдвиг параметра в заданном направлении будет
обнаруживаться. Алгоритм (2.2.9) имеет простое графическое ре-
шение, которое широко использовалось при отсутствии ЭВМ [118,
119]. Строилась кумулятивная сумма (см. рис. 7) и на чертеж нак-
ладывалась У-образная маска, параметры которой d и ср есть функ-
ции к и h в (2.2.5) — (2.2.7). Точка А совмещалась в момент t
с очередным наблюдением S^. Если кумулятивная сумма где-ни-
будь переходила прямолинейные границы СВ и ДЕ, то подавался
сигнал о разладке.
Методы Неймана—Пирсона и экспоненциального сглаживания
также могут быть настроены на обнаружение любого отклонения
параметра 9 от номинала 9Х.
Во многих случаях нельзя заранее сказать, какой будет вели-
чина 92, больше или меньше 9Х, поэтому в этой ситуации целесооб-
разно использовать две «односторонние» процедуры одновременно
или «двустороннюю» процедуру.
Д. Надлер и Н. Роббинс [134] показали, что две процедуры
(2.2.9) с к = 0, применяемые одновременно, эквивалентны следую-
щему правилу обнаружения разладки:
ta = inf {f > 1 : 7?t > h}, (2.2.10)
m m
где Rt = max 2i — 9i) — min 3 ~ 91)-
i—1 т^Л i=l
Такой АКС позволяет не иметь априорную информацию относи-
тельно 92 — всякое отклонение от 9Х будет обнаруживаться, так
как к = 0.
Что касается методов Неймана—Пирсона (в практической ин-
терпретации карт Шьюхарта) и экспоненциального сглаживания,
то здесь также возможны «двусторонние» процедуры. Для этого
в (2.2.8) нужно сравнивать с порогом величину | g(| на каждом шаге:
ta = inf {i > 1 : |gt | > h}.
Подобным образом обстоит дело и с картами Шьюхарта.
Однако эффективность обнаружения разладки при отклонении
от известного (или предполагаемого) значения 92 падает. Поэтому
Г. Лорденом была предложена процедура «максимального прав-
доподобия» на основе процедуры Пейджа, которая равномерно
эффективна для некоторого множества значений 92. Идея метода
заключается в аналогии между АКС в виде (2.2.5) и правилом
21
S7 0/)
Puc. 7. Графическая интерпретация правила (2.2.5)
Рис. 8. Графическая интерпретация правила (2.2.11)
остановки, основанным на «одностороннем» ПКОВ [131]:
t
ta = inf {t > 1: max J (In ® (^i/02) — In co (^/01)) > h 1 ,
Zr<i j=/c J
где оз (z/0) = exp (QT (x) — b (0)) — плотность одномерного се-
мейства Купмена—Дармуа, 0 е= 0* — интервал действитель-
ной оси, Ъ (0) — функция, строго вогнутая вверх и дифферен-
цируемая по 0. Для принятого семейства можно без потери общ-
ности положить, что 0Х = О, Ъ (0) = 0, тогда логарифм отношения
правдоподобия перепишем в виде 025п — nb (02), где Sn —
= Т (х^ + .... + Т (хп). Полагая, что существует некоторый
допуск 0 > 0 вокруг 0! = 0, определим V02 : | 02 | 0 правила
«максимального правдоподобия» [131]:
t
ta = inf > 1 : sup ( J T (х() — (t — k -f- 1) b (02)j . (2.2.11)
|02|>e i=k
Таким образом, правило (2.2.11) означает как бы одновременно
используемые процедуры (2.2.5), (2.2.6) для всех 02: | 02 | 0-
Правило (2.2.11) можно представить в форме «17-маски», т. е.
на каждом шаге t рассчитывается кумулятивная сумма
t
Sjc— J Т (ж,) для 1 k t и сравнивается с двумя криволиней-
i--k
ними выпуклыми порогами q:
cz = inf {/i/02 + lb (02)/02)t
e2>e
cz = sup {/i/02 + lb (02)/02},
e2<-e
22
которые образуют «77-маску». Если 51 А1 сг или 51 Q для не-
которого I, то подаем сигнал о разладке. При этом переменная I
пробегает значения в «обратном времени» и связана с к таким об-
разом: I = 1, t — к + 1, в то время как к = t, t — 1, . . . Эта
ситуация иллюстрируется рис. 8.
Однако при всей очевидности графического решения уравне-
ния (2.2.11) этот метод весьма сложен для реализации на ЭВМ.
Здесь в отличие от всех методов, рассмотренных ранее (сравнить
с АКС (2.2.5), (2.2.6) и его графическим решением), не удается
получить простую рекуррентную запись. Нужно либо вычислять
значения сг и сг на каждом шаге t, что приводит к расходу машин-
ного времени, либо держать их значения в памяти ЭВМ. Помимо
этого, нужно вычислять и помнить значения Si на достаточную
«глубину» по к (максимальный номер к связан с величиной 0).
Векторный параметр 0 (группы 13, 15 классификации). Этот
раздел в литературе представлен весьма скупо. Остановимся здесь
на двух работах [100, 133]. Пусть 0 — r-мерный вектор, 0 — 0х
при £ < и 0 = 02 при t t0. Для независимой последователь-
ности r-мерных случайных векторов в [100] предлагается эвристи-
ческая процедура, являющаяся обобщением карт Шьюхарта.
На основании наблюдения Хх, . . ., XN берется вспомогательная
выборка {Xi(+iV~1} объемом /V, по которой вычисляются оценки век-
тора средних X и ковариационной матрицы R:
_ t-HV-i Ifiv-i _ _
S R = (.V — 1)_| 3 (Xi-X)(Xi-X)T,
i=t i=t
а затем вычисляется квадратичная форма [133]
T2t = Я (X — 01)TR-1 (X — 0i),
где Ат — транспонированная матрица А, А-1 — матрица, об-
ратная по отношению к А. Величина Tt имеет ^-распределение
Хоттелинга с г и N — г степенями свободы. Выбирая величину а:
р{Г2>Г2 } = а 0<а<1,
зададим порог г %_г и если 7? > Тла г то подадим сигнал
о разладке. Если ковариационная матрица R известна заранее,
то статистика T2t имеет ^-распределение с г степенями свободы.
При 0 = 0Х это центральное %2—распределение, а если 0 0х,
то нецентральное. Хотя относительно 02 не делается каких-либо
предположений, заданием Т\ г в пространстве параметров во-
кРуг 0Х образуется эллипсоид допусков. Если текущее значение
вектора 0 принадлежит его внутренности, то состояние считается
отлаженным.
На этом закончим обзор известных из литературы алгоритмов
последовательного обнаружения разладки для независимых слу-
23
чайных величин, но, прежде чем переходить к обзору результа-
тов исследования свойств алгоритмов, подведем некоторые итоги.
Обратимся к классификации последовательных методов (рис. 3).
Как следует из вышеизложенного, вопросы разработки алгорит-
мов достаточно полно решены для групп 1 и 9 классификации,
когда 0 — скалярный параметр и его значения до и после раз-
ладки известны заранее. Менее разработаны вопросы построения
алгоритмов, когда 02 — неизвестный скаляр (группа 11) и 02 —
известный или неизвестный вектор (группы 13 и 15). Практически
остались не затронутыми в литературе группы 3, 5, 7. Таким об-
разом, для независимой последовательности наблюдений остались
нерешенными или решены частично вопросы создания алгоритмов,
наиболее перспективных с точки зрения практического исполь-
зования.
Исследование алгоритмов последовательного обнаружения раз-
ладки. В последние годы большинство работ по последовател ьно-
му обнаружению разладки посвящено вопросам исследования
свойств ранее синтезированных алгоритмов. Интерес к этим воп-
росам объясняется тем, что они имеют решающее значение при
практическом использовании алгоритмов и составляют значитель-
ную трудность при решении. Для практика знание свойств алго-
ритма и правильная его настройка означают подчас несравненно
больше, чем факт оптимальности применяемого им алгоритма по
одному из критериев, предложенному в теоретических работах.
В соответствии с постановкой задачи (разд. 1) любая процеду-
ра последовательного обнаружения разладки характеризуется
средним запаздыванием обнаружения разладки "т, средним числом
М (N) ложных тревог, подаваемых до появления разладки, или
вероятностью а (2.1.2) ложной тревоги, а при байесовской поста-
новке — величиной среднего риска (2.1.3). Альтернативный под-
ход заключается в_расчете т (или Т* (2.1.4)) и среднего времени до
ложной тревоги Т. Если после ложной тревоги осуществляется
проверка и режим слежения продолжается, то Т будет обозна-
чать среднее время между ложными тревогами. По принятой клас-
сификации рассмотрим сначала получение величин т и Т для ме-
тодов, использующих априорное распределение момента t0.
В работах [68—70] для случая непрерывного времени и слу-
чайного процесса х (t), который удовлетворяет стохастическому
дифференциальному уравнению
dx = x(t-t0)dt + dl, (2.2.12)
где g (t) — винеровский процесс, £ (0) = 0, ML(A = 0, М (А£а) —
= o2Ai
и
[ Г,
Х^)==| о, г<0,
получены для непрерывного аналога алгоритма (2.2.1) — (2.2.3)
зависимости т ="f (Т) при заранее известном отношении сигнал/
24
Itr\м r3/2o2. Предполагалось, что момент t0 распределен согласно
закону
Р {i0<i} = 1 - е-м,
, ((> А. — известная константа. Для случая, когда к —> 0 и одно-
временно а —> 1 так, чтобы отношение (1 — а)/Л = Т фиксиро-
валось, в работе [73] получена зависимость т (Г) при больших Т:
= ~ [in (-£- Т) - 1 - С + О , С = 0,577 . . .
(2.2.13)
: >/'Н результаты можно использовать в случае дискретного време-
на [24] как аппроксимацию, однако точность этого не ясна. Подоб-
ный алгоритм исследовался в работах [157, 164] численным мето-
ном и статистическим моделированием для независимой гауссов-
ской последовательности в предположении, что t0 имеет геомет-
рическое распределение.
Перейдем к исследованию методов, не использующих априор-
ное распределение момента t0. Исследование алгоритма Нейма-
на—Пирсона (конкретно реализованного в виде карт Шьюхарта)
проводилось в работе [139], получены оценки ~т и Т в предположе-
нии независимой гауссовской последовательности с известной дис-
персией и постоянным (в течение накопления вспомогательной
выборки объемом N) средним ш, но меняющимся случайным об-
разом от выборки к выборке, т. е. момент t0 «дискретизирован»
с точностью до объема вспомогательной выборки. В этих пред-
положениях для «двусторонней» процедуры Шьюхарта получены
оценки т и Т:
т^М/[ф(Л ++ #Х)], (2.2.14)
Т Д\/2Ф (/с),
1 ' Г°° - ~
где ф (х) — = \ е 2 dx, к — расчетное значение контроль-
V 2п J
X
ного предела, к± — фактическое значение отклонения среднего
в долях о.
Для модификации карт Шьюхарта, которые содержат (кроме
контрольного предела) «линию предупреждения» I, т. е. сигнал
11 разладке подается, когда \ х^ — m ] )> lo- выполняется п
раз подряд, в работе [142, 145] проведено аналогичное исследо-
вание. В работе [72] в случае непрерывного времени и модели раз-
гадки (2.2.12) в предположении присутствия до разладки стацио-
нарного режима (к->- 0) исследован алгоритм Неймана—Пирсона.
Показано, что при 7->оо т (Г) ~ 3/2 In Т и при Т —>-0 f (Т) ~ 1/2 Т
Щя единичного отношения сигнал/шум г2/2о2 = 1. Этот резуль-
тат может использоваться в качестве приближенной оценки для
научая дискретного времени.
В работе [158] проведено исследование характеристик «дву-
с>сронней» процедуры экспоненциального сглаживания (2.2.8)
25
для независимой гауссовской последовательности с известной дис-
персией. Предложена численная процедура отыскания т и Т,
основанная на расчете среднего времени первого пересечения двух
разноотстоящих пределов процессом авторегрессии первого по-
рядка как функций параметров настройки: коэффициента сгла-
живания к, порога h и фактического среднего. Приведены таблицы
значений т и f.
Вопросам исследования алгоритма кумулятивных сумм посвя-
щено максимальное число работ, которое можно свести к четырем
группам: работы [69, 120,134, 155, 166], в которых рекуррентная
формула (2.2.5) аппроксимируется непрерывным броуновским
движением с отражением в нуле; решение интегральных уравнений
Фредгольма для получения т и Т [104, 122J_ 124, 126, 140, 146,
168]; получение приближенных оценок х и Т методами либо тео-
рии восстановления, либо последовательного анализа [129—131,
150, 161]; работы [76, 105, 120, 123, 134, 155, 156], исследующие
АКС методом статистического моделирования.
Чтобы не повторяться в дальнейшем, отметим сразу, что прак-
тически во всех работах рассматривается случай независимой,
одномерной, гауссовской последовательности, а под разладкой
понимается скачкообразное изменение среднего т.
Аппроксимация выражения (2.2.5) броуновским движением
g (t) с отражением в нуле позволила для односторонней процедуры
(2.2.9) получить зависимость среднего времени L от начала наб-
людения до первого выполнения g (i) = h [120, 155]:
[l/(m — к)] [Л 4- (o2/(2 (m — к))) x
X (exp (— 2 (m — k) h/o2) — 1], m — & #= 0,
h2/o2, m — k = 0.
(2.2.15)
L =
При этом до начала наблюдения g (0) - 0 и величина т по-
стоянна в течение всего времени наблюдения. Понятно, что связь
т и Т с L носит приближенный характер и точность этого при-
ближения исследовалась сравнением зависимости L (2.2.15) и
результатов статистического моделирования алгоритма (2.2.9).
При т — к 0 качество аппроксимации вполне удовлетвори-
тельное даже при малых h, но и при т — к < 0 аппроксимация
гораздо хуже.
Для «двусторонней» процедуры (2.2.10) и к = 0 получена за-
висимость среднего времени от начала наблюдения до попадания
R (t) на порог h. Обозначим ее L(±) [134]:
Л(±) =
(h/m) ch (тЛ/cr2) — o2/(2m2) —
— h2/(2o2 sh (дай/ст2)), m 0,
(2.2.16)
. h2/(2o2), m = 0.
Случай к 0 рассматривался в работе [155], но выражение для
не будем приводить здесь ввиду громоздкости. Отметим лишь,
что зависимость между L(±) (2.2.16) и L(+), А(-) (2.2.15) (индексы (-]-).
и (—) соответствуют одностороннимАлгоритмам (2.2.9)) довольна
26
проста, и аппроксимация броуновским движением здесь не имеет
значения:
1^11
L(±) LW + £(-) •
Если выполняется соотношение к^ + к^~~> | 7Д+> — между
параметрами (2.2,9), то
1 1,1
£(±) — £(+) Т" £(-) •
В некоторых задачах представляет интерес отыскание вероятно-
сти того, что непрерывная решающая функция gt (2.2.9) достиг-
нет границы h за заданное время. Такая вероятность оценена в ра-
боте [166]. В работе [71] для модели разладки (2.2.12) при г2/2ст2 =
-= 1 и в предположении наличия до разладки стационарного ре-
жима (X —> 0) получена зависимость т (Г) для АКС:
т (Т) = -^ {В (ев - В/2 - е-в) _ з/2 (ев _ 2 ж fc-B)},
где В определяется из уравнения Т = ев — В_ — 1-
Численный метод получения оценок т и Т решением интег-
ральных уравнений Фредгольма впервые был предложен
Е. С. Пейджем в [140], где были использованы результаты [126].
Далее метод рассматривался в работах [104, 122, 124, 146, 148],
где исследовались различные методы решения интегральных
уравнений, их точность, различные виды распределений xt, вы-
числительные аспекты и т. п. Довольно полный обзор численных
методов дан в работе [168]. Аналитическое решение этих уравне-
ний можно получить лишь в специальных случаях (для практики
малоинтересных), но и тогда аналитическим его можно назвать до-
вольно условно, так как объем вычислений в этом случае сравним
с численными методами.
Возможно несколько методов численного решения интеграль-
ных уравнений. Рассмотрим наиболее распространенный метод,
придерживаясь работы [104].
Для исследования свойств АКС часто удобно рассматривать
Функцию Lz (0), где Lz (0) — среднее время от начала наблюде-
ния до подачи сигнала о разладке при постоянном значении пара-
метра 0 и начальном значении gt в (2.2.5) g0 = z (0 z h).
Например, Т = Lo (0Д, а т (z) = Lz (02) (ясно, что быстрота об-
наружения разладки зависит от начального значения gt).
Е. С. Пейджем было получено соотношение [141]
Lo (0) = Мо (п/0)/(1 - Ро (0)), (2.2.17)
где Mz (ге/0) — средняя продолжительность ПКОВ, a Pz (0) —
вероятность окончания ПКОВ на пороге — 8 = 0 (см. рис. 4),
если ПКОВ стартует из точки z.
27
В свою очередь, Pz — Pz (0) и N (z) = Mz (zz/0) определяются
из интегральных уравнений [122]
—z h
p(z) = 5 f (у) dy + ^Р (y)f (у — z) dy, (2.2.18)
—OO о
h
N(z)==l+^N(y)f(y — z)dy, (2.2.19)
0
гДе f (y) — плотность распределения вероятностей для слагаемых
In со (ж4/02) — In и (Xf/Gi) кумулятивной суммы (2.2.5). Метод
решения (2.2.18) и (2.2.19), следуя [22], заключается в замене
Р (z) на Р (z). Для гауссовского случая, когда распределены сла-
гаемые кумулятивной суммы со средним 0 и дисперсией о2 = 1,
получим
т
р (Z) = ф (Z - 0) + 3 А (2л)-1 A exp (- 1/2 (z, - z - 0)2) Р (zk),
Jr=l
где Ак, zk — веса и корни гауссовских квадратур для интервала
(О, К). Величины Р (zk) получаются из решения системы
уравнений АР = В, где А = || ац ||, ati = 1 — AiKfa, zt), atj =
= -A;A(z;, zO,Pr = || P(z1),...,J'(zm)||, Вг = ||ф(—Z1_ 0),...
. . ., Ф (— zm — 0) ||, К (zfe, z;) = (2л)-1/2 exp {— 1/2 (zfr — z; — 0)2}.
Аналогично получаем N (z). В зависимости от потребностей точ-
ности выбираем число точек т. Исследование точности производи-
лось в работе [104] увеличением т от 6 до 96. Было найдено, что
степень сходимости и точность аппроксимации сильно зависят от
близости Р (0) к единице (для других методов это остается в силе
[168]), что определяется величинами hl а и 0/а. Например, если
0/о = 0 и hl о = 1, то Р (0) и N (0) при т = 6 воспроизводятся
с 10 значащими цифрами, а если hl о = 5 и 10, то при т = 15 точ-
ность оценки Р (0) и А (0) 6 и 9 знаков соответственно. Исполь-
зование широкого диапазона h/o и 0/о показало, что при т = 15,
L. (9) < Ю6 и 1 - Р(0)> 10-5 точность расчета Ао из (2.2.17)
имеет 6 значащих цифр.
Изящный метод приближенного решения уравнений (2.2.18)
и (2.2.19) был предложен К. Кемпом в работе [122], где вместо
уравнения (2.2.18) рассматривалось
со
P(z)^ $ P{y}j{y — z)dy. (2.2.20)
—OO
Предполагалось, что Р (у) 1, если у 0, и Р (у) 0, если
у h. Иными словами, использовалась аппроксимация А. Валь-
да (2.2.20), с помощью которой были получены основные формулы
последовательного анализа. Если о)0 —ненулевой корень уравне-
ния М (е'“»У) = 1, то решение (2.2.20) имеет вид
Р (z) А + Be“»z. (2.2.21)
Подстановкой z = 0 и z = h получим
А = /р (h) — Р (0) еаЛ) (1 — ешЛ)-1; В = (Р (0) — Р (ft)) X
X (1 — е®’'1)”1. (2.2.22)
Теперь, если известны Р (0)иР (/г), можно вычислить Р (z). И здесь
отличие от вальдовской аппроксимации предлагается подста-
тЬ' р (z) с учетом (2.2.20) в (2.2.18), проинтегрировать и полу-
чить два выражения для Р (0) и 1° (Д) подстановкой z = Ои z = h.
То есть К. Кемп предложил постулировать вид решения (2.2.21),
Но искать константы А и В не из (2.2.20), а из (2.2.18).
Сравнение результатов решения уравнений (2.2.18) и (2.2.19)
для нормального распределения слагаемых кумулятивных сумм
методом К. Кемпа, приближенным способом, предложенным
Е. (1 Пейджем [140], и гауссовскими квадратурами показало, что
точность последних гораздо выше, чем у приближенных решений.
В последующих работах [125] К. Кемпом были получены оценки
сверху и снизу для величин Р (0) и А (0) приближенным решением
уравнений (2.2.18) и (2.2.19).
Вместе с рядом достоинств рассмотренные методы имеют оче-
видные недостатки. Аппроксимация броуновским движением не-
точна, но дает простое аналитическое выражение, что важно для
оптимизации параметров. С другой стороны, численное решение
интегральных уравнений (2.2.18) — (2.2.19) дает весьма точные
оценки Lo (0), но очень громоздко для использования при оптими-
зации параметров. Поэтому в последнее время появились работы
но нахождению оценок величин т и Т, которые давали бы приемле-
мую точность и были бы достаточно просты.
Прежде всего к этой группе относятся работы [129 — 131].
Здесь для случая, когда xt распределено согласно однопараметри-
ческому семейству Купмана — Дармуа, получена асимптотичес-
кая оценка величины А* = sup т (£0): т* ~ hll (0) при h -> оо,
где I (0) = М (In со (ж*/02) — In со (^/©j)) — информационное чис-
ло Кульбака—Леблера. Для одного частного случая независимой
последовательности {ту}, когда xt распределено по экспоненциаль-
ному закону с плотностью
<о (хД) —
he~^x
0
(2.2.23)
Е работе [130] получены довольно точные оценки т* и Т. Новизна
11ОД\ода заключается в том, что в качестве_выражений А (0) и
р О') в (2.2.17) для получения оценок т* и Т использовались не
вальдовские аппроксимации [11], а учитывались ошибки пере-
скока, возникающие из-за пренебрежения величинами gt-i +
~ < 0 при выполнении «отражения» в (2.2.5) и gt — h 0
при выполнении неравенства (2.2.6). Используя специфические
свойства экспоненциального распределения (2.2.23), были полу-
чены оценки "г* и Т, а также грубые оценки этих величин ;для про-
28
29
цедуры (2.2.11), т. е. предположение, что значение 0! = At из
(2.2.23) до разладки, а после разладки 02 <= [Л|; А^].
Отысканию пригодных аппроксимаций для N (0) и Р (0) мето-
дами теории восстановления посвящены работы [161, 168]. Здесь
оценивается влияние пренебрежения величиной перескока и по-
казано, что для нормального закона распределения наблюдений
xt при h -> эо [168]:
Lo (M(Agt/0) > 0) ~ > (2-2.24)
где'Д^ — приращение кумулятивной суммы в (2.2.5). Сравнение
расчета Lo по (2.2.24) и численных результатов показало доволь-
но высокую точность оценки при конечных h. Отметим, однако,
что Lo (М (Agt/0) > 0) (в силу условия М (bgt/G) > 0) может
быть использована только для расчета т.
Последняя и самая многочисленная группа включает в себя
работы, посвященные статистическому моделированию процедур
(2.2.5) — (2.2.9) с целью получения оценок т и Т. Так как стати-
стическое моделирование требует меньше всего упрощений и до-
полнительных предположений, то этим методом исследовались
следующие вопросы: зависимость т от момента Zo появления разлад-
ки [165], изменение среднего не скачком, а плавно [168], и нахо-
дились т и Т для обычных условий, чаще всего для гауссовской
последовательности [76,105,120,123, 134]. Однако этот метод имеет
ряд существенных ограничений: сравнительно (с_ численны-
ми методами) низкая точность получения оценок 7 и Т при таких
же затратах машинного времени; ограничение на оцениваемые
величины 7 и Т сверху из-за того, что потребное машинное время
быстро растет с увеличением 7 и Т; трудность использования это-
го метода при оптимизации процедур обнаружения разладки.
Учет влияния мешающих параметров. В настоящей задаче под
мешающими параметрами следует понимать те компоненты векто-
ра 0, изменение которых не представляет интереса с точки зрения
обнаружения разладки, но которые оказывают влияние на работу
алгоритма. Эти компоненты могут быть априори неизвестны, изме-
няться во времени. Вредное влияние мешающих параметров на-
ходит свое выражение в увеличении частоты ложных тревог и
среднего времени запаздывания в обнаружении разладки.
В случае независимой одномерной гауссовской последователь-
ности и разладки по среднему в качестве мешающего параметра
может выступать дисперсия о2 [75], кроме этого, в работах [105,
120, 123] рассматривалось влияние автокорреляции на характе-
ристики АКС путем задания рядов наблюдений посредством двух
простейших моделей авторегрессии и скользящего среднего пер-
вых порядков, т. е. в качестве мешающих параметров выступают
ненулевые коэффициенты авторегрессии и скользящего среднего.
В работе [75] значение ^сг2 предполагалось априори неизвест-
ным, рассматривалась процедура (2.2.9) и ее двусторонняя версия.
Для оценки влияния ошибки по о2 использовалась аппроксимация
(2.2.9) броуновским движением с отражением в нуле. Было показа-
но, что на чувствительность характеристик процедуры к ошибке
но о2 влияет выбор к в соотношении (2.2.9), а также что двусторон-
няя процедура более чувствительна к ошибкам по о2. При увели-
чении о2 по отношению к расчетной 7 и Т уменьшаются (по срав-
нению с расчетом), а при уменьшении о2 7 и Т растут.
В работах [105, 123] методом статистических испытаний оцени-
вается зависимость среднего времени наблюдения Lo от величины
коэффициента авторегрессии Фх. Псевдослучайные гауссовские
последовательности авторегрессии генерировались на ЭВМ со-
гласно коэффициенту Фг. Моделировалась процедура (2.2.9),
в диапазоне | Фх | < 1 получено семейство зависимостей Lo от Фх.
Отмечена «робастность» (2.2.9) в определенном диапазоне измене-
ния коэффициента Фх. _
В работе [120] получена аппроксимация 7 и Т (вновь использо-
валось броуновское движение, вслед за работами [105, 123]) как
функций коэффициента авторегрессии Фх и коэффициента скользя-
щего среднего. Однако во многих случаях качество аппроксима-
ции очень низкое. Как показало моделирование [120], при 0,1
<Фх<0,7 (практически наиболее интересный случай) аппрок-
симация 7 даже не отражает истинного характера зависимости т
от Фх.
Настройка и сравнение алгоритмов. Вопрос настройки и срав-
нения алгоритмов по заданным критериям — один из важнейших
яри использовании в конкретной системе контроля или обнаруже-
ния. При известном априорном распределении момента t0 вопросы
настройки и оптимизации достаточно полно разобраны в [68—74,
164], так как оптимальный алгоритм (2.2.1) — (2.2.3) предполагает
полностью известными все статистические свойства последователь-
ности. Единственный параметр настройки это порог h для (2.2.3).
Перейдем к методам, не использующим априорное распределе-
ние t0. Карты Шьюхарта имеют три параметра настройки: номи-
нальное среднее до разладки т, расчетное значение А: контрольного
предела и объем вспомогательной выборки А. В работе [139] про-
ведена численная оптимизация карт по двум критериям: фиксиро-
валось Т, а А; и А выбирались так, чтобы минимизировать 7;
фиксировалось 7, и, выбирая А: и А, максимизировалось Т. Факти-
ческая величина скачка А'х в долях о изменялась в’диапазоне
0.2-1,8.
Три параметра настройки имеет также АКС в (2.2.5) (2.2.6):
номинальное среднее до разладки, величину допуска к, а также
величину порога h. Номограммы, позволяющие настраивать АКС,
приведены в работе [168]. По этим номограммам можно, задавшись
т или Т, а также статистическими свойствами последовательности
(° и после разладки, выбрать параметры настройки.
В отличие от алгоритма (2.2.1) — (2.2.3) АКС не является
1(|чно оптимальным в смысле критериев разд. 1, но в работе [131]
-^казана асимптотическая оптимальность (при h ->• оо) АКС
^2.9) в смысле критерия 3) разд. 1, дающего минимальную ве-
31
80
личину т* = sup Т (i0) при заданном Т. Асимптотическая опти-
/о>1
мальностьв такомже смысле доказана [131] для процедуры(2.2.И)
-«максимального правдоподобия», которая минимизирует величину
т* = х* (02) не просто для некоторого наперед заданного 02, а
для диапазона 0а : |02 | 0. Отметим этот важный результат. Да-
лее еще столкнемся с фактом «почти оптимальности» АКС, уста-
новленным для случая непрерывного времени в работах [68—74]
для модели разладки (2.2.12).
Как отмечалось ранее, возможна оптимизация алгоритмов об-
наружения разладки по экономическому критерию. Этому посвя-
щены работы [92, 93, 96 —98]. Впервые такой подход развивался
А. Дунканом [96, 97] для карт Шьюхарта в предположении, что
настройке доступны три параметра алгоритма: размер выборки А,
контрольный предел к и частота выборочных проверок. Эти пара-
метры выбирались таким образом, чтобы максимизировать общий
средний доход от технологического процесса. Под разладкой под-
разумевалось изменение среднего независимой случайной последо-
вательности с известной дисперсией. Момент t0 предполагался
распределенным по экспоненциальному закону. В более поздней
работе А. Дункан [98] рассмотрел подобную модель производства,
но ввел в нее возможность появления разладок нескольких типов,
различающихся величинами изменения среднего ш.
Экономическая настройка АКС рассматривалась вслед за
[96, 97] в работах [165, 92, 93]: здесь также считалось, что качество
процесса изменяется скачками, т. е. нет длиннопериодических
трендов, и только что восстановленное после разладки производ-
ство такое же, как новое. АКС настраивался так, чтобы минимизи-
ровать среднюю цену функционирования S — SjTx, где St —
общая цена потерь в течение одного цикла и восстановления из
состояния отказа, Т± — среднее время одного цикла, т. е. время
от начала функционирования до первого верного обнаружения
разладки и восстановления производства. Предполагалось, что
каждое значение наблюдаемой последовательности получено
осреднением по вспомогательной выборке. При "ом величины
.<$! и Тт определяются так:
Sx = Kr + (М (А) + 1) Ks - рМ (t0) + CM (h (m + s) ~ t0),
Ti = тг + ts (1 + M (N)) + hM (m + s),
где Kr — цена восстановления производства, Ks — цена про-
верки факта обнаружения разладки, хг — среднее время восста-
новления, ts — среднее время проверки факта обнаружения
разладки, ш — число выборок, полученных до разладки, А —
число ложных тревог в течение первых m выборок, s — запазды-
вание в обнаружении разладки (в выборках), h — выборочный
интервал, t0 — время до разладки, р — доход от исправленной
работы в час, С — потери от пропущенной разладки в час.
Кроме этого, к средней цене функционирования можно доба-
вить цену за применение собственно алгоритма контроля [92].
92
Следует отметить, что при наличии ЭВМ, которые используются
для других целей, этой составляющей можно пренебречь, так как
в машинной реализации АКС чрезвычайно прост.
Процедура настройки АКС в виде У-маски (см. рис. 7) произ-
водилась в два этапа. Устанавливались зависимости средней
цены S от т и Т АКС, а затем выбирались параметры У-маски —
расстояние d и угол <р. В более поздней работе [89] исследовалась
чувствительность отклонения истинных параметров модели от
расчетных.
Из всех вопросов, связанных с анализом алгоритмов обнаруже-
ния разладки, наименее исследованы вопросы сравнения различ-
ных алгоритмов между собой. Отметим сразу, что во всех работах
по сравнению рассматривается случай одномерной независимой
гауссовской последовательности с известной дисперсией о2 и под
разладкой понимается изменение среднего на величину ко.
В работе [157] статистическим моделированием и посредством
приближенных расчетов подвергнуто сравнению пять алгоритмов:
карты Шьюхарта, метод скользящего окна, экспоненциальное
сглаживание (2.2.8), АКС (2.2.9) и алгоритм типа (2.2.3), исполь-
зующий априорное распределение момента i0. Каждый из них
численной оптимизацией настраивался так, чтобы минимизиро-
валась величина У при заданных Т и к*. Затем проводилось модели-
рование обнаружения разладки в некотором диапазоне значений к
около/с*. Исследование показало, что в рассмотренном диапазо-
не Т при к 2 [157] АКС дает наименьшее запаздывание т из всех
алгоритмов, не использующих априорное распределение t0. При
а 2 АКС уступал другим алгоритмам. Незначительно уступал
он и алгоритму (2.2.3) при точном задании априорного распреде-
ления момента tQ для последнего.
В случае непрерывного времени сравнение аналогов трех дис-
кретных алгоритмов: АКС (2.2.9), схемы Неймана—Пирсона и
оптимального алгоритма (2.2.3) — проведено А. Н. Ширяевым
в работе [69]. Использовалась модель (2.2.12), и разладке предшест-
вовал стационарный режим, т. еА->0иа->-1 так, что Т = (1 —
— а)/к фиксировано. Показано, что в практически интересном
случае больших значений Т АКС дает хорошее приближение к оп-
тимальному алгоритму. Более того, при Т -> оо [69]:
т (У) = In Т — 1 — С 4- о (1) — оптимальный алгоритм, С = 0,577,
т(Г)=1пГ------g-4-o(l) -АКС,
А
<(Г) — 3/2 In Т — алгоритм Неймана—Пирсона.
Напротив, при Т -> О АКС уступает схеме Неймана—Пирсона.
Кроме перечисленных, существуют еще работы [102, 119,
149] методического характера, содержащие в основном качествен-
ные рассуждения о целесообразности применения той или иной
схемы обнаружения разладки, их преимуществах и недостатках.
Эти работы носят обзорный характер и не содержат оригинальных
2 И. в. Никифоров 33
аналитических или численных результатов по сравнению алго-
ритмов.
Подведем итоги обзора в части исследования алгоритмов обна-
ружения разладки независимых последовательностей. Из 16 групп
классификации последовательных параметрических методов
(см. рис. 3) сравнительно хорошо разработаны вопросы исследо-
вания алгоритмов в группах 1 и 9, т. е. в простейших случаях,
когда априорная информация задана наиболее полно. Хуже
разработаны вопросы исследования алгоритмов группы 11, когда
63 — неизвестный скаляр, но и в группах 1, 9, 11 большинство
результатов получено численными методами, что не позволяет
использовать их при оптимизации параметров алгоритмов и лишь
в специальных случаях гауссовского и экспоненциального распре-
делений получены аппроксимации величин т и Т. В остальных
группах классификации в случае независимых наблюдений (3, §,
7 и 13, 15) практически отсутствуют результаты по исследованию
алгоритмов. Если сравнить это с результатами синтеза алгоритмов,
то станет ясно, что процесс исследования отстает от разработки
новых алгоритмов и в тени остаются алгоритмы, наиболее перспек-
тивные с точки зрения практики.
3. Апостериорные методы обнаружения разладки
Рассмотрим основные методы апостериорного параметрическо-
го обнаружения разладки и сравним оценки, получаемые в рамках
схемы кумулятивных сумм, с оценкой максимального правдопо-
добия. Так как целью этого раздела является установление раз-
личий и связей между последовательными и апостериорными алго-
ритмами, то обзор последних ни в коем случае не претендует на
полноту.
Впервые задача апостериорного обнаружения разладки была
поставлена и решена Е. С. Пейджем [143, 144]. Предполагалось,
что — независимая одномерная случайная последователь-
ность. Плотность распределения ®(хг/0) наблюдений xt имела
при первых t = 1, t0 — 1 скалярный параметр 0 = 0х, а при
t = t0, N — параметр 0 = 02. Значения 0j и 02 предполагались
известными заранее, а все значения i0 = 1, N — равновероятными.
Идея Е. С. Пейджа заключалась в проверке N + 1 гипотез
Нг, Нг, . . ., состоящих в том, что t0 = 1, 2, . . ., N 4- 1.
Например, гипотеза Hi означает, что плотность распределения
Xi, . . ., xN — о» (гг/02), а гипотеза Hn+i — что хи х2, . . ., Xn
имеют плотность распределения <0 (x/0i). В этих условиях вероят-
ность ошибочной классификации будет минимальной, если гипо-
теза II t. принимается при выполнении условия
(2.3.1)
m—1 N
гт(х)= s Inw^i/Oj) + 3 1пы(х;/02), (2.3.2)
2—1 i==m
34
j де Im (x) ~~ функция правдоподобия, соответствующая гипотезе
# Так как значения 0! и 02 заранее известны, получение оценок
метод°м максимального правдоподобия эквивалентно использо-
ванию схемы кумулятивных сумм (см. разд. 2). Тогда оценка мо-
мента разладки получается согласно [144]:
/Око = inf {А:: S^Sj, j=2,N}t (2.3.3)
Sk = 3 [In co (хг/01) — In co (ж4/е2)].
i=l
Действие правила (2.3.1) — (2.3.3) иллюстрируется рис. 9. Смысл
ого прост. Если, двигаясь по оси t слева направо, откладывать
но оси 5 значения SK для последовательных моментов времени
/• = 1, N, то за оценку #0 принимается момент времени к, соответ-
ствующий максимальному знечению 8к кумулятивной суммы,
плюс единица.
Подобным образом в работах [143, 144] решался вопрос и
в случае, когда параметр 0 после разладки мог принимать одно из
двух известных значений 02 и 02 (02 01 0г).
Следующий важный шаг в развитии апостериорных методов
был сделан Д. В. Хинкли. В работах [109—ИЗ] он детально ис-
следовал оценки /Омп максимального правдоподобия при условии,
что 0Х и (или) 02 известны или неизвестны заранее. Был найден
общий способ получения распределения оценки #омп Для произволь-
ной плотности со (х/0) наблюдаемых независимых случайных ве-
личин хг, . . ., х^, а также получено асимптотическое (при t0 —>-
—>- оо и N — t0 -+ оо) распределения оценки <омп (2.3.1). Кроме
этого, Д. В. Хинкли рассмотрел вопросы построения тестов для
проверки различных гипотез относительно момента £0. Особенно
тщательно исследовался случай, когда L {xt} ~ N (0, о2) и о2
известна, при следующих предположениях относительно 0:
а) 0х и 02 известны, б) 0Х известен, а 02 неизвестен; в) 0Х и 02 неиз-
вестны.
В случае а) оценки максимального правдоподобия и кумулятив-
ных сумм совпадают. В случае б) оценка /Омп получается заменой
1! (2.3.2) неизвестной величины 02 оценкой максимального правдо-
подобия:
N
°2 “ 7V-«+ 1 У ।Xi = ’
i=f
тогда
^омп = arg max {(t — 1) (Л^ — t Ц-1) (г* — 0i)2}. (2.3.4)
4=2, Л’
В случае в) оценками в (2.3.2) заменяются и 0Х и 02:
Чп = arg max {(t - 1) (N -1 + 1) (Ж4 - г?)2}, (2.3.5)
4=2, N
35
2*
Рис. 9. Графическая иллюстрация
действия алгоритма (2.3.1)— (2.3.3)
t—1
где
г=1
Для случая б) (02 < 01)
было проведено сравнение
оценок максимального правдо-
подобия и кумулятивных сумм,
которые в этом случае получа-
ются из (2.3.3) заменой на
к
Sk=^l (Ж; —01 +6а),
г=1
где 6 ДО задает величину допуска по 0. Заметим, что в случае
а) 6 = А = 1/2а (0х — 02). Исследование показало, что оценка
Дмп асимптотически не смещена, в то время как 70кс асимпто-
тически смещена и, более того, менее эффективна, чем
Д. В. Хинкли исследовал асимптотическое распределение оценок
+кс и +мп в случаях а) — в), а также провел серию статистиче-
ских экспериментов на ЭВМ с целью оценки дисперсий и смещений
7окс и #омп в зависимости от Д и а. Чтобы как-то улучшить свой-
ства оценки /Окс в случае б), им была предложена остроумная
эвристическая процедура, заключающаяся в оценке величины
Д = (1/2о) (01 — 02) (ясно, что в случае б) Д заранее неизвестна)
в результате расчета схемы кумулятивных сумм по выборке.
А затем, используя (2.3.3), где 6 = Д, т. е.
К
$к = &к— S (ч — 01 + До),
г=1
в результате второго прогона по той же выборке Д. В. Хинкли
получил оценку ДКС(А), смещение которой (как показало моде-
лирование) несколько меньше, чем смещение /Окс-
В работах [88, 128, 162] рассматривался байесовский подход
к задаче апостериорного обнаружения разладки. Предполагалось
известным распределение момента t0 появления разладки и рас-
пределение среднего гауссовской случайной величины. А в работе
[107], кроме ранее перечисленных предположений, число изме-
нений среднего уровня может быть произвольным и даже априори
неизвестным.
Параметрические методы, зависимые последовательности. До
сих пор рассматривались независимые последовательности, но на
практике такое предположение часто неверно. Поэтому большой
интерес представляют работы по обнаружению разладки зависи-
мых последовательностей. В одной из первых таких работ Дж.
Боксом и Дж. Тяо [84] предполагалось, что случайная последо-
вательность задается нестационарной моделью проинтегриро-
ванного скользящего среднего. Критерий проверки факта изме-
36
нения среднего уровняв некоторой точке основывался на Рраспре-
делении Стьюдента.
Однако в общем случае, когда разладка заключается в измене-
нии не только среднего, но и коэффициентов корреляции после-
довательности, апостериорное обнаружение наталкивается на
серьезные вычислительные трудности. Связано это с тем, что
даже в гауссовском случае для получения оценки максимального
правдоподобия t0 необходимо на каждом шаге обращать ковари-
ационные матрицы, размерность которых определяется длиной
вЫборки, и вычислять их определители.
Для преодоления указанных трудностей оказалось целесооб-
разным применить параметрическое моделирование случайных
последовательностей. Наибольший прогресс в использовании мо-
делей авторегрессии — скользящего среднего (АРСС) для апосте-
риорного обнаружения разладки был достигнут в работах
Л. А. Тельксниса, Н. И. Клигене, А.-М. М. Монтвиласа и др.
[26, 27, 36—39, 57—59], которые представляют собой дальнейшее
развитие методов [143, 144], и в работе Р. Джонса с соавтора-
ми [121].
Поясним основные идеи апостериорного обнаружения разлад-
ки моделей АРСС на следующем примере. Пусть две части после-
довательности {ап-1} и {жц} порождаются стационарными моде-
лями авторегрессии АР (р) и {х[У} не зависит от {х}0-1}:
•Л = Фх 4- .. . + Ф^ад-р + (2.3.6)
где ф|г), . . ., Ф^Д — коэффициенты авторегрессии до (с = 1)
и после (i = 2) разладки, о)ц — дисперсия независимой последо-
вательности, 7W(et)=0, М(е?) = oh. Все дальнейшие результаты
можно обобщить на проинтегрированную модель авторегрес-
сии, описывающую нестационарные последовательности .
• • wN. Предполагается, что конечные разности d-ro порядка
такой последовательности {^-,1}:
Vu-f = wt — Wt-i, ^2Wt = ¥wt — , . . . ,
vdwt = = xt,
где V — оператор разности [8], подчиняются модели авторегрес-
сии АР (р) (2.3.6). Из соотношения (2.3.6) видно, что (р -]- 1)-
мерный вектор параметров Of = |] Ф^, . . ., Фр%8; ||. Если апри-
ори нельзя предпочесть какие-либо значения t0, то вновь прихо-
дим к методу максимального правдоподобия:
Чп = arS max <1п ® (4°-1/01) + In СО (х”/^)} =
io
io—1
= arg max Unco (arf/Ox)-|- 1псо(^/жЦ, Oi) + (2,3.7)
io i=p+l
N
+ In co (?t;+1’-1/02) + S In co (Xt/xtp, M •
t=io-|-p
37
Рассмотрим случай гауссовской модели (2.3.6), т. е. L {ej ~
~ N (0, 0g) и || #1, . . ., Ждг || — гауссовский вектор. Тогда, сле-
дуя работе [8], запишем для модели авторегрессии
In © (4/9) = - -f- In 2л<?е + -L in det Мрр) -
(2.3.8)
к р
In © (4+1/0, 4) = — In 2ло2е — ~ У1 (xi — У,
Е г=г+1 з=1
(2.3.9)
где Хр = || х±, . . хр ||, Jfp₽) = Г;Ч2, Гр — ковариационная мат-
рица (р х р) последовательности авторегрессии, МрР> — матрица
(р '< р) квадратичной формы нормального закона (2.3.8), и окон-
чательно получим
In © (4/0) = In © (4/0) + In® (4+i/0, 4) =----g- In 2ло| +
к p
+ A- In det M(p> - j_XpMpP'Xp +£(*<-£ Ф^г-з)2 ] .
e i=p+l ‘ 3=1
(2.3.10)
Из сопоставления (2.3.7) и (2.3.10) видно, что при известных 0j
и 02 вычисление 1омп сопряжено с обращением матрицы размером
не более чем (р х р) и вычислением ее определителя. Напомним,
что для стационарной гауссовской последовательности общего
вида на каждом шаге поиска максимума правдоподобия нужно
обращать матрицу и вычислять ее определитель при к = 1, /V.
Обычно р = 1 н- 10, а число точек в выборке может достигать
сотен и тысяч, поэтому очевидна эффективность такого подхода.
Более того, как видно из соотношения (2.3.10), начиная г, (р + 1)-й
точки, функция правдоподобия может рассчитываться рекуррент-
но, лишь первые р точек (см. (2.3.8)) выпадают из этой схемы.
Если N +> р, то первым членом в квадратных скобках (2.3.10),
а также величиной In det можно пренебречь. Это еще
более упрощает расчет 70 в (2.3.7). Как и ранее, если 0t и (или)
02 неизвестны, то в (2.3.7) используются оценки 0t и 02. Оценка
0г рассчитывается в (2.3.7) по первым 4°-1 значениям выборки,
а 02 — по остальным 4, в то время как t0 пробегает значение от
р + 3 до N — р — 1.
Нетрудно распространить все указанные результаты на случай
двух и более моментов разладки [37]. Пусть последовательность
{4} разделена на три части {4"1}, где 2 <4 +
+ tz + N. Оценка моментов К и t2 по методу максимального прав-
38
доподобия получается подобно (2.3.7)
{t 1мп’ 4rJ = агё max <ln ® (^i-1/0!) + ln “ (ж«Г1/©а) +
+ 1п®(4/0з)} (2.3.11)
с той разницей, что перебор необходимо произвести по (№ +
+ 7V)/2 точкам. Метод (2.3.11) иллюстрируется рис. 10. Перебирая
значения = 2, 3, 4, . . ., отыскиваем каждый раз условный мак-
симум функции правдоподобия I t2) по t2 : tr <; t2 N, а за-
тем по их множеству безусловный максимум и оценки и i2.
В рамках указанного подхода можно рассмотреть и несколько
иную модель разладки авторегрессии. Если снять предположение
о независимости {а;^} от {xi-1}, третий и четвертый члены в (2.3.7)
необходимо заменить на условное правдоподобие In «> (х^/02,
^i-1), где р точек {Ч-р} будут играть роль начальных условий.
Содержательное различие между двумя моделями разладки за-
ключается в том, что новая модель (в отличие от старой) обеспе-
чивает условие «сшивания» двух частей последовательности
(см. рис. И, а). Первую модель разладки можно рассматри-
вать как обнаружение момента переключения с наблюдения гене-
ратора авторегрессионной последовательности (2.3.6) с парамет-
рами на наблюдение генератора с параметрами 02. Вторая
модель разладки соответствует не переключению наблюдения,
а изменению скачком коэффициентов генератора (2.3.6) с сохране-
нием «хвоста» памяти {x$°Zp}- Для новой модели разладки можно
переписать (2.3.7) в следующем виде (0j и 02 известны):
( <о (а:!0-1/^!) 4 ,
Чп = агё max ln о + 1п ® Ч /02) +
и I «о {х1‘ 7вг)
N 4 ] [ <1> (^’^/Oj) 1
+ In Ю (ж/о 02) = arg max In t -г .
) t, I co (x’ 70.,) )
Из сравнения c (2.3.3) видно, что это специальный вид схемы куму-
лятивных сумм. Таким образом, вновь существует факт соответ-
ствия /омп = Че ПРИ известных 0! и 02.
В работах [57, 58] метод обнаружения разладки обобщен на
«-мерную модель авторегрессии, рассмотрен вопрос учета апри-
орного распределения / (£0) (в этом случае максимизация правдо-
подобия заменяется максимизацией апостериорной плотности ве-
роятности и в сумму (2.3.7) добавляется член In / В работах
[26, 27, 36] исследуется вопрос точности оценки момента t0, по-
лучаемой по схеме (2.3.6).
Кратко обсудим вышеуказанные методы получения оценок
t омп и их трудности. Хотя не получено явного вида распределения
оценки ^омп Для моделей авторегрессии (как следует из работ [26,
27], это связано с принципиальными трудностями), приближенные
89
Рис. 10. Вид решающей функции при обнаружении двух моментов разладки
Рис. 11. Две модели разладки последовательности авторегрессии
результаты и моделирование показывают, что оценки 10ма суще-
ственно эффективнее оценок, получаемых в схеме кумулятивных
сумм (разумеется, если 0Х и (или) 02 известны неточно). Это преиму-
щество, однако, приводит к значительному росту объема вы-
числений.
Проанализируем получение ^оМ11 с вычислительной точки зре-
ния. Вначале остановимся на модели «чистой» авторегрессии.
На каждом шаге при отыскании максимума в соотношении (2.3.7)
необходимо получение оценок двух векторов 01 и 02, а затем вы-
числение двух функций правдоподобия (2.3.10). Существенно
сократить объем вычислений поможет использование факта на-
личия достаточных статистик у модели авторегрессии. Тогда на
каждом шаге необходимо накапливать вектор достаточных стати-
стик (для модели (2.3.6) его размерность ((р + I)2 + (р + 1))/2),
который будет использоваться для расчета оценок 02 и функций
правдоподобия. Отыскание 0 по достаточным статистикам сво-
дится обычно [8] к применению метода вторых моментов. Здесь
целесообразно использовать эффективные методы обращения сим-
метрической теплицевой матрицы при решении уравнений Юла—
Уокера, например быструю декомпозицию Холецкого [106, 138],
или производить оценку 0, рекуррентным методом наименьших
квадратов [35, 106]. Однако оценки МНК не гарантируют полу-
чение устойчивого полинома авторегрессии и поэтому менее пред-
почтительны. При обнаружении разладки многомерных моделей
авторегрессии вычислительных трудностей гораздо больше, так
как вместо скалярных коэффициентов модели (2.3.6) появляются
матрицы коэффициентов, подлежащие оценке. В связи с этим для
многомерной модели авторегрессии целесообразно применять
быструю процедуру рекуррентного (по порядкам модели) оцени-
40
вания коэффициентов модели /с-го порядка на основе коэффициен-
тов модели /с-1-го порядка [121, 170]. Если же последовательность
{а?Г} содержит два момента разладки, то отыскание оценок Смп и
^2мп сопряжено с увеличением объема вычислений примерно
в ~ N/2 раз по сравнению с «одномерной» оценкой.
Перейдем к моделям авторегрессии — скользящего среднего.
Хорошо известно, что применение смешанных моделей дает воз-
можность экономно моделировать временные ряды. Однако труд-
ности оценки 0 для смешанных моделей авторегрессии — скользя-
щего среднего значительно превосходят все перечисленное ранее.
Дело в том, что, во-первых, модель АРСС не допускает сжатия
данных путем применения достаточных статистик, поэтому для
расчета функций правдоподобия на каждом шаге нужна вся вы-
борка. Во-вторых, оценка коэффициентов моделей АРСС стати-
стически и вычислительно существенно сложнее, чем оценка коэф-
фициентов модели авторегрессии. Например, если метод вторых
моментов для модели авторегрессии (т. е. уравнения Юла—Уоке-
ра) дает весьма эффективные оценки, то даже для простейшей мо-
дели скользящего среднего первого порядка он не эффективен
(см. пример 50.1 в работе [25]). Это заставляет применять для
оценки коэффициентов модели АРСС метод максимального правдо-
подобия на каждом шаге поиска максимума, что в свою очередь
сопряжено с неоднозначностью оценок [8] и требует итеративной
процедуры нелинейной минимизации при расчете коэффициентов
[8] на каждом шаге.
Итак, подведем итоги этого раздела. Из вышесказанного можно
сделать следующие выводы:
апостериорное оценивание момента разладки методом макси-
мального правдоподобия статистически эффективнее, чем методом
кумулятивных сумм;
для апостериорного оценивания момента разладки временного
ряда целесообразно использовать модели «чистой» авторегрессии,
даже если успешное описание выборочных данных достигается
применением моделей более высокого порядка, чем суммарный
порядок АР и CG частей смешанной модели авторегрессии—сколь-
зящего среднего;
объем вычислений при оценке 10 методом максимального прав-
доподобия быстро растет с увеличением длины выборки, особенно
для моделей АРСС и нескольких моментов разладки, существенно
превосходя вычислительные затраты, необходимые для реализа-
ции АКС;
процедура апостериорной оценки момента разладки будет тем
эффективнее, чем точнее определить диапазон возможных значе-
ний момента разладки, это особенно важно для случая наличия
нескольких разладок на одной выборке.
Таким образом, становится ясна взаимосвязь апостериорных
и последовательных методов обнаружения разладки. Если нужно
не только обнаружить, но и точно оценить момент разладки, то
41
последовательный алгоритм должен дать сигнал о разладке и пер-
вичную оценку момента разладки, а апостериорный алгоритм
Г +лг
должен ее уточнить после обработки участка реализации {ж”кс_^},
^Окс 1
где ширина «окна» 2N -}- 1 выбирается так, чтобы с заданной ве-
роятностью обеспечить попадание момента tn в «окно» — N;
V L и KA
Чс + М-
4. Актуальные вопросы синтеза и анализа
алгоритмов обнаружения разладки
После того как закончен обзор результатов синтеза и анализа
последовательных алгоритмов обнаружения разладки для незави-
симых случайных величин и кратко рассмотрены результаты по
апостериорному обнаружению разладки, сопоставим практические
требования, предъявляемые к алгоритмам обнаружения разладки
(см. разд. 4 гл. 1), и полученные результаты.
Первое требование — близость к оптимуму характеристик
алгоритма в заданном диапазоне значений параметров, изменение
которых необходимо обнаруживать, и устойчивость работы алго-
ритма при отклонении статистических свойств наблюдаемых сиг-
налов (устойчивость к влиянию мешаюших параметров) — выпол-
няются для АКС (2.2.5), (2.2.6) и его более поздней «равномерно
мощной» версии (2.2.11) для семейства распределений Купмена—
Дармуа со скалярным параметром.
Второе требование — независимость алгоритма от априорно-
го распределения момента разладки и «равномерная» эффектив-
ность обнаружения разладки по времени ее возникновения.
И этому требованию АКС практически удовлетворяет. Действи-
тельно, зависимость запаздывания т" = т (t0) от момента Zn, полу-
ченная аналитическими, численными исследованиями и статисти-
ческим моделированием, имеет пологий характер и быстро при-
ближается к горизонтальной асимптоте при £0 оо.
Четвертое требование — возможность получения в рамках
последовательного алгоритма начальной оценки момента разладки
t0, которая затем может быть улучшена апостериорным алгорит-
мом. Как видно из разд. 2 и 3, этому требованию успешно удовлет-
воряет АКС, причем без всякого усложнения. Из сопоставления
формул (2.2.5), (2.2.6) и (2.3.3) ясно, что для получения i0 на каж-
дом шаге достаточно запоминать максимальный номер шага, на
котором решающая функция обнулялась последний раз.
Пятое требование — простота реализации на ЭВМ. Как видно
из сравнения различных алгоритмов (см. разд. 2), АКС (2.2.5),
(2.2.6) — один из самых простых. К сожалению, значительно
сложнее реализовать на ЭВМ «равномерно мощный» АКС (2.2.11).
Поэтому здесь возможны два подхода. Первый подход заключается
в оптимизации АКС на наиболее трудно обнаруживаемые раз-
ладки, когда норма || 02 — II ->0. Эта ситуация обычно назы-
42
лается случаем близких гипотез. Второй подход состоит в исполь-
зовании одновременно нескольких алгоритмов (2.2.5), настроен-
ных на разные значения 02, что как бы «аппроксимирует» алго-
ритм (2.2.11).
Таким образом, становится ясно, что наиболее предпочтитель-
ным в практическом отношении методом обнаружения разладки
является последовательный анализ А. Вальда в виде АКС. Вме-
сте с тем видно, что основное внимание исследователей концентри-
ровалось на случае скалярного параметра 9. Перейдем теперь
к задаче обнаружения разладки зависимых многомерных последо-
вательностей. Для успешного применения АКС в этом случае его
необходимо модифицировать так, чтобы естественным образом учи-
тывать свойства зависимых последовательностей для разных уров-
ней априорной информации относительно векторного параметра
0. Кроме этого, необходимо исследовать свойства модифицирован-
ного АКС, проанализировать влияние мешающих параметров,
разработать методы настройки и методику практического исполь-
зования АКС. Дальнейшие главы будут посвящены решению этих
вопросов.
Глава 3
МОДИФИКАЦИЯ АЛГОРИТМА
КУМУЛЯТИВНЫХ СУММ
(ЗАВИСИМЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ)
1. Модели разладки и способы задания
информации о векторе параметров
Сформулируем модели разладки зависимой случайной последо-
вательности наблюдений {Х^}.
Первая модель. Пусть до неизвестного момента времени t0 — 1
включительно совместная плотность распределения со (Х^о-1/0)
зависит от вектора параметров 0 : 0 Е= ©х, где 0! — область па-
раметрического пространства (далее будем обозначать этот факт
гипотезой Но : О GE ©х), а начиная с момента tg условная совмест-
ная плотность распределения со (X^/Xj0-1, 0) зависит от параметра
0 E0j (Hi : 0 G 02), dim 0 = г.
Вторая модель. До момента разладки i0 — 1 эта модель опре-
деляется так же, как и первая, а начиная с момента tg -цослелова,-
тельность {Х^} не зависит от {Хх-1}, и тогда {Х^} имеет совмест-
ную плотность распределения со (Х^/0), где 0 02.
С точки зрения практических требований и удобства синтеза
АКС оказалось, что целесообразно выбрать следующие способы
задания априорной информации о векторе 0:
1. Значения вектора 0 до и после разладки известны точно,
т. е. Но : 0 = 0! и Hi : 0 = 02. В этом случае момент разладки
трактуется как момент перехода гипотезы Но в Нх.
2. Предполагается, что все множество значений вектора 0
описывается уравнением 0 = 0О + Хс, где с — единичный вектор
направления в параметрическом пространстве, || с || = 1, dim с =
= г. При этом до разладки Нй : % 0 и после Ht : X 0. В этом
случае обнаружению подлежит факт перехода вектора 0 через
«границу» 0О в направлении с.
3. Предполагается, что значение вектора до разладки извест-
но: 0 = ©!, а после разладки вектор 0 выходит за пределы эллип-
соида, образуемого информационной матрицей Фишера в пара-
метрическом пространстве. Итак, Но : 0 = ©В Ях : (0 — 0х)т X
XF (00(0-01) >Х?, где F (0) — информационная матрица Фи-
шера, X? — граничное значение параметра нецентральное™.
Может оказаться полезной и несколько иная модель. В этом
случае
Яо: (6 -00^(00(0- Ох) <Х02,
Ях: (0-00^(00(0-00 >Х?,
где X® и X® — граничные значения параметра нецентральное™
44
Рис. 12. Способы задания апри-
орной информации о векторе па-
раметров
Все три способа задания априорной информации о векторе ил-
люстрируется рис. 12. Первый способ (см. рис. 12, а) — это про-
сто переход параметра 0 из точки 0Х в точку 02. Второй способ
(см. рис. 12, б) допускает незнание точных значений 0 до и после
разладки, но нужно знать доминирующее направление с, в котором
происходит перемещение конца вектора 0 при разладке и гранич-
ное значение 0о. Третий способ требует менее всего информации
о векторе 0 после разладки. Нужно лишь назначить значение па-
раметра нецентральности %х или два значения и X?, которые
определяют эллипсоиды. В последнем случае будет существовать
«зона нечувствительности» — пространство между двумя эллип-
соидами (см. рис. 12, в).
В соответствии с разд. 4 гл. 2 проведем модификации АКС
в последующих разделах согласно вышеуказанным способам зада-
ния априорной информации о векторе 0.
2. Применение АКС
при полной информации о векторе о
Будем называть этот случай первым вариантом АКС (щ соот-
ветствии со способами задания априорной информации о векторе 0).
Рассмотрим первую модель разладки. Свойства {Хх-1} до раз-
ладки задаются плотностью и (Хх-1/0х), а после разладки свой-
ства {Х(У} — условной плотностью со (Х^/Х}0-1, 02). В этом случае
45
логарифм отношения правдоподобия для последовательности
{X/V} имеет вид
(3.2.1)
co (Xf/Х‘-\ 0t)
Заметим, что Sj (017 02) в (3.2.1) может быть записана в виде куму-
лятивной суммы
5Г(01’ °2) = 1П| «их^/х*-
(О /Aj
<0 (Х^/Х*-1, о2) ] Г (QtXjy/xf-1, е2) 1
“I <0 (Xjy/Xf-1, 0х) J ’
или 5Г(0Х, 0^=5^ (Or, 02) + ^(9i, 02), где S#(0b 02) =
- In и (Xjv/X) \ 02) — In со (X.y/Xf х, 01), которая представляет
собой обобщение (2.2.4) на случай зависимых наблюдений, и Sy
можно рассматривать как 'приращение кумулятивной суммы.
ПКОВ для зависимых наблюдений базируется на вычислении
логарифма отношения правдоподобия и сравнения его с порога-
ми —е и h [10, 11, 101]. Так как первая модель разладки предпо-
лагает зависимость последовательности после разладки от после-
довательности до момента t0 — 1 включительно, то для реализа-
ции ПКОВ с нулевым нижним порогом и многократным возоб-
новлением из нуля используем следующую решающую функцию:
gt= (*^t-n(+i (01, 92))+, nt — nt-il (gt-i) + 1, S°i = go = O,
(x)+ = max (0, x), I (x 0) = 1, I (x 0) =0. (3.2.2)
Здесь nt играет роль счетчика количества наблюдений после послед-
него обнуления решающей функции gt, т. е. это длина очередного
цикла ПКОВ (см. рис. 4). Если сравнить (3.2.2) с (2.2.5), легко
установить соответствие между ними, заключающееся в том, что
величина St (Oi, 02) = в среднем убывает ci ростом t,
если t t0. Поэтому до разладки nt бывает больше единицы толь-
ко за счет случайных флюктуаций. После разладки (£^>£0) величина
S{ (91, 02) начнет систематически расти и сразу же будет увели-
чиваться длина цикла ПКОВ. При этом, если сравнивать с кумуля-
тивной суммой St в (2.2.7), момент t — nt будет зафиксирован
в точке, где последний раз выполнялось условие gt = 0.
Для второй модели разладки при начале очередного цикла
ПКОВ нужно полностью «забывать» всю предыдущую последова-
тельность, так как по условию последовательность после разлад-
ки не зависит от последовательности до разладки. В этом случае
ПКОВ базируется на логарифме безусловного отношения правдо-
подобия
о» , “(W , , “(Хи1/Хг,02) ,
St (01, е2) = 1п--(х</81) +1D
со (X^xf-1, 02)
... + in----------1
со (Xjy/Xf-1, 0i)
^(Xt+1/Xt, 0i)
46
если он начинается в момент времени 1. Решающая функция для
такой модели разладки рассчитывается согласно (3.2.1), но при
ЭТОМ
SU(+1 (01,
02) = In
Ш(хЦ+1/о2)
®(Х‘_П(+1Я)
Особый интерес представляет случай р-связной марковской
последовательности. Тогда для первой модели разладки решаю-
щая функция gt выглядит особенно просто:
I
, , ©(х./хгС ел
gt = (gt-1 + Si (0ъ 02))+, si (0ъ 0а) = In • (3.2.3)
<о (Xf/Xt_p, Oi)
I) отличие от (3.2.2) здесь удобно вычислять логарифм условного
отношения правдоподобия Si (0Ъ 02) и рассчитывать решающую
функцию рекуррентно. Правда, для первых р точек последова-
тельности вычисление Si (0Ь 02) усложняется, но так как АКС
предполагается использовать непрерывно, то не представляет
труда перед началом режима слежения набрать р штук наблюде-
ний и после этого начать расчет по формуле (3.2.3). Для второй
модели разладки и р-связной марковской последовательности
упрощение достигается при расчете St-npi (0i, О?) в (3.2.3) в том
случае, если nt р + 1, тогда
с* In Ш(Х*-Р+1/02)
О/-п,+1 («1, «2) = 1П ---—-f-----—
1 «> (x;_p+1j0i)
у In <Q(\/xHp, fl,)
соСВД^в!) •
Второй член в последнем выражении «регулярная» часть +1»
которая удобна для вычислений в реальном масштабе времени.
Сравнивая две модели разладки, отметим, что в вычислительном
отношении вторая модель сложнее, так как при каждом новом
цикле ПКОВ необходимо вычислять «нерегулярный» член StLnt+v
а для первой модели он вычисляется однажды или не вычисляется
вообще (при наличии начальных условий).
В заключение отметим, что правило подачи сигнала о разладке
« охраняется прежнее (2.2.6), т. е.
ta = inf {t : gt > h}, (3.2.4)
где h — порог.
Как отмечено в гл. 1 и 2, для успешного решения многих прак-
шческих задач алгоритм последовательного обнаружения раз-
ладки должен вырабатывать первичную оценку i0 момента раз-
ладки. В рассмотренных вычислительных схемах это просто
сделать с помощью счетчика щ из (3.2.2). Согласно методу
В. С. Пейджа (см., например, формулу (2.3.3) из разд. 3 гл. 2),
сценка /Окс в момент ta подачи сообщения о разладке вырабаты-
47
вается следующим образом:
^c~ta-nta + l. (3.2.5)
Смысл этой формулы становится совершенно ясен, если вспомнить
что очередной цикл ПКОВ, который привел к подаче сигнала
о разладке, начался в момент ta - соответствующий самой
нижнеи точке на кривой кумулятивной суммы (см. рис 6) или
верхней точке на кривой (см. рис. 9). Р '
3. Применение АКС при неполной информации
о векторе 0 (II вариант АКС)
Второй и третий варианты АКС основаны на идее Ле Кама
асимптотического разложения функции 5? (0, 0 _|_ Хс/1ДУ) в ок
рестности некоторой точки 0о. Условия существования такого
Разложения и его свойства рассматривались Дж. Русасом, Р Б?
Девисом, К. О. Джапаридзе и др. в работах [18, 52, 94] Отметим
важнейшие для практики случаи существования такого разло-
жения. Во-первых, это разложение существует для р-связной
марковской последовательности [31], а если предположить гаус-
совость наблюдаемых сигналов {Xf}, то и для класса стационар-
ных случайных последовательностей [94]. Последнее дает возмож-
гауссов-
52, 94]
ность использовать разложение Sf (0, 0 Хс/1/7V) для
ской модели авторегрессии—скользящего среднего.
Запишем в этих предположениях разложение [18,
(0, 6 + Хс/уЙ) = (Х/УА) д^ (0, xf) с -
-(^/2А)с^(0)с + и7У (Xf),
где
параметру I .
—-----,,, с — r-мерный вектор направ-
(3.3.1)
г мерный вектор эффективных вкладов, обычно это
вектор производных логарифмической функции правдоподобия по
О • Д*г_ а1п“(*Г/0)"
1 ~ ^е. ||’ -
ления, || с || =1, Fa- (0) — полоиУительно определенная симметри-
ческая матрица (г х г), обычно это информационная матрица Фи-
шера на N наблюдений, (Xf) — остаточный член, а,у -> 0 по
вероятности при N <х> и А = const.
Особый интерес, как и ранее, представляет случай р-связной
марковской последовательности {Х£р}. Следуя [31], запишем
разложение для 8^:
5"(e'e+^=^EfT^e)»-
i=l
А2
-^-cJ’F1(6)c + aw(Xf_p),
где
iT (XU, 6) = ainco(xi/xU’ e)
v p’ ' Э0.
Fi (6) = || 4/(f (Xj_p, 0)fr(Xi_p,0))||.
(3.3.2)
FJV(0) = AF1(0),
N
i-pi 0)с
Причем статистика A^N (Xf, 0) с и -^= У*J (Xi.
пвИ определенных требованиях регулярности асимптотически нор-
мальна [18 31, 52, 94], что делает ее очень удобной для приме-
нения в задачах проверки гипотез. Далее также будем использо-
ВаТКак°уЛзывалось в разд. 4 гл. 2, если точные значения пара-
метра до и после разладки неизвестны, то во многих случаях
целесообразно настраивать алгоритм на обнаружение «слабых»
разладок, когда || 02 - 0Х || 0. Конечно, при этом обнаружение
«сильных» разладок будет происходить с запаздыванием, большим,
чем у гипотетического «равномерно эффективного» АКС. <±го не-
посредственно связано с фактом отсутствия в классе ПКОВ с по-
стоянными порогами равномерно наиболее мощных (гНМ) кр
териев проверки гипотез [34, 81]. Представляется, ~ однако, что
для практических целей это не очень существенный недостаток
тем более что за «равномерную эффективность» АКС (2.Z.11)
приходится расплачиваться существенным усложнением вычисли-
тельной схемы. Поучительно, что сам автор алгоритма (2.2.11)
не применяет его при решении практических задач lldUj.
Если точки и 02 сближаются в параметрическом простран^
стве то наблюдение логарифма отношения правдоподобия $г
теряет смысл при || 02 - 0г || -> 0. Это легко видеть на примере
рекуррентной формулы для gt (2.2.7) при 0а+ 0V Поэтому в за-
дачах проверки близких гипотез выделяют постоянную часть
первого члена разложения (3.3.1), (3.3.2) и используют ее в ка-
честве решающей функции [31, 32, 52]. Проиллюстрируем сказан-
ное следующим преобразованием:
_ _ w(Xf/0 4-Wl^)
5Г (0 - - Ас/ -|ЛА7, 0 + МУN) = In —у—-----—
“ ^xi /0 ~ удг;
со (Xf/9 + 1C//1V) СО (Xf/9 - Хс/УТУ) =
=ln Mxygj n «(xf/e^
= зГ (0, 0 + Хс/уЙ) - 5Г (0, 0 - Хс/У N).
(3.3.3)
Таким образом, пренебрегая в (3.3.1) остаточным членом и подстав-
ляя Sf (0, 0 + Хс/У N) и 3f (6, 0 — ke/УН) в (3.3.3), получим
Sf (9 _ Хс/уЙ, 0 + U/УN) (2Х/ tfN) AiN (Xf, 0) с. (3.3.4)
Гипотезы Но : 0 = во - и Ш : 0 = ©о + сбли-
жаются так, что ||Д0 || ~ 1/УЙ. При || Д0 [| — 0 в (3.3.4) имеет смысл
наблюдать постоянную часть первого члена разложения Ai ( i-
0-)) с.
49
48
В задачах проверки гипотез ПКОВ, построенный на основе
такой статистики, называют локально наиболее мощным (ЛНМ),
т. е. он становится оптимальным при |] Д0 || -+ 0. Одномерный
случай ЛНМ ПКОВ для независимой случайной последователь-
ности рассмотрен в работах [81, 82], где исследованы его характе-
ристики и выполнено сравнение ЛНМ ПКОВ с соответствующей
схемой Неймана—Пирсона. ЛНМ ПКОВ в этом случае строится
на основе кумулятивной суммы (ср. с (2.2.4)):
= St-i + д In® (ж(/0)/д0 [0=0..
Итак, возвращаясь к -задаче обнаружения разладки согласно
второму способу задания априорной информации о векторе 0,
получим II вариант АКС (первая модель разладки):
gt = (&*-n(+i (Оо, с))+, $_Я(+1 (0О, с) = ДЦ+!(0о) с, (3.3.5)
где At-nj+i (Оо) = At-n(+i (XLn<+i/Oo, X*~n‘) — вектор условных
эффективных вкладов, a nt вычисляется согласно (3.2.2).
Здесь предполагается, что разложение (3.3.1) существует и для
условного логарифма отношения правдоподобия. Для второй
модели разладки А(‘_П;+] (0О) = At-nt+i (Х|_п<+1/0о) — безусловный
вектор эффективных вкладов.
Для р-связной марковской последовательности и первой мо-
дели разладки из (3.3.5) и (3.3.2) получим упрощенную рекуррент-
ную формулу
gt = (gt-1 + A gt)+, Agt = iT (Xl-P, Оо) C. (3.3.6)
Для второй модели разладки вектор эффективных вкладов
в (3.3.5) вычисляется в этом случае согласно
AU,.,(e.) = Aw;:f(4 + . , 21 (3.3.7)
1 ‘ г=<—п4+р+1
где
Tt_n<+p /в F Ь 9 Ь
^l+1 (0) = ---------------- н--------------------- + . . . .
II 3 3
Правила подачи сигнала о разладке и получения оценки t0 сохра-
няются прежними (см. (3.2.4), (3.2.5)).
Между первыми двумя вариантами АКС существует опреде-
ленное соответствие, основанное на свойствах распределений
с монотонным отношением правдоподобия [34]. Пусть переходная
плотность наблюдений {X{ip} представлена в виде экспоненциаль-
ного распределения [34] (имеется в виду, что наблюдения образо-
ваны р-связной марковской последовательностью)
о (Х(/Х%>, 0) = С (0) exp [ X Qi (0) Т> (Xlp) 1 h (XLP)
i=l
и допускается переход к естественному r-мерному параметрическо-
го
му пространству
w(xt/xU,e) = c(O)eXp[S0>T>(xLp)], (з.з.8)
где 0Г = || 01, . . 0Г |( — вектор параметров.
Возьмем для простоты первую модель разладки. Тогда прира-
щение решающей функции I варианта АКС из (3.2.3)
(3.3.9)
;i приращение решающей функции, соответствующее II варианту
АКС (3.3.6)
д In С (6)
30.
з
е=е»
4-
(3.3.10)
Известно, что In С (0) в семействе (3.3.8) — строго выпуклая функ-
ция, поэтому, если принять 02 — 0Х = цс и применить теорему
Лагранжа, станет очевидным следующее: правая часть (3.3.9)
равна правой части (3.3.10), умноженной на ц, если выбирать
точку Оо специальным образом: 0О = Х0х 4- (1 — %) 02, где 0
.4 л 'С !• Причем, в силу строгой выпуклости In С (0), этот выбор
однозначен. Таким образом, для экспоненциального семейства
(3.3.8) задача о разладке с точно известными величинами 0Х и 02
и соответствующий ей АКС (3.2.3), (3.3.9) эквивалентны некоторой
другой задаче (II вариант АКС) с известным направлением с и
вектором 0О (3.3.6), (3.3.10). Наличие постоянного множителя г]
может быть всегда скомпенсировано соответствующим выбором
ш>рога h в (3.2.4).
4. Применение АКС при неполной информации
о векторе 0 (III вариант АКС)
Как и в предыдущих разделах, начнем с построения ПКОВ для
проверки гипотез Но и Нг согласно третьему способу (см. разд. 1)
Учета априорной информации о векторе 0.
В случае, когда класс альтернатив не ограничен, существует
Несколько подходов к конструированию ПКОВ [11, 101, 117],
"Днако все они приводят к использованию статистики %2-критерия.
будем придерживаться подхода весовых функций, развитого
4- Вальдом [11]. Предположим, что в параметрическом простран-
1 Д ве существует зона <ва принятия гипотезы Но, зона сог — бра-
В’овки (принятия и поверхность 5Г, разделяющая зону
51
<ог и зону безразличия а>0 (см. рис. 13). Кроме этого, пусть сущест-
вуют весовые функции va и vr:
Jz;a(0)d0 = l; $ vr(0)dSr=l.
“a sr
В качестве отношения правдоподобия в этом случае используется
функция
est= $ pr(0)®(Xl/0)d5r/ J pa(0)co(Xl/0)dO, (3.4.1)
Sr ®a
на основе которой строится ПКОВ. А. Вальд указал, как нужно
выбирать весовые функции va и уг, и рассмотрел случай, когда
0 — вектор средних гауссовской r-мерной независимой последо-
Рис. 13. Задание зон принятия
соа, браковки (ог, гипотезы
и зоны безразличия ш0
вательности с единичной ковариационной матрицей [11]. Исполь-
зуя разложение (3.3.1), (3.3.2), сведем (3.4.1) к такому случаю.
Сразу отметим, что III вариант АКС, как-и II вариант, нацелен
на обнаружение «слабых» разладок и будет допускать проигрыш
при «сильных». Рассмотрим сначала задание гипотезы Но в виде
точки в параметрическом пространстве, а затем дадим некоторые
обобщения.
Пусть Но : 0 = 0! и Hi : (0 - 0х)г Fi (0х)(О - Ох) > Та-
ким образом, в качестве соа выбирается точка 015 а в качестве сог —
множество точек, попадающих во внешность эллипсоида, опреде-
ляемого информационной матрицей Fr и параметром %®, а зона
безразличия — это внутренность эллипсоида без точки 01# Оче-
видно, что
(О _ 03)TF1 (о _ О,) = Д 0f Dx А 0х = А 02т А 02 = X?, (3.4.2)
А0 = 0 —015 А0х = АА0,
где А — ортогональная матрица (г х г), Dx = diag {oi , . . ., п®} —
диагональная матрица (г х г), А02 = || А0х4ог || — r-мерный век-
тор «деформированных» отклонений. Переформулируем гипотезы:
Яо: Д02гА02 = 0; Нг: А02 А02 > Xt
Перейдем от соотношения (3.4.1), используя (3.3.2), к случаю
близких гипотез, т. е. (| А0 || -> 0:
t
~ exp [£jfr (XLP, 00 (0 - Ox) - 4 (0 ~ 6i)] •
i=l
Выполняя с A0 преобразования, подобные (3.4.2), получим
est exp f2r (XU) Д 02-------Д 02Г Д e2] , fi = Af,
Ы
где il = || fu/Oi, . . ., firlar || — деформированный r-мерный век-
тор fr (X]_p, 0). Выбираем согласно указаниям А. Вальда весо-
вую функцию vr (А02) постоянной на поверхности сферы S^,t
радиуса %х:
Vr(A0») = [$ dSuy=C,
s
а так как в данном случае область <ва — точка, то интегрирование
с весовой функцией va в знаменателе (3.4.1) отсутствует. Таким
образом, получим из (3.4.1)
t
Л exp (V f2r (Xt-p) Д02-----Y А «2ГД dSKl / J dSu.
S ' S
Далее
2 t
Л — б'ехр -7Г-) § exp (У f2T (Xi-p) A ^dSKl =
S i=l
2 t
— Cexp(-----exp f /U У f2 (Xj_P) II X
S ' “ " i=l
X II A 02 II COS p (0)) dSKi, (3.4.3)
t
где p (0) — угол между векторами У f2 (X[_p) и Д02. В ра-
’ i=i
боте [11] показано, что интеграл такого типа является строго воз-
растающей функцией от статистики
i=l i=l
и требования по выбору vr выполнены, поэтому статистика %t
асимптотически достаточна для проверки указанных гипотез.
Возвращаясь от f2 (Х[_р) к f (Х*_Р), получим
[S f2T(Xtp)][3f2(xUp)]= з (3/п)2^=
Li=i JH=i 1=1 t=i
= [3fr(xU)]Dr1[S«i(xLp)]=
ui=l
= [ 3 fT (XUp)l ATDrrA [ 3 f (XLp)] .
Li=l »=!
52
53
По свойству ортогональных матриц Fy1 = ATD114, поэтому
Z(=4 L Еf г [ £,f (х*-р) ] •
i=l г=1
Так как статистика Xt асимптотически имеет х2-распределение
с г степенями свободы, центральное при Но и нецентральное при
Я1, с параметром нецентральности К2 > X2, то в силу монотонно-
сти eSf (3.4.3) от %t, необходимо наблюдать на каждом шаге t
логарифм отношения правдоподобия для статистики Xt и гипотез
Но : X2 = 0 и Нг : X2 = X2. Используя выражение для плотности
распределения х2 закона из работ [4, 116], запишем 1
’ (зл4)
где
OF1 (с, х) = 1 + —- + С(с+ 1)2! + • • • + Ffc + 1).. .(с + «-!)»!
— обобщенная гипергеометрическая функция [116, 117].
Вернемся вновь к задаче о разладке. Структура решающей
функции для III варианта АКС остается прежней (3.2.2) с естест-
венной заменой 5;_П(+1 на Л^П(+1:
gt = (*sUi+t (Хп;))+, Хп( = а£п(+1 (01) f;* (Oj) а'_П(+1 (вд, (3.4.5)
где Д/_И/+1 (Oj) определено для первой модели разладки в (3.3.5),
а для второй модели Д(_п<+1(01) = Д*_Пг+1(Х{_П{+1/01) — безусловный
вектор эффективных вкладов.
Перепишем (3.4.5) для р-связной марковской последователь-
ности и первой модели разладки:
gt = G-M-npi (Xn())+, х»( = ~ V^Fi (Or)-1 Vt, (3.4.6)
где Vt = Vt-i I (gt-i) + f (X;_p) — вектор эффективных вкла-
дов, вычисляемый рекуррентно от начала очередного цикла ПКОВ.
Для второй модели разладки и р-связной марковской последова-
тельности Ai-npi (61) рассчитывается по формуле (3.3.7).
Правила подачи сигнала о разладке и, получения оценки
для АКС (3.4.5), (3.4.6) сохраняются прежними (3.2.4), (3.2.5).
В некоторых задачах нецелесообразно с вычислительной точки
зрения рассчитывать на каждом шаге наблюдения гипергеометри-
ческую функцию 0Fx (с, х} как сумму сходящегося ряда. Вместо
этого, используя факт монотонной зависимости логарифма отно-
1 Понятно, что при разложении (3.3.1) это остается в силе, для этого доста-
точно заменить сумму / (Х?_р , 0J на Д‘ (X*, 0х).
щения правдоподобия х2-Распределения от статистики X/ ШК
заранее вычислим криволинейные пороги ПКОВ и перепишем
правило (3.4.5), (3.4.6) непосредственно для %п :
gt = (%nf — X(ret))+ + xW> «t = «t-i7'(g’t-i —Х(л<-1)) + 1-
(3.4.7)
При этом правило подачи сигнала о разладке изменяется и ста-
новится следующим: ta = inf {i : > X (wt)}-
Пороги x(nt), X (nt) вычисляются как корни уравнения
—А:Х?/2 + ln0Fi (r/2, fcXiX (X)/4) = a, (3.4.8)
решаемого относительно x(^) Для набора к = 1, к. При вычисле-
нии х (nt) выбираем a = 0, а при х {щ} выбираем a = h. Для ре-
ализации такого АКС необходимо дополнительно хранить в памя-
ти ЭВМ 2к значений порогов, где к определяется на практике мак-
симально возможным запаздыванием в обнаружении разладки
или (что тоже самое) максимальной длиной цикла ПКОВ.
В рамках указанного подхода можно задать множество точек
wa — зоны принятия гипотезы Но как внутренность эллипсоида
<0 _ 01)TF1 (0 _ 0Д = х2, тогда зоне безразличия соответствует
множество точек, попавших между двумя эллипсоидами. При
таком определении гипотез Но: (0 — 0i)rFi (0 — ОД «С X2;
Яр. (0 — 0i)TFi (0 — 0Д Х| ПКОВ также основан на х2 кри-
терии [11, 101, 117] и асимптотической нормальности вектора
(Х/уУ)А^ (0Д. В этом случае необходимо наблюдать логарифм
отношения правдоподобия St (хД Для гипотез Но: X2 = X2 и
Яр X2 = X2 /> X2. Вновь используя выражение для плотности
//-распределения из работ [4, 116], получим
^t(Xt) = -*(Х2! -Х20)/2 + 1п0Л(г/2, lX21Xt/4) -1п0Л(г/2, fX20xt/4).
(3.4.9)
Из сопоставления (3.4.4) и (3.4.9) видно, что St (хД = A t (хДь, —
— St (Xt)x. и если X2 = 0 (т. е. внутренний эллипсоид сжимается
точку 01), то St (х<) = £ t (хД- В формулах расчета АКС (3.4.5),
>3.4.6) в этом случае £ t (хД заменяется на St (хД, а при определе-
нии gt непосредственно через Xt (3.4.7) все изменения сводятся
к расчету порогов х (nt) и X (nt) не из (3.4.8), а из следующего
уравнения:
~к (X? - Хо2)/2 + 1п(0Л(г/2, Н2х(А:)/4)/0Л(г/2, ЛХ2Х(*)/4)) = а.
(3.4.10)
Рассмотрим поведение решающей функции gt, типичное для
всех трех вариантов АКС. До появления разладки приращение
АаА имеет отрицательное математическое ожидание и решающая
55
54
Рис. 14. Типичное поведение статис-
тики v
функция близка к нулю, так как
ПКОВ постоянно возобновляе-
тся из нуля [(см. рис. 5). После
того как произошла разладка и
0 = 62 при t > t0, М (/\ёг^2У>
>0 и решающая функция, по-
лучая в среднем положитель-
р ные приращения, начинает ра-
сти и достигает порога (см.
рис. 5). В случае третьего ва-
рианта АКС приращение /\gt
введем формально:
= £t(Xt)z~ ^j-i(Xt-i)-
£\gt =
Работа
правила (3.4.7) третьего вариан-
та АКС иллюстрируется рис. 14.
На каждом шаге t происходит
расчет и сравнение эцс ниж-
пим криволинейным порогом х (nt); если он достигнут, то на сле-
дующем шаге t + 1 выполняется сброс счетчика: nt+1 = 1
(см. рис. 14). До появления разладки Хпг в среднем движется к
порогу х (пг), а после момента t0 — к верхнему порогу, кото-
рого достигает в момент ta: %п A x(reta)-
До сих пор предполагалось, что после начала наблюдения раз-
ладка возникает однажды и затем вектор 0 не покидает области
02- Однако представляет интерес и несколько иная задача — об-
наружение многократных переходов вектора в из в 02 и обрат-
но в неизвестные моменты времени. Покажем, что рассмотренные
алгоритмы решают эту задачу при минимальной модификации.
В самом деле, АКС основан на том, что М (Ag,/0) меняет свой
знак при переходе 0 из 01 в 02. То же самое происходит и при пе-
реходе 0 из ©2 в 0V Таким образом, чтобы продолжить режим на-
блюдения с целью обнаружения возврата последовательности в на-
лаженное состояние, необходимо после выявления разладки в
момент 1а установить счетчик nt +1 = 1 и вместо S‘f_n+1 (0Х, 02)
в (3.2.2), 'SUni+i (0О, с) в (3.3.5), St-nj+i (Xnz) в (3.4.5) использо-
вать соответствующие величины с обратными знаками. Это позво-
лит свести задачу обнаружения перехода вектора 0 из 02 в ©j
к рассмотренной ранее. После обнаружения факта перехода вновь
установим счетчик в положение nta+1 = 1 и возобновим обычный
режим наблюдения.
Глава 4
ИССЛЕДОВАНИЕ АЛГОРИТМОВ
КУМУЛЯТИВНЫХ СУММ
1. Методика исследования АКС
Для того чтобы правильно использовать алгоритмы, рассмот-
ренные в гл. 3, необходимо прежде всего исследовать их свойства,
т. е. получить зависимости среднего времени запаздывания т
в обнаружении разладки и среднего времени Т от начала наблю-
дения до ложной тревоги от параметров настройки АКС и статис-
тических свойств наблюдаемых случайных последовательностей.
Далее будем предполагать, что t0 — неизвестный метод времени,
и не будем приписывать t0 каких-либо вероятностных свойств.
Как видно из гл. 2 (см. разд. 1 и 2), исчерпывающую информа-
цию о свойствах АКС в этих условиях дает зависимость среднего
времени наблюдения (СВН) (в англоязычной литературе average
run lengths (ARL)) от истинного параметра 0, который определяет
свойства наблюдаемой последовательности {Х^}. Среднее время
наблюдений, которое обозначим L (0), представляет собой среднее
время от начала наблюдения до первого выполнения неравенства
gt^ h. Предполагается, что в течение этого времени значение 0
постоянно. Строго говоря, СВН — функция не только параметра
0, но и начального значения решающей функции, которое опреде-
ляется «предысторией», но этого вопроса мы коснемся позднее.
Функция СВН L (0) в задаче обнаружения разладки играет ту
же роль, что и функция мощности |3 (0) в задаче проверки гипо-
тез. Поясним это на таком примере.
Пример 1. Пусть 0 — скалярный параметр плотности
распределения наблюдений. Налаженное состояние соответствует
полупрямой ]— оо; 0О], а разлаженное ]0О; Ч-оо[. В задаче про-
верки гипотез обычно фиксируют уровень значимости а — р(0о)
и требуют, чтобы функция мощности была максимальной при аль-
тернативе (т. е. при 0 )> 0О). Аналогично и в задаче о разладке
зафиксируем некоторое значение L и будем минимизировать функ-
цию L (0) при 9> 90, в то время как L (0 0О) > L. При этом
среднее запаздывание в обнаружении разладки т (0) = L (0 >
А 0О) и среднее время до ложной тревоги Т (0) = L (0 А 0О)
являются аналогами вероятностей ошибок первого и второго рода
в задаче проверки гипотез.
Идеальный алгоритм обнаружения разладки должен вообще
не давать ложных тревог и обнаруживать разладку за один шаг
(в силу дискретности времени обнаружение разладки быст-
рее, чем за один шаг, невозможно). Таким образом, идеальная
57
L* (0) =
0>0о
функция СВН имеет вид
оо, если
1, если '
и соответствующие ей т = L (0
= оо. Если существует г------
нимизирует т (0) при V0 > 0О, „ :
оптимальным алгоритмом. В гл. 2 лпс. (Z.
торый является асимптотическим РО для гипотезы 0 =
тернативы 0: | 0 — 0О I > 0 ]> 0.
Как и в задаче проверки гипотез РО, алгоритмы существуют
редко, их трудно реализовать, поэтому большое значение приоб-
ретает свойство несмещенности, которое в данном случае означает,
что
L (0 < Ло) > 4 L (0 > во) < L.
Проиллюстрируем сказанное графически. На рис. 15 изобра-
жены реальные и идеальная функция СВН для примера 1. Срав-
ним две кривые СВН (см. рис. 15). Можно видеть, что алгоритм,
соответствующий штрихпунктирной кривой, лучше работает при
близких альтернативах, а алгоритм, соответствующий сплошной
кривой, лучше при больших величинах 0 — 0О ]> 0. Такое поло-
жение типично для задачи обнаружения разладки. При решении
конкретной задачи алгоритм обнаружения разладки настраива-
ется так, чтобы на заданном отрезке значения Т (0) были бы ми-
нимальны. Если существует РО алгоритм, то его функция СВН
является огибающей (см. рис. 15, кривая с косой штриховкой)
для всевозможных СВН, оптимальных для конкретных значений
0 Е? ] 0О; 00 I, а если РО алгоритмы не существуют или их исполь-
зование затруднительно, то целесообразно перейти к локально
оптимальным алгоритмам. В этом случае при заданном уровне L
необходимо максимизировать наклон касательной функции СВН
/ \ а т > dL (6) I
в (.) 0О, т. е. максимизировать производную L ---------1 ,
она существует в (.) 0О. Очевидно, что идеальная функция
__________________i касательной — -у .
вектор 0 £ 0j и после
определим условие несмещенности следующим
max L (0),
0=02
0О) = 1 и Т = L (0 < 0о) =
такое правило, что оно одновременно ми-
) ]> 0О, то будем называть его равномерно
— 2 рассмотрен АКС (2.2.11), ко-
ц ------------------- ~ = 0О и аль-
если с”" ---
CBH имеет угол наклона
В общем случае, когда до разладки
разладки ft Е Я -----
образом:
minL(0)>i_____--у/, (4.1.1)
0-01 0=02
Подразумевается, что области и О2 не пересекаются, но могут
иметь общую границу. Содержательный смысл условия (4.1.1)
прост — последовательный алгоритм должен обнаруживать раз-
ладку со средним запаздыванием не больше чем среднее время от
начала наблюдения до подачи] ложной тревоги, независимо от
значения вектора 0.
Все рассмотренное в примере 1 может быть легко перенесено
на случай векторного параметра 0. Функция СВН в этом случае —
поверхность, а при исследовании локальных свойств алгоритма
производная берется по интересующему направлению. Не пред-
ставляет труда определить в этом случае и идеальную функ-
цию СВН.
Во многих случаях разлаженное состояние может занимать все
параметрическое пространство за исключением одной точки 0О
для некоторой области вокруг нее. Вновь обратимся к скалярно-
му случаю.
Пример 2. Пусть налаженное состояние 0 : 0 = 0О, а
разлаженное 9 : 0 =И= 0О. В этом случае идеальная зависимость
СВН имеет вид
если 0 = 0О;
если 0 0О.
Па рис. 16 изображены реальная и идеальная зависимости СВН,
а также огибающая (косая штриховка), соответствующая РО ал-
горитму при заданном уровне L. Их поведение аналогично «од-
ностороннему» случаю (пример 1). Рассмотрим локальные свойст-
ва двухсторонних алгоритмов. Так как естественно потребовать
выполнения условия несмещенности, то, предполагая возмож-
ность разложения L (0) в ряд Тейлора
................... (0 - 0о) + 4- I (6-0о)3,
об |е=е„'.2 св2 |0=0ох '
свойство несмещенности выполняется при
1,
L(0)
0.
видим, что «локально»
таких условиях:
"ffil =0;
[е=ео ей2 le=e,
Тогда локальная оптимизация алгоритма заключается в максими-
зации d.
Если предположить возможность разложения L (0) в ряд Тей-
лора для векторного параметра, то L (6) st: L ^0) + (0 — 0O)TZ0O +
+ (0 — Оо)Ш0о (0 — 0О), где z0 = || dL || — r-мерный век-
тор частных производных, Не = || дг.Т6/<?0,д'0^ || — матрица вто-
рых производных (г X г), тогда «локальные» условия несмещен-
ности имеют вид: z0o = 0; (0 — 0о)гНео (0 — 0О) -С 0 при ® 0О>
где 0 — вектор с нулевыми компонентами.
Если ни одно из направлений выделить нельзя, то локальной
(в смысле || 0 — 0О |] —> 0) мерой качества алгоритма может служить
d = —det (Яео). Оптимизация алгоритма в этом случае сводится
к максимизации d. Типичный вид зависимости СВН для двумер-
ного случая показан на рис. 17.
До сих пор рассматривались относительно простые случаи,
когда до разладки 0 = 0! или изменение 0 происходит в определен-
ном направлении. Можно представить себе гораздо более сложные
59
58
+ оо
Рис. 15. Реальная и идеальная за-
висимости СВН в случае односто-
ронней альтернативы
Рис. 16. Реальная и идеальная за-
висимости СВН в случае двухсто-
ронней альтернативы
Рис. 17. Реальная зависимость
СВН в случае векторного парамет-
ра 0
ситуации, когда 0а и 02 — произвольные области в параметриче-
ском пространстве. В этом случае для исследования и сравнения
качества алгоритмов можно, например, ввести функцию потерь
или оценивать качество алгоритмов по разности A L = min L (0)—
8G01
— max L (0).
0е®2
Вряд ли имеет смысл здесь вдаваться в дальнейшие подробно-
сти, так как ясно, что в каждой практической задаче эти вопросы
решаются по-своему. Важно то, что для любого исследования
свойств последовательных алгоритмов обнаружения разладки не-
обходимо иметь удобные для практики методы оценки функции
О1) и ее производных.
60
В общем случае задача аналитического получения зависимости
L (0) в настоящее время не решена даже для случая независимых
наблюдений. Более того, как следует из гл. 2, получение прибли-
женных оценок L (0) сопряжено с рядом трудностей и предвари-
тельных предположений относительно характера приращений ре-
шающей функции Z\gt- В следующих разделах будут рассмотрены
приближенные оценки функции L (0) и границы сверху и снизу
для L (6) в этих предположениях. Затем для случая близких ги-
потез будут детально рассмотрены свойства функции СВН для I
и II вариантов АКС и исследовано влияние мешающих парамет-
ров. После этого будут сняты сделанные ранее предположения о
свойствах приращений Ag* и рассмотрены некоторые эвристиче-
ские приемы исследования функции СВН в этой ситуации.
2. Оценка среднего времени наблюдения
для случая независимых приращений
решающей функции
Содержание этого раздела относительно независимо от ранее
рассмотренных вопросов, так как не привязано к каким-либо
конкретным моделям разладки или вариантам АКС. Здесь будут
получены приближенные оценки и границы СВН, удобные для
практического использования в предположении, что приращения
кумулятивной суммы — одинаково распределенные и независи-
мые случайные величины [41—44].
Эти оценки и границы основаны на идеях последовательного
анализа А. Вальда и являются развитием методов расчета функ-
ции СВН для АКС, рассмотренных ранее (см. разд. 2 гл. 2, третья
группа методов по исследованию характеристик АКС), на случай
произвольного распределения приращения кумулятивной суммы.
Как следует из разд. 2 гл. 2, в этих условиях существуют «точные»
методы получения зависимости СВН посредством численного ре-
шения интегральных уравнений Фредгольма. Это, однако, не
умаляет актуальности рассматриваемого вопроса. Дело в том, что
численные методы тоже имеют свои недостатки и при неблаго-
приятных сочетаниях параметров АКС могут давать довольно
большую ошибку в вычислении СВН, а главное, на их основе
нельзя (кроме простейших ситуаций) выполнить настройку АКС.
При решении практических задач два таких подхода должны ра-
зумно дополнять друг друга.
Получение простых и достаточно эффективных для инженер-
ных приложений аналитических оценок, подкрепленных граница-
ми, позволит в гл. 6 разработать методику настройки АКС. Как
будет видно далее, во многих важных случаях обнаружения раз-
ладки зависимых случайных последовательностей эти предполо-
жения выполняются хотя бы частично, что дает возможность по-
строить для них удовлетворительные оценки СВН, а в некоторых
случаях скорректировать общие результаты применительно к
конкретной ситуации
61
В этом разделе мы будем иметь дело с решающей функцией
gt и моментом остановки ta, определяемыми следующим образом:
gt = (gt-1 + Д£/)+> go = z > 0, ta = inf {t : gt > h).
Функцию СВН для gQ = z обозначим Lz (0). Так как далее будут
использоваться методы последовательного анализа А. Вальда
[11], примем следующие дополнительные предположения отно-
сительно функции распределения F (ж/0) приращения Д#г:
а) производящая функция моментов ф (t, 6) существует в лю-
бой точке комплексной плоскости и для V0 является непрерывной
функцией 0:
<30
ф(С 0) = J etx d (F (х/0)), (4.2.1)
—оо
где F (ж/0) — функция распределения Ащ при условии, что
6 — истинное значение параметра;
б)
Э6 > 0 : Р {e^8t > 1 + 6} > 0 и Р {е^ < 1 - 6} > 0.
(4.2.2)
Вначале рассмотрим получение приближенных оценок L (0)
для случая g0 = 0. Это, пожалуй, важнейший случай по следую-
щим причинам. Во-первых, интуитивно ясно (а строго это показал
Г. Лорден [131]), что при условии = 0 запаздывание в об-
наружении разладки будет максимально, т. е. sup Т (02) = Lo (02)
(см. разд. 1 гл. 2, критерий 3, (2.1.4)). Условие gt0-i = 0 опреде-
ляет «тяжелейший случай» обнаружения разладки. Во-вторых,
обычно режим наблюдения начинается из неразлаженного состоя-
ния, поэтому разумно установить g0 — 0. Следовательно, _среднее
время от начала наблюдения до ложной тревоги будет Т (0j) =
= Zo (02).
Вспомним выражение (2.2.17) для Ао (0), полученное
1.. С. Пейджем:
£0 (0) = Мо (н/0)/(1 - Р_£ (0/0)), (4.2.3)
где Мг (п/0) обозначает среднюю продолжительность ПКОВ
с порогами —е и h при g0 = z, Р_£ (z/0) — вероятность оконча-
ния ПКОВ на пороге — е при g0 = z. Трудность использования
в (4.2.3) вальдовских аппроксимаций Мй(п/8) и Р_£{О/0} [11, 101]:
Мо (п/0) Мо (п/0) = (-Р_е (0/0) 8 + h (1 - Р-Ё (01&)))1М (£&/&)
(4.2.4)
л
Р_„ (0/0) ~ Р_£ (0/0) = (е-аЛ — 1)/ (е-“л — е“»Е),
где ю0 = (о0 (0) — единственный ненулевой корень уравнения
.П(е заключается в том, что при 8 = 0 подстановка
62
j/0 (n/0) и Р-г (0/0) в (4.2.3) приводит к неопределенности. В ра-
боте [155] для нормального распределения /\gt предложен при-
ближенный метод получения Lo (0). Используя подобный прием,
получим Во (0) как предел
Во (0) = Иш (Мо (п/0)/(1 - Р-г (0/0))). (4.2.5)
е-Ч)
Подставим оценки выражения для Мо (п/0)] и Р_е (0/0) в (4.2.5)
и после несложных преобразований вычислим предел
Во (0) = (1/M (Agz/0)) (h + е-“>л/(оо - 1/®0). (4.2.6)
В (4.2.6) существенно, что Ф 0. Теперь предполо-
жим, что 0 = 0: M(Ag</0) = 0, и найдем оценку для Во (0).
Множество значений 0 обычно играет роль границы в параметри-
ческом пространстве между областями налаженного и разлажен-
ного состояний наблюдаемого процесса. Это случай, когда единст-
венный корень уравнения М^-®*^4) = 1 равен нулю, тогда
вальдовские аппроксимации Мо(м/О) и Р_е (0/0) имеют вид
[11, 101] 'Мо («/О) = JP-г (0/0) еа + (1 - Р-г (0/0)) Я/М(Д g?/0);
Р_е (0/0) = hl (h + е). Подставляя эти оценки вновь в (4.2.5),
а затем переходя к пределу, получим
Bo(0) = A2/M(Ag?/0). (4.2.7)
Эти оценки были получены в предположении, что gta-y = 0, т. е.
что до разладки решающая функция была минимальной, но пред-
ставляет интерес и расчет Вг (0) при = z 0.
Итак, пусть g0 = z 0. В работе [168] приведено соотноше-
ние
Вг (0) = Мг (п/В) + Ро (z/0) Во (0). (4.2.8)
Поясним его смысл. Решающая функция gt при «старте» из точки
z может ни разу не коснуться отражающего барьера —е = 0, и
при этом условии время достижения h определяется, как у ПКОВ
с порогами 0 и h и g0 = z. Если же gt попадает на отражающий
барьер —е = 0, то время достижения порога h при этом условии
определяется суммой времени ПКОВ и АКС, начинающегося из
нуля. Взвешенная с вероятностями 1 — Рй (z/B) и Ро (z/0) сумма
таких условных средних дает
Вг (0) = (1 - Ро (z/0))Mz(«/0) + Рй (z/B) (п/В) + ,Вв (0)).
Раскрывая скобки, получим (4.2.8). Кстати, при z= 0 из послед-
него выражения получаем формулу (4.2.3).
Нетрудно видеть, что при —е = 0и^о = г>0 вальдовскин
63
аппроксимации величин Mz (п/Q) и Ро (z/0) имеют вид
Mz (n/0) = [~ZPO (z/0) + (h - z) (1 - Po (z/Q))]/M (>/Q),
p9 (z/0) = _ l)/(e-<Oo(h-z) _
Подставляя Mz {n/Q) и Ln (0) в соотношение (4.2.8), получим
Lz (0) ~ Lt (0) = [- zP0 (z/0) + (h - z) (1 - PQ (z/0))]/M (Д gt/0) +
+ ТЙ^д^/б) + ^“°>° ~ V®o).
Используем теперь оценку Po (z/&) и окончательно получим
4 (0)= ~M{Agt/Q) {h ~ Zl+ е"“оЛ/®° ~ е'“"7«о). (4.2.9)
Подобным образом выведем оценку Lz (0). Вальдовские оценки
величин Mz (п/&) и Ро (z/0) при g0 = z имеют вид
< {n/Q) = [Ро (z/0) z2 + (1 - Ро (z/0)) {h - z)2]/M (Ag|) 0);
Po (z/0) = {h — z)/h.
Подставим эти оценки в; (4.2.8), и после очевидных преобразова-
Д (0) = (Л2 - z2)/M(Ag?/0). (4.2.10)
Проанализируем выражения (4.2.9) и (4.2.10). Покажем, что
Lz (0) Lo (0) независимо от величины 0 : М (A.gt/Q) =# 0. Из
(4.2.9) и (4.2.6) найдем, что
Д (0) - Lo (0) = (юо/М (A gt/®)) (~ ®oz - e~°’z + 1).
Первый сомножитель в правой части последнего равенства всег-
да положительный, так, как [101] М (Д gtl&) и ю0 = <в0 (0) имеют
один знак. Второй сомножитель всегда отрицательный, так как
сводится очевидным преобразованием х = — <o0z к неравенству
1 + х. Таким образом, V0 0, Lz (0) Д (0). Если срав-
нить теперь первые части выражений (4.2.10) и (4.2.7), то станет
очевидно, что при 0=0
Д (0) - и (О) = (- ^/м {& g2t/e)) < о.
Следовательно, V0, Lz (0) £0 (0). Это показывает, что для полу-
ченных приближенных выражений сохраняются важнейшие свой-
ства, присущие функции СВН.
Однако не следует забывать, что выражения (4.2.9) и (4.2.10)
носят приближенный характер. Кратко обсудим причины этого.
Представим себе ПКОВ (пороги — е и h), начинающиеся из нуля,
и кумулятивную сумму St = St-i + £\gt- Правило остановки
ПКОВ имеет вид п = inf {£ : St h или St —е}. Под переско-
64
ком в такой задаче понимают величины — 8п — h 0 или
= Sn + е «С 0 в момент выхода кумулятивной суммы St за
порог [111- А. Вальд в своей фундаментальной работе по последо-
вательному анализу [11] оценил среднюю продолжительность
ПКОВ и вероятность окончания ПКОВ на нижнем пороге:
Мо (тг/0) = [М (Sn/Sn < - е) (0/0) + М (Sn/Sn > Д) X
X (1-Р-е (O/0))]/M(Agt/0),
Р-Е (0/0) = Р {5n< - 8} = (M(e-^/Sn^h) - 1)/ (4.2.11)
,/(М (e~a°Sn/Sn ^h)-M (е~^п/Зп < - б))
и предложил пренебречь величинами Rn и Рп (например,
М (SJSn —е) заменить в (4.2.11) на —е). Так возникли валь-
довские аппроксимации (4.2.4). Если М (j\gt) и ~\fD (/\gt) малы
по сравнению с порогами h и —8, то пренебрежение перескоком
не оказывает особого влияния на оценки Мо (nlQ) и Р_е (0/0).
В пределе при h~lM (/\gt) и hMtfD (>) -> 0 (т. е. когда вре-
мя становится непрерывным) аппроксимационные формулы (4.2.4)
становятся точными. Однако для конечных величин М (/\gt),
VВ (Л gt) и h ошибка перескока ощутима. Наиболее распростра-
ненным методом ее учета стало получение верхних и нижних гра-
ниц для Р-в (0/0) и Мо (н/0). Различным аспектам этой задачи
посвящены работы [11, 101, 125, 129].
В АКС нижний порог е = 0, поэтому учет или хотя бы оценка
ошибки перескока — задача весьма актуальная по двум причи-
нам. Во-первых, необходимо иметь гарантированные характери-
стики АКС. Во-вторых, сравнение границ для Lz (0) с аппрокси-
мацией Lz (0) служит косвенной мерой точности последней.
Естественно, что для среднего времени запаздывания т в обнаруже-
нии разладки интересно иметь верхнюю границу, а для среднего
времени Т от начала наблюдения до момента тревоги — границу
снизу.
Итак, получим верхнюю границу для Lo (0 : М (Д gt (0) > 0).
Заметим, что соо = ©0 (0) 0. Из (4.2.3) и (4.2.11) получим
Lo (0 : М (Д gt/0) > 0 = (М (gt/gt < - е)/М (Д gf/0)) X
(Р (0 /&\ \
, Z n' +M(g(/gt>A)/M(Agt/0). (4.2.12)
1—Jr _g \y/\J) /
Оценим сверху первый член в (4.2.12). Очевидно, что выражение
в квадратных скобках всегда положительно, а величина М (gt/gt
—е), по крайней мере, неположительна: Vs 0. Поэтому са-
мая грубая оценка сверху для первого члена — это ноль. Именно
так сделано в работе [44]. Но можно оценить ее несколько точнее.
Обозначим первый член в (4.2.12) а. Тогда, используя Р_8 (0/0)
3 И. в. Никифоров
65
из (4.2.11), получим
М (gflgt < — е)
а~1
М (e~e><s’t/gt'^.h) — 1
(4.2.13)
Применим к знаменателю дроби в квадратных скобках неравенст-
во Йенсена [И], тогда
1 _ М (e'^t/gt < - е)< 1]-
Затем оценим а сверху:
а
М (gtlgt < — 6)
м (>!Q)
M(e~a’gt/gt^h)- 1
1 _
Применим неравенство —х 1 — ех, а так как дробь в квадрат-
ных скобках положительна, то
М (gt/gt < - е) Г М (e~a‘8t/gt > Л) - 1 ]
а "" М (Agf/ty I WoM (gt/gt < — 8) J ’
и окончательно учитывая, что М gt k) e~a°h (так как
а>0 > 0), получим а (e~&‘h — 1)/ (М (/\gtlty соо). Теперь оце-
ним сверху, следуя А. Вальду [11], второй член в соотношении
(4.2.12):
Л + у(0)
M(Agf0) M(Ag//9) ’
где у (0) = sup М (/\gt — ф / Ag« > ф > 0, 0).
Ф>о
Если In (со (х/&)), где <о (х/д) — плотность распределения /\gt,
непрерывная вогнутая функция от х для некоторых 0EE0, то
у (0) = М (Ag,/^gf > 0, 0) [11]. Например, так обстоит дело
с гауссовским экспоненциальным и другими распределениями.
Что же касается вычисления у(0) распределения общего вида, то
эта задача весьма сложна, поэтому Г. Лорденом предложена очень
простая оценка [129] сверху для у(0) (к сожалению, только при
(Ag'/ZQ) 0). Итак, окончательно получим верхнюю границу
+ ХЗ • <4-2-14>
Получим нижнюю границу Lo (0 : М (Ag?/0) < 0). Теперь
йо = ®о (0) <0 и в (4.2.13) a _> 0. Оценим а снизу, вновь приме-
няя неравенство —х 1 — ех, неравенство Йенсена и учитывая,
что М (е~“'3gt > й) е-®л:
М (gt!gt А - О Г М (е “’%>*) - 1 '
М (>lQ) 1 _ ^(-coogt/g^-e)
М (е (a°gilgt — 1 e-<Ooh_______________।
~M (Ag(/0) coo М(Д gt/0)coo ’
66
Оценим снизу второй член в (4.2.12), теперь он отрицательный,
поэтому
M(gt!gt>h) Л + у(0)
М (A gt/Q) М (Д gtjQ) •
Таким образом,
4 Г _ л «I
Lo (0: М (Д ^/0) < 0) = + h + у (0)] .
(4.2.15)
Чтобы проиллюстрировать эти границы, разберем следующий
простой пример.
Пример 3. Пусть приращение кумулятивной суммы в АКС
распределено по нормальному закону, т. е. L {Ag4 ~ N (т, о2).
Прежде всего найдем у (0) или, в новых обозначениях, у (иг):
со со
у (m) = М > 0, т) = $ ха (х/т) dx A а (х/т) dx,
о ' о
где со (х/т) — плотность распределения Agt.
После очевидных преобразований получим у (т) = о ср (т/а)/
/Ф (т/а) + т, где
1 Г
<р (х) = е 2 11 ®(J) = j Ф (х) <ix.
—оо
Для гауссовского случая ненулевое решение уравнения
Л/ (е-О|,Лг<) = 1 имеет вид [И]: со0 = 2т/а2. Выпишем из (4.2.14)
и (4.2.15) границы: Lo (т < 0) = а (т < 0); Lo (т//> 0) =
= « (и > 0),
а (т) - (е-2т,1/а2 — 1 + 2/rtfe/o2)/(2m2/cr2) + сер (т/о)1(тФ (иг/о))+1.
(4.2.16)
Интересно рассмотреть предельные случаи. Пусть т -* ±0.
В этом случае первый член (4.2.16) имеет своим пределом слева
и справа выражение W/d1. Если т ->+ 0» то второй член (4.2.16)
стремится к +оо, а если т -э—0, то к —оо. Таким образом,
lim Lo (т) = оо; lim Lo (т) = —оо.
m^+o т->—о
Пусть теперь т ±оо. Напомним, что в условиях этого
примера
Ао (т 0) = (e~tmhl0‘ — 1 + 2mA/o2)/(2m2/o2) (4.2.17)
легко видеть, что при т -> + оо первый член в (4.2.16) имеет
своим пределом ноль, а после очевидных преобразований полу-
чим:
=(°/1/Г^) lim ф-1(т/п) lim е(-’»г/2а’)/т = 0,
Т. е. limLa(m) — 1.
m-»4-oo
67
3*
Рассмотрим предел разности Lo (т) — Lo (т) при 'т -> —оо.
Для этого используем асимптотическую формулу [50]: Ф (—х) ~
~ (1/(я]Л2л)) е~х2/2 (1 — 1/ж2 + З/z4 + . . .) при х +°о, тогда
Pm ЗСР (т3) ___е~»»72
«221 тФ(т/а) — т2“«> т ((- m)-i (Trn?i (1 - 1/,п2 + З/m1 + ...) = ~
и lim (Lo (т) — Lo (m)) = 0.
m-*—о?
Обсудим полученные результаты. Если т -> ±0, то примене-
ние верхнего и нижнего пределов теряет практический смысл.
Если тп->• фоо, то обнаружение происходит за один шаг, т. е.
lim Lo (m) = 1 (как отмечалось ранее, в любой ситуации необ-
ходимо сделать, по крайней мере, одно наблюдение). В то же вре-
мя из (4.2.17) видно, что lim Lo (т) = 0. Это естественно, так как
7П-*+сю
ошибка, возникающая из-за пренебрежения перескоком, в этих
условиях весьма существенна. С другой стороны, верхняя грани-
ца Lo (т )> 0)>1 и lim Lo (m) = 1. Таким образом, при боль-
тп-н-ос
ших положительных т верхняя граница будет служить лучшей
аппроксимацией Lo (т), чем Lo (щ). Если т -> — оо, то разность
Lo (ш) — Lo (ш) -> 0, т. е. аппроксимация Lo (т) в этих условиях
играет роль нижней границы. Интересно отметить, что таким об-
разом границы функции Lo (m) сохраняют свойства неэффектив-
ности границ для Мо (п/в) (4.2.4) при т -> 0, указанные еще
А. Вальдом в работе [11]. То же самое относится к поведению
Lo (ш) при т —> + оо. Для иллюстрации вышесказанного на
рис. 18 изображены зависимости Lo (т), Lo (m.), Lo (in 0),
Lo (m </ 0). «Точная» функция СВН Lo (m) заимствована из таб-
лиц [168], которые получены численным решением уравнений
Фредгольма (2.2.18), (2.2.19).
Итак, как следует из формулы (4.2.14), (4.2.15) и примера 3,
практическая ценность границ функции Lo (9) при 9 9:
Л/ДД^/Э) = 0ничтожна. Поэтому непосредственно получим ниж-
нюю границу для Lo (9) при 9 : М (Д gt/Q) — 0. Используя (4.2.3)
и нижнюю границу М (п/9) из работы [11], получим
д (ё)=-—о(га/ё)^ =
1 - Р_Е (0,9)
= М (g?lgt < - е) Р_е (0/0) + м (gf/gt > h) (1 - р_е (0.0))
^(Ag?/6)(l-P_e(0/6))
_ (g^/gf < С Т_е (0/6) ; M(g2/gt>A)
(A g?/6) (1 - Р_е (0/0) + М (A g?/6)
т?2
(4.2.18)
68
Такая граница Ln (0), конечно,
довольно груба, и во многих слу-
чаях, задавая конкретное распре-
деление Agt, можно получить
более эффективную границу.
Тем не менее характер аппрокси-
мации (4.2.7) ясен она зани-
жает истинное значение Lo (9).
Определенный интерес пред-
ставляет получение верхней гра-
ницы для Lz (0 : М (Ag(/9)> 0).
Так как в соотношении (4.2.8)
оба члена положительные, то оце-
пим каждый из них сверху. Возь-
мем верхнюю границу Mz (ге/0)
[11] и границу (4.2.14):
Рис. 18. Вид функции СВН, ее
оценки верхней и нижней границ
Д(0:М(Д£(/9)>О) =
м (gtlgt А — г) Ро (z,0) + М (gtigt > /г — z) (1 — A (z/0))
М (Д gf/0)
Ро (Z/0) Lo (6) < I? - Z + V (9) +
/ -rGhh_ 4 \ 1
+ .-А) .
В последнем выражении остается оценить снизу Ро (z/0) (так как
VA)>0 4 cog1 (е~®оЛ — 1) <; 0). Самая простая оценка снизу
это Ро (z/0) = 0, но, используя более точную оценку [11, 101]
(ясно, что старт ПКОВ из точки z : h z 0 эквивалентен рас-
смотрению обычного ПКОВ с порогами h — z, и — z)
Ро (z/0) = __ 6 (9) «?“•*), ®o > 0,
б (0) = Sup IM ,
o<£<i /
получим
(0:^(Дяг/0)>О) =
__ 1 Г, , /Л. , (е-Лв»_ е-ги») 1) 1
М (A gt.6) [ z + Y ( ) + Шо {e-h^ _ б (0)) ] •
(4.2.19)
Подведем итоги данного раздела. В предположении независи-
мости приращений A gt кумулятивной суммы получены прибли-
женные оценки функции Lz (0) среднего времени наблюдения,
а также верхняя граница для Lz (0 : М (/\ gt/Q) > 0) и нижняя гра-
ница для Lo (0 : М (Д gt/Q) < 0).
69
3. Оценка среднего времени наблюдения
в случае близких гипотез
Как видно из разд, 2, приближенные оценки и границы функ-
ции GBH Lz (в) зависят от конкретного вида распределения при-
ращения решающей функции. Однако в случае близких гипотез,
т. е. при || 9 — ©о || —>- 0, общее выражение Lz (0) существенно уп-
рощается и расчет функции GBH для параметров произвольного
распределения наблюдаемого сигнала фактически сводится к слу-
чаю разладки по среднему гауссовского распределения. Это весь-
ма упрощает анализ основных выражений для оценки функции
СВН в важном для практики случае близких гипотез.
Вначале рассмотрим вычисление ненулевого корня уравнения
М (e~u>a'^8t) = 1. Вновь предполагаем выполненными условия
предыдущего раздела. Используем результаты [11] (леммы 5.1 —
5.5). Учитываем,что 0 : М (Ag»/9) = 0 и для V0 =/= 0 из некоторой
окрестности 0 существует разложение
М = i __ Юо (9) м (Д'?(/0) + М (A g?/0) -
_ ^_M(Ag?e-tt<a’(en?9,
где 0 и 1,1
а также тот факт, что М (eOJ>0<:e)Ag() = 1, получим
- ®о (0) М {/\gt/Q) + М (Д g?/0) -
_^y!LM(Ag?e-UM”w^) = 0. (4.3.1)
Так как по условию 0 : М (/\gt/&) =#= 0 и, следовательно, со® (0)#=
=А 0, а также [И] М (A g^"^0’^) — ограниченная функция 0,
перепишем (4.3.1):
М (A'gtIQ) - (®о (0)/2) М (A gt/B) + о (<Bo0)) = 0.
Это позволяет] в малой окрестности 0 в силу непрерывности ио (0)
и М (Д g?/0) как функций 0 и учитывая, что <в0 (0) = 0, получить
оценку ненулевого корня) уравнения Af(e-®°(0)Ag9 = 1:
®о (0) 2М (Д gtIQ)IM (A g?/0). 4.3.2)
Таким образом, приближенное выражение для оценки Lz (0)
в случае близких гипотез имеет вид
1 м>.г. = — (л — Z 4- ) • (4-3-3)
гдеН = м (Agf/0), о2 = М (Ag?/0).
70
Если сравнить решение уравнения М = 1 для /\gt,
распределенного по нормальному закону TV (р, о2) и (4.3.2),(4.3.3),
то станет ясно, что в случае близких гипотез суть приближения
заключается в аппроксимации произвольного распределения
/\gt нормальным.
Так как в случае близких гипотез между первыми двумя ва-
риантами АКС разница исчезает, в дальнейшем рассмотрении бу-
дем придерживаться II варианта АКС из соображений удобства
анализа.
Оценим М и М (£\gt/Q) для второго варианта АКС
и р-связной марковской последовательности, предполагая, что
Оо = 0, т. е. из всего множества точек 0 рассмотрим только на-
строечное значение 0О в соотношении (3.3.6). Оставляя в
силе предположение о регулярности переходной плотности
со (Xj/XtZp, 0) [31], используем возможность разложения
со (Xt/X|lp, 0) в окрестности точки 0О:
® (Xt/Xtp, 6)=<0 (Xt/xfci, 0О) (1 + iT (Xlp, во) д 0 + II д 0II2 X
хб(Х|_р,Д0)),
д0=о-0о,2И(б2(х?_р,де))<А<0о.
Далее, предполагая, что 0 — 0О = pD, где D7 = || dx, . . ., dr || —
единичный вектор, запишем
М( Д g</0) = $ (fT (XLp, 0о) с) (0 (Хг/Х%, 6) dXt =
= $ (fT (XU, 0O) c) co (Xt/X*Zp, 0o) dXt +
+ nJ(fT(XU,0o)c)f?(XLp,
0o) Deo (Xt/Xjz^, Go) dXt + (fT (XU, 0o)c) 5 (Х,‘_Р) X
X<o(Xt/XtZp, 0o)dXt.
В правой части последнего равенства первый член равен нулю
по определению 0о, а третий интеграл ограничен по условию ре-
гулярности, таким образом, М (0о) D + о (цД
где Fi (0О) = || М (f (Xj_p) iT (X£p)/0O || — информационная мат-
рица (г X г) па одно1 измерение. В свою очередь, М (£\gt№o) =
= М (cTf (XLp) fT (Х‘_р) c/Oo) = cTFx (Go) c.
Таким образом, для близких гипотез получаем
U (п)б.г. = (l/foc’TxD)) (h - z + - e^«V(2^)),
pcTFjD^O, a = (cTF1D)/(crF1c).
Выражение (4.3.4) особенно упрощается, если D = с:
2г (р)б. г. = (1/(T]CTF1C)) (h - z + (е-^ - e-2^)/(2r])). (4.3.5)
71
В случае близких гипотез Lz (0):|
46,r(0)M^--2WrFic). (4.3.6)
Те же результаты (4.3.4)—(4.3.6) для более общей решающей
функции (3.3.5) получаются исходя из того, что статистика
(А,/|/А) (0) из (3.3.1) асимптотически распределена по нормаль-
ному закону.
Для дальнейшего изложения в наиболее важном случае по-
лезно исключить из соотношения (4.3.4) h подстановкой его из
(4.3.6) при z = 0:
£о (/?)б.т = (2Т?£оЛ(0)е.г + e-2R£o'(o)6;r _ 1)/(22?2); (4.з.7)
7?у=0, 7? = T1(crF1D)/(c’’F1c)1^,
где R2 — играет роль отношения сигнал/шум.
Соотношение (4.3.7) полностью определяет свойства 'АКС
в удобной форме: задавая требуемый уровень Lo (О)б.г (минималь-
ное среднее время между ложными тревогами) в (4.3.7) можно рас-
считывать значения Lo (7?)б.г, где R, в свою очередь, зависит
от 0 =0О + г|О. Легко видеть, что £0(Т?)б.г (4.3.7) — убывающая
функция R. Таким образом, с ростом R2 — отношения сигнал/шум
(при фиксированной величине Lo (О)б.г) качество АКС улучшает-
ся, т. е. увеличивается среднее время между ложными тревогами
и уменьшается среднее запаздывание в обнаружении разладки.
Представляет интерес проанализировать характеристики АКС
с информационной точки зрения. В случае близких гипотез это
особенно просто. Опираясь на свойства регулярности, вновь ис-
пользуем разложение логарифма правдоподобия [18,31,52], подоб-
ное (3.3.1), в окрестности точки 0О. Тогда средняя информация
для различения гипотезы Но: 0 = 0О против Нг : 0 = 0О + т]С
(ц — мало) [29]:
I (0О 00 + Т]С) = (7г) (0О) cj+ о (Т]2). (4.3.8)
Если теперь принять в (4.3.7) D = с, т. е. рассмотреть случай,
когда действительное направление изменения вектора 0 совпадает
с расчетным, то R2 = (0О) с 21 (0О : ©о + т]с)-
Таким образом, зависимость СВН в данном случае полностью
определяется средней информацией I (0о : во + Лс)-
Как отмечалось в разд. 1, в случае близких гипотез качество
АКС определяется крутизной зависимости СВН Lo (г]) в направ-
лении D при г] = 0 и заданном уровне Lo (0). Найдем производ-
ную (4.3.4) при z = 0:
Lo (ц)б.г = (h 4- (e-wxh _ 1)/(2т]сс)), (4.3.9)
где а = сгрД).
72
Далее
£ (ц) = dL0 (л)б.г;/^Л — (— h-arl — е~2'1аг> — hc/.r]e~2har} + 1)/(аац3),
заметим, что lim Lz (ц)б.г = Lz (0)б.г, поэтому, хотя последнее
выражение | (ц) не определено при ц = 0, вычислим предел £ (г|)
при 1)->0и таким образом получим 5 (0):
£ (0) = lim g (ц) = — a2/i3/(3a). (4.3.10)
n-»o
Подставляя a и a из (4.3.9) и учитывая, что из (4.3.6) № =
= Lo (0)e.rCTFic, преобразуем (4.3.10):
С (0) = - (7з) L'ob (0)б.г ((с^^^суА). (4.3.11)
Предполагая D — С, упростим (4.3.11):
В (0) = - (2/з) (0)б.Г! (с^с)*/.. (4.3.12)
Из соотношения (4.3.12) видно, что
5 (0) = Н(7з) (0)б.г f(2J (% :J6o + с))*/’,
где под величиной I (0О : 0» + с) понимается средняя информа-
ция различения гипотез Но : 0 — 60 и Н± : 0 = ©о + с. Аль-
тернатива Н} образуется путем единичного «шага» (ц = 1) в на-
правлении с. В одномерном случае (г = 1) выражение Е (0) приоб-
ретает особенно простой вид [137]: Е (0) = —2/3 Le/a (0)б.Д1/!,
где I = М (/2 (жг_р)/0о)— информационное числ о Фишера.
Из рассмотрения (4.3.6) — (4.3.8) и (4.3.12) видно, что при
D = с функция £0 (7?)б.г (через R2 — отношение сигнал/шум) и
5 (0) зависят от величины квадратичной формы cTF1c. Оценим
вариацию сП^с. Так как информационная матрица Fi (0ц) поло-
жительно определена, то квадратичная форма crFjC ограничена
сверху и снизу положительными собственными числами. Из соот-
ношения Релея [5] %г (сП^^ДсЛ?) Л.!,’ где /.г<л,ч4 •'С
' — собственные числа матрицы Fv В свою очередь, величина
с (0) ограничена сверху и снизу:
(~ 7з) а? (0)г.г >.;/2 < 5(0) < (~ 7з) W (0)Р,г k'rh. (4.3.13)
Вели теперь снять предположение D = с, то из (4.3.7) и (4.3.11)
видно, что Lo (Н)ъ.т и £ (0) зависят от отношения
/ (с, D) == (e’T1D)/(cTF1c),/«, (4.3.14)
которое, в свою очередь, определяется углом между единичными
век торами с и D, задающими расчетное и действительное направ-
ления изменения вектора параметров 9. Легко видеть, что (4.3.14)
не зависит от нормы с. В дальнейшем (гл. 6) факт условности вы-
пора этой нормы будет использоваться при настройке АКС.
Исследуем зависимость /(с, D) при фиксированном векторе
’ т- е. при заданном фактическом направлении изменения
73
вектора 0. Покажем, что в этом случае
arg min f (с, D) = — D; arg max / (c, D) = D.
c c
Это следует из неравенства
| / (с, D) | = | с^ОДс^с)7' | < (DrF!D),/2 ~J (D, D)
(4.3.15)
(4.3.16)
или | cTF1I) |-^ ]/'(DrF1D) (с^с), которое ортогональным пре-
образованием и нормировкой (подобно разд. 4 гл. 3, см. (3.4.2))
приводится к очевидному
| crD | </(атс) (DTD). (4.3.17)
Из (4.3.17) видно, что максимум crD/y(o'1?) достигается при c=D,
а минимум при с = —D. Возвращаясь от с к с и от D к D, полу-
чаем (4.3.15).
Из (4.3.15) следует, что выбор с, максимизирующий величину
| (ОДи R2 — отношение сигнал/шум,— это с = D. Поэтому соот-
ношения (4.3.5) и (4.3.12) — (4.3.13) дают представление о макси-
мально достижимом (в условиях конкретной задачи) качестве
работы АКС.
Часто необходимо представлять, насколько изменятся вели-
чины R2 и £ (0), если фактическое направление изменения 0 не
совпадает с расчетным, т. е. D с. Зафиксируем некоторое с,
тогда из (4.3.14) получим посредством очевидных преобразований
/ (с, D) = (е^с)’/* -||и-ЦР||^д = (crFic)V* cos , (4.3.18)
J] а || || с || cos («с) cos (ас)
где || с || = || D || = 1 и вектор аг = crFx. Из выражения (4.3.18)
следует, что при заданном векторе с вариации величины / (с, D)
происходят только за счет изменения отношения 0 = cos (aD)/
I cos (ac).
В параметрическом пространстве существует телесный угол
вокруг вектора а, ограниченный конусом вращения с углом при
вершине осевого сечения 2ас (см. рис. 19). Если вектор D попадает
в него, то 0 1 и качество обнаружения лучше расчетного (т. е.
когда D = с), в то же время вне конуса 0 < 1. Очевидно, что
Р А 1 при любом D, если все собственные числа равны = X,,
в этом случае 2ас =0 (конус «сжимается» в вектор а) и arg min f
( ТЛ\
с’ D) = —С) arg max у D) = Cj || J) || _ 1, а если с | D, то
/ (с, D) = Q. это
показывает, что в общем случае отклонение ис-
тинного вектора направления D от расчетного с может приводить
Ухудшению и к улучшению качества обнаружения.
аким образом, в случае близких гипотез получены оценки
(4.3.3.)—(4.3.7) и крутизны функции
границ - г -3-11)—(4.3.12). Из предыдущго раздела ясно, что
Lz (0) (4.2.12)—(4.2.19), полученные в предположении
конечных величин ЛРАдЛЛ.
теряют практический смысл при
|| 0 - 0о || -> 0.
Для построения границ сред-
ней продолжительности ПКОВ
в случае близких гипотез Валь-
дом была предложена следующая
процедура оценки Мо (n/Q) [И]:
Мо (п/0) = (©о (0)/2/W(>/0)) X
X M(S%) - (co?(0)/6M(Agf/0)) X
хМ(5’е-иШо(0)^) при || 0 - 0o[|->O.
Второй член в правой части бо-
лее высокого порядка малости,
и поэтому им пренебрегаем при ||0—
— 0о || -> 0 (хотя его также мож-
но оценить снизу и сверху). Для
M(Sn) в работе [11] получены та-
кие границы:
е2Р_е(0/е)-[-Л2(1-Р_в(0/0))<_ , ...
+ Уз (0)) + (h2 + 2hyo (6) + у4 (0)) (1 - (0/0))
0, где Yj (0) = inf М (£\gt + ф/Zsgt
Ф>о
Рис. 19. Взаимное расположение
вектора с, а и D
при || 9
У2 (6) = sup М (Д gt — ф/Д gt > Ф> 0,0),
4>>о
Уз (9) = sup М ((Д gt + ф)2/Д gt < — Ф < 0, 0),
ф>0
у4 (0) = sup М ((A gt — Ф)7Д gt > Ф> °. 6)-
'1>>0
Поэтому при М (/\.gt/&) < 0 (т. е. для 0 0о)
Мо(и/0) _ соо(0)М(52) ®о(0) ь2А£(О,0) , \
1 - (0/6) ~ 2М (A g(;0) 2М (Д g//0) [1 - Р_е (0,0) + П
М° [0) Z.2
"" 2М (T\gtlQ)
Так как при || 0 — 0О || —>-Э отношение too (Э)/2М (l\gt^)
-*[/И (Agt/0o)l-1, то в пределе £0 (0о) > h2IM г. е. по-
лучим границу (4.2.18). Полностью аналогично (4.3.19) получаем
и верхнюю границу для Ьй (0 : М (Ag;/0) А 0) в случае близких
гипотез. Основная трудность здесь заключается в вычислении гра-
ниц для Р_е (0/0) в (4.3.19). В общем случае это задача даже более
сложная, чем получение (0) — у4 (0), но ее можно преодолеть,
предполагая гауссовость приращения кумулятивной суммы Agt.
75
74
4. Оценка среднего времени наблюдения
для зависимых приращений решающей функции
и чувствительность АКС
к влиянию мешающих параметров
В двух предыдущих разделах свойства АКС рассматривались
в предположении, что приращения решающей функции — это
независимые одинаково распределенные случайные величины с из-
вестными характеристиками. Данный раздел состоит'из двух ча-
стей. которые объединены тем, что в них рассматриваются свой-
ства АКС при нарушении ранее сделанных предположений. Пер-
вая часть посвящена вопросу оценки СВН при нарушении условий
независимости и одинаковой распределенности приращений ре-
шающей функции, а вторая — чувствительности АКС к влиянию
мешающих параметров, т. е. исследованию функции СВН при на-
личии мешающих параметров.
Неодинаково распределенные и зависимые прира-цепия куму-
лятивной суммы. Так как расчет функции СВН основан на идеях
последовательного анализа А. Вальда, рассмотрим, к чему при-
водит нарушение^ вышеуказанных условий при’; расчете М(п/0)
и Р_Ё (0/0). Следует' отметить, что общих теоретических резуль-
татов в настоящее время в этом направлении не получено. Поэтому
будем руководствоваться в основном эвристическими соображе-
ниями, следуя работам [76, 101, 127, 148, 120].
Вновь рассмотрим решающую функцию
gt = fet-i + Д£«)+, go = z > 0, А = inf{i : gt h}.
(4.4.1)
Предположим, что Vt ^>1, Д gt — независимые, но неодинако-
во распределенные случайные величины. Как показано в работе
[101], в этом случае вальдовские аппроксимации (4.2.4) величин
М (н/0) и Р_Е (0/0) для ПКОВ остаются верными, если единствен-
ный корень соо; (9) уравнения М {е м’«(е)^г) = 1 для t-го шага
ПКОВ г 1 существует и соог (0) -const, М(Ag;/0) = const. Од-
нако следует иметь в виду, что границы для М (n/Q) и P_g (0/0)
в этом случае рассчитать гораздо сложнее, так как yt -г-
из соотношения (4.3.19) зависят от распределения Д gn на шаге п,
где п = inf {I 1 : St ] — е, h [}. В этой ситуации необходи-
мо, например, в качестве у2 в формулах границ для Ьг (0) рассмат-
ривать у, = sup sup М O\gt — ф/Дй4 > 'Ф > 9> 0» чтобы по-
лучить гарантированное качество АКС. Если предположение о по-
стоянстве ®0. (9) нарушено, то при расчете Р_Е (0/0) в работе [101]
предлагается выбирать в качестве ®0(9) сРеДнсе
(0) = 1/2 [sup со0; (9) 4- inf ®о, (0)], (4.4.2)
i>l г>1
если оно существует.
76
Оценка среднего времени достижения границ получена в ра-
боте [127] для таких условий:
п = inf {t > 1 : StTt + Rt $ 1 - e; h [}, (4.4.3)
где «St = S-ri— сумма независимых одинаково распределен-
ных величин: М = 0, М (я?) = оу, a Tt и Rt — две последо-
вательности от случайных переменных xt, обладающие определен-
ными свойствами. Эти результаты могут быть полезны, если
решающую функцию АКС удается описать как многократно возоб-
новляемый ПКОВ в форме (4.4.3). Если М (Л g</9~) зависит от но-
мера шага t, то при оценке среднего времени ПКОВ может быть
использовано «усреднение» математических ожиданий (наряду
с (4.4.2)) таким образом, что М (Sn/Q) М (Sk/f)),k = [Л/(и/0)] —
целая часть от М (п/д). Для этого необходимо решить относи-
тельно к уравнение М (Sk/Q) » — е,Р~г (0/0) + к (1 — Р-е (0/0)).
Пусть теперь приращения кумулятивной суммы зависимы.
Это происходит в тех случаях, когда в число параметров, изменение
которых подлежит обнаружению, входят коэффициенты авторе-
грессии и скользящего среднего, если наблюдаемая последователь-
ность описывается моделью АРСС, и во многих других случаях.
Если ПКОВ применяется к зависимой последовательности
{xi} с плотностью совместного распределения со (.Д/0) на каждом
шаге I, то в работе [101] с эвристических позиций показано, что
аппроксимации (4.2.4) вновь сохраняют смысл при условии су-
ществования единственного корня соо. (0) уравнения М
/ Д gi-1, 0) - 1 и его постоянства SOj (0) = const, V; 1. Если
со0. (0) const, то эти приближенные результаты сохраняются.
Из работ этого направления следует выделить работу Р. М. Фа-
тарфуда [148]. Для марковской последовательности (и для мар-
ковской цепи) и кумулятивных сумм St — 5г-1 + A«Sf,
ДА( = xt или St = St-x + A«Sf, ДД =/ (xt, xtA) им установ-
лен аналог фундаментального тождества Вальда и указано, что
аппроксимации типа (4.2.4) могут быть применены, если при
t А- оо производящая функция моментов tpt (со) для St предста-
вима в виде
фс (ю) — с (со) (со),
(4.4.4)
где А (0) = 1, А (со) |ы=о>(^(“) 1<о=о)2- Тогда имеет место
тождество
М (е^А” (<о) d (®/тп)) = с (а) (4.4.5)
при действительных со : А (со) 1 и М (d (co/#»)) = с (®). При
этом у At сохраняется свойство производящей функции моментов
77
для случая независимой последовательности, т. е.
.И (/\ 6<) = (и) |<о=о# (4.4.6)
Несколько отличный внешне (но сходный по существу) под-
ход в случае зависимых приращений кумулятивной суммы разра-
батывался в различных аспектах в работах [76, 120, 155]. Суть
его заключается в аппроксимации частичных сумм St броунов-
ским движением с непрерывным временем. При этом в работах [76,
120] доказывается возможность применения функциональной цент-
ральной предельной теоремы (см. [7], теорема 21.1) для процессов
с ^-перемешиванием. Показано, что для моделей АРСС выпол-
няются условия применимости теоремы, т. е. суммы образуются
оо
из последовательности с <р перемешиванием, где 2 фУ2 <С °0- Однако
i=l
статистическое моделирование, проводившееся с целью проверки
этих положений, показало [120], что во многих случаях сходи-
мость результатов неудовлетворительная, поэтому такой подход
можно использовать с большой осторожностью.
В случае близких гипотез для I и II вариантов АКС результа-
ты, полученные при условии независимости приращений /\gt
(4.4.1), могут быть использованы при зависимых приращениях по
крайней мере в качестве грубых приближений. Это основывается
на следующих результатах для компонент вектора / эффективных
вкладов т?-связной марковской последовательности [31 ]:
{W)
Таким образом, при 0 = 60 приращения Ag, не коррелированы.
Если dim (6) = dim (с) = dim (f (ХЦ?)) 1 и вектор с имеет
все г компонент отличными от нуля, то приближенно можно счи-
тать распределение /\gt нормальным. В этом случае из некоррели-
рованности вытекает приближенная их независимость. В силу
свойств контигуальности переходной плотности <в (X(/X<Zp, 9)
при малых отклонениях ДО 0 — 0о: || Д0 |] -> 0 предположение
о приближенной независимости будет нарушаться постепенно, по
мере роста |) ДО ||. Все это дает основания для непосредственного
использования оценок (4.3.4)—(4.3.12) в случае близких гипотез
применительно к р-связной марковской последовательности.
Подведем итоги этого раздела. Перечисленные здесь эвристи-
ческие методы расчета характеристик АКС позволяют в каждом
конкретном случае посредством несложных изменений применить
формулы (4.2.6)—(4.2.10) или им подобные для приближенного
расчета Lz (0). Но во всех случаях доверять этим оценкам нуж-
но осторожно, постоянно проверяя их статистическим моделиро-
ванием.
Оценка чувствительности АКС к влиянию мешающих парамет-
ров. В условиях реальной работы АКС часто складывается ситуа-
ция, когда часть элементов вектора 0 не является параметрами,
78
изменение которых необходимо обнаруживать, но они (мешающие)
либо известны априори, либо изменяются в процессе эксплуатации
и оказывают влияние на характеристики АКС. В последователь-
ном анализе известно несколько подходов к решению задач с ме-
шающими параметрами. Идеальный вариант — это (в примене-
нии к задаче о разладке) синтез АКС, инвариантных относительно
изменения мешающих параметров. Однако такие ситуации весь-
ма редки, поэтому чаще всего приходится либо преобразовывать
последовательность наблюдений таким образом, чтобы новая по-
следовательность не зависела от мешающих параметров (подход
Д. Р. Кокса [90]), либо использовать метод весовых функций, раз-
витый А. Вальдом [11, 101], заключающийся в синтезе отношения
правдоподобия (3.2.1) путем интегрирования по множеству зна-
чений мешающих параметров. Примеры синтеза ПКОВ согласно
этим подходам рассмотрены в работах [101, 169]. Однако оба ме-
тода имеют следующие недостатки: даже в простейших случаях
происходит серьезное усложнение ПКОВ, а следовательно, и АКС;
если для АКС без мешающих параметров, удовлетворяющих тре-
бованиям разд. 2—3, можно оценить функцию СВН, то после при-
менения подходов Д. Р. Кокса или А. Вальда чаще всего это сде-
лать нельзя.
Помимо этих двух способов, можно использовать в явном виде
оценки максимального правдоподобия для мешающих парамет-
ров, .получаемые, например, рекуррентно, но и это не является
идеальным выходом, потому что таким способом можно устранить
незнание мешающих параметров только до момента разладки.
Поэтому предлагается следующий инженерный подход к ре-
шению задачи с мешающими параметрами. Сначала исследуем
аналитически или посредством статистического моделирования
чувствительность АКС к мешающим параметрам. Если функция
СВН существенно изменяется в худшую сторону, то на этапе на-
стройки алгоритма зададим такие «запасы» на изменение мешаю-
щих параметров, чтобы гарантировать приемлемое качество ра-
боты АКС.
Пусть 0г — r-мерный вектор, i = 1, 2, разбит на две части:
4 = || 6а, • • •, • • • 0ir II, где 9;1, . . ., eim—информа-
ционные параметры, изменение которых необходимо обнаружи-
вать, a Qj.mH, • • •, ®ir — мешающие параметры. Как и ранее, ис-
черпывающей характеристикой работы АКС является зависимость
Lz (6) СВН, которую обозначим Lz (0й, 0м), где0Г = || 0иТ : 0“т ||,
тогда Lz (0й, 0р) — расчетная зависимость СВН, получаемая при
расчетном значении 0“ мешающей части вектора 0. Отклонение
от расчетной зависимости обозначим
Д (0й, 0* 0$ = 4 (6П, 0^) - 4 (0й, е$, (4.4.8)
где 0ф — вектор фактических значений мешающих параметров.
Если величина || 0м — 0ф || невелика, о характере чувствитель-
79
ности функции Lz (0й, 0м) можно судить по производным
(0й, 0м)
~ 9Q.
г
9м=вм ’
р
i = т 4- 1, г.
(4.4.9)
Важны не только абсолютные величины А и аг, но и их знаки. Если
наблюдаемая последовательность находится в налаженном со-
стоянии, то ухудшение характеристик АКС происходит, если
А (б”, 0”, 0ф) > 0, и наоборот, если 0й = 02, то ухудшение — это
А (02, 0р, Оф) < 0.
Если выполнены требования разд. 2, то оценка зависимости
СВН для первых двух вариантов АКС имеет вид (4.2.10)
Lz (0й, 0м) = (1/М (Д gf/0й, 0м)) \h - z + - е-^Доо],
(4.4.10)
где «о = (до (0й, 0м).
Снова обратимся к случаю близких гипотез, но дополнительно
потребуем, чтобы || 0м — 0м || -> 0, т. е. отклонение мешающих па-
раметров тоже должны быть малыми, тогда можно значительно
упростить (4.4.10).
Вернемся к вектору 0, содержащему информационную и меша-
ющие части. На примере р-связной марковской последователь-
ности учтем влияние мешающих параметров следующим образом:
предполагая условия регулярности выполненными, будем рас-
сматривать разложение переходной плотности со (Xt/XtZp, 0)
в окрестности точки 0О и, подобно тому как это сделано ранее,
получим М (6м). Чтобы использовать оценку М (/\gf/Q),
искусственно расширим вектор с следующим образом: сТ =
= || с1; . . ., ст, 0, . . ., 0 || и получим
М (/\gt/0\ 0м) crFi (0О) (0 - 0О) =
= (0ои) Dm + r^Fx (0й, 6?) Dr.
0” - 0“ = T]iDm; 0м - 0“ = ц2Ог_т;
Dm = || dx • •., dm II = |] dm+1,.
II cm II = 11 Dm||2 + II Dr-m ||2 = 1,
(4.4.11)
где т]!, ц2 — скалярные параметры, Fi (00) — информационная
матрица (г X г) блочной структуры,
Fi (0О) =
Fx(0o) (Fx(0oH,6M)
FxT (0?, 0ОИ) | Fi (0ом)
Следовательно, в r-мерном параметрическом пространстве (вклю-
чающем информационные и мешающие параметры) вектор откло-
нений Д 0 = 0 — 00 можно рассматривать как сумму двух состав-
ляющих T|iDm и т]21)г_т, и в соответствии с этим величина
М (Л gt№, 6м) имеет два слагаемых. Для использования формул
80
(4.3.4)—(4.3.8) необходима оценка дисперсии D (/\gt) при
0 = 0О:
= (4.4.12)
Таким образом, для близких гипотез и наличия мешающих
параметров можно использовать результаты разд. 3. Перепишем
из соотношений (4.4.10)—(4.4.12) оценку Lz (0й, 0м) для случая
близких гипотез подобно (4.3.9):
Lo (T]i, т]2)б.г = + a~lb (е-шЬ~1 — 1)), (4.4.13}
где а = rpc^Fi (fl”) Dm + j. (0“, 0") Dr_m =£ 0,
b = c^F1(^)cm.
При a = 0 из (4.3.6) получим
Lo (0)б.г = /гУс^М) cm. (4.4.14)
Определяя в подпространстве мешающих параметров направле-
ние через Dr_m и величину ц = || 0м — 0“ ||, можно, используя
(4.4.13), оценивать величину отклонения фактической зависимо-
сти СВН от расчетной Л (0й, 0р, 0ф) из (4.4.8), считая, что 6“ =
= Ор, а 0м = 0ф. Легко видеть, что если блок матрицы Fx (0", 0“)
нулевой, т. е. Fi (0о) — блочно-диагональной структуры (ин-
формационная и мешающая части вектора f (Х/_р, 0О) некоррели-
рованы), то в условиях близких гипотез влияние мешающих па-
раметров отсутствует.
Выражение (4.4.13) и производные (4.4.9) даже в случае близ-
ких гипотез довольно громозки для качественного анализа, но
все значительно упрощается, если предположить, что до разладки
вектор 0м мешающих параметров не отклоняется от расчета:
0м = ()“. Такое предположение зачастую проходит на практике:
во-первых, потому, что можно периодически оценивать 0м и кор-
ректировать АКС, а во-вторых, если речь идет о технологических
приложениях, то 0м бывает известен из ГОСТов, технологических
карт и т. п. В этом случае качество АКС £(0) определяется из
(4.3.11):
g(0)=-W(0)6.r
<Fi(9o)Dm + <FH9o'eo)Dr-m
(4.4.15)
где || Dm |р 4- || Dr_m || 2 = 1.
Из (4.4.15) можно оценить, насколько изменится крутизна
функции СВН в точке 0о, если r-мерный вектор параметров (ин-
формационных и мешающих) отклоняется от номинала 00 в на-
правлении Dm в подпространстве информационных параметров
и в направлении Dr_m в пространстве мешающих параметров.
Если в тех же предположениях из (4.4.13) устранить h (используя
(4.4.14)), то, как и ранее в (4.3.7), получим, что зависимости СВН
81
(4 4ЛЗ) и I (0) (4.4.15) определяются аналогично (4.3.14) через
7 (Ст, "т»> иг-т)-
f (ст- ^!п> Dr-m) = (cmFx (0q) Dm -|-
+ CmFi (0?, 0*) Dr_w)/(c£F1 (0И)
Используя f (cm, Dm) из (4.3.14), получим
f (cm- Dm, Dr_m) — f (cm, Dm) =
= (<£Fx (0", 0”) D™)/^! (0ОИ) Cm)^ (4.4.16)
Выражение (4.4.16) гораздо проще для анализа, а так как £ (0)
(4.4.15) и Lo (y]1; т)2) (4.4.13) в случае отсутствия мешающих пара-
метров до разладки выражаются через / (cm, Dm, Dr_m), то это
позволяет провести исследование чувствительности АКС к мешаю-
щим параметрам через (4.4.16).
Завершая этот раздел, отметим, что чувствительность АКС
к появлению выбросов в наблюдаемой последовательности здесь
не рассматривалась. Следует ожидать, что особую трудность для
распределений с «тяжелыми хвостами» будет представлять учет
перескока при расчете функции СВН. Однако в остальном резуль-
таты, полученные в разд. 2—4, вполне применимы и в этом случае.
Глава 5
ПРИМЕНЕНИЕ АЛГОРИТМА
КУМУЛЯТИВНЫХ СУММ
ДЛЯ ОБНАРУЖЕНИЯ РАЗЛАДКИ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ АВТОРЕГРЕССИИ —
ПРОИНТЕГРИРОВАННОГО
СКОЛЬЗЯЩЕГО СРЕДНЕГО
1. Описание временных рядов
с помощью моделей АРПСС
Для большинства практических задач целесообразно конкре-
тизировать модели рядов наблюдений в виде n-мерных последова-
тельностей авторегрессии—проинтегрированного скользящего
среднего АРПССП (р, d, q), которые порождаются следующим
образом [1, 8, 67]:
р
Vdxt = Wf, wt = 3 + Ег -
i==l
- 3 ВгЕм + (Е - S Аг) Мщ, (5.1.1)
г=1 г=1
где V — оператор взятия разности (см. разд. 3 гл. 2), d — поря-
док разности, Е — единичная матрица размером (п х п), А{,
Вг — матрицы авторегрессии скользящего среднего размером
(n X n), р, q — порядки АР и СС частей, Mw — n-мерный вектор
средних, Е( — n-мерная независимая последовательность одина-
ково распределенных случайных векторов, М (Ег) = 0 (нулевой
вектор), М (EtE^) = Ее — ковариационная матрица независимой
последовательности.
Потребуем также выполнения условий стационарности и об-
ратимости моделей АРПСС:
det h (z) Ф 0, | z | < 1; det g (z) 0, | z | < 1,
h(z) = E-S A/; g(z) = E-W (5.1.2)
i=l i=l
где h (z) и g (z) — матричные полиномы. Для последовательностей
АРПСС под вектором параметров 0 будем понимать все множество
матричных (скалярных) коэффициентов модели (5.1.1), т. е.
6 О {Ai, . . ., Ар, В15 . . ., Вд, М\у, Ее}- В некоторых случаях
можно включать в вектор 0 и параметры плотности распределения
вероятностей порождающего случайного вектора Et.
Рассмотрим один из наиболее важных типов моделей (5.1.1) —
гауссовские последовательности АРПСС.
83
Одномерные последовательности АРПСС. Рассмотрим одно-
мерную последовательность АРПСС (р, d, q), задаваемую уравне-
нием (5.1.1)
v^wf,
(5.1.3)
где Ф1; . . Фр — коэффициенты авторегрессии, ф17 . . ., фд —
коэффициенты скользящего среднего, z-1 — оператор сдвига,
ег — независимая гауссовская последовательность, М (ег) = О,
М (е2) — Og, т — среднее.
Вектор параметров 0 в модели (5.1.3) может содержать коэф-
фициенты Фх, . . ., Фр, . .. ., фд, среднее т и дисперсию белого
шума ol. В дальнейшем понадобится функция правдоподобия
модели АРПСС {р, d, q), поэтому рассмотрим совместную плотность
распределения последовательностей АРСС (р, д) (ясно, что опера-
ция взятия разности или суммирования ничего нового не несет).
Итак, следуя [8], получим
(0 (жГ/Ф, т,аа) = (2nol)~N/2 det> (М-’ 9)) ехр ( - 1 ,
I 2зе J
(5.1.4)
__ __ N
У(Ф,Т,т) = 3 (8г)2, (5.1.5)
t —— со
et — М (₽г/Ф, Т, т, Xi),
(5.1.6)
где Фг = || Ф15 . . ., Фр ||; фт = || ф1; . . ., фд || — р- и д-мерные
векторы коэффициентов АР и СС частей, a® (Mjy ’ 9))-1 — ковариа-
ционная матрица наблюдений размером {N X Лг). Приведем
совместную плотность распределения чистой авторегрессии АРСС
(р, 0) из (2.3.8) и (2.3.9):
со (х± /Ф, т, ое) = (2лое)~Л72 det1/» (МрР’",) exp {— F (Ф, л/?)/2о®},
(5.1.7)
__ р р -ч
¥(Ф,т)=2 3 mijXiXj + (ег)2, (5.1.8)
i==l .7 =1 t=p-f-l
Мр₽>0) = II mij || = Гр = Toepl {/?0, ..., «р-11>
где Г2, — ковариационная матрица (р X р); 7?0, . . ., Ap-i — авто-
ковариации последовательности. При этом в (5.1.5) и (5.1.8)
вычисляются как условные математические ожидания (5.1.6):
1 — Фхг-1 — ... —
ft -------------------—у- (xt — т). (5.1.9)
1 - - . .. - 4qz 1 '
Из сравнения (5.1.5) и (5.1.8) видно, что при чистой модели авто-
84
регрессии вычисление «остатков» замкнуто в том смысле, что не
требует «прогнозирования назад», как в смешанной модели АРСС
(р, д'). Вместо этого при вычислении V (Ф, т) первые р точек рас-
считываются не по рекуррентному соотношению (5.1.9), а обра-
зуют новую квадратичную форму (первый член (5.1.8)). Ввиду
важности модели чистой авторегрессии приведем здесь простой
способ вычисления этой квадратичной формы, основанный на идее
[138]. Так как Гр из (5.1.8) — теплицева матрица, то Мрр’0) имеет
простой вид [138]: М'р’0) = SS^ - ТТ£,
где
Тогда квадратичная форма из (5.1.8) имеет вид
(Хр ~ Мр) м<,р-0) (Хр - Мр) = (ХР - Мр) (SSr— ТТ7) (Хр-Мр) =
р
= (X£S) (Xjsf - (ХРТ) (ХртТ)г= 3 - и?),
г=1
где Vр = || Vj., . . v.p ||, Up = || и^, . . Up ||, Хр Хр Мр,
vj = XrrS, Uj = х£т, ХТР =1] хъ . . ., хр||.
Таким образом, при вычислении первого члена в соотношении
(5.1.8) не требуется обращения матрицы Гр, а достаточно лишь
просто перемножений векторов и матриц.
В случае смешанной модели АРСС (Р, д) в (5.1.5) посредством
«прогнозирования назад» (согласно методике [8]) вычисляются
значения ё0, е_1з . . е_^-, но на практике приходится ограничивать-
ся таким конечным номером Q: | e_q| <( е*, после которого все e_f
пренебрежимо малы. Существуют точные методы вычисления функ-
ции правдоподобия модели АРСС (р, д), которые не требуют про-
гнозов назад [135]. Для практической реализации АКС (во вся-
ком случае, для модели I разладки) нет необходимости в вычисле-
нии прогнозов назад. Для начала рекуррентного счета вперед по
формуле (5.1.9) достаточно лишь принять удобные начальные ус-
ловия, так как в силу условий (5.1.2) процесс расчета обычно
быстро сходится.
Многомерные последовательности АРПСС. Рассмотрим «-мер-
ную гауссовскую последовательность АРССП (р, с/):
Р Q Р
х, = S А;Х(_; + Et - 3 В.Ем + (Е - 3 Аг) Мх, (5.1.10)
г=1 i=l i=l
где X7 = || х(1, . . ., xtn ||, Et — «-мерная независимая последова-
85
тельность гауссовских векторов, М (ЕЛ =0, М (Е*Е?) = Ее,
О — вектор, состоящий из нулей. Важный частный случай модели
(5.1.10) — модель чистой авторегрессии
р , р
4* (Е — 2J М) Мх Et (5.1.11)
4=1 t—I
имеет совместную плотность распределения [1, 671
® (X^/At,... Ар, Мх, SE) = (в (Xf/Ai,..., Ар, Мх, SE) X
X® (Хр+1/Аъ ..Ар, Мх, SB, Xf).
Подобно одномерной модели авторегрессии первые р векторов Х^
имеют совместную плотность распределения (если рассматривать-
{Xf} как вектор Хр, составленный из векторов Xj, . . ., Хр)
{Xf}«=> Xj = || «ц, . . х1п, . . ., жР1, . . ., хрп II] гауссовского-
рп-мерного закона [8]:
со (Xf/Aj,..., Ар, Мх, SB) == 2л-р«/2 (det х
X ехр | (Хр — Мр)г Крг (Хр — Мр)} , (5.1.12)
где Кр = М (XpXj)—ковариационная матрица размером
{пр х пр). Ясно, что Кр — функция Aj, . . ., Ар, Ев, а Мр —
растянутый (подобно Хр) вектор средних. При заданных векторах
Xi, . . ., Хр последовательности Ер+1, . . ., Ел- и Хр+1, . . ., Хуу
связаны преобразованием с единичным якобианом, и поэтому
ш(Х£ i/Аь ..., Ар, Мх, Sx, Xf) == 2л-<^р)«/« х
JV
x(detS£)-(»-₽)/2exp{—У, EfS^Ej} . (5.1.13)
i=p+l
При вычислении функции правдоподобия в (5.1.13) вектор Ег
рассчитывается (как и в одномерном случае) по рекуррентной
формуле
_ р р
Ег = Хг - 3 AiXj-j - (Е - 21 Aj) Мх- (5.1.14)
i=l 1=1 :
Смешанная модель APCCn(p, д), как и ее одномерная версия
(5.1.3), требует для вычисления функции правдоподобия наличия
прогнозов назад, т. е. Ео, Е_1; . . ., E_q.' Совместная плотность
распределения {Xf} имеет вид
® (Xiv/A1(..., Ар, Въ .. .,’Bq, Мх, Sk) = 2n~K^CN х
X(det SE)-*/*exp {—, (5.1.15)
г==—с»
р q Р
Ez = Xd- 21 АгХе_И- 2) В4Ёг_г-(Е- 2) А;) Мх, (5.1.16)
1=1 2=1 2=1 ..
86
где Cjv — функция Аь . . Ар, Въ . . Bg, которая сходится
с ростом N к постоянному значению, и ее учет обычно имеет
смысл только при малых N.
В задаче о разладке для модели I (см. разд. 1 гл. 3), однако, не
требуется использования безусловной функции правдоподобия
общей модели АРПСС. Как отмечалось ранее, если предположить,
что известны начальные условия Хо, . . ., Xj-p и Ео, . . ., E^q,
то можно существенно упростить задачу. С практической точки
зрения это допущение не вызывает возражений по той причине,
что запуску АКС всегда может предшествовать режим «списыва-
ния ошибок» (в силу (5.1.2)), связанных с выбором начальных
условий. Тогда логарифм условного правдоподобия имеет вид
{8, 67]
InZ (0/ХГ) = In® (Xf/Аг,..., Ар, В1;..., В„ Мх, SE, Х?_Р,Ё“_?) =
N
= --^-1п2л- In det 2,-4-V (5.1.17)
it it it
i=l
так как при фиксированных {Х$_р} и {Е?_9} плотность в (5.1.17)
совпадает с совместной плотностью распределения {Е^}. Такой
подход будет принят в основном в этой главе, так как в следующих
разделах внимание будет сконцентрировано на модели I разладки.
Связано это с тем, что в большинстве практических задач прихо-
дится иметь дело с наблюдениями {Xf}, которые являются выхо-
дом некоторой динамической системы, возбуждаемой «белым шу-
мом». Поэтому задаче обнаружения изменения состояния такой
системы (т. е. изменения матричных коэффициентов А,, В(-, Mv,
Ее) более адекватна модель I разладки из разд. 1 гл. 3.
2. Применение АКС
для одномерных моделей АРПСС
Рассмотрим обнаружение разладки, когда изменяется только
среднее т, а остальные параметры либо точно известны, либо
являются мешающими.
Обнаружение изменения среднего. Рассмотрим I вариант АКС.
Логарифм отношения правдоподобия выражается через лога-
рифмическую функцию правдоподобия для последовательности
АРСС (р, 7):
t
=IЕ(ё? (mi) ~м] * (5,2Л)
е t=—оо
где wij, т2 — значения среднего т до и после разладки. Прира-
щение решающей функции в этом случае
A St = -Л- $ И1) - ("М] = (АфА), (5.2.2)
87
, р / Q
k==(m2 — mi) (1— S Фг) /a|(l— S Фг) ;
i=l i=i
P q
(m) = [(1 - S ф*2-г) / (1 ~ ,g Ф,Й] (xt - m).
Для начала рекуррентного счета по формуле (5.2.2) удобно за на-
чальные условия х0, . . Xi-р (если нет возможности сначала нако-
пить «хвост» в р точек, а затем начать расчет Л gt в АКС) принять
х_ = т-г, значения ё0, . . ё]_9 взять равными (Д [431: ё_^ =
= - kol/2.
Из (5.2.2) легко видеть, что такой выбор соответствует началу
расчета без «скачка» решающей функции gt, так как за хУ и
выбраны их математические ожидания при отсутствии разладки.
Для II варианта АКС из экспоненциальной структуры плот-
ности со (xilm) следует, что он эквивалентен первому. Выбор
«пограничного значения» между областью нормы и разладки оче-
виден из (5.2.2): т0 = Д 4- т2)/2. Таким образом, Л gt для
II варианта АКС
Р Q
Agt = [(1 - 3 ФсН (1-2 Фг)] it Ы (5.2.3)
2=1 2=1
при условии, что разладка заключается в превышении значе-
ния гп0.
Напомним, что для I и II вариантов АКС — решающая функ-
ция и правило остановки выглядит следующим образом:
gt = (gt-1 + Д gt)+, g0 = 0, ta = inf {t- gt > h}, (5.2.4)
где рассчитывается из (5.2.2) или (5.2.3).
Третий вариант АКС применять для одномерной последователь-
ности АРСС (р, q) и разладки «по среднему» не имеет смысла. Если
т может изменяться в обе стороны от т0, то целесообразно вы-
числять на каждом шаге два отдельных АКС (5.2.4) Для обнару-
жения отклонения т от т0 в сторону уменьшения приращение
Agi вычисляется по (5.2.3), но с обратным знаком. Если необхо-
димо заложить некоторую зону нечувствительности вокруг
то : mQ 4- А т, то Д g((+) вычисляется из (5.2.3) через ё", (ш0 +
+ Дт), а Д^((_) через — (т0 — Дт).
Рассмотрим обнаружение разладки, когда среднее последова-
тельности с момента t0 скачком стало равным т2. Из-за того что
последовательность АРСС имеет последействие, среднее значение
Д#<> как следует из (5.2.2) и (5.2.3), изменяется не мгновенно
в момент t0, а будет иметь место переходный процесс изменения
среднего /\gt. В том случае, если в модели АРСС (р, q) q = О'
(чистая авторегрессия), переходный процесс имеет длину р точек.
Из соотношения (5.2.2) получим [43]
р
, («1., — ™1)2 [ 4 _ V
М (Д gf/m = m2) =----—2 2
8 г=
р Р
~ ' Ф„
(т->
(5.2.5)
. u п _ 1 I = t - t0. Лишь после того, как
пройдет^р точек последовательности, переходный процесс закон-
чится и М (/^gtlm2) станет постоянным и равным
р
М (Д gt/m = m2) = ((Шг — mi)2/2°e) (1“ .S ф0 ’
(5.2.7)
to + 1-
М (Д St!m == т2)=
(5.2.6)
Проиллюстрируем это положение иа приморо кооледо.ательиости
авторегрессии первого порядка АРСС (1, )•
м (A gt/™ = mj) = -(1 Ф1) 32
м (Д gtJm = т2) = -^7^2 (1'1 — ф1
— mi)2
2(1 + ®i)
в случае смешанной модели АРСС (р, ?)пе^еход!шй процесс и№ет
бесконечную длину, однако в Реа™ь й модели АРСС
характеристических полиномов АР и U » д процеСс
не лежат близко к единичноиокру чт0 приращения
быстро прекращается. Из (5.2.2) и(5.2.^видн^ коэф^циентов
сс”?. Оценим математическое ожидание и дисперсию
из (5.2.2) без учета переходного процесса.
М(Д£еМ) = р „
= (Ш2 _ mi) (2m — mi + т2) (1 — 3 ф{) / (2<7е ~ ’
(5.2.8)
(5.2.9)
£»(Дг») = (rn2 — rn3)2 (1
Так как Д8, раскрав нормально “
Г ’Ж) « —
89
88
запаздывания в обнаружении разладки
2о| (1 — ^)2
Lz (т2) =----------------------(e~!l — e~z + h — z)
(тг — m^2 (1 —
i=l
и оценку среднего времени до ложной тревоги
25e(!-i^)2
Lz (mt) =-----------l-=~-------(eh ~ez~h-]- z).
21 Фг)2
1=1
Оценим СВН в точке т0. Из (4.2.10) и (5.2.9)
9
О2 (Л2 — Z2) (1- 2j 'Ф Г
1 _ "И + т г\__ i=i
Ьг\тп0------g---J-------------------------.
(тг — mJ2 (1 — У ф/)2
(5.2.10)
(5.2.11)
(5.2.12)
Любая другая точка кривой СВН может быть получена при под-
становке (5.2.8) и (5.2.9) в выражение для и0 (т) и в (4.2.9). Так
как первые два варианта АКС эквивалентны в рассматриваемом
случае, то сразу перейдем к зависимости Lo (R) из (4.3.7), но в от-
личие от (4.3.7) при нормальном распределении не требуется
близости гипотез:
2/?£У2 (0) + е 2ЙЬ()/ (0) — 1
Lo (7?) =--------° 2 -8-----------.
<? Гр
h2 (1 — У г|);)2 с2 (т — т0) (1 — У Ф/)
(0) = ——--------------------------------------------—1=1
1=1 1=1
(5.2.13)
где А2, как и в (4.3.7), играет роль отношения сигнал/шум. Подоб-
но (4.3.11) получим крутизну зависимости СВН в точке т0. Из
(4.3.9) — (4.3.12) в одномерном случае имеем
g(0) = _Az;'w,/2.
Р <1
I = D(Agt) = (i-^ Фг)2/ (1 - s ф{)2, (5.2.14)
i=l ' i=l
где D (Agt) ~ дисперсия приращения (5.2.3).
Из соотношений (5.2.13) — (5.2.14) легко видеть влияние ав-
токорреляции на оценку функции СВН. Зафиксируем некоторое
значение Lo (0) в (5.2.13), тогда среднее время запаздывания в об-
ft)
ааРужении разладки Lo (R )> 0) будет уменьшаться с ростом R2.
Для простейшей модели АРСС (1, 0) R2 = (т — тп0)2(1 — Фх)/
/ст* (1 Ц- Фх). Если (т — пг0)/ох = const и Фх -> 1, то R2 ->• 0
и, следовательно, Lo (R) ->• £0 (0) и Zo (-R) -> Lo (О'), т. е. про-
цедура обнаружения теряет всякий смысл. Наоборот, при Фх ->
->—1, _й2->-оо, следовательно, Lo (R) 0, a Lo (—R) -+ оо,
т. е. происходит безошибочное обнаружение.
После того как получены соотношения (5.2.10) — (5.2.13),
не представляет трудностей вычисления оценки функции СВН
для двустороннего АКС, обнаруживающего отклонения от т0
в обе стороны. Для независимых последовательностей этот случай
рассмотрен в разд. 2 гл. 2. Здесь необходимо применить ту же
формулу связи функции СВН дву и односторонних АКС [168]:
где вокруг т0 назначена зона нечувствительности; mQ — А
А т А т0 + А т<-+'>. Это позволяет, используя (5.2.10) —
(5.2.13), вычислять (т) для моделей АРСС (р, q). В простей-
шем случае, когда Дш<+) = Дт<"> = 0, £<0±) (т) оценивается со-
гласно (2.2.16), при этом т и ст2 заменяются на М (/\gtlm) (5.2.8)
и D (A g/) (5.2.9) соответственно.
Выражения (5.2.10) — (5.2.14) были получены в предположе-
нии, что переходный процесс (5.2.5) —(5.2.7) отсутствует. Таким
образом, в случае изменения среднего скачком к ошибкам пере-
скока добавляется еще неуточненное влияние переходного про-
цесса. Однако, как будет сейчас показано, для практических рас-
четов оценки (5.2.10) — (5.2.14) вполне пригодны.
Пример 1. Оценим ошибки перескока и влияния переход-
ного процесса для последовательности АРСС (1, 0). Пусть (в) —
функция СВН, определенная ранее
без учета переходного процесса,
a Lzp(6) — с учетом для модели
авторегрессии р~го порядка. Рас-
смотрим положение решающей
функции (5.2.4) для модели АРСС
(1, 0) на 'первом шаге при усло-
вии, что ~ z. Введем проме-
жуточную переменную = Agi +
+ г, тогда возможны три исхода:
Si A h, т. е. наблюдение закон-
чено за один шаг (т = 1),0 <
<Z8i<(h—наблюдение продолжа-
ется (т > 1) и 5х 0 — наблю-
дение продолжается (т А 1), но
АКС начался вновь из нуля, так
как gt = (5t 0)+ = 0 (см. рИС.
40). Обозначим {вероятности этих
Рис. 20. Поведение решающей
функции в случае последователь-
ности АРСС (1, 0)
91
исходов следующим образом: Р gt h); Р Q < q± < h)
и Р (qt = 0). Тогда для Lzl(0) получим очевидное соотношение
Lzl (0) = Р (gt > h) + Р (0 < gl < h) +
+ P (gt = O)(Lo (0) + 1), (5.2.15)
h h
где 1л = 1 + / (и) du) 1 Lu (0) / (и) du) , f (и) —
0 0
плотность распределения glt
Так как
h
Р (° < gt < h) = $ / (u) du,
0
то, выполняя преобразования, получим
h
Lzl(6) = P(gl>A)4-P(0<gl</i) + $Lu(e) du +
0
+ P (gt = 0) (Lo (0) + 1) = P (gt > 0) 4-
h
+ $ Lu (9) f (u) du 4- (1 - P (gt > 0)) (Lo (0) 4-1). (5.2.16)
о
Введем следующие обозначения: pij = M (A g./zn), ц2 ==
= M (/\,gthn, t~^2)n cr2 =D (/\gt). Без потери общности выберем
Lot (т) (понятно, что задание z 7> 0 изменяет только / (и) в соот-
ношении (5.2.15)). Подставим в (5.2.16) аппроксимацию для Lz (т)
с учетом (5.2.7) и (5.2.9) и получим
f . . . , Ф(— Hj/c;)(/i + e-M"(m’z7wo(m)-l/Wo(zn))
Л01 (т) — 1 -j--------------------------------------г *!>
Hi
Л
It= (1/Цг) § (h—гЦ-е^^/соо (m) — /СОо f ^z. (5.2.17)
о
Выполняя интегрирование It = Цг1 (Лх + ^12 + Лз), получим
Zn = (h -f- е-а,»<т)Л/й)0 (m)) Ф ((z — p.i)/o) |£,
h
/12 = — ^ zf (z) dz = Оф ((z — Ц1)/о) I о — Н1Ф ((z — Hi)/o) |o.
0
k
113= ~ 5 (e-^^/tHo (m)) / (z) dz ~ — (l/coo (m)) X
О
x exP [((p-x — 2p2)2 — |4)/2a2] Ф ((Z — Ji! + 2p,2)/cr) ,
где
X
Ф (x) = ф («) dx, ф (x) = e-x2n t
J у 2л,
92
Таким образом, приближенная оценка LOi (иг) (5.2.17) учиты-
вает влияние переходного процесса для модели АРСС (1, 0), но
сохраняет погрешности, связанные с ошибками перескока. По-
этому представляет интерес получение верхней границы Loi (иг Д
4> т0), которая учитывает оба фактора, приводящие к ошибкам
аппроксимации. Используем выражение для Lz (0 : М (,^\gt/^) >
> 0) из (4.2.14) с некоторыми упрощениями, т. е. отбросим первый
член в (4.2.14):
h
Loi (т ш0) < 1 4- Lu (иг > т0) / (г/.) du 4- (1 — Р (gi > 0)) х
о
h
XLO (иг > иг0) ~ 1 4- р.21 [ § (h — 2 + У (т)) f (z) dz -4
О
+ (l-P(gi>0))(L + v(m))] = l + ^^ф(±=±1_)£ +
+ (h + т (т)). (5.2.18)
Г2 Н2
В гауссовском случае у (иг) имеет вид (см. пример 3, гл. 4)
у (иг) — пер (р.2 (иг)/о)/Ф (р2 (иг)/о) + р2 (иг). (5.2.19)
Подставляя (5.2.19) в (5.2.18) и выполняя очевидные преобразо-
вания, получим
1„|„>,.).1+А±Жф(ЬЬ) +
+ _J_ (ач> (iLzUj-J _ , (5.2.20)
Итак, для модели АРСС (1, 0) влияние переходного процесса
в сторону увеличения среднего времени запаздывания при обна-
ружении разладки происходит, как следует из (5.2.7) и (5.2.20),
при Фх <4 0. Общее время обнаружения при Фх 0 уменьшается,
но относительное замедляющее влияние переходного процесса рас-
тет, потому что (для I варианта АКС) из (5.2.7) рх = М (Д gjm^ =
(т2 — mx)2/2o„; р2 = (иг2 — Шх)2(1 — Фх)/2ох (1 + Фг)-
Таким образом, р.х не зависит от Фх, а р,2 Д рх Д 0 при
Фх Д 0. Разность р2 — рх определяет замедляющее влияние
переходного процесса, что учитывается интегрированием в
(5.2.17) и (5.2.20). При Фх-> —1 эффект замедления максималь-
ный. Напротив, при Фх > 0 разность Цх — Иг Д 0> следовательно,
переходный процесс в среднем ускоряет обнаружение разладки,
максимальное ускорение достигается при Фх -> 1. Анализ (5.2.20)
показывает, что переходный процесс не является фактором, зна-
чительно задерживающим обнаружение разладки. Аналогично
Для процесса авторегрессии р-го порядка можно грубо считать
максимальное увеличение среднего времени запаздывания т (иг)
равным р дискретам при любом выборе коэффициентов авторегрес-
98
сии в пределах зоны устойчивости. Переходный процесс присут-
ствует не только при обнаружении изменения среднего. Если об-
наруживается изменение дисперсии или коэффициентов АР и СС
частей, то переходный процесс также имеет место. Точно оценить
его влияние в этих случаях в вычислительном отношении гораздо
сложнее, хотя принципиально ничего нового по сравнению
с рассмотренным примером там нет.
В заключение этого раздела рассмотрим на двух примерах,
как влияет учет априорной информации о параметре переходной
плотности после разладки на быстроту ее обнаружения. Хотя
в этих примерах разладка заключается в изменении среднего т
гауссовской последовательности АРСС, полученные качественные
выводы применимы и для более сложных задач. Использование
т как параметра разладки позволяет выполнить расчеты нагляд-
но, не прибегая к численным методам.
Пример 2. Пусть среднее т скачком изменяется от — т
до т. Даны два АКС: I вариант (5.2.2), (5.2.4) всегда настроен
точно на т1 = — т и т2 = т, во II варианте (5.2.3), (5.2.4) точно
известно т0 = — т, а величина скачка (т. е. т2) неизвестна. Ос-
тальные параметры модели (5.1.3) известны. Будем выбирать по-
роги для I варианта и h2 для II варианта так, чтобы приближен-
ная оценка функции СВН Lo (т) I варианта АКС Li (т) и II ва-
рианта Ln (m) удовлетворяли требованию (— т) = £ц (—т)
равенства средних времен до ложной тревоги. Понятно, что в силу
вышеуказанной эквивалентности (5.2.2) и (5.2.3) речь идет о двух
методах настройки алгоритма. Сравним две эти настройки, при-
нимая в качестве критерия отношение р, = 7>ц (т)/7ц (ш) при ус-
ловии
(_ т) = £п (- т) = Т. (5.2.21)
Тогда из (5.2.13)
Zi (+ R) = (+ 2RL¥ (0) + 2(0) - 1)/(27?2),
£п (27?) = (47?l7i! (0) + - 1)/(87?2),
/? = «(!- 3 Ф4)/(ае(1- S 4>i))>°-
i=l ' г=1
Ясно, что для I и II вариантов АКС имеют место соотношения
Li (тп) = Ьг (7?); Li (— = — R) — T,
Ln (m) ~ £ii (23?); Ln (— m) = Ln (0) =j7’.
Поэтому получим для отношения ц следующее выражение:
у. = ^RTl,t + e-*R?h - 1)/(4 (27?£j/2 (0) + - 1)).
94
(5.2.22)
Рис. 21. Сравнительная эффективность двух вариантов АКС
Учитывая, что функция а : а — 2RLi‘ (0) 0, 7?_и Т связаны
между собой через уравнение еа — а — 1 = 2R2T, перепишем
ц (/?), выражая R через а:
р.(а) = (2 /2 / — а — 1 + _ 1)/(4(g-а + а_1)).
Рассмотрим два предельных случая: «малый скачок» (т -> 0)
и «большой скачок» (т -> оо):
1. Пусть т ->• 0, тогда R 0 и через уравнение связи перехо-
дим к а —» 0: ц (а) — (1 + «/3 + 0 (а))/(1 — а/3 + 0 (а)), т. е.
а-Н)
lim р, (т) = 1. Причем производная Ца около нуля неотрица-
7П-*0
те льна.
2. Пусть m —> оо, тогда R -> оо и а-» оо, Из (5.2,23) легко
видеть, что lim 11 (т) — lim ц (а) = оо.
П1-.ОС а->°°
Полученные результаты позволяют сделать вывод о том, что
априорная информация о значении in после разладки важна в
случае «большого скачка», а при m 0 оба варианта настройки
близки по качеству. В этом и есть проявление локальной опти-
мальности II варианта АКС (этот пример иллюстрируется
рис. 21, а).
Как видно из первого примера, «локальная» настройка АКС
проигрывает в сравнении с точной настройкой АКС и лишь при
т 0 обе настройки эквивалентны. Покажем, что может быть
и обратная ситуация, когда второй вариант настройки оказывает-
ся более эффективным.
Пример 3. Пусть вновь даны два варианта АКС, настроен
ные в соответствии с примером 2. Рассмотрим сразу величину R
(ясно, что R и т связаны однозначно). В отличие от примера 2
истинное значение R после разладки теперь установим: R =
= —R + А, т. е. вместо расчетного скачка от —R до R будет, сде-
лано изменение от —R до —R + А (по условию примера^2 : А —
= 2R). Теперь нас будет интересовать поведение АКС при А -> 0.
95
Для этого рассмотрим крутизну зависимостей Лт (7?) и £ц (И)
в точках, где Ц (—В) = Lu (0) — Т. Для II варианта АКС из
(5.2.13) получим
(Л) о —
^(О) = -^й=о=-4гл. (5.2.24)
Заметим, что (0) не зависит от В. В свою очередь, дифферен-
цируя Ц (7?), получим
(В) = дЦ (В)/дВ = (- ВЦ (0) - BL^2 (0) _
- е"2д£1 '<°1 д 1)/7?3.
Рассмотрим (—В) и, учитывая, что а = 2В1Д (0) и В
•связаны, перейдем к ос:
Si (-•Я) О gi (а), а = / (Я),
h (а) = (2е“ - ае“ - а - 2)/(2 ((е“ - а - 1)/2ВД. (5.2.25)
После того как получены оценки <h (—К), £ц (0) для обоих
вариантов АКС, мы в состоянии оценивать их работу по крутизне
функции СВН вблизи значения А — 0. Вновь рассмотрим два пре-
дельных случая: «малый скачок» (К -> 0) и «большой скачок»
(В -> оо):
1) пусть В —> 0, тогда ос -> 0 и по правилу Лопиталя получим
Ит|1(-Й) = -2/3Г/2; (5.2.26)
й-»о
2) пусть В —> оо, тогда а -> оо и легко установить из соотно-
шения (5.2.25)
lim 1г(-Й) = 0. (5.2.27)
«-.ос
Сравним поведение обоих вариантов АКС в окрестности А = 0
на основании оценок (5.2.24), (5.2.26) и (5.2.27). Во-первых, I ва-
риант АКС имеет в окрестности точки А = 0 более пологую зави-
симость СВН от А (см. рис. 21, б)), чем II вариант. Причем, если
расчетная величина скачка В -> 0, то тангенс угла наклона ка-
сательной Ц (—В) стремится к постоянной величине —
из (5.2.24), т. е. при В ->• 0 I вариант АКС приближается к «ло-
кально оптимальному». Тем не менее VB Ц 0 ЗА = ]0; А (7?)]
и если А ре А, то II вариант АКС эффективнее I варианта. Конеч-
но, при А А это не так (см. рис. 21, б)). Во-вторых, при увели-
чении В «зона» А большой эффективности II варианта АКС будет
расти.
Конечно, для сравнения двух вариантов АКС использовались
приближенные оценки СВН, не учитывающие влияния переход-
96
ного процесса и ошибок перескока. Тем не менее два разобранных
примера позволяют сделать следующие качественные выводы:
использование априорной информации о значении параметра
плотности 0 после разладки приносит тем больший эффект, чем
большее изменение обнаруживается;
если величина изменения параметра задана точно, то лучшее
качество обеспечивает первый вариант АКС, использующий эту
величину, однако такой алгоритм существенно проигрывает вто-
рому варианту, если величина изменения, вопреки расчету, мала;
если значение параметра переходной плотности известно пло-
хо, лучше применять второй вариант АКС, который имеет преиму-
щество перед первым в наиболее трудных ситуациях «локальных
разладок».
Обнаружение изменения дисперсии белого шума и коэффи-
циентов АР и СС частей. Кроме обнаружения изменения среднего
для последовательностей АРПСС большой практический интерес
представляет обнаружение изменения дисперсии о? от о? до о2
в модели (5.1.3). Как в случае обнаружения изменения среднего,
приращения Agt для первых двух вариантов АКС образуют неза-
висимую последовательность. В самом деле, из (5.1.4) — (5.1.9)
получим, что логарифм отношения правдоподобия для модели
АРСС (р, q) имеет вид
2 ‘
<5-2-28)
2 1 * |==—00
При этом остальные параметры модели (5.1.3) считаются из-
вестными точно. С учетом сказанного ранее о начальных условиях
приращение Agt I варианта АКС имеет вид
A gt — — 1п + -у f -----------j-'j (иг). (5.2.29)
Из (5.2.29) видно, что величины Agf являются функциями только
от et, определенных ранее в (5.1.9) и (5.2.2), поэтому Agt незави-
симы. Приращение для II варианта АКС получается из (5.1.4)
дифференцированием по <УЕ при о8 — <т0:
Agt = (1/о0) (et (т)/оо — 1). (5.2.30)
Из сравнения (5.2.29) и (5.2.30) легко видеть, что они эквивалент-
ны с точностью до постоянного множителя, если выбрать в качест-
ве о0:
Оо = (In о? - 1П о*) /(-± _ J_y (5.2.31)
Правило вычисления решающей функции gt и правило остановки
сохраняются прежние — (5.2.4).
Функция СВН для случая обнаружения изменения дисперсии
о8 вычисляется согласно (4.2.6). При 0 — 0Х и 0 = 62 уравнение
4 И. В. Никифоров 97
М = 1 решается независимо от распределения Agf так,
что ®0 (0J = — 1, а соо (02) = 1. Из (5.2.29) получим: M (Agf/o?) =
= (—1/2) (Oi/ff| —1+2 In^/oJ),
М (Ag(/o|) = (1/2)(о|/а? _ 1 _ 2 In ((Т,/^)),
а затем с учетом этих результатов выведем оценку для среднего
времени до ложной тревоги
Lo (о?) =——-----------------(eh - h — 1) (5.2.32)
-1 + 2 In (sa/31) V K ’
и среднего времени запаздывания в обнаружении разладки
U (<r|) =—п-----------------(e"h + h~l). (5.2.33)
<з«/а« — 1 — 2 In (з2/ах) к v '
В заключение определим оценку Lo (п0 : М (>/og) = 0), где
0О определяется из (5.2.31). Из (5.2.29) вычислим
М (Ag?/o«) = (1/4) (i/al - 1/и®) In (о?/^).
Подставим последнее выражение в (4.2.7) и получим оценку
Ьй (о?) = 2й2/ ((In 01 — In 0s) f 4-тЛ •
' \ \ «2 б1 / 1
Обратим внимание на одну особенность обнаружения разладки
по а|: аппроксимация функции СВН Lo (о|) не зависит от коэф-
фициентов АР и СС частей модели (5.1.3). Этот факт указывает
на теоретическую возможность обнаруживать разладку как угод-
но быстро, если частота дискретизации по времени наблюдаемого
непрерывного процесса может неограниченно увеличиваться, но
практически это невозможно из-за потери устойчивости вычисле-
ния в (5.2.29), (5.2.30).
Двусторонний АКС, обнаруживающий и уменьшение и увели-
чение дисперсии Og от номинала По, конструируется подобно ал-
горитму для обнаружения отклонения среднего т в обе стороны.
Для практических применений нам более интересно включить
в вектор параметров 0 не только 0^, но и коэффициенты АР и СС
частей. Это связано с тем, что во многих прикладных задачах наи-
большая информация о наблюдаемом процессе сосредоточена в
спектре сигнала. Впервые задача использования I варианта АКС
в этой ситуации рассматривалась в [38] для модели АРСС (1, 0).
Рассмотрим логарифм отношения правдоподобия для моде-
ли АРСС (5.1.3) в предположении, что вектор параметров 0Т =
= || Фп . . ., Фр, Tj,. . ., Тд, т, Ое ||. Из (5.1.4) получим
4 4 2
5! я <«> - й Xs* <’>+т|+1п т •
= det (М|р> ”(/)), М^в)(/) = /(Ф^,Т;), j = l,2, (5.2.34)
98
где ёг (Qj) рассчитывается по формуле (5.1.9) для вектора парамет-
ров модели (5.1.3) 0 = 0j и О = 02. Последний член в (5.2.34), равно
как и выбор начальных условий при расчете st с ростом t теряет
значение в силу условий стационарности (5.1.2). Дело в том, что
det М;р,ч) сходится к постоянному значению при t-+ оо. Кроме
того, если, как и ранее, считать известными начальные условия
х0, . . ., Хх-р и 80, . . ., er_g, то вместо 5^ можно использовать от-
ношение условного правдоподобия из (5.1.17), тогда для I вариан-
та АКС приращение решающей функции имеет вид
Дё/(Oi) —et2(02) + -i-ln—(5.2.35)
Для начала рекуррентного счета st (Q}) необходимо сделать сле-
дующее: в соответствии с методикой «прогнозирования назад»
вычислить необходимые значения х0, . . ., Хх-Р и е0, . . ., ej_q
или (это проще) положить все начальные значения 8f нулевыми,
a xt равными и начать с них расчет по формуле (5.1.9), но это
приведет к появлению затухающего переходного процесса. От-
метим, что приращение Agt (5.2.35) идентично (при о2 = о2) эле-
менту кумулятивной суммы, которая введена в [76].
Второй вариант АКС получается из (3.3.5) дифференцирова-
нием приращения логарифмической функции правдоподобия
(5.1.4) — (5.1.6). Для дальнейшего рассмотрения ограничимся
моделью чистой авторегрессии, поэтому 0г = || пЕ, Фъ . . ., Фр ||.
Из (3.3.2), (3.3.6) и (5.1.7) получим при т = О
д In И(г(/Д_р’ ®)
(5.2.36)
(5.2.37)
где 0О = || or0j . •, Ф° || — «пограничное»значение вектора 9,
сТ == II св • • •, ср+х || — вектор направления.
Теперь в отличие от случаев, рассмотренных ранее, эквивалент-
ности между первыми двумя вариантами АКС нет. Но если дис-
персия а2 не изменяется, то плотность со (rrf/Ф, 0, о£) (5.1.7)
сохраняет свойство монотонности отношения правдоподобия для
99
4*
некоторой функции от наблюдений. Более того, Ag; для первых
двух вариантов АКС почти одинаковы, если дисперсия меняется
слабо. Покажем это, применив другую параметризацию модели
авторегрессии в (5.1.7):
= р2=-Ф1/8Е,..., ₽р+1 =-
Тогда из (5.2.35) для I варианта АКС получим
.р+1 /й2 I й1\\ /Р+1 \ В2
Agt= ( 3 ж*-й-1(-2-~—-))( 3 xt-i+i(Pi—Pi)) (5.2.38)
\ i=i \ 2 / / \ i=i / p*
а для II варианта
P+1 p+i
Agt^EME^J + p (5-2.39)
L-i—1 i
где параметры образуют новый вектор Of = || pi, • • •, P₽+i II •
Сравнивая (5.2.38) и (5.2.39), легко видеть, что выбором р“ =
= (Pi + Pi)/2; Cj ~ Pi — Pi i = 1, p + 1 можно сделать их
различающимися только в свободных членах. Оценим эту разни-
цу. Вначале введем дополнительное обозначение: у — (Р? — Pi)/Pi»
тогда In (Pi/Pi) = In (1 + у)', Ci/Pi — у/(1 + 0,5y). Используя
разложение в ряд Тейлора, получим при малых у: In (1 + у) —
- у/(1 + 0,5г/) = (1/12) г/3 + о (г/3), | у | < 1.
Из последнего соотношения видно, что разница между (5.2.38)
и (5.2.39) составляет (1/12) у3 + о (у3) при | у | <1. Если вер-
нуться к старой параметризации, то множеству у: | у | <; 1 соот-
ветствует интервал 0 <2. Таким образом, при неболь-
ших отклонениях о+/сг2 от единицы приращения Agz для первых
двух вариантов АКС близки. Как будет показано далее, АКС
может обладать рядом полезных свойств (таких, например, как
простота настройки), если со (аг^/Ф, 0, о£) имеет экспоненциаль-
ную структуру. Следуя [1], введем новые параметры у,, которые
определим таким образом:
а;,
2а;-,
если
если
; = 1;
/>1>
(5.2.40)
при этом
Р—Н-2
“г = 3 PiPi+M, у=1,р4-1.
i=l
Новые параметры . .
., ур+1 связаны взаимно-однозначным со-
ответствием с обычными параметпами Ф15 . . ., Фр, о£. В [1] по-
казано, что со (arf/Ф, 0, стЁ) (5.1.7) может быть приближенно
100
представлено в виде
р-'-Т
а (жГ/у) К (у) ехр ~ У, у, (aW-,41)}
>=1 i=j (5.2.41)
Jf 1 р+1 .
К (у) = (2л) 2 det2 у;А Л ,
4=1 '
где ут = || ух, . . ., ур+1 || — (р + 1)-мерный вектор параметров,
Aj — заданные симметрические матрицы, если пренебречь конце-
выми эффектами, которые «работают» на первых и последних точ-
ках последовательности {а^}. Представление (5.2.41) дает возмож-
ность использовать минимальный набор достаточных статистик,
размерность которого р + 1:
л
Т,= 3 ад-м, /== 1, р 4- 1 (5.2.42)
i=j
для синтеза АКС. Заметим, что при использовании точной функ-
ции правдоподобия для последовательности авторегрессии р-го
порядка минимальный набор достаточных статистик имеет раз-
мерность 0,5 ((р + I)2 + р + 1), т. е. параметризация (5.2.40)
и приближенное представление (5.2.41), помимо прочего, сущест-
венно сокращают размерность задачи.
Согласно свойствам экспоненциального (р + 1)-мерного пара-
метрического семейства первые два варианта АКС эквивалентны
(см. формулы (3.3.9), (3.3.10)) и приращение Agz определяется
из (3.3.10) и (5.2.42) следующим образом:
л+1
Agt= — со. ((5.2.43)
3=1
где с0 = с0 (у) — аддитивная добавка, зависящая только от па-
раметров ..., ур+1.
Применение полученной аппроксимации зависимости СВН да-
же для первых двух вариантов АКС в общем случае затруднено.
Причины этого подробно обсуждались в разд. 4 гл. 4. Там было
показано, что в условиях близких гипотез в качестве грубого при-
ближения можно использовать полученные аппроксимации функ-
ции СВН. Рассмотрим асимптотическую информационную матри-
цу и обратную ей (которая понадобится несколько позднее) для
модели авторегрессии р-го порядка [8]:
2} 0 ... 0 о,5 ; о ... о
Л(0) = оГ о,: : i гр (0) 6; 0 1 : ! г;1 (0) о ; . (5.2.44)
101
Подставим (5.2.44) в (4.3.7) и получим аппроксимацию Л0(Я)бг:
1 -L
-- Л 2
Г /Ы 2R1* (0)б г. + e~2RL* (0)б г--1
Mi (п)б.т. = —---------------
Rao
2 Я2
<з2Л2
'-(«>»=M+crMe,)”-
(5.2.45)
где
в = п(2сА + ^Гр (0о)Рр)
М24 + <£Гр(Оо)ср)~
(0 — 0О)Г = II о8 — <т0, Фх — Фь . . ., Фр — Ф“ || — вектор от-
клонений для модели АРСС (р, 0), норма которого ц = || 0 —
— 0О ||, сг = || сх • Ср ||, DT = || : Dp || — расчетный и фактиче-
ский (р + 1)-мерный векторы направлений, || с || = || D || = 1.
Перейдем теперь к III варианту АКС. В данной ситуации его
появление оправдано, если в пространстве параметров необходи-
мо обнаруживать отклонение вектора 0 от 0Х в любую сторону.
Используя (р 1)-мерный вектор производных (5.2.36) для мо-
дели АРСС (р, 0)
d\na>(xi/xtt_1p, 0)
dQ}
fr(*U,0o) =
и асимптотическую информационную матрицу, получим из (3.4.6)
конкретной вид статистики хП/:
t
= + , (5.2.46)
* * ' 1 i=>t—П(+1 ' *
t
^ = W(gt-i) + i,’
i=t—n(4-l
где Vf — р-мерный вектор накопленных по последним nt точкам
эффективных вкладов, Xf — || xt^, . . ., xt^p || — р-мерный век-
тор прошлых наблюдений последовательности.
Функция gt вычисляется из (3.4.6) или (3.4.7). Определим зна-
чение параметра нецентральности X2 для %2-распределения [4]
Г ((р 4- 1)/2; Х2/2, 1/2), которое определяет зону нормального
и разлаженного состояний в параметрическом пространстве.
В случае близких гипотез || 0 — 0Х || -> 0:
X2 (0 - 0х)т Ft (0t) (0 - ех) 2 (4- 4 X
____________ ' 1 7 si
X (Ф - Ф1)т Гр (0!) (Ф - Фх), (5.2.47)
102
где (6 — OJ7, = || <те — : Фг — Ф,Т || — (р + 1)-мерный вектор
отклонений для модели АРСС (/>, 0), с помощью (5.2.47) можно гру-
бо определить эллипсоиды, соответствующие нормальному и раз-
лаженному состояниям.
Влияние мешающих параметров в условиях моделей АРПСС.
В заключение этого раздела приведем два примера оценки влия-
ния мешающих параметров при обнаружении разладки в последо-
вательности АРПСС.
Пусть дана одномерная последовательность АРСС (р, q) и
необходимо обнаруживать изменение среднего т от тх до zn2.
Оценим влияние, производимое неточным знанием мешающего па-
раметра — дисперсии <Те, на оценку функции СВН Lo (т). Обо-
значим через ка отношение фактической дисперсии к расчетной,
тогда решение уравнения М (е~а°^1ко) = 1 имеет вид
(т, ка) = 2М (&gi/m)/(kaD (bgt)), ка 0.
Подставляя со0 (пг, ко) и (5.2.8), (5.2.9) в (4.4.10), получим зависи-
мость оценки СВН Lo (m, ко) для I варианта АКС от величины ка:
h
Lo (т%, k^ = kj, (e*ff — 1 — -г~
\ о
__h_
Zo (mi, ко) = ка1{е
l = 2ol 1-S^i /((^-mi)2 1-2 Фг
\ г=1 ' I \ V г=1 '
(5.2.48)
можно полу-
ко -> оо. Из
Представление о качестве обнаружения разладки
чить из отношения а (ко) — Lo (т1, ko)/L0 (^2, ко)-
Рассмотрим два предельных случая ко 0 и
(5.2.48) видно, что если Zco-> 0, то а (ка) -> оо, а если /са—оо,
то а(А:о)~>1. Эти результаты показывают, что если дисперсия
наблюдаемой последовательности уменьшается, то обнаружение
становится безошибочным, а если, наоборот, неограниченно воз-
растает, то процедура становится бессмысленной.
Второй пример заключается в оценке мешающего влияния
отклонения фактических коэффициентов авторегрессии Ф; от
расчетных Фг при обнаружении изменения среднего т I или II
вариантом АКС (5.2.2) — (5.2.4). Согласно методике учета влия-
ния мешающих параметров (см. разд. 4 гл. 4) блочная диагональ-
ность информационной матрицы обеспечивает отсутствие этого
влияния при небольших отклонениях Фг — Ф; (точнее, в усло-
виях близких гипотез). Рассмотрим логарифм приращения ус-
ловного правдоподобия для модели АРСС (р, 0) из (5.1.7), (5.1.8):
In со (xt/xt~p, т, Ф, о2) =-In 2лОе — (xt —
Р
р
2
I , t
103
Найдем вторую смешанную производную
т, Ф, 1 г , Л
дФ.5т 02 \Х1 / ।
8 1=1
р р
— (1 — — (zt-i — т)(1 — ^Фг)] •
i=l i=l
Нетрудно видеть, что М (d3 In ® (xt/xlt~p, т, Ф, а^/дФ^дт) — 0.
Таким образом, в предположении, что t велико (или что из-
вестны начальные условия а:0, Х-х, . . ., л?х-р), информационная
матрица имеет требуемую блочно-диагональную структуру. По-
этому I и II варианты АКС при обнаружении изменения среднего
т должны слабо реагировать (в смысле отклонения фактической
функции СВН от расчетной) на изменение коэффициентов Ф; мо-
дели авторегрессии в малых интервалах. Результаты статистиче-
ского моделирования (см. разд. 4) подтверждают этот результат,
причем отклонение фактических коэффициентов Ф; от расчетных
достигло 30% отноминальной величины Ф;, что демонстрирует при-
годность разрабатываемых оценок СВН и методики учета влияния
мешающих параметров для инженерных расчетов. Заметим, что
из формулы (5.2.44) следует, что изменение дисперсии о| слабо
влияет на АКС, обнаруживающий изменение коэффициентов Ф<
авторегрессии модели АРСС (р, 0), опять-таки из-за блочной диа-
гональной информационной матрицы Fi (0) (см. (5.2.44)).
И напротив, если часть коэффициентов авторегрессии являют-
ся мешающими параметрами, то их влияние на функцию СВН бу-
дет ощутимо даже в случае близких гипотез.
3. Применение АКС
для многомерных моделей АРПСС
Перейдем от одномерных гауссовских моделей АРСС (р, qp
задаваемых уравнением (5.1.3), к многомерным моделям АРССП
(р, (?) (5.1.10). Как и ранее, достаточно рассматривать случай, ког-
да порядок оператора разности d равен нулю. Все алгоритмы,
рассмотренные для одномерных моделей АРСС, обобщаются на
n-мерные модели. Обычно при этом не возникает каких-либо труд-
ностей и обобщение сводится к замене скалярных параметров на
векторные. Но использование АКС для многомерных моделей
АРСС вносит свои особенности, которым здесь будет уделено ос-
новное внимание.
Обнаружение изменения вектора средних Мх. Подобно одно-
мерным моделям получим из (5.1.15) и (5.1.16) приращение лога-
рифма правдоподобия для модели APCCn (р, q) после окончания
104
действия начальных эффектов
In <о (Xt/X^, Ё%, А{, Въ Мж, S£) = - — In 2л -
--^lndetSE-----(5.3.1)
где
Et = Xt —Мх — S Ai(X<_i-M^)+ 3 ВгЕм. (5.3.2)
i=l i=l
Для реализации рекуррентного расчета Ef (5.3.2) вперед необхо-
димо иметь начальные значения Хо, . . ., Ео, . . Е^д.
Этот вопрос уже обсуждался в разд. 1. Отметим лишь, что полу-
чение прогнозов назад для и-мерных моделей АРСС гораздо.слож-
нее, чем для одномерных. Связано это с тем, что модель (5.1.10)
несимметрична относительно обращения времени [170], т. е. мат-
рицы АР и СС частей модели (5.1.10) в «прямом времени» не совпа-
дают с соответствующими матрицами модели в «обратном време-
ни»:
Хг = 3 A<X,+i - t BjE/+i + Ef + (E - J Aj) Mx.
i=l i=l \ i=l '
Поэтому в (5.3.2) нужно выбирать постоянные значения Хо, . . »
. . ., Хх_р иЕ0, . . ., Ex_g из условия отсутствия начального скач-
ка gt. Вследствие экспоненциальной структуры ® (Xf/XfZp, EfZj,
Мх) (см. (3.3.8)) при разладке по вектору средних Мх сразу рас-
смотрим многомерный аналог (5.2.3) для II варианта АКС:
Agt= EtT (Мо) С = ЁГ (0) С 4- со, (5.3.3)
где Е( (0) соответствует (5.3.2) с нулевым вектором Мх й играет
роль достаточной статистики Т (X) в семействе (3.3.8); Мо — «по-
граничное» значение вектора Мх', С — n-мерный вектор направ-
ления в естественном параметрическом пространстве экспонен-
циального семейства; с0 — центрирующая добавка.
Ввиду громоздкости (5.3.3) поясним структуру Ag( на модели
APCCn (1, 0). Рассмотрим приращение логарифма правдоподобия
из (5.1.13):
lnw(X(/X(_1,A1,M0,SB) = --J-ln2rt-
-4-lndetSx-(Ftr(M0)Sx1Ef (Мо))/2, (5.3.4)
где Ef(Mo) = Xt-Mo-A1(Xf_1-Mo), t>2.
Преобразуем последнее слагаемое в (5.3.4):
- 4- ЁГ (Мо) 2#Ef (Мо) = - 4- [ЁГ (0) -Е Ё( (0) - 2ЁГ (0)
X (Е — Ах) Мо + Мот (Е - Ах)т Si;1 (Е - Ах) Мо].
105
Продифференцируем In со (Х(/Х(_1; Alt М, Ед) по вектору М сог-
ласно правилам [3] и получим вектор эффективных вкладов:
, dlnw(XJXf n, Alr М, SP)
f (XL, 0 -------* - - *-!’ 3’ =
' L M=M«
= (E - At)T 2#Et (0) - (E - Ax)T (E - A,) Mo.
Таким образом, с учетом SE = Rx — AjR.yAf, где Rx =
= cov (Х(), запишем приращение
Agt= HxLi, e0) c=[(xt - AM? -
- Мог (E - А0Ч (Rx - A1RXA1T)-1 (E - Ax) C, (5.3.5)
где C — n-мерный вектор направления в пространстве сред-
них Мх.
В соотношении (5.3.5) выражение, заключенное в квадратные
скобки, это Ef (Мо), а новый вектор направления С связан со ста-
рым таким соотношением: С = ZC, Z = (Rx — AxRxAf)-1 X
X (Е — Ах), которое определяет матрицу преобразования Z
системы координат при переходе от Мх к естественным парамет-
рам экспоненциального распределения со (Х4/Х(_х, 0).
Если положить Ах нулевой матрицей, а Ее — единичной, то
приращение Agt будет иметь особенно простой вид: Agt = (Хг —
— M(f) С. В этом случае Мх — вектор естественных параметров
с С = С. Напомним, что решающая функция gt вычисляется по
формуле (5.2.4).
Оценим функцию СВН для модели APCCn (1, 0). Очевидно,
что
M(Agt/Mx) = (Мх- МО)Г (Е - Ах)т (Rx - ARxAiT)-! (Е - Ах)С,
D (Ag?)=CT2EC = Сг (Е — Ах)Т (Rx - AiRxA?)-1 (Е - Ах) С.
Обозначим Мх — Мо = T]D, получим]
(Сг (Е - Ах)г (Rx - AxR^Af)-! (Е - Ах) D)
П (CT(E-A1)r(Rx-A1R;s.A1r)-i(E-A1) С)1/’ ( ‘ ‘
Таким образом, применяя аппроксимацию Lo (R) (5.2.13)
и подставляя в нее R из (5.3.6), получим оценку функции СВН.
Если R = 0, то из (5.2.13) получим
Ео (0) = Д2/(СГ (Е - Ах)т (Rx - AxRxAfr1 (Е - Ах) С).
При настройке II варианта АКС представляет интерес получе-
ние в параметрическом пространстве плоскостей постоянных зна-
чений функции СВН. Для данного случая такой «портрет скорос-
тей» легко можно получить из (5.3.6). Так как Lo (R) постоянна
при R = const, то, обозначая Y = Мх — Мо — вектор отклоне-
ний, запишем уравнение плоскостей постоянных величин
106
L (R) = L*:
Yr [(E - Ai)T (Rx - AiRxAf)-1 (E - Ax) C] = d,
где d удовлетворяет у равнению L (d/(CT (E — Ai)r (Rx —AjRx Af )-1 x
X (E — Ai) €)*/• = L*. В простейшем случае, когда Ах — нуле-
вая, a Rx — единичная матрицы, плоскости постоянных L (/?)
перпендикулярны вектору С.
Легко видеть, что оценки £ (0) (4.3.11) и результаты анализа
функции/ (С, D) (4.3.14) — (4.3.18), определяющей свойства АКС,
полностью применимы для модели APCCn (р, q) в случае «разлад-
ки по вектору средних» без требования близости гипотез.
Оценить влияние переходного процесса для модели АРСС„
(1, 0) можно, используя полученные ранее формулы (5.2.15) —
(5.2.20) (см. пример 1), которые применимы в данном случае, так
как последовательность гауссовских величин Ag( независима
и переходный процесс длится один дискрет времени.
Третий вариант АКС (3.4.5) — (3.4.9) позволяет обнаруживать
отклонение вектора Мх в любом направлении от номинального
значения вектора Мх = Мг Так как Е( (Mj) является достаточ-
ной статистикой, образуем Хп( из (3.4.5):
< 1 ‘
xnt=4-( Е Е‘(М1))Ч Е (5-3-7)
4 i=t—nt4-l i=t—nt+l
Причем теперь статистика %п (5.3.7) имеет точное распределение
Г (п/2, ZA,2/2,1/2), т. е. в предположении о близости гипотез больше
нет необходимости. Выведем уравнение эллипсоида (3.4.2), опре-
деляющего в пространстве отклонений Y = Мх — Mj зоны нор-
мального и разлаженного состояний последовательности АРССП
(р, q). Из (5.3.2) найдем
. 9 ,-1 . Р \
М (Е( (М1)/Мх) = (Е - S Bi) (Е - 3 (Мх - Мо).
\ 1=1 ! \| 1=1 /
Тогда для Г (н/2, Z%2/2, !/2) параметр нецентральное™ Z/.2 опреде-
ляется из соотношения
ZX2 = (zYrGT)221(ZGY),
где
9 -1 Р \
с = (Е-ЁВА (E-3AJ, Sx = ZT£.
\ i=l / \ i=i '
Таким образом, искомое уравнение эллипсоида имеет вид
YtGt2#GY = X2.
Обнаружение изменения ковариационной матрицы многомер-
ного белого шума и матриц АР и СС частей. Кратко остановимся
на этой задаче, представляющей собой прямое обобщение резуль-
107
татов разд. 2. Из (5.3.1), (5.3.2) непосредственно получаем прира-
щение Agt решающей функции I варианта АКС как логарифм
отношения условного правдоподобия
Agt= ~2“ [Et (%Ег — Ех In (det SE1/det S^)] =
= 4-tr && (S*« - Sk,)) + 4"111 <det Ss,/det Se,), (5.3.8)
Где 2е, и Se, — ковариационные матрицы Et до и после разладки,
tr — след матрицы.
Легко видеть, что плотность распределения (5.3.1) имеет экспо-
ненциальную структуру относительно элементов а'-' Матрицы
Se1 — обратной к ковариационной при известных матрицах и
А(, В,-. Следовательно, для II варианта АКС получим, дифферен-
цируя In и (Xt/X(Zp, E((Zg, А;, Вг, Se) (5.3.1) по матрице Se1 :
ПпМ(Хг/хЦ,Ё‘4,А.,В.,2^) 4
Ь =----------:----------------- t t = у ------------2"EtEt,
а^Е SE
(5.3.9)
где G = || gij || — матрица эффективных вкладов размером (геХ«),
приращения решающей функции
п п
Agt=£1£giAJ- = 4-[tr(2s'C) “ tr (ЁЖ)]. (5.3.10)
i=l j=l
Сравнивая (5.3.8) и (5.3.10), легко видеть, что при соответствую-
щем выборе матриц С и Se0, а именно
С = Se* -— Se*; tr (So (S^ — Se',)) = In (det SE,/det Ses)
обеспечивается эквивалентность первых двух вариантов АКС
(5.3.8) и (5.3.10). Решающа^ функция для этих вариантов АКС
вычисляется согласцо (5.2.5).
Оценка функции СВН для первых двух вариантов АКС может
быть выполнена по общим формулам (4.2.6) — (4.2.15) подобно то-
му, как это делалось ранее. Причем в предположении близости
гипотез можно воспользоваться аппроксимацией типа (5.2.13).
Для этого понадобится лишь расчет первых двух моментов слу-
чайной величины Agf. Если предположение о близости гипотез не
подходит, то необходимо решать уравнение М (e-M“ASt) = 1, что
может оказаться довольно громоздким. Упрощение может прои-
зойти, если размерность п последовательности АРСС достаточно
велика, что' позволит аппроксимировать распределение Agt нор-
мальным законом.
Третий вариант АКС синтезируется на основе матрицы G
эффективных вкладов (5.3.9) и асимптотической информационной
матрицы. В качестве вектора 0 здесь выступает верхний треуголь-
ник матрицы G, «растянутый» в столбец длиной] п (п + 1)/2. Та-
108
ким образом, статистика (3.4.5) является квадратичной фор-
мой вектора эффективных вкладов размером п (п + 1)/2.
Если необходимо обнаруживать изменение элементов матриц
Аг, р; и Se модели (5.1.10), то приращение решающей функции
для I варианта АКС представляет собой многомерное обобщение
(5.2.35). Из (5.1.15) приращение решающей функции Ag( имеет
вид
= (V2) ЁГ (01) 2£.Ёг (01) - ГЛ) EF (0а) 2еД (0г) +
+ (l/2) In (det SEl/detE2),
где 0 44 {Aj, А2,. . ., Ay, Вп. . ., Вд, SE} — вектор парамет-
ров модели (5.1.10); 0Х и 02 — значение вектора параметров 0 до
и после разладки. Рекуррентный расчет Et (OJnEt (02) выполняет-
сы по формуле (5.1.16) с учетом сказанного ранее относительно
выбора начальных условий.
Рассмотрим применение II варианта АКС на примере последо-
вательности APCCn (1, 0). Подобно одномерному случаю (5.2.37)
найдем матрицы эффективных вкладов от элементов матрицы
2е из (5.3.9)'
523,1
2/)
= 42^----Mf(A10)ET (Аь),
где Аю и Se„ — матрицы (и X п) авторегрессии и ковариации, со-
ответствующие «пограничному» значению вектора Оо, и от эле-
ментов матрицы авторегрессии Аг:
1 P[(X(-A1Xf_1)T2^(Xt-A1Xf_1)]
2 9A.i
д s-u^) ____! a (x^AfzgAX^)
dzli ^-1==^10 2 <?Ai
Ax=Aj0
= Se1. (Xt - AxXw) Х^ = S^Ef (Alo) Xtr_v
(5.3.11)
Далее из (3.3.8) полностью аналогично (5.3.10) приращение Ag(:
Agt= 4 tr ------tr (Et (Ale) ЁГ (Alo) C2) +
А-и^ЁДАДХ^Сд),
(5.3.12)
где Сд — матрица направления для элементов ац матрицы авто-
регрессии А1; С2 — матрица направления для элементов
матрицы SE . Чтобы подчеркнуть аналогию с одномерным слу-
чаем АРССХ (1, 0), перепишем формулу (5.2.37) для Agt. В этом
109
случае
д In со (xt/xt_r alf а) д In со (хЛх,х, <zx, а)
Ag‘=c“ “=“• + Са-------------------
“*—и1о
1-1 1
= ~2~ ао ел —' “2" &t (аю)2 Са 4“ ао£< (йю) xt~\Cay
а=ао —
(5.3.13)
где а = (о|)-1, et (аю) = xt — a^xt^x. Из почленного сравнения
(5.3.12) и (5.3.13) нетрудно увидеть соответствие: а0 = (о!)-1 «=>
<=> Se\; (аю) <=> Et (Аю); Са ФФ С2; са фф Са. Подобно (5.3.12)
выводится приращение и для модели АРССП (р, 0) с естественной
заменой последнего члена в (5.3.12) на след от суммы произведе-
ний матрицы.
Функция СВН для многомерной модели АРССП (р, 0) оцени-
вается в предположении близких гипотез подобно (5.2.45), ис-
пользуя асимптотическую ковариационную матрицу для элемен-
тов матриц А10, . . ., Ар, и эта ковариационная матрица
в асимптотических предположениях получена в работах [1, 67].
На основании матриц эффективных вкладов (5.3.9) и (5.3.11)
от элементов матриц Ед и А/и их совместной ковариационной
матрицы, которая, как и в одномерном случае, имеет блочно-
диагональную структуру [1], синтезируется III вариант АКС.
Статистика %п при этом выписывается подобно (5.2.46) с заме-
ной векторов эффективных вкладов на матрицы и появлением в ко-
вариационной матрице’прямого произведения.
4. Применение АКС
для линейных моделей объектов
До сих пор в качестве объекта исследования использовались
временные ряды, порождаемые формирующим фильтром из по-
следовательности независимых одинаково распределенных слу-
чайных величин, недоступные наблюдению. Вместе с тем во мно-
гих практических задачах необходимо обнаруживать изменение
свойств объекта, входы и выходы которого предполагаются до-
ступными наблюдению. В этом разделе рассмотрим задачу обна-
ружения изменения свойств линейных статических и динамических
моделей объектов. Как и ранее, под разладкой будем понимать
изменение скачком вектора параметров 0 в неизвестный момент
времени. Кратко рассмотрим возможные подходы при решении
этой задачи.
Статические модели. Впервые такая задача для статической мо-
дели была рассмотрена в 1958 г. в апостериорной постановке [152,
153].
Пусть дана скалярная регрессионная модель
yt = х/'р + ej, (5.4.1)
где Уi — выход (отклик), Xf — Ц xlt, . , хг(Ц — r-мерный век-
270
тор входов (регрессоров), et — независимая последовательность
гауссовских случайных величин М (et) = О, М (е2) = о|»
Рт = || Pi, . . рг || — r-мерный вектор параметров, т. е. в дан-
ном случае 0 = р. Предполагается, что в неизвестный момент вре-
мени t0 вектор р изменяет свое значение. До момента времени
t0 — 1 включительно 0 = рп ас момента to вектор £ = |32. В ра-
боте [152] предлагается взять за основу статистику логарифма
отношения правдоподобия:
St = In [f (Но/У?, X?)/f (Нг/У1, Xf)],
где {yf} и {Xf}—совокупности наблюдений зависимой пере-
менной (отклика) и независимой (регрессора). В соотношении
(5.4.2) гипотеза ff0 означает отсутствие изменения коэффициен-
тов рг регрессии, а гипотеза Ht означает, что это изменение про-
изошло в момент времени t. Отыскивая min St для последователь-
ности значений t, получим оценку момента разладки коэффициен-
тов регрессии
io = arg min (St). (5.4.2)
t=2, N
Если сравнить эти результаты с методом апостериорного обнару-
жения разладки Е. С. Пейджа [144], рассмотренным в разд. 3
гл. 2, то станет ясно, что (5.4.1) — (5.4.2) есть не что иное, как
распространение метода максимального правдоподобия (2.3.1) —
(2.3.2) на случай регрессионной модели. Если значения вектора
Pi и Р2 заранее неизвестны, то в ходе решения (5.4.2) их необхо-
димо оценивать. Если необходимо проверить гипотезу ff0 (по-
стоянство коэффициентов рг), то в качестве статистики можно ис-
пользовать S?. Нетрудно видеть, что статистика (5.4.2) проста
в вычислительном отношении [152]:
St = (1/2) (t - 1) In б2 + (1/2) (N - t + 1) In б2 - (1/2)
X In d*,
где б2 — оценка остаточной дисперсии (сумма квадратов остат-
ков, деленная на число наблюдений, по которым была подогнана
данная регрессионная модель), б?, б2 и б2 — оценки остаточной
дисперсии для моделей (5.4.1), подгоняемых по первым t — 1
точкам, последним N — t -]- 1 точкам и по всей выборке. Далее
задача о разладке для регрессионной модели (иногда в «неявной»
постановке) рассматривалась в работах [109, 112, 113, 114, 154].
Обзоры результатов по этому вопросу содержатся в работах [54,
85]. Резюмируя их, отметим следующее: исчерпывающая инфор-
мация относительно разладки коэффициентов р/ модели (5.4.1)
может быть получена из анализа функции правдоподобия и алго-
ритмы обнаружения разладки формируются полностью аналогич-
но тому, как это сделано в гл. 3. Единственное отличие заключает-
ся в использовании наблюдений не только выходов, но и входов.
Рассмотрим, например, применение II варианта АКС для последо-
111
(5.4.3)
вательного обнаружения изменения коэффициентов рг в направ-
лении, задаваемом вектором с. Дифференцируя функцию правдо-
подобия для модели (5.4.1) по параметрам |Зг, получим решающую
функцию II варианта АКС (3.3.5) — (3.3.7):
gt = (gt-i + Agt)+. go = O, Z0 = inf{Z: gt >/г},
r
Agt = “Г У. ci (Vt — ₽»)
°* id
Введение в модель (5.4.1) свободного члена осуществляется зада-
нием первого входа xlt = const. В соотношении (5.4.3) легко ус-
мотреть аналогию с ранее упоминавшимися алгоритмами. Пусть
г = 1 и xlt = 1, тогда (5.4.3) преобразуется в (2.2.9) при к = 0.
Если yt — xt, а X? = || х(_1( . . ., Xt-r || то (5.4.1) — это модель
авторегрессии р-го порядка, а (5.4.3) полностью совпадает с
(5.2.37) при сг = 0 (т. е. дисперсия of в (5.2.37) не изменяется).
Точно так же используются и другие варианты АКС для модели
(5.4.1).
Естественно, что в рамках принятого подхода необходимо при-
дать приращению Agt какие-то статистические свойства, иначе
н евозможно оценить функцию СВН. Это можно сделать, предполо-
жив, что регрессор Xt — случайный вектор, а последователь-
ность векторов {Xf} обладает о i ределенными вероятностными
свойствами. При этом свойства АКС будут зависеть от свойств по-
следней, подобно тому как точность оценок МНК зависит от
свойств матрицы плана (т. е. от {Xf}) [54]. Таким образом, основ-
ная сложность использования АКС для модели (5.4.1) заклю-
чается в наличии мешающих параметров распределения {Х^}.
Динамические модели. В последние годы большую популяр-
ность приобрело описание различных динамических объектов
с помощью комбинированной модели объект—возмущение [1, 8,
47, 25, 67]:
gt — 6-1 (z~l)й (z-1) z~bxt + vt, <р (z-1) vt = У (z-1) ef, (5.4.4)
где
6 (z-1) =1 — 61Z-1 — 62z~2 — ... — 6rz“r,
О (z-1) = (O0 — (OjZ-1 — tf»2Z~2 — ... — (0sZ~*,
<p (z-1) = 1 — OiZ-1 — ... — Фрг“Р,
T (z’1) = 1 — '»|'1z~1 — ... —
6 (z-1), Q (z-1), <p (z-1), T (z-1) — полиномы динамической и сто-
хастической части модели (5.4.4), yt — выход, xt — вход, vt —
дополнительный шум. Причем yt, xt, vt могут быть как скалярны-
ми, так и векторными величинами. Во втором случае 6, О, <р, Т
представляют собой матричные полиномы. В модели (5.4.4) до-
полнительный шум vt порожден моделью APCCn (р, q). Понятно,
что в отсутствие шума vt задача о разладке статистического смысла
772
не имеет. Для детерминированной модели (5.4.4) с vt = 0 изме-
нение коэффициентов . . ., Sr и w0, . . ., cog, может быть обна-
ружено пороговым устройством по разности действительного и
спрогнозированного по модели выхода. Часто предполагается,
что входная последовательность {^Г} также порождена некоторой
моделью АРПСС. Такое предположение выглядит естественным
при моделировании непрерывных производств, в геофизике, ме-
теорологии и т. д. Удобно оно и при решении задачи последова-
тельного обнаружения момента изменения свойств модели (5.4.4).
Выписывая в каждом конкретном случае функцию правдоподобия
для модели (5.4.4), можно применить результаты гл. 3 по синтезу
всех трех вариантов АКС. В качестве иллюстрации рассмотрим
простой, но очень распространенный в теории управления слу-
чай модели (5.4.4):
Y^BYm + GXm + 8*, (5.4.5)
где Y( и — «-мерные векторы, Xt — /с-мерный вектор, В — мат-
рица (п X n), G — матрица (п X к). Пусть вход Xt — это после-
довательность авторегрессии АРПСС^ (1, 0, 0) (5.1.1):
X/ = AXt_1 + (E-A)Mz + Et. (5.4.6)
Не представляет труда объединить уравнения (5.4.5) и (5.4.6)
в одно следующим образом:
В 1 G । *М о; о II 0 II 1 . (5.4.7)
— = - "1 ” " X -- — + — —— —* — X + •• — *
xt 0 1 А 1 Xt-! 0 I Е —А S Мх II 1 Et
В результате получим модель типа АРПCCn+)c (1, 0, 0), определен-
ную ранее в разд. 1.
Как видно из вышеизложенного, рассматривать отдельно ме-
тоды обнаружения разладки моделей типа объект—возмущение
(5.4.4) со случайными входами нет необходимости, так как такая
задача представляет собой частный случай уже рассмотренной
задачи о разладке последовательностей типа АРПСС. Правда,
при обнаружении разладки в объекте коэффициенты модели воз-
мущения будут играть роль мешающих параметров, что делает для
такой задачи особенно важным правильный учет их влияния. За-
кончим обсуждение этого вопроса следующим примером.
Пример. Рассмотрим простейший тип модели (5.4.5):
Vt = 4- ef, (5.4.8)
где xt и et — последовательности независимых гауссовских слу-
чайных величин: М (xt) = М (et) = 0. Необходимо обнаруживать
изменение величины Ъ от Ьо в сторону увеличения (II вариантАКС),
при этом# •— мешающий параметр. Необходимость в таком разде-
лении на информационный и мешающий параметры с точки зрения
практики обоснована тем, что# является коэффициентом усиления
входа, а b отвечаетза динамику модели (5.4.8). Поэтому изменение
# будет приводить к увеличению или уменьшению дисперсии по-
113
следовательности gxt, т. е. в качестве мешающего параметра вы-
ступает дисперсия входной последовательности. Перепишем
(5.4.8) в виде (5.4.7):
I
I
ь g
о о
Vt-i
Vt-
et
₽2
et
где pt = yt, у* = xt.
Затем для (5.1.13) получим
Vt - bVt~i - gVi-1
Vt
T VII - ~ gy‘-i
E yt
Рассмотрим производные In co (Yt/Yj-j, 5, g) (5.1.13):
c? In co (Yb, g)/db = eJyUo11 + yt-igto12,
d2 In ® (Yt/Yt_x, b, g)/db dg = — yt^yt-iO11.
Как показано в разд. 4 гл. 4, блочная диагональность информа-
ционной матрицы, а в данном примере это выполнение условия
М (52lnco(Yt/Yt_i, b, g')/dbdg) = O,
гарантирует отсутствие влияния мешающего параметра g при
обнаружении II варианта АКС изменения коэффициента в усло-
виях близких гипотез. Таким образом, если
^(2/LiJ/?-i) = M(ytxt) = 0, (5.4.9)
то малые отклонения дя от номинала g будут нечувствительны
для АКС. Заметим, что условие (5.4.9) выглядит совершенно ес-
тественным для модели (5.4.8), так как выход yt в момент t не мо-
жет зависеть от xt. Полученные результаты сохраняются и для
векторной модели (5.4.5). Условие для блочной диагональности
информационной матрицы в асимптотических предположениях
можно получить из работы [1].
5. Статистическое моделирование
процедуры обнаружения разладки
Статистическое моделирование процедуры обнаружения раз-
ладки проводится обычно с целью исследования применимости
тех или иных аналитических аппроксимаций функции СВН. Наи-
больший интерес в рамках настоящего подхода представляет ис-
следование применимости аппроксимаций (4.2.6) — (4.2.10), сопо-
ставление экспериментальных кривых с границами (4.2.14) —
(4.2.19) для функции СВН и учет влияния мешающих парамет-
ров.
Рассмотрим результаты статистических экспериментов по об-
наружению скачкообразного изменения среднего m последова-
тельности АРСС (р, q). Эксперименты разделены на две группы.
114
Первая группа экспериментов (№ 1 — 3) проводилась с
целью проанализировать погрешности аппроксимации функции
СВН Lo (т2) (5.2.10), вносимые ошибками перескока и переход-
ным процессом. Кроме этого, интересно сопоставить эксперимен-
тальную зависимость СВН с верхней границей Lo (тг) из (5.2.20)
с целью выяснения, насколько плотно верхняя граница Lo (zn2)
примыкает к экспериментальным точкам.
Вторая группа экспериментов (№ 4—9) проводилась с целы»
оценить влияние, производимое отклонением истинных коэффи-
циентов авторегрессии и скользящего среднего от расчетных на
экспериментальные значения среднего запаздывания т (тн2), и со-
поставить все это с расчетом оценки Lo (т2) по формуле (5.2,10).
Статистическое моделирование последовательностей АРСС (р,
q) проводилось по следующей схеме. С помощью датчика нормаль-
но распределенных псевдослучайных чисел генерировалась реа-
лизация {е^} (5.1.3). Если q = 0, то первые р значений {х?} ге-
нерировались из {е?} как компоненты гауссовского р-мерного
вектора с заданной ковариационной матрицей ГР (5.1.8). Начи-
ная с (р + 1)-го значения, последовательность {я*Р+1} генериро-
валась по рекуррентной формуле (5.1.3). Если q > 1, то для на-
чала рекуррентного счета по (5.1.3) нужно иметь не только р
начальных значений {z’-p}, которые сгенерированы из р-мерного
нормально распределенного псевдослучайного вектора но
и q начальных значений {е^}. Затем расчет проводился по ре-
куррентной формуле (5.1.3). АКС рассчитывался по формулам
(5.2.2), (5.2.4). На заданном шаге t0 значение среднего т последо-
вательности АРСС (р, q) скачком изменялось от т1 при t t0 — 1
до т2 при t t0. При этом выполнялось условие: gt^-i = 0. По-
сле достижения решающей функцией gt порога h в момент ta фик-
сировалось запаздывание при обнаружении разладки в i-м экспе-
рименте тг = ta — tfy + 1. После завершения i-ro эксперимента
последовательность {е^} генерировалась с помощью датчика на
основе нового базового числа.
Первая группа экспериментов. В этой группе число повторе-
ний обнаружения разладки выбиралось по методу [49] следую-
щим образом: задавался трехпроцентный доверительный интер-
вал б ==_0,03 для относительной погрешности экспериментальной
оценки т среднего времени запаздывания в обнаружении разладки
и последовательно (с ростом числа N обнаружений) вычислялись
оценки т^у и о {тгу }:
N f~N
°t = ]/ £(т4-т)7(А-1);
i—1
о {Tjv} = oT// N,
где о {tjv} — среднеквадратичная ошибка оценки т, стт — сред-
125
неквадратичное отклонение запаздывания. Повторение экспери-
мента прекращалось, когда впервые выполнялось неравенство
5тх ко к = 2.
Результаты экспериментов по моделированию сведены в таб-
лицы, номера которых соответствуют номерам экспериментов.
Результаты первого эксперимента изображены в логарифмиче
ском масштабе на рис, 22, где верхняя кривая соответствует
Го (иг2)л нижняя Lo (тп2), а пунктирная линия т (пг2). Результаты
расчетов Lo (тп2) по формуле (5.2.20) также помещены в табл. 1.
Эксперимент 1. Моделировалась последовательность
АРСС (1, 0), т2 — = 0,5, о% = 1, Фх = —0,9 н- 0,9, h — 12.
Такой набор величины порога h (в этом и последующих экспери-
ментах) наряду с перебором широкого спектра значений коэффи-
циента авторегрессии Фх позволил рассмотреть ситуации, когда
ошибки аппроксимации ощутимы и пренебрежимо малы.
Эксперимент 2. Моделировалась последовательность
АРСС (2, 0)
т2 — mi = 0,5, Ох — 1, Ф1 = +0,3, Ф2 = +0,5, h = 12.
Эксперимент 3. Моделировалась последовательность
АРСС (1, 1)
ni2 — mt = 0,5; 1, о® = 1; а) Фх = 0,2; фх = —0,1,
б) Фх — 0,5; фх = —0,3, в) Фх = 0,8; фх = —0,9.
Из рассмотрения табл. 1 следует, что в диапазоне 0 Фх +
0,9 точность аппроксимации довольно высока — относитель-
ная ошибка А = [(7 — L0)/t] • 100% не превышает 0,3%. В то же
время, если —0,9 Фх < 0, точность аппроксимации хуже и до-
ходит до А = 30,6% при Фх = —0,9. В табл. 2 А + 11,9% и
в табл. 3 А + 7,3%. Все это позволяет считать аппроксимацию
Ло (+) вполне пригодной для инженерных расчетов, кроме слу-
чая Фх = —0,9, когда величины М (Agt/^г) и rfD (Agt) сопо-
ставимы с h, что и является причиной плохой аппроксимации. От-
метим относительную близость верхней границы Lo (m2), Lo (т2)
и т (см. рис. 22 и табл. 1) и тот факт, что при уменьшении т верх-
няя граница Lo (m2) играет роль лучшей, чем Lo (т2), аппроксима-
ции для т (случай Фх = —0,9; —0,7). Последнее, как отмечалось
ранее, согласуется с выводами, сделанными А. Вальдом [11] от-
носительно оценки среднего времени ПКОВ и ее верхней границы.
Вторая группа экспериментов. Так как теперь коэффициенты
АР и CG частей рассматриваются как мешающие параметры в за-
даче обнаружения изменения среднего т от тг до т2, то при вы-
числении Agt (5.2.2) использовались расчетные значения Ф1р
ф1р, а при генерации псевдослучайной последовательности —
фактические значения ФХф и фХф.
Ив
Рис. 23. Результаты экспериментов № в и 7
Эксперимент 4. Моделировалась последоватёльность
АРСС (1, 0),
т2 — Шх = 0,5, Ох = 1, Ф1Р = —0,5, h = 12, Lo (тп2) =
= 29,33, Ф1ф = (-0,9) н- (-0,1).
Эксперимент 5. Моделировалась последовательность
АРСС (1, 0)
т2 — тх = 1, Ох = 1, Ф1р = 0,’ h — 12, Lo (т2) = 22,
Ф1ф = —0,3 =- 0,3.
Эксперимент 6. Моделировалась последовательность
АРСС (1,0)
т2 — Шх = 1, Ох = 1, Ф1Р = 0,3, h = 12, Lo (т2) =
= 40,86, Ф1ф = -0,3 =- 0,7. -
Эксперимент 7. Моделировалась последовательность
АРСС (1, 0)
— mi = 1, о» = 1, Ф1р = 0,5, h = 12, Lo (тп2) = 66,
Ф1ф = 0 -ь 0,95.
Эксперимент, 8, Моделировалась последовательность
АРСС (1, 0)
ттг2 — тх = 2, Ох = 1, Ф1Р = 0,8, h = 12, Lo (т2) =
= 49,5, Ф1ф = 0,3 =- 0,9.
Эксперимент 9. Моделировалась последовательность
АРСС (0, 1)
7712 М^х == 0,5, Ох == 1, "Ф1р === 0, h == 12, Lq (тт2-2) = 88,
ф1ф = -0,9 — 0,7. ----- - -
117
Число повторений обнаружений разладки во всех эксперимен-
тах с № 4 по 9 было выбрано фиксированным N = 300. Результа-
ты экспериментов сведены в таблицы (номера совпадают с номера-
ми экспериментов). Результаты двух экспериментов (№ 6 и 7),
в которых диапазон значений коэффициента Ф1(р представляет
наибольший практический интерес, изображены на рис. 23. В си-
лу того что при обнаружении изменения среднего т модели APCG
(/>, 0) малые отклонения Ф1ф от Ф1р (см. разд. 4) не должны при-
водить к изменению функцииСВН I и II вариантов АКС, с резуль-
татами статистических экспериментов сравнивалась аппроксима-
ция рассчитанная по формуле (5.2.10) без учета отклоне-
ния Ф1ф от Ф1р. На рис. 23 сплошная линия — это т, штрихпунк-
тирная — оценка Lo (т2).
Из рассмотрения табл. 4—9 видно, что, кроме случая Ф1ф =
=0,95, Ф1р = 0,5, А = 14,77% (см. табл. 7), величина А = [(т —
— т*)/т*]-100% относительного отклонения фактического т от-
среднего запаздывания т* при Ф1ф = Ф1р не превышает 10%.
Если сопоставить величины т — т* ио {т}(см. рис. 23 и табл. 4—
9), станет ясно, что большая часть экспериментальных точек от-
клоняется от т* не более чем на величину а {т}. Тем не менее оче-
видна тенденция к увеличению т при Ф1ф > Ф1р (илиф1ф ф1р),.
если Ф1р 0. Кроме того, с ростом Ф1ф растет среднеквадратич-
ное отклонение от (см. табл. 4—9), что также является неблаго-
приятным фактором.
Как видим, полученные результаты хорошо согласуются с ме-
тодом оценки Lo (т) в условиях мешающих параметров, разрабо-
танным в разд. 4 гл. 4, и условие близости гипотез не является
особенно ограничительным. В экспериментах № 4—9 диапазон
отклонений Ф1ф от Ф1р и ф1ф от ф1Р удовлетворяет всем практи-
ческим потребностям.
СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
ПРОЦЕДУРЫ ОБНАРУЖЕНИЯ РАЗЛАДКИ
Таблица 1
Ф1 Zo("12) М^з) А, %
—0,9 4,63 6,67±0,1 6,89 30,6
—0,7 15,5 17,4±0,2 18,95 10,9
—0,5 29,3 30,8±0,4 34,16 4,9
-0,3 47,4 48,5±0,6 54,01 2,3
0,0 88,0 88,2±1,2 98,43 0,2
0,3 163,4 162,9±2,2 182,16 —0,3
0,5 164,0 264,4±3,6 291,78 0,2
0,7 498,7 499,6±6,9 550,53 0,2
0,9 1672,0 1670,5±21,2 1835,67 —0,1
118
Таблица 2
Ф1 Фа io(™a) т±б{т) А. %
0,3 0,5 1056,0 1059,3±15,9 0,3
-0,3 0,5 66,0 67,7±1,0 2,5
i 0,3 —0,5 44,0 45,8-0,7 3,9
-0,3 <- 0,5 19,6 22,2±0,3 11,9
Таблица 3
/72^—7»! А>("г2) T±3{if} А, %
а) 0,5 152,1 162,8±2,4 6,5
, 1,0 38,0 41,0±0,6 7,3
б) 0,5 327,2 341,9±5,1 4,3
1,0 81,8 85,1±1,3 4,4
в) 0,5 879,7 915,4±13,7 3,9
1,0 219,9 227,2±3,4 3,2
Таблица, 4
ф1ф -0,9 —0,7 —0,6 -0,5 -0,3 -0,1
t 32,46 32,08 32,19 31,69 30,58 29,65
5,09 9,05 10,24 11,39 13,67 15,46
s{t) 0,29 0,52 0,59 0,66 0,79 0,89
: д, % 2,43 3,50 1,58 0 -3,50 —6,44
Таблица 5
ф1ф —0,3 -0,1 0 0,1 0,2 0,3
т 24,05 24,34 24,34 24,31 24,14 24,56
бг 7,10 8,31 9,52 10,27 11,01 11,76
<5{Т} 0,41 0,48 0,56 00,59 0,64 0,68
А, % —1,19 0 0 —0,12 -0,82 0,90
Таблица 6
ф1ф -0,3 -0,1 0 0,1 0,2 0,3 0,4 0,5 0,6 "Г"1 0,7
т 42,74 42,13 42,43 42,43 42,75 42,46 42,69 42,37 42,68 44,51
9,61 11,69 12,78 13,76 15,20 16,38 18,80 19,74 22,52 25,58
а{т} 0,55 0,67 0,74 0,79 0,88 0,95 1,09 1,14 1,30 1,48
А, % 0,66 —0,78 -0,07 —0,07 0,68 0 0,54 —0,21 0,52 4,83
Таблица 7 ,а
ф1ф 0 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
т 67,58 67,35 67,40 67,66 68,04 68,04 67,65 67,65 68,66 68,78
От 17,0 17,7 18,51 19,64 20,37 20,86 22,10 23,16 24,31 25,21
б{т} 0,98 1,02 1,07 1,13 1,18 1,20 1,26 1,34 1,41 1,46
А, % —1,74 -2,08 -2,01 —1,63 —1,08 —1,08 —1,64 —1,64 —0,17 0
Таблица 7,6
ф. 1<р 0,55 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95
т 68,03 69,11 68,92 69,16 70,42 70,59 70,11 71,77 78,94
26,13 30,02 31,95 34,77 39,25 41,18 43,93 50,68 67,9
б{?} 1,51 1,73 1,84 2,00 2,27 2,38 2,54 2,93 3,92
а, % —1,09 0,48 0,20 0,55 2,38 2,63 1,93 4,35 14,77
Таблица 8
ф, 1<р 0,3 0,5 0,7 0,8 0,9
т 42,55 43,66 45,03 47,13 49,5
бг 9,14 11,90 16,16 19,03 25,97
б{т} 0,53 0,69 0,93 1,10 1,50
А, % —9,72 —7,76 —4,46 0 5,03
Таблица 9
—0,9 -0,7 -0,5 -0,3 0 0,3 0,5 0,7
•Г 83,94 85,25 84,92 84,91 89,01 89,49 92,61 92,03
41,05 40,75 39,23 37,27 37,12 23,02 18,58 8,89
б{7} 2,37 2,34 2,27 2,15 2,14 1,33 1,07 0,51
А, % —5,70 -4,22 —4,59 -4,61 0 0,54 4,04 3,39
Глава 6
НАСТРОЙКА АЛГОРИТМОВ
КУМУЛЯТИВНЫХ СУММ
1. Методика настройки АКС
(предварительные этапы)
Методика настройки АКС заключается в выполнении следую-
щих мероприятий: предварительного анализа объекта, экспери-
ментирования на объекте, идентификации моделей временных рядов
и собственно настройки АКС. Многообразие практических задач,
решаемых с помощью АКС, приводит каждыйТраз к появлению
определенных особенностей в проведении^этих мероприятий, но
их перечень и последовательность проведения достатцчно стабиль-
ны. Общая методика настройки АКС изображена на рис. 24 в виде
блок-схемы. Кратко остановимся на этапах предварительного ана-
лиза объекта, экспериментирования на объекте и идентификации
моделей рядов наблюдений.;
Предварительный анализ объекта. На этапе предварительного
анализа объекта необходимо решить следующие вопросы:
выделить перечень временных рядов (показателей качества,
входов и выходов объектов, показаний измерительных цепей и
т. п.), которые предполагается использовать для последователь-
ного обнаружения разладки;
выяснить физическую сущность разладки, вид распределения
вероятностей наблюдаемых сигналов и их параметрические моде-
ли, зоны нормального и разлаженного состояния или априорные
распределения и 02 в пространстве параметров;
оценить динамику протекания наблюдаемого процесса, потреб-
ные средние времена обнаружения разладки, допустимую часто-
ту ложных срабатываний;
оценить характеристики располагаемой ЭВМ.
Рассмотрим подробнее каждый из этих разделов. Вопрос вы-
деления некоторого набора наблюдаемых сигналов особенно ак-
туален при контроле многосвязных технологических объектов
или информационных систем с большим количеством наблюдаемых
сигналов. В каждом конкретном случае приходится решать, ка-
кие именно сигналы имеет смысл наблюдать, чтобы они обеспечи-
вали максимум информации о возможных отказах, поломках или
изменении свойств контролируемых объектов (см. гл. 1). Дать
какие-то общие рекомендации затруднительно, так как многое
здесь зависит от конкретной задачи. Некоторые подходы к реше-
нию такой задачи рассмотрены в работах [21, 171].
Во втором разделе особенно важно выявить зоны нормального
и разлаженного состояний в параметрическом пространстве. Сле-
дует иметь в виду, что зона нормального состояния определяется
121
Рис. 24. Общая методика настройки АКС
режимом функционирования объекта. Например, требования по
качеству снижаются, а следовательно, и допуски на технологиче-
ские показатели выходного продукта расширяются, если произо-
шло долговременное ухудшение сырьевой базы производства.
Если априорные распределения векторов 0Х и 02 трудно опреде-
лить, то возможно введение весовой функции в пространстве 0,
определяющей важность обнаружения тех или иных видов разла-
док. Часто такая информация может быть получена (конечно,
в содержательных терминах) от операторов систем управления,
персонала КИП а, наблюдателей-интерпретаторов при научных
наблюдениях, т. е. от сотрудников, которым приходится иметь де-
ло с интересующим объектом. Представление о налаженной и раз-
лаженной работе объекта частично может быть извлечено из тех-
нологических карт, ГОСТов и т. п.
В третьем разделе сосредоточена информация о динамике про-
текания процесса и связанных с этим потребном времени диск-
ретизации наблюдаемого процесса, среднем времени т обнаруже-
ния разладки и среднем времени Т между ложными тревогами.
Так как на предварительном этапе нельзя сказать, каковы будут
эти параметры в точности, то здесь желательно получить набор
различных вариантов \t, и и. Т, чтобы затем сопоставить их с рас-
четными значениями параметров.
Так как на этапе предварительного анализа объекта слишком
рано говорить о конкретном алгоритме и его'параметрах, инфор-
мация об ЭВМ (четвертый раздел), предполагаемая для исполь-
зования, нужна толькосамая общая: быстродействие (впоследствии
это может стать ограничением для выбора дискретности), опера-
тивная память и возможность ее наращивания, характеристики
периферийных устройств, такие, например, как допустимая ча-
стота дискретизации по времени и динамический диапазон аналог/
код преобразователей.
На этапе предварительного анализа объема чаще всего невоз-
можно получить по вышеперечисленным вопросам (а особенно
по первому и второму разделам) исчерпывающие ответы, которые
позволили бы сразу перейти к настройке алгоритмов. В этом слу-
122
чае следующим этапом является экспериментирование на объекте.
Под этим будем понимать подбор исследуемых последовательно-
стей из некоторого их множества (архива), а возможно, и специ-
ально поставленные эксперименты на объекте с целью их получе-
ния.
Эксперименты на объекте. Первый вопрос, возникающий при
экспериментировании на объекте, состоит в выборе участков реги-
страции. Такие участки должны соответствовать нормальному и
разлаженному состояниям объекта. Количество выборок каждого
типа определяется следующими факторами: количеством режимов
функционирования технологических агрегатов, что потенциально
может привести к изменению статистических свойств временных
рядов налаженного и разлаженного состояний, или количеством
характерных типов внешних условий при проведении научных наб-
людений; надежностью системы сбора и регистрации данных;
потребностью в контрольных выборках для имитации на ЭВМ ра-
боты алгоритма.
В качестве грубой оценки можно рекомендовать взять 10 вы-
борок каждого типа на каждый характерный режим функциони-
рования объекта.
Второй вопрос при экспериментировании — дискретность сбо-
ра данных. При этом возможны две ситуации: дискретность поступ-
ления данных от объекта априори задана и не может быть изме-
нена, если речь идет о контроле за состоянием дискретно наблю-
даемого объекта; дискретность поступления данных может
варьироваться, т. е. являться параметром настройки алгоритма.
Во втором случае при сборе данных нужно выбирать дискрет-
ность, исходя из спектрального состава наблюдаемых процессов,
так как именно это влияет на выбор дискретности работы алгорит-
ма. Хотя окончательный выбор дискретности происходит на этапе
настройки алгоритма, при сборе данных следует придерживаться
обычной рекомендации, т. е. выбирать дискретность [8] =
= 7\/(10 -ь 15), где — время спада автокорреляционной
функции наблюдаемого процесса до статистически незначимого
уровня.
Длина выборки определяется требуемой точностью последую-
щей оценки среднего времени т запаздывания в обнаружении
разладки и среднего времени Т между ложными тревогами.
Идентификация моделей. Этап идентификации моделей делится
на два подэтапа: первичный анализ временных рядов и идентифи-
кация моделей временных рядов.
Первичный анализ включает в себя построение гистограмм рас-
пределений, полученных выборочных оценок среднего, диспер-
сии, авто- и взаимно-корреляционных функций. В результате
этого грубо оцениваются статистические свойства наблюдаемых
процессов и корректируются требования к экспериментам на объ-
екте. Например, увеличивается частота дискретизации повремени
и после этого повторно снимаются выборки наблюдаемых сиг-
налов.
123
За первичным анализом временных рядов следует подэтап
идентификации моделей временных рядов. Как видно из гл. 5,
приходится иметь дело с одномерными и многомерными моделями
АРПСС (5.1.1) временных рядов и динамическими и статическими
линейными моделями объектов. Будем придерживаться работ
Т. Андерсона, Э. Хеннана, Дж. Себера, Дж. Бокса и Г. Джен-
кинса [1, 67, 54, 8] при идентификации этих моделей. Общая тео-
рия идентификации достаточно освещена в вышеуказанных рабо-
тах, поэтому здесь кратко остановимся преимущественно на тех
вопросах, которые особенно важны при настройке алгоритмов
обнаружения разладки.
Первым этапом идентификации моделей является определение
ее структуры. Для модели временного ряда или динамической мо-
дели объект—возмущение под выбором структуры понимается
выбор порядка полиномов АР и СС частей и порядка оператора
разности, который применяется к входу и выходу модели. Для
линейной регрессионной модели — это число регрессоров. Вы-
бором порядка разности необходимо устранить влияние нестацио-
нарности среднего уровня (если такое имеет место), т. е. устранить
мешающий параметр, влияние которого в противном случае при-
шлось бы устранять за счет усложнения алгоритма. Помимо стан-
дартных примеров решения этого вопроса [8], следует оценить
насколько существенно влияние сдвига среднего как мешающего
параметра на работу алгоритма обнаружения разладки.
Существует несколько возможных подходов к определению
порядков моделей. К сожалению, при практической их реализа-
ции трудно выделить лучший из них. Поэтому целесообразно при-
держиваться прагматического подхода, изложенного, в работе [8].
Смысл его (на примере подгонки модели АРСС) заключается в сле-
дующем. На основе свойств решения линейного разностного урав-
нения с постоянными коэффициентами проводится визуальный ана-
лиз выборочных автокорреляционной и частной автокорреляцион-
ной функций. Это позволяет грубо определить диапазон порядков
АР и СС частей и провести подгонку коэффициентов каждой
модели из этого диапазона. Полученные модели необходимо про-
тестировать с помощью критериев согласия 11, 8, 67]. Как видно
из предыдущих глав, многие расчеты базируются на предпол оже-
нии независимости приращения кумулятивной суммы. Поэтому
при подгонке моделей очень важно оценить, насколько правомер-
но предположение о независимости последовательности остатков,
которые получаются пропусканием наблюдаемой последователь-
ности через «обратный фильтр»
1 - Ф^1 — ... — фрг~р
1 — ijjiZ-1 — ... —
(xt — т),
(6.1.1)
где Ф1( . . ., Фр, Ф1, . . .,фч — выборочные коэффициенты АР
и СС частей модели АРСС (р, q), т — выборочное среднее. Это
124
реализуется С помощью кумулятивного %2-критерия автокорреля-
ции остатков ct [8]. Рассматривается величина
<2(^) = 7V3 4, (6.1.2)
г=1
где к — максимальное значение лага, в работе [8] рекомендуется
выбирать к — 20—25, которая асимптотически имеет центрально
'^-распределение с к — р — q степенями свободы для ситуации
когда идентифицированная модель адекватна исходным данным
Задавая 90%-ные или 95%-ные квантили для ^-распределения
с к — р — q степенями свободы и сравнивая с ними Q (х), полу-
чаем тест для проверки общей адекватности модели и степени
«выбеливания» последовательности остатков.
Кратко остановимся на задаче оценивания параметров моде-
лей временных рядов. Здесь наибольшее распространение полу-
чил подход Дж. Бокса и Г. Дженкинса [8], представляющий со-
бой двухступенчатую процедуру оценивания.
Первая ступень, или метод вторых моментов, заключается
в «разделении» АР и СС частей модели и оценивании коэффициен-
тов АР и СС частей посредством решения нелинейных уравнений
с заменой теоретических автоковариаций (в случае модели объект—
возмущение и взаимноковариаций) на выборочные. К сожалению,
если q 0, то в результате первой ступени получаются весьма не-
эффективные оценки [8, 25]. Более того, метод вторых моментов
в этом случае не гарантирует получение устойчивых полиномов
АР и СС частей, поэтому перед началом второй ступени необхо-
димо перевести неустойчивые корни полиномов АР и СС частей
во внутрь единого круга в комплексной плоскости. Вторая сту-
пень — это метод максимального правдоподобия. Получение
максимально правдоподобных оценок коэффициентов модели
АРСС или модели объект—возмущение сопряжено с нелинейной
минимизацией многоэкстремальной функции. Причем при q 0
число экстремумов может быть сопоставлено с количеством наб-
людений в обрабатываемой выборке [25]. Поэтому на успешное
окончание второй ступени оценивания параметров можно рассчи-
тывать только при удачных начальных условиях. Понятно, что
при переходе к многомерным моделям статистические и вычисли-
тельные трудности неизмеримо возрастают.
Таким образом, видно, что, даже если удалось верно угадать
структуру модели, подгонка коэффициентов доставляет много
трудностей, которые связаны в основном с необходимостью чис-
ленной минимизации нелинейной многоэкстремальной функции.
Поэтому целесообразно, где только возможно, использовать мо-
дели, подгонка коэффициентов которых сводится к методу наи-
меньших квадратов.
Наиболее важная для данного рассмотрения модель — это
«чистая» авторегрессия, т. е. модель АРСС (р, 0). В этом случае
метод вторых моментов сводится к решению уравнений Юла-
If»
Уокера с симметрической положительно определенной тепли-
цевой матрицей R [8]
Ф = R-»r,
где R = Toepl (£0, <5lt. . др^), Ф = || Фп . . Фр ||, гт =
= || <?i, . . др || , а выборочные оценки автоковариаций ск вычис-
ляются для ряда {xf} по формуле
N—к
(6.1.4)
i=l
Нормировка на N при вычислении ёк позволяет гарантировать
получение устойчивого полинома авторегрессии [16, 67]. Вторая
же ступень, или метод максимального правдоподобия, который
для модели АРСС (р, 0) сводится к минимизации квадратичной
формы, вообще не нужна, так как оценки Юла—У окера асимпто-
тически эффективны. Уравнение Юла—Уокера легко обобщаются
для модели АРССП (р, 0) (5.1.11) [67]
«Р = {Е ® С;1} С„ (6.1.5)
тде ® — знак кронекеровского (прямого) произведения матриц,
Е — единичная матрица (n X «),
Г (0) . . . Г (- Р + 1)
Г (1) Г (0) . . . Г (- р + 2)
Г(Р —1) ...Г(0)
СР1
срт
аРт
•Оценки ковариационных матриц Г (к) вычисляются следующим об-
разом
N-k
= 4 £(Х«-Х)(Х,-Х)^, Г(А) = ГГ(-А),
i=l
я
х = 4-£х., к=о,Р,
1=1
где Хг — тг-мерный вектор г-ro наблюдения временного ряда {Х^}.
Вектор-столбец оценок ар представляет собой р штук матриц А.к
авторегрессии (5.1.11), «растянутых» в столбец по следующему
правилу:
«pi = ay, I = (г — 1) пр + (к — 1) п + j, i, j = 1, п,
к = 1, р,
^1- — элемент к-й матрицы авторегрессии.
126
Аналогично формируется и столбец
ffpi = уц, I = (j — 1) пр + (к — 1) п + i, i, j = 1, п,
к = 1, р, уу — элемент матрицы Г (к).
В разд. 3 гл. 2 уже отмечалось, что сейчас существует много
эффективных вычислительных методов для нахождения коэффи-
циентов моделей АРСС (р, 0) и АРССП (р, 0) [106, 170]. Причем
применение рекуррентного вычисления коэффициентов модели
р-го порядка по модели (р — 1)-го порядка позволяет свести зада-
чу (6.1.5) к обращению матриц размером (и X га) [170].
После того как с помощью критериев установлена адекват-
ность выбора модели, выполняется массовый обсчет выборок од-
ного типа с целью выяснения стабильности коэффициентов модели.
Это делается на основе предположения об асимптотической нор-
мальности вектора оценок коэффициентов модели [1]. Применяя
критерий для проверки гипотезы о равенстве средних и ковариа-
ционных матриц совокупности гауссовских векторов [25], полу-
чаем возможность оценить степень «размытости» множества пара-
метров модели до и после разладки. Далее при настройке АКС
это будет предметом обсуждения.
Как отмечалось ранее, идентификацию необходимо выполнять,
имея в виду дальнейшее использование моделей при настройке
алгоритмов. Поэтому особое внимание следует обратить на устра-
нение неинформативных, а следовательно, потенциально мешаю-
щих параметров из модели. Для этого можно, например, снизить
порядок модели до некоторой степени в ущерб качеству подгонки,
если в результате этого будет устранен неинформативный пара-
метр. Такая модификация может в конечном итоге улучшить каче-
ство работы алгоритма. Для многомерных временных рядов,,
помимо этого, существует возможность декомпозиции п-мерной
случайной последовательности на п одномерных [33, 46] путем
проверки гипотезы о равенстве нулю недиагональных элементов
матриц авторегрессии и скользящего среднего.
Этап идентификации моделей должен заканчиваться выбором
типа модели, его параметризацией и оценкой диапазонов изме-
нения коэффициентов при различных режимах нормального и раз-
лаженного состояний контролируемого объекта.
2. Методы оптимизации АКС
Последний и основной этап методики настройки АКС заклю-
чается в таком выборе его параметров, чтобы значения функции
CBHLZ (0) были в каком-то смысле близки к требуемым на мно-
жествах ©j до и 02 после разладки. Условно выделим два типа
настройки: параметрический и выборочный. Параметрический
тип настройки использует для описания свойств временных ря-
дов до и после разладки непосредственно множества 0г и 02,
а при выборочной настройке свойства временных рядов до и после
разладки задаются выборочными оценками параметров модели или
727
достаточными статистиками. Так как практически все резуль-
таты параметрической ^настройки переносятся на выборочную,
то сначала рассмотрим первый тип настройки.
Параметрические методы настройки АКС. Разберем настрой-
ку каждого из трех вариантов АКС.
I вариант (значения вектора 0 до и после разладки из-
вестны точно). Множества и 02 представляют собой точки 0Х
и 02- Предположим вначале, что мешающие параметры отсут-
ствуют. Тогда единственный параметр, подлежащий настройке
в первом варианте АКСДЗ.2.2) — (3.2.4),— величина порога h.
Методы выбора h в этой ситуации хорошо освещены в литературе
[104, 155, 168] для случая гауссовской независимой последова-
тельности и разладки^о среднему (см. разд. 2 гл. 2). Наиболее
употребительно (помимо критериев из разд. 1 гл. 2) задание вели-
чин
= sup f (i0)== Ао(02), T = Lo(01)
t»>i I
таким образом, чтобы минимизировать взвешенную сумму т* и
средней частоты ложных тревог
h* — arg min {т* 4- А.71"1}, (6.2.1)
где X — размерный коэффициент, определяющий важность сла-
гаемых. Применяя аппроксимацииLo (0)изгл. 4, можно решитьза-
дачу настройки для рассматриваемых в работе последовательно-
стей. Например, из (4.2.6), при этом учитывая, что <о0 (0Д = —1
и ш0 (02) = 1, получим
h* = arg min {с2 (h + e~h — 1) + X (ci (ел — h 4- I))'1},
h
= | M I"1, i = 1,2
Дифференцируя no h выражение в фигурных скобках, полу-
чим уравнение для нахождения
crc^(1 — e~h) (eh + 1 — h)2 — (eh — 1) = 0. (6.2.2)
Для грубой оценки h* можно получить из (6.2.2) h* ~ In Лс^сД
(если априори ясно, что h 6 -j~ 10). Если задано предельное
значение Т*, то выбрать h, минимизирующее т*, можно, рассчи-
тывая h = h (Т) из (4.2.6). Другими словами, задача настройки
в этом случае проста и полностью сводится к методам гл. 4 Отме-
тим только, что при малых значениях т* и Т целесообразно
использовать1 границы для Lz (0) вместо приближенной оценки
А (6).
Пусть теперь присутствуют мешающие параметры и исследо-
вание чувствительности АКС (гл. 4, разд. 4) показало, что пре-
небречь ими нельзя. Тогда необходимо минимизировать влияние
мешающих параметров на этапе настройки алгоритма. Сделать это
можно разными путями в зависимости от располагаемой инфор-
128
мации: либо введением плотностей /, (0м) и /2 (0м) априорных рас-
пределений мешающей части 0м, вектора 0 до и после разладки,
либо установлением весовых функций к1 (0м) и v2 (0м), определяю-
щих сравнительную важность разных значений вектора 0м, либо
заданием диапазонов изменения вектора 0м. Однако, как будет
видно из дальнейшего, имеет смысл рассматривать эту задачу как
частный случай более общей задачи настройки АКС, когда вектор
до и после разладки «размыт». Эта задача рассматривается в сле-
дующем разделе.
II - III в а рианты АКС (значения вектора 0 до и пос-
ле разладки известны неточно). Прежде чем разбирать настройку
II варианта АКС, посмотрим на задачу обнаружения разладки
с иной стороны. Если значения параметров, характеризующих
свойства случайной последовательности до и после разладки, раз-
мыты в параметрическом пространстве, то естественно рассматри-
вать задачу о разладке как задачу обнаружения момента «изме-
нения образа». В задачах распознавания образов необходимо
отнести совокупность наблюдений к тому или иному состоянию
(классу) [65], в задаче о разладке необходимо обнаруживать мо-
мент, когда наблюдения перестали соответствовать первому клас-
су (норма) и перешли во второй (разладка). Без труда можно вве-
сти и несколько классов, соответствующих разладке. Все это не
просто формальная аналогия. Одно из основных понятий теории
распознавания образов — разделяющая поверхность— совершен-
но естественно вводится для АКС.
Пусть выполнены предположения гл. 4, при которых получены
оценка и границы для Ьг (0). Тогда если V0: М = 0 и вы-
полняется условие постоянства дисперсии М (>/Q) = const,
то под разделяющей поверхностью G целесообразно понимать мно-
жество точек 0. В самом деле, в силу монотонности Lo (0) (4.2.6)
Ло (6: М > 0) < Lo (0) < Lo (0: М (Agi/0) < 0)
и’на поверхности' G величина Lo (0) будет постоянна. При этом бу-
дет выполняться требование несмещенности, введенное в разд. 1
гл. 4. Даже в том случае, если М (Л g?/0) изменяется в определен-
ных пределах в зависимости от значения 0 или нарушаются усло-
вия гл. 4, целесообразно рассматривать G как разделяющую по-
верхность. Интуитивно ясно, что положительная величина
Af (Л g»/0) говорит о том, что более правдоподобна гипотеза
: 0 Е ©2, а отрицательная величина М (/\gt/Q) — о большем
правдоподобии гипотезы Но : 0 €=
Изменения вектора 0 имеют доминирующее направление. В этом
случае целесообразно использовать II вариант АКС (3.3.5) —
(3.3.7). Параметрами настройки в (3.3.5) — (3.3.7) являются ра-
счетные значения векторов с, 0О и величина порога h. Принци-
пиально возможно несколько вариантов задания областей и
0.2 (см. рис. 25). Каждый раз задача настройки II варианта АКС
5 И. В. Никифоров
129
Рис. 25. Варианты задания об-
ластей в случае 1Г вариан-
та А К С
заключается в таком выборе
разделяющей поверхности G
(см. рис. 25), определяющей
приращения Л gt, и порога /г,
чтобы можно было доставить
экстремум заданному крите-
рию качества. Рассмотрим
возможные методы настройки АКС в этих условиях.
Пусть определены непересекающиеся множества 0г и 02 зна-
чений вектора 0 до и после разладки и на них заданы плотности
/х (0) и /2 (0) априорных распределений вектора 0. Таким же об-
разом можно ввести весовые функции ty (0) и (0), аналогичные
рассмотренным в предыдущем разделе. К этому случаю сводится
и учет влияния мешающих параметров за счет включения в вектор
0 мешающей части. Если необходимо получить настройку, соот-
ветствующую «усредненной» ситуации, то перепишем (6.2.1)
с учетом априорных плотностей /х (0) и /2 (6):
{h*, 0*, с*} ~ arg min Jf /2 (0) т* (h, 0О, с, 0) dQ 4-
Л, 9, с U
01
+ У $ Л (0) г (h, 00, с, 0) doj- . (6.2.3)
Вместо плотностей /г (0) можно ввести в (6.2.3) весовые функции
иг (0). Априорная информация о поведении вектора до и после
разладки может ограничиваться только заданием областей 0Х и
02. В этом случае определим минимаксную настройку следующим
образом:
{h*, 0*, с*} = arg min {шах т* (h, 0О, с, I)} (6.2.4)
h, Ос, с 0cz€>2
130
при условии, что
min Т (Мо,с,е) > Т*. .
в = 01
(6.2.5)
Анализ выражений (6.2.3) — (6.2.5), а также зависимости СВН
показывают,,что, кроме одномерных случаев, осуществить такую
настройку сложцо. Причина этого заключается в нелинейной
зависимости A g/ от 0О для второго варианта АКС, в сложном
характере зависимости ненулевого корня ио = too (0) уравнения
М (e~“"Agf) •= 1, входящего в расчет Lo (0), от 0О и с, в нелинейной
зависимости аппроксимации СВН от 0. Однако ««существует до-
вольно широкий круг задач, в которых можно обойти эти труд-
ности полностью или частично. Во-первых, это минимаксная на-
стройка II варианта АКС при условии выпуклости областей Нх
и 02. Ввиду важности этой задачи рассмотрим ее отдельно в сле-
дующем разделе. А теперь перейдем к рассмотрению другого част-
ного случая настройки II варианта АКС.
Настройка «по направлению» при известном 0О.« Во многих
практических задачах предположение об известном 0О выглядит
естественным, например в технологических приложениях 0О
определяется рабочими диапазонами установок, технологиче-
скими картами, ГОСТами и т. п. Как отмечалось в гл. 4, чем бли-
же реальная характеристика Lo (0) к идеальной, тем лучше рабо-
тает процедура обнаружения разладки при любом виде кри-
терпя. В случае близких гипотез таким показателем является
, где т] = || 0 — 0о || • Рассмотрим эту величину
? ,0) = jAH)
~ ' дт|
из (4.3.11):
2 cTFi (0О) D
g(0) = —-4-Ь а (0) -° ,
V ' 3 o'.' (crFx (Oopc)1'2
(6.2.6)
где е — вектор, подлежащий выбору, Fx (0О) — информативная
матрица (г X г) на одно измерение, D — r-мерный единичный
вектор фактического направления.
Как видно из разд. 3 гл. 4, при заданном (0) качество работы
процедуры улучшается с ростом / (с, D) (4.3.14):
/ (с, D) = cTFx (0О) D/(cTFi (0о) с)7«.
Так как нас интересует выбор с для доминирующего направления,
предположим, что на поверхности 5 единичной сферы задана ап-
риорная плотность распределения / (D) вектора D, которая явля-
ется аналогом плотностей /х (0) и /2 (0) в случае близких гипотез.
Тогда находим с* следующим образом:
с* = arg max —° F1^0^ f (D) dS^ . (6.2.7)
s (СТГ! (0o) c)~
Таким образом, в случае близких гипотез и известном 0О с*
определяется из (6.2.7), а единственный оставшийся параметр
131
5*
настройки h определяется, исходя из требований предъявляемых
к величине Lo (0О). Если распределение / (D) неизвестно и задана
только область Sx на сфере, то (по аналогии с минимаксной на-
стройкой) с* получим так:
с* = arg max (min (- C_^?1 P. U . (6.2.8)
c I.DC-Si I (cr Fj (0O) c)1^ Jj ’
Настройка (6.2.8) соответствует максимизации минимальной (по
всем возможным направлениям) величины 5 (0). Чтобы проиллю-
стрировать выбор с* для случая близких гипотез, рассмотрим
такой пример.
Пример 1. Пусть информационная матрица F, (0О) =
= ХлЕ, где X — скаляр, аЕ — единичная матрица (2 X 2). Тогда
перепишем (6.2.6):
g(0) ------(0) cTD.
В данном случае удобно задавать с и D через углы а и Р между
единичными радиус-векторами и осью щ (йг) (см. рис. 26). При
этом сг = || cos a, sin а ||, DT = ([ cos р, sin р ||. Пусть фактические
направления D ограничены таким образом: Pj Р Р2- Если на
сегменте [Pi, Р2] задана априорная плотность распределения
/ (Р), то настройка (6.2.7) соответствует выбору
₽2
а* = arg max К / (Р) [cos a cos р + sin a sin Р] . (6.2.9)
Если априорная плотность неизвестна, а указаны лишь границы
сегмента, то определим а* из настройки (6.2.8):
сс* = arg max min (cos a cos p + sin a sin P) =
a
= arg max min cos (a — P).
a pi=CPCp2
Так как | a — p | n, to max min cos (a — P) = cos (min max
I a — P I).
После этого получим
a* = arg min max |a — p | = (Pi + p2)/2. (6.2.10)
a PiXPXpz
Если сравнить (6.2.9) и (6.2.10), то станет ясно, что минимаксный
выбор а* (6.2.10) соответствует заданию на сегменте [рг, р2] сим-
метричной функции / (Р).
При настройке по направлению существенно используется факт
наличия доминирующего направления D изменения вектора 0,
т. е. предполагается, что вектор D заключен в некоторый телесный
угол или выход из него для вектора D маловероятен. Если же
в пространстве параметров нельзя выделить доминирующее на-
132
Рис. 26. Графическая иллюстрация настройки по направлению
Рис. 27. Выбор эллипсоидов при настройке III варианта АКС
правление изменения вектора 0, то II вариант АКС использован
быть не может.
Изменение вектора 0 не имеет доминирующего направления.
В этом случае целесообразно использовать III вариант АКС
(3.4.5) — (3.4.8), в котором настройке подлежат: номинальное
значение вектора параметров 01; одно или два значения параметра
нецентральности Ао и А?, соответствующие налаженному и разла-
женному состояниям, и величина порога h. При этом величина
0Х выбирается либо обследованием, либо исходя из требований
технологии, ГОСТов и т. п. Что касается выбора величин Aq, А?
и h, то здесь приходится руководствоваться чисто эвристическими
соображениями, основанными на общих идеях ПКОВ. Будем вы-
бирать эллипсоиды нормального и разлаженного состояний таким
образом, чтобы обеспечить наилучшее качество работы АКС
в крайних в смысле «расстояния» d
d = (0-O1fF1(01)(0-01) (6.2.11)
точках. На рис. 27 показана эта ситуация. Область охвачена
эллипсоидом с минимальным А?, а 02 — с максимальным Ар
Имея в виду малость || 0 — 0Х ||, определим настройку А| следую-
щим образом:
Ад — max d (0); А^ — min d(0), (6.2.12)
0ЕЦ(е)=о в=/2(0)=о
где Л (0) = 0 и /2 (0) = 0 — уравнения границ областей 0Х и 02.
Кроме случаев, когда 0 — вектор средних гауссовского распре-
деления, необходимо проверять моделированием, выполняются
ли условия М (Agt/0 6= ®i) О и М (Agt./Q G= О2) > 0, где
Agt определяется из (3.4.4) или (3.4.9); Agt = (%t) — £t-i
(%t_i). Дело в том, что эллипсоиды, описывающие гипотезы Но
и Нг (см. разд. 4 гл. 3), не более чем аппроксимация, имеющая
смысл при близких гипотезах. Поэтому для страховки необходима
такая проверка.
133
Заметим, что с точки зрения распознавания образов III вариант
(см. (3.4.4)) АКС представляет собой нелинейное преобразование
исходных наблюдений, при котором размерность параметриче-
ского пространства уменьшается с dim {0} = г до dim {с?} = 1.
При этом условие полной разделимости множеств 0Х и 0.2 выгля-
дит так, что )> Л.2. К этому можно подойти и с информационной
точки зрения.
Рассмотрим среднюю информацию I (0: 0Х + Д 0) для раз-
личения гипотезы Н (0Х) и Н (0х + Д0) в предположении, что
норма || Д0 || мала. Пренебрегая на основании свойств регуляр-
ности в разложении логарифма правдоподобия членами выше вто-
рого порядка, получим [29]: I (0,: + Д 0) ~ (V2) Л 0rFx (0Х) Д 0.
Если трактовать 27? = Д QTF1 (0Х) Д 0 как единицу средней инфор-
мации I (0Х : 0О + ДО), то условие разделимости принимает вид:
I (01 : 0 -02!/ I (0j : 0 6=01), т. е. для выполнения условия
нужно, чтобы все точки множества 0t были менее информатив-
ны, чем точки из 02. Как отмечалось ранее (гл. 4), аналити-
ческие методы расчета величин т и Т для III варианта АКС не
могут быть применены, поэтому остается использовать статисти-
ческое моделирование процедуры (3.4.5) — (3.4.9).
Выбор дискретности наблюдения процесса. Если дискретность
наблюдения процесса доступна изменению, то она должна выби-
раться согласно общему критерию задачи о разладке. Например,
для систем текущего контроля технологического процесса необ-
ходимо минимизировать (по экономическому, технологическому
или иному критерию) суммарные потери от пропуска брака и от
применения системы контроля. Если выполнение очередного на-
блюдения имеет ненулевую цену, то естественно, что наблюдать
процесс с частотой выше определенной просто невыгодно. Рассмот-
рим, как меняется функция СВН в зависимости от частоты дискре-
тизации.
Пусть наблюдению подвержен случайный процесс х (t) в после-
довательные моменты времени 0, А I, 2 Д С 3 Л • . ., N Д /, где
A t — шаг дискретизации по времени. Таким образом, имеем слу-
чайную последовательность {^7}- Для I и II вариантов АКС и
независимых приращений £\gt рассмотрим оценку Д из (4.3.7)
для случая близких гипотез, но, заменив величину Lo (7?), изме-
ряемую в дискретах, на величину La (R) Д £ = Lo (R). измеряемую
в единицах времени, получим
Д (/?)бг = (2ЯЛ*/2 (0)бг + _ 1)/(2 Л2), R = р/(а/At).
(6.2.13)
Так как (7?)бг при заданной величине Д (0)дг зависит только
от R, то, исследуя зависимость R (ДО, можно понять, насколько
часто имеет смысл наблюдать исходный процесс х (£) Далее из
(6.2.6) ясно, что через R (ДО определяется и крутизна кривой
о , которая определяет ка-
7 / \ л йД(11)бг
Д (ц)бг при ц = 0 через-------------—
134
чество работы процедур обнаружения при близких гипотезах. Из
(6.2.13) выразим R2 : /?2 = ц2/(о2'Д0 = (ц2 (cTFx (0О) D)2)/
/(Д ? (cTFx (0о) с)).
Если с = D, то получим R2 = (т]2/Д?) (0О) с ~
~ (2/А Z) 1 (0О '• 6 + lie), т. е. можно рассматривать i/2 R2 в окрест-
ности 0о как информацию для различения гипотезы Но : 0 = 0О
против Нх : 0 = 0о + цс, получаемую в единицу времени. С умень-
шением дискретности A t информация, получаемая в единицу вре-
мени, будет расти, но во многих случаях R2 (А ?) асимптотически
приближается к некоторому пределу. Так обстоит дело для модели
АРПСС и разладки по среднему. Однако не в каждом случае ве-
личина R2 (Д t) имеет предельное значение (при Д t—>0), например,
для тех же моделей АРПСС и разладки по дисперсии (при посто-
янном среднем и автокорреляционной функции)/?2 (Д?) растет
теоретически.неограниченно, так как I (0О : 0 + цс) не зависят от
Д t (см. (5.2.32) — (5.2.34)). Следует иметь в виду, что при
Д t —> 0 корни характеристических полиномов АР и СС частей
моделей временных рядов могут приближаться к единичной окруж-
ности в комплексной плоскости, и это будет приводить к неустой-
чивости рекуррентного вычисления приращения A gt решающей
функции даже при малых отклонениях от расчетных значений
коэффициентов АР и СС частей. Поэтому теоретическое увеличе-
ние R2 (ДО при Д? —О практически не может быть реализовано
из-за указанной неустойчивости. Так как выбор дискретности
влияет на настройку через коэффициенты АРПСС моделей, то
целесообразно грубо оценить характер возрастения R2 (Д ?) при
Л t —> 0 и выбрать компромиссное значение Д t*, которое, с одной
стороны, дает R2 (Д ?*), близкое к R2 (0), а с другой — не приво-
дит к высокой чувствительности процедуры обнаружения к ошиб-
кам в определении коэффициентов моделей АРПСС и удовлетво-
ряет условиям технической реализации, а затем выполнить на-
стройку остальных параметров алгоритма. Закончим рассмотре-
ние следующим примером.
Пример 2. Пусть х (?) — гауссовский стационарный про-
цесс с автокорреляционной функцией вида сх (т) = 0 <
< а < оо, а под разладкой понимается изменение среднего тх.
Если наблюдать исходный процесс с дискретностью Д t, то это
будет последовательность авторегрессии первого порядка с коэф-
фициентом авторегрессии Ф = и дисперсией о2. Из (6.2.13)
получим выражение R2 (Д ?) = ((1 — (1 + е_“А1) ))
(тх/о)2, полагая (без потери общности) номинальным значение
тх = 0. Рассмотрим влияние уменьшения величины Д Z на R2.
Во-первых, дробь у (х) — (1 — е~ах)/(х (1 + е~ах)) при х )> О
убывает, так как ух = (2ахе~ах — 1 + е~2ах)/(х2 (1 + е-аж)2) < 0
при х )> 0. Это следует из того, что числитель у'х меньше нуля.
В самом деле / (х) = 2аже'“х — 1 + е~2ах < 0 при х Д 0, так как
/ (0) = 0, a f 'x = 2ае~ах (1 — ах — е~ах) < 0 при х )> 0 (из оче-
видного неравенства е~ах )> 1 — ах). Таким образом, у'х Д О
при х Д 0, т. е. у (х) — убывающая функция при х~^> 0.
135
Во-вторых, используя разложение е~ах в ряд Тейлора в ок-
рестности нуля, получим
1 — е~ах а 2 — ах -га2.г2 3 — о (х2)
.г (l|. e_coj 2 2 — ах а2х2/2— о (х2)
Очевидно, что lim у (ж) = а/2, причем функция у (ж) подходит
к-»о
к пределу а/2 очень полого, так как у (я?) — (а/2)(1 — ((a2za)/6))
при х -+ 0. Учитывая, что lim у'х (х) = 0, получим типичный вид
зависимости Й2 на рис. 28.
Окончательно переходя от
Рис. 28. Типичный вид зави-
симости R2 (Ьл)
(6.2.13) к пределу, получим предельно достижимую функцию
lira Zo (тх) = [4 (2aL0 (0)р — exp (к (2aL0 (0))’/») — 1]/сьЛ:2,
где к = тх/о.
Выборочные методы настройки. Смысл выборочной настройки
заключается в таком подборе параметров алгоритма обнаружения
разладки, чтобы на обучающем материале он работал наилучшим
(в смысле заданного критерия) образом, предполагая, что при
работе на объекте статистические свойства сигналов будут близки
к расчетным. Так как почти все методы параметрической настрой-
ки легко переносятся на выборочную, то в этих случаях будем
просто указывать соответствующую формулу из предыдущих
разделов, а основное внимание сосредоточим на отличиях этих
методов.
Оценки 01(- и 02г группируются вокруг двух точек. Если зна-
чения оценок максимального правдоподобия 01г, i = 1, и
02i, i = 1, N2, где IVi и У2 — количество обучающих выборок
первого и второго типов, группируются вокруг двух центров
(см. рис. 29, а) и разброс их вокруг центров определяется диспер-
сией оценок, то целесообразно использовать I вариант (3.2.2) —
(3.2.4) АКС. Как указывалось ранее, меру плотности группиров-
ки 01г и 02i можно оценить с помощью проверки гипотезы о равенст-
ве векторов средних и ковариационных матриц. При выборочной
настройке в качестве величин 0х и 02 выбираются усредненные по
множеству JV4 и N2 обучающих выборок векторы оценок 0Х и 02,
а выбор порога h выполняется аналогично (6.2.1) — (6.2.2).
Вопрос учета мешающих параметров 0м, как и при парамет-
рической настройке, является частным случаем более общей за-
Рис. 29. Варианты группиров-
ки оценок ©к и вц в парамет-
рическом пространстве
дачи настройки, когда оценки 01г- и 02г- «размыты» в пространстве
параметров.
После выборочной настройки I варианта АКС требуется оце-
нить точность полученных результатов, определяемую ковариа-
ционными матрицами оценок 0Х и 02. Приближенно это можно
сделать линеаризацией зависимостей т иТ относительно входящих
туда оценок 0Х и 02. Если величины полученных таким образом
оценок дисперсий т и Т окажутся больше требуемых, то легко
сформулировать требования к длине выборки для дополнитель-
ных экспериментов.
Оценки векторов 0Xj и 02; «размыты» в параметрическом прост-
ранстве, и существуют доминирующие направления изменения
вектора 0. Так же как при параметрической настройке, II вариант
АКС (3.3.5) — (3.3.7) подразумевает оптимальный выбор разде-
ляющей поверхности (см. рис. 29, б)) G = G (с, 0О) и h согласно
выражениям (6.2.3) — (6.2.5), где операция усреднения в (6.2.3)
с использованием априорных плотностей заменяется на усредне-
ние но множеству IVi и N2 обучающих выборок, а в соотношениях
(6.2.4) — (6.2.5) отыскание экстремумов в областях 0Х и 02 за-
меняется перебором по множествам и Лг2 обучающих выборок.
Выборочный аналог параметрической настройки «по направ-
лению» соответствует применению выражений (6.2.7) — (6.2.8)
с заменой интегрирования в (6.2.7) на оценку среднего направле-
ния изменения вектора 0 по выборке направлений D,, i = 1, N,
а в (6.2.8) область на сфере заменяется на выборку направле-
ний D;, получаемых из обучающего материала.
13?
136
До сих пор для параметрической и выборочной настроек ис-
следовалось влияние направления изменения вектора 0 на харак-
теристику АКС. Оценим теперь, насколько изменяется функция
СВН в зависимости от вариации элементов ковариационной мат-
рицы оценки граничного значения вектора 0О.
Пример 3. Как видно из гл. 4, в случае близких гипотез
качество АКС определяется аналогом отношения сигнал/шум R2:
R = г] (crFx (0О) D)/(crFx (0О) с)1/2. Отклоняя фактическое на-
правление D от расчетного с, можно понять, как меняется качест-
во работы алгоритма через зависимость Lo (0), где 0 = 0 (ц, D).
Так как обычно выбираем D с, упростим выражение R: R ==
= ц (crFj (0О) с)1/2 и рассмотрим чувствительность величины R
к изменению элементов ковариационной матрицы оценок Vx (0О) =
== F^1 (0О). Это бывает полезно, во-первых, для оценки дисперсии
величины (0), определяемой ковариациями выборочной оценки
матрицы УДво), а во-вторых, для оценки изменения L'R) при
вариациях точки 60. Так как характер зависимости R = R (Vx (0о))
довольно сложен, линеаризуем ее в окрестности расчетного зна-
чения V*:
Г г
R (V^ + AV) = R (V?) + £ А^ + о (II AV ||), (6.2.14)
i=l j=l v
где AV — || Др,] || — симметрическая матрица отклонений (г X г),
используя [3]
д (ХГА~ХХ)/9А = || д (Хт А~1Х)/дац || = — (A~lf ХХТ
и учитывая симметричность матрицы Vx (0О), получим
R (V* + A V) ж Я (V*) + ц - T--(F1 (9о) с?Г^(г9о.1.^у2 (6.2.15)
(CTFX (0О) е)^
при || AV || —> 0. Так как оценка максимального правдоподобия
Оо асимптотически распределена по нормальному закону, то расп-
ределение выборочной ковариационной матрицы оценки 0О яв-
ляется обобщенным ^-распределением [25]. Обобщенное ^-расп-
ределение (распределение Уишарта) практически неприменимо
для расчетов, поэтому вновь воспользуемся результатами для
больших выборок (У -+ оо). Тогда из [25] получим
COV (Cjk<?im) = У-1 (qmCkl + СцСкт), (6.2.16)
где Cjk и Cjk — выборочная оценка и теоретическая ковариация.
Используя линеаризацию (6.2.14), оценим дисперсию R:
Л(Я)~ВХЖ, (6.2.17)
138
где R^ = || rM || — г (г + 1)/2-мерный вектор производных
лт II дЯ дЯ дЯ дЯ дЯ ||
|| ^1Г <?гл;2 ^2г ^гг II
(6.2.18)
f 1, если j = к-,
аЛ I 2, если /<(&;
R„ = || rMI || = || cov (слс(т) || — ковариационная матрица вы-
борочных оценок (г (г Ц- 1)/2 X г (г + 1)/2).
В матрице Rcc и векторе RB индексы М и I элементов вычис-
ляются следующим образом: М = (/ — 1) г + к, (k^f)- I =
= (Z-1) г -j- m, (m I). В соответствии с (6.2.17) оценка дис-
персии £ (0) может быть получена
4 (0) . т
D £ (0)) RXcR,, (6.2.19)
у cJ Ft (0о) е
где элемент гмг(‘Г 2L --мерного вектора определяется из (6.2.18) как
i'M = ицс/уь где/д. — элемент матрицы Fi (0О) ccTFi (0О). На прак-
тике вместо неизвестных теоретических значений cit! приходится
иметь дело с выборочными оценками ковариаций вектора 0О,
которые асимптотически (при N ->• оо) сходятся к с^., и исполь-
зовать их в формулах (6.2.16) — (6.2.19). Однако, для того чтобы
грубо (до порядка величины) оценить погрешность параметров
Н (0) и R, от которых зависит функция £0 (0), такой аппроксима,
ции достаточно.
Оценки векторов и 02« «размыты» в параметрическом про-
странстве, и не существует доминирующего направления измене-
ния вектора 0. При выборочной настройке III варианта АКС
алгоритма (3.4.5) — (3.4.8) процесс отыскания значений A.q и
модифицируется таким образом, чтобы в соотношении (6.2.12)
отыскание шах и min по границам областей О, и 02 заменить пере-
бором по точкам 0i;, i = 1, Ах и 02i, i = 1, N2.
Адаптивная настройка II и III вариантов АКС. Имеет смысл
упомянуть еще об одной возможности выборочной настройки.
Допустим, что нам точно известно значение 02 вектора парамет-
ров 0 после разладки. И наоборот — неразлаженное состояние
известно плохо, так как значение вектора 0t все время изменяется1
с течением времени. В этой ситуации возможно такое эвристиче-
ское решение.
Будем рекуррентно оценивать вектор параметров 0Х = 01 (t)',
наблюдая последовательность {X*}. Обозначим 0и оценку векто-
ра 0Х в момент времени t. Как именно осуществить текущее оце-
нивание 0н, зависит от конкретных условий. Для этого обычно
используется, рекуррентный МНК. Весовая функция может быть
либо экспоненциальной, т. е. учитывать наблюдения X>—\. . . .
139
. . Xj co все убывающими значениями весовых коэффициентов
оц_д, . . «1, либо кусочно-постоянной, т. е. использовать
Х/_д, . . Х(_д_м+1 с постоянными весами: оц_д = «г_д_1 = . . .
. . . = а(_д_м+1 = const, а все остальные наблюдения не исполь-
зовать вовсе: а^-д-м = ...=«1=0. Величина А выбирается
равной среднему запаздыванию т в обнаружении разладки, чтобы
не использовать для оценки 9 наблюдений за разлаженным со-
стоянием. После получения очередной оценки 01; необходимо ис-
пользовать первый вариант АКС (3.2.2) — (3.2.4). Если за точку
02 принимается «центр тяжести» области 02 разлаженного состоя-
ния, то можно использовать II вариант АКС (3.3.5) — (3.3.7).
В этом случае оценка единичного вектора направления с получа-
ется следующим образом: ct = (02 — 0i()/|| 02 — 0ц ||, а гранич-
ное значение 0О вектора параметров 0 рассчитывается, например,
как точка пересечения поверхности доверительного эллипсоида
оценки 0ц с лучом, идущим из точки 01( в направлении с. Нако-
нец, если о разлаженном состоянии ничего не известно, то, зада-
вая параметры нецентральности и Х?, можно использовать III
вариант АКС (3.4.5) — (3.4.8).
3. Сведение настройки АКС к решению задачи
квадратичного программирования
Этот раздел посвящен решению одной частной, но важной за-
дачи — минимаксной настройке II варианта АКС. В разд. 2
были указаны трудности, которые мешают применить общий ме-
тод настройки типа (6.2.3) — (6.2.5) в случае векторного парамет-
ра 0. Чтобы преодолеть их, сделаем следующие предположения.
Минимаксная настройка в случае экспоненциального семейст-
ва распределений. Пусть наблюдения принадлежат к г-парамет-
рическому экспоненциальному семейству распределений в форме
(3.3.8). В этом случае приращение решающей функции для первых
двух вариантов АКС, р-связной марковской последовательности
и первой модели разладки становится линейной функцией (3.3.10)
от параметров
bgt = 3 CjTj (XLP) + со, (6.3.1)
где с0 — центрирующая добавка, Х;_р-вектор наблюдений. Число
настроечных параметров в этом случае равно г + 2. Это вектор
ст = || с17 . . ., сг || и скалярные параметры с0 и h. Если дополни-
тельно предположить близость гипотез, т. е. принять оценку кор-
ня со010) (4.3.2) в окрестности точки 0О , то получим
M(^gt/6) = 3 cJ-A7(7’y(XLp)/0) + со,
(6.3.2)
Л7(А^/0о) = стЛ (0о)с,
140
Рис. 30. Зависимость СВН при минимаксной настройке АКС
Рис. 31. Положение разделяющей плоскости при минимаксной настройке
АКС
где Fr (0) =
д2 In с (0)
90. 90;
i, j= 1, г.
Таким образом, видим, что здесь необходим переход от векто-
ра параметров 0 к вектору tcT = || xt, . . ., пг ||, где х7- =
= М (Тj (Х;_р)/0). При этом областям и 62 в параметрическом
пространстве соответствуют области Ях и Я2 в координатах х15 . . .
. . ., хг. Однако это не является серьезным осложнением, так как
в большинстве случаев содержательная интерпретация через X;
сохраняется. Например, в случае гауссовской последовательности
АРПСС и разладки по вектору средних хх, . . ., хг — прост-
ранство средних. Пусть разладка заключается в обнаружении
изменения коэффициентов авторегрессии модели АРПСС (р, d, 0);
тогда, используя аппроксимацию (5.2.41), получим, что Хх, . . .
. . ., хг — набор автоковариаций наблюдаемого ряда, которые
однозначно связаны с коэффициентами авторегрессии. Все это
доказывает, что переход к х7- не таит в себе опасностей.
Как следует из формул (4.3,7), (4.3.11), качество АКС в рас-
сматриваемом случае определяется величиной отношения R2 сиг-
нал/шум: R = ц/о = p,/(crFx (0О) с)1/2, р, = М (Agt/ty.
Проанализируем его. Во-первых, как отмечено в разд. 3 гл. 4,
величина R не зависит от нормы с. Во-вторых, известно, что оп-
тимальный выбор величины р,х до и р2 после разладки независимо
от выбора h [155] такой, что р,х = —р2 (см. рис. 30). Из этих двух
соображений следует, что минимаксная настройка АКС заключа-
ется в выборе с и с0 такими, чтобы величины | R | были равными
и максимальными в «крайних» точках Кх и К2 непересекающихся
областей Ях и Я2 (см. рис. 31), что соответствует оптимизации «тя-
желейшего» случая. Это позволяет преодолеть указанные в разд. 2
'трудности и отделить настройку с и с0 от h.
141
Таким образом, минимаксная настройка (6.2.4) — (6.2.5) для
экспоненциального семейства распределений в форме (3.3.8) соот-
ветствует решению записанной ниже задачи математического
программирования. Найти настроечные значения с* и с*:
{с*, с*} = arg min {сгЛ (0о) с} (6.3.3)
С, Со
при условиях
стК2 + с0 > т, К2 й2,
(6.3.4)
cTKi + с0 — т, КхеЯг,
где т — положительная константа, Ki = || Иц, . . ., Хц. ||. По-
сле того как найдены с и с0, не представляет трудности с помощью
аппроксимации функции СВН или верхних и нижних границ
(см. гл. 4) подобрать соответствующее значение h. При этом ве-
личина запаздывания т в обнаружении разладки получается
подстановкой в (6.3.2) и (4.3.7) настроечных значений с, с0, h и
координат точки К2. Среднее время Т от начала наблюдения до
ложной тревоги рассчитывается также, но с использованием ко-
ординат точки Kj.
Задача (6.3.3), (6.3.4) с точки зрения обучения распознаванию
образов представляет собой отыскание такой разделяющей плос-
кости
сгХ1 + с2х2 4- . . . + сгхг + с0 = 0, (6.3.5)
которая была бы максимально «удалена» от областей й] и Й2.
(см. рис. 31). Если области Й1 и й2 представляют собой выпуклые
многогранники или выпуклые многогранные области, то задачу
(6.3.3), (6.3.4) можно еще существенно упростить, сведя ее к квад-
ратичному программированию.
Пусть непересекающиеся области й2 и й2 задаются системой
линейных неравенств — ограничений: AjK^>bi; А2К ba, где
At и Л2 — матрицы условий размером (Л X г) и (J2 X г), 1ц и
Ь2 — /1- и /2-мерные векторы ограничений. Известно [23],
что при любом выборе с и сй условия (6.3.4) будут достигаться
в угловых точках областей Qi и Й2, т. е. в вершинах многогранни-
ков или многогранных областей (см. рис. 32). Это позволяет пе-
реписать условия (6.3.4) следующим образом:
сгК > т при К — Кг €= й2,
cTK<J — т при К = Кг€ЕОь
где сг = || с0, с1у . . ., сг || — (г + 1)-мерный вектор переменных^
Д, 12 — количество вершин многогранных областей; Kf = || 1,
Иц, . . ., х,г || — (г 4- 1)-мерный вектор, в котором хл, . . ., xjr —
координаты i-й вершины областий. Окончательно получим зада-
чу квадратичного программирования. Найти настроечное значение
142
вектора с*:
с* = arg min {cTFi (0О) с}
О
при условиях
А2С > rol2, AjC < — mii,
где
(6.3.6)
(6.3.7)
М = 1},
А,- — расширенные матрицы условий размером (Ij X (г 4~ 1)),
j -- 1, 2, строками которых служат векторы K.f, lj — /j-мерный
вектор, состоящий из единиц.
Особенно проста геометрическая интерпретация такой задачи
при единичной матрице Fi (0О). В самом деле, в этом случае вели-
чина
. ciKi + с2х2 + . .. + сгхг + с0
Л — ------„ - - :z =----
l/4 + с’ + ...+с*
играет роль расстояния между разделяющей плоскостью (6.3.5)
и точкой с координатами xlt . . ., хг. Необходимо так провести
плоскость (6.3.5), чтобы расстояние | R | от нее до ближайших
вершин областей Йх и й2 было бы максимальным. Заметим, что к
подобной задаче — максимизации расстояния | R | — приводит
метод «обобщенного портрета» [12, 13] при обучении распознава-
нию образов. В задачах (6.3.3) — (6.3.7) безразлично, как выбрать
тп, и поэтому] удобно принять величину т = 1.
До некоторой степени можно варьировать настройку, передви-
гая оптимум от границ внутрь областей и О2. Этого можно до-
биться выбором различных констант для неравенств — ограниче-
ний в (6.3.4) и (6.3.7). В первом неравенстве (6.3.4) надо использо-
вать величину т^, а во втором — т2, так же и в (6.3.7). На рис. 30
показана типичная зависимость Lo (R), и на горизонтальной оси
отмечены две точки R± = mJ о и = —т2/о. Выбранным значе-
ниям mt и тг соответствует передвижение прямой 4- с2х2 +
4- с0 = 0 (см. рис. 32) ближе к точке К2 пропорционально отно-
шению m-i/mt. Продолжим обсуждение минимаксной настройки
следующим примером.
Пример 4. Рассмотрим обнаружение изменения вектора
Мх средних re-мерной последовательности APCCn (1, 0). Из (5.3.5)
следует, что
Agt = (Xt - АХ J)Tc 4- со с = (Rx - ARx А1')'1 (Е - А) с.
Как видно из последнего равенства, в качестве координат хх, . . .
- . х„ выступают координаты вектора К = (Е — А) Мх- Наст-
143
ройке подлежат с, с0. Так как Xf — гауссовский вектор, то нет
необходимости предполагать близость гипотез. Задавая области
и О2, получим задачу квадратичного программирования (6.3.6),
(6.3.7). Еще упростим задачу, пусть п = 2, А — нулевая матри-
ца и Fi = Е. Области нормального и разлаженного состояний за-
даются следующими системами ограничений:
| — 1, | +
I А I
( —mi4-m2>l; ( —— 1.
Эти области изображены на рис. 33. Тогда задача (6.3.6) — (6.3.7)
с* — arg min {с? + с2}
с
при условиях
( Ci 4~ 1 ,
с -4-с < 1 сг = ||с0>с1,с2||.
I — Ci ~г со % —
Так как с2 не входит в систему ограничений, очевидно, что с* =
= 0, тогда с* = min {max (1 + с0, 1 — с0)}. Окончательное ре-
шение имеет вид с*г = || 0, 1, 0 || и поэтому уравнение разделяю-
щей поверхности (6.3.5): Xi = 0 (см. рис. 33).
В заключение отметим трудности вышеизложенного метода на-
стройки. Во-первых, кроме тех случаев, когда матрица Fi(0)
не зависит от 0, необходимо заранее оценить 0О, так как Ft (0О) —
матрица квадратичной формы (6.3.3) и отклонение ее элементов
от истинных значений будет менять решение задачи настройки.
Оценить влияние выбора точки 0О можно, исследуя чувствитель-
ность решения задач (6.3.3) — (6.3.4) или (6.3.6) — (6.3.7) к ва-
риациям элементов матрицы Fx (0) и зависимость этих элементов
от 0. Во-вторых, основное предположение этого метода — пос-
тоянство СВН Lz (0) на плоскости (6.3.5) — выполняется лишь
в специальных случаях (например, в гауссовском), а для произ-
вольного экспоненциального распределения вместо плоскостей,
равных Lz (0), существуют поверхности, которые в случае близ-
ких гипотез аппроксимируются плоскостями. Поэтому после ре-
шения задач (6.3.3) — (6.3.7) нужно проверить степень искаже-
ния, вносимую такой аппроксимацией. Уточнения значения ©о
можно добиваться многократным решением задач (6.3.3) — (6.3.7).
При этом результаты предыдущего решения нужно использовать
для уточнения оценки 0О.
Рассмотренный метод минимаксной настройки может быть ис-
пользован в случае близких гипотез не только для параметриче-
ского экспоненциального семейства в форме (3.3.8). В самом деле
(см. разд. 3 гл. 4): М (hgt/Q) pc^Fi (0О) D; М (Agf2/0o) =
= cTFi (©о) с.
Очевидно, что, рассматривая величину А = cTFi (0О) 0О как
центрирующую добавку, получим уравнение разделяющей плос-
144
Рис. 32. Задание областей Qi и й2
системами линейных неравенств
Рис. 33. Графическая иллюстрация
минимаксной настройки АКС
кости в параметрическом пространстве cTFi (0О) 0 — X = 0. Если
области ©1 и 02 представляют собой непересекающиеся выпуклые
многогранники, то задача (6.3.6) — (6.3.7) имеет вид. Найти наст-
роечное значение вектора с*:
с* = argmincTFi (0О) с (6.3.8)
С
при условиях
А2с > ml2,
AjC —ml
(6.3.9)
где сг = || X, щ, . . ., сп || — (г + 1)-мерный
настройки. Матрица А; имеет вид
вектор
параметров
1 0ц , . .., е1г
М =
1 0М1,.. . , 0Мг
где 0П, . . ., 01г — координаты вершин многогранников ©х и 02.
Так как здесь поверхности равных Lz (0) аппроксимируются плос-
костями, переход от величины X* к новому значению 0* выполня-
ется путем проекции точки 0О на разделяющую плоскость
c*rFi (0О) 0 — X* = 0. В задаче (6.3.8) — (6.3.9) в наибольшей
степени используется факт близости гипотез, так как в отличие
от задачи (6.3.6) — (6.3.7) аппроксимация используется и при
расчете M(Agt \ 0). Поэтому здесь вопросы проверки применимости
всех упрощений играют особо важную роль.
Рассмотрим выборочную минимаксную настройку II варианта
АКС. Все отличие выборочной настройки от параметрической
в случае экспоненциального семейства (3.3.8) заключается в за-
мене матриц А;- в (6.3.7). Теперь матрицы А; будут содержать вы-
борочные оценки векторов К{ = || zib . . ., хгг ||, где i = 1, Л
для налаженного и i = 1, 12 для разлаженного состояний наблю-
даемой последовательности. При этом будет много таких выбо-
рочных оценок К;, которые станут неактивными ограничениями
145
при решении задачи квадратичного программирования, однако
заранее обнаруживать их нельзя (кроме простейших случаев)
и, следовательно, задача будет содержать столько ограничений—
неравенств (7Х + /2), сколько обучающих точек содержит экспе-
риментальный материал.
Выборочный аналог настройки (6.3.6) — (6.3.7) имеет еще одну
•особенность — необходимо проверить факт полной разделимости
точек Кг ейх (i = 1, Д) и точек Кг е £22 (i = 1, Z2), где S2X
и й2 — множества обучающих точек (реализаций) из налаженно-
го и разлаженного состояний, разделяющей плоскостью (6.3.5).
Иными словами, необходимо проверить совместность системы
<(6.3.7) ограничений — неравенств. Если система (6.3.7) несовмес-
тима, то необходимо установить, какие точки из множеств £2Х
и 112 следует отбросить, чтобы достигнуть совместности системы
ограничений. Из эвристических соображений ясно, что при этом
желательно отбросить минимально возможное число обучающих
точек Кг. Такая задача решалась при обучении распознаванию
образов. Здесь возможно несколько приемов. Например, можно
использовать метод линейного программирования [15, 48, 51]
или градиентные методы поиска решения [65].
4. Программное обеспечение этапов
настройки АКС (описание набора программ)
Для реализации предварительных этапов настройки и опти-
мизации АКС автором разработан набор программ, который осу-
ществляет следующие функции: организация архива данных на
магнитной ленте; устранение грубых ошибок при вводе данных;
элементарная статистическая обработка, т. е. расчет оценок сред-
него, дисперсии, авто- и взаимно-корреляционных функций, по-
строение гистограмм; предварительная и окончательная подгонка
одномерных моделей временных рядов типа АРПСС, вычисление
ковариационных матриц оценок, тестирование моделей, анализ
остатков, расчет параметрических автокорреляционных функций,
спектральных плотностей и корней характеристических полино-
мов; подгонка по методу вторых моментов многомерных времен-
ных рядов типа АРПССП (р, d, 0), вычисление ковариационных
матриц оценок, тестирование моделей, анализ остатков, подгон-
ка по методу вторых моментов динамической модели типа (5.4.5);
минимаксная настройка II варианта АКС для модели АРПСС
(р, d, 0); реализация I, II и III вариантов АКС для модели АРПСС
(р, d, 0); реализация алгоритмов апостериорного обнаружения
разладки для моделей АРПСС (р, d, 0) и АРПССП (р, d, 0).
Разработанный набор прикладных программ содержит 35 про-
грамм и подпрограмм, написанных на языке Фортран-IV. При ра-
боте пакета используется стандартное математическое обеспече-
ние ОС и ДОС ЕС, включающее в себя пакеты прикладных про-
грамм по линейной и матричной алгебре, математической статис-
146
тике и полиномам. Набор может использоваться на ЭВМ типа
М-4030, ЕС-1022, а также на ЭВМ СМ-4 (с учетом введения допол-
нительных подпрограмм).
В настоящее время стало почти традицией сопровождать ра-
боты по прикладной статистике программами на Фортране-IV.
Это дает возможность исследователям, решающим практические
задачи, сразу же опробовать предлагаемые методы если уж не
на реальной задаче, то во всяком случае на серьезном тест-приме-
ре. После такой апробации интерес к тому, что они прочли, либо
возрастает, либо пропадет. И то и другое полезно, так как даже
при отрицательном результате исследователь не затратит много
времени для его получения.
В приложении приведены исходные тексты 15 подпрограмм
на Фортране-IV из вышеуказанного набора программ. В них во-
шли наиболее простые, но достаточно интересные с практической
точки зрения программы. Всем желающим на практике ознако-
миться с предлагаемыми методами достаточно отперфорировать
карты согласно исходным текстам и путем написания коротких
ведущих программ провести интересующие их эксперименты на
ЭВМ. В эти 15 подпрограмм входят 3 подпрограммы для подгон-
ки и анализа моделей временных радов, 2 подпрограммы для их
имитации на ЭВМ, 5 подпрограмм для реализации АКС и 5 под-
программ для реализации методов апостериорного обнаружения
разладки. В соответствии с современными тенденциями все ис-
пользуемые подпрограммами массивы могут быть объявлены в ве-
дущей программе одномерными. Далее приведены инструкции по
использованию подпрограмм.
Подпрограмма ARP. Назначение. Подпрограмма пред-
назначена для вычисления оценок среднего, автоковариационнойг
функции и коэффициентов модели авторегрессии р-го порядка.
Коэффициенты модели (5.1.3) АРПСС (р, 0, 0) вычисляются мето-
дом приближенного максимального правдоподобия, МНК, мето-
дом Юла — Уокера [8].
Обращение: CALL ARP (X, N, Р, DB, DM, F, E, S,
IND, EPS, IER)
Входные параметры: X — массив, содержащий ис-
ходную выборку, после решения центрируется; N — длина мас-
сива X; Р — целое, порядок авторегрессии; IND — управляю-
щий индекс, IND = 1 — вычисляются оценки приближенного
максимального правдоподобия, IND = 2 — вычисляются оценки
МНК, IND =3 — вычисляются оценки Юла — Уокера; EPS —
величина относительного допуска в подпрограмме SINV [53].
Выходные параметры и рабочие масси-
в ы: DB — массив длиной (р2 + р)/2, содержит верхний треуголь-
ник обратной матрицы выборочных ковариаций, упакованный по
столбцам; DM — массив длиной р + 1, содержит выборочные ав-
токовариации с лагами 0, 1, . . ., р, (лаг = 0 — оценка диспер-
сии); F — массив длиной р, содержит оценки коэффициентов ав-
торегрессии; Е — оценка среднего; S — оценка дисперсии оста-
147
точного шума; IER — индекс ошибок, IER = 0 — нормальное
решение, IER = —2 — ошибка при вводе р < 1, IER = —3 —
ошибка при вводе N < 2р + 1, IER = —1 и IER = к > 0 —
ошибки в подпрограмме SINV [53].
Используемые подпрограммы: SINV — обра-
щение положительно определенной симметрической матрицы [53].
Подпрограмма ESTARP. Назначение. Подпрограмма
предназначена для быстрого вычисления оценок коэффициентов
авторегрессии модели (5.1.3) АРПСС (р, 0, 0) и определителя кор-
реляционной матрицы методом быстрой декомпозиции Холецко-
го. Кроме этого, по результатам работы подпрограммы простыми
вычислениями получаются оценки коэффициентов моделей авто-
регрессии от 1 до р — 1 порядков [138].
Обращение: CALL ESTARP (R, Р, В, DET, A, D, Z,
EPS, IER)
Входные параметры: R — массив длиной р, оцен-
ки автокорреляции с лагами 1, 2, . . ., р; Р — целое, порядок
авторегрессии; EPS — величина положительного допуска, с ко-
торым сравниваются элементы диагональной матрицы декомпози-
ции [138], обычно EPS = 10~8 ч- 10-6.
Выходные параметры и рабочие масси-
вы: В — массив длиной р оценок коэффициентов авторегрессии
модели р-го порядка; DET — значение определителя корреля-
ционной матрицы; А — массив длиной шах (((р — 1) 2 + р —
— 1)/2, 1), содержит элементы треугольной матрицы декомпози-
ции Холецкого, D — массив длиной р, содержит элементы диаго-
нальной матрицы декомпозиции; Z — массив длиной р содержит
старшие коэффициенты Фп, . . ., Фрр последовательности моде-
лей авторегрессии от 1-го до р-го порядков [138]; IER — индекс
ошибки, IER = 0 — нормальное решение, IER = к 0 — сви-
детельствует о том, что к-й элемент диагональной матрицы разло-
жения меньше допуска EPS (это свидетельствует о близости к ну-
лю определителя корреляционной матрицы).
Примечание. В массиве А после решения содержатся
элементы нижнего треугольника матрицы декомпозиции Холец-
кого, за исключением единичной диагонали [138]. Элементы ниж-
него треугольника упакованы по столбцам.
Подпрограмма AUTOAR. Назначение. Подпрограмма
для вычисления параметрической автокорреляционной функции
модели авторегрессии р-го порядка. Значения автокорреляций
с лагами от 1 дор вычисляются решением уравнений Юла—Уоке-
ра, а последующие значения автокорреляций с лагами от р + 1
до N — посредством решения разностного уравнения [8].
Обращение: CALL, AUTOAR (Е, Р, В, N, A, IER)
Входные параметры: F — массив коэффициентов
-авторегрессии длиной р; Р — целое, порядок авторегрессии;
N — максимальный лаг.
Выходные параметры и рабочие масси-
вы: В — массив длиной N, содержит значения автокорреляцион-
'148
ной функции с лагами 1, 2, . . N; А — рабочий массив длиной
р2; IER — индекс ошибки, IER =0 — нормальное решение,
IER =2 — ошибка при вводе р < 1, IER = 1 — сингулярная
система линейных уравнений.
Используемые подпрограммы: SIMQ — ре-
шение системы линейных уравнений [53J,_J
Подпрограмма GRGV1. Назначение. Подпрограмма
предназначена для генерации псевдослучайных нормально расп-
ределенных векторов X с нулевыми средними и заданной ковариа-
ционной матрицей В. Вектор X получается умножением треуголь-
ной матрицы А на псевдослучайный вектор V с единичной кова-
риационной матрицей [49].
Обращение: CALL GRGV1 (В, А, X, V, N, IX, KL,
IER)
Входные параметры: В — массив, содержащий
верхний треугольник ковариационной матрицы, размещенный по
столбцам, длина массива (№ + N)/2; N — длина вектора X;
IX — базовое число для генерации псевдослучайных чисел под-
программой GAUSS; KL — управляющий индекс, KL У' 0 —
в результате решения будет получена матрица преобразования
A, KL = 1 — в результате решения будет получена матрица А
и вектор X, KL 2 — в результате решения будет получен век-
тор X в предположении, что матрица А получена ранее и сохране-
на в оперативной памяти.
Выходные параметры и рабочие масси-
вы: А — массив длиной (N2 + N)I2, содержит нижний треуголь-
ник матрицы преобразования А, размещенный по строкам; X —
массив длиной N, при KL 1 содержит искомый псевдослучай-
ный вектор с заданной ковариационной матрицей; V — массив
длиной N, при KL О 1 содержит вспомогательный псевдослучай-
ный вектор с единичной ковариационной матрицей; IER — ин-
декс ошибки, IER =0 — нормальное решение, IER = к — в про-
цессе вычисления матрицы А на к-м шаге потеряна точность или
ковариационная матрица неположительно определена (подробно
см. в работе [49]).
Примечание. Если необходимо сгенерировать последо-
вательность псевдослучайных векторов X, то при первом обраще-
нии к GRGV1 необходимо установить KL = 1, а затем KL р 1.
Используемые подпрограммы: GAUSS — ге-
нерация псевдослучайного гауссовского числа [53]; LOG — вы-
числение номера элемента матрицы в одномерном массиве [53].
Подпрограмма GGARS. Назначение. Подпрограмма
предназначена для генерации псевдослучайной гауссовской по-
следовательности авторегрессии р-го порядка длиной N. Первые
р значений последовательности генерируются подпрограммой
GRGV1, как гауссовский вектор с заданной ковариационной мат-
рицей [8]. Остальные значения последовательности рассчитывают-
ся по рекуррентному уравнению (5.1.3) для модели АРПСС (р,
149
Обращение: CALL GGARS (X, N, F, P, A, DX, EXr
EA, SIGA, IX, KL, IER)
Входные параметры: N — длина генерируемой по-
следовательности; F — массив коэффициентов авторегрессии дли-
ной р; Р — целое, порядок авторегрессии; DX — дисперсия по-
следовательности; ЕХ — среднее последовательности; IX — ба-
зовое число для генерации последовательных чисел подпрограм-
мой GAUSS; KL — управляющий индекс, KL = 1 при первом
обращении к подпрограмме, KL 2 при повторных обращениях
к подпрограмме, для получения серии псевдослучайных последо-
вательностей с одинаковыми параметрами.
Выходные параметры и рабочие масси-
вы: X — рабочий массив, содержит в первых N ячейках псевдо-
случайную последовательность, длина массива вычисляется по
следующей формуле: max (А, р2 + 2,5/?); А — рабочий массив
длиной (р2 + р)/2; ЕА — содержит значение общей константы
авторегрессионного уравнения; SIGA содержит значение средне-
квадратичного отклонения ое последовательности независимых
гауссовских случайных величин в (5.1.3); IER — индекс ошибки,
IER =0 — нормальное решение, IER = —2 — ошибка при вво-
де р < 1, IER = —1 — сингулярна система линейных уравне-
ний в подпрограмме AUTOAR, IER = к 1 — сообщение об
ошибке из подпрограммы GRGV1.
Примечание. Если необходимо получить серию реали-
заций псевдослучайных последовательностей, то массивы A, F
и простые переменные Р, EX, ЕА, SIGA должны сохраняться в
ведущей программе между обращениями.
Используемые подпрограммы: AUTOAR —
вычисление параметрической автокорреляционной функции;.
GRGV1 — генерация псевдослучайного гауссовского вектора;
GAUSS — генерация псевдослучайного гауссовского числа [53].
Подпрограмма CUSUM1. Назначение. Подпрограмма
предназначена для вычисления приращения Agt решающей функ-
ции II варианта АКС для модели авторегрессии р-го порядка.
Приращение вычисляется по формуле (5.2.37).
Обращение: CALL, CUSUM1 (W, F, ВЕТ, С, DGT,
AW, Р)
Входные параметры: W — массив длиной (р + 1),
последние точки наблюдений последовательности, W (1) = xt,
W (2) = х4_!, . . ., W (р + 1) = xt-p, которая должна иметь ну-
левое среднее; F — массив длиной р, коэффициенты авторегрессии
р (1) = р (2) = Фа, . . ., F (р) — Фр согласно обозначениям
(5.2.37); ВЕТ — среднеквадратичное отклонение белого шума <т0
(5.2.37), С — массив длиной (р + 1) из элементов вектора направ-
ления С (5.2.37); Р — целое, порядок авторегрессии.
Выходные параметры: DGT — значение прираще-
ния Agt (5.2.37); AW — рабочая переменная.
Подпрограмма CUSUM2. Назначение. Подпрограмма
предназначена для многократного последовательного обнаруже-
.150
ния переходов от налаженного состояния наблюдаемой последо-
вательности к разлаженному и обратно, а также для оценки
моментов появления разладок. Предполагается, что наблюдения
моделируются последовательностью типа АРПСС (р, d, 0). Реализу-
ется II вариант АКС (5.2.4), (5.2.37). Для оценки момента разлад-
ки согласно (3.2.5) в подпрограмме вычисляется запаздывание nt .
Обращение: CALL CUSUM2 (У, F, X, ВЕТ, С, Я, Р1,
DI, GT, AW, IND, INDD, ITAU)
Входные параметры: V — значение xt наблюдаемой
последовательности в момент t, последовательность {^} или ее
конечная разность должны иметь нулевое среднее; F — см. опи-
сание подпрограммы CUSUM1; ВЕТ — см. описание подпрограм-
мы CUSUM1; С — см. описание подпрограммы CUSUM1; Я —
порог h в (5.2.4); Р1 — целое, порядок авторегрессии плюс еди-
ница; D1 — целое, порядок разности плюс единица; IND — уп-
равляющий индекс, IND = 1 — при первом обращении к под-
программе, IND >-1 — при последующих обращениях.
Выходные параметры и рабочие масси-
вы: X — рабочий массив длиной (р + 1) (cZ + 1); GT — значе-
ние решающей функции gt (5.2.4); AW — рабочая переменная;
INDD — индекс состояния, INDD =0 — процесс в налаженном
состоянии, INDD = 1 — процесс в разлаженном состоянии;
ITAU — оценка запаздывания при обнаружении последней раз-
ладки.
Примечание. Подпрограмма позволяет осуществлять
режим многократного обнаружения разладок. При первом обра-
щении к подпрограмме необходимо установить следующие значе-
ния переменных: GT = 0., INDD = 0. После того как обнаружена
первая разладка (см. (5.2.4)), индекс состояния будет установ-
лен следующим образом: INDD = 1. До тех пор, пока последова-
тельность находится в разлаженном состоянии INDD = 1. После
обнаружения факта возврата последовательности к налаженному
состоянию устанавливается INDD =0 и режим обнаружения
разладки продолжается. Для обнаружения переходов от налажен-
ного состояния к разлаженному и обратно используется одно зна-
чение порога в (5.2.4).
Используемые подпрограммы: CUSUM1 — рас-
чет приращения решающей функции II варианта АКС.
Подпрограмма LOGCHI. Назначение. Подпрограмма
предназначена для вычисления логарифма отношения правдопо-
добия St (%t) для ^-распределения по формуле (3.4.9).
Обращение: CALL LOGCHI (Р, N, СШ2, LAMB21,
LAMB22, IND, ITER, EPS, Y, IER)
Входные параметры: P — целое число степеней
свободы ^-распределения; N — число отсчетов t, по которым рас-
считана статистика в (3.4.9); CHI2 — значение статистики х*
в (3.4.9); LAMB21 — действительная переменная, параметр 7ц
в (3.4.9); LAMB22 — действительная переменная, параметр
151
в (3.4.9); IND — управляющий индекс, IND 1 — при первом
обращении к подпрограмме, IND ^>1 — при последующих об-
ращениях к подпрограмме; ITER — максимальное допустимое
число членов ряда в гипергеометрической функции 0F1 (с, х)
(3.4.4); EPS — положительный допуск, если n-йчлен ряда гипер-
геометрической функции оЛ (с, х) (3.4.4) не превышает EPS, то
остальные члены разложения отбрасываются.
Выходные параметры: Y — значение логарифма
отношения правдоподобия St (%г) (3.4.9); IER — индекс ошибки,
IER =0 — нормальное решение; IER = 1 — в подпрограмму
введено отрицательное значение статистики %t (3.4.9), IER — 2 —
в подпрограмме не достигнута требуемая точность разложения
oF1 (с, х) (3.4.4) при заданном значении ITER.
Примечание. Значение ITER не должно превосходить
30.' Значение EPS подбирается на практике в зависимости от тре-
бований точности решения, возможностей ЭВМ и т. п. Ориенти-
ровочные значения EPS = 10-3 10'в.
Подпрограмма CUSUM4. Назначение. Подпрограмма
предназначена для вычисления решающей функции g? III вариан-
та АКС (3.4.6), (3.4.9), (5.2.46) для последовательности авторег-
рессии />-го порядка.
Обращени е: CALL CUSUM4 (W, F, ВЕТ, С, Р, NCHI,
LAMB21, LAMB22, IT, IND, ITER, EPS, AW, В, V, GT, IER)
Входные параметры: LAMB21, LAMB22, ITER,
EPS — те же, что и в подпрограмме LOGCHI, W — массив (см.
описание подпрограммы CUSUM1); F — массив длиной р, содер-
жит коэффициенты авторегрессии (5.2.46); ВЕТ — стандартное
отклонение белого шума в (5.2.46); С — массив длиной ((р 4-
+ I)2 4- р + 1)/2, содержит верхний треугольник матрицы Fj1 (0j)
(см. вывод (5.2.46), расположенный по столбцам; Р — целое, по-
рядок авторегрессии; NCHI—число параметров, разладку кото-
рых необходимо обнаруживать, NCHI << р + 1; IND — управ-
ляющий индекс IND = 1 — при первом обращении к подпро-
грамме, IND 1 — при последующих обращениях к подпро-
грамме; IT — число отсчетов £после последнего обнуления
решающей функции.
Выходные параметры и рабочие масси-
в ы: AW — рабочая переменная; В — рабочий массив длиной
(р + 1), результат матричного произведения V X С; V — рабо-
чий массив длиной (р + 1), содержащий вектор эффективных вкла-
дов, накопленный по (IT + 1)-му отсчету наблюдаемой последо-
вательности; GT — значение решающей функции gt (3.4.6); IER —
индекс ошибки, IER = 0 — нормальное решение, IER == 1,
IER = 2 — ошибки в подпрограмме LOGCHI (см. описание под-
программы LOGCHI).
Используемые подпрограммы: MPRD — ум-
ножение матриц [53]; LOGCHI — вычисление логарифма отноше-
ния правдоподобия для ^-распределения.
Подпрограмма CUSUM3. Назначение. Подпрограмма
152
предназначена для многократного последовательного обнаруже-
ния переходов от налаженного состояния наблюдаемой последо-
вательности к разлаженному и обратно и для оценки моментов
появления разладок. Предполагается, что наблюдаемая последо-
вательность типа АРПСС (р, d, 0). Реализуется III вариант АКС
(3.2.4), (3.4.6), (3.4.9), (5.2.46). Для оценки момента разладки со-
гласно (3.2.5) в подпрограмме вычисляется запаздывание nta.
Обращение: CALL CUSUM3 (V, F, X, ВЕТ, С; Я, Р1,
DI, NCHI, LAMB21, LAMB22, GT, AW, IND, ITER, EPS, В, VI,
INDD, ITAU, IER)
Входные параметры: F, BET, C, NCHI, LAMB21,
LAMB22, IND, ITER, EPS — те же, что и в подпрограмме
CUSUM4; V — см. описание подпрограммы CUSUM2; Я — значе-
ние порога h (3.2.4); Pl —целое, порядок авторегрессии плюс еди-
ница; D1 — целое, порядок разности плюс единица.
Выходные параметры и рабочие масс и-
в ы: GT, AW, В, IER — те же, что и в подпрограмме CUSUM4,
а VI — то же, что V; X — рабочий массив длиной Pl X D1;
INDD — индекс состояния, INDD =0 — процесс в налаженном
состоянии, INDD = 1 — процесс в разлаженном состоянии;
ITAU — оценка запаздывания при обнаружении последней раз-
ладки.
Примечание. Подпрограмма позволяет осуществлять
режим многократного обнаружения разладок. При первом обра-
щении к подпрограмме необходимо установить INDD = 0. Да-
лее согласно примечанию к подпрограмме CUSUM2.
Используемые подпрограммы: CUSUM4 —
вычисление решающей функции gt III варианта АКС для последо-
вательности авторегрессии р-го порядка.
Подпрограмма MREESR. Назначение. Подпрограмма
предназначена для оценивания коэффициентов линейной регрес-
сионной модели (5.4.1) рекуррентным МНК [35]: yt = Xt’F + е;,
F< = Fw - Pt (X4Fhl - Xtyt), P, = Р;_! - Рг_!Хг [1 +
+ Х^-^ИХД^.
Обращение: CALL MREESR (A, K, Y, F, P, WORK,
Wl, W2)
Входные параметры: A — количество регрессоров
(размерность вектора Х4); К — номер обращения к подпрограмме,
К = 1 при первом обращении; Y — массив длиной А + 1, со-
держит отклик и регрессоры, т. е. Y (1) = yt, Y (2) = xtl, . . .
. . ., У (А1) = <rtN; W1 — при первом обращении к подпро-
грамме должна содержать значение диагональных элементов на-
чальной матрицы Ро.
Выходные параметры и рабочие масси-
вы: F — массив длиной А, содержит вектор оценок Ff коэффи-
циентов регрессии; Р — рабочий массив длиной (А2 А)/2,
содержит верхний треугольник симметрической матрицы Pf;
WORK — рабочий массив длиной A; W2 — рабочая переменная,
содержит оценку it.
153
Примечание. Массивы F, Р, WORK не должны изме-
няться вне подпрограммы. Начальное значение W1 диагональных
элементов симметрической матрицы Ро выбирается, исходя из
возможностей ЭВМ, обычно W1 = 103 н- 104.
Используемые подпрограммы: MMPRD1 —
умножение симметрической матрицы A (N X N) на столбец
В (N X 1). Результат помещен в столбец С (N X 1). Верхний
треугольник матрицы А должен храниться в памяти по столбцам.
Массив А имеет длину (№ -|- А)/2, а массивы В и С имеют дли-
ну N.
Подпрограмма MRELF. Назначение. Подпрограмма
предназначена для рекуррентного оценивания по МНК коэффи-
циентов гауссовской последовательности АРПСС (р, d, 0) и лога-
рифма функции правдоподобия (ЛФП) (2.3.10) без второго члена
(1/2) In det которым можно пренебречь, если объем выборки
А ^>> р и N d. Это предположение проходит для обработки
средних и длинных временных рядов при условии, что время кор-
реляции невелико по сравнению с N.
Обращение: CALL, MRELF (X, NUM, Р, D, NN, EPS,
SI, EX, F, S, WORK1, WORK2, WORK3, CUSUM, ESTLF,
IER)
Входные параметры: X — рабочий массив дли-
ной (р 4- 1) (d 1) + 1, содержащий (р + 1) последнее значе-
ние временного ряда и его разностей по d-ro порядка включи-
тельно, при обращении к подпрограмме в ячейку X (1) должна
быть помещено значение oct временного ряда; NUM — номер об-
ращения к подпрограмме, NUM = 1 при первом обращении;
Р — целое, порядок авторегрессии; D — целое, порядок разно-
сти; NN — начальный допуск (см. примечание); EPS — положи-
тельная константа, ограничивающая снизу величину квадратич-
ной формы в ЛФП (2.3.10) EPS = 1(Г:! -ь 10~5; SI — то же са-
мое, что и W1 в подпрограмме MREESR.
Выходные параметры и рабочие масси-
в ы: ЕХ — рекуррентная оценка среднего; F — массив длиной
(р + 1), при NUM р содержит вектор оценок коэффициентов
авторегрессии и постоянного члена модели АРПСС (р, d, 0); 5 —
оценка о| дисперсии остатков модели АРПСС (р, d, 0); WORK1 —
рабочий массив длиной (р + 1); WORK2 — рабочий массив дли-
ной ((р + I)2 + р + 1)/2; WORK3 — рабочий массив длиной р;
CUSUM — рабочий массив длиной 2 (р + 1) + (р2 + р)/2;
ESTLF — при NUM NN содержит оценку ЛФП; IER — ин-
декс ошибки; IER = 0 — нормальное решение, IER = 1 — полу-
ченные оценки коэффициентов авторегрессии соответствуют квад-
ратичной форме в ЛФП (2.3.10) модели АРПСС (р, d, 0), меньшей
по значению, чем EPS.
Примечание. Начальный допуск NN Р + D выби-
рается исходя из статистических свойств обрабатываемого времен-
ного ряда. Предварительно можно установить NN = 5 -ь 30, до
154
тех пор пока NUM NN, в подпрограмме не вычисляются ЕХ,
оценки о2 и ЛФП. Массивы F, W0RK2, W0RK3, CUSUM не
должны изменяться вне подпрограммы. То же относится к масси-
ву X, кроме его первого элемента.
Распределение памяти в массиве X.
XI Xt-1 Xt-1, xt—p .., 1.
Используемые подпрограммы: MMPRD1 —
умножение матриц; MREESR — рекуррентный MHKJ
Подпрограмма MAPDET. Назначение. Подпрограмма
предназначена для апостериорного обнаружения разладки по-
следовательности АРПСС (р, d, 0). Предполагается, что времен-
ные ряды до и после разладки независимы. Одновременно с оцен-
кой момента разладки вычисляются коэффициенты моделей АРПСС
до и после разладки.
Обращение: CALL MAPDET (X, N, Pl, P2, DI, D2, NN,
IND, SI, EPS, ESTMIN, F, WORK1,WORK2, WORK3, CUSUM,
XX, ESTLF, NLF, ESTAR, L, IDET, IERR)
Входные параметры: X — массив с исходной выбор-
кой наблюдений; N — длина массива X; Р1 — целое, порядок
авторегрессии до разладки; Р2 — целое, порядок авторегрессии
после разладки; D1 — целое, порядок разности до разладки;
D2 — целое, порядок разности после разладки; NN — краевой
(начальный и конечный) допуск (см. примечание); IND — управ-
ляющий индекс, IND = — 1 коэффициенты моделей до и после
разладки не запоминаются, IND =0 — запоминаются коэффи-
циенты модели после разладки, IND = 1 — запоминаются коэф-
фициенты моделей до и после разладки, SI, EPS — см. описание
подпрограммы MRELF; ESTMIN — минимально возможное зна-
чение ЛФП (см. примечание).
Выходные параметры и рабочие мас-
сивы: F — рабочий массив длиной, равной max (рх, р2) 1;
WORK1 — рабочий массив длиной, равной max (рх, р2) + 1;
WORK2 — рабочий массив длиной, равной max ((рг + I)2 +
+ Pi + 1)/2 ; W0RK3 — рабочий массив длиной, равной
max (pn р2); CUSUM — рабочий массив длиной, равной
max (2 (р; + 1) + (рг2 + рг)/2); XX — рабочий массив длиной,
равной max ((рг 4- 1) (dt -f- 1)) + 1, перед обращением занулить;
ESTLF — массив значений ЛФП для полной выборки длиной, равной
N — 2 * NN; NLF — после решения равно длине массива ESTLF;
ESTAR — массив, содержащий коэффициенты моделей АРПСС
(р, d, 0); L — после решения равно длине массива ESTAR (при
IND^>0); IDET — оценка момента разладки, полученная согласно
формуле (2.3.7); IERR — количество сообщений IER = 1 из
подпрограммы MRELF, полученное за время обработки исход-
ной выборки.
155
Примечание. Краевой допуск NN обозначает число точек
с начала и с конца выборки, для которых момент разладки не об-
наруживается, обычно NN — 5-4- 30. Об удачности выбора NN
можно судить по величине IERR. Величина ESTMIN обычна
выбирается равной наибольшему по абсолютной величине отри-
цательному числу, представимому в ЭВМ. В ведущей программе
длины массивов ESTLF и ESTAR объявляются равными NLF
и L, где L принимает следующие значения: IND = —1, длина
L = 1 (т. е. ESTAR объявляется простой переменной); IND = 0,
длина L = ра 2; IND = 1 длина L = рх + р2 + 4.
Распределение памяти в массиве ESTAR.
IND = 0 F(l) ... F (P2 + 1) S
IND = 1 F(l) ... F(P1 + 1) S F (1) ... F(P2 + 1) S
Используемые подпрограммы: MRELF —
рекуррентное вычисление по МНК оценок коэффициентов гаус-
совской модели АРПСС (р, d, 0), остаточной дисперсии и прибли-
женной ЛФП.
Подпрограмма MRELF1. Назначение. Подпрограмма
предназначена для рекуррентного оценивания среднего, диспер-
сии, автокорреляционной функции (АКФ), частной автокорреля-
ционной функции (ЧАКФ), а также коэффициентов авторегрессии
гауссовской последовательности АРПСС (р, d, 0), определителя
корреляционной матрицы, остаточной дисперсии и ЛФП (2.3.10).
Обращение: CALL MRELF1 (X, NUM, Р, D, NN, EPS,
EX, VAR, SACF, SPACF, F, FP1, S, DET, W0RK1, W0RK2,
WORK3, CUSUM, CUSUM1, ESTLF, IER).
Входные параметры: NUM, P, D, NN — то же самое,
что и в подпрограмме MRELF; X — рабочий массив длиной
(р + 1) X (d + 1), отличается от соответствующего массива в под-
программе MRELF тем, что короче на одну ячейку; EPS — см.
описание подпрограммы ESTARP.
Выходные параметры и рабочие м ас с и -
в ы: EX, S, W0RK3, CUSUM, ESTLF — то же самое, что и в под-
программе MRELF; VAR — оценка дисперсии; SACF — массив
длиной р, при NUM NN содержит оценки АКФ, SPACF —
массив длиной р, при NUM )> NN содержит оценки ЧАКФ;
F — массив длиной р, при NUM NN содержит оценки коэф-
фициентов авторегрессии; FP1 — при NUM NN содержит
оценку постоянного члена модели АРПСС (р, d, 0); DET — при
NUM )> NN содержит значение определителя корреляционной
матрицы; W0RK1 — рабочий массив длиной р; W0RK2 —
то же самое, что и массив А в подпрограмме ESTARP; CUSUM1 —
156
рабочий массив длиной 3 (р + 1); IER — см. описание подпро-
граммы ESTARP.
Примечание. О выборе начального допуска см. в опи-
сании подпрограммы MRELF. Массивы X, CUSUM, CUSUM1,
W0RK3 не должны изменяться вне подпрограммы, кроме первого
элемента массива X.
Используемые подпрограммы: ESTARP —
быстрое вычисление оценок коэффициентов авторегрессии,
MMPRD1 — умножение матриц.
Подпрограмма MAPDT1. Назначение. Полностью ана-
логично подпрограмме MAPDET.
Обращение: CALL MAPDT1 (X, N, Р1ж Р2, DI, D2, NN,
IND, EPS, ESTMIN, F, SACF, SPACF, W0RK1, W0RK2, W0RK3,
CUSUM, CUSUM1, XX, ESTLF, NLF, ESTAR, L, IDET, IERR)
Входные параметры: X, TV, Pl, P2, DI, D2, NN,
IND, ESTMIN — то же, самое, что и в подпрограмме MAPDET;
EPS — см. описание подпрограммы MRELF1.
Выходные параметры и рабочие мас-
сив ы: F, SACF, SPACF, W0RK1, W0RK2, W0RK3, CUSUM,
CUSUM1 — то же самое, что и в подпрограмме MRELF, причем
для расчета длин массивов р и d выбираются следующим образом:
р = max (Pl, Р2), d = max (DI, D2); XX — рабочий массив
длиной, равной max ((рг 4- 1) (<Тг + 1)); ESTLF, NLF, IDET,
IERR — см. описание подпрограммы MAPDET; ESTAR — мас-
сив, содержащий оценки среднего, дисперсии, АКФ, ЧАКФ,;
коэффициенты модели АРПСС (р, d, 0) и определителя корреля-
ционной матрицы до и после разладки (см. примечание); L— после
решения равно длине массива ESTAR (при IND > 0).
Примечание. Выбор NN и ESTMIN аналогично подпро-
грамме MAPDET. Длина L массива ESTAR в ведущей программе
выбирается так, что L = 1 при IND = — 1; L = Зр2 -}- 5 при
IND = 0; L = 3 (р! + р2) + 10 при IND — 1.
Распределение памяти в массиве ESTAR.
IND =0
EX VAR SACF SPACF F FP1 S DET
IND = 1
ЕХ VAR SACF SPACF F FP1 S DET EX VAR S DET
Используемые подпрограммы: MRELF1 —
рекуррентное вычисление среднего, дисперсии, АКФ, ЧАКФ,
коэффициентов модели АРПСС (р, d, 0), определителя корреля-
ционной матрицы и ЛФП; ARDATA — заполнение массива
ESTAR.
Глава 7
ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ
КУМУЛЯТИВНЫХ СУММ
1. Примеры использования АКС
при контроле производства
В разд. 2 первой главы был очерчен круг задач, которые
естественным образом приводят к необходимости последователь-
ного обнаружения момента изменения свойств временного ряда.
Исторически первые применения алгоритмов обнаружения раз-
ладки были осуществлены для решения задач текущего контроля.
Различным аспектам применения алгоритмов последовательного
обнаружения разладки посвящены работы [41, 42, 78, 96, 115,
130, 136].
Кратко рассмотрим основные результаты в этом направлении.
Наибольший прогресс на сегодня достигнут в области контроля
качества непрерывной или штучной (но непрерывно вырабатывае-
мой) продукции. Следует вспомнить, что собственно АКС в его
первоначальном виде (2.2.7) был разработан Е. С. Пейджем [141]
для решения задачи непрерывного контроля производства.
В 50-х и 60-х годах, когда управляющие ЭВМ не были распро-
странены столь широко, как теперь, текущий контроль с помощью
АКС осуществлялся накладыванием У-маски (см. рис. 7) на гра-
фическое изображение кумулятивной суммы. Практически во
всех известных работах предполагалось, что наблюдается после-
довательность независимых случайных величин с известной дис-
персией о2, а под разладкой подразумевалось изменение среднего
тп. Типичным примером использования АКС для контроля непре-
рывной продукции является обнаружение скачкообразного изме-
нения среднего удельного веса листового материала [120]. В этой
работе сериальная корреляция в последовательности наблюдений
рассматривалась как мешающий параметр.
В последние годы в связи с появлением управляющих мини-
и микро-ЭВМ п созданием развитых АСУ крупными производ-
ствами все более актуальной становится задача оперативного
обнаружения неисправностей технологических агрегатов, радио-
электронного оборудования, датчиков систем управления [171,
172]. Такие задачи эффективно решаются, например, в нефтепере-
рабатывающей промышленности [95]. Изящное применение АКС
для контроля гироскопических приборов рассмотрено в работе
[136]. Применение АКС как правила, согласно которому произ-
водится замена изношенного оборудования, рассмотрено в работе
ИЗО].
В качестве контролируемого параметра в работе [130] фигу-
рировал коэффициент поломок. При его увеличении выше опре-
158
Рис. 34. Упрощенная схема смешивания сырья при производстве цемента
деленного уровня АКС подавал сигнал о разладке и производи-
лась замена изношенного оборудования. Закончим рассмотрение
вопросов применения АКС при контроле производства следующим
примером 133, 41, 42, 115].
Текущий контроль исходного сырья в АСУ ТП цементного
производства. Производство цемента представляет собой слож-
ный многоступенчатый процесс, начинающийся добычей сырьевых
компонентов на карьерах и заканчивающийся помолом цемента
и отгрузкой его потребителю. В силу непрерывного характера
протекания процесса и его многостадийности большое значение
приобретает текущий контроль всех основных параметров техно-
логического процесса, оборудования, системы датчиков и испол-
нительных механизмов. Рассмотрим применение АКС на участке
приготовления сырьевой смеси.
Оптимальное управление смешиванием сырьевых компонентов
является наиболее технологически и экономически важной зада-
чей при производстве цемента [14]. Типовая структура сырьевого
цеха изображена на рис. 34. Сырьевые компоненты (известняк,
мергель, пиритные огарки и т. п.) поступают с карьеров или
складов в бункеры, откуда непрерывно дозируются в определен-
ных соотношениях в сырьевую мельницу, где происходит измель-
чение и перемешивание смеси. Затем смесь транспортируется
в гомогенизационный силос, в котором происходит ее окончатель-
ное перемешивание. Из силоса смесь подается в печь. На этом
заканчивается участок приготовления сырьевой смеси. Задача
управления смешиванием сырьевых компонентов заключается
в поддержании технологических модулей — функций, зависящих
от концентраций четырех окислов А12О3, CaO, SiO2, Fe2O3
в смеси, около заданных значений. Для многих заводов [14, 331
характерно наличие трех сырьевых компонентов.
159
При этом необходимо стабилизировать не менее трех показа-
телей качества, поэтому число независимых управлений меньше
числа стабилизируемых модулей, что приводит (в общем случае)
к смещенному решению задачи с квадратичным критерием качест-
ва. Технологические задания для модулей выбираются определен-
ным образом в зависимости от среднего химического состава от-
дельных компонент. Однако из-за выработки разных слоев карьера
в случайный момент времени может происходить систематическое
отклонение химического состава одного (или даже нескольких)
сырьевых компонентов, что чаще всего (в силу смещенности реше-
ния задачи управления) приводит к неустранимым отклонениям
модулей от расчетных величин и выпуску бракованной продукции.
Как показало исследование [42, 115], изменение среднего химиче-
ского состава часто носит скачкообразный характер, поэтому
скорейшее обнаружение момента времени систематического откло-
нения модулей от задания является типичной задачей обнаружения
разладки случайной последовательности.
Обозначим тройку технологических модулей на шаге t трех-
мерным вектором Х4. Тогда последовательность {Xf} — это по-
следовательность показателей, характеризующих качество сырье-
вой смеси. В неизвестный момент времени t0 вектор средних М.у
последовательности {Х^} скачком меняет свое значение. Пусть
заданное значение вектора (соответствующее кондиционной смеси)
есть Мх = Мх. Вокруг вектора Мх существует определенный
допуск. В трехмерном пространстве определить его трудно, и
поэтому удобнее задать допуски на каждую компоненту вектора
Мх = || т1, т2, т3 ||. Целесообразно это и потому, что, как по-
казало обследование заводов [42], структура модели трехмерного
временного ряда {X?} такова, что она допускает покомпонентную
декомпозицию. Дело в том, что анализ подогнанной к данным трех-
мерной модели авторегрессии АРПСС3 (р, d, 0), где р 2, d 1,
показал диагональную структуру матриц авторегрессии. Нетруд-
но видеть, что в этом случае правомерно перейти к одномерным
моделям авторегрессии.
Такое обследование статистических свойств одномерных вре-
менных рядов значений технологических модулей на выходе мель-
ницы, проведенное на ряде советских и зарубежных заводов, пока-
зало [33, 42,115], что эти ряды могут быть аппроксимированы гаус-
совскими! моделями АРПСС (р, d, q), где р 2, d 1, q «С 1-
Для исследования процесса обнаружения систематического
смещения модулей от задания проводилось имитационное модели-
рование типичного цементного завода [33, 42, 115]. При этом в од-
ном из компонентов (мергеле) имитировалось увеличение среднего
содержания СаО на 10%. Применение II варианта АКС (5.2.3),
(5.2.4) позволило за счет обнаружения разладки адаптировать си-
стему управления и уменьшить среднеквадратичное отклонение
первого модуля на 1%, второго на 29% и третьего на 38,5%.
Для расчета характеристик АКС (5.2.3), (5.2.4) использовалась
оценка (5.2.13). Основными мешающими параметрами в этой зада-
че являются дисперсия последовательности ох и коэффициенты
АР и СС частей. Исследования показали (см. гл. 5, разд. 2 и 5),
что отклонения истинных коэффициентов АР и СС частей и ах
модели АРПСС (р, d, q), типичные для цементного производства,
приводят к отклонениям истинных значений т от расчетных не
более чем на 10 ч-15% [42]. Это вполне приемлемая точность
оценки характеристик АКС в этой задаче.
2. Примеры использования АКС
при обработке научных наблюдений
В первой главе были сформулированы некоторые задачи обра-
ботки временных рядов, возникающие при научных наблюдениях,
которые сводятся к задаче о разладке. Однако применение алгорит-
мов последовательного обнаружения разладки стало возможным
только в последнее время, когда мини- и микро-ЭВМ с развитыми
возможностями стали использоваться для оперативной обработки
экспериментальных данных. Поэтому число работ по использо-
ванию алгоритмов обнаружения разладки для обработки научных
наблюдений сравнительно невелико. Из литературы известно
о применении такого подхода в океанологии, сейсмологии, при
расшифровке ритмограмм, анализе речи, распознавании зритель-
ных образов. Остановимся на двух типичных для этого направле-
ния работах [121, 154].
В [121] рассмотрена задача обнаружения изменения электро-
энцефалограммы вслед за введением определенного препарата.
Для многомерной модели авторегрессии был предложен эвристиче-
ский алгоритм, основанный на анализе скользящей суммы квадра-
тичных форм (сравнить с алгоритмом Д. Монтгомери [133],
см. разд. 2 гл. 2):
t+N
st= S (ёМёц, (7-2л)
где Е,,- — вектор остатков многомерной модели авторегрессии из
(5.1.16), 2е — ковариационная матрица остатков.
Модель налаженного состояния подгонялась по выборке на-
блюдений до введения препарата. Таким образом, можно сказать,
что эта ситуация соответствует применению III варианта АКС.
В работе [154] рассматривается задача одновременного обна-
ружения нарушения стационарного режима и оценки момента
возникновения нарушения на примере анализа температуры воды
в океане. Предполагалось, что наблюдения температуры до и
после разладки представляют собой модели, содержащие трендо-
вую компоненту и аддитивный шум. В качестве теста для оценки
факта и момента изменения свойств использовалась статистика
подобная (7.2.1).
160
1/26 И. в. Никифоров
161
Перейдем теперь к применению АКС в сейсмологии на сле-
дующем, типичном для этой области примере.
Задача Оперативного прогноза волн цунами по сейсмозаписям.
При оперативной обработке информации в сейсмологии часто воз-
никает задача автоматического обнаружения момента изменения
свойств временных рядов. Рассмотрим применение АКС для ре-
шения указанной задачи при прогнозировании появления волн
цунами по данным отдельной сейсмостанции.
Волны цунами в основном возникают из-за подводных земле-
трясений. Под оперативным прогнозом цунами понимается вы-
работка решения о возможности возникновения цунами в процес-
се регистрации близкого землетрясения на отдельной сейсмостан-
ции. В результате обработки записи необходимо в течение 5—10 мин
после начала регистрации землетрясения определить два его па-
раметра: координаты эпицентра и магнитуду, используемые при
выработке решения о тревоге «цунами» согласно магнитудно-гео-
графическому критерию [55]. В настоящее время процесс опера-
тивного прогнозирования цунами на сейсмостанциях Дальнего
Востока СССР основан на ручной обработке записей близких
землетрясений, но опыт работы этой службы свидетельствует
о том, что ручной способ обработки записей не обеспечивает необ-
ходимой точности, надежности и оперативности в определении
координат эпицентра землетрясения [61—64]. Ключевым фактором
в процессе оперативного прогнозирования является определение
координат эпицентра землетрясения по моментам прихода про-
дольных (Р) и поперечных (S) волн на трехкомпонентной записи
замеров сейсмоприемников (см. рис. 35).
Пусть {Х]Л} — векторная последовательность замеров трех
сейсмоприемников, установленных по вертикальной оси xtl (Z —
компонента), по оси север — юг xt2 (NS-компонента) и по оси
восток — запад xt3 (EW — компонента), т. е. Х(г = || xtl, xt2, xt3 || .
Местоположение эпицентра определяется по азимуту на эпицентр
Az и эпицентральному расстоянию А. Азимут Аг определяется
исходя из того, что проекция трехмерного облака точек Х(, при-
надлежащих участку записи от момента tp прихода P-волны и
до момента ts прихода S-волны, на горизонтальную плоскость
(NS — EW) вытянута в направлении на эпицентр. Эпицентральное
расстояние определяется по разности ts — tp прихода S- и Р-
волн на основании годографа скоростей [61—64]. Исследования
показывают, что статистические свойства участка сейсмического
шума и участка, содержащего Р- или S-волну, систематически от-
личаются. Таким образом, чтобы обнаружить Р-, S-волны и оце-
нить моменты их прихода, необходимо разбить задачу о разладке
на две части: последовательное обнаружение Р-, S-волн, первич-
ная оценка ip и i°s моментов tp- и ^-вступлений Р- и S-волн (см.
рис. 36) и апостериорное уточнение этих оценок. При ручной
обработке этапы обнаружения и оценивания моментов вступлений
Р-, S-волн выполняются дежурным интерпретатором на основе
162
интуитивных представлений, что приводит, особенно в условиях
сильных штормовых микросейсм, к недостаточной надежности и
точности определения местоположения эпицентра землетрясения.
В отличие от ранее рассмотренных постановок задачи о раз-
ладке иногда, если «волновой пакет» очень короткий, необходимо
минимизировать не f* (02) = sup т (^о> ^2), а вероятность пропу-
f»>0
ска «волнового пакета» [32], т. е.
Л,р = Р = ta — to + 1 > А},
(7.2.2)
где А — ожидаемая длина пакета, или sup Рпр (£0) при условии,
•/о>1
что среднее время между ложными тревогами не меньше за-
данного.
Цифровая сейсмостанция
Задача апостериорного оце-
нивания моментов tp и ts бази-
руется на АКС двояко. Во-пер-
вых, апостериорное оценивание
происходит после обнаружения
Р-, 5-волн по фиксированной
выборке, которая определяется
АКС, во-вторых, начальная
оценка момента t0 (3.2.5) поз-
воляет перейти от совместного
оценивания двух моментов раз-
ладки (tp и ts) по одной выбо-
рке длиной N к оцениванию мо-
ментов tp и ts по двум отдель-
ным выборкам длиной JVi иТУ2.
Рис. 35. Типичная трехкомпонент-
ная запись землетрясения
Рис. 36. Блок-схема обнаружения и
оценивания моментов вступления Р-
и S-волн землетрясений
Мини - ЭВМ
Обновляемая выборка
163
6*
Это позволяет существенно сократить число вычислительных
операций (см. разд. 3 гл. 2). В самом деле, даже при использова-
нии рекуррентных расчетов объем вычислений для обнаружения
двух моментов разладки tp и ts на выборке длиной N пропорцио-
нален (№ + N)/2 для модели типа АРПСС (р, d, 0) и при усло-
вии, что N^>p- Предположим, что оценки 1°р и 7“ позволяют про-
сто разделить одну выборку на две (из [46] следует, что на самом
деле оценки tp и 7° точнее), т. е. объем вычислений с использова-
нием iap и 7“ пропорционален + А2 = N. Таким образом,
приближенный коэффициент к сокращения числа операций рас-
считывается по следующей формуле:
к = (№ + N)/(2N) = N/2 + 0,5.
Типичное значение N = 100 — 200, поэтому к = 50 -н 100, т. е.
объем вычислительных операций уменьшается почти на два по-
рядка, что позволяет решать указанную задачу на мини-ЭВМ.
Чтобы продемонстрировать методику настройки АКС и его
практическую эффективность, рассмотрим в следующем разделе
результаты настройки сравнительных испытаний автоматического
и ручного обнаружения и оценивания моментов вступлений Р-
и 5-волн.
3. Практическая реализация
методики настройки АКС
и оценка его эффективности
на примере задачи обнаружения
сейсмических волн
Статистические свойства сейсмических сигналов и настройка
АКС. Для исследования статистических свойств сейсмических сиг-
налов был проделан анализ записей ряда советских и зарубежных
сейсмостанций 1. Установлено, что как участки чистого шума, так
и участки Р-, 5-волн хорошо аппроксимируются моделями чистой
авторегрессии АРПСС (р, d, 0), одномерными и трехмерными, где
d = 0,1 и р = 3 -н 5. Эти результаты хорошо согласуются с ра-
нее известными работами [159, 167] по описанию участков записи
с помощью одно- и трехмерных моделей авторегрессии АРПСС
(р, 0, 0), где р =Зч-5, для разделения сейсмических сигналов
естественного и искусственного происхождения. Переход к пер-
вой разности необходим в том случае, когда участкам, содержащим
шум, присущи низкочастотные дрейфы с большой амплитудой,
превышающей во много раз полезный сигнал. Выборочные иссле-
дования гистограмм распределений и использование %2-критерия
согласия Пирсона [25] показали возможность аппроксимации рас-
1 Анализ сейсмических сигналов, настройка и испытания АКС были выпол-
нены автором совместно с И. Н. Тихоновым [45, 46].
164
пределения случайной величины Xt нормальным законом. Измене-
ния, связанные с переходом от участка шума к участку с Р- и
5-волнами, выражаются в изменении матриц авторегрессии Ах. .
. . Ар и ковариационной матрицы в (5.1.11) (в одномерном
случае Фп . . Фр и о’ в (5.1.3)), в то время как вектор средних
Мл- (или тх) играет роль мешающего параметра (для устранения
его влияний выполняется, например, переход к разностям). По-
ложение очага землетрясения относительно сейсмостанции оказы-
вает влияние на матрицу в модели (5.1.11), поэтому изменение
не может служить надежным признаком вступления Р-волны,
кроме тех случаев, когда эпицентры возможных землетрясений
лежат в узком диапазоне азимутов. Обследование статистического
материала показало, что гипотеза о постоянстве во времени век-
тора параметров 0 {Аъ А2, . . ., Ар, как до, так и после
разладки не выполняется. Это происходит по следующим причи-
нам: статистические свойства участков шума определяются
местными условиями, зависящими от времени суток и времени
года, а статистические свойства Р- и 5-волн определяются очагом
землетрясения, его глубиной и трассой распространения сигнала
и т. д. Кроме этого, на коэффициенты моделей АРПСС3 (р, d, 0)
участков всех трех типов влияют характеристики сейсмоприем-
ников Z, NS и EW компонент, усилителей, фильтров и преобра-
зователей аналог/код. А так как сейсмоприемцики обычно не уни-
фицированы, то при переходе от одной станции к другой коэффи-
циенты авторегрессии участков всех типов изменяются в широких
диапазонах. Таким образом, переходя к терминам задачи о раз-
ладке, можно сказать, что даже для определенной сейсмостанции
области нормального и разлаженного состояний модели
АРПССз (р, d, 0) в параметрическом пространстве существенно
размыты, но тем не менее можно вычислить доминирующее направ-
ление изменения вектора 0 при переходе от участка шума к участ-
ку с P-волной и от участка с P-волной к участку с S- волной.
В силу этого для последовательного обнаружения было предложе-
но использовать два АКС (II варианта), работающих параллель-
но, один из них был настроен на обнаружение P-волны, а дру-
гой — 5-волны, а оценка tap и происходила согласно (3.2.5).
Оптимизация II варианта АКС производилась согласно методике,
изложенной в гл. 6. Отметим лишь два специфических момента.
Во-первых, аппроксимация решающей функции gt (5.2.4) броунов-
ским движением, что допустимо в случае близких гипотез, позво-
ляет получить оценку вероятности пропуска сигнала в (7.2.2)
согласно [166]. Во-вторых, для уточнения минимаксной настройки
II варианта АКС необходима точная зависимость М 0О, с),
0Г = || СиГ | 6мТ ||, от вектора фактических значений информа-
ционных параметров (или набора достаточных статистик) и мешаю-
щего параметра для модели АРПСС (р, d, 0). Из соотношения
165
(5.2.37) получим
м (Agt/е, е0) с) = _^ + А- а/- £Ф«хгчу / о) +
+ -у М — У, Ф?*м) У •
Предполагая, что М (xt) = тх учтем влияние мешающего пара
метра тх на М (Ag;/0, 0О, с, тгеж):
м (Agt/О, 0О, с, тх) = - A + A (FTrp+1F + т* (1 -£ф°)2) +
° 4=1
+ -j- (Frrp+1Cp + тЦ1 - £ф?) £ q), (7.2.3)
О 4=1 4=2
где с’ = || с2, . . ., ср„ ||, Fr = || 1, -Ф?, . . ., -Ф® || - (р + 1)-
мерный вектор коэффициентов полинома авторегрессии, Гг+1 —
ковариационная матрица ((р + 1) X (р + 1)) модели АРСС
(р, 0) с фактическим вектором параметров 0Г = || оЕ, Фх, . . .
. . ., Фр ||, а матрица Гг+1 образуется на Гр+1 следующим обра-
зом:
ГР+1 —
V | 1 , , р
: 1 •
к ! я л,..., я0
р I р-1’ • • • ’ и
А {
: i Гр-ц
Легко видеть, что если в первой части (7.2.3) теоретические
вторые моменты заменить на выборочные, то М (Ag;/O, ₽0, с, тх)
зависит от набора выборочных автоковариаций с лагами от Одо р
и оценки среднего тх. Формула (7.2.3) в таком виде использова-
лась при настройке II варианта АКС для контроля результатов
минимаксной настройки в предположении близких гипотез. Тре-
бовалось, чтобы на обучающем множестве выборок чистого сей-
смического шума М (>/(i, 0о, с, тх) <0, а на выборках с сиг-
налами М (>/Q, 0О, с, nix) /> 0.
Сравнительные испытания автоматического и ручного обнару-
жения моментов вступлений Р-, S'-волн. Для проверки возможно-
стей алгоритмического комплекса, заключающего в себе II вари-
ант АКС (5.2.4), (5.2.37) с получением предварительных оценок
(3.2.5) ip и 2® и алгоритм (2.3.7) апостериорного оценивания мо-
ментов tp и ts, а также для отработки и оценки пригодности ме-
тодики настройки были проведены сравнительные испытания ав-
томатического и ручного (сейсмологом-интерпретатором) обнару-
жения вступлений Р-, S-волн. Блок-схема алгоритмического
комплекса изображена на рис. 36. Программное обеспечение было
166
Рис. 37. Пример цифровой записи землетрясения, применявшейся для сравни-
тельных испытаний автоматического и ручного обнаружения моментов вступ-
лений Р- и S-волн
составлено из подпрограмм CUSUM1, GUSUM2, MAPDET,
MRELF, MREESR, MMPRD1 (MAPDT1, MRELF1).
Экспериментальный материал испытаний представлял собой
выборку 29 записей гавайских землетрясений [45], полученных
в течение 1973—1976 гг. с помощью трехкомпонентной цифровой
длиннопериодной системы «Кипапа» [80], установленной на о-ве,
Оаху (Гавайи, США). Система настроена на регистрацию слабых
поверхностных волн удаленных землетрясений и имеет неунифици-
рованные характеристики каналов при наличии на записях нену-
левой составляющей в виде низкочастотного дрейфа. Диапазоны
эпицентральных расстояний А, магнитуд М и глубин очагов h
для землетрясений выборки были соответственно следующими:
226 А 389 км; 4,0 М 7,2; 1 О h 50 км. Подробно
свойства этого экспериментального материала рассмотрены в ра-
ботах [20, 45]. Каждой записи землетрясения предшествовал уча-
сток записи помехи длительностью 4—8 мин при шаге дискрети-
зации 1 с (рис. 37). Фактические моменты вступлений Р-волп
рассчитывались по годографу Р-, 5-волн [45] с учетом фазовых
частотных характеристик каналов. Времена вступления 5-волн
рассчитывались относительно опорных значений для P-волн по
известным величинам запаздываний ts — tp. Как показали расче-
ты, выполненные по слабо «зашумленным» записям, данная про-
цедура оценки опорных моментов вступлений обеспечивает точность
+2 —— 3 с.
После получения опорных значений tp и ts моментов вступле-
ний Р- и 5-волн были идентифицированы трех- и одномерные мо-
дели авторегрессии участков шума, Р- и 5-волн. Результаты под-
гонки модели АРПСС (5, 1, 0) для участков шума и P-волны по
компоненте собраны в табл. 10. Интересно отметить,что дисперсия
оценок коэффициентов Фх, Ф2, . • ., Ф6, <те в модели АРПСС
(5, 1, 0), полученная осреднением по 29 реализациям, на порядок
больше дисперсии этих оценок, полученных по отдельным реали-
зациям. Это является наглядным указанием на нестабильность
коэффициентов модели при переходе от одной реализации к дру-
гой. Подгонка трехмерных моделей АРПСС3 (5, 1, 0) показала
167
[45], что для участков шума (длины которых составляли 10 20
времен спада выборочных автокорреляционных функций) боль-
шинство (90%) оценок йу недиагональных элементов ау к-й
матрицы авторегрессии не превышает (по абсолютной величине)
своих среднеквадратичных отклонений д {щ,}. Этот факт, а также
хорошее (в пределах б {йу}) совпадение оценок диагональных
элементов йу (i — j) с соответствующими оценками коэффициен-
тов одномерных моделей АРПСС (5, 1, 0) являются указанием
на возможность декомпозиции трехмерной модели на три одномер-
ные, у которых независимые последовательности {е^}г образуют
трехмерную случайную последовательность с заданной ковариа-
ционной матрицей SE. Это позволяет существенно упростить зада-
чу настройки алгоритмов, а также избавиться от мешающего влия-
ния коэффициентов взаимной корреляции вектора Егт = || etl,
е(2, егз || . Из табл. 10 следует, что ни один из коэффициентов
модели АРПСС (5.1.0) не может служить надежным признаком для
обнаружения момента вступления P-волны, поэтому при настрой-
ке АКС использовались все коэффициенты Фъ Ф2, . . ., Фр, сц.
Было обнаружено, что при р — 5 процесс настройки АКС (5.2.4),
(5.2.37) затруднен, а также что качество обнаружения Р- и S-
волн не ухудшается при снижении порядка авторегрессии до р — 3.
Окончательное испытание алгоритма проводилось с р = 3.
В сейсмологической практике существуют задачи обнаруже-
ния моментов вступлений по каждой из компонент отдельно и по
всем компонентам вместе (некоторая интегральная оценка момен-
та вступлений). В проведенных испытаниях применялся как од-
номерный АКС, так и его трехмерный вариант, но с учетом диа-
гональной структуры матриц авторегрессии.
Для сравнения с автоматическим обнаружением в СахКНИИ
была проведена ручная обработка тех же выборок опытными сей-
смологами-интерпретаторами в двух режимах: в режиме реального
времени, когда сейсмолог наблюдал трехкомпонентную запись,
регистрируемую на бумажной ленте в темпе, соответствующем
оцифровке, т. е. 3 см/мин (обычно в таком режиме сейсмолог на-
блюдает землетрясение в процессе его регистрации на сейсмографе),
и апостериорно, т. е. обрабатывая всю запись сразу, что также
является типичным режимом работы сейсмолога-интерпрета-
тора.
Результаты сравнительных’ испытаний по обнаружению вступ-
лений Р-, 5-волн автоматически (АКС (5.2,4), (5.2.37)) и сейсмо-
логами-интерпретаторами собраны в табл. 11. Знаком (+) в табл. 11
отмечено появление события, которое может быть правильным
обнаружением (п.о.) или ложным обнаружением (л. о.). Пра-
вильным считалось обнаружение, при котором сигнал от АКС или
сейсмолога подавался в момент ta: ta t0 — At , где t0 — tp,
te, At = 2 — 3 с — погрешность вычисления опорных значений
tp и t„ а ложным — если ta <Z t0 — At, t0 = ta, ts или сигнал
168
Таблица 10
Результаты подгонки моделей авторегрессии (р=5, d=lj для Z-компоненты
записей цифровой станции Кипапа
Номера землетря- сения согласно данным табл. 1 Ф1 Фг Ф« Ф1 ф» °е
«Чистый» шум, предшествующий записи землетрясения
1 0,51 -0,02 -0,03 —0,05 -0,05 3,43
2 0,61 0,51 0,13 —0,14 -0,32 8,98
3 1,79 -0,42 -0,70 0,13 0,16 12,04
4 1,43 -0,33 -0,66 0,24 0,13 2,39
5 0,76 0,42 -0,03 -0,08 -0,25 1,64
6 0,73 0,20 -0,14 0,02 —0,23 1,14
7 0,82 0,35 0,16 -0,13 —0,21 2,20
8 1,53 -0,38 -0,53 0,02 0,27 2,36
9 0,84 0,42 —0,14 —0,26 0,02 5,65
10 1,36 —0,21 -0,19 —0,12 0,05 2,71
11 1,36 0,06 -0,45 —0,20 0,47 2,21
12 1,33 0,10 -0,52 —0,17 0,19 2,02
13 0,44 0,62 0,24 —0,17 -0,27 6,57
14 1,22 0,02 -0,24 —0,30 0,19 7,33
15 0,99 0,25 -0,27 —0,22 —0,05 1,93
16 0,55 0,52 0,06 -0,25 -0,15 3,94
17 1,19 0,03 -0,33 —0,19 0,1-5 1,45
18 0,62 0,59 0,12 —0,22 -0,23 4,74
19 0,75 0,08 0,05 —0,09 —0,11 2,32
20 0,64 0,52 0,03 -0,27 —0,27 15,46
21 1,27 0,27 -0,42 —0,36 0,16 4,36
22 0,8? 0,60 -0,45 —0,72 0,42 17,11
23 2,47 —1,68 -0,68 1,36 -0,49 5,41
24 0,59 0,10 —0,02 0,14 —0,19 1,41
25 1,33 —0,04 —0,41 —0,23 0,15 2,77
26 0,97 0,46 —0,25 -0,33 0,00 4,48
27 1,33 0,04 -0,48 —0,17 0,13 3,36
28 0,67 0,13 0,01 —0,10 —0,14 2,08
_ 29 1,08 0,20 -0,30 —0,15 -0,03 2,87
Среднее 1,03 0,12 -0,23 —0,10 -0,03 4,63
Стандартное 0,44 0,44 0,26 0,33 0,21 4,00
отклонение
P-волна на’фоне шума
1 0,39 ? 0,32 0,05 -0,0,1 -0,37 9,98
2 2,92 -2,73 0,12 1,22 0,54 4,31
3 1,46 -0,24 —0,49 -0,05 0,18 4,62
4 1,64 -0,49 -0,25 -0,35 0,36 3,70
5 0,92 0,32 -0,17 0,05 -0,24 2,41
7 И. В. Никифоров
169
Таблица 10 (окончание)
Номера вемлетря- сения согласно данным табл- 1 Ф1 Ф2 Ф. ф« Ф»
6 2,05 -0,99 -0,35 0,11 0,15 15,79
7 1,31 -0,06 —0,47 0,13 -0,13 3,51
8 1,84 —0,41 -1,15 0,78 -0,12 25,41
9 1,47 -0,10 -0,36 —0,29 0,23 3,95
10 1,65 -0,50 -0,34 -0,02 0,08 5,49
l-i 1,39 0,16 -0,58 -0,56 0,51 2,55
12 1,50 0,08 —0,82 -0,25 0,40 3,48
13 2,16 —1,23 —0,21 0,08 0,17 11,80
14 2,69 —2,16 -0,40 1,32 —0,49 4,43
15 1,53 —0,05 -0,39 —0,76 0,63 2,12
16 0,47 0,89 1,12 —3,00 1,25 11,01
17 1,83 -0,45 -0,60 —0,17 0,36 3,03
18 2,49 -1,58 —0,21 -0,09 0,42 7,25
19 1,07 0,34 —0,16 -0,63 0,18 3,01
20 1,38 —0,20 —0,34 0,08 —0,11 7,99
21 2,04 -0,86 -0,41 -0,07 0,27 96,29
22 2,22 —2,12 1,39 —0,81 0,26 100,00 :
23 1,77 —0,70 —0,30 -0,11 0,34 11,68
24 0,58 0,21 -0,23 0,07 —0,12 0,94
25 1,63 —1,02 0,43 —0,27 —0,09 3,22
26 1,11 —0,31 0,21 —0,29 -0,03 4,59
27 1,60 —0,50 —0,09 —0,19 0,06 5,38
28 1,89 —0,58 -0,58 —0,04 0,27 4,45
29 1,23 0,15 —0,40 -0,23 0,07 2,71
Среднее 1,59 -0,51 —0,21 -0,15 0,14 12,59
Стандартное отклонение 0,59 0,81 0,50 0,71 0,35 23,82
подавался после прохождения «волнового пакета». Прочерк
в столбце (п. о.) означает пропуск вступления волны.
Из табл. 11 видно, что АКС полностью пропустил «волновой
пакет» (т. е. не обнаружил ни Р-, ни 5-волны) в 5 случаях. Сей-
смолог, работающий в реальном масштабе времени, тоже в 5 слу-
чаях, и сейсмолог, обрабатывающий всю выборку сразу, в 8
случаях. В то же время АКС не сделал ни одного ложного обна-
ружения, а сейсмолог допустил 9 л. о. в реальном масштабе вре-
мени и 5 л. о. при работе по всей; выборке сразу.Таким образом,
можно сказать, что АКС не уступает сейсмологу ни в реальном
масштабе времени, ни при обработке] сейсмологом' всей выборки
сразу (т. е. когда сейсмолог находится в заведомо более выгодных
условиях).
170
Таблица 11
Номер земле- трясения АКС Сейсмолог (реальный масштаб времени) Сейсмолог (по всей выборке)
Р-волна S-волна Р-волна S-волна Р-волна | 8-волна
п.о. л.о. п.о. л.О П.О. Л.О. п.о. л.о. П.О. л.о. | п.о. л.о.
1 + 4- + + 4- 4-
4- + + + 4- 4~
3 — — + 4-4- 4- 4-4- — -—
4 + 4- + 4- 4- 4- 4- 4-
5 — — — ++ + +4- — -L- — 4-
G + + + + 4- +
7 4- + + + + 4- + 4-
8 + + 4- + 4- 4-
9 + — — — 4- 4-
10 + 4“ + + 4- +
И 4- — + 4- + 4- Ц- 4-
12 + 4- + 4- 4-
13 4- < Л" + + 4- 4-
14 4- + 4- 4-
15 + 4- + 4- + 4- 4- 4-
16 + 4- — + 4-
17 + + 4- 4- -Ц 4-
18 + + + + 4- 4-
19 + + 4~ 4- 4- 4-
20 — — — — — 4- 4~
. 21 + -г 4- 4- + 4-
22 — + + + 4- 4-
23 — — — — —
24 — — — —— — 4- — 4-
25 — + — — — —
26 + — + + + 4- — + — 4-
27 — + + + 4- 4-
28 + + + 4- 4- 4-
29 + + 4- 4- 4- 4-
Итого: 21 0 21 0 23 9 23 9 21 5 21 5
Кроме этого, максимальное запаздывание, допущенное АКС при
обнаружении Р- и 5-волн, составляет 67 с, а сейсмолог в реаль-
ном масштабе времени максимально запаздывал на 206 с. Имеет
смысл сравнить точность оценки моментов вступлений волн
У автоматического обнаружителя и у сейсмолога, работающего
всей выборке сразу. На примере P-волны установлено, что хотя
первичные оценки tp очень грубы (см. табл. 1 в 145]), но использо-
вание апостериорного алгоритма позволяет получить следующие
171 7*
результаты (по тем выборкам из табл. 11, которые правильно об-
работали и АКС и сейсмолог): Др = 1,48, др = 7,32, где
= ^р»
N / ~
К = (1/М 3 Ар., 6р = ]/ 3 (APi - \,)2/(А - 1).
г=1 г i=sl
Для сейсмолога эти величины были следующими: Др = 0,52,
др = 9,90. Таким образом, и по точности оценки моментов вступ-
ления волн АКС и апостериорный алгоритм не уступают сейсмо-
логу-интерпретатору, обрабатывающему выборку вручную.
Подведем итоги испытаний алгоритмического комплекса на за-
писях станции «Кинана». Как показано в [20, 45], этот материал
представляет собой наибольшую сложность для обнаружения и
оценки моментов вступлений Р- и S-волн (рис. 28), об этом гово-
рит прежде всего низкая точность (2—3 с) определения самих
опорных значений tp и ts, большая величина погрешности др —
— 9,90 оценки момента вступления P-волны опытным сейсмологом
и сравнительно большой процент ошибок, допущенных'при обна-
ружении вступлений волн. Все это объясняется малым отношением
сигнал/шум (Р- и S-волны маскируются на фоне сильных сейсми-
ческих помех), неунифицированными каналами и наличием на
записях низкочастотных дрейфов.
Как показало исследование статистического материала станции
«Южно-Сахалинск» и моделирование работы алгоритмов, качество
автоматического обнаружения на записях с более высоким отно-
шением сигнал/шум, с отсутствием низкочастотных дрейфов может
быть значительно улучшено,^в частности, величины др и os дохо-
дят до 1—1,5 с при^частоте дискретизации 3 Гц, что является
приемлемым результатом.
Автоматизация процесса обнаружения и оценки моментов
вступлений Р- и S-волн позволяет повысить точность и надежность
определения положения эпицентра землетрясения и тем самым
обеспечить своевременное предупреждение населения побережья
о возможности возникновения волн цунами.
ПРИЛОЖЕНИЕ
НАБОР ПОДПРОГРАММ НА ЯЗЫКЕ ФОРТРАН-ГР
(исходные тексты)
SUBROUTINE ARP(X,N,P,DB,DM,F,E,S ,IND, EPS, IER)
C
С ПОДПРОГРАММА ВЫЧИСЛЕНИЯ ОЦЕНОК CPE ДНЕГО,АВТОКОВАРИАЦИОННОИ
С ФУНКЦИИ И КОЭФФИЦИЕНТОВ МОДЕЛИ АВТОРЕГРЕССИИ ОДНИМ ИЗ ТРЕХ
С СПОСОБОВ (ПРИБЛИ1ЕННОГО МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ,МНК,-
С В ЛА - УОКЕРА)
С
DIMENSION X(1),DB(1),DM<1) ,F (1)
INTEGER P,P1
IF(P.LT.l) GO TO 100
IF(N.LT.2*P+1) GO TO 200
C
С ВЫЧИСЛЕНИЕ СТАТИСТИК
С
E=0.
DO. 10 1=1, N
10 E=E+X(I)
P1=P+1
E=E/N
C
С ВНИМАНИЕ ! МАССИВ X ЦЕНТРИРУЕТСЯ ПОСЛЕ РЕШЕНИЯ
С
DO 20 1=1, N
20 X(I)=X(I)-E
XN=N
DO 40 1=1,Pl
N1=N-I+1
IF(IND.EO.l) XN=N1
s=o.
DO 30 K=l,Ni
K1=K+I-1
30 S=S+X(K)*X(K1)
40 DM(I)=S/XN
IF(IND.GE.3) GO TO 62
DO 60 1=1,p
DO 60 J=I,P
K1=N-I-J
IF(IND.EQ.l) XN=N1
S=0.
DO 50 K=1,N1
K1=I+K
K2=J+K
50 S=S+X(K1)*X(K2)
Kl=(J*J-J)/2+I
60 DB(K1)=S/XN
GO TO 66
62 K1=O
DO 65 1=1,P
DO 65 J=1,I
K1=K1+1
K2=I-JH
65 DB(K1)=DM(K2)
173
с
С РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИИ
С
66 CALL SINV (DB,PrEPS,IER)
IF(IER.NE.O) GO TO 300
CALL MPRD (DB, DM (2) , F »P rPd j 0 • 1)
S=DM(1)
DO 70 1=1rP
70 S=S-DM(1 + 1)*F (I)
RETURN
100 IER=-2
RETURN
200 IER=-3
300 RETURN
END
SUBROUTINE ESTARP(R,P-B!DET,A>Dj Z,EPS-IER)
c
С ПОДПРОГРАММА ВЫЧИСЛЕНИЯ КОЭФФИНИ ЕНТОВ АВТОРЕГРЕССИОННОЙ < № 3
С ПОСЛЕДОВАТЕЛЬНОСТИ ПО МЕТОДУ М. П АГАНО (СМ. СПИСОК ЛИТЕРАТУРА
С /138/)
DIMENSION. Rd) ,В(1) . А (1) , D (1) ,Z( 1)
INTEGER Р
IER=O
DET=1.
Dd)=l.
Z(1)=R(1)
IF(P.LE.l) GO TO 65
C
С МОДИФИЦИРОВАННАЯ ДЕКОМПОЗИЦИЯ ХОЛ ЕНКОГО
С
М2=0
С ОСНОВНОЙ цикл - ДЕКОМПОЗИЦИЯ И РЕ ВЕНИЕ ТРЕУГОЛЬНОЙ СИСТЕМА ЛИ- ,
С НЕЙНЫХ УРАВНЕНИЙ
С
ВО 60 К=2,Р
К1=К-1
М1=0
S2=l.
S3=R (К)
ПО 50 1=1,К1
М=К-1
S=R(М)
IF(I.EO.l) GO ТО 40
L=I-1
DO 30 J=1,L
M1=M1+1
30 S=S-B(J)»A(M1)
40 B(I)=S
M2=M2+1
S1=S/D<I)
S2=S2-S»S1
S3=S3-S1*Z(I)
50 A(M2)=S1
IF(S2-EPS) 55,58»58
GO TO 90
58 Z(K)=S3
174
ВСЮ =S2
C
С ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЯ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ АР-МОДЕЛИ
С
60 DET=DET*S2
С
С РЕШЕНИЕ ТРЕУГОЛЬНОЙ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИИ ДЛЯ ВЫЧИСЛЕНИЯ
С АР-К03ФФИЦИЕНТ0В
Е
65 B(P)=Z(P)/O(P)
Z(P>=B'P)
IF(P.LE.l) GO TO 90
J=P-1
HO 80 1 = 1, J
L=P~I
S=Z(L)/B(L)
Z(L> =S
M=M2
BO 70 K=1,I
K1=J-K
S=S-B(K1+2)*A(H)
70 M=M-K1
H2=H2-1
SO StL)=S
RETURN
END
SUBROUTINE AUTOAR(F,P,E,N,A,IER)
C
С ПОДПРОГРАММА ВЫЧИСЛЕНИЯ АВТОКОРРЕЛ ЯДИОННОИ ФУНКЦИИ < АКФ )
С ПОСЛЕДОВАТЕЛЬНОСТИ АВТОРЕГРЕССИИ П О ЗАДАННЫМ КОЭФФИЦИЕНТАМ
С ПУТЕН РЕШЕНИЯ УРАВНЕНИИ ЮЛА - УОКЕРА
С
DIMENSION F С1) , В (1) , А (1)
INTEGER Р
IFCP.LE.O) GO ТО 50
С
С ФОРМИРОВАНИЕ МАТРИЦЫ СИСТЕМЫ ЛИНЕЙ НИХ УРАВНЕНИИ
С
DO 10 1=1,Р
DO 10 J=I,P
K=(J-1)«P+I
IF(I.EQ.J) GO TO 5
ft(K)=O.
GO TO 10
5 A(K)=-1.
10 CONTINUE
IF(P.EO.l) GO TO 30
DO 20 1=2,P
K1=O
DO 20 J=I,P
K1=K1+1
K2=(I-2)*P+K1
K=(I-2)»P+J
A(K)=F(K1)
20 A(K2 )=A(K2 )+F(J)
175
30 ПО 40 1 = 1,-P
40 B(I)=-F(I)
c
С РЕШЕНИЕ СИСТЕМЫ .ЧИНЕННЫХ УРАВНЕНИИ ДЛЯ ВЫЧИСЛЕНИЯ АКФ
С С ЛАГАМИ ОТ 1 ДО р
С
CALL SIMQ(A»B»P»IER)
IF(N.LE.P) RETURN
С
С ВЫЧИСЛЕНИЕ АКФ С ЛАГАМИ ОТ Р + 1 ДО N
С
К=Р+1
Bu z>5 I = K?N
ВО 42 0=1 ?Р
K1=I-J
42 S=S+F(O)»B(K1)
45 B(I)=S
RETURN
50 IER=2
RETURN
END
SUBROUTINE GRGU1 (B, A »X» V»N.• IX>KL»IER)
C
С ПОДПРОГРАММА ГЕНЕРАЦИИ ПСЕВДОСЛУЧАЙНОГО ГАУССОВСКОГО'ВЕКТОРА X
С С НУЛЕВЫМИ СРЕДНИМИ И С КОВАРИАЦИОННОЙ МАТРИЦЕЙ В
С
с
DIMENSION В(1) ,А(1)•X(1)>V(1)
IF(KL'.GE.2) GO ТО 90
IER=O
С
С ВЫЧИСЛЕНИЕ ПЕРВОГО СТОЛБЦА МАТРИЦЫ А.
С
S=B(1)
IF(S)4,4,5
4 IER=1
RETURN
5 S=SQRT(S)
HO 10 I=1»N
CALL LOC (I»1»K»N,Nr 1)
10 A(K>=B(K)/S
IF(N.LE.l) GO TO Э0
C
С- ВЫЧИСЛЕНИЕ МАТРИЦЫ А (ОСНОВНОЙ ЦИКЛ)
С
DO 70 I=2»N
DO 70 0=2» I
CALL LOC(I,0>I0,N»N»i)
K1=J-1
S=B(IJ)
IF(J.LT.I) GO TO 50
775
DO 20 Г.--1.К1
L=K+(J*J-J)/2
20 S=S-A(L)»»2
IF(S) 30,30,40
C
С ИНДИКАЦИЯ ОШИБОК
С
30 IER=J
RETURN
40 S=S0RT(S)
X(J)=S
A(IJ)=S
GO TO 70
50 DO 60 K=1,K1
L=K+(I*I~I)/2
M=K+(/2
60 S=S-A(L>*A(M>
A(IJ>=S/X(J)
70 CONTINUE
SO IF(KL.GT.O) GO TO 90
RETURN
C
С ВЫЧИСЛЕНИЕ ВЕКТОРА X=A*U, ГДЕ 'J - ПСЕВДОСЛУЧАЙНЫЙ ВЕКТОР С
С ЕДИНИЧНОЙ КОВАРИАЦИОННОЙ МАТРИЦЕЙ
С
СЭ ПО 110 1=1»Ы
CALL GAUSS(IX,1.0,0.0,V СI))
S=0.
К=(1*1-1)/2
DO 100 J=i,I
M=K+J
100 S=S+V(J)*A(M)
110 X(I)=S
RETURN
END
SUBROUTINE GGARS(X,N,F,P,A,DX,EX,EA,SIGA,IX,KL,IER)
ПОДПРОГРАММА ГЕНЕРАЦИИ ПСЕВДОСЛУЧАЙНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
АВТОРЕГРЕССИИ ( АР )
DIMENSION X(l) ,F(1) ,А(1)
INTEGER Р
IFCKL.GE.2) GO ТО 25
L=P+2
Ll=P+t
L2=(P*P*P)/2+Ll
С
С- ВЫЧИСЛЕНИЕ АВТОКОРРЕЛЯЦИОННОЙ ФУНКЦИИ АР-МОДЕЛИ
С
CALL AUT0AR(F,P,X(2),P,X(L),IER)
IF(IER.EQ.O) GO TO 5
IER=-IER
RETURN
C
С ВЫЧИСЛЕНИЕ ДИСПЕРСИИ,СРЕДНЕКВАДРАТИЧНОГО ОТКЛОНЕНИЯ НЕЗАВИСИМОЙ
С ПСЕВДОСЛУЧАЙНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ И КОНСТАНТЫ СМЕШЕНИЯ ДЛЯ АР--
С МОДЕЛИ
п о о n
177
5 S=1.0
EA=1.0
DO 10 1 = 1,p
EA=EA-F(I)
10 S=S-F(I)«X(I+1)
EA=EA*EX
S=DX*S
SIGA=SORT(S)
C
С ФОРМИРОВАНИЕ ковариационной матрицы ар-модели
с
К=Р
Х(1)=1.0
DO 20 J=1,P
DO 20 1=1,J
M=J~r+l
K=K+1
20 X(K)=DX*X(M)
C
С ВЫЧИСЛЕНИЕ ПСЕВДОСЛУЧАЙНОГО ВЕКТОРА X
С
25 CALL GRGV1(X<L1),A,X,X<L2), P,IX,KL,IER)
IF(IER.NE.O) RETURN
DO 30 1=1,P
30 X<I)=X(I)+EX
IF(N.LE.P) RETURN
C
С ВЫЧИСЛЕНИЕ АР-ПОСЛЕДОВАТЕЛЬНОСТИ
С
DO 50 I=L1,N
CALL GAUSS (IX,SIGA,EA,S)
DO 40 J=1,P
M=I-J
40 S=S+F<J)«X(M)
50 X(I)=S
RETURN
END
SUBROUTINE CUSUM1 (IJ,E,BET, C,DGT, AW,P)
c
С ПОДПРОГРАММА ВЫЧИСЛЕНИЯ ПРИРАЩЕНИЯ #5.2.37) РЕШАЮЩЕЙ ФУНКЦИЙ
С ВТОРОГО ВАРИАНТА АКС ДЛЯ ПОСЛЕДОВАТЕЛЬНОСТИ АВТОРЕГРЕССИИ
С
DIMENSION 0'1),С (1j -Filo
INTEGER Р
AW=W(1)
DO 10 1=1,p
10 AW«AW-F(I)*Wa + l)
A=0.
DO 20 1 = 1 ,P
20 A=A+C< IJ-1) *Ы (I +1)
DGT=C(1)*< <AU*AU)/(BET»BET*BET)-l./BET)+AW/(BET*BET)*A
RETURN
END
178
SUBROUTINE CUSUM2 (Vr F > X, BET , С > H • F'l > Di, GT, AW, I ND, INDD, IT AU)
C
С ПОДПРОГРАММА МНОГОКРАТНОГО ПОСЛЕДОВАТЕЛЬНОГО ОБНАРУЖЕНИЯ
С И ОЦЕНИВАНИЯ МОМЕНТОВ РАЗЛАДКИ (ВТОРОЙ ВАРИАНТ АКС) ДЛЯ
С ПОСЛЕДОВАТЕЛЬНОСТИ АВТОРЕГРЕССИИ
С
INTEGER P,P1,D,D1
DIMENSION F(l),C(1),X(P1,D1)
IF(IND.GT.l) GO TO 30
D=D1-1
P=P1-1
IT=O
DO 20 K=1,D1
DO 20 1=1,Pl
20 X(I,K)=O.
30 X(i,l)=V
IFID.LE.O) GO TO 50
DO 40 1 = 1, D
40 Х(Ы+1)=Х(Ы)-Х(2,1>
50 CALL CUSUM1(X(l,D1),F,BET,C,DGT,AW,P)
00 60 K=1,D1
DO 60 1=1,p
L=P1-I
40 X(L+1,K)=X(L.40
GT=GT+DGT
IF(GT.GT.O.) GO TC 110
GT=0.
IF(HiDD.EQ.O) :G0 TO 140
INDD=O
GO TO 130
110 IF(GT.GE.H) GO TO 120
IT = IT+1 '
RETORT!
120 GT=H
IF(INDD.EO.l) GO TO 140
IHDD=1
130 ITAU=IT+i
140 IT=O
RETURN
END
SUBROUTINE LOGCHI(P,N,CHI2,LAMB21,LAMB22,IND,ITER,EPS,Y,IER.
C
С ПОДПРОГРАММА ВЫЧИСЛЕНИЯ ЛОГАРИФМА ОТНОИЕНИЯ ПРАВДОПОДОБИЯ
С ДЛЯ ХИ - КВАДРАТ РАСПРЕДЕЛЕНИЯ (3.4.9)
С
INTEGER Р
REAL LAME21-LAMB22
DIMENSION AC(30)
IF(IND.GT.l) GO TO 20
FACT1=1.
FACT2=(LAMB21-LAMB22)*C.5
C=0.5*P
31 = 1.
DO 10 1=1,30
EACTl=FACtl*FLOAT(I)
S1=S1* (C+FLOAT(I)-1.)
10 AC (I)=S1«FACT1
m
20 IF(CHI2.LT.O.) GO TO 40
IER=O
Sl = CHI2*0.25
S2=S1*LAMB22
S1=S1*LAMB21
Sll=l.
S21=l.
S12=l.
S22=l.
1=0
30 IF (I.GE.ITER) GO TO 35
1 = 1+1
S11=S1*S11
S2i=S2*S21
X1=S11/AC(L)
' X2=S21/AC(I)
S12=S12+X1
S22=S22+X2
IF (X1.GT.EPS.OR.X2.GT.EPS) GO TO 30
GO TO 36 '
35 IER=2
36 Y=FACT2*N+AL0G(S22/S12)
RETURN
40 IER=1
RETURN
END
SUBROUTINE CUSUM4(W,F,BET,C,P,NCHI,LAMB21,LAHB22iITiTND,
*ITER,EPS,AU,B,V,GT,IER)-
C
С ПОДПРОГРАММА ВЫЧИСЛЕНИЯ РЕШАВШЕЙ ФУНКЦИИ ТРЕТЬЕГО ВАРИАНТА АКС
С (3.4.6), (3.4.9),(5.2.46) ДЛЯ ПОСЛЕДОВАТЕЛЬНОСТИ АВТОРЕГРЕССИИ
С
DIMENSION F(l) ,С(1) ,Ы(1) ,B(1),V(1)
REAL LAMB21,LAMB22,INDGT
INTEGER Р,Р1
Р1=Р+1
INDGT=1.
АИ=Ы(1)
DO 10 1=1,р
10 AU=AU-F(I)»W(I+i)
В (1) = (AU*AW)/(ВЕТ»ВЕТ*ВЕТ)-i. /ВЕТ
DO 20 1=2,Pl
20 В(I)=AW*W(I)/(BET*BET)
IF(IT.LE.O) INDGT=O.
DO 30 1=1,Pl
30 V(I)=V(I)*INDGT+B(I)
CALL MPRD(V,C,B,1,P1,O,1,P1)
CHI2=0.
DO 40 1=1,Pl
40- CHI2=CHI2+V(I) »B(I)
CALL LOGCHI (NCHI, IT+1 ,CHI2,LAHB2 1 ,LAMB2.2,IND,ITER,EPSfGblER)
RETURN
END
180
SUBROUTINE CUSUM3(V,F,X,BET,C,H,P1,D1,NCHI,LAMB21,LAMB22, GT»AU
*IND,ITER,EPS,В,VI,INDD,ITAU,IER)
C
С ПОДПРОГРАММА МНОГОКРАТНОГО ПОСЛЕДОВАТЕЛЬНОГО ОБНАРУЖЕНИЯ И
£ ОЦЕНИВАНИЯ МОМЕНТОВ РАЗЛАДКИ (ТРЕТИЙ ВАРИАНТ АКС) ДЛЯ
С ПОСЛЕДОВАТЕЛЬНОСТИ АВТОРЕГРЕССИИ
С
INTEGER P,P1,D,D1
REAL LAMB21,LAMB22
DIMENSION F(l),C(1),X(P1,D1) ,B(1),V1(1)
IF(IND.ST.1> GO TO 30
D=D1-1
P=P1-1
IT=O
DO 20 K=l,Di
DO 20 1=1,Pl
20 X(I,K)=0.
30 X(1,1)=V
IF(D.LE.O) GO TO 50
DO 40 1=1,D
40 X(1,1+1)=X(1,I)-X(2,I)
50 CALL CUSUM4(X(1,D1),F,BET,C,P,NCHI,LAMB2i,LAMB22,IT,IND,
*ITER,EPS,AU,В,VI,GT,IER)
'DO 60 K=1,B1
DO 60 1 = 1, P
L=P1-I
.60 X(L+1,K)=X(L,K)
IF(INDD.LE.O) GO TO 120
IFCGT.GE.O.) GO TO 122
IF (GT.GT.-H) GO TO 130
GT=-H
INDD=O
GO TO 140
120 IF(GT.GT.O.) GO TO 125
122 GT=O.
GO TO 150
125 IF(GT.GE.H) GO TO 135
130 IT=IT+1
RETURN
135 GT=H
INDD=1
140 ITAU=IT+1
150 IT=O
RETURN
END
181
SUBROUTINE MREESR(N,K,Y,F,P,WORKjWl»W2>
ПОДПРОГРАММА РЕКУРРЕНТНОЙ МНК-ОЦЕНКИ КОЭФФИЦИЕНТОВ РЕГРЕССИИ
DIMENSION Y(1)>F(1),P(1)?UORK (1)
IF(K-l) 10,10,30
13 IR=O
DO 20 J=1,H
F(J)=O.
DO 20 1=1»J
IR=IR+1 . .
U2=0.
IF(I.EQ.J) W2=W1
20 P(IR)=W2
30 CALL MMPRD1 (N,P,Y(2),WORK)
Wl = l.
M2=Y(1)
DO 40 1=1,N
Wi=W1+Y(1+1>«WORK(I)
40 W2=W2~Y<1 + 1 s *F(I)
U1=1./W1
IR=O
DO 50 J=1,N
DO 50 1=1, J
IR=IR+1
50 P(IR)=P(IR)-UORK(I)*UORK(J>»W1
CALL MMPRD1 (N, P,Y (2) rWfjRK)
DO 60 1=1fN
60 F(I)=F(I)+U0RK<D*U2
RETURN
END
SUBROUTINE MMPRDl<N,AfB,C)
DIMENSION Ad) >8(1) >C(1)
IR1=O
DO 40 1=1,N
UORK=O.
IR=IR1
DO 30 J=1,N
IF(I-J) 20,10,10
10 IR=JR+1
GO TO 30
20 IR=IR+J-1
30 WORK=WORK+A(IR)*B(J)
IR1=IR1+I
40 C(I>=WORK
RETURN
END
182
SUBROUTINE MRELF(X» NUM»P>И»NN,EPS•SIr EX r F ,S>WORK 1>WORK2»W0RK3
*CUSUM»ESTLF IER)
C
С ПОДПРОГРАММА РЕКУРРЕНТНОГО ВЫЧИСЛЕНИЯ ПРИБЛИЖЕННОЙ ФУНКЦИИ
С ПРАВДОПОДОБИЯ ( ФП ) АВТОРЕГРЕССИОННОЙ ( АР ) ПОСЛЕДОВАТЕЛЬНОСТИ
£
DIMENSION У. (1) ,F < 1) >UORK1 (1) • WORK2 (I, W0RK3 (1; ,CHSUM (1)
INTEGER P,D,D1,F1,P2,P3,P4
IER=O
IF (NUM.GT.1) GO TO 20
K1 = D+1
P1=P.+ 1
P2=P1+1
P3=D*P1+1
P4=P+D
I=P3+P1
X(I)=1.0
E1=SI
J=Pl+Pl+tP*P+P)/2
DO 15 1 = 1, J
15 CUSUMd) =0.
£
С ЗАПОЛНЕНИЕ СКОЛЬЗЯЩЕГО ОКНА НнЕЛИЕНИй
£
20 IF(D.EQ.O) GO ТО 40
J=1
DO 30 1=1:0
K=J
J=K+P1
30 x(j) -x ею-x(K+i)
40 NUM1=HUM-P4
IFiNUMl) 75’42,48
С ВЫЧИСЛЕНИЕ НАЧАЛЬНЫХ. СТАТИСТИК
42 CUSUM1=0.
K=P3+P-1
ПО 43 1 = 1,P
c-y (K)
W0RK3<n=S
CUSUM1=CUSUM1+S
43 K=K-i
GO TO 75
c
С ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТОВ АР-МОДЕЛИ
£
48 CALL MREESR(P1»NUM1»X<P3),F,W0RK2.WORK!,81»S>
C
С ОПЕНКА ДИСПЕРСИИ НЕЗАВИСИМОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
М=Р1
L=P1+M
S1 = X.(P3)
183
C
C
c
DO 60 J=1,P1
K=J+P3
S=X(K-1>
cusum(j)=cusum(J)+s
M=M+1
CUSUM(M)=CUSUM(H)+S*Si
IF (J.EQ.Pl) GO TO 60
S=X(K)
DO 50 I=hJ
L=L+1
K=I+P3
50 CUSUM(L)=CUSUM(L) +X (Ю *3
60 CONTINUE
IF(NUM.LE.NN> GO TO 75
S4=FL0AT (NUM-D)
EX= (CUSUM (1) +CUSUffl)/S4
3=0.
FP=-F(P)
DO 64 1=1,P
Sl=W0RK3(I)-EX
S2=S1*FP
K=P-I
IF(K.LT.l) GO TO 64
M=I
L=P
DO 62 J=1,K
M=M+1
L=L-1
S3=W0RK3(H>-EX
S1=S1-S3*F(J)
62 S2=S2-S3*F(L)
64 3=3+31*31-32*32
M=P1+P2
IF (S.GT.EPS) GO TO 65
IER=1
S=EPS
65 CALL MMPPD1(P,CUSUM(M ),F,UORK1)
M=P2
31=0.
FP1=F(P1)
DO 70 1=1,P
FI=F(I)
M=M+1
S2=CUSUM(M)
S=S+FI*(WORK1(I)-S2-S2)
70 S1=S1+FI*CUSUM(I+1)
S2=FLOAT(NUM1>
S=(S+(S1-CUSUM(1))*FP1*2.O+CUSUM(P2))/S4+(S2/S4)*FP1*FP1
ВЫЧИСЛЕНИЕ ПРИБЛИЖЕННОЙ ФИ
ESTLF=-0.5*S2*AL0G(S>
184
L
С ОБНОВЛЕНИЕ СКОЛЬЗЯЩЕГО ОКНА НАБЛЮДЕНИИ
С
75 М=О
ПО 80 1=ЫН
М=М+Р1
ПО 80 J=l,p
K=H-J
80 Х(К+1)=Х‘Ю
RETURN
END
SUBROUTINE НАРВЕТ<Х»N»PijP2»Bl»П2?NNjIND,SI-iEPS»ESTHIN»F»WORKlr
»W0RK?,U0RK3,CUS!JM, XX, ESTLF^LF, ESTAR, LHOETHERR;
C
С ПОДПРОГРАММА АПОСТЕРИОРНОГО ОБНАРУЖЕНИЯ РАЗЛАДКИ АВТОРЕГРЕССИОННОЙ
С ‘ АР ) ПОСЛЕДОВАТЕЛЬНОСТИ
С
DIMENSION X < 1 >»F <i> г W0RK1 <1 >»W0RK2C 1> /CUSUH(D ,E3TLF (1) > ESTAR (1) г
«XX (1)rW0RK3(l>
INTEGER Pl,Р2»Bl»D2tР21
IERR=O
P21=P2+1
M1=';P1+2)*IND+1
ESTMAX=ESTMIN
C
С ВЫЧИСЛЕНИЕ ФУНКЦИИ ПРАВДОПОДОБИЯ С ФП ) В ПРЯМОМ НАПРАВЛЕНИИ
с
J=N-NN-1
К=0
DO 10 1 = 1, J
XX < 1) =Х (I)
*£ALL HR|LF<XX»I,Pi»Dl!Nfl,EPS.SI>EXFF»VAR>W0RKl.ll0RK2fW0RK3r
С ИНДИКАЦИЯ ОШИБОК
С
IERR=IERR+IER
IF(I.LE.NH> GO TO 15
К=К+1
ESTLF(K)=EST
10 CONTINUE
filf-t:
С ВЫЧИСЛЕНИЕ ФП В ОБРАТНОМ НАПРАВЛЕНИИ
с
К1=Н+1
ПО 30 1 = 1, -!
К1=К1-1
ХХ(1,'=Х(К1>
CALL HRELF (XXiI,P2,H2,HfbEFS,SI ,EX,F,VAR,UORKi>U0RK2,U0RK3»
*CUSUM,EST,IER)
185
С ИНДИКАЦИЯ ОШИБОК
IERR=IERR+IER
IF(I.LE.NN) GO ТО 30
EST=EST+ESTLF(K)
ESTLF<K)=EST
K=K-1
IF (ESTMAX.GE.EST) GO TO 30
ESTMAX=EST
IDET=K1
IF<IND) 30,15,15
C
С ОЦЕНКА АР-МОДЕЛИ ПОСЛЕ РАЗЛАДКИ
£
15 L=M1
DO 20 M=1,P21
ESTAR(L)=F(M)
'20 L=L+1
ESTAR(L)=VAR
30 CONTINUE
IF(IND.LE.O) GO TO 60
fC
С ОЦЕНКА АР-МОДЕЛИ ДО РАЗЛАДКИ
iC
J=IDET-1
M=J-1
DO 40 1=1,J
xxd)=x(i)
CALL MRELF(XX,I,Pi,D!,H,EPS>SI,EX,F,VAR,H0RKi,U0RK2,U0RK3,
*CUSUM,EST,IER)
40 CONTINUE
J=P1+1
DO 50 1=1,J
50 ESTAR(I)=F(I!
ESTAR(J+1)=VAR
60 RETURN
END
SUBROUTINE MRELFKX,NUM,P,D,NN,EPS,EX,VAR,SACF,SPACF,F,FP1,S,DET,
*U0RKl,W0RK2,U0RK3, CUSUM, CUSUM1, ESTLF, IER).
c
.С ПОДПРОГРАММА РЕКУРРЕНТНОГО ВЫЧИСЛЕНИЯ ТОЧНОЙ ФУНКЦИИ ПРАВДОПОДОБИЯ
С АВТОРЕГРЕССИОННОЙ ( АР ) ПОСЛЕДОВАТЕЛЬНОСТИ
.С
DIMENSION X(1),F <i),WORK!<1),WORK2(1),W0RK3<1),CUSUM(1),CUSUM!(1),
*SACF(1),SPACF(1)
INTEGER P,D,P1,D1,P2,P3,P4
IER=O
IFCNUM.GT.l) GO TO 20
D1=D+1
Pl=P+.l
P2=P1+1
P3=D*P1+1
P4=P+D
J=Pl+Pl+(P*P+p)/2
DO 15 1=1,J
15 CUSUM(D=0.
186
20 IF(D.EQ.O) GO TO 40
C
С ЗАПОЛНЕНИЕ СКОЛЬЗЯЩЕГО ОКНА НАБЛЮДЕНИИ
С
J=1
DO 30 1 = 1,D
K=J
J=K+P1
30 X(J)=X(K)-X(K+1>
40 NUM1=NUM-P4
IF(NUMl) 75,42,45
C
С ВЫЧИСЛЕНИЕ НАЧАЛЬНЫХ СТАТИСТИК
С
42 CUSUM1(1)=0.
CUSUM1(Р2)=0.
J=P+p+3
N=P3+P-1
DO 44 1 = 1, P
S=X(N)
W0RK3(I)=S
CUSUM1(I+1)=CUSUM1(I)+S
s=o.
K=P3
M1=I-1
M=P-M1
DO 43 J1=1,M
L=K+M1
S=S+X(K)*X(L)
43 K=K+1
CUSUM1(J)=S
J=J+1
44 N=N-1
CUSUM1(J)=0.
GO TO 75
C
С ВЫЧИСЛЕНИЕ СТАТИСТИК НА КАХЛОМ ШАГЕ
С
45 К=Р1+Р
Н=РЗ
DO 46 1=Р2,К
CUSUM1 (1 + 1)=CUSUM1(I)+Х(N)
46 N=N+1
М=Р1
1_=Р1+М
S1=X(P3)
DO 60 J=1,P1
K=J+P3
S=X(K-l)
CUSUM(J)=CUSUM(J)+S
M=M+1
CUSUM(M)=CUSUM(M)+S*S1
IF(J.EQ.Pl) GO TO 60
,=X(K)
DO 50 1 = 1, J
L=L+1
K=I+P3
50 CUSUM (L)=CIJSUM(L)+X (KJ *S
187
60 CONTINUE
IF (NUM.LE.NN) GO TO 75
£
£ ВЫЧИСЛЕНИЕ ВЫБОРОЧНЫХ ОПЕНОК СРЕДНЕГО, ДИСПЕРСИИ И
С АВТОКОРРЕЛЯЦИОННОЙ функции
£
S4=FL0AT (NUM-B)
ЕХ=(CUSUM(1)+CUSUM1(Р1))/34
3=ЕХ*ЕХ'
М=Р1
ВО 56 1=1,Р1
М=М+1
L=M+P1
S2=CUSUM(М)+CUSUM1(L)-3*(S4+FL0AT(1-1))+ЕХ*(CUSUM1(М)+CUSUM1(I))
IFd.GT.ll GO ТО 54
31=32
GO ТО 56
54 SACF(I-1)=S2/S1
56 CONTINUE
VAR=S1/S4
£
С ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТОВ АР-МОДЕЛИ (РЕШЕНИЕ УРАВНЕНИИ ВЛА-УОКЕРА)
С
CALL ESTARP(SACF,P,F,BET,WORK2,UORK1,SPACF,EPS,IER)
IF(IER.NE.O) GO TO 75
£
£ ВЫЧИСЛЕНИЕ КВАДРАТИЧНОЙ ФОРМЫ ОТ ПЕРВЫХ Р НАБЛЮДЕНИИ
£
s=o.
FP=-F(P)
FP1=1.
ВО 64 1 = 1,Р
FP1=FP1-Fd)
Sl=W0RK3 (Г)-EX
S2=S1*FP
K=P-I
IF (К.LT.1) GO TO 64
M=I
L=P
BO 62 J=1,K
M=M+1
L=L-1
S3=W0RK3(M)-EX
S1=S1-S3«F(J)
62 S2=S2-S3*F(L)
64 3=3+31*31-32*32
£
£ ВЫЧИСЛЕНИЕ ПОЛНОЙ ’КВАДРАТИЧНОЙ ФО РМЫ ОТ НАБЛЮДЕНИЙ '
£
FP1=FP1*EX
М=Р1+Р2
CALL MMPRHl(P,CUSUM.(.««f/ilORKl) i
М=Р2
31=0.
ВО 70 1=1,Р
FI=F(I)
М=М+1
,S2=CUSUM.(«
188
S=S+FI«(W0RK1<1)-S2-E2?
70 S1=S1+FI*CUSUM(1+1)
C
С ОПЕНКА ДИСПЕРСИИ НЕЗАВИСИМОЙ ПОСЛ ЕДОВАТЕДЕ КОСТИ
S2=FL0AT(NU«l)
S= (S+ (Sl-CUSUM (.1))*FP1*2.O+CUSU H(P2) >/S4+<S2/S^>mFF1«FP1
С ВЫЧИСЛЕНИЕ ТОЧНОЙ ФУНКЦИИ ПРАВДОЙ СДО ВИЯ
с
ESTLF=-0.5*(S2*AL0G(S)+FLOAT(Р)* ALOG(VAR)+ALOG(DET))
С
С ОБНОВЛЕНИЕ СКОЛЬЗЯЩЕГО ОКНА НАЕЛ ЮДЕНИИ
С
75 М-0
ПО 30 1=1,D1
:М=М+Р1
DO 80 J=lrP
K=M-J
ВО X(K+i)=X.(K)
RETURN
END
SUBROUTINE MAPDT1<X,N,P1»P2,D1,B2,NN,IND,EPS,ESTMIN,F,SACF,SPACF,
MW0RK1 ,WORK2,WORK3, CUSUM,CUSIJM1, XX,ESTLF,NLF ,ESTAR ,L, IDET , IERR)
C
С ПОДПРОГРАММА АПОСТЕРИОРНОГО 0БНАРУ1ЕНИЯ РАЗЛАДКИ АВТОРЕГРЕССИОННОЙ
С ( АР ) ПОСЛЕДОВАТЕЛЬНОСТИ
С
DIMENSION X(l) ,F(1),WORK1 (1), W0RK2(Г),CUSUM (1) ,ESTLF (1) ,ESTAR(1)»
*ХХ (1), W0RK3 (1), SACF (1), SPACF (1 ), CIJSIJM1 (1) '
INTEGER P1,P2,D1,D2,P21
IERR=O
P21=P2+1
M1=(3*P+5)*IND+1
L=M1*IND+M1
ESTMAX=ESTMIN
С ВЫЧИСЛЕНИЕ ФУНКЦИИ ПРАВДОПОДОБИЯ ( ФП ) В ПРЯМОМ НАПРАВЛЕНИИ .
J=N-NN-1
К=0
ПО 10 1=1,J
XXС1)=Х<1)
CALL MRELF1(XX,I,P1,Di,NN,EPS,EX,VARX,SACF,SPACF,F,FP1,OAR,DET»
wWORKl, W0RK2»i!0RK3»CUSUM,CUSUMl, EST, IER)
c
С ИНДИКАЦИЯ ОШИБОК
IERR=IERR+IER
IF(I.LE.NN) GO TO 10
K=K+1
ESTLF(K)=EST
10 CONTINUE
NLF=K
C
С ВЫЧИСЛЕНИЕ ФП В ОБРАТНОМ НАПРАВЛЕНИИ
•С
189
K1=N+1
DO 30 1 = 1,J
K1=K1-1
XX(1)=X(K1)
CALL MRELF1 (XX,I,P2,D2,NN,EPS,EX,VARX,SACF,SPACF,F,FP1,VAR,DET,
«W0RK1,W0RK2,W0RK3,CUSUM,CUSUM1,EST,IER)
C
С ИНДИКАЦИЯ ОШИБОК
С
IERR=IERR+IER
IF(I.LE.NN) GO TO 30
EST=EST+ESTLF(K) . ..
ESTLF(K)=EST
K=K-1
IF(ESTNAX.GE.EST) GO TO 30
ESTMAX=EST
IDET=K1
IF(IND) 30,15,15
C
С ОПЕНКА АР-МОДЕЛИ ПОСЛЕ РАЗЛАДКИ
С
15 CALL ARDATA'TTU EX, VARY, SACF , SPACE, F, FP1, VAR, DET, ESTAR (Ml))
30 CONTINUE
IF(IND.LE.O) GO TO 60
C
С ОПЕНКА АР-МОДЕЛИ ДО РАЗЛАДКИ
J=IDET-1
" M=J-1
DO 40 1 = 1,3
XX(1)=X(I)
CALL MRELF1 'XX,I,Pl,DI,M,EPS,EX,VARY,SACF,SPACF,F,FP1,VAR,DET,
«WORK1,W0RK2,W0RK3,CUSUM,CUSUM1,EST,IER)
40 CONTINUE
CALL ARDATA(Pl,EX,VARX,SACF-SPACF,F,FP1,VAR,DET?ESTAR)
60 RETURN
END
SUBROUTINE ARDATA (P,EX,VARX,SACF,SPACF,F,FP1,VAR,DET,ESTAR)
INTEGER p
DIMENS ION SACF(1),SPACF(1),F ' 1),ESTAR(1)
ESTAR(l)=EX
ESTAR(2)=VARX
DO 10 I = l,p
L = I + 2
ESTAR(L)=SACF(I)
J=L+P
ESTAR(J)=SPACF(I)
J=J+P
10 ESTAR(J)=F(I)
J=J+1
ESTAR(J)=FP1
J=J+1
ESTAR(J)=VAR
J=J+1
ESTAR(J)=DET
RETURN
END
ЛИТЕРАТУРА
1. Андерсон Т. Статистический анализ временных рядов. М.: Мир, 1976.
755 с.
2. Бакугп И. А., Жулина Ю. В., Иванчук И. А. Обнаружение движущих-
ся объектов. М.: Сов. радио, 1980. 287 с.
3. И. Нелинейное оценивание параметров. М.: Статистика, 1979.
4. Барра Ж.-Р. Основные понятия математической статистики. М.: Мир,
1974. 275 с.
5. Веллман Р. Введение в теорию матриц. М.: Наука, 1969. 367 с.
6. Беляев Б. К. Вероятностные методы выборочного контроля. М.: Наука,
1975. 406 с.
7. Биллингсли И. Сходимость вероятностных мер. М.: Наука, 1977. 352 с.
8. Бокс Дж., Дженкинс Г. Анализ временных рядов. М.: Мир, 1974.
Вып. 1. 406 с.; Вып. 2. 193 с.
9. Бородкин Л. И., Моттль В. В. Алгоритм обнаружения моментов из-
медания^^параметров уравнения случайного процесса.— АиТ, 1976,
10. Бусганг Д., Миддлтон Д. Оптимальное последовательное обнаружение
сигналов в шуме.— В кн.: Прием сигналов при наличии шума: Пер. с
англ./Под ред. Л. С. Гуткина М.: Изд-во иностр, лит., 1960. 343 с.
11. Вальд А. Последовательный анализ. М.: Физматгиз, 1960. 328 с.
12. Вапник В. И., Червоненкис А. Я. Теория распознавания образов. М.:
Наука, 1974. 416 с.
13. Вапник В. Н. Восстановление зависимостей по эмпирическим данным.
М.: Наука, 1979. 447 с.
14. Гельфанд Я. Е. Управление цементным производством с использованием
вычислительной техники. Л.: Стройиздат, 1973. 176 с.
15. Головин Б. А. Машинное распознавание и линейное программирование.
М.: Сов. радио, 1973. 150 с.
16. Гренандер У., Сегё Г. Теплицевы формы и их приложения. М.: Изд-во
иностр, лит., 1961. 308 с.
17. Дарховский В. С. Непараметрический метод для апостериорного обна-
ружения момента «разладки» последовательности независимых случай-
ных величин.— Теория вероятностей и ее применения, 1976, 21, вып. 1,
с. 180-184.
18. Джапаридзе К. О. Асимптотически эффективное оценивание параметров
спектра гауссовского временного ряда. Тбилиси: Изд-во Тбил. ун-та,
1977. 120 с.
19. Дынкин Е. Е. Оптимальный выбор момента остановки марковского
процесса.— Докл. АН СССР, 1963, 150, № 2, с. 238—240.
20. Иващенко А. И., Поплавский А. А., Соколовский Т. И., Тихонов И. И.
Автоматическая оценка азимута на эпицентры местных гавайских зем-
летрясений по записям станции «Кипапа» (Гавайи, США).— Изв.
АН СССР. Физика Земли, 1980, № 8, с. 112—120.
21. Ицкович Э. Л. Контроль производства с помощью вычислительных mi-
шин. М.: Энергия, 1975. 417 с.
22. Канторович Л. В., Крылов В. И. Приближенные методы высшего ана-
лиза. М.: Физматгиз, 1962. 708 с.
23. Карманов В. Г. Математическое программирование. М.: Наука, 1975.
272 с.
24. Келъберт М. Я. О сходимости дискретных схем к непрерывным в неко-
торых задачах последовательного анализа.— Теория вероятностей и ее
применения, 1976, 21, вып. 3, с. 620—628.
191
25. Кендалл М., Стьюарт Л. Многомерный статистический анализ и вре-
менные ряды. М.: Наука, 1976. 736 с.
26. Клигене Н. Исследование точности оценки максимального'правдоподо-
бия момента изменения параметров уравнения авторегрессии.— В кн.:
Труды семинара «Статистические проблемы управления». Вильнюс:
Ин-т математики и кибернетики АН ЛитССР, 1975, вып. 12, с. 42—70.
27. Клигене Н. Точное распределение оценки максимального правдоподо-
бия момента изменения параметров авторегрессии.— В кн.: Труды семи-
нара «Статистические проблемы управления». Вильнюс: Ин-т математи-
ки и кибернетики АН ЛитССР, 1978, вып. 31, с. 9—28.
28. Куликовская Е. С., Федуинов Б. Е. Определение случайного момента
времени появления полезного сигнала.— Изв. АН СССР. Техн, кибер-
нетика, 1975, № 4, с. 148—154.
29. Кулъбак С. Теория информации и статистика. М.: Наука, 1967. 408 с.
30. Кушнир А. Ф. Асимптотические оптимальные критерии для регрессион-
ной задачи проверки гипотез.— Теория вероятностей и ее применения,
1968, 13, вып. 4, с. 682—700.
31. Кушнир А. Ф., Пинский А. И. Асимптотические оптимальные крите-
рии для проверки гипотез при зависимой выборке наблюдений.— Тео-
рия вероятностей и ее применения, 1971, 16, вып. 3, с. 280—291.
32. Кушнир А. Ф., Никифоров И. В., Савин И. В. Два подхода к синтезу
подоптимальных алгоритмов обнаружения случайно появляющихся сиг-
налов.— В кн.: V Всесоюз. совещ. по статист, методам в прспессах уп-
равления: (Тез. докл.). НКАУ, ИПУ, Москва, КПП, Алма-Ата, 1981,
с. 118-120.
33. Луканов В., Маринов Д., Дудников Е. и др. Разработка типовой авто-
матизированной системы управления участком производства. М.:
МЦНТИ, 1978. 64 с.
34. Леман Э. Проверка статистических гипотез. М.: Наука, 1979. 408 с.
35. Ли Р. Оптимальные оценки, определение характеристик и управление.
М.: Наука, 1966. 176 с.
36. Липейка А. Оценка точности определения момента времени изменения
свойств случайной последовательности.— В кн.: Труды семинара «Ста-
тистические проблемы управления». Вильнюс: Ин-т математики и кибер-
нетики АН ЛитССР, 1973, вып. 7, с. 78—86.
37. Липейка А . Определение моментов изменения свойств авторегрессион-
ной последовательности.— В кн.: Труды семинара «Статистические про-
блемы управления». Вильнюс: Ин-т математики и кибернетики
АН ЛитССР, 1977, вып. 24, с. 27-71.
38. Лумелъский В. Я. Один алгоритм обнаружения момента времени изме-
нения свойств случайного процесса.— АиТ, 1972, № 10, с. 67—73.
39. Монтвилас А. Обработка результатов наблюдений при определении из-
менения свойств случайных сигналов.— В кн.: Труды семинара «Статис-
тические проблемы управления». Вильнюс: Ин-т математики и кибер-
нетики АН ЛитССР, 1973, вып. 7, с. 41—53.
40. Никифоров И. В. Применение последовательного анализа к процессам
авторегрессии.— АиТ, 1975, № 8, с. 174—177.
41. Никифоров И. В. Обнаружение моментов изменерия свойств процессов
в АСУ ТП.— В кн.: VII Всесоюз. совещ. по проблемам управления.
Институт проблем управления. М.: ИАТ; Минск: Ин-т техн, кибернети-
ки, 1977, кн. 2, с. 49.
42. Никифоров И. В. Применение имитационного моделирования для раз-
работки АСУ ТП непрерывного производства.— В кн.: Кибернетические
проблемы АСУ технологическими процессами. М.: Знание, 1978, с. 99—
106.
43. Никифоров И. В. Применение кумулятивных сумм для обнаружения
изменения характеристик случайного процесса.— АиТ, 1979, № 2,
с. 48—58.
44. Никифоров И. В. Модификация и исследование процедуры кумулятив-
ных сумм.— АиТ, 1980, № 9, с. 74—80.
45. Никифоров И. В., Тихонов И. Н. Автоматическое обнаружение и оцен-
192
ка моментов вступлений объемных волн близких землетрясений по за-
писям станции «Кипапа».— В кн.: Параметры очагов цунамигенных зем-
летрясений и особенности цунами. Владивосток: ДВНЦ АН СССР-
СахКНИИ, 1980, с. 64-75.
46. Никифоров И. В., Тихонов И. Н. Автоматическое обнаружение и оцен-
ка момента вступления Р-волпы в процессе регистрации землетрясе-
ния-— В кн.: Совещ. по пробл. цунами (Тез. докл.). Южно-Сахалинск:
ДВНЦ АН СССР, СахКНИИ, 1981, с. 77-78.
47. Острем К. Ю. Введение в стохастическую теорию управления. М.:
Мир, 1973. 320 с.
48. Первозванский А. А. Распознавание абстрактных образов как задача
линейного программирования. — Изв. АН СССР. Техн, кибернетика,
1965, № 4, с. 41—44.
49. Полляк Ю. Г. Вероятностное моделирование на электронных вычисли-
тельных машинах. М.: Сов. радио, 1971. 400 с.
50. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. М.: Наука,
1973. 494 с.
51. Пупков К. А., Рожков В. Е. К минимизации функции эмпирического
риска методами линейного программирования. — АиТ, 1982, № 1, с. 172—
174.
52. Русас Дж. Контигуальность вероятностных мер. М.: Мир, 1975. 254 с
53. Сборник научных программ на Фортране/Под ред. С. Я. Виленкина.
М.: Статистика, 1974. Вып. 1. 315 с.; Вып. 2. 223 с.
54. Себер Дж. Линейный регрессионный анализ. М.: Мир, 1980. 456 с.
55. Соловьев С. Л., Шебалин Н. В. Цунами и интенсивность Курило-Кам-
чатских землетрясений,— Изв. АН СССР. Сер. геофиз., 1959, № 8,
с. 1195-1198.
56. Стратонович Р. Л. Об оптимальном обнаружении разладки производ-
ственного процесса.— Вести. МГУ. Математика, механика, 1962, № 2,
с. 63—71.
57. Телькснис Л. А. О применении оптимального байесова алгоритма обу-
чения при определении момента времени изменения свойств случайных
сигналов.— АиТ, 1969, № 6, с. 52—58.
58. Телькснис Л. Определение изменений свойств случайных процессов при
неполных априорных данных.— В кн.: Труды семинара «Статистические
проблемы управления». Вильнюс: Ин-т математики и кибернетики
АН ЛитССР, 1975, вып. 12, с. 9—26.
59. Телькснис Л. Определение наиболее вероятных изменений свойств мно-
гомерных динамических систем с неизвестными параметрами.— В кн.:
Труды семинара «Статистические проблемы управления». Вильнюс:
Ин-т математики и кибернетики АН ЛитССР, 1977, вып. 24, с. 9—26.
60. Тихомирова И. Г., Б акут П. А. Обнаружение случайно появляющих-
ся сигналов случайной длительности.— Изв. АН СССР. Техн, киберне-
тика, 1977, № 2, с. 137—141.
61. Тихонов И. Н. Алгоритм для оценки эпицентральных расстояний по
записям сейсмической станции «Южно-Сахалинск».— В кн.: Теория
и оперативный прогноз цунами. М.: Наука, 1980, с. 35—41.
62. Тихонов И. Н., Поплавский А. А. Первичный машинный анализ сейс-
мограмм, содержащих интенсивные помехи.— В кн.: Теория и оператив-
ный прогноз цунами. М.: Наука, 1980, с. 49—63.
63. Тихонов И. Н. Автоматическое определение азимута на эпицентр зем-
летрясения с помощью ЭВМ по записи одной станции.— Геология и гео-
физика, 1975, № 5, с. 105—111.
64. Тихонов И. Н. Оценка момента вступления продольной волны по трех-
компонентной записи с помощью ЭВМ.— В кн.: Алгоритмы интерпрета-
ции геофизических данных. Владивосток: ДВНЦ АН СССР; СахКНИИ,
1976, с. 105—111.
65. Фукунага К. Введение в статистическую теорию распознавания образов.
М.: Наука, 1979. 368 с.
66. Хазен Э. М. Методы оптимальных статистических решений и задачи
оптимального управления. М.: Сов. радио, 1968. 256 с.
193
67. Хеннан Э. Многомерные временные ряды. М.: Мир, 1974. 575 с.
68. Ширяев А. Н. Обнаружение спонтанно возникающих эффектов.— Докл-
АН СССР, 1961, 138, № 4, с. 799-801.
69. Ширяев А. Н. Задача скорейшего обнаружения нарушения стационар-
ного. режима.— Докл. АН СССР, 1961, 138, № 5, с. 1039—1042.
70. Ширяев А. Н. Об оптимальных методах в задачах скорейшего обнару-
жения.— Теория вероятностей и ее применения, 1963, 8, вып. 1, с. 26—
71. Ширяев А. U.K обнаружению разладки производственного процесса.—
Теория вероятностей и ее применения, 1963, 8, вып. 3, с. 264—281.
72. Ширяев А. Н. К обнаружению разладок производственного процесса.—
Теория вероятностей и ее применения, 1963, 8, вып. 4, с. 431—443.
73. Ширяев А. Н. Некоторые точные формулы в задачах о «разладке».—
Теория вероятностей и ее применения, 1965, 10, вып. 2, с. 380—385.
74. Ширяев А. Н. Статистический последовательный анализ. М.: Наука,
1969. 231 с.
75. Bagshaw М., Johnson R. A. The influence of reference values and estima-
ted variance on the ARL of cusum test.— J. Roy. Statist. Soc. B, 1975i
37, N 3, p. 413—420.
76. Bagshaw M., Johnson R. A. Sequential procedures for detecting parame-
ter changes in a time-series model.— J. Amer. Statist. Assoc., 1977, 72,
N 359, p. 593-597.
77. Balmer D. PF. On a quickest detection problem with variable monitoring.-—
J. Appl. Prob., 1978, 13, N 3 p. 760—767.
78. Barnard G. A. Control charts and stohastic processes.— J. Roy. Statist.
Soc. B, 1959, 21, N 24, p. 239—271.
79. Bather J. A. Control Chart and the minimization of cost.— J. Roy. Sta-
tist. Soc. B, 1963, 25, N 1, p. 49—70.
80. Berg E., Chesley D. M. Automated high-precision amplitude and phase
calibration of seismic systems.— BSSA, 1976, 66, N 4, p. 1413—1424.
81. Berk R. H. Locally most powerfull sequential tests.— Ann. Statist.,
1975, 3, N 2, p. 373—381.
82. Berk R. H. Comparing sequential and non-sequential test.— Ann. Sta-
tist., 1975, 3, N 4, p. 991—998.
83. Bissell A. F. Cusum techniques for quality control.— Appl. Statist.r
1969, 18, N 1, p. 1—30.
84. Box G. E. P., Tiao G. C. A change in level of a nonstationary time se-
ries.— Biometrika, 1965, 52, N 1, 2, p. 181—192.
85. Brown R. L., Durbin J., Evans J. M. Techniques for testing the constan-
cy of regression reletionships over time.— J. Roy. Statist. Soc. B, 1975,.
37, N 2, p. 149—163.
86. Bungum II., Husebye E. S., Ringchahl F. The NORSAR array and pre-
liminary results of data analysis.— Geophys. J. Roy. Astron. Soc., 1975,
25, N 1, p. 115—126.
87. Chang С. B., Dunn К. P. On GLR detection and estimation of unexpec-
ted inputs in linear discrete systems.— IEEE Trans. Autom. Control.,
1979, AC-24, N 3.
88. Chernoff H., Zacks S. Estimating the current mean of a normal distribu-
tion which is subjected to a change in time.— Ann. Math. Statist., 1964,
35, N 3, p. 999—1018.
89. Chiu W. K., Wetherill G. B. A simplified scheme for the economic design
of X-charts.— J. Quality Technol., 1974, 6, N 2, p. 63—69.
90. Cox D. R. Sequential tests for composite hypotheses.— Proc. Cambridge
Philos. Soc., 1952, 48, N 2, p. 290-299.
91. Cox D. R., Miller H. D. The theory of stochastic processes. N. Y., 1965.
398 p.
92. Chiu W. K. The economic design of cusum charts for controlling normal
mean.— Appl. Statist., 1974, 23, N 3, p. 420—433.
93. Chiu W. K., Wetherill G. B. A simplified scheme for the economic design
of X-charts.— J- Quality Technol., 1974, 6, N 2, p. 63—69.
194
94. Davies R. В. Asymptotic inference in stationary gaussian time series.—
Adv. Appl. Prob., 1973, 5, N 3, p. 469—497.
95. Digernes T. Real-time failure detection and identification applied to su-
pervision of oil transport in pipe-lines.— Modelling, Identification and
Control, 1980, 1, N 1.
96. Duncan A. J. Quality control and industrial statistics.— Homewood (Ill.):
Irvin, 1965. 992 p.
97. Duncan A. J. The economic design of X-charts used to maintain current
of a process.— J. Amer. Statist. Assoc., 1956, 56, N 274, p. 228—242.
98. D uncan A. J. Economic design of X-charts when there is a multiplicity
of assignable causes.— J. Amer. Statist. Assoc., 1971, 66, N 333, p. 107—
121.
99. Ewan W. D. When and how to use cu-sum charts.— Technometrics,
1963, 5, N 1, p. 1-22.
100. Ghave P. M., Torgersen P. E. The multicharacteristic control charts.—
J. Industr. Eng., 1968, 19, N 6, p. 269—272.
101. Ghosh В. K. Sequential tests of statistical hypotheses. Reading (Mass.):
Addison-Wesley, 1970. 454 p.
102. Gibra I. N. Recent development in control chart techniques.— J. Quali-
ty Technol., 1975, 7, N 4, p. 183—192.
103. Girshich M. A., Rubin H. A Bayes approach to a quality control model.—
Ann. Math. Statist., 1952, 23, N 1, p. 114—125.
104. Gael A. L., Wu S. M. Determination ARL and a contiur nomogram for
CUSUM charts to control normal mean.— Technometrics, 1971, 13, N 2,
p. 221—230.
105. Goldsmith P. L., Whitfield H. Average run lengths in cumulative chart
quality control schemes.— Technometrics, 1961, 3, N 1, p. 11—80.
106. Graupe D., Jain V. K., Salahi J. A comparative analysis of various
least-squares identification algorithms.— Automatica, 1980, 16, N 6,
p. 663—681.
107. Hawkins D. M. Testing a sequence of observations for a shift in location.—
J. Amer. Statist. Assoc., 1977, 72, N 357, p. 180—186.
108. Hines W. G. S. Improving a simple monitor of a system with sudden pa-
rameterchange.— IEEE Trans. Inform. Theory, 1976, 22, N 4, p. 496—499.
109. Hinkley D. V. Inference about the intersection in two-phase regression.—
Biometrika, 1969, 56, N 3, p. 495—504.
110. Hinkley D. V. Inference about the change-point a sequence of a random
variables.— Biometrika, 1970, 57, N 1, p. 1—17.
111. Hinkley D. V. Inference about the change-point from cumulative sum
tests.— Biometrika, 1971, 58, N 3, p. 509—523.
112. Hinkley D. V. Inference in two-phase regression.— J. Amer. Statist.
Assoc., 1971, 66, N 336, p. 736—743.
113. Hinkley D. V. Time-ordered classification.— Biometrika, 1972, 52, N 2,
p. 509—523.
114. Hudson D. J. Fitting segmented curves whose join points have to be esti-
mated.— J. Amer. Statist. Assoc., 1966, 61, N 317, p. 1097—1129.
115. Itskovich E., Nikiforov I. Typical algorithms of raw blending control
in the cement industry.— In: Proc, of 5th IFAC/IFIP Conf, on Digital
Comput. Application to Process Control. Hague, Netherlands, 1977,
p. 395—402.
116. Jackson J. E., Bradley R. A. Sequential %2 and T2-tests and their appli-
cation to an acceptance sampling problem.— Technometrics, 1961, 3, N 4,
p. 519—534.
117. Jackson J. E., Bradley R. A. Sequential %2 and T2-tests.— Ann. Math.
Statist., 1961, 32, N 4, p. 1063—1077.
118. Johnson N. L. A simple theoretical approach to cumulative sum control
charts.— J. Amer. Statist. Assoc., 1961, 56, N 296, p. 835—840.
119. Johnson N. L., Leone F. C. Cumulative sum control charts.— Industrial
Quality Control, pt 1 — 1962, 18, N 12, p. 15—21; pt 2—1962, 19, N 1,
p. 29—36; pt 3—1962, 19, N 2, p. 22—28.
120. Johnson R. A., Bagshaw M. The effect of serial correlation on the perfor-
ms
mance of cusum tests.— Technometrics, pt I — 175, 16, N 1, p. 103_____
112; pt 2-1975, 17, N 1, p. 73—80.
121. Jones R. H., Crowell D. H., Kapunaiai L. E. Change detection model
for serially correlated multivariate data.— Biometrics, 1970, 26, N 2
p. 269—280.
122. Kemp K. W. Formulae for calculating the operating characteristic and
average sample number of some sequential tests.— J. Roy. Statist. Soc
B, 1958, 20, p. 374—386.
123. Kemp K. W. The average run length of the cumulative sum chart when
a V-mask is used.— J. Roy. Statist. Soc. B, 1961, 23, N 1, p. 149—153.
124. Kemp K. W. Formal expressions which can be used for the determination
of operating characteristic and average sample number of a simple sequ-
ential test.— J. Roy. Statist. Soc. B, 1967, 29, N 2, p. 248—262.
125. Kemp K. W. A simple procedure for determining upper and lower limits
for the average sample run length of a cumulative sum scheme.— J. Roy.
Statist. Soc. B, 1967, 29, N 2, p. 263—265.
126. Kemperman J. The general one-dimensional random walk.— S-Gravenha-
ge, 1950. ill p.
127. Lai T. L. A note on first exit times with application to sequential analy-
sis.— Ann. Statist., 1975, 3, N 4, p. 999—1005.
128. Lee A. F. S., Heghinian S. M. A shift of the mean level in a sequence of
independent normal random variables — a bayesian approach.— Techno-
metrics, 1977, 19, N 4, p. 503-506.
129. Lorden G. On excess over the boundary.— Ann. Math. Statist., 1970,
41, N 2, p. 520—527.
130. Lorden G., Eisenberger I. Detection of failure rate increases.— Techno-
metrics, 1973, 15, N 1, p. 167—175.
131. Lorden G. Procedures for reacting to a change in distribution.— Ann.
Math. Statist., 1971, 42, N 6, p. 1897—1908.
132. Me Gilchrist C. A., Woodyer K. D. Note on a distribution — free CUSUM
technique.— Technometrics, 1975, 17, N 3, p. 321—325.
133. Montgomery D. C., Klatt P. J. Economic design of T2-control charts to
maintain current control of a process.— Manag. Sci., 1972, 19, N 1,
p. 76-89.
Nadler J., Robbins N. B. Some characteristics of Page’s twosided proce-
dure for detecting a change in a location parameter.— Ann. Math. Statist.,
1971, 42, N 2, p. 538—551.
Newbold P. Tbe exact likelihood function for a mixed autoregressive —
moving average process.— Biometrika, 1974, 61, N 3, p. 423—426.
136. Newbold P. M., Ho Y.-C. Detection of a changes in the characteristics
of a Gauss — Markov process.— IEEE Trans. Aerospace and Electron.
Syst., 1968, 4, N 5, p. 707—718.
137. Nikiforov I. V. A statistical method for detecting the time at which the
sensor properties change: Prepr. of IMEKO Symp. on Application of Sta-
tist. Meth, in Measurement. Leningrad, 1978, p. 1—7.
138. Pagano M. An algorithm for fitting autoregressive schemes.— Appl. Sta-
tist., 1972, 21, N 3, p. 274-281.
139. Page E. S. Control charts for the mean of a normal population.— J. Roy.
Statist. Soc. B, 1954, 16, N 1, p. 131 — 135.
Page E. S. An improvement to Wald’s approximation for some properties
of sequential tests.— J. Roy. Statist. Soc. B, 1954, 16, N 1, p. 136—139.
Page E. S. Continuous inspection schemes.— Biometrika, 1954, 41, N 1,
p. 100—115.
Page E. S. Control charts with warning lines.— Biometrika, 1955, 42,
N 2, p. 241—257.
Page E. S. A test for a change in a parameter occuring at an unknown po-
int.— Biometrika, 1955, 42, N 4, p. 523—527.
Page E. S. Estimating the point of change in a continuous process.— Bio-
metrika, 1957, 44, N 2, p. 248—252.
Page E. S. A modified control chart with warning limits.— Biometrika,
1962, 49, N 1, p. 171—176.
134.
135.
140.
141.
142.
143.
144.
145.
146. Page E. S. Controlling the standard deviation by cusum and warning li-
nes.— Technometrics, 1963, 5, N, 3, p. 307—315.
147. Page E. S. Comparison of process inspection schemes.— Industr. Quali-
ty Contr., 1964, 21, N 5, p. 245—249.
148. Phatarfod R. M. Sequential tests for normal markov sequence.— J. Aust"
ral. Math. Soc., 1971, 12, p. 433—440.
149. Phillips M. J. A survey of sampling procedures for continuous producti-
on.— J. Roy. Statist. Soc. A, 1969, 132, pt 2, p. 205—228.
150. Pollak M.., Siegmund D. Approximations to the expected sample size
of certain sequential tests.— Ann. Statist., 1975, 3, N 6, p. 1267—1282.
151. Prairie R. R., Zimmer W. J. Continuous sampling plans based on cumu-
lative sums.— Appl. Statist., 1970, 19, N 3, p. 222—230.
152. Quandt R. E. The estimation of the parameters of a linear regression sy-
stem obeying two separate regimes.— J. Amer. Statist. Assoc.,) 1958, 53,
p._ 873-880.
153. Quandt R. E. Tests of the hypothesis that a linear regression system obeys
two separate regimes.— J. Amer. Statist. Assoc., 1960, 55, p. 324—330.
154. Riffenburgh R. H. Regime testimation in a time sequence.— Technomet-
rics, 1971, 13, N 4, p. 795—809.
155. Reynolds M. R. Approximations to the average run length in cumulative
sum control charts.— Technometrics, 1975, 17, N 1, p. 65—71.
156. Roberts S. W. Control charts tests based on geometric moving, average.—
Technometrics, 1959, 1, N 3, p. 239—250.
157. Roberts S. W. A comparison of some control chart procedures.— Tech-
nometrics, 1966, 8, N 3, p. 411—430.
158. Robinson P. В., Ho T. Y. Average run lengths of[geometric moving ave-
rage charts by numerical methods.— Technometrics, 1978, 20, N 1,
p. 85—93.
159. Sandvin O., Tjostheim D. Multivariate autoregressive representation of
seismic P-wave signal application to shortperiod discrimination.— BSSA,
1978, 68, N 3, p. 735—756.
160. Schweppe F. C. Evaluation of likelihood functions for Gaussian signals.—
IEEE Trans. Inform. Theory, 1965, 11, p. 61—70.
161. Siegmund D. Error probability and average sample number of the sequen-
tial probability ratio test.— J. Roy. Statist. Soc. B, 1975, 37, N 3,
p. 394—401.
162. Smith A. F. M. A bayesian approach to inference about a change point
in a sequence of random variables.— Biometrika, 1975, 62, N 2, p. 407—
416.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
Sweet A. L., Hardin J. C. Solution for some diffusion process with two-
barriers.— J. Appl. Probab., 1970, 7, N 2, p. 423—431.
Taylor H. M. Statistical control of a gaussian process.— Technometrics,
1967, 9, N 1, p. 29—41.
Taylor H. M. The economic design of cumulative sum control charts.—
Technometrics, 1968, 10, N 3, p. 479—488.
Taylor H. M. A stopped brownian motion formula.—[Ann. Probab.,
1975, 3, N 2, p. 234-246.
Tjostheim D. Autoregressive representation of seismic P-wave signals with
an application to the problem of short — period discriminants.— Geophys.
J. Roy. Astron. Soc., 1975, 25, N 2, p. 269—291.
van Dovven de Bruyn C. S. Cumulative sum tests. L.: Griffin, 1968. 82 p.
Wetherill G. B. Seguentiai methods in statistics. L.: Methuen, 1966. 218 p.
Whittle P. On the fitting of multivariate autoregressions and the approxi-
mate factorization of the spectral density matrix.— Biometrika, 1963,
50, N 1, p. 129—134.
Willsky A. S. A survey of design methods for failure detection in dyna-
mic systems.— Automatica, 1976, 12, N 6, p. 601—611.
Willsky A. S., Jones H. L. A GLR approach to the detection and estima-
tion of jumps in linear systems.— IEEE Trans. Autom. Contr., 1976,
21, N 1, p. 108—112.
Woodward R. H., Goldsmith P. L. Cumulative sum techniques.— In:
ICI Monograph N 3, Edinburgh; Oliver and Boyd, 1964. 66 p.
196
СОДЕРЖАНИЕ
ВВЕДЕНИЕ.................................................. 3
Глава 1. КРУГ РЕШАЕМЫХ ЗАДАЧ.............................. 5
1. Общая классификация задач........................ 5
2. Задачи текущего контроля производства............ 6
3. Задачи автоматизации обработки научных наблюдений .... 10
4. Основные требования, предъявленные к алгоритмам обнару-
жения разладки..................................... 12
Глава 2. КЛАССИФИКАЦИЯ АЛГОРИТМОВ ОБНАРУЖЕНИЯ
РАЗЛАДКИ............................................... 13
1. Варианты формальной постановки задачи........... 13
2. Последовательные методы обнаружения разладки (независи-
мые случайные последовательности) . . 15
3. Апостериорные методы обнаружения разладки....... 34
4. Актуальные вопросы синтеза и анализа алгоритмов обнару-
жения разладки..................................... 42
Глава 3. МОДИФИКАЦИИ АЛГОРИТМА КУМУЛЯТИВНЫХ
СУММ (ЗАВИСИМЫЕ СЛУЧАЙНЫЕ ПОСЛЕДОВА-
ТЕЛЬНОСТИ) ............................................. 44
1. Модели разладки и способы задания информации о векторе
параметров......................................... 44
2. Применение АКС при полной информации о векторе 0 , . . 45
3. Применение АКС при неполной информации о векторе 0
(II вариант АКС)................................... 48
4. Применение АКС при неполной информации о векторе 0
(III вариант АКС).................................. 51
Глава 4. ИССЛЕДОВАНИЕ АЛГОРИТМОВ КУМУЛЯТИВНЫХ
СУММ.................................................... 57
1. Методика исследования АКС....................... 57
2. Оценка среднего времени наблюдения для случая независи-
мых приращений решающей функции.................... 61
3. Оценка среднего времени наблюдения в случае близких ги-
потез ............................................. 70
4. Оценка среднего времени наблюдения для зависимых прира-
щений решающей функции и чувствительность АКС к влия-
нию мешающих параметров............................ 76
Глава 5. ПРИМЕНЕНИЕ АЛГОРИТМА КУМУЛЯТИВНЫХ
СУММ ДЛЯ ОБНАРУЖЕНИЯ РАЗЛАДКИ ПОСЛЕДО-
ВА ТЕЛЬНОСТЕЙ АВТОРЕГРЕССИИ—ПРОИНТЕ-
ГРИРОВАННОГО СКОЛЬЗЯЩЕГО СРЕДНЕГО .... 83
1. Описание временных рядов с помощью моделей АРПСС . . 83
2. Применение АКС для одномерных моделей АРПСС .... 87
198
3. Применение АК для многомерных моделей АРПСС .... 104
4. Применение АКС для линейных моделей объектов..... ПО
5. Статистическое моделирование процедуры обнаружения раз-
ладки ............................................ 114
Глава 6. НАСТРОЙКА АЛГОРИТМОВ КУМУЛЯТИВНЫХ
СУММ................................................... 121
1. Методика настройки АКС (предварительные этапы) . ... 121
2. Методы оптимизации АКС.......................... 127
3. Сведение настройки АКС к решению задачи квадратичного
программирования.................................. 140
4. Программное обеспечение этапов настройки АКС (описание
набора программ).................................. 146
Глава 7. ПРИМЕРЫ) ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ КУМУ-
ЛЯТИВНЫХ СУММ.......................................... 158
1. Примеры использования АКС при контроле производства 158
2. Примеры использования АКС при обработке научных на-
блюдений ......................................... 161
3. Практическая реализация методики настройки АКС и оцен-
ка его эффективности на примере задачи обнаружения сейс-
мических волн..................................... 164
ПРИЛОЖЕНИЕ
Набор подпрограмм на языке Фортран-IV (исходные тексты) 173
ЛИТЕРАТУРА.............................................. 191