Author: Огарков М.А.
Tags: автоматика системы автоматического управления и регулирования интеллектуальная техника технология управления оборудование систем управления техническая кибернетика теория вероятностей анализ данных математическое моделирование математическая статистика
ISBN: 5-283-01511-4
Year: 1990
М.А.ОГАРКОВ
Методы
статистического
оценивания
параметров
случайных
процессов
МОСКВА
ЭНЕРГОАТОМ ИЗДАТ
1990
ББК 32.965
0-36
УДК 681.5.015.42
Рецензент С. Я. Виленкин
Редактор В. И. Петухова
Огарков М. А.
0-36 Методы статистического оценивания
параметров случайных процессов.—М.: Энергоатомиздат,
1990. —208 с: ил.
ISBN 5-283-01511-4
Систематизированы методы оценивания параметров
случайных процессов по выборке измерений нарастающего
объема. Рассмотрены вопросы синтеза значительного числа
практически реализуемых алгоритмов дискретной и непрерывно-
дискретной фильтрации. Особое внимание обращено на
специфику учета в алгоритмах статистической обработки
информации о границах областей допустимых значений
исследуемых параметров.
Для инженеров и научных работников, занимающихся
прикладными задачами фильтрации и управления.
„ 1402060000—022
" 051(01)-90 '-'' ^^"^ ''■'''
ISBN 5-283-01511-4 © Автор, 1990
Предисловие
Современный этап научно-технической революции
характеризуется тесным взаимодействием науки и производства. От
научных работников и инженеров требуется не просто решать
те или иные технические задачи, а уметь находить
оптимальные инженерные решения. Ускорение научно-технического
прогресса в области создания систем автоматического управления
не будет достигнуто, если ученые или инженеры будут
создавать вновь то, что уже создано до них, поэтому степень
информированности приобретает сейчас решающую роль.
В настоящее время существуют фундаментальные
теоретические работы по теории случайных процессов [18, 23, 33, 34,
60, 89, 102], имеются книги на эту тему, написанные на основе
лекций, читаемых в вузах [98, 99]. Тем не менее нередко
встречается ситуация, когда инженер, добросовестно выучивший
теорию случайных процессов, не умеет решать практические
технические задачи, возникающие при синтезе автоматических
систем. Оказывается, что для оптимального решения технических
задач оценивания знание теории необходимо, но не достаточно.
Нужно обладать еще набором решений модельных задач,
которые могли бы служить прототипом для технических задач и в
известной мере отображали бы многообразие ситуаций, которые
могут встретиться на практике при оценивании случайных
процессов— см. [И, 19, 58, 62, 84]. Эти книги отражают уровень
развития алгоритмов динамического оценивания на момент их
издания, поэтому, естественно, не учитывают изменений,
происшедших к настоящему времени в этой области. Кроме того, они
не обладают требуемой для практики полнотой, поскольку не
учитывают, что решения задач оценивания выполняются на
ЦВМ с ограниченной разрядной сеткой.
В данной книге рассмотрены методы оценивания случайных
процессов, недоступных непосредственному наблюдению в
системах автоматического управления, по измерительной
информации нарастающего объема, поступающей на вход системы.
Свое начало эти методы берут с трудов Р. Е. Калмана
(1960 г.) по дискретной и непрерывной фильтрации.
3
в настоящей работе делается попытка описания комплекса
практически реализуемых алгоритмов динамического
оценивания на материале научно-технической журнальной литературы,
изданной на сегодняшний день; однако о некоторых
особенностях книги нужно сказать отдельно:
1) помимо традиционных направлений непрерывной и
дискретной динамической фильтрации здесь рассмотрены
непрерывно-дискретные алгоритмы оценивания, которые в ряде
случаев более адекватны реальным условиям работы;
2) дается систематическое изложение на инженерном
уровне мало известных разделов построения эллипсоидальных
гарантирующих оценок и вопросы коррекции регулярных оценок
за счет использования информации об ограниченности областей
допустимых значений исследуемых параметров;
3) рассмотрены эквивалентные преобразования дискретных
алгоритмов фильтрации и экстраполяции к виду, удобному для
работы на ЭВМ с ограниченной разрядной сеткой;
4) в области адаптивной фильтрации (наряду с
изложением известных алгоритмов оценивания) приводится дискретный
адаптивный регуляризованный фильтр, обеспечивающий
неизбежную сходимость оценок с высокой скоростью;
5) технические задачи и примеры поясняют процедуру
применения результатов решения модельных задач для практики;
6) единство подхода к синтезу алгоритмов оценивания
достигается благодаря обоснованному использованию единого
критерия оптимизации, вывода общих математических
соотношений для первых двух статистических моментов оцениваемых
параметров и правил действий с эллипсоидами,
аппроксимирующими области допустимых значений исследуемых
параметров. Далее эти соотношения и правила применяют при
построении конкретных алгоритмов дискретного, непрерывного и
непрерывно-дискретного оценивания.
В целом книга представляет собой систематизацию
существующих и изложение новых результатов по методам обработки
измерительной информации нарастающего объема, может быть
полезна специалистам, занимающимся вопросами синтеза
систем автоматического управления.
Автор благодарен проф. А. Ф. Романенко за участие в
обсуждении полученных результатов, признателен О. О. Голова-
невой, В. Г. Пшенянику и Н. А. Яблоковой за большую помощь
при оформлении рукописи книги.
Автор благодарен рецензенту С. Я. Виленкину за пожелания,
способствовавшие улучшению качества излагаемого материала.
Предложения по дальнейшему развитию вопросов, затронутых
в книге, и совершенствованию их изложения просим направлять
по адресу: 113114, Москва, Шлюзовая наб., 10, Энергоатом-
издат.
Автор
Краткий список сокращений и обозначений
АВ — астровизир
БКУ — бортовой комплекс управления
БЦВМ — бортовая цифровая
вычислительная машина
ГЭСК — геоцентрическая экваториальная
система координат
ДО — двигатели ориентации
ДС — двигатели стабилизации
- ДУС — датчик угловых скоростей
КА — космический аппарат
ОСК —опорная система координат
ПДЦМ — параметры движения центра масс
РВЕ — радиовертикаль-высотомер
САН — система автономной навигации
сек — связанная система координат
СОИ — система обмена информации
сое — система ориентации и стабилизации
СУМ — система управления маневром
ЦМ — центр масс
ДУ — датчик угла
СЭП — система энергопитания
п{-), по{-), ni(-), Л2{-) —плотности распределения
вероятностей случайных величин
^=3,1415926...
б(^—т) —дельта-функция
6ki — символ Кронекера
tr А — след квадратной матрицы А
х^—■N{m, Р) —случайный вектор х имеет
нормальный закон распределения
вероятностей с математическим ожиданием
т и корреляционной матрицей Р
Л1[-] —математическое ожидание
cov(xt, у,)=М[(хг—Afxt) {ъ—ЩхУ];
var(Xf)=cov(Xf, xt);
А'' —транспонирование матрицы А
А+ — псевдообращение матрицы А
А~1 — обратная матрица по отношению к матрице А
Q(/n, Р) —эллипсоид с центром т и размерами,
определяемыми положительно-определенной матрицей Р
г л ав a 1
Постановка задачи оценивания
1.1. Некоторые технические задачи оценивания
Методы оптимального оценивания параметров в темпе
поступления измерительной информации широко применяют в
различных областях техники. Целый ряд таких задач в общих
чертах описан в [19]. В настоящей книге остановимся более
подробно на использовании методов оценивания при построении
бортового комплекса управления (БКУ) беспилотного
космического аппарата (КА). Бортовой комплекс управления
беспилотного КА, функциональная схема которого представлена на
рис. 1.1, включает в себя систему ориентации и стабилизации
(СОС), систему автономной навигации (САН), систему
управления маневром (СУМ), систему энергопитания (СЭП) и
систему обмена информацией (СОИ) [6]. Координация работы
этих систем осуществляется бортовой цифровой
вычислительной машиной (БЦВМ).
Несмотря на различие физических принципов построения
систем, входящих в состав БКУ, алгоритмы их функционирования
могут быть построены как частные случаи решения
формализованной математической задачи оценивания. Характерными
чертами такой задачи являются: априорное описание
оцениваемых параметров в виде системы обыкновенных
дифференциальных уравнений; наличие уравнений взаимосвязи оцениваемых
и измеряемых параметров; учет ограничений На возмущения,
действующие на систему, и на области допустимых значений
этих параметров; критерий оптимизации. Посмотрим, какой вид
имеет эта априорная информация для тех систем БКУ, которые
отвечают за баллистическое обеспечение КА, т. е. для систем
СОС и САН.
Система ориентации и стабилизации представляет собой
совокупность устройств, обеспечивающих заданное движение КА
относительно его центра масс (ЦМ). Движение вокруг ЦМ
может быть двух видов: ориентация — поворот КА или какой-
6
сое
Т^'
САН
-Г
СУМ
л\
сэп
1 t
Б и в М
'
1
сои''-
Рис. 1.1. функциональная схема БКУ
Инсрормация о границах
обллстей. изменения
измеряемых параметров
ЛУС
ДУ
БЦВМ
Алгоритм
ориентации
Алгоритм
стабилизации
Исполнительные
устройства.
Угловые отклонения
Угловые скорости
Корпус КА ила
прабор
Рис. 1.2. Функциональная схема СОС
либо подсистемы КА из произвольного положения в
требуемое— и стабилизация — удержание связанных с КА осей
координат вблизи осей опорной системы координат (ОСК).
Функциональная схема СОС представлена на рис. 1,2. По сигналам
датчиков углов (ДУ) и датчиков угловых скоростей (ДУС)
БЦВМ в соответствии с заложенными в нее алгоритмами
управления ориентацией и стабилизацией вырабатываются
управляющие команды, поступающие на исполнительные
устройства. Последние воздействуют на корректирующие двигатели
ориентации (ДО) и стабилизации (ДС), создающие
требуемые управляющие моменты.
Движение КА относительно ЦМ в связанной системе
координат (ССК) описывается динамическими уравнениями Эйлера
[14]
А«1 + (/, — /з) со.со, = Ml -Ь ДЖ,;
/.^^-Ь (/з —/i) сОзСй! = ЛГ,-Ь ДЖ,;
hk + (/i — /2) «i«2 = л^з -ь ^м,
и кинематическими уравнениями в кватернионной форме
Л = 0,5(ЛОсй^),
где /ь /г, /з — главные центральные моменты инерции КА; «i,
<02, соз — проекции абсолютной угловой скорости КА на оси
ССК; Mi и АЛ1,(г^1, 2, 3) —проекции управляющих и
возмущающих моментов сил на оси ССК; А=(А,о, A,i, Х2, А,з) и о)в=(0,
соь CU2, о)з) — кватернионы, описывающие движение ОСК
относительно ССК: О—знак кватернионного умножения.
Измерения, поступающие на момент времени t с ДУС,
имеют вид
yi=ii,i-\-Vi, г=1, 2, 3,
где Vi — погрешности измерения угловых скоростей.
Датчики угловых скоростей имеют известную зону
нечувствительности [—А,, At], г^1, 2, 3, поэтому точечные измерения
yi указывают лишь на событие присутствия истинных значений
измеряемых параметров в областях [уг—2Аг, yi-\-2Ai], г^1, 2, 3.
Требуется по результатам измерений угловых скоростей
yi(i^l, 2, 3) определить на момент времени t параметры
кватерниона А и моменты сил Mi так, чтобы обеспечить минимум
расхода топлива или минимальное время переориентации КА.
Знание оценки Л кватерниона Л позволяет при малых
отклонениях ССК и ОСК определить углы Крылова (углы тангаи^а
ф1, крена ф2 и рыскания фз) [И], приближенные значения
которых tpi ^ 2Яо Яз; ?2 "^ ЗЯоЯ^; ср, "=* 2Я(, Яг, поступают с ДУ.
Система автономной навигации предназначена для
определения координат и скорости движения центра масс
[параметров движения центра масс (ПДЦМ)] КА в некоторой системе
координат по данным
бортовых
навигационных измерителей.
Функциональная схема
одного из видов ,САН
приведена на рис. 1.3.
радиовысотомер-вертикаль (РВВ) измеряет
высоту 1/1 ЦМ КА над
поверхностью Земли и
углы тангажа ф1 и
крена ф2, задающие
направление местной
вертикали относительно
ССК. Астровизир (АВ)
определяет
относительно ССК углы • а и
РВВ
АВ
КС
У1 % 92
а fi
Уз
БЦВМ
Навигационный,
алгоритм
,
1
}
-L
Инсрормация о грани
цах областей,
изменения оцениваемых U.U3M&-
ряемых параметров
Рис. 1.3. Функциональная схема САН
8
p, задающие направление на выбранную звезду. Космический
секстант измеряет угол уз между направлением на известный
ориентир и выбранную звезду. Обработка навигационной
информации производится с помощью БЦВМ, куда помимо
измерительной информации вводятся начальные условия
решения навигационной задачи, границы областей
неопределенности, в которых находятся измеряемые параметры, а также
границы областей допустимых значений ПДЦМ КА в
орбитальной системе координат.
Априорное описание оцениваемых - параметров, которыми
являются ПДЦМ КА, в геоцентрической экваториальной
системе координат (ГЭСК) Qx\X2Xz имеет вид [72]
Xi=Xj+z; Xi+3=Ff/m-\-Fjy"Plm, /,=1, 2, 3.
где Xj и Xf+3 — проекции на оси ГЭСК радиуса-вектора г и
радиальной скорости ЦМ КА; F/ и /'уУпр — проекции на те же оси
равнодействующей внешних сил, действующих на КА и
управляющей силы, создаваемой двигательной установкой КА; т —
масса КА.
В связи с тем что силы F,- и f/y"P (/=1, 2, 3) известны
приближенно, возникает необходимость периодически уточнять
ПДЦМ по измерительной информации. При этом для решения
навигационной задачи следует выбирать измеряемые
параметры, инвариантные относительно системы координат, в которой
решается навигационная задача. Здесь в качестве таких
параметров выбраны: i/i — высота ЦМ КА над поверхностью Земли,
1/2 — угол между направлением на звезду и местной вертикалью.
Уз—угол между направлениями на звезду и известный ориентир.
Взаимосвязь ПДЦМ и измеряемых параметров (/,(г^1, 2, 3),
может быть представлена в следующем виде [72] (рис. 1.4):
y,=r—R4\—aX3'r-^)+vr,
1/2=л/2—arcsin (LiN)-|-t;2;
1/з=л/2—arcsin (L2L3) -{-V3,
где Яэ — экваториальный радиус Земли; а — коэффициент
сжатия общеземного эллипсоида; Lj и N — единичные векторы,
определяющие линии визирования звезд, ориентира и местной
вертикали; о,- — погрешности измерения высоты ЦМ над
поверхностью земли и углов звезда — вертикаль и звезда —
ориентир.
Используемый на борту КА высотомер измеряет расстояние
от ЦМ КА до реальной поверхности океана, а не до общеземио-
го эллипсоида, выбранного для аппроксимативного описания
движения ЦМ КА. Измерения, полученные с РВВ и АВ, позво-
9
t^^z
p I
^n
,^3в1
Рис. 1.4. Геоцентрическая экваториальная система координат
ляют сформировать значение угла между направлениями на
центр звезды и местной вертикалью, а не значения угла звезда—
геоцентрическая вертикаль. Поэтому высоты i/i ЦМ КА над
общеземным эллипсоидом и угол 1/2 (звезда — геоцентрическая
вертикаль) известны лишь с точностью до допустимого
диапазона значений с известными границами. Таким образом, имеем
дело не с точечными значениями измеряемых параметров, а с
событиями присутствия измеряемых параметров в известном
допустимом диапазоне значений.
В силу приближенного знания начальных значений ПДЦМ
КА, а также сил Fj и Ff^'^ (/^1. 2, 3) при численном
интегрировании уравнений, описывающих движение ЦМ КА, будут
иметь место ошибки прогнозирования. Известно [72], что
ошибки прогнозирования в направлении, перпендикулярном к
плоскости орбиты, носят приближенно гармонический характер
изменения с амплитудой, являющейся величиной
высокостабильной. Поэтому всегда можно указать границы области ошибок
прогнозирования в орбитальной системе координат для
координат и скоростей движения ЦМ в направлении,
перпендикулярном плоскости орбиты КА.
Используя указанную априорную информацию, необходимо
по результатам измерения высоты ух и углов 1/2 и уг найти
оценки Xi, i=\, 6 ПДЦМ КА, оптимальные в среднеквадратическом
смысле.
Аналогично можно было бы рассмотреть и остальные
системы БКУ КА с позиции наличия априорной информации,
которую целесообразно использовать при синтезе алгоритмов
функционирования этих систем. Характерные особенности,
выявленные при рассмотрении технических задач, позволяют перейти
к математической постановке формализованной задачи
оценивания.
10
1.2. Общая формулировка задачи оценивания
Пусть xt — случайный процесс, непосредственное
наблюдение которого невозможно. Чтобы получить информацию о
процессе \t, наблюдаем за процессом yt, функционально связанным
с процессом Xt. На интервале времени [^о, г], имеющем
переменный верхний предел %, формируется выборка измерений
Yo^^iys : s^[to, %]}. Задача оценивания состоит в том, чтобы
построить функционал хДУо). определяющий единственное
значение х<(точечное оценивание), либо операторQj = Qj (Уо),
определяющий множество значений х< (интервальное
оценивание). По значениям х/ или Q- получаем возможность судить с
некоторой достоверностью об истинном значении процесса \t на
момент времени t. Совокупность математических операций,
выполненных в порядке, определяемом функционалом х^-- (Уо) или
оператором Q- (Уо), будем называть алгоритмом оценивания.
В зависимости от соотношения между моментом времени т
получения последнего измерения и моментом времени t, на
который необходимо получить оценку вектора xt, различают
три вида задач оценивания. Если t<Cx, то задачу оценивания
называют задачей интерполяции, если t^x, то — задачей
фильтрации, если ^>г, то — задачей экстраполяции.
Основными исходными данными, которые используются при
математической постановке задачи оценивания, являются:
математическая модель, описывающая оцениваемые и измеряемые
параметры; априорная и измерительная информация; критерий
оптимизации; дополнительные ограничения, накладываемые на
алгоритм оценивания вектора х<, для обеспечения его
практической реализуемости. Эти данные, отражая объективные
закономерности, описывающие оцениваемые и измеряемые
параметры, в то же время несут в себе элементы субъективности,
связанные с полнотой учета априорной информации, выбором
критерия оптимизации и ограничений, упрощающих
реализацию алгоритма в ЦВМ.
Остановимся более подробно на отдельных факторах,
определяющих постановку задачи оценивания.
1. Математическая модель — система математических
соотношений, описывающих оцениваемые и измеряемые параметры:
xt=f{xt)+b{xt)v/t; (1.1)
y<=h(xO + B(xOvb (1.2)
где f{xt), h{xt), b{xt) и B{xt) —нелинейные известные функции,
аргументом которых служит оцениваемый вектор xt; w< и v< —
случайные процессы, являющиеся функциями времени t.
11
Задачу оценивания называют непрерывной, если процессы
•Kt и yt, описываются уравнениями (1.1) и (1.2) в непрерывном
времени; непрерывно-дискретной, если процесс xt описывается
уравнением (1.1) в непрерывном времени, а измерения у<
проводятся в дискретные моменты времени t^tk, k^O, 1, 2...;
дискретной, если уравнение (1.1) приведено к рекуррентной форме,
а измерения yt проводятся в дискретные моменты времени
.i=tk, *=0, 1, 2...
2. Априорная информация — совокупность данных о
процессах v/t и yt, начальном значении Хо и областях Qx и Qy
допустимых значений процессов xt и y^ В зависимости от способа
задания априорной информации подходы к решению задачи
оценивания подразделяют на вероятностный, гарантирующий и
комбинированный. При вероятностном подходе задаются
статистические описания (вероятности, плотности распределения
вероятностей или статистические моменты) процессов wt, yt и
значения Хо, а области Qx и Qy считаются неограниченными.
При гарантируюдем подходе задаются ограниченные области
:Q^, Q„ и Qx„, такие, что WtG^w, ^tG^v и x^G^x^, области
же Qx и Qy — произвольны. Комбинированный подход
представляет собой сочетание в рамках одной задачи вероятностного и
гарантирующего подходов. Такое сочетание достигается путем
неполного статистического описания процессов w<, vt и
начальных условий Хо и задания областей Q,: и Qy в виде ограничен-
: ных замкнутых множеств.
3. Измерительная информация представляет собой выборку
измерений нарастающего объема 1^1*= (у^: s = 1,^),полученных
в дискретные моменты времени ^j* = {^^ : s = 1, kj, либо при
непрерывно поступающих измерениях выборка измерений
принимает бесконечный объем и представима в виде
Yl-iys-.tsGVo, -]}■
4. Критерий оптимизации — показатель, позволяющий
определить качество работы алгоритма оценивания. Выбор критерия
оптимизации вносит наибольший субъективизм в решение
задачи оценивания. Подробное обсуждение вопроса о выборе
критерия оптимизации при вероятностном подходе к решению
задачи оценивания приводится в § 1.3. Здесь же отметим, что
при вероятностном подходе будем пользоваться только такими
критериями, которые позволяют искать оценку Xt процесса xt
в виде условного математического ожидания
i (О = X (П ^) = М (X, I YI).
Различные возможные варианты выбора критерия
оптимизации при наличии априорной информации об областях
неопределенности исследуемых параметров приведены в § 1.4.
.12
1.3. Критерии оптимизации при вероятностном подходе
Для обоснования выбора критерия оптимизации при
вероятностном подходе к решению задачи оценивания будем
пользоваться результатами теории статистических решений [78].
Оценка х^, каким бы способом она ни была получена, не
совпадает, за редким исключением, с истинным значением
случайного процесса x^ Количественной мерой потерь, которые
несет наблюдатель от принятия оценки х^ вместо истинного
значения х^ является функция потерь С (х^, х^ (Yl)). Последняя
есть функция погрешности Хг — х^ и выборки измерений Уо^.
Поскольку наблюдения у< несут в себе элементы случайности,
то случайными будут и значения функции потерь, поэтому для
построения функционала х^(Уо) нельзя непосредственно
использовать функцию потерь. Необходимо провести усреднение
ее по множеству Qy изменения процесса y^ В теории
статистических решений в качестве такой операции усреднения
используется математическое ожидание. Введем понятие
нерандомизированного условного риска [78]
г (х„ х",) = My [С (X,. i, (YD) I X,] =
= ^C{x,,i,{Yl))i:{Yl\x,)dYl. (1.3)
Здесь индекс у знака математического ожидания означает
переменную, по которой производится усреднение; я{Уо^|х<) —
условную плотность распределения вероятностей.
Наилучшей точечной оценкой х^(Уо) будем считать такую,
которая бы минимизировала условный риск (1.3), т. е.
min г (х^, х^) = г (X,, \'t). (1.4)
Функционал х*=х*(Уо, х^), удовлетворяющий (1.4), в общем
случае будет зависеть от неизвестного процесса xt, поэтому
становится неясным, какой же функционал считать наилучшим.
Построение наилучшего функционала можно выполнить
двумя путями:
во-первых, оценку х^ можно выбрать так, чтобы она
соответствовала одному конкретному значению х^ а именно тому, при
котором достигается верхняя грань условного риска г (х^, х<).
В этом случае вместо (1.4) будем иметь критерий оптимизации
следующего вида:
min sup г {Xf, Xf) = sup г (x^, x"). (1.5)
13
Этот принцип выбора оценки называют принципом мини-
макса Неймана. Минимаксная оценка считается чересчур
пессимистической. Однако когда невозможно предположить какое-
либо подходящее распределение для xt или когда наблюдатель
сознательно стремится к самой осторожной оценке,
минимаксная оценка с успехом может быть применена;
во-вторых, оценку xt можно выбрать так, чтобы она
соответствовала среднему значению xt на множестве Qx, найденному с
учетом вероятности появления каждого значения х^ Для этого
используется средний риск — математическое ожидание
условного риска г (х^, Xt), взятое по х^:
R{Fx, Xt) = Mx,r{Xt, i,) = jr(x„ it)dF{Xt). (1.6)
Средний риск R (F^, xj зависит от функции априорного
распределения вероятностей F^ = F (Xf) процесса х^ и функционала
х< (У5). в данном случае критерий оптимизации
min R{F,, it) = R{Fx, X?). (1.7)
xt^Q
X
Этот принцип выбора оценки называют байесовским. При
таком подходе переносим неопределенность в знании истинного
значения xt в функцию априорного распределения вероятностей
Fx- Из равенств (1.3), (1.6) и (1.7) следует, что для построения
байесовской оценки х? необходимо полное статистическое
описание процессов Xt и уг, т. е. использование функции
распределения вероятностей Fx и условной плотности распределения
вероятностей и (У5 I xj. Можно показать, что байесовскую оценку
X? проще получить, минимизируя по xt вместо среднего риска
апостериорный риск, вводимый как условное математическое
ожидание функции потерь при условии, что известна выборка
наблюдений Уо^ [78]:
i?(^„ х; |У5) = ЖЛС(х„ it)\^l\-
= JC(x„ х,)тг(х, |У'о)£/х„ (1.8)
^х
где т. {Xt I Yl) — условная плотность распределения вероятностей
вектора x^ В силу ограниченности объема книги в дальнейшем
будут рассматриваться только байесовские оценки.
Остановимся коротко на выборе функций потерь и влиянии
этого выбора на байесовскую оценку xf- В [14] показано, что
байесовская оценка является условным математическим ожи-
14
данием оцениваемого процесса xt:
if=x{t\^) = M{xt\Yl) (1.9)
в следующих трех случаях:
1) при квадратичной функции потерь С (х^, х^)=,(х^ — х^)'^Х
X Sf {\( — \t), где Sf — симметричная положительно определенная
матрица, и произвольной условной плотности распределения
вероятностей я(х<|Уо^);
2) при выпуклой и симметричной относительно нуля
функции потерь С (Xf), где х^ = х^ — х^ и симметричной
относительно условного математического ожидания М (х^ | Уд)
Условной плотности распределения вероятностей и (х^ | Уо);
3) при симметричной относительно нуля функции потерь С(х^),
где Xf = \t — х^, и симметричной относительно М (х^ | Yl), невоз-
растающей относительно разности xt—M{xt\Yo'^) условной
плотности распределения вероятностей я(х<|Уо^). Кроме того,
должно быть выполнено равенство
lim C(xt)'^{\t I Yl) =0.
Из Сравнения указанных случаев получения байесовской
оценки в виде условного математического ожидания следует,
что чем шире класс функций потерь, тем большие ограничения
должны быть наложены на функцию распределения
вероятностей.
Посмотрим теперь, какой вид принимает байесовская
оценка при равномерной функции потерь и различных
предположениях о совместной плотности распределения вероятностей xt
и y^ Как при этом видоизменяется сам критерий оптимизации.
1. Байесовская оценка х<р, минимизирующая апостериорный
риск Я{пх, xt\Yo'^) при равномерной функции потерь и
произвольной условной плотности распределения вероятностей
п(х<|Уо^), совпадает с оценкой х<"-*-^, полученной по критерию
Максимума апостериорной плотности распределения
вероятностей
max ^(х,|У5) = Ч>сГ"''|>'о)- (1.10)
Справедливость равенства х<р^х<"-*-^ легко проверяется с
использованием (1.8) и (1.10) (предлагается сделать это чита-
телю), а сама оценка х<"-*-^ удовлетворяет уравнению
х.->-=0. (1.11)
15
Vx, In 11 (X, I Yl)
2. При равномерной функции потерь и равномерной
априорной плотности распределения вероятностей я(х<):=сопз1^яо
^^ -^
совпадают между собой оценки х<р, х<"-*-^- и максимально прав-
доподобная оценка xt""-"-", удовлетворяющая критерию
max тг (У5 I X,) = тг (У5 I i"-"-"). (1-12)
xteQx
Действительно, применим формулу Байеса, чтобы разделить
роли, априорных сведений я(х<)^яо и выборки измерений Уо^,
n{xt\Yo')=n{Xt)n{Yo''\xt)/n{Yo'). (1.13)
Используя равенства (1.10), (1.12) и (1.13), можно записать:
in тг (ir-"" I Yl) = max In тг (x, ', У5) = ^ -^ +
+ max In i: {Yl | x,) - In -^^ Ч- Imi {Yl \ хГ'" "). (1.14)
С помощью (1.14) заключаем, что уравнение (1.11), опре-
деляющее оценку х<"-*-в, превращается в уравнение
максимального правдоподобия
у^1п^(У5|хЛ| -^„.„„ = 0. (1.15)
3. Максимально правдоподобная оценка xt"-"-" совпадает с
оценкой метода наименьших квадратов хЛ*"-", полученной по
выборке дискретных измерений yi*:={ys: s=l, k} и
удовлетворяющей критерию
k k
min S(yi-Hi(x,))^W,(y,-Hnx,))= аСУг-НИ^Г"))^ WX
xt e Sx i=i i=\
X (y, - H, (ir-^)), (1.16)
если:
а) плотность распределения вероятностей я(У1''|х<)—гаус-
совская;
б) Hi (X,) = My, [у, I х,];
в) Vi/t, - GOV-' (уг, уг | х,).
Необходимое условие экстремума (1.16) представляется в
виде уравнения, определяющего оценку метода наименьших
квадратов
V
16
-^H(x,)W^^(Sy,-Hi(x,)j
Xt=Xt
в заключение проведенного здесь обзора критериев
оптимизации отметим, что в дальнейшем при решении большинства
задач оценивания будем использовать в основном байесовскую
оценку в виде (1.9), как наиболее конструктивную.
1.4. Критерии оптимизации при наличии
априорной неопределенности
Рассмотренные выше критерии оптимизации были связаны
с задачами, имеющими полное статистическое описание
оцениваемых и измеряемых параметров. Такая ситуация редко
встречается на практике. Чаще задача оценивания сопровождается
большей или меньшей априорной неопределенностью.
Рассмотрим некоторые ситуации, встречающиеся в технических задачах
оценивания.
1. Пусть я{х<) и я{Уо^|х<) являются весьма грубым
приближением к истинному виду соответствующих плотностей
распределения вероятностей, имеющему место в реальной
практической задаче. Поэтому целесообразно расширить класс
плотностей распределения вероятностей я{х<) и л{Уо^|х<) с тем,
чтобы, используя измерительную информацию, добиться более
близкого к истине статистического описания. Универсальным
способом статистического описания процессов xt и у< при
наличии априорной неопределенности является параметрический.
При этом способе плотности распределения вероятностей
я{Уo■^|x^ а) и я{х<|р) задаются с точностью до совокупности
неизвестных параметров a^{ai,... ,ап) и p={'Pi,... ,Рт).
Обозначим полную совокупность неизвестных параметров аир
через у. Тогда совместная плотность распределения вероятностей
процессов Xt и у< может быть записана в виде
я{Уо^|х^ а)я{х<|'Р)=я{х^ Yo'=\y) =
=я{Уо^|7)я{х<|Уо\ у).
Средний риск (1.6) в этом случае будет иметь вид
= j,r(yS|T)JC{x„ i,)7^{Xt\Ylj)dx,dYl. (1.18)
Так как параметр у неизвестен, то из (1.18) следует, что
значения среднего и апостериорного рисков не определены.
Сохранить байесовский подход к решению задачи оценивания в
этом случае можно двумя путями:
а) расширить вектор состояния xt на множество параметров
у, т. е. сделать оцениваемым вектор [хЛ, ■у'^]'^. Тогда вопрос о
2—6899 17
выборе критерия оптимизации уже решен в § 1.3. Однако еле-
дует заметить, что функция потерь C{xt, xt) не зависит от
параметра у. Например, при равномерной функции потерь
критерием, эквивалентным минимуму среднего риска, будет
max^(x„yS|T) = ^(Xb П| f)- (1-19)
Из (1.19) следует, что для нахождения оценки xt при
известном значении у достаточно использовать условную апостери-
орную плотность распределения вероятностей я(х<|Уо^, у), а
для нахождения оценки параметра у необходимо использовать
совместную плотность распределения вероятностей n{xt, Yo^\y)-
В силу сказанного критерий оптимизации можно сделать
составным:
max тг (X, I Yl у); max тг (х„ Yl \ у); (1.20)
б) задать для у такие значения, которые бы обеспечили
среднему риску требуемое значение, например максимальное.
В этом случае критерий оптимизации может быть минимаксным:
тттахR{F^, х^, у) = R {F^, х*, уЛ-
2. Следующая ситуация возникает тогда, когда плотности
распределения вероятностей n{xt) и л(Уо^|х<) достаточно
близки к их истинному виду, а на основе физических
соображений или результатов экспериментов, предшествующих данному,
известно, что оцениваемые и измеряемые параметры находятся
в ограниченных областях Qx и Q^, не совпадающих с областями
определения параметров xt и yt для функций я(х<) и n{Yo'^\xt).
В этом случае критерий оптимизации может быть выбран в виде
min R (тг^. X, I Уо) = /? {^„ Xt I Yl). (1.21)
iteQx
Такой подход вызван тем, что параметрическая коррекция
плотностей распределения вероятностей приводит к
несущественным изменениям в точности решения задачи оценивания, в
то время как объем вычислений возрастает значительно.
3. Пусть для решения технической задачи вместо истинных
распределений вероятности выбраны квазиправдоподобные
распределения n{xt) и я(Уо^|х<). В то же время измepиteльнaя
информация, поступающая с приборов, характеризуется
существенной зоной нечувствительности. Это означает, что каждое
18
измеренное у,- указывает лишь на принадлежность истинного
значения измеряемого параметра известной области Qy. и не
соответствует априорно выбранной взаимосвязи оцениваемых и
измеряемых параметров. В этом случае выборка измерений
представляет собой выборку событий Di'^{Di, D2,... , Dt)
присутствия измеряемых параметров в последовательности
областей Qyi, i^l, 2,..., t. Критерий оптимизации принимает вид
min R (тг^, it I d\) = R (тг^, i? I D\). (1.22)
4. При полном отсутствии априорной статистической
информации неопределенные величины задаются областями их
возможных значений. Подходы к решению задачи оценивания, а
следовательно, и критерии оптимизации здесь могут быть
различны. Рассмотрим два таких подхода, используя в качестве
априорных областей неопределенности только замкнутые,
выпуклые, симметричные области, а именно, эллипсоиды
неопределенности. Следуя работам Ф. Л. Черноусько [104, 105],
операции над неопределенными величинами можно свести к
соответствующим операциям над эллипсоидами неопределенности.
Образующиеся при этом замкнутые выпуклые области
неопределенности аппроксимируются эллипсоидами минимального
объема. Цель задачи оценивания состоит в определении центра
и полуосей этого эллипсоида. Центр эллипсоида
рассматривается как гарантированная оценка неопределенного параметра, а
большая полуось эллипсоида дает приближенное значение
максимальной ошибки гарантированного оценивания. Найденная
таким способом максимальная ошибка оценивания, естественно,
является завышенной. Вопрос о том, насколько она больше
истинного значения в общем случае остается открытым.
Другой подход к решению задач оценивания в условиях
статистической априорной неопределенности состоит в отыскании
чебышевского центра х* замкнутого выпуклого множества Q^,
которому принадлежат оцениваемые параметры х. Критерий
оптимизации в этом случае имеет вид
max [(х — \*у (х — X*)] = min max [(х — х)'^ (х — х)].
Суть этого минимаксного подхода состоит в построении
таких оценок X*, максимальное расстояние от которых до границы
множества Q^; было бы минимальным из возможных.
Глава 2
Элементы теории оценивания
2.1. Эволюция статистических моментов
В данной главе опишем в минимальном объеме те
теоретические сведения, которые необходимы при вероятностном и
комбинированном подходах к решению задач оценивания по
выборке измерений нарастающего объема. Как отмечалось в гл. 1,
при решении задач оценивания будем пользоваться только
такими функциями потерь, которые позволяют искать оценки
неизвестного процесса х; при выборке измерений нарастающего
объема (Уо'^ или Fi'') в виде условного математического
ожидания Af[xf| Уо''] или M[xt\Yi>'].
Поэтому представляет интерес уравнение эволюции во
времени условного математического ожидания. Однако
пользоваться таким уравнением возможно, если имеем уравнения для
эволюции всех остальных статистических моментов. В этой
главе ограничимся только рассмотрением уравнений для эволюции
условного математического ожидания и условной
корреляционной матрицы применительно к задачам непрерывно-дискретного,
непрерывного и дискретного оценивания.
Случайный процесс xt, t^[to, Т] будем считать
удовлетворяющим стохастическому дифференциальному . уравнению
Ито [23]
dxt=i(xt, t)dt-\-G(xt, t)dwt, (2.1)
где Xt — n-мерный вектор состояния системы; f(x;,
t)—n-мерная непрерывная функция х; и t; G{xt, t) —матрица
размерности пУ(,г; wt — г-мерный процесс броуновского движения с
Mwt=0; M[dwtdwt'']=Q(t)6it—x)dtdx; b{t—x) — дельта-
функция.
Начальный вектор состояния хо имеет нормальную
плотность распределения вероятностей с математическим
ожиданием х(0|0)^ЛГхо и корреляционной матрицей cov(xo, Хо)^Ро, что
кратко можно записать в виде хо'—'Я(х(0|0), Ро).
Вектор Хо и процесс wt — независимы.
Процесс у; при непрерывных наблюдениях связан с
оцениваемым процессом Xt стохастическим дифференциальным
уравнением Ито
dyt=h{xt, t)dt-\-dvt, (2.2)
где У; — т-мерный случайный процесс; h{xt, t) —m-мерная
непрерывная функция Xt и t; vt — m-мерный процесс
броуновского движения с Mvt=0 и M[d\tdvt'']=R(t)b{t—x)dtdx.
Вектор Хо и процесс v; — независимы.
20
При наблюдениях, проводимых в дискретные моменты
времени tk, результаты измерений у^ связаны со значениями х^,
оцениваемого процесса х; в те же моменты времени t^tk, с
помощью соотношения
y,=h(x,, tk)+Vk {k=\, 2,...), (2.3)
где Xft и Уа — значения х; и у; при t^tk; Vk {k^l, 2 ...) — белая
гауссовская последовательность [53], такая, что \k'^N(0, R^).
Значения Хо и v^ (^^1, 2...), а также Vh и wt—независимы.
Непрерывно-дискретное оценивание. Чтобы получить
интересующее уравнение эволюции первых двух статистических
моментов в задаче непрерывно-дискретного оценивания, решим
сначала вспомогательную задачу, в которой выведем
выражение для вычисления условного математического ожидания
скалярной функции векторного аргумента xt.
Задача 2.1. Дано:
1. Непрерывно-дискретный марковский процесс {xt, у к)
удовлетворяет соотношениям
dxt=i{xt, t)dt-\-G{xt, t)dwt; (2.4)
y,=h(x,, tk)-\-Vk; k=l, 2 ... (2.5)
Обозначения в (2.4) и (2.5) те же, что и в уравнениях (2.1)
и (2.3).
2. Ф(х;) —дважды непрерывно-дифференцируемая
скалярная функция векторного аргумента xt.
3. Выборка измерений У1*^{у,; i^\, k}.
Доказать, что в промежутках между измерениями
условное математическое ожидание АГ[Ф(х;) | Fi*] удовлетворяет
уравнению
dM [Ф (X,) I yf] =
= М[ФЦ\ yf] d/ + — tr Ж [GQG^ Ф^^ I У?] dt,
tG[h, h^,]. (2.6)
Для краткости записи опущены аргументы х; и / у функций
Ф4^1),Фхх{х()Лх(, t), G(0,Q(0-
В моменты времени tk{k^\, 2...) проведения измерений
М \Ф (Xfe) I Y\] = ; ' . (2.7)
М [^Ук I X*) I Y\]
Доказательство. Пусть t^[th, 4+i[. Применяя к функции
Ф(х;) формулу Ито замены переменных [60, 122], получим
t
Ф (X,) = Ф (Xfe) ^-^Ф, (X,) f (Х„ х) dx +
21
+ 1/2 i tr [G (X., x) Q (x) G^ (X., X) ф^^ (X.) rfx] +
i
+ f0;j(x,)G(x„ x)dw., (2.8)
где Xft — значение xt при t^tk.
Вычислим математическое ожидание M(-\Yi'') от левой и
правой части равенства (2.8). При этом заметим, что по
свойству стохастических интегралов [60] математическое ожидание
от последнего слагаемого в равенстве (2.8) равно нулю.
Получим
М [Ф (X,) I yf] -М[Ф (X,) I yf] =
t
= \М[Ф, (X,) f (Х„ х) dx I yf] dx +
'k
t
+ 1/2 j tr M [G (X., x) Q (x) G^ (X., x) Ф,, (X,) I yf] dx. (2.9)
Деля левую и правую части равенства (2.9) на t—tk и
переходя к пределу при t—/^^-0, найдем искомое равенство (2.6).
Пусть теперь t^tk. По определению условного
математического ожидания можно записать
М [Ф (X,) I yfI = J Ф (X) ^ (X, /, I yf) dx. (2.10)
Условную плотность распределения вероятностей я(х, tk\Y\'')
представим по формуле Байеса в следующем виде:
It (X, /fe I УО = . (2.11)
Подставляя значение (2.11) в (2.10), получим искомое
равенство (2.7). А
Применим результаты решения задачи 2.1 для нахождения
уравнений, описывающих эволюцию первых двух условных
статистических моментов при непрерывно-дискретном оценивании.
Задача 2.2 (Непрерывно-дискретное оценивание). Дано:
1. Непрерывно-дискретный марковский процесс {х/, у^}
удовлетворяет соотношениям
dxf=f(Xf, t)dt^G(xt, t)dwt, t^to, (2.12)
y,=h(x,,/,)+v,, ;fe=l,2... (2.13)
22
Здесь обозначения те же, что и в уравнениях (2.1) и (2.3).
2. Выборка измерений У1*^{у,-; i^\, k}.
3. Совместная плотность распределения вероятностей я(х;,
t, У1*) существует, непрерывно дифференцируема по / и
дважды — по xt.
Доказать: 1. В промежутках времени между измерениями
t^[tk, tk+i[ условное математическое ожидание xt^M(xt\Yi'')
и условная корреляционная матрица Pt^co-v(xt, xt\Yi'')
удовлетворяют уравнениям
dXf/dt = i {Xf, ty.
(2.14)
dPf/dt = M [Xt f I yf] — хГг +
+ M [fxj I yf] - f xj + M [GQG^ I yfl, (2.15)
где? = M[i{Xt, i) I Y\\, аргументы X; и / у функция f(X;, t),
G(Xf, t), Q.{t) опущены для краткости записи.
2. В моменты tk проведения измерений условное
математическое ожидание x{k\k)^M{Xk\Y\'') и условная
корреляционная матрица P(^|^)^cov(xft, х^|У1*) определяются с помощью
соотношений
x{k\k) = M[x,'^ (у, I X,) I Y\-']IM [-. (у, I X,) I yf-']; (2.16)
Р,(^ I k) =
М[щ^1^(Уи\щ)\У'{
м МУк I ч) I У
k-u
k-U
■x{k\k)x^k\k), (2.17)
где я(уй|х^) —условная плотность распределения вероятностей.
Доказательство. Сначала получим уравнения эволюции
первых двух статистических моментов для моментов времени
t^[tk, tk+i[- Учитывая, что вектор xj и матрица Р; имеют
соответственно размерности пХ1 и иХ". можно записать
-irM\^i\^'\
dP
t
dt
dt
d
~dt
■M\XiXj\Y4]
k
nXn
di
•(Xf, Xj),
(2.18)
(2.19)
где xt={xi, X2,..., ХпУ, Xi—Xi{t), i=\, n.
Придадим соотношениям (2.18) и (2.19) явный вид,
воспользовавшись результатами решения задачи 2.1.
Если Ф(х)=л;г и f=[fi,..,, fn], то по (2.6) будем иметь
dM(Xi\Yi'')=M[[0... 1 ... 0\[h ...fi... fn\'\Yik\dt=
=M[fi{xt, t)\Yi>^]=Tiixt, t), i=\, n.
(2.20)
23
Из (2.18) и (2.20) непосредственно следует справедливость
уравнения (2.14).
Пусть теперь Ф(х)=л;,л;/, i, /=1~, i</, тогда по (2.6)
получим
dMix.Xj I yf) = M[[0...x,....x,...OJ [/,.../,.../,.../„f I У?]Л +
+ ^ tr [GQG^ dt = [M (xjU I yt) +
+ J^ (Xifj I yf)]d/ + Y^r [GQG'l ^^ ^ / = 1. 2,..., Я. (2.21)
Используя (2.21) и (2.18), найдем первое слагаемое в
равенстве (2.19):
= [М (X, Г I yf) + Л1 (fxj I yf)] + -Ltr (GQG^). (2.22)
Второе слагаемое вычисляем непосредственно по правилу
дифференцирования произведения функций, поскольку функция
Xf^M(x|yi*) является дифференцируемой по t. При
вычислении учтем равенство (2.14)
-^(i.ij) =1 (х„ О il + i. Г (х„ 0. (2.23)
Подставляя выражения, стоящие в правых частях равенств
(2.22) и (2.23), в (2.19), получим искомое соотношение (2.15).
Полагая Ф(х)^х^ и используя равенства (2.18) и (2.7),
непосредственно найдем искомое равенство (2.16).
Докажем теперь справедливость равенства (2.17).
Р (^ I ^) = COV (х„ x,\Yb = M (X, xl I yf) -
- X (^ I ^) x^ (^ I ^) = II Ж (XikXjk I Y^) \ln^„ -x(k\ k) X- {k I k).,
(2.24)
Полагая Ф{х)^х,кХ,-к, используя равенства (2.7) и (2.24),
получим искомое соотношение (2.17). Д
Для решения задачи непрерывно-дискретной фильтрации и
экстраполяции при помош,и равенств (2.14) — (2.17) требуются
значения статистических моментов выше второго порядка.
Поэтому получить практически реализуемый
непрерывно-дискретный алгоритм оценивания возможно только при некоторых
дополнительных аппроксимирующих предположениях
относительно старших статистических моментов. Вопросы практической
реализации этих алгоритмов будут рассмотрены в гл. 6.
Непрерывная фильтрация и экстраполяция. Так же как и
при решении задачи непрерывно-дискретного оценивания сна-
24
чала будет решена вспомогательная задача, аналогичная
задаче 2.1.
Задача 2.3. Дано:
1. Непрерывный марковский процесс, описываемый
стохастическими дифференциальными уравнениями Ито (2.1) и (2.2).
2. Ф(х;)—дважды непрерывно-дифференцируемая
скалярная функция векторного аргумента xt.
3. Измерения образуют реализацию
Yo'={ys, s^[to, t]}.
Доказать, что
d$ = ^0J + -L (GQG^0,,) j dt + (0h - a h)^ R-' (dy, -hdt).
(2.25)
Для краткости записи опущены аргументы х; и / у функций
Ф(х,), <Px{xt), 0xx{xt), i{xt, t), G(x,, t), h(x,, t), Q(0, R(0, a
также использовано обозначение для условного математическо-
го ожидания (•)^M[(-) | УоМ-
Доказательство. По определению математического
ожидания
Ф = .W |Ф(х) I У'ц] = J Ф (X) 7t (X, t\ У^) dx.
Используя уравнение Кушнера (П.36) для эволюции
условной плотности распределения вероятностей, получим
d0 = \0 {x)di: (X, t I Y'o)dx = f j Ф (X) I (7t(x, t I Уо))йх
d/-f
+ J Ф (X) [h (X, 0 - h (X, 0] R-' (0 [^У/ -
— h(x, t)dt\'K{x, t I Yo)dx = /j + /2.
(2.26)
Вычислим слагаемые в правой части (2.26) по отдельности,
опуская для краткости записи аргументы функций.
При вычислении /i воспользуемся уравнением Колмогорова
«вперед» [см. (П.34)] и уравнением (2.6)
/i
41
0L (тс) dx
dt-
Гф^йх]й/ = -|-|Гф7г^х
d/-=
= J-M(0\ Уо) Л = ЙЖ(Ф I Уо) =
dt
= М(0Ц\ Уо) -f- —1гЖ (ООО^Ф;,
У^).
(2.27)
25
Непосредственно по определению математического
ожидания вычислим
/^ = j (ФЬ — фh) R~' (dy — hdt). (2.28)
Подставляя (2.27) и (2.28) в (2.26), получим искомое
равенство (2.25). А
Задача 2.4 (Непрерывное оценивание). Дано:
1. {xt, yt}—непрерывный процесс, удовлетворяет
стохастическим дифференциальным уравнениям Ито (2.1) и (2.2).
2. Измерения образуют реализацию Yo*={ys, s^[to, t]}.
Доказать, что условное математическое ожидание х;^
^Л1(х;|Уо') и корреляционная матрица Р^^Ц (Pf),7ll=cov(xf,
Х;|Уо') удовлетворяют стохастическим дифференциальным
уравнениям
dXf = idt + (x^h" — X; h^) R"' (t) {dy^ — hdt); (2.29)
d {Pth = / [(Яз - xtij) + (Qi - M + GQG^),^] -
— (xjh — Xjh)^ R~' (hx^ — \vc)) dt-\- (XiXjh — XiXp. —
— x,xjh — jc^xlh + 'Ix^K'jkf R-' {dyt — hdt), (2.30)
где f(xf, t)=[fi, )f2,..., fn]; использовано обозначение (•) =
=М[(-)|Уо'] и для краткости записи опущены аргументы
функций.
Доказательство. Пусть Ф{\)^Хи Тогда, используя (2.25),
имеем
dXi = fidt + {Xih — Xihy R-' (dy; — hdt), i = 1, n.
Отсюда следует искомое равенство (2.29).
Так как Р^ = х^х/ — х^х^'', то
dPf = d (х^;^) — d (Х;Х;^). (2.31)
Возьмем 0{x)=XiXi и используем снова (2.25), тогда
d (^•) = {x^j + Qj + (GQG^)г^) dt + (^h -
~ x^jhy R-' (dy; —^dt); i, j = T7«. (2.32)
Так как xt — решение стохастического дифференциального
уравнения (2.29), то по формуле Ито (П.33) можно записать
•^ /-^ /--Ч /--Ч
d (xtXj) = XidXj + (dxt) Xj + (Xjh — Xihf R"' {hXj — hл^) dt.
(2.33)
26
Подставляя (2.32), (2.33) в (2.31), получим после
преобразований
d (P,)ti = d (Qj) - d Oi^s) = (^} + fi^i+ (ОООЪ) (^t +
+ (л iXjh — Ic^fiY R-' {d^t — Mt) — 7i (fjdt + {x}i —
— 7jhy R~' (dyt—hdt)) — Qi dt + (x^ — 7ihy R-' (dy^ — hdt)) 7j+
+ (Qi- ^^y R-' (h^^ -^7j) dt = [(Д. - хг/J) +
+ (Й -1-^i) + (GQG^)i^ - (^ - ^^Y R-' (h^^ - hx^)] dt +
/--4 •^ •^
H- (XjX^h — лjA,-h — XjAjh — л,-л,-Ь + 2XjA:,-h)''R~' (dy^ — Ы^.
(2.34)
Это равенство совпадает с требуемым равенством (2.30). А
Дискретное оценивание. Особенно важную роль при
решении задач оценивания в дискретном времени играет теорема
о нормальной корреляции, к рассмотрению которой переходим.
Эта теорема позволяет непосредственно выписывать
соотношения для эволюции первого и второго статистических моментов,
не прибегая к сложному математическому аппарату теории
вероятностей.
Задача 2.5 (Теорема о нормальной корреляции). Дано:
1. {х, у}— («+'")-мерный вектор. Совместная плотность
распределения вероятностей я(х, у) —гауссовская.
2. Априорные значения
Мх=тх; My=my; cov(x, х) = 'Рхх', cov(x, y) = P^y;
cov(y, у) = Р,„. (2.35)
Доказать: 1. Условное математическое ожидание m^r|i/=
^M(x|y) и условная корреляционная матрица P.xx'y=cov(x,
х|у) удовлетворяют соотношениям
m^,^=m, + K(y-m,); (2.36)
К = Рл,Р71); (2.37)
Р..,. = Р..-КР1„. (2.38)
2. Условная плотность распределения вероятностей я(х|у)
является гауссовской.
Доказательство. Получим формулу для условной плотности
распределения вероятностей я(х|у), используя формулу полной
вероятности
11(х|у)=я(х, у)/я(у). (2.39)
27
Поскольку {х, у} — гауссовский вектор, то плотность
распределения вероятности этого вектора представим в виде
■к (х, у) =■ (2^)-
-(п+т)/2
I-1/2,
ехр -^
X —Ш;,
ly-m^
(2.40)
где
р-' =
7С(У) =
.Cl2 С22
(2^)-'""
=
р
'^ УУ
ГР Р 1
^ XX ^ Ху
Р Р
L'^ ух '^ уу Л
Г'^^ехр!-
-1,
-2-(y-m/Pw(y-m^)
(2.41)
(2.42)
Заметим, что согласно формуле Фробениуса [21] для
вычисления обратных матриц
Гр..
1(-
Кроме того, допустимо представление
р _ "хх ^ху I _ "хх "ху "уу "ух "ху I
" [р.. р.. J L о р,, I
У"хх "ху "уу "ух)
\ '-'11 "ху"уу )
+ "хХ "ху ^-'2Й "ух "хХ
р—1р С V
'^хх '^ху ^ii)
с Р р~1
'-'11 '^ху '^УУ
\"уу "ух "хх "ху)
^хх ^ху С22
"уу ~Г "уу "ух ^-'11 "ху
(2.43)
Р Р
.'■ух '^ уу
Тогда
I Р I = I Р — Р
р-1р
L'^yy "^ух
О
Е„
р-'р
= !С
-1
ху '^ уу '^ ух \ • \ ' уу \ — \ ^П I ■ I '^уу \- (^'-V
Преобразуем квадратичную форму в (2.40), используя со
отношения (2.43):
Гх —т;,Гр_, Гх —Ш;,! Гх —т;,ГГС^1 Cj^
Ly —mj 1_У —mj |_У —mj [с^г С
т.,
-Ш;, 'р_, X —Ш;, ^ X —т,
mJ |_У —mJ [у — гПу
= (х — т,У Сц (х — т^) + (х — mJ" С^^ (у — т^,) +
+ (у - ШуУ Сп (X - т,) + (у - т/ С^^ (у - т^) =
= (X - т,)^ С,, (X - т,) - (X - т,)^ С,, Р,,р-' (у - т,) -
- (у - т,)^ (С,1 Р,, Р-V (X - т,) + (у - т,)^ Р^,' (у - т,) +
+ (у - т/ Р^; P,AiP.,P7i/' (у - т,) =
28
= [X — т., — Р^у Р-' (у — my)Y С,, [X — Ш;, —
- РхуР^у (у - ш,)] + (у - тПуУ PJy' (у - т,). (2,45)
Подставляя (2.44) —(2.45) в (2.40), а затем (2.40) и (2.42) в
(2.39), получаем
7с(х |у)-(2^) ""\Сп'Г''"ехр
(X Шд. "ху"уу X
X (у - т,))^ С„ (X - т, - Р,, Р^; (у - т,))]. (2.46)
С другой стороны,
Мх I у) = {21Г" I Р..„)~'''ехр[- ^(х-т„/Х
ХР:гЛЛх-т,|,)]. (2.47)
Из сравнения выражений (2.46) и (2.47) следует
tn.iy = т, — Р^уР^у (у — ШуУ, (2.48)
"хх]у ^ '-'11 =^ "хх "ху"уу "ух- (^.4У)
Обозначая К = P^j^P^i,' и используя (2.48) и (2.49), получаем
искомые равенства (2.36) —(2.38).
Из равенств (2.46) и (2.49) следует второе утверждение
теоремы, что условная плотность распределения вероятностей
л(х|у) является гауссовской со статистическими параметрами
^Х1у и Р,сх\у Д
Используя доказательство, аналогичное решению задачи 2.5,
можно получить результат, являющийся следствием теоремы о
нормальной корреляции.
Задача 2.6 (Следствие теоремы о нормальной корреляции).
Дано:
1. {{xi,...,Xn)\ {уи...,УтУ, (zi,...,z,)^}—условно-гауссов-
ский вектор, т. е. я(х, y|z) — гауссовская условная плотность
распределения вероятностей.
2. Параметры я(х, y|z):
М(х I Z) = т,„; Ж (у I Z) - т,„; (2.50)
COV (х, X I Z) = Р;,;,,^; COV (х, у | z) = Р^,^,!^;
COV (у, у I Z) = Руу,,. (2.51)
Доказать: 1. Апостериорная плотность распределения
вероятностей я(х|у, z) —гауссовская.
29
2. Условное математическое ожидание M(x|y, z) и условная
корреляционная матрица cov(x, х|у, z) задаются формулами
Ж (X I у, Z) = т,|, + К (у - т,„); (2.52)
К = Р.„гР7.\г; (2.53)
COV (X, X I у, Z) = Р,,,,-КРу,^,. (2.54)
Доказательство. Оно может быть выполнено аналогично
доказательству теоремы о нормальной корреляции, если положить
It (X, у) = Tt (х, у I Z), т^ = т;,,^, т^ = т^,!^;
р _р.р _р .р _. р
2.2. Обобщенная теорема о нормальной корреляции
Доказанная в предыдущем параграфе теорема о нормальной
корреляции позволяет наиболее просто выписывать
рекуррентные соотношения для дискретного оценивания при наличии
точечных измерений.
Обобщим эту теорему на случай, когда измерительная
информация представляет собой совокупность событий
присутствия Z)''i^{yi :у^ей(, i^l,^} неизвестных значений измеряемых
параметров у,- в последовательности известных областей Q/,
i=~k.
Суть обобщенной теоремы состоит в следующем. По задаН'
ному условно-гауссовскому распределению оцениваемых и
измеряемых параметров с известными первыми двумя
статистическими моментами этих параметров, полученными по выборке
(k—1) измерений в форме событий присутствия и
поступающему ^-му измерению в форме события присутствия, находятся
апостериорные значения первых двух статистических моментов
оцениваемых параметров.
Задача 2.7 (Обобщенная теорема о нормальной
корреляции). Дано: 1. Измерения образуют выборку
D\={Ds. y(s)eQs, s= 1, 2,.. .,^}
событий присутствия неизвестных значений измеряемых
параметров y(s) в произвольных ограниченных областях Qs-
2. {х(^), у(^)I''— (rt-|-m)-мерный вектор, имеющий услов-
но-гауссовскую плотность распределения вероятностей
■тс (Xji;, yjs; I Z)i~') с математическими ожиданиями mx(k\k—1) =
M(x, I Dt') и m,(^ I ^- t) = Af (у, 1 Z)*,-')
30
и корреляционной матрицей с блочными элементами
dxx {k\k~l) = cov (Xfe, Xfe I Dt'y, d,y ik\k—\) =
= cov (x„ y, I Dt'y, (2.55)
dyy {k\k-\)^ cov (y^, y, I D'r'). (2.56)
Доказать, что условное математическое ожидание
mx{k\k)=M(Xk\D>^i) и условная корреляционная матрица
d.x.x(^|^) =cov(xft, Xfe|D''i) задаются формулами
mAk\k) = mAk\k-\) + d„ (^ | ^- 1) djy'{k | ^- 1) X
X [А, (^ I ^ - 1) - т, (^ I ^ - 1)]; (2.57)
d.. {k\k) = d,, (k\k-l)-d,yik\k-l) dj^l^k I ^ - 1)X
X 2 (^ I ^ - 1) d-;l'^ {k\k-\) dly {k\k- 1), (2.58)
где
my{k\k-\) = P-' (D, I Dt' S y^ ^ (y^ I D'r')dy,; (2.59)
P (D, I Dt') = j ^ (y, I Dt) dy,- (2.60)
2 (^ I ^ — 1) = Ed"'^' (k\k — \)X
X /Я-' (Z), I Dt') j v,„_,v^|,_, Tc (y, I Df-') dyJ d-'^2 (^1^-1);
(2.61)
v.u-i = y. -m,(^ I ^-1); v,„_/>y,-m,(^|^-l). (2.62)
Доказательство. В силу обобщенной формулы Байеса [75]
имеем
■к (X, I Df) = тс (X, I Df-') Я (D, I Df-\ х,)/Я (D, | D^'), (2.63)
где
P(D, |^Г) = |,с(у, |Df-Vy,; (2.64)
Р {D, I D^-\ X,) = J тс (у, I Df-\ X,) dy,. (2.65)
31
Подставляя (2.64) и (2.65) в (2.63) и используя формулу
полной вероятности, получаем
-. (X, I Z)t) = J тс (X, I Df-') -к (у, I D'r\ X,) dy./P (D, I Dt') =
= J ^ (y. I ^f~') ^ (X, I ^Г', У,) dyjP {D, I Df-'). (2.66)
По определению условного математического ожидания
тЛ^ I ^) = j Xfe7t(Xft I Df)dXfe.
Подставляя в это равенство правую часть выражения (2.66)
и изменяя порядок интегрирования, имеем
т, (^ I ^) = Р-' {D, I Df) ]М{х,\ Dt\ у,) ^ (у, I Dt) dy,.
h
(2.67)
Поскольку условная плотность распределения вероятностей
я(хй, Уk\D^^^^\) — гауссовская, то в силу теоремы о нормальной
корреляции получим
М (X, I и\-\ у,) = тЛ^ I ^ - 1) +
+ d,, (^ I ^ - 1) d^i) (^1^-1) [у.- Л^ (у. I Df-')]. (2.68)
Подставляя в (2.67) вместо Af(xfe|Di~\ у^) правую часть
выражения (2.68) и производя интегрирование, находим
т, (^ I ^)= Р-' (D, I Z)f-') j [т, (^ I ^ - 1) + d,,(^ I ^- 1)Х
Х{У* - т, (^ U - 1))] ^ (У^ I ^f~Vyfc = rnAk \k-\) +
+ d,,(^| ^_i)d7;(^| ^_1)(1Й,(^ I k-\)-my{k I ^-1)),
(2.69)
где xny{k\k—\) задается выражением (2.59).
Таким образом, справедливость уравнения (2.57) доказана.
Для вычисления условной корреляционной матрицы uxx{k\k)
представим ее в следующем виде:
d,, (^ I ^) = J x,x^7c(x, I D\)dx^ -mAk\ k) ml{k \ k). (2.70)
32
Подставляя в (2.70) вместо n(Xfe|Z)''i) правую часть
выражения (2.66) и меняя порядок интегрирования, имеем
d.. (^ I ^) = Р-' {D, 1 D'r') f ^ (у, I Z)f-')[ j x,x^ X
X^x, I Dt\ Yk) dx,]dy, -mAk\k)ml{k\k) ^
=|Я- iD,\Dt') l^y.l ВГ) [cov (x„ X, I Dt\ y,) +
+ M (X, I D'r\ y,) M {xl i Dl-\ y,)] dy, -
-mAk\k)m\ik\k). (2,71)
По теореме о нормальной корреляции
cov (Xfe, X, 1 Dt\ y^) = d^^ (^ 1 ;fe - 1) -
-d,y{k\k- 1) d~l (k\k-\)dly{k\k- 1), (2.72)
a условное математическое ожидание Af(Xfe|D''-'i, y^) задается
равенством (2.68).
Подставляя (2.68) и (2.72) в (2.71) и опуская для
краткости аргументы (^|^—1) подставляемых выражений, находим
d.. {k\k) = Я-' (D, I Df-') J 7г(у, I DM) K,-d,,d-'d;j, +
+ {"!;, + d^^d-' (y,, — m^)) {ml + (y^ — m/ d^^l d^^)] dy^ —
— m;,(;fe I ;fe)m^(;fe 1 ;fe). (2.7З)
Выражения Ш;^, d^x, d^', d^^^,, m^, не зависят от y^j,, поэтому
при интегрировании по области Q^ в равенстве (2.71) эти
выражения могут быть вынесены за знак интеграла.
Учитывая сказанное и равенство (2.64), представим правую
часть выражения (2.73) в следующем виде:
^хл (^ 1 ^) = ^хх~ ^xsA^y ^ху + tn^tnl + ^xyd'^y (^Пу—Щу) ml +
'ху^
'ух
+ т, (ту - туУ d"' d,, + Р-' {D, \ О'г') d^.d"' X
X [| (у, - т,) (у, - т,)^ -к (у, 1 Dt') rfy.J d-' d,, -
— тА^\^Ж(^\^)- (2-74)
Обозначим iTiy—mj;=v'' и y^—my=v и вместо mx{k\k)
подставим правую часть доказанного уже равенства (2.57). Выра-
г-6899 33
жение (2.74) приобретет следующий вид:
^-m^x^-ldy, + Я-' {D, I d\-') d,yd-M vv^7c(y, I Df-VyJx
X AJy dy, - (m, + d,yd-^ v») (m;j + v»d7; d,,). (2.75)
После элементарных упрощений правой части равенства
(2.75) получим
d,, {k\k) = d,,-d,,d-' d,, - d,,d-' vVd-' d,, +
+ d,,d7;p-' {D, I Df-' [J vv^^ (y, I D'r') dyA d-J d,, =
\ ■'
= d,,-d,,d7;/4E + d7;/^|vV^-P-'(Z), I D^J vv^ X
L [ s^
ХЧу, I Dt)dy,j d~y'''jd~^'4y,.. (2.76)
Обозначим
2 (^ I ;fe - 1) = E + diy"4vOvo'-P-' (Dfe I Df-') J vv^ X
ХЧу, |M-Vy,|d7r (2.77)
и приведем правую часть этого выражения к иному виду.
Заметим, что
v" = Д, - т, = Р-' {D, I ОГ) J «/.^ (у, I ^f-Уу, -
- Р-' (D, I Df-') J m, (^ U - 1) тс (у, ! Dt') dy, -
= P-> (D, I D?-') J VK (y, I Df-') dy,. (2.78)
Прибавляя и вычитая внутри фигурных скобок выражения
(2.77) величину v"v"'' и используя (2.60), (2.62) и (2-78),
приведем (2.77) к следующему виду:
2(k\k-l)=E- di^^'4p-' (D, I Dt) J (y,-m,) (y,^m,)^X
X-iy.\Dr)dy,y-;y\ (2.79)
Вводя обозначение (2.62), преобразуем равенство (2.79) к
виду (2.61).
34
Таким образом, обобщенная теорема о нормальной
корреляции доказана полностью. А
Уравнение (2.57) аналогично уравнению (2.36) для
определения первого статистического момента в теореме о
нормальной корреляции, с той разницей, что вместо точечных значений
измеряемых параметров в нем используются my(k\k—\),
являющиеся математическими ожиданиями измеряемых параметров,
определяемых при условии использования информации об
ограниченности области допустимых значений (ОДЗ) этих
параметров.
Уравнение (2.58) также имеет внешнее сходство с (2.37) и
(2.38) для вычисления корреляционной матрицы в теореме о
нормальной корреляции. Различие состоит в том, что матрица
2(^1^—1) =7^Е и зависит от my{k\k—l). Таким образом, если
при дискретных точечных измерениях апостериорная
корреляционная матрица оцениваемых параметров определяется лишь
на основе априорной информации, то при измерениях в форме
событий присутствия имеется возможность управления
значением dxx(k\k) с помощью измерительной информации.
Непосредственно из изложенного вытекают следствия.
Следствие 1 задачи 2.7. Если на момент времени th
независимо друг от друга находим оценки вектора х^ по
измерениям двух видов: события присутствия — Dk и точечного зна«
чения ук, то
mAk\k) = M (X, I Z)f-', у,) -
-d,,ik\k- 1) d^; (k\k-l)ly,-myik\k- 1)]; (2.80)
d,, {k\k) = cov (x„ X, I D'r\ yk) + B„ (2.81)
где
В, = d,, {k.\k- 1) diy'ik \k-\) [P- (D, I Z)?-') X
X i yk\k-y ^ (y. I Df') dy,] d^; (k\k-l)dly{k\k- 1); (2.82)
cov(xa., Xfe|Z)i*)H>cov(Xfe, Xk\Dl^^, yk)ii, i=l, 2,.... n. (2.83)
Равенство (2.80) следует из сравнения соотношений (2.57)
и (2.68) и означает, что mx{k\k) является смещенной оценкой
относительно условного математического ожидания УИ(xfe|Z)*-'i,
Yk).
Равенства (2.81) и (2.82) следуют из сравнения
соотношений (2.58) и (2.72). Матрица 8* является положительно
определенной, поэтому (Bfe);;>0, 1^1, 2,..., П. Используя (2.82),
непосредственно получим справедливость неравенства (2.83).
Ухудшение дисперсии оценок есть следствие неопределенности
3* 35
расположения измеряемого параметра относительно области
Qkiyk^Qh) по сравнению с точечным измерением ук-
Следствие 2 задачи 2.7. Условная плотность
распределения вероятностей n(Xfe|Z)i*) не является гауссовской.
В справедливости этого утверждения можно убедиться,
вычислив условную моду Xfe, являющуюся решением уравнения
\/х '^(Xfe I ^i)lxb=x = 0> и сравнив ее с услойн'ым математиче-
ским ожиданием тпх(к\к).
Следствие 3 задачи 2.7. Оценки mx{k\k) и dxx{k\k)
обладают асимптотическими свойствами:
а) при стягивании области Q^ в точку у^ они стремятся
соответственно к M(Xfe|Z)*i, ук) и cov(Xft, \k\D^^u уи);
б) при бесконечном расширении -области Qk эти оценки
стремятся соответственно к априорным значениям mx(k\k—l)
и dxx{k\k—l).
Доказательство следствий 2 и 3 предоставляется читателю.
2.3. Комплексирование регулярных оценок
Достаточно часто при решении технических задач возникает
ситуация, когда на один и тот же момент времени tk известны
две апостериорные оценки x(k\k) и x(k\l) вектора состояния
х^ полученные независимо друг от друга по выборкам
измерений, доставляемых независимо работающими измерительными
устройствами, на несовпадающих временных интервалах.
Возникает вопрос: можно ли построить комбинированную
оценку, использующую оценки x{k\k) и x{k\l), которая бы
обеспечивала меньший средний квадрат ошибки, чем каждая из
этих оценок в отдельности? Ответ на этот вопрос дает
рассмотренная ниже задача.
Задача 2.8 (Комплексирование регулярных оценок). Дано:
1. [Xk, jTfe, z;} — (n-|-m-l-g)-мерный гауссовский вектор,
имеющий априорную плотность распределения вероятностей
я(хо)-Л^(то, Ро) (2.84)
и условные плотности распределения вероятностей
n{Xk\Y\)^N{x{k\k), P(fe|fe)); (2.85)
n{Xk\Z',)^N{x{k\l), Sk); (2.86)
Po, P{k\k), Sk и S-'fe-|-P-i(^l^)—P"'o
—положительно-определенные матрицы.
2. Выборки измерений
Yh= (у.: s= 1, 2,..., k}; Z\= (z,-: i= 1,2,..., /}
независимы.
36
Доказать, что условное математическое ожидание ти=
= М(ха.|У''1, Z'l) и условная корреляционная матрица Qfe=
= cov(x/t, Xk\Y>^i, Z'l) задаются следующими формулами:
mu=Aiikj'xik\l)-{-A2ik)x{k\k) +
+ (Е-Л,{А:)-Л2(А:))то; (2.87)
Q^=A2(A:)P(A:|A:), (2.88)
где
A,(fe)=QfeS-4; (2.89)
A,{k)=[E-{-P(k\k)S~^k—P(k\k)P-^o]-'. (2.90)
Доказательство. Используя формулу Байеса для
вычисления условных плотностей распределения вероятностей n{Xk\Y>^i,
Z'l) и n(Z'i\Xk) и независимость выборок измерений У*1 и Z'l,
получим
я(Хй|У^, Z'i)=n(x,|y^)n(Xft|Z'i)/n(x,). (2.91)
С учетом (2.84) —(2.86) представим (2.91) в явном виде
7Г (X, I yf, Z{)= (2~^)-«'^ I Р„ I'/^l Р (k I ^)Г>/21 S, 17"^ ехр {- (1/2) X
X (pIP- (k I k) p, +7, Sr'P, - pSPq-' P«)), (2.92)
где
Pfc = X;^ — X (A: I k); }^^х^—1(.{к\ /); p„ = Xo — mo- (2.93)
Преобразуем выражение, стоящее в круглых скобках под
знаком экспоненты равенства (2.92), учтя (2.93):
91Р-' (k \k)p,+ ~pl SI'р, - pS Po Po =
= (X, - m,)^ Qr' (X, - m,) + (xlP- (k \ k) x, +
+ x" (fe I /) Sr' X (k I /) _ mS P^' mo - ml Q^' m,), (2.94)
где
Q-i,= p-i(fe|fe)+S-'ft-P-'o; (2.95)
mk = Qk{P-4k\k)x{k\k)+S-\x(k\l)-P-\m,). (2.96)
Подставляя (2.94) в (2.92), получаем
-к (X, I YlZ{) = (2V'' I Q.r'^'exp {-(1/2) (x,-
-m,yQl\x,-m,)} \ P„ Г^^ \P{k\ k)^^' | S,r"^|Q.|"^X
Xexp{-(l/2)(x-,P-'(fe|fe)x,+
+ хЦк\ I) Sr' X (fe I /) - mS Po"' mo - ml Ql' m,)). (2.97)
.37
Учитывая, что
{7с(х, |yf, Z{)dx,= l и
2
X
из (2.97) получаем
\P,\'"\'Pik\k)\-'"\S,r'^'\Q,\"'exp{-il/2)ixlPik\k)x,+
+ x^{k\ I)Sj'x{k I /) - mSPo"'mo - mlQr'm,) = 1.
Поэтому равенство (2.97) приобретает окончательный вид
Tt (X, I yf, Z\) =
= (2i)-"^^ I QJ-'/^exp{-(l/2)(x,-m,)-Qr'(x,-m,)). (2.98)
Преобразуем выражения (2.95) и (2.96) к
параметрическому виду.
Обозначим
A,(fe) = QfeS-'fe; (2.99)
A2(fe)=QfeP-4fe|^). (2.100)
Из этих равенств следует:
Е—Ai(A:)—A2(iA:)=QfeP-io. (2.101)
Подставляя (2.99) —(2.101) в (2.96), получаем искомое
равенство (2.87). Из (2.95) с учетом (2.100) следует:
Q,= p-'(fe| fe) + S7^-P^')-^ = (E + P(fe|fe)SГ'-
— Р (А: I k) Р^')-' Р (А: I А:) = Л, (k) Р (k \ Щ,
где
A2(fe) = (E+P(fe|fe)S-'fe-P(fe|fe)P-'o).
Справедливость равенств (2.88) и (2.90) доказана. Л
Следствие задачи 2.8. Для произвольных то и Ро,
удовлетворяющих условиям
Р->(А:|А:)-Р->о«Р-'('^|А:); (2.102)
S-'fe-P-'o«S-'fe; (2.103)
S-'feX(A: I/)+Р-> (А: I А:)х (А: I А:)-P->omo« S-'feX(A: I/)+
+Р-'(А:|А:)х(А:|А:) (2.104)
38
и коммутативных матриц P{k\k) и Sk, оценки т^ и Qk
приобретают следующий вид:
mu^Aiik)x{k\l)-{-A2{k)x{k\k); (2.105)
Qfe«A2{A:)P(A:|A:), (2.106)
где
ЛЛ^) = Т (k) [E+P(k\k) Sr']-' Т (k); (2.107)
Ai (fe) = Е - Л, (k) = Т (k) [E + S,P-' (k I fe)]-' T (k), (2.108)
P{k\k) и Sa; — диагональные матрицы собственных чисел
матриц P(k\k) и Sk\ T(fe)—^ортогональная матрица собственных
векторов.
Доказательство. Действительно, при выполнении условий
(2.102) —(2.104) из равенств (2.95) и (2.96) следует, что
Q, ^ [S;-4 Р~'(^ I ^)Г'; (2.109)
m,^Q,[P-'{k\k)xik\k) + Sl'xik\l)]. (2.110)
Параметры Ai(fe), Л2(^) и Е—Ai(fe)—Л2(^) принимают
следующий вид:
А, {Щ ^ (Sk' + Р-' (k I k))-' SI' - (Е + S, Р- (k I fe))-'; (2.111)
Л, (k) ^ (Sr' + P-' (k I fe))-' P-' (fe I ^^) = (E + P (fe 1 fe) Sr')->;
(2.112)
E-A,{k)-A,{k) = {0}. (2.113)
Из равенств (2.109) —(2.113) следует справедливость
выражений (2.104) —(2.106).
Из коммутативности матриц P{k\k) и S^ согласно [9]
существует ортогональная матрица Tk такая, что P(k\k) и S^ могут
быть выражены через диагональные матрицы P{k\k) и S*
собственных чисел матриц:
Pik\k)=T{k)P{k\k)T'{k); (2.114)
S, = T(/s)S;Tn^)- (2.115)
Подставляя (2.114) и (2.115) в (2.111) и (2.112) и пользуясь
свойствами ортогональных матриц [9], получаем равенства
(2.107) и (2.108). Л
Равенства (2.107) и (2.108) позволяют раскрыть смысл
коэффициентов A\{k) и Л2(^). В системе координат, полученной
в результате преобразования Xk^T{k)Xk, эти коэффициенты
определяют относительный выигрыш от применения
параметрического преобразования (2.105) в сравнении с оценками x(k\l)
39
и х(^|й).^1оскольку диагональные элементы диагональных
матриц [E+P{k\k)S-h]-^ и [E+SkP-^{k\k)]-^ всегда меньше
единицы, то выигрыш в точности решения задач оценивания
при использовании комплексирования регулярных оценок
является неизбежным.
Результаты решения задачи 2.8 позволяют сформировать
оценки, обеспечиваюш,ие максимум нормальной апостериорной
плотности распределения вероятностей я(хй|У*1, Z'l) в
предположении, что отсутствует информация об ограниченности
вектора оцениваемых параметров x{k).
2.4. Нерегулярные оценки с ограниченным
множеством значений
В составе ряда динамических систем функционирование
алгоритмов оценивания происходит при жестких ограничениях на
допустимый объем оперативной памяти ЦВМ и быстродействие
процесса оценивания. Поэтому алгоритмы оценивания
стремятся делать максимально простыми, учитываюш,ими минимум
имеющейся априорной информации. В частности, такими
алгоритмами являются те, которые построены в предположении
неограниченности области допустимых значений (ОДЗ)
оцениваемых параметров, хотя в действительности ОДЗ этих параметров
ограничена. Указанные алгоритмы удовлетворяют потребителя
большую часть времени функционирования. Однако на
некоторых интервалах времени требуется, чтобы ошибка оценивания
была минимально возможной. Это обстоятельство, в свою
очередь, вызывает необходимость использования всей имеющейся
в наличии информации, а именно, коррекцию уже полученных
оценок за счет информации об ограниченности ОДЗ
оцениваемых параметров. Правила выполнения такой коррекции
являются результатами решения излагаемой ниже задачи.
Задача 2.9- (Формирование нерегулярных оценок). Дано:
1- {Xfc, Ук} — (и-Ьт)-мерный случайный вектор; I'^i^
= {у^: s^ I, 2,.. .,k} — выборка измерений.
2. В предположении, что вектор Xk^Qoo, где Q,»
—неограниченная область,
Xft~JV(mft, Qk); mft=M(Xft| y*i);
Qk=cov{Xk,Xk\Yh). (2.116)
3. Векторы Xft, nifc и матрицу Qk разбивают на блоки
Xk=[xh, x2ft]-; xU=[xl4, xl\]^; (2.117)
mft=[mU, m2ft]^; mU=[mlift, ml2ft]^; (2.118)
40
Qu(^), Qi.(^)
Q
11
qii(^) f\n{k)
q^iC^) qs2(^).
(2.119)
Векторы х1Ч, xPft, x2ft, тР*, mPft, m2ft имеют соответственно
размерности pxl, rXl, (n—р—r)Xl, pXl, rXl, («—p—r)Xl.
Матрицы qii, qi2, Я2Ь Ч22> Q22, Qi2. Q21 имеют соответственно
размерности рхр, rXr, pxr, rXp, in—p—r)X{n—p—r), {p+r)X
X{n-p-r), {n—p—r)X{p+r).
4. В предположении, что
xlfcGQ,,;, mli^Q,,i; (2.120)
xllGQ,.^; mllGQ,..; (2.121)
x2;iGQoo; m2^GQoo, (2.122)
где Q^i и Q^2 — соответственно /? и (/-мерные параллелепипеды:
Й^1 = (л1}:^}<л1!<71!, i = 1, 2,..., /?}; (2.123)
Й^2=(л1^_л]^<л2/<Щ /= 1, 2,..., (7}, (2.124)
элементы вектора т*й и матрицы Q*^ обеспечивают
max max max it (х^^ | У*). (2.125)
Доказать, что нерегулярные оценки задаются формулами
х\\, если ml^^<^lj;
„ 11* _
*' ~ ' И-, если mlL>n!-, i = 1, 2 /?; (2.126)
m 1|* = m 1| + q,i (fe) (7П' (^) (m U* - m Ц); (2.127)
m2; = m2^ + Q,i (^) QH' {Щ (тЦ- m^); (2.128)
(q;i(^)b<(^l-iii!m, i=l, 2 p- (2.129)
Я2*2 (^) = q.. (^) - Чп (^) чп' (^) 41= (^); (2- iso)
Q22 (^) = Q,, {Щ - Qa {k) QtTi (k) Qi, (fe). (2.131)
Доказательство. Как известно [58, 76], при гауссовской
плотности распределения вероятностей я(хй|У*1) и Xy^eQ,» условное
математическое ожидание т^ и условная корреляционная
матрица Q.k образуют достаточную статистику, поэтому
jx(Xft|y''i)=n(Xfc|mft, Qft). (2.132)
Используя (2.132), преобразуем критерий (2.130) в
следующий составной:
max max it(xl^, т2\ \ т^, Q*); (2.133)
maxit(mU, х2;^ | УГ), (^.П4)
41
где m*ft=[ml*ft, m2*fcj''— нерегулярная оценка параметров
\k, удовлетворяющая критерию (2.125).
Найдем оценку m2*h, удовлетворяющую критерию (2.134).
В силу гауссовости плотности распределения вероятностей
я(т1*й, x2fc|y*i) оценка m2*h является условным
математическим ожиданием m2*ft=AI(x2ft|ml*ft, Y'^l) и может быть
найдена вместе с условной корреляционной матрицей Q*22(^)^
^cov(x2ft, x2ft|ml*ft, Y'^l) с помощью теоремы о нормальной
корреляции в виде, задаваемом формулами (2.128) и (2.131).
Чтобы найти оценку ml*;,, удовлетворяющую критерию
(2.133) при наличии ограничений (2.123) и (2.124), составим
обобщенную функцию Лагранжа
F(xU, Я,1, Я,2)=я(хи, m2*ft|mft, Q^)-fЯ,^1 (хЦ—Tl)-f
-fr2(x_l—xU), (2.135)
где
Ki={Ku>0, i=l, 2,..,p}; K2={i^2i>0, /=l, 2,.. .,т}-
столбцы множителей Лагранжа;
^ ={^], rij); х1 = {х}], xl'i); i = 1, 2,..., р; /= 1,2 q.
Введем обозначения
и (х1,) = V.1 ^ (х1„ m2l I m„ Q,) + X]-Xl; (2.136)
Vii^K) = - V,tF(x1„ X,, X,) = Yl -xl,; (2.137)
'•I
VЛхU) = - V,T F (X1,. Я„ Я,) = X1, - X1, (2.138)
'■2
где V — символ градиента.
Применим теорему Куна —Таккера [56]. Условия Куна—
Таккера в обозначениях (2.136) —(2.138) имеют следующий
вид:
U(mll) = 0; (2.139)
V,,(mi;,)>0; у,, (mi;.) > 0; (2.140)
X,i^O- Я,г>0; (2.141)
кУи{тК:) = 0; Я,гУ,, (mi;.) = 0; (2.142)
i = 1, 2,..., p + q.
Рассмотрим отдельно две составные части вектора хЦ^
^[xl'ft, xPft]'' и найдем их оценки ml'*^ и тР*^. С одной
42
стороны, они должны удовлетворять условиям (2.139) — (2.142).
С другой стороны, согласно теореме Рао [76] их следует искать
в виде функции достаточной статистики (т^, Q^) на том
множестве, на котором эта статистика определена. Условие (2.120)
запишем так
V,i {mil*) =< 0; V,, (mli*) > 0; (2.143)
или
Vh {ml'kd > 0; V,i {mli])<0, i = 1, 2 p, (2.144)
a условию (2.121) придадим вид
V'i;(ml|;)>0 и V,^(ml|;)>0, ; = 1, 2,..., 9. (2.145)
Найдем пересечение множеств решений неравенств (2.140)
и (2.143) или (2.140) и (2.144). Получим
Vuim\ib = 0 и V,i(mU:)^0; (2.146)
или
Vii(mU!)>0 и V,i{mli]) = 0. (2.147)
Из (2.146) или (2.147) следует, что оценка ml'*^
удовлетворяет равенствам (2.126).
Из (2.145) и (2.142) следует, что Я,и=Я,2/=0; /=1, 2,...,?,
поэтому (2.139) с использованием обозначений (2.136)
приобретает вид
V^,2it(xU I mir, m2fc, т,,, Q„) = 0. (2.148)
В силу гауссовости плотности распределения вероятностей
n(xl2ft|mli*ft, m2*ft, т^, Q^) из равенства (2.148) следует, что
оценки ml2*ft и q*ii(fe) удовлетворяют теореме о нормальной
корреляции и задаются формулами (2.128) и (2.130). Л
Преобразование регулярных оценок т^, Q^ в нерегулярные
•"*fc, Q*ft, осуш,ествляемое на основании решения задачи 2.9,
представляет собой способ использования информации об
ограниченности областей допустимых значений оцениваемых
параметров в интересах решения задачи оценивания. Суть способа
состоит в том, что при выходе регулярной оценки на границу
или за границу ОДЗ оцениваемого параметра нерегулярная
оценка принимает значение, совпадаюш,ее с тем граничным
значением, которое было нарушено регулярной оценкой. Если же
регулярная оценка находится внутри априорно заданной
области, то она корректируется лишь за счет взаимного линейного
влияния оценок друг на друга, которое описывается вторыми
слагаемыми равенств (2.127) и (2.128).
Из (2.126) —(2.128) следует также, что при несмеш,енных
регулярных оценках формируемые с их использованием
нерегулярные оценки будут всегда смеш,енными.
43
Из (2.129) видно, что нерегулярные оценки неизбежно
обладают меньшим средним квадратом ошибки, чем
соответствующие регулярные оценки, если выполнено условие
(Quik))и>{114) {^i-xliy,i=l, 2,...,р+г.
Изменение условной дисперсии нерегулярных оценок
параметров xPft и x2k в сравнении с условной дисперсией
регулярных оценок аналогично взаимосвязи между априорным и
апостериорным значениями дисперсии оцениваемых параметров,
выражаемой теоремой о нормальной корреляции.
Глава 3
Оптимальные линейные алгоритмы оценивания
при полной априорной информации
3.1. Фильтрация и экстраполяция при некоррелированных
помехах
В этой главе рассмотрим применение теории оценивания к
проблемам линейной фильтрации, экстраполяции и
интерполяции. При этом исходим из предположения, что плотность
распределения вероятностей оцениваемых и наблюдаемых
случайных процессов является гауссовской. Поскольку такая
плотность распределения вероятностей полностью задается
математическим ожиданием и корреляционной матрицей, то уделим
внимание в каждой из решаемых здесь задач именно
построению соотношений, описываюш,их во времени эти два
статистических момента. Различие задач и алгоритмов будет
определяться используемой исходной априорной информацией.
Задача 3.1 (Непрерывно-дискретный фильтр). Дано:
1. Модель системы описывается стохастическим
дифференциальным уравнение Ито
dxt=ai{t)dt+F{t)xtdt-\-G{t)dwu t>to. (3.1)
2. Модель дискретных измерений
yk^Ak+HkXk+Vk, k=l, 2,..., to<^tk-i<tk. (3.2)
3. Априорные данные:
{Wf, t^to] — процесс броуновского движения;
M[dwtdw''^] = QS(t—x)dtdx; (3.3)
х,^ -^Л^ (X (О I 0); Ро); v, ^ Л^ (О, R,); (3.4)
44
cov(Vft, v/)=0 при кфу,
Xf , {Wf}, {v^} — независимы.
Доказать: 1. Для моментов времени t^[tk-i, th]
уравнения эволюции x{t\k—l)=M{xt\Y'^-\) и P(^|fe—l)=cov(Xi,
Х(| К''-S) имеют вид
dx{t\k-l) = {F{t)x{t\k—l)+ai{t))dt; (3.5)
dP{t\k-\) = [F{t)P{t\k-l)+P{t\k-l)F^t) +
+ G{t)QtG''{t)]dt. (3.6)
2. В моменты измерений x{k\k) ^M{Xk\Y'^i) и P{k\k)^
= cov(Xft, Xft|y*i) вычисляются при помощи рекуррентных
соотношений
x{k\k)=x{k\k-l) + Kk{yk-Ak-nkX{k\k-l)); (3.7)
Kk = P{k\k-l)H\[HkP{k\k-l)H\+Rk]-'', (3.8)
P{k\k) = (E—V^Hk)P(Jt\k—l). (3.9)
Доказательство. Получим сначала уравнения для эволюции
условного математического ожидания x{t\k—l)^M{x^\Y^^-^l) и
условной корреляционной матрицы P(^|fe —l)^cov(X(, Xi|y*""S)
в промежутке между моментами времени tk-i и th, в которые
производят измерения. Для этого используем результаты
решения задачи 2.2. Чтобы применить уравнения (2.14) и (2.15) для
рассматриваемой здесь задачи оценивания, проведем отдельно
следуюш,ие вычисления:
М (F (О X, I Yt) = F (О X (^ I k— 1); (3.10)
A = M[Xt (F (О х,)^ I Yf] -М{х,\ yf-') X
X М [(F (О х,)^ I уГЧ = Р (^ I ;fe - 1) Р (0; (3.11)
В = М[0 (О Q, G^ (О i Yi~'] = G (О Q,G^ (0. (3.12)
Уравнения (2.14) и (2.15) при использовании обозначений
(3.11) и (3.12) имеют вид
dxit\k—l) = M{¥ (О X, + а (О I У*~') dt; ' (3.13)
dP{t\k — l) = {A+A^ + B)dt. (3.14)
Подставив (3.10) —(3.12) в уравнения (3.13) и (3.14),
получим искомые уравнения (3.5) и (3.6).
Вычислим теперь x{k\k) и P{k\k) на момент времени 4,
в который поступает измерение уй.
Решения уравнений (3.5) и (3.6) на этот момент времени
Имеют вид
x(;fe|;fe-i)=x(^|;fe-i); P(;fe|;fe-i) = P(^|;fe-i);
t=tk. (3.15)
45
Для нахождения x(k\k)=M(Xk\Y>'i) и P{k\k)=cov{Xh,
Xfc|y*i) применим теорему о нормальной корреляции.
Обозначим
Miy,\Yt) = y{k\k-iy, (3.16)
COV (х„ у, I Yf) = Р.у {k\k- 1); (3.17)
соу(у„уИ>'П = Р,Л^1^-1)- (3.18)
Уравнения (2.36) — (2.38) примут следующий вид:
x{k\k)=x{k\k-\) + V^k{}lh-y{k\k-\)); (3.19)
M^ = P,y{k\k-\)V-'y{k\k-\)', (3.20)
V{k\k) ^P(k\k—\) — M^Vlyik \k—\). (3.21)
Вычислим отдельно y{k\k—\), Vxy{k\k—\) и ^yy{k\k—\).
Используя соотношение (3.2), имеем
у (;fe I ;fe - .1) = н,ж (X, I y\-') + m (v, I y\-') =
= П^х{к\к— 1); (3.22)
У* - У (^ I ^ - 1) = H, (X, - X (;fe I ;fe - 1)) + V,. (3.23)
По определению условных корреляционных матриц Vxv{k\k—
— 1), Vyy{k\k—\) и V{k\k—\) с учетом (3.23), (3.4) и
независимости Xft и Vfc найдем
Vxy{k\k-\) = '?(k\k-\))\-'h\ (3.24)
Pw(^|^-l) = HftP(;fe|;fe-l)H^ft+Rft. (3.25)
Подставляя (3.22), (3.24) и (3.25) в соотношения (3.19) —
(3.21), непосредственно получаем искомые рекуррентные
соотношения (3.7) —(3.9). Д
Задача 3.2 (Дискретный фильтр Калмана). Дано:
1. Модель системы описывается рекуррентным
соотношением
XH+i=uk+<i^{k+\\k)Xk+T(k+\\k)yNH. (3.26)
2. Модель дискретных измерений
yfc=Aft+HftXft+Vft. (3.27)
3. Априорные данные:
Хо~Л^(х(0|0), Ро)-, Wfc~A^(0, Qft);
Vk^N{Q, Rft);
cov(Wfc, wy)=Qft6fty; cov(vft, Vj) = Rft6fc/;
cov(WfcVj)==cov(xoWft)=cov(xoVft)=0; (3.28)
bk! — символ Кронекера; k, j^l, 2...
46
Доказать: 1. Алгоритм экстраполяции значений x{k-\-
+ l\k)=M{xh+i\Y'^x) и P(fe+l|^)=cov(Xft+i, Xft+iiy^i) имеет
вид
х(к-\-1\к)=Ф{к-\-1\к)х{к\к)-\-ак', (3.29)
+ T{k-\-l\k)Qkr{k-\-l\k). (3.30)
2. Алгоритм фильтрации значений x{k\k)^M{Xk\Y'^i) и
P(k\k)^cov{Xk, Xfc|y*i) задается рекуррентными
соотношениями (3.7)-(3.9).
Доказательство. Рассмотрим построение алгоритма
экстраполяции. Пусть на момент времени ^^+1 известна выборка
измерений Рь а измерение yft+i еще не поступало. Используя
(3,26), непосредственно вычисляем условное математическое
ожидание М {Xh+i | У^О :
х{к+1\к)=М{хн+1\¥^)=М[Ф{к-\-1\к)Хк-\-
+ r{k+l\k)Wk-\-ak\Yh] = ^{k+l\k)x{k\k)-\-aik. (3.31)
Равенство (3.31) и представляет первое искомое
соотношение (3.29).
Для нахождения корреляционной матрицы P{k-{-l\k)
воспользуемся тем, что в соответствии с (3.26) и (3.31)
Хи+1-х{к-\-1\к) = Ф{к-\-1\к){хи-х{к\к))-\-
+ r{k-\-l\k)Wk. (3.32)
Используя определение корреляционной матрицы и
соотношения (3.32) и (3.28), получаем
P{k+l\k)=M[{xk+i-x{k-\-l\k)){Xk+i-x{k-\-
+ 1\к)У\¥'^1] = Ф{к-\-1\к)Р{к\к)Ф-{к-\-1\к) +
+ r{k-\-l\k)QkrHk-\-l\k). (3.33)
Это соотношение и представляет искомое равенство (3.30).
При вычислении (3.33) применялось свойство, что
M(xftWft| y*i)^0, которое непосредственно проверяется, если
(3.26), представить в нерекуррентном виде
к
X, = Ф (;fe I 0) хо + Еф (^ I О г (i I i - 1) щ_, +
г = 1
к
+ ЕФ(^10аг_1
1=1
и воспользоваться априорными данными (3.28).
47
Доказательство алгоритма фильтрации здесь полностью
совпадает с выводом соотношений (3.7) —(3.9) для непрерывно-
дискретного фильтра Калмана. Л
Особенностями полученных алгоритмов являются
следующие:
Рекуррентная форма построения, которая обеспечивает
удобство практической реализации алгоритмов с помощью
ЦВМ в реальном масштабе времени.
Корреляционная матрица P{k\k) и коэффициент усиления
Kft определяются на основе только априорной информации и
не зависят от поступающих значений измерений у^. Это легко
видеть из равенств (3.8), (3.9) и (3.30). Поэтому проблема
обеспечения точными априорными данными является одной из
основных трудностей при практическом использовании
алгоритмов Калмана.
Диагональные элементы корреляционной матрицы P{k\k) и
модуль коэффициента усиления Кй быстро уменьшаются с
ростом k — числа шагов обработки измерений. Поэтому, как
следует из (3.7), при больших значениях k влияние последующего
измерения уй на коррекцию экстраполированной оценки x{k\k—
— 1) уменьшается. Эта особенность опасна при задании
начальных условий Xq и Ро, существенно отличающихся от
математического ожидания и корреляционной матрицы в начальный момент
времени. При расчетах на ЦВМ из-за погрешностей округления
улучшение экстраполированной оценки x{k\k—l) может
прекратиться раньше, чем достигнуто приемлемое значение
отклонения между Xft и x{k\k). Дальнейшие измерения в этом случае
бесполезны. Они не улучшают качество оценки, которая
оказывается существенно смещенной. Оценка x(\k\k) не сходится к
значению оцениваемого параметра х^ и теряет свойство
состоятельности.
Алгоритм (3.7) —(3.9) полностью применим для обработки
измерений, полученных идеальными измерительными
приборами, не имеющими погрешностей измерений Vs^O. Для этого
достаточно положить R^O в соотношении (3.8). Случайность
вектора у^ будет в этом случае обусловлена случайным
характером процесса х^. Таким образом, отсутствие шумов измерений
не обеспечивает идеального оценивания. Задача фильтрации в
условиях, когда шум измерений отсутствует, была решена в
1960 г. Калманом [123] и положила начало развитию
рекуррентных алгоритмов фильтрации.
Коэффициент усиления Kk вычисляется с помощью
выражения (3.8), содержащего обратную матрицу Bft=[HftP(fefe—
— 1) H'Tft+Rfc]-'. Поэтому если матрица HhP{k k—
— l)H''ft-|-Rfe плохо обусловлена, то малые ее изменения за счет
ошибок машинного счета или неточности априорной
информации будут приводить к существенным изменениям матрицы В^,
48
a следовательно, и коэффициента усиления Ки- Как следует из
(3.7) и (3.9), это приведет к существенному изменению оценок
x{k\k) и P{k\k).
Наличие в алгоритме процедуры вычитания матриц (3.9)
может привести к потере матрицей P{k\k) положительной
определенности. Это может произойти за счет погрешности
округления машинного счета при малых значениях Кь и Ни- Если же
при этом дополнительно окажется, что в соотношении (3.30)
T{k-\-l\k)Qkr'4k-\-l\k) =0, то матрица P{k-\-l\k) также
потеряет положительную определенность. Это все приведет к тому,
что коэффициент усиления Kft (см. (3.8)) изменит свой знак на
противоположный и соотношение (3.7) будет корректировать
оценку x{k\k—l) в противоположную сторону, т. е. в сторону
ухудшения качества оценок. Модуль разности Xh—x{k\k) при
этом будет расти по мере поступления новых измерений и
оценки потеряют устойчивость.
Указанные особенности алгоритма Калмана часто делают его
не адекватным тем условиям, в которых ему приходится
функционировать. Поэтому все последуюш,ие работы по
рекуррентной динамической фильтрации были направлены на обеспечение
адекватности алгоритма реальным условиям функционирования
по тем или другим параметрам, используемым в алгоритме
Калмана.
Задача 3.3 (Непрерывный фильтр Калмана — Бьюси). Дано:
1. Модели системы и измерений описываются линейными
стохастическими дифференциальными уравнениями Ито
dxt=F{t)xtdt-\-Q{t)dwt-\-ei{i)dt, f^to; (3.34)
dyt=A{t)dt-\-H{t)xtdt-^dvt, t:^t{^U. (3.35)
2. Априорные данные:
{W(, r^ti^ и {Vi, t'^ti'^to} — соответственно n и m-мерные
процессы броуновского движения;
M{dwtdvf\)=Qt^{t—x)dt; M{dvtdv\) =Rt8it—x)dt; \
Xo, {Wi}, {vf} — независимы; \ (3.36)
Xo--iV(A:(0|0); P(0|0)). j
Доказать: 1. Для моментов времени t^[to, ti] уравнения
эволюции mt^M{Xt) и Pt^cov{xt, Xt) задаются уравнениями
(3.5) и (3.6).
2. Для моментов времени t > ii эволюция условных
статистических моментов х(^ I ^) = Л1 (х, I У',) и Р (^|^) = cov(x„ х, | У';,)
описывается уравнениями
dx{t\t) = F{t)\{t\ f)dt + а (О'Л + К (О (dy,—
— Н (О X (П t)dt — А (О dt); (3.37)
4—6899 49
к (О = P (И О Н^ (О кг'; (3.38)
dP {t I t)/dt = Fit)P{t\ t) + P{t\t)F^ (t) + G(0 Q,G" (0 —
- К (0 H (t) P{t\i) (3.39)
G начальными условиями
X (t, I g = m,^; P {t, I t,) = P,^. (3.40)
Доказательство. Вывод уравнений эволюции гп; и Р; для
моментов времени t^[to, ti] основывается на использовании
уравнения (3.34), которое полностью совпадает с (3.1), поэтому,
повторив все рассуждения, проведенные при рассмотрении
непрерывно-дискретного фильтра, получим уравнения эволюции
(3.5) и (3.6).
Рассмотрим моменты времени f^ti, для которых
наблюдению доступна реализация YU.^iys, ti^s-^t). Применим
результаты решения задачи 2.4 к данному линейному случаю.
Подставляя в (2.29) и (2.30) Н(хь t)=H(t)xt и i{xt, t)=r{t)xt
и используя определение корреляционной матрицы,
непосредственно получаем искомые равенства (3.37) —(3.39). Л
Различие между уравнениями (3.37) и (3.39) состоит в
следующем: (3.37) — стохастическое дифференциальное уравнение,
в чем легко убеждаемся, если вместо dyt подставим его
значение из (3.35), поэтому это уравнение нужно рассматривать как
символическую запись и понимать в интегральном смысле;
(3.39) — обыкновенное дифференциальное уравнение.
В заключение приведем еще одну задачу фильтрации, часто
встречающуюся на практике, в которой оценивание состояния
непрерывно функционирующей системы производится по
совокупности непрерывных (обычно пассивных) и дискретных
(активных) измерений.
Задача 3.4 (Фильтр Кицула) [28, 51]. Дано:
1. Модели системы и измерений описываются
стохастическими дифференциальными уравнениями Ито (3.34) и (3.35).
Кроме непрерывных измерений в дискретные моменты времени th
наблюдению доступны величины ун, описываемые
соотношением
Ук'^К + Кч+'^к-
2. Априорная информация состоит из (3.36) и
v.'^N (0; R,); cov (v,, v^) = R, 8,^;
6fc/ — символ Кронекера; причем Vk не зависит от Хо, w^, Vf.
Доказать, что условное математическое ожидание
x{t\t)=M[Kt\Y*o, ?*о] и условная корреляционная матрица
50
P{t\t)^cov{xt, Хг|У'о, F'o) удовлетворяют системе уравнений
dx it\t) = [а (О + Н (О X (^ I 01 dt + К (t) [dyt — (А {t) +
+ Н (О X (П 0) di] + 8 (t-t,) К, [у, - А,х(^ I k)]-
dP (t\t)=. [F (О P (П 0) + P (t 10 F^ (0 + G (0 Q, G40 -
- К (0 H (t) p (^ I 0] dt-b{t-1^) \\i^P {k I k),
где К (0 = P (M 0 H^ (0 R7';
K, = P (^ I ^) if, [H,P (^ I ^) Hi^ + R,]-';
X (^ I ^) = lim X (/ [ 0', P (^ I ^) = lim P (t \ t);
^{t—tk) —символ Кронекера;
l'o=(y.. 0<5<0-, n=(y„ 0<^,</; k^ 1, 2,...}.
Доказательство. Предлагаем читателю провести его
самостоятельно, используя решения задач 3.1 и 3.3. Особенностью
оптимальных оценок х(^|^) и элементов матрицы Р(^|0
является их разрывность в моменты поступления дискретных
измерений. Первое дискретное измерение поступает не в нулевой
момент времени.
3.2. Последовательная обработка дискретных измерений
Одной из особенностей алгоритма фильтрации (3.7) —(3.9),
затрудняющей в ряде случаев практическое использование
этого алгоритма, является наличие в соотношении (3.8) или
эквивалентном ему соотношении (П.26) обратных матриц
(HftP(^|^—l)HT;i+Rft)-i или Rft-i. Обраш,ение матриц большой
размерности на ЦВМ нежелательно по нескольким причинам:
1) требуется большое число ячеек оперативной памяти
ЦВМ;
2) велико время, затрачиваемое на обраш,ение, особенно
если эту операцию выполняют в каждый дискретный момент
времени получения измерений;
3) точность окончательного результата суш,ественно зависит
от процедуры округления данных в ЦВМ.
По возможности стремятся уменьшить размерность
обращаемых матриц либо вообще исключить эту процедуру из
алгоритма фильтрации. Такая возможность появляется тогда,
когда часть измерений (или все измерения), полученных на
каждый дискретный момент времени ^й, взаимно некоррелирована.
В этом случае вместо одновременной обработки всех измерений,
относящихся к моменту времени th, возможно применить способ
последовательной обработки некоррелированных между собой
4* 51
групп измерений. Как будет показано в решаемой ниже задаче,
оба указанных способа обработки измерений эквивалентны.
Задача 3.5. Дано:
1. Модель системы
х,+, = а,+Ф(^+1|^)Хй+Г(^+1|^)\у^.
2. Модель дискретных измерений
Уа =
i/У'
У
(9)
л^"
+
я!"'
Xft +
v'i'
L ^k- J L ^i"' J
3. Априорная информация:
Xo-^yVCxCOlO); P„); w,-^yV(0; Q,);
v,-^yV(0;R,); R, =
t^i"'
(3.41)
(3.42)
0
^i"'
(3.43)
cov (W„ w^) = Q,3,;; cov (a^', t»}") = /?i' 3,_,; г = 1, 9;
cov (W;^, aj") = cov (Xo, W;^) = cov (Xo, yi'') = 0;
6ftj — символ Кронекера; k, /^1, 2 ...
Доказать, что одновременная обработка измерений у^,
относящихся к моменту времени t^, выполненная при помощи
соотношений (3.7) — (3.9), (3.29), (3.30), равносильна
последовательной обработке измерений y'-^h, i^\,q по следующей
методике:
1. Вычисляют P(i)(^|/fe-l), P<'^){k\k), Щ%, х(1)(А|^-1),
х(')(^|^) с использованием соотношений (3.7) —(3.9), (3.29) и
(3.30) и первой группы данных if^h.
2. На основе Р'^'й, х^^\ обрабатывают измерения у'-%, i^
^2, 3, ...,(7> последовательно используя следующие
соотношения:
КГ" = Р''' {k I k) (НГ")^[Н*<'+'' ?<'■' {k I k) (Hi'"+")^ + Ri'+'']-'.
(3.44)
x''^^'(M ^) = x<" (M ^) + КГ^'[УГ^'- 4'
C + l)
-//Г»Х<"(^|^)];
(3.45)
?('■+•> (^ I ^) = (E- Ki'+'' Я1'+'') P<'' (^ I ^), i = 1, (7 _ 1.
3. Конечные оценки будут
xik\k) =х(я){k\k); P{k\k) =?("){k\k).
(3.46)
(3.47)
52
Доказательство. Пусть данные измерений у^, относящиеся к
моменту времени th, обрабатываются одновременно. Тогда,
используя (П.26) и (3.43), матрицу усиления можно представить
в расчлененном виде:
К, = Р (^ I ^) ЩКГ' = Р (^ I ^) \{НЧ^Г... (//i"')^]
R'^'- О ■
о" • /?1^>
)(1)\-1
= [Р (^ I k) ЯГ (^Г)- ... Р(^ I k) яг {R'^Y']
(9)
?(9)\
(3.48)
Подставляя значения Кй и у;^ из (3.48) и (3.42) в (3.7),
имеем
X (^ I ^) = X (^ I ^ - 1) + [Р (^ I ^) (Hi")^ (^?i")-' ...
-у(')_Л1" = Я^"х(/^|^-1)
1-у1'"-Л^"-Я^'"х(^|^-1)]
Рассмотрим теперь Н'^йК-^йН^ в расчлененном виде:
Р(^1 ^)(Hi'")^(^?i,'")-4
(3.49)
Н1К^'Н, = [(Я1")\.. (Я^'У!
О : (Rf)-'
нГ
L^i"'
Подставляя (3.50) в (П.29), получаем
Р-' {k\ k) ^ Р-' {k I k
1)+ 2if^k'y {R'kY'iH'^')-
(3.50)
(3.51)
Соотношения (3.49) и (3.50) позволяют вычислить оценки
x(^l^) и P(^l^), обрабатывая целиком вектор измерений у*.
Перейдем к последовательной обработке измерений, при
которой каждая группа измерений yi''>k обрабатывается
отдельно. Матрицу усиления, оценку и матрицу коварации,
полученную на основании данных измерений у(%, будем обозначать
индексом i. Тогда при г^1, используя соотношения (П.26), (П.29)
и (3.7), можно записать
(Р<'' (k I k))-^ = (P{k\k-1))-' + {Hiy (/?!•')-' /^i"; (3-52)
K^^^^P^'\k\k))Hiy{Ri'Y^- (3.53)
x<'> (^ I ^) = X (* I ^ - 1) + Ki^' (уГ' - Ai'\- Hi" X {k I ^-:i)),
(3.54)
53
где значения x{k\k—l) и Р(^|Л—1) получаются с помощью
соотношений (3.29) и (3.30).
Используя значения х^\, К'^'* и Р'^'й, обработаем измерение
i/(2'ft. Так как y^^h относится к тому же моменту времени, что и
y^^h, экстраполяция не требуется. Аналогично соотношениям
(3.52) —(3.54) можно записать
(Р<2' {k I k))-^ = (Р<'' {k I k))-^ + (Н^^^у {R^^Y' Hf; (3.55)
Kf = p(2) (^ I ^) {Hfy{R4Y\ (3.56)
x'^' (^ I ^) = x'^' {k\k)+ kT [yf _ Л^^' - Hf x'^' (^ I ^)I.
(3.57)
Подставляя значение (P'^' {k \ k))~^ из (3.52) в (3.55), получаем
2
(P<2' {k I ^))-' = (P(^ I ^ -1))-' + 2(//i")4^i")-'^i"- (3.58)
Здесь R'k^ не зависит от значений измерений y'k\ поэтому после
обработки q систем данных измерений
р-' {k\k) = (Pi"')- = р-' (^ I *-1) + S(^i'''r {RkY' нчк
(3.59)
Сравнение соотношений (3.51) и (3.59) убеждает в их
идентичности.
Подставляя значение х(')(Л|^) из (3.54) в (3.57), получаем
х<^'(^|^)=х(^|^-1) + [(Е + КГ'яГ)К1"К^]Х
V-4"-//i"x(^ 1^-1)1
bf-^f-^f х<"(М^) ]•
X
Если аналогичным способом обработаны все q систем
измерений, то матрица усиления [по аналогии с (3.60)] примет вид
К, = [(Е - Ki"' //i"') (Е - КГ" я!"-")•... • (Е- Kf Wf) Ki" ...
... (Е- К^"//!"') КГ" Mf]. (3.61)
Сопоставим соотношения (3.48) и (3.61) и покажем, что они
имеют одинаковые блоки:
Ki" = Р'" {k I /fe) (Я!"')- (^^i"')-' = Р (^ I ^) (Я,"')- {Rf )-'• (3.62)
Так как
V{k\k)^ Р<«' (/fe I /fe) = (Е - Ki"' Я^"') Р'"-'' {k I ^), (3.63)
54
то, домножая равенство (3.63) справа на {Н(ч-\)-^{1^(я-^)^)-\
получим
Р (^ I ^) (ЯГ»)^ {Ri'-'Y'= {E-KlHi) кГ". (3.64)
Далее, используя
?(«-•) {k\k) = {E— К^'-^'Я!'-") Р''-^' {k\ k) и
подставляя это равенство в (3.63), получим
p{k\k) = {Е~ Ki"» я!"') (Е — Ki"-'' я!"-") р''-^' {k \ k).
(3.65)
Умножив равенство (3.65) справа на {Н''-^к)''{^''~^к)~К
получим равенство третьих блоков матриц Кй и Кй. Повторяя
указанную процедуру для номеров i=q—3,.. ,1, находим, что
Таким образом, одновременная и последовательная
обработка измерений дает одинаковые результаты. Л
3.3. Интерполяция компонент гауссовских процессов
Интерполяция случайного процесса Х; состоит в построении
оценки x(^|s) первой компоненты xt гауссовского процесса
{^t, У;} по наблюдениям У«о={Уг, te[0; s]}, s^t и
представляет собой более общую задачу оценивания, чем задача
фильтрации, при которой строится оценка x{t\t) по наблюдениям У'о.
Полезность интерполяции состоит в том, что она позволяет
улучшить оценку х(^|^), являющуюся результатом решения
задачи фильтрации по наблюдениям У'о, за счет привлечения
избыточной измерительной информации Y^t, полученной после
момента времени t, на который строится оценка процесса Х(.
Рассмотрим решение трех классов задач дискретной
интерполяции:
1. Интерполяция в закрепленной точке, или интерполяция
в прямом времени, при которой строится оценка х(Л^|^), k =
=Л^-|-1, Л^-|-2... на фиксированный момент времени t^ по
нарастающей выборке измерений У*1.
2. Интерполяция на закрепленном интервале, или
интерполяция в обратном времени, при которой определяется оценка
х(^|Л^), k^N, N—\,...,\, О, на каждый из моментов времени
tk^[t(j, 1ц\ после получения выборки измерений У^о,
относящейся ко всему интервалу времени [^о, tsl- Отправной точкой
для таких оценок является х(Л^|Л^).
3. Интерполяция с постоянным запаздыванием, при которой
формируется оценка х(^|^-|-Л^) на последовательно
возрастающие моменты времени tk, k=\, 2,..., запаздывающие на
постоянную величину th+N—th относительно времени tk+N последнего
измерения, принадлежащего выборке У*+^
55
Задача 3.6 (Дискретная интерполяция в закрепленной
точке). Дано:
1. Модели системы и дискретных измерений (3.26) —(3.28).
2. tN — фиксированный момент времени; y^o^jy», i^O, к},
k^N-^l, Л^+2,...—выборка измерений нарастающего объема.
Доказать, что алгоритм интерполяции значений
х(Л^|^) =M[x^\Y>'o] HP{N\k) =cov(x^v, Xn\Y\)
имеет вид
x{N\k+l)=x{N\k) + K{N\k){yk+i-A.k+i-
-Hft+ix(^+l|^)); (3.66)
P (Л^ I ^ + 1) = Я(Л^ I ^)_ К(Л^ I ^) (H,+iP(^ + 1 I ^) Ш+1 +
+ R,^,)W{N\k)- (3.67)
. К(Л^ I ^) = M (Л^ I ^) ФМ^ + 1 I ^) Hl+i X
X (H,+i P (^ + 1 I ^) Ш+, + R,+i)-; (3.68)
Л1 (Л^ I ^ + 1) = Л1 (Л^ I /fe) Ф^^ + 1 I ^) (E —
- К (^ + 1 I ^) H,+i)^; M{N\N) = P{N\ N), (3.69)
где M iM\k) = cov (x^, X, | У§); x (Л^ 1 Л^), P (Л^ | .V), К (^ + 1 | k),
x{k-\-l\k), P(^+l|^) задаются соответственно соотношениями
(3.7)-(3.9), (3.29) и (3.30).
Доказательство. Применительно к вектору {х^, У*о, Yft+i}
используем результат решения задачи 2.6, задаваемый
соотношениями (2.52) —(2.54):
X (Л^ I ^ + 1) = Л1(х^ I yg, y,+i) = X (/V I ^) +
+ K{M\k)[y,^,-M{y,,,\Yt)\; (3.70)
K{N\k) = cov (x^, y,+i I yg) fcov (y,+„ y,+i | yg)]-; (3.71)
P (ЛГ I ^ + 1) = cov (x^, x^ I Уо, y^+i) =
= P (Л^ I ^) - К(Л^ I ^) [cov (x^, y,+i I Y'oY. (3.72)
В силу (3.27) и (3.28) можно записать
М (у,+1 I yg) = А,+1 Н- Н,+1 X (^ + 1 I ^); (3.73)
у(^+ l\k) = y,^,-M{y,^,\Y^) =
= Н,+1 (х,+1 - X (^ + 1 I ^)) + У,+г, (3.74)
COV (у,+1, у,+1 I yg) - H,+iP (^ + 1 I ^) Ш+, + R,+i; (3.75)
cov (х^, у,+1 I Уо*) = М [(х^ - X (Л^ I ^)) (х,+, -
- X (^ + 1 I ^) I Уо*] UUu (3.76)
56
Подставляя выражение (3.73) в (3.70), получаем первое
искомое соотношение (3.66), Используя (3.26) и (3.29),
находим
Xk+1-X{k+I\k) =Ф {k-\-l\k) {Xk~X{k\k)) +
+ r(^+ll^)+Wft. (3.77)
Подставив значение (3,77) в (3.76) и учитывая (3.28),
находим
COV (Xyv, у,+, \y'o)=M [(х^ - X (Л^ I k)) (X, - X (^ I к)у I yg] X
ХФ'' {k + I \ к)Щ+1 = М {N \ k) ФЦк + I \ k) HUi. (3.78)
Подставляя (3.75) в выражение (3.71), а значение (3.78) в
соотношения (3.71) и (3.72), получаем искомые соотношения
(3.67) и (3.68).
Для вывода соотношения (3.69) выполним следуюш,ие
преобразования:
Л1 (Л^ I ^ + 1) = Л1 {Л1 [(х^-х (Л^ 1^+1)) (х,+,-
-х(^+ 1|^+1))^|У^']|Уо} =
.- М {М [х^ (х,+1 - X (^ + 1 I ^ + 1))^ I yg] I Y^'j. (3.79)
Используя последовательно соотношения (3.26), (3,7), (3.29)
и (3.77) после элементарных преобразований находим
Хй+1-х(^+1|^+1) = (Е-К(^+1|^)Щ+1)Ф(^+
+11 ^) (Xft-x (^ I ^) + (Е-К (^+11 ^) H,+i) Г (^+
+ l|^)Wft+K(^+l|^)Vft+i. (3.80)
Подставляя (3.80) в (3.79), с учетом (3.28) получаем
M{N\k+ l) = M{M[{x^-x{N\k)){x,-
-x{k\k)y\Yt]\ У'о^'}ФЦк+1 |^)(E-K(^ + l|^)H,+i)^ =
= Л1 (Л^ I ^) Ф^ (^ Н- 1 I ^) (Е — К (^ + 1 I ^) Hi+i)^ А
Отметим некоторые особенности алгоритма интерполяции с
закрепленной точкой.
1. Алгоритм (3.66) —(3.69) обрабатывает измерительную
информацию в темпе ее поступления. Параллельно с
алгоритмом интерполяции должны работать по той же измерительной
информации алгоритмы фильтрации (3.7) —(3.9) и
экстраполяции (3.29) и (3.30), формирующие коэффициент передачи
К(^+1|^) и прогнозные значения х(^+1|^) и Р(^+1|^), k =
= Л^4-1, Л^+2... на текущие моменты времени. С помощью
алгоритма фильтрации и оределяются на момент времени tN по
57
выборке измерений Y^o значения х(Л^|Л^) и Р(Л^|Л^),
являющиеся начальными условиями для работы алгоритма интерполяции.
2. В соотношения (3.66) — (3.69) входят выражения
Уа+1 - А,+1 - Н,+1 X (^ + 1 I ^), (H,+iP (^ + 1 I ^) X
X Щ+1.+ Rft+i)-' и Е - К (^ + .1 I ^) Н,+1,
значения которых уже сформированы на тот же момент
времени в алгоритме рекуррентной фильтрации. Это обстоятельство
позволяет сократить объем вычислений, необходимых для
реализации алгоритма интерполяции.
3. При формировании коэффициента передачи К(Л^|Л^) не
используется матрица Р(Л^|^+1), поэтому соотношение (3.67)
можно исключить из алгоритма интерполяции, если определять
качество оценок х(Л^|^+1).
4. Из соотношения (3.67) следует, что матрица Р(Л^|^+1) —
— Р(Л^|^)—отрицательно определена; это указывает на
улучшение оценок параметров х^ по мере роста объема
измерительной информации.
Задача 3.7 (Дискретная интерполяция на закрепленном
интервале). Дано:
1. Модели системы и измерений (3.26) —(3.28).
2. У^о —выборка измерений на фиксированном временном
интервале {^о, ^w]-
Доказать, что алгоритм интерполяции значений x(^|i^^) =
= M{xu\Y^o} и P(^|^^)=cov(Xft, Xft|y^o) при k=N-l, N-2,...
..., О задается соотношениями
x{k\N) = x{k\k)-]-K{k\k+ 1) (X (^ + I I Л^) —
- X (^ + 1 I k)); (3.81)
P {k \ N) = P {k \ k) — K {k \ k + I) {P {k + I \ k) —
- P (^ + 1 I Л0)1с^ {k\k+ 1); (3.82)
K{k\ k + l) = P{k\ к)ФЦк+1\ k)P~-'{k+ \\ k), (3.83)
где начальные значения x{N\N) и Р(Л^|Л^) и значения x(k\k),
P(^l^), x{k-\-\\k), Р(^+1|^) находятся соответственно при
помощи соотношений (3.7) —(3.9), (3.29) и (3.30).
Доказательство. Для вычисления значений х(^|Л^) и Р(^|Л^)
используем свойства условных математических ожиданий
x{k\N)=M{xn\Y^o}=M{M{xk\Y^o, xn+{\\Y^o}; (3.84)
P{k\N)==M{(xn-x{k\N)){Xk-x{k\N)Y\Y^o}^
=Al{cov(Xft, Xft|y^o, Xft+i) |У^о}+соу{Л1(хй|Ул^о, x^+i),
Л1(х,|У^^о. Xft+i)|yV. ' (3.85)
58
Преобразуем условные математические ожидания, входящие
в правые части равенств (3.84) и (3.85). Из рекуррентных
соотношений (3.26), (3.27) и условий (3.28) следует, что каждый
из случайных векторов {xft+2,.. .,Xjv, Y'^k+i} полностью
определяется заданием случайных векторов {хо,.. ..х^+ь w^+i,..., Wiv-i,
Vft+i,.. .,Vw}. Кроме того, случайные векторы {хо, ...,Ха, У'о} не
зависят от случайных векторов {wft+i,..., Wiv_i, Vft+i,.. ..v^}.
Поэтому для любой ограниченной функции ф(хй) можно
записать
М[?{х,) I Уо'', x,+i] =Л1[<р(х,) I yg, Y^^u х,,,] =
= Al[cp(Xft) I Yq, Wft+i, ..., wyv-i, Vft+i, ..., Ум, Xft+i] =
= M[cp(x,)|yg, x,+i]. (3.86)
Выбирая сначала ф(хй)=ха, a затем ф(Хй) = (x^—Л1(хй|У^о,
Xft+i))(xft—Л1(Хй|У^о, Xft+i)) и используя следствие из
теоремы о нормальной корреляции (2.52) —(2.54), получаем
М [X, I Yl x,+i] = М[х,\ Yi x,+i] = X (^ 1 ^) + К (^ I ^+1)Х
Х[х,+1-х(^ + 1 1% (3.87)
К(^ I ^ + 1) =-. cov(x„ х,+1 I У„*)Р-'(^ + 1 I ^); • (3-88)
cov(Xft, Xft I Yq, Xft+i) = cov(Xft, Xft I Yq, x^+i) =
= P (^ I ^) - К (^ I ^ + 1) [cov (x„ x,+i I y'q)Y=
= P{k I k)~K{k I k+ l)P(/fe + l|^)K^(^ 1^ + 1). (3.89)
Подставляя (3.87) и (3.89) в правые части равенств (3.84)
и (3.85), получаем искомые соотношения (3.81) и (3.82).
Наконец, заметим, что в силу соотношений (3.26) и (3.29)
Xft+1-X (^+ 1 I ^) = Ф {k+ 1 I k) (Xft-X {k\k)) +
+ r(^+l|^)wft, (3.90)
поэтому cov(Xft, Xft+11 У'о) = P (^ I^) фт{k+ l\k).
Подставляя (3.90) в (3.88), получаем искомое равенство
(3.83). А
Отметим характерные особенности алгоритма интерполяции
на закрепленном интервале.
1. Алгоритм (3.81) —(3.83) предназначен для работы в
обратном времени от tN к ^о- Его нельзя использовать в реальном
Масштабе времени для обработки текущей измерительной
информации, поэтому этот алгоритм полезен для анализа данных
после окончания эксперимента.
59
2. Рассматриваемый алгоритм интерполяции может начать
функционировать лишь после определения с помощью
рекуррентных алгоритмов фильтрации и экстраполяции, задаваемых
соотношениями (3.7) —(3.9), (3.29) и (3.30), начальных х(Л/' N)
и Р(Л^|Л^) и текущих х(^:|^:), Р(^:|^:), х(^5:+11^5:), Р(^5:+1 k),
^=Л/'—1, Л/'—2,..., О значений.
В отличие от алгоритмов фильтрации соотношение (3.81) не
включает в себя явно далные измерений. Роль «измерений»
играет текущая оценка х(^|^).
4. Матрица передачи К(^ | ^+ 1), как следует из (3.83),
формируется только по результатам решения задач
фильтрации и экстраполяции с использованием выборки измерений У'о
без привлечения дополнительной измерительной информации
^ft+i- В состав матрицы K(^|^-f 1) не входит матрица
P{k\N). Если нас не интересует качество работы алгоритма
интерполяции, то (3.82) может быть исключено без нарушения
работоспособности алгоритма интерполяции.
5. Недостатком исследуемого алгоритма является наличие в
(3.83) обратной матрицы P-'(^-f-l k). Действительно, если
матрица P(^-f-l|^) особенная в какой-то момент времени h, то
оценку x(k\N) получить нельзя. Если матрица P(^-f-l|^) плохо
обусловлена, то незначительные ошибки округления ЦВМ могут
приводить к существенным ошибкам в оценке x(k\N).
6. Как следует из (3.82), матрица
Р(^|Л/')—Р(^|^)—отрицательно определена. Это означает, что при нормальном
функционировании алгоритма интерполяции привлечение
дополнительной измерительной информации Yk+i приводит к
улучшению оценки х(^|^).
Задача 3.8 (Дискретная интерполяция с постоянным
запаздыванием). Дано:
1. Модели системы и измерений (3.26) —(3.28).
2. Интервал запаздывания измерений tu+N—4, N—const,
k = 0, 1, 2...
Доказать, что алгоритм интерполяции имеет вид
х(^^+1|^+1+Л^)=х(^5:+11^5:)+К-Ч^|^+1) [^(k\k^
-\-N) -X (^: I ^:) ] +К (^+11 ^:+Л^) [yh+i+N-Ah+i+N—
-\ik+i+Nx(ki-l-\-N\k-\-'N)]; (3.91)
P(k+ 1 I ^: + 1-ЬЛ^) = Р(^:+ 1 I k)+^~4k I ^:+l)[P(^: \k +
+ N)-P{k I ^:)](K-'(^ I ^: + l))^-K(^:+ 1 | k + N)X
(^: + 1 + Л^ I k+N) HUi^N + Rft+i+/v] K' {k +
+ i\k + N), (3.92)
60
где K(k-{-\\k-\-N) и К(^|^+1) находят с использованием
выражений (3.68), (3.69) и (3.83); х(^5:+1|^:), р(^5:+11^5:), х(^5:+1+
-\-N\k-{-N), Р(^+1+^|^+^) —результаты решения задач
фильтрации и экстраполяции определяют с помощью
соотношений (3.7) —(3.9), (3.29), (3.30). Начальные условия х(01Л/'),
Р(ОШ).
Доказательство. При вычислении x(k-{-\\k-{-\-{-N) и Р(^+
+ 1|^+1+Л/') значение ^-f-1 будем рассматривать как
закрепленную точку. Применим соотношения (3.66) и (3.67), заменив
в них индекс N на индекс ^-f-1, а индекс k-{-'l на ^+1+^-
Получим
x(k+\\k+l+N) =х(^5:+1 \k-\-N) +К(^:+11^5:+
iih+i+Nx{k-\-l-\-N\k-\-N)]; (3.93)
P(/fe+ 1 I ^5:+ 1+Л^) = Р(^5:+1 I k + N)~K(k+l \k + N)X
X[Hs+i+;vP(^+l +Л^| к+Ы)}Г^+пы+Яш+м\КЦк +
+ 1 I ^ + ^). (3.94)
Для вычисления значений x(k-\-l\k-\-N) и P{k-\-l\k-{-N)
воспользуемся алгоритмом интерполяции на закрепленном
интервале. Из соотношений (3.81) — (3.83) следует
х(^5:+11Л^)=х(^5:+11^5:) +
+ К-Ч^1^+1)[х(^:1Л^)-х(^.1^.)]; (3.95)
Р (^5:+11Л^) = Р (^5:+11 ^5:) К-1 (^ I ^+
+ 1)[Р(^:1Л^)-Р(^.1^.)](К-1(^1^+1))^; (3.96)
\~Нк\к+1) = Р{к+1\к)ФНк\к-\-\)Р-Цк\к). (3.97)
Заменяя в (3.95) —(3.97) индекс -V на k-\-N, находим
х(^:+11^5:+Л^)=х(^5:+11^5:) +
+ К-Ч^1^+1)[х(^1^5:+Л^)-х(^:1^:)]; (3.98)
P(^:+1|^5:+A^) = P(^+M^5:)+K-4^1^+1)[P(^1^+^V)-
-Р(^:1^.)](К-1(^.1^.+ 1))^ ■ (3.99)
Подставляя x(k-{-\\k-{-N) и P{k-{-l\k-\-N) из соотношений
(3.98), (3.99) соответственно в соотношения (3.93), (3.94),
получаем исходные соотношения (3.81) и (3.82). Л
Алгоритм интерполяции с постоянным запаздыванием имеет
следующие особенности:
1. Необходимо определить начальные условия х(0|Л/') и
Р(01Л/') с помощью алгоритма интерполяции с закрепленной
точкой ^0, поэтому алгоритм интерполяции с постоянным
запаздыванием на интервале времени [^о, t^] не работает.
61
2. Параллельно с данным алгоритмом интерполяции должны
работать рекуррентные алгоритмы фильтрации и
экстраполяции, определяющие на каждый момент времени tk значения
3. Рассматриваемый алгоритм интерполяции является
рекуррентным в прямом времени и имеет два слагаемых,
корректирующих оценки x(^-f-l|^) и P(^-f-l|^). Первое
корректирующее слагаемое определяется невязкой, возникающей за счет
использования избыточной выборки измерений Уа+Г, второе —
невязкой последнего измерения yft+i+N-
4. Коэффициенты передачи К^' (^ | ^ + 1) и K(k -{- l\k + N) не
зависят от матрицы P(k-{-\\k-{-l-{-N). Поэтому соотношение
(3.91) не зависит от (3.92), т. е. оценку x{k-\-l\k-\-l-\-N) можно
находить, не вычисляя матрицу P(k-{-l\k-{-l-{-N).
5. Недостатки этого алгоритма интерполяции, связанные с
вычислением коэффициента передачи К~Ч^|^+1), аналогичны
недостаткам алгоритма интерполяции на закрепленном
интервале.
В заключение заметим, что алгоритмы непрерывной
интерполяции могут быть получены на основе предельного перехода
от соответствующих задач дискретной интерполяции при
стремлении к нулю временного шага дискретности [62].
3.4. Учет старения измерений при оптимальной
фильтрации
Полная априорная информация в задачах оценивания чаще
всего задается так, что наблюдения, осуществленные в
настоящий момент времени, дают точно такую же полезную
информацию, как и наблюдения, выполненные в прошлом. В
применении к практическим задачам оценивания такой модельный
подход нельзя признать удовлетворительным, ибо не вполне
достоверно известны свойства реальной системы. Например,
если один из параметров, подлежащих оцениванию, считается
постоянным, в то время как в действительности он может
медленно меняться в соответствии с некоторым известным законом,
то оценка этого параметра должна быть основана либо только
на недавно полученных данных, либо должны учитываться веса
измерений в зависимости от времени их получения.
Рассмотрим один метод учета старения измерительной
информации, который укладывается в рамки теории рекуррентной
фильтрации. Метод предусматривает введение весовой функции
в корреляционную матрицу шумов измерений, так что
априорная дисперсия измерений возрастает по мере устаревания
данных. Коэффициент старения представляет поостое средство
улучшения характеристик алгоритма оценивания в применении
62
его к практическим задачам оценивания. Рассматриваемые
ниже задачи дискретной и непрерывной фильтрации
иллюстрируют введение коэффициентов старения измерений.
Задача 3.9 (s — модификация дискретного фильтра Калма-
на). Дано:
1. Модели системы и дискретных измерений (3.26) и (3.27).
2. Априорные данные (3.28) исправлены с помощью
соотношения
cov(v^, v^iy^") = s'*~"'RAy, s —const, s>l, s —скаляр.
(3.100)
Доказать, что алгоритмы экстраполяции и фильтрации
задаются соотношениями (3.29), (3.30), (3.7) и (3.9), где
Kh=P{k\k—l)\i\[HkP(k\fk-l)\i\+sRk]-'. (3.101)
Доказательство. Оно частично повторяет решение задач 3.1
и 3.2 при использовании в (3.25) соотношения (3.100).
Задача 3.10 (Экспоненциальное старение измерений в
непрерывном фильтре Калмана). Дано:
1. Модели системы и непрерывных измерений (3.34) и
(3.35).
2. Априорные данные (3.36) исправлены при помош,и
соотношения
М {dvtdw) = e«'R<« (^-т) dt. (3.102)
Доказать, что эволюция условных статистических
моментов
x{t\t,)=M{x,\Y't,) я P{t\t,) = cov (х„ X, IYl)
при f^ti описывается уравнениями (3.37) и
dP*(t\h)/dt=-aP*(t\h)-\-F{t)P*{t\ti) +
+P*{t\U)F-{t)-K{t)H{t)P*{t\h) +
+G(Oe-«'Q<G-(0; (3.103)
K{t)=P*(t\tl)W(t)R-^^■, (3.104)
P{t\ti)=e'^tp*(t\ti) (3.105)
и начальными условиями (3.40).
Доказательство. Оно повторяет решение задачи 3.3 с
учетом следующих дополнений. Используя (3.38) и (3.102) можно
записать
K(t) = P{t\ti)H^t)e-'^tR~it.
Отсюда следует соотношение (3.104) при использовании
обозначения (3.105). Подставляя значение P(^|^i), задаваемое
равенством (3.105) в (3.39), получаем искомое уравнение
(3.103). Л
63
в случае стационарных систем Q(t)^0 уравнение (3.103)
становится линейным матричным уравнением с постоянными
коэффициентами и может быть решено в явном виде.
Асимптотическое поведение фильтра Калмана при ^-^оо и
экспоненциальном старении измерения приведено в [65].
3.5. Фильтрация при взаимной коррелированности
шумов моделей системы и измерений
Проведем обобщение дискретного и непрерывного фильтров
Калмана в двух направлениях: во-первых, в моделях системы и
измерений будем использовать взаимнокоррелированные шумы;
во-вторых, коэффициенты в уравнениях указанных моделей
будут зависеть не только от времени, но и от измеряемых
параметров.
Задача 3.11 (Дискретный алгоритм Глонти). Дано:
1. Модель системы
Xft+i = ao(A!, yft)-fai(A!, yft)Xft-fbi(A!, yft)Wft+i-f
+b2(i^:, yft)Vft+i, k=l,2,...,N,... (3.106)
2. Модель дискретных измерений
Уй+1 = Ао(А!, yft)-fAi(A!, yft)Xft-fBi(A!, yfe)Wft+i-f
+ 82(1^:, yft)vft+i, ^:=1, 2,..., Л^-1. (3.107)
3. Априорные данные:
Wft-~A/'(Wft, Qft); Vft~iA/'(Vft, Rft);
хо~Л/'(хо, Po); yo=0;
cov(Wft, v/)=cov(Wft, xo)=cov(vft, Xo)=0. (3.108)
Доказать: 1. Алгоритм одношаговой экстраполяции
значений
x(k+l\k)=M{Xk+i\Y\); y{k-\-l\k)=M(yk+i\Y\);
P{k^\\k)=coY(xk+uXk+i\y\);
Pxv (A!-t-11 A!) = cov (xft+1, Yk+i 1 Y\);
PyЛ^+11 ^) =cov (yft+1, yft+11 y,"), A:= 1, 2,..., Л^-1, -
на моменты времени проведения измерений имеет вид
x(k-\-l\k)=sm,-\-aiix{k\k)+biWk+i-\-b2Vh+\; (3.109)
y{k-\-l\k)=Ao-\-Aix{k\k)-\-BiWk+i + ^Vk+u (3.110)
P(A:+l|A:)=aiP(A:lA:)a^i+biQft+ibT,-l-b2Rft+ibV, (3.1 И)
Pxa(^+ll^)=aiP(^l^)A^i+biQft+iB''i+b2Rft+iB^2; (3.112)
Pya(^+l|^)=AiP(^1^5:)A^+BiQft+iB''i+B2Rft+iB^2. (З.ПЗ)
64
2. Алгоритм фильтрации значений
x{k+l\k+l)=M(xk+l\Y^^+h)■,
P{k+l\k)=cov(x^,Xk+i\Y''+h)
задается рекуррентными соотношениями
х(^: + 1 I ^:+1) = х(^:+1 | ^) + К,+,(Уа^1-У(^ + 1 I k));
(3.114)
K,^, = P,y(k + l\k)Pi;(k+l\ky,
Р(^:+1 |^:+1)=Р(^:+1 | k)-K,+,Ply(k-\-1 \ k).
3. Алгоритм экстраполяции значений
Xs=M{xs\Y'^{);ys=M{ys\Y''x);
"cov(x„xjyf) covCx^yjyf)
.соу(у„х,|уГ) cov(y„yjyf)
На моменты времени после проведения последнего измерения
при условии, что
-[,
, s>N.
(3.115)
(3.116)
(3.117)
ai(A!, yft)=ai(A!); A, (A;, yft)=Ai(A!);
bi{k,yk)=bi(k); Bi{k,yu)^Bt{k); i=l,2,
имеет вид
(3.118)
[y.+iJ LAo(s)J Ui(s)A,(s)jLyJ
LBi(s)B,(s)JU+J'
+
(3.119)
s+i-
+
is) B,(s)
_ [ai (s) a, (s)
LAi(s)A,(s)
bi(s) b,(s)-| f-Q, 01
LBi(s)B,(s)J Lo rJ
Начальные условия
■х(Л^/ЛО
У. 1У-
1 ^ rai(s) a,(s)"
] 4Ai
1^
(s) A, (s)J
bi(s) b,(s)-
Bi(s)B,(s)
р(л^/ло 0
0 0
+
(3.120)
(3.121)
Доказательство. Вычисляя условное математическое
ожидание Af(-|y''i), k<N от левой и правой части равенств (3.106)
5—6899 65
и (3.107) с учетом априорных данных (3.108) непосредственно
получаем рекуррентные соотношения (3.109) и (3.110).
Найдем разности Xa+i—х(^+11^) и Yft+i—у(^+11^),
используя соотношения (3.106), (3.107), (3.109) и (3.110):
Xft+i—x(A!+l|A!)=ai(A!, yft)(xft—x(A!lA!)) +
+bl {k, Yft) (Wft+i—Wft+i) +b2(A!, Yft) (Vft+i—Vft+i); (3.122)
yft+i-y(^:+ll^:)=Ai(^:, y^) (x^-x (^: | ^:))+
+Bi(A!, yft) (Wft+i—Wft+i)+B2(A!, уй) (Vfc+i—v^^+i). (3.123)
Здесь следует заметить, что приращение (xft—х(^|^)) не
зависит от приращений (w^+i—Wft+i) и (vft+i—Vft+i) в силу условий
(3.108) и соотношения (3.106), поэтому, используя определения
корреляционных матриц P(k-{-\\k), Pxv{k-{-l\k), Pvy{k+l\k) и
соотношения (3.122) и (3.123), непосредственным подсчетом
получаем соотношения (3.111) — (3.113).
Для нахождения апостериорных значений x(^-f-l|^+l) и
P(^-j-M^+l) применим теорему о нормальной корреляции,
которая в обозначениях данной задачи имеет вид (3.114) —
(3.116).
Алгоритм экстраполяции на моменты времени после
проведения последнего измерения {s>iN) может быть получен в
частном случае, когда коэффициенты соотношений, описывающих
модели системы и измерения, имеют вид (3.118). Подставляя
значения (3.118) в (3.109) и (3.110), сразу получаем искомое
соотношение (3.119).
Подставим теперь значения коэффициентов (3.118) в
равенства (3.106) и (3.107), затем вычтем из них (3.119).
Получим
Гх,+1 —x,+i1_rai(.s) ajs)! Гх, —хЛ ,
Lm-WJ U.(s)A,(.)J[y^_yJ
_^|b.(s)b.(s)-|K,,-w,,J (3.124)
LBi(s)B,(s)| K+i-v.+i J
Используя определение (3.117) корреляционной матри-
цы Ps И соотношения (3.124) с учетом независимости
•ч
приращения (Xs—Xs) от приращений (w^+i—Wg+i) и (vg+i—Vs+i),
непосредственным расчетом получаем (3.120). А
Рассмотрим применение алгоритма Глонти к задаче, в
которой модель измерений описывается нерекуррентным
соотношением.
66
Задача 3.12 (Алгоритм Глонти — Липцера). Дано:
1. Модель системы
Xk+l = aio{k)■i-Ф{k-\-l\k)xh-\-Ьl{k)Wk+l-{-
+b2{k)\k+u k=l,2... (3.125)
2. Модель измерений
уА+1 = Ао(А!+1)+Яй+1Хй+1+В1(А!+1)шг,+,+
+B2(^:+l)vft+b ^:=1,2... (3.126)
3. Априорные данные— (3.108).
Доказать: 1. Алгоритм экстраполяции имеет вид
+
х(^: + 1|^)1 Гао(^)
Ly(^ + l|^)J [Ао(^:+1)+Н,+,ао(^)
~Ф{к + 1\ k)
.Н,+1Ф(^ + 1|^)
X
(^+l)+H,+ibi(^)B,(^+l)+
Ш::}
(3.127)
+ н,+А(^)-
Р (^5:+11 ^5:) = Ф (^5:+11 ^5:) Р (^5:1 ^5:) Ф''(^+11 ^)+
+bi (k) Qft+ib-i (k) +b2(^) Rft+ib-2(^); (3.128)
Pxv{k-\-l\k)=P{k-\-l\k)H^k+i-\-bi{k)Qk+iu'i{k+l)-\-
+b2(^:)Rft+iB-2(^+l); (3.129)
Pyy i;k-\-11 k) =Hft+iP {k-\-\\k) H\+i+Bi {k+
+ l)Qft+iB^i(^:+l)+B2(^:+l)Rft+,B-2(^+l) +
+ Hft+,[b,(^:)Qft+,BT,(^:+l)+b2(^:)Rft+,B-2(^+l)] +
+Bi(^:+l)Qft+M(^:)+B2(^+l)Rft+ib-2(^)]H-ft+i. (3.130)
2. Алгоритм фильтрации задается соотношениями (3.114) —
(3.116).
Доказательство. Подставив в (3.126) вместо x^+i его
значение, взятое из (3.125), получим
Ук+1=(Ао{к+1)+Ни+1Мк))+Н^+1Ф(к-\-1\к)хи+
+i[Bi(^:+l)+Hft4jibi(^:)]Wft+i+
+ [B2(^:+l) + Hft+,b2(^:)]vft+,. (3.131)
Рекуррентные соотношения (3.125) и (3.131) образуют
исходные модели системы и измерений, к которым применим ал-
5* ■ 67
горитм Глонти. Обозначив
Ao(^:)=Ao(^:+l)+Hft+,ao(^);
B,(^:) = B,(^:+l) + Hft+,b,(^:); (3.132)
А1(^:)=Нй+1Ф(^:+1|^:); B2(^:)=B2(^+l)+Hft+ib2(^)
и подставив эти значения вместо До, Аь Bi и Вз в равенства
(3.109) —(3.113), сразу получим искомые соотношения (3.127)
и (3.128).
Выражение (3.112) примет вид
Р.Л^+1 |^) = ф(А+1|^)Р(^|^)ф'(^+1 \k)HUi +
+ bi (k) Q,+i [Bi (A + 1) + Н,+Л {k)Y + b, {k) R, ,1 [B, (^ + 1) +
+ н,+1ЬЛ^)Г=[ф(^+1 \k)P{k\k)o-4k + i \k) +
+ Ъ, (k) Q,+,bI(k) + b, (k) Я,^,Ъ1 (k)] HUi+b, (k) Q,+,B[(^.+1)+
+;b,(^)R*+iB/(A+i). (3.133)
Из равенств (3.128) и (3.133) следует (3.129).
Наконец, соотношение (3.113) запишем в виде
Pyy{k+i \k) = H,^,0(k+l |^:)Р(^:|^:)Ф^(^:+1|^:)т+,+
+ [В, {k+l) + H,H.ib, (k)] Q,+, [В, (^ + 1) + H,+ib, {k)Y +
+ [B, (^ + 1) + H,+ib, (k)] R,+, [B, (k+l) + H,+A {k)Y =
= H,+i [Ф (^ + 1 I ^) P (k/k) фЦк+1\к) + Ъ, (k) Q,+ibi- (k) +
+ b, (k) Я,^,Ы (k)] Нг+,+ Bi {k + 1) ОанпВГ (^ + 1) +
+ ВЛ^ + 1)Ra+iB|(^+1) + Bi (^+1) QA+ibf(^)Hl+i+
+ H,+,bi (^) Q,+,BI(^+1) + B, {k + 1) R,+ibI(^) Щ+, +
+ H,+A(^)R*mB/(A + 1). (3.134)
Из равенств (3.128) и (3.134) следует (3.130).
Структура алгоритма фильтрации остается такой же, как и
в фильтре Глонти. А.
Рассмотрим алгоритмы оценивания, в которых шумы модели
и измерений заданы с использованием произвольной
корреляционной матрицы. Следует заметить, что вид алгоритмов
оценивания, приведенных в задачах 3.13 и 3.14, существенно
зависит от того момента времени, к которому относятся шумы
модели системы.
Задача 3.13. (Алгоритм Хо —Ли).
1. Модель системы
Xk+i = aioik)-\-^(fi+Ufi)^h-\-bi(k)Wk+i. (3.135)
68
2. Модель измерений
yft+i==Ao(A!+l) + Hft+iXft+i+B2(A!)Vft+i.
3. Априорные данные:
Wftfi'^A^(Wft+i, Qft+i); Уй+1'^Л/'(Уй+1, Rft+i);
Хо^Л^(Хо, Ро);
(3.136)
COV
}
yi .
)-
с/ R*.
°w.
(3.137)
где 6ft/ — символ Кронекера;
cov(xo, Wft)=0; cov(xo, Vft)=0.
Доказать: 1. Алгоритм экстраполяции имеет вид
х(^:+1|^)=ао(^) + Ф(^+1|^)х(^:|^:)+Ь,(^:)ш,+,;
у (^:+11 ^:) =Ао (Л)+Hft+ix (^:+11 ^)+В2 (^)'^ft+i;
^{к-\-\\к) = Ф{к-\-\\к)9{к\к)Ф^{к-\-\\к)-\-
■\-bi{k)(Xu+xb\{k);
Р,, (^: + 1 I ^:) = Р (^. + 1 I ^:) Н1+, + Ь^ {к) С,.,,Ы (к);
Руу (^ + 1 I ^) = Н,+,Р{k+l\k)HUi + в,(к)R,+i В^(к) +
н,+Л (k) с,+,В1 (к) + в, (к) а+,ьт (к) н,^,.
(3.138)
2. Алгоритм фильтрации задается соотношениями (3.114) —
(3.115), элементы которых берут из соотношений (3.138).
Доказательство. Используя соотношения (3.135) —(3.137) и
независимость w^+i и Vft+i от выборки измерений У*1, найдем,
что условные математические ожидания Xft(^+l|^)^
=Af(xft+i|y*i) и y(^+l|^)=Af(yfe+i|y''i) удовлетворяют
первым двум соотношениям (3.138).
Составим разности
x,+l-x(^:+ll^)=Ф(^+ll^)(Xft-x(^:|^:)) +
+bi(A!)(Wft+i—Wft+i)
yft+i-y(^+l|^) = Hft+i(Xft+i-x(^:+l|^:)) +
+ B2(A!)(Vft+i —Va-h).
Учитывая независимость приращений Xfe—х(^|^) от
приращений Wft+i—Wft+i и Vft+i—Vft+i, по определению корреляционных
матриц Р(^+1|^). Pxv{k+l\k) и Pvy{k-\-l\k), получим третье,
четвертое и пятое равенства (3.138).
69
Зная Р(^+1|^), Pxy{k-{-l\k) и Руу(1г+1\1г) и применяя
теорему о нормальной корреляции, имеем алгоритм фильтрации в
требуемом виде. Л
Приведем теперь решения задачи, отличающейся от задачи
3.13 только тем, что в уравнении (3.135) вместо случайного
процесса w^+i используется случайный процесс w^. В этом
случае алгоритм _экстраполяции будет другим в силу того, что
•M(Wft+i| y*i)^Wft+i, а M(W|^\Y>^l) вычисляется с
использованием теоремы о нормальной корреляции из-за зависимости w^ от
Yft. Алгоритм фильтрации также будет иным, так как при
вычислении корреляционных матриц Pxv(k-i-l\k) и Pyy{k-{-l\k)
вместо Af[(Wft+i—Wft+i) (vft+i—Vft+i) |y*i] = Cft+i используют
Af[(Wft—Af(Wft|y''i)) (vft+i—Vft+i)''|y''i]=0. Математически
наиболее просто в данном случае алгоритм оценивания получается
путем «декоррелирования» шумов моделей системы и
измерений.
Задача 3.14 (Алгоритм Симкина). Дано:
1. Модель системы
Xk+i = Mk)+^{k-\-Uk)xk-\-bi(k)Wk. (3.139)
2. Модель измерений и априорные данные описаны в (3.136)
и (3.137).
Доказать: 1. Алгоритм экстраполяции имеет вид
x{k-\-l\k) =ао(^5:)+Ф(^+1 |^)x(^|^)+b, (k)Wk+
-\-Kp{k)[yh-Ao{k)-iikX{k\k)-B2{^k];
р(^:+1|^:) = [Ф(^:+1|^)-Кр(^)Н,]Р(^:|^:)[Ф(^:+1|^:)-
-Кр (^:) Hft]+bi (^) Qftb^i (^:) -Кр (^) Bj (^:) R,В-2 (^) Кр (^);
KAk)=bi(k)Ck[B2(k)R,]-K (3.140)
2. Алгоритм фильтрации удовлетворяет соотношениям
x(^:+l|^+l)=x(^:+l|^) + K(^+l)[yft+i-Ao(^+l)-
-Hft+,x(^:+l|^:)-B2(^:+l)vft+i];
P(/;+l|^5:+l) = [E-K(^+l)Hft+i]P(^:+l|^);
K(^:-f 1) = Р(^:+1 |^)Hl+,[H,+iP(^:+l|^:)Hl+,+
+ B^(k+l)R,^,B:{k+l)]-\ (3.141)
Доказательство. Построить эквивалентную, модель системы,
которая бы содержала шум, некоррелированный с шумом
модели измерений. С этой целью запишем модель системы в виде,
70
содержащем неизвестный матричный коэффициент Kp(k):
^k+l = ao{k)■i-Ф(k-\-l\k)Xk-\-Ъl{k)Wk-{-
-\-Kp{k){yk-Ao{k)-iikXk-B2{k)Vk) =
= [го{к)-\-КАк){уи-Ао(к))]-\-[Ф(к^\\к)-
- Кр (k) На] Xft+ [bi (k) Wft- Кр (k) Bj (k) V,J.
Обозначим
a* (k, yu) =aio{k)-\-Kp{k) (Yft-Ao(k));
Ф*(^+11^) =Ф(^+1 |^)-Kp(^:) Щ;
w*ft=bi (^:) Wft-Kp (^) Bj (^) Vft.
Тогда равенство (3.135) примет вид
Xft+i = a*(^:, yk)-\-Ф*(k+l\k)Xk+w*k, (3.142)
в котором коэффициенты а*(к, у^), Ф*(^+11^) и случайный
процесс w*ft зависят от матричного коэффициента Кр(^).
Выберем Kp(k) таким, чтобы w*ft и v* были не коррелированы
О = COV (W,*, V,) = М {[Ь, (k) (W, - W,) - Кр (k) В, (k) (v,v,)] X
Отсюда следует справедливость третьего равенства,
входящего в систему соотношений (3.140).
Определим математическое ожидание и корреляционную
функцию для процесса:
Mw,* = Ъ, (k)^, - К, (k) В, (^.)V,; (3.143)
Q*ft=cov(w*ft, w*ft) =bi (k) Qftb-i (k) +
+Kp (k) Bj (k) RftB-2 (k) K% (k) -
-Kp (^) Bj (k) Cftb-i (^:) -bi (^:) CftB^j (^:) K% (^:) =
= bi(k)Qkb'i(k)-Kp{k)B2(k)Rk^^2(k)K''p{k). (3.144)
Легко непосредственно проверяется, что
cov(yft, w*ft)=0 и cov(w*ft, w*„)=Q*ft6ft/. (3.145)
Используя (3.142) —(3.145), определения условного
математического ожидания x(^-f-l|^)=Af(Xft+i|Y*i) и условной
корреляционной матрицы, непосредственно получаем первые два
соотношения (3.140). Предлагаем читателю получить
самостоятельно соотношения (3.141), используя исходные соотношения
(3.136), (3.142) и теорему о нормальной корреляции,
записанную в виде (3.114) — (3.116). Формально соотношения (3.141)
совпадают с дискретным калмановским фильтром (3.7) —
(3.9). Л
Рассмотрим обработку непрерывно поступающих измерений
при модели системы, заданной в непрерывном времени.
7)
Задача 3.15 (Непрерывный алгоритм Липцера). Дано:
1. Модели системы и измерений описываются линейными
стохастическими дифференциальными уравнениями Ито:
dxt=[aio{i, yO+F(^. yt)iit]dt+bi{t, yt)dwt^
+b2{t, yt)dvt, t^W, (3.146)
dyt=\k^{t, yO + H(^, yt)xt\dt^b,(t, yt)d^f\-
+ B2(^, yt)dyt, t^ti^to. (3.147)
2. Априорная информация:
y/t и \t — стандартные винеровские процессы [60];
M[dwtdw\] = Qtb(t—x)dtdx;
M[d\td\\] = Ri6 (t—t)dtdx; Xo-^N(xo, Po).
Векторы Xo и процессы Wt и \t — независимы.
3. Выборка измерений У<, = (у^, s ^ [t^, t]}.
Доказать: 1. Алгоритм фильтрации при f^ti имеет вид
dx{t\t) = [ao{t,yt)+F(t,yt)x(t\t)]dt-\-
+ K{t, yt)[dyt-(Ao(t, уО + Н(^ yt)xit\t))dty, (3.148)
dP(t\t)=F(t, yt)P(t\t)-\-P(t\t)F^t, У0 +
+bi(^, yOQ(b^(^, yt)-\-b2{t, yt)Rtb^2{t, yt)-
-K(t.yt)[b,{t,yt)QtB-i(t,yt) +
+b2{t, yt)RtB-2{t, yt)-\-P{t\t)\mt, yt)], (3.149)
где
K(^, yO = {bi(^, yt)Qt^'i(t, yt)-\-b2{t, yOR^B-2(^ yO +
+P(^|OH-(^ yt)}{Mt, yt)Qtb\{t, yO +
-\-^2{t, yt)Rtb-2{t, yt)}-^■, (3.150)
x(t\t)=M[xt\YhA; P(t\t)=coY{xt, xt\YU,).
2. Алгоритм экстраполяции при W^f^U для частного вида
коэффициентов уравнений (3.146) и (3.147)
Mt, УО=ао(0+а2(ОУ<; Ао(^, yt)=^>(t)+^2(t)yt\
F(^,yO = F(0;H(^,yO = H(0;
bi{t, yt)=bi{t);Mt, yt) = Mt), i=\, 2,
имеет вид
J_P^l-Po(01,rF(0 аЛО|ГхЛ 5
'^49J"La„(oJ^lh(o A,(oJl9J
dP,^rF(0 аЛ01- , s rF(0 a.(01^ .
d/ Lh(0 a,(OJ '^ 4H(0 A,(0J
72
+
bi(0 Kit)
Bi(0 B,(0
Q, 0
0 R,
bi(0
.B.(0
BJO
(3.152)
с начальными условиями
Ё:1=«[;:]
Po о
О О
Р(= COV
[yt
Ut J
У
Доказательство. Предлагаем читателю выполнить
доказательство по следующему плану: 1) в уравнениях (3.146) и
(3.147) перейти к интегральной форме записи; 2)
воспользоваться алгоритмом Глонти (3.109) —(3.116); 3) выполнить
предельный переход при стремлении к нулю промежутка времени
интегрирования уравнений (3.146) и (3.147). Получить искомые
уравнения (3.148) —(3.150); 5) применить формулу Ито (П.33)
для вычисления стохастического дифференциала
d
[Дх,\ ДуЛ
Получить уравнение (3.152).
В заключение заметим, что полученные в § 3.1 и 3.5
результаты справедливы лишь тогда, когда невырождены обращаемые
матрицы, входящие в уравнения соответствующих фильтров.
В ряде случаев предположение о невырожденности обращаемых
матриц нарушается. Трудности возникают и в том случае, когда
некоторые собственные числа обращаемых матриц близки
к нулю, а решение задачи фильтрации выполняется на ЦВМ,
обладающей ограниченной разрядной сеткой. В этом случае
матрицы могут оказаться плохо обусловленными. Для
преодоления указанных трудностей может применяться метод
регуляризации, позволяющий построить квазиоптимальный фильтр.
Сущность метода регуляризации состоит в том, что обращаемая
матрица регуляризуется путем добавления к ней величины еЕ,
где Е — единичная матрица соответствующей размерности; е —
малый параметр. Далее берут уравнения соответствующего
оптимального фильтра, в которых вырожденную матрицу
заменяют на регуляризованную. В [28, 59, 86] показано, что как
в непрерывном, так и в дискретном фильтрах квазиоптимальная
регуляризованная оценка x^{t\t) является несмещенной, т. е.
M(x\t)^M{x^{t\t)), сходится в среднеквадратичном смысле
73
к оптимальной оценке x(^|^)=Af (х(^) | У'о) при стремлении
параметра е к нулю,
lim М [х] {t\t)- xi (t I {t)Y .-= 0, i =T^,
s-»-0
И, наконец, средний квадрат ошибки оценки х^(/|^) ограничен:
Puii I t)<M[Xi(i)-x](t I t)f<Ph{t I 0; i = 1, n,
где
P{t\t) = {Pi,{t\t)', i, j=TJi \ = coY{x(t),x{t)\Y'o);
P\t\f) = {Ph(t\t); i.i=l, n} = M[{x(t)-x'(t\t)){x(t)-
-x{t\ t)Y\Yi]
— матрица среднеквадратических ошибок квазиоптимальной
оценки, причем
Р(^ I 0 = limP'(^ I О-
3.6. Фильтрация при наличии автокоррелированных шумов
Задача 3.16 (Дискретный фильтр). Дано:
1. Модель системы
х^+1 = Ф(к-\-1\к)х^-\-Г(к-\-\\к)щ. (3.153)
2. Модель автокоррелированного шума системы
щ+1 = Ф(к-\-1\к)г]и-\^Ъ1(к)у,^+1. (3.154)
3. Модель дискретных измерений
yA+i = Hft+iXft+i+lft+i. (3.155)
4. Модель автокоррелированного шума измерений
lk+i = Hk+iU+^k)vk+i. (3.156)
5. Априорные данные:
Wk^N{vFk,Qk); \^^Ы{у^,Я^у, Xo^N{xo,Po);
п„^л^Гпо,Р,,(0));
COV (Хо, По) = COV (Хо, Wft) = COV (Хо, V;^) = COV (tlo, Wft) =
= COV (ло, V,) = COV (v„ w,) = 0. (3.157)
Доказать: 1. Алгоритм экстраполяции имеет вид
х(^5:+1|^) = Ф(^5:+1|^)х(^:|^5:)+Г(^5:+1|^5:)л(^1^); (3.158)
1\{к+1\к) = Ф{к-\-1\к)ц{к \ к) +bi{k)w,+i; (3.159)
74
P (^:+11 ^:) = Ф (^5:+11 ^5:) P (^5:1 ^5:) Ф''(^5:+11 A;)+
+ Ф (^+11 ^5:) С (^5:1 ^5:) Г'-(/:+11 ^5:)+
+Г (^:+11 ^5:) C^ (^5:1 ^5:) Ф^ (^5:+11 ^5:)+
+r(^:+l|^5:)D(^5:|^5:)r^(^5:+l|^5:); (3.160)
С (A; + 1 I A;) = Ф (A; + i I A;) С (A; I A;) Ф^ (A!+l I A;) +
+ Г(А:+ 1 I A:)D(A: I А:)Ф"(А:+ 1 | k). (3.161)
0(А!+1|А!) = Ф(А!+1|А!)0(А!|'А!)Ф''(А!+1|А:) +
+b,(A:)Qft+,b-,(A:), (3.162)
где
P(t I k) C(i I k)
C''(t I k) D (t I k)_
где
cov( "■' ■"' r," 1= "_"' ' " ' •;' ,'^ t;= A;, A; + 1.
(3.163)
2. Алгоритм фильтрации
x(A:+l|A:+l)=x(A:+l|A:)+Kft+i(Zft+i-z(A:+l|A:)); (3.164)
л(^+1|А:+1)=т1(^+1|^) +
+ Kn(A:+l)(Zft+,^z(A:+l|A:)); (3.165)
P(A:+l|A:+l) = P(A:+l|A:)-Kft+iPi(A:+l); (3.166)
C(A:+l|A:+l) = C(A:+l|A:)-Kft+iP2(A:+l); (3.167)
D(A:+l|A:+l)=D(A:+l|A:)-Kn(^+l)P2(^5:+l), (3.168)
Zft+i=yft+i—Hft+iYft; (3.169)
z(A:+ 1 I A:) = H,+ jX(A:+ 1 | A:)-Н.+^Н.х (A: | A:) + B,(^) v,+x;
(3.170)
K.Hri = Pi (k + 1) P%' {k+i\ k); (3.171)
K, (A: +1) = P, (A: + 1) PY2' (^ + 1 I ^); (3.172)
Pi(^+ 1)= P(A: I А:)Н/-Ф(А:+ 1 | A:)P(* | к)Н,%^,-
- Г (A: + 1 I A:) C^A: I A:) H,^H,+i; (3.173)
P,(^ + 1) = С (^ I ^) H,^- i (A: + 1 I A:)C'(A: | k) H/H,+i;
(3.174)
Pliik +J I k) = H,+iP (A: + 1 I A:) H^, - Н,+, (ф (A: + 11 A:) X
75
XP{k\k) + r{k+i \k)C(k\k)HlHU,-iiU,ii,{P{k\k)x
ХФЧк+1 \k) + C{k\k)r{k+\\k))\iU,+
+ H,^,H,P{k\k)HlHUi +BAk) R,+iB5 (k). (3.175)
Доказательство. Различие между автокоррелированными
шумами модели системы и модели измерений определяет методы
решения поставленной задачи. Шум r\k в модели системы
должен оцениваться по измерительной информации. Без этого
невозможно построение алгоритма экстраполяции оцениваемых
параметров Xk. Шум %k в модели измерений является мешающим
параметром и оценке не подлежит, поэтому для решения
задачи можно использовать два метода.
1. Метод расширения вектора состояния, при котором вектор
состояния Xft дополняется вектором щ. Новый вектор состояния
будет x*ft=[x''ft, ■ц'^й]''. Соотношения (3.153) —(3.155)
заменяются следующими:
xUi = Ф {k+l\k)xl + bftW^^+i;
Уй+1 = Hft+iXft+i + 1й+1.
(3.176)
(3.177)
где
х.* =
ь.* =
"Xft'
Як.
- 0
.bi(*
I
).
0*(^fe+l 1 k)=:
; Hft+i = [Hft+i,
Ф (^fe + 1 I ^fe) г (Л + 1 I ^fe)
0 Ф(к+1 \ k)_
2. Метод разностных измерений Брайсона—Хенриксона [84]
позволяет исключить шум %k, формируя новые измерения Zft+i
как линейную комбинацию двух последовательных измерений
У* и Yft+i:
Zft+i=yft+i—ril+iYft. (3.178)
Используя (3.176) — (3.178), получаем модель для описания
измерений
Zft+i = (Hft+i© (k+l\ k)— U^+jHI) xl + Hft+ibftW;,+i +
+ B,(*)v,+i. (3.179)
Соотношения (3.176) и (3.179) образуют исходные модели
системы и измерений для построения фильтра Глонти.
Используя соотношения (3.109) — (3.116), читатель может
самостоятельно убедиться в справедливости (3.158) — (3.175).
76
3.7. Методы фильтрации на основе использования
квадратных корней из матриц
Применение полученных ранее рекуррентных алгоритмов
оценивания для решения практических задач осуществляется с
помощью ЦВМ, которые не являются идеально точными
вычислительными устройствами, а имеют индивидуальные для
каждого класса машин ошибки округления. Это обстоятельство
является причиной различия между теоретическими и практически
получаемыми характеристиками оценок. Иногда эти различия
становятся существенными и имеют принципиальное значение
для принятия решения о целесообразности использования
результатов работы алгоритмов оценивания. Такие различия при
применении ЦВМ возникают, во-первых, из-за потери
положительной определенности условной корреляционной матрицией,
во-вторых, из-за плохой обусловленности обращаемых матриц.
Потеря положительной определенности матрицами Р(Л|^)
или P{k\k—1) при использовании ЦВМ может произойти в двух
случаях:
при формировании апостериорной корреляционной матрицы
с помощью соотношения (3.9), содержащего вычитание матриц,
при условии близости к единице какого-либо из диагональных
элементов матрицы КйН^;
при условии округления матрицы Ф{к-\-\\к)Р{к\к)Ф''{к-\-
+ l\k)-\-r{k-\-l\k)Qhr'^{k-\-l\k) в соотношении (3.30) до
матрицы Ф{к-\-\\к)Р{к\к)Ф''{к-\-1\к) и близости какого-либо из
диагональных элементов этой матрицы к нулю.
Плохая обусловленность обращаемых матриц может иметь
место: при выполнении точных измерений, т. е. при R^^O и
близком к нулю определителе матрицы НйР(А|Л—1)Н\ в
соотношении (3.8); при проведении в относительно короткое время
ряда неточных измерений с примерно одинаковым вкладом их
в коррекцию оценки вектора состояния.
Для преодоления указанных трудностей возможно
использование методов расщепления измерений, введения различных
весов измерений и других модификаций, в большой степени
эмпирических, зависящих от конкретных приложений.
В этом параграфе рассмотрим несколько вариантов метода
извлечения корней квадратных из матрицы для сохранения
положительной определенности корреляционной матрицы
оцениваемых параметров чисто вычислительным путем. Все
алгоритмы будут получены в результате модификации соотношений,
используемых в фильтре Калмана.
Основная идея метода фильтрации с использованием корней
квадратных из матриц состоит в следующем:
1) экстраполированную и апостериорную корреляционные
матрицы оцениваемых параметров представляют в виде произ-
77
ведения некоторых невырожденных матриц на
транспонированные по отношению к ним матрицы;
2) соотношения для расчета корреляционных матриц и
коэффициента усиления заменяют эквивалентными соотношениями,
позволяющими: неявно гарантировать положительную
определенность корреляционных матриц; получить двойную точность
вычислений при вычислении корреляционных матриц.
Впервые эта идея была реализована Поттером при
отсутствии ошибок модели системы для скалярных измерений.
Корреляционная матрица оцениваемых параметров представлялась в
виде P^ss^, где s —некоторая невырожденная матрица.
В дальнейшем Эндрюс получил модификацию фильтра Кал-
мана при наличии шума модели для векторных измерений.
Корреляционная матрица оцениваемых параметров представляется
в виде P^ssT, где s — нижнетреугольная матрица [ПО].
Беллантони и Дожд далее модифицировали алгоритм Энд-
рюса, предложив способ сохранения треугольности матрицы s,
которая нарушалась в алгоритме Эндрюса, при помощи
разложения квадратных матриц по собственным числам с
использованием ортогональных матриц [7].
Карлсон модифицировал алгоритм Калмана при наличии
шума модели системы для скалярных измерений, использовав
представления P:=ss'f, где s — верхнеугольная матрица.
Бирман выполнил модификацию алгоритма Карлсона,
обрабатывающего также скалярные измерения, при помощи
представления P^UDIJT, где и — единичная верхнетреугольная
матрица, D — диагональная матрица [116].
В заключение следует сказать об алгоритме Джозефа,
который модифицировал в алгоритме Калмана только соотношение
для расчета апостериорной корреляционной матрицы,
представив его в виде
P{k\k) = {E-KkUH)P{k\k-\){E-KkHky-\-
+ KftRftKV (3.180)
Это соотношение получается следующим способом. Из (3.7)
и (3.27) следует, что
x{k\k)=x{k\k-\)-\-Kk{yh-i\kX{k\k-l)) =
=x{k\k-l)-\-Kk(iihXh+Vk-iikX{k\k-\)) =
=x(k\k-l)-\-Kkttk(Xk-x{k\k-l)-\-Khyk.
Составим разность Xh—x{k\k) = {E—КйНй) (х^—х(Л|Л—1)) +
-\-KhVk. Используя определение корреляционной матрицы и
априорные данные дискретного фильтра Калмана, получим
соотношение (3.180). Представление P{k\k) в виде (3.180)
соответствует применению в линейном фильтре произвольного
коэффициента усиления Кй. В частном случае, при Kk, зада-
78
ваемом соотношением (3.8), равенство (3.180) превращается
в (3.9). Указанный способ позволяет сохранить положительную
определенность P{k\k), но требует увеличения объема
вычислений в сравнении с фильтром Калмана. Он не является, однако,
способом извлечения корней квадратных из матриц.
Рассмотрим последовательно алгоритмы Поттера, Эндрюса
и Карлсона, которые чаще других из указанных выше
модификаций фильтра Калмана используют в технических задачах.
Задача 3.17 (Алгоритм Поттера). Дано:
1. Модель системы
Хк=Ф{к\к-1)х^-1. (3.181)
2. Модель измерений
Уй=НйХй+Уй; Yft —скаляр. (3.182)
3. Априорные данные:
Vft^iV(0, Rft); cov(Vft, v/)=Rft6ftj;
Xo-iV(xo, Po); cov(Vft, Xo)=0. (3.183)
Доказать. 1. Алгоритм экстраполяции значений x{k\k—
-l)=M(xft, y*-ii) и P(^fe|^fe-l)=cov(Xft, x.iy-ii):
х(^^|^^-1) = Ф(Л|^^-1)х(^^-1|^^-1); (3.184)
8(^^|^^-1) = Ф(Л|^^-1)8(^^-1|^^-1); (3.185)
Р{к\к—1)=8{к\к-1)8Цк\к—1). (3.186)
2. Алгоритм фильтрации значений x{k\k)^M{Xh\Y''i) и
R(*|ft)=cov(Xft, x,|y*i):
x{k\k)=x{k\k-l)-\-Kk{yk-HMk\k-l)); (3.187)
Kft=aftS(*|*-l)Fft; (3.188)
s(*|^fe)=s(*|*-l) {E—akykFkF\); (3.189)
P{k\k)=s(k\k)s''(k\k), (3.190)
где
F, = sT(ft|ft_l)HV, (3.191)
aft=(F-,Fft+Rfe)-i-скаляр; (3.192)
Y, = (l+1/R,a,)-'; T*>0. (3.193)
Доказательство. Используя соотношения (3.7) —(3.9) и
(3.29), (3.30) применительно к моделям системы и измерений
(3.181), (3.182), получаем дискретный алгоритм Калмана
х(^^|^^-1) = Ф(^^|^^-1)х(^^-1|Л-1); (3.194)
Р(^^|;Ь-1) = Ф(^^|^^-1)Р(^^-1|^^-1)ФМ*|*-1); (3.195)
x{k\k)=x{k\k-\)-\-Kk{yh-i\hx(k\k-l)); (3.196)
79
Kk = Pik\k-l)H\(H,P(k\k-\)ll\+Rk)-'; (3.197)
P(^|^) = (E-KftHft)P(^|^-l). (3.198)
Согласно теореме о существовании квадратного корня из
симметричной положительно определенной матрицы [62], для
корреляционных матриц Р(^|^) и P{k\k—1) соответственно
существуют неособенные матрицы s(^|^) и s(^|^—1), такие,
что возможно следующее представление:
P(^^|^^)=s(^|^)s^(^|^);
Р(^|^^—l)=s(^|^^—l)s^(^^|^—1). (3.199)
Преобразуем соотношения (3.195), (3.197) и (3.198) с
использованием (3.199) к иной форме.
Сначала подставим (3.199) в (3.195), получим
8(^1^-1)8^(^1^-1) =
= [Ф(^|^_1)8(^-1|^-1)][Ф(^|^-
-1)8(^-11^-1)]^. (3.200)
Отсюда непосредственно следует соотношение (3.185).
Подставим (3.199) в (3.197):
Kfe = 8(^|^-l)8^(^|^-l)HTft(Hft8(^|^-
-l)s^k\k-l)H\+Rk)-'. (3.201)
Введем обозначения
F^=8-(^|^-1)HV, (3.202)
ak= (HkS(k\k-\)s^k\k-l)H'k+Rh)-' =
= {F\F„+R,)-^, (3.203)
где Oft — число.
Тогда соотношение (3.201) примет требуемый вид (3.188).
Наконец, подставим (3.199) и (3.188) в соотношение (3.198).
Учитывая (3.202), находим
8(^^|^^)8Т(^|^)=8(^|^^—1)8''(^|^—l) —
-aft8(^|^-l)FftHft8(^|^-l)8T(^|^-l)=
= 8(^1^—l)[E-aftFftFM8^(^ 1^—1). (3.204)
Пусть ук — неопределенный множитель, который обеспечивает
представление
E-ahFkF\= {Е-ануkPhP'^h) {Е-анун^кР^кУ. (3.205)
В этом случае из (3.204) и (3.205) непосредственно следует
(3.189).
80
Остается только найти положительный неопределенный
множитель ун- Раскроем соотношение (3.205):
E-aftFftFTft= E-2aft7ftFftF'ft+
или
aft(FT,Fft)v'ft-27ft+l = 0. (3.206)
Равенство (3.206) —квадратное уравнение относительно
неизвестного множителя ук- Найдем корни этого уравнения:
Y,=(l ±Kl-a,(F.T,)/a,(F.T,). (3.207)
Из (3.203) следует
FTftFft=l/aft-Rft. (3.208)
Подставляя (3.208) в (3.207), получаем
Yft = (1 ± ГЖ)/(1 - a,R,). (3.209)
Так как по предположению ук>^, то в (3.209) необходимо
выбрать один знак
Y, = (1-Г^)/[(1-КЖ)(1 +Г^)] = (1 + V^K)r\
тем самым равенство (3.193) доказано. А
В силу равенств (3.186) и (3.190) достоинством метода Пот-
тера является гарантированное обеспечение неотрицательной
определенности матриц Р(^|^—1) и Р(^|^). Другим
преимуществом метода Поттера является то, что обусловленность
s(^|^—1) и s(^l^) в общем случае лучще, чем ^{k\k—1) и
Р(^|^). Последнее обстоятельство можно количественно
проиллюстрировать путем исследования условных чисел N{k),
определяемых соотнощениями
yV(A)=Xmax/Xmin, (3.210)
где Ятах и Xmin — соответственно максимальное и минимальное
значения матрицы А. Здесь под матрицей А будем понимать
матрицы Р(^|^—1) или Р(^|^).
Как известно [21], квадратным корнем из матрицы А
называют невырожденную матрицу В, такую, что А^В^-В или
В = Т
i^-5:L°_lr
где Т — ортогональная матрица; "ki — собственные числа
матрицы А (г=1, 2 п).
Поэтому
N{E) = VK.JKin- (3.211)
Из (3.210) и (3.199) следует, что
N{k) = [N{'u)Y. (3.212)
6—6899 81
Таким образом, условным числом матрицы В является
квадратный корень из N(A).
Посмотрим, как условное число N(A) может быть
использовано для исследования вычислительных операций с
корреляционными матрицами. При вычислении в десятичной системе
счисления с / значащими разрядами численные трудности из-за
округления результатов возникают тогда, когда ^(А)
приближается к 10'. Фильтр же Поттера может работать со
значениями yV(B) = 10' или N{A)^W. Таким образом, происходит
удвоение точности работы фильтра, использующего квадратные
корни для плохо обусловленных задач.
Недостатком алгоритма Поттера является то, что он
применим к обработке только скалярных измерений, а модель
системы не содержит шумов, поэтому последующие исследования
были направлены на преодоление указанных недостатков
алгоритма Поттера при сохранении его достоинств. Разумеется,
если в каждый момент времени выборка содержит несколько
некоррелированных измерений, то матрица R^ — диагональна, а
модель системы не содержит шумов, тогда метод Поттера
можно применять, последовательно обрабатывая скалярные
измерения, составляющие векторное измерение. Эндрюс [ПО]
предложил выполнить диагонализацию Rft за счет перехода к новым
измерениям:
у1= Rr'^Vft. (3.213)
Считая (3.182) векторным измерением, составим модель,
описывающую измерение у^:
у, = RT''' (Н,х, + V,) = Rft-'^'H.x, + Rr'4. (3.214)
Тогда
cov(Rr^4. Rr'4) = Rr'^Rr'^^ = Е.
поэтому составляющие вектора Ук можно обрабатывать
последовательно алгоритмом Поттера, в котором вместо строки
Hft используются соответственно строки матрицы R~^^\llh-
Эндрюсом [ПО] также был предложен алгоритм обработки
векторных измерений, не требующий процедуры диагонализа-
ции и отсутствия шума в модели системы.
Задача 3.18 (Алгоритм Эндрюса). Дано:
1. Модель системы
Х1,= Ф{к\к-1)хк-1+^к-1. (3.215)
2. Модель измерений
yft=HftXft+Vft. (3.216)
82
3. Априорные данные:
Va~A^(0, Rft); w,~yV(0, Qft); (3.217)
Хо~Л^(0, Po);
COv(Vft, V/) =C0v(Vft, Wj) =COv(Vft, Xo) =
= cov(w/, Xo) =0, кФ1.
Доказать: 1. Алгоритм экстраполяции значений х(^|^—
-l)=M(x,|y*-ii) и P(^|^-l)=cov(x,, Xftiy'-'i):
х(^|^_1) = Ф(^|^-1)х(^^-1|^^-1); (3.218)
ф^=ф(^|^_1)8(^-1|^-1); (3.219)
sik\k-l) = [(pkVk+QhV'^; (3.220)
P(^|^-l)=s(^|A-l)s^(^|^—1), (3.221)
где s(^|^—1) —нижняя треугольная матрица.
2. Алгоритм фильтрации значений x{k\k)^M(Xk\Y''i) и
P(^|^)=cov(Xft,Xft|y*i):
x(k\k)=x(k\k-\) + Kk(yk-ilMk\k-\)); (3.222)
Kk=s(k\k-l)Fk(G^k)-'Crh; (3.223)
s(^|^)=s(^|^-l)[E-F,(GT,)-i(G,+
+ Bft)-iFM; (3.224)
P(^|^)=s(^|^)s^(^^|^), (3.225)
где s(^l^) —нижняя треугольная матрица;
F4=sT(^|^-l)HTft; (3.226)
G,= [F-ftFft+Rft]'/2; (3.227)
Bft=Rfti/2. (3.228)
Доказательство. Соотношения фильтра Калмана в данном
случае имеют вид (3.194), (3.196) —(3.198) и
Р(^^|^^-1)=Ф(^|^—1)Р(^—1|^—
-1)Ф^(^|^-1)+0ь (3.229)
Выразим корреляционные матрицы Р(^|^) и Р(^|^—1)
соответственно через неособенные нижнетреугольные
матрицы Sk и Sft_i:
P(^^|^^)=S(^|^)ST(^|^); Р(^|^-1) =
= s(^|^-l)sT(^|^-l). (3.230)
Подставим (3.230) в (3.229):
8(^^|^-1)8Т(^|^-1) = (Ф(^|^-1)8(^-1|А;-
-I)) {Ф(к\к-1)8{к-1\к-1)У+а>.. (3-231)
6. 83
Обозначив
фА=Ф(^|^-1)8(^-1,|^-1), (3.232)
придадим равенству (3.231) иной вид:
s{k\k-l)s^k\k-l)=(pk(p''k+Qk-=
= (ФАФ^А+Ой) ''2(фаФ^а+0а) '/2. (3.233)
Извлечение квадратного корня из матрицы выполняется
методом Чолеского (П. 19), (П.20). Из (3.233) непосредственно
следует (3.220). Таким образом, справедливость алгоритма
экстраполяции (3.218) —(3.221) доказана.
Получим теперь новое выражение для коэффициента
усиления фильтра. В соотношение (3.197) подставим (3.230). Вводя
обозначения (3.226), (3.227), находим
Kk = s{k\k-l)s^k\k-l)H\(HkS{k\k-\)s^(k\k-l)H\+
+ Rft)-' = s(^|^-l)Fft(GM-iG-ift. (3.234)
Это и есть требуемое равенство (3.223).
Преобразуем, наконец, соотношение (3.198) для
апостериорной корреляционной матрицы, подставив в него (3.230) и
(3.234):
s(^^|^^)sT(^|^)=s(^|^^-l)[E-
-F,(G-,)-^G-\F-,]s^k\k-\). (3.235)
Чтобы представить выражение в квадратных скобках в виде
произведения некоторой матрицы на транспонированную,
выполним несколько предварительных вычислений. Рассмотрим
произведение
(Gft+Bft) (Gft+Bft)-=Gft(Gft+Bft)^+
+ (Gft+Bft) GTft+ (BftBT.-GftGM. (3.236)
Если Bft = Ri/2ft, TO с учетом (3.227)
B,BT,_GftGT,= Ri/2ftRi/2,-FT,Fft-Rft=-F-ftFft. (3.237)
Подставим (3.237) в (3.236), тогда
(Gft+B,) (G,+Bft)T=G,(Gft+B,)T+
+ (Gft+Bft)Gft-F^Fft. (3.238)
Единичную матрицу с учетом (3.238) запишем в виде
Е= (G,+B,)-4G,+ Bft) (G,+B,)T((Gft+Bft)T)-i =
= (Gft+Bft) -1 [ Gft (Gft+ Bft) -+ (Gft+ Bft) G\-
-FTftFftJ ((G,+B,)-)-'= (G,+ B,)-iGft+G\((Gft+
+ Bft)T)-i_(Gft+Bft)-iFTftFft[(Gft+Bft)Tj-i. (3.239)
84
Преобразуем выражение в квадратных скобках (3.235),
учтя (3.239):
E-Fft(GM-'G-4Fft- = E-Fft(G-ft)-i[Gft+Bft)-iGft+
+ GTft((Gft+Bft)^)-i-(Gft+Bft)-TTftFft((Gft+
+ Bft)T)-i]G-4FTft=[E-FftGT-i,(Gft+B,)-iFM[E_
-FftGT-ift(Gft+Bft)-iFVjT. (3.240)
Подставив (3.240) в (3.235), получим требуемое
соотношение (3.224). Л
Недостатками алгоритма Эндрюса являются:
1. Потеря матрицей s(^|^) треугольного вида при
использовании соотношения (3.224). На каждом шагу вычислений
необходимо эту матрицу возводить в квадрат, а затем
извлекать квадратный корень из матрицы s(^|^)st(^|^) методом
Чолеского (П. 19) и (П. 20). Такая процедура позволяет
восстановить треугольный вид матрицы s(^|^).
2. Увеличение необходимого объема памяти ЦВМ и
количества вычислений по сравнению с калмановским фильтром.
В том случае, когда обрабатываются скалярные измерения,
удается создать рекуррентный алгоритм, который обладает
достоинствами алгоритма Эндрюса, но имеет существенно
меньшие требования к объему памяти и быстродействию
ЦВМ.
Таким алгоритмом является алгоритм Карлсона.
Задача 3.19 (Алгоритм Карлсона). Дано:
1. Модели системы и измерений задаются соотношениями
(3.215)-(3.217).
2. Измерения у^ — скалярные.
Доказать: 1. Алгоритм экстраполяции задается
соотношениями (3.218) —(3.221) при условии, что s(^|^—l)^s —
верхнетреугольная матрица.
2. Алгоритм фильтрации значений x(k\k)^M(Xh\Y^^l) и
P(^|^)=cov(xft, Xfciy^i) имеет вид
x(k\k)=x(k\k-l) + Kk(yk-Hkx(k\k-\)); (3.241)
Kft=bwr'n; P(^|^)=ss^ P(^|^-l)=ssT, (3 242)
где
s = [Si sj; Si = [Sii 5„, 0, ..., Of;
s=[Sb...,s„]; Si[sii,...,su, 0, ...,0]'';
Si^SiOii—bi-iCi или
85
'/.i =
Зцйц, если I = /;
SttOti— bj, i_iCi, если i > /;
0 , если i</; г, / = 1, /г; (3-243)
Ь, = [Й1,-, b2i,...,bii, 0 0];
bi^b,-i+s,Fi; г^1,/г; bo^O; или
StiFi, если г^/;
*л г = Ь}_ t-i + SjtFi, если i </;
О, если «'■</, г, / = 1, л или i = 0; (3.244)
Р=[Л, ^2 РпГ=8-Н-;
Ч-1\ 1/2
(Рг-1РГ')
А = ||ая11= —/^'^Сг,
если г = /;
если «>/; г, /= 1, п;
если «'■</;
(3.245)
(3.246)
Доказательство. Условие данной задачи почти полностью
совпадает с постановкой задачи для построения алгоритма
Эндрюса. Отличие состоит только в том, что здесь измерения
Ук скалярные, поэтому алгоритм экстраполяции, в который в
явном виде не входят измерения у^, должен задаваться теми
же соотношениями (3.218) — (3.221), что и в алгоритме
Эндрюса. Причем Карлсоном было предложено использовать вместо
нижнетреугольных матриц s(^—1|^—1) и s(^|^—1)
верхнетреугольные. Однако, это обстоятельство не приводит к
изменению структуры алгоритма экстраполяции.
Перейдем к построению алгоритма фильтрации. Поскольку
алгоритм Карлсона — частный случай алгоритма Калмана, то
соотношение (3.241) очевидно. Требуется найти лишь новое
представление для коэффициента усиления Kh и
корреляционной матрицы Р(^|^). Будем искать Р(^|^) и P(k\k—1) в виде
P(^|^)=ss^ и P(^^|^^-l)=ss^ (3.247)
где S и S — верхнетреугольные матрицы:
S =
О
О
'12
О
'13
^1п
_L0 о о
— 1^11 Sj, Sj S„jj
(3.248)
86
s,- — столбцы матрицы s.
Аналогично
s=[s7, s;,...,s~]. (3.249)
Временные аргументы опущены для простоты записи.
Проведя преобразования Kk и Р(^|^), аналогичные
(3.199) —(3.204), выполненным при построении алгоритма Пот-
тера, получим
Kk=P(k\k-l)H\(HkP(k\k-\)H\+Rk)-' =
=iasF; (3.250)
a=(HftP(^|^-l)H-ft+R,)-i=(F-F+R)-'; (3.251)
F=sTHT; (3.252)
's=s[E-aFF^]i/2=s^; (3.253)
A=[E-aFF^]i/2, (3.254)
где A —верхнетреугольная матрица.
Получим рекуррентную форму для расчета а~'. Вектор F
имеет компоненты
F=[Fu F2,...,F„]\ (3.255)
Подставим (3.255) в (3.251):
отсюда следует
Ро=/?; Pi = Po+^i; Р2=Р1+Я2; ... '
а-'=|р„=|Рп-1+Я„. (3.256)
Итак, рекуррентное соотношение для нахождения а~'
имеет вид
a-'=iPn;
P/=Pi-i+^'/,/=1, 2 п;
Ро=/?. (3.257)
Получим в явном виде соотношения для нахождения
элементов матрицы А. Для этого представим АА'' в двух видах.
Во-первых,
АА^ =
87
«11
0
0
0
«12 «13 •
«М «23 •
0 «33 •
0 0..
.. «!„"
• «а«
•• «зп
• «п«^
"flu 0 0
«12 «22 0
«13 «2, «,3
_«1п «2/1 «ЗЛ •
.. 0
.. —
.. 0
•• «лл
• + «1ла2л--а,А
Во-вторых, используя (3.254),
-af/, \-aF\...-aF,F,
aln
AA^ = E —aFF* =
_—aFjF„ —af/„ ... l—aF„'^
(3.258)
(3.259)
Приравнивая соответствующие элементы матриц (3.258) и
(3.259), начиная с последнего, получим с учетом соотношений
(3.257) следующие выражения для элементов матрицы А:
а,-,= [р,_,/р,]1/2;
а
п-
-—ffCr, С, = /,/(Р,-,р,)'/2,
(3.260)
(3.261)
«■=1, 2,...,п; /=1, 2,...,п; г>/.
В силу соотношений (3.260) и (3.261) матрица
А =
*и
о
О
О
а„ О О
О а,, О
О О а„
«22
О
О
-F с
Азз
О
-F с
о
о
о
о о о ... с
-о F. F, ... F,
О О F, ... Z^',
0 0 О ... F,
0 0 0
О
О О
О О
О
О
О
0 0 0
(3.262)
Преобразуем (3.253) к форме, позволяющей вычислять
столбцы матрицы s. Используя (3.248), (3.249) и (3.262), пред-
88
ставим равенство (3.253) в следующем виде:
[Si, Sj, S3, ..., S„J = [Sj, 85, S3, ..., S„J
«11 0 0 ... 0
0 a,, 0
0 0 a„
0
0
1*1) *2) *3' ••■> ^nj
0 F, F, ... F,-
0 0 F, ... F,
0 0 0 ... f.
0 0 0 ... a„
"Ci 0... 0
0 c, ... 0
0 0 0
0
0 0
= [Siflii, s,a„, ..., s„a,,„] — 0, s^, s^F^ + s/,
1=1
"Ci 0 ... 0
0 с,... 0
О о ... с„
(3.263)
Введем следующее рекуррентное соотнощение:
Ьо=0; b,=b,_i+Sif,-, г=1, 2,...,/г-1. (3.264)
Тогда с помощью (3.263) и (3.264) получим соотношение
для расчета столбцов матрицы s:
Si=Siau—bi-iCi, t= 1, 2,.., п. (3.265)
Учитывая, что столбцы s,- и b,_i имеют вид
Si=[sii, S2i,...,Sii, 0,...,0]'';
Ь,_1 = [Й1,,-_ь...,й,-1,,-ь 0,...,0]^ (3.266)
из (3.265) получаем требуемое соотношение (3.243) между
элементами корреляционных матриц s и s. Соотношение (3.264)
при этом примет вид (3.244).
Наконец, преобразуем соотношение (3.250) для
коэффициента усиления
-Pi
F..
К^ = asF = a[Si, Ss, .... s„]
^.Fn.
SjFj.
(3.267)
89
Поскольку в силу (3.264) 2 8,-/'г=Ь„, получаем соотноше-
1=1
ние
Kft=b„/ip„. А
3.8. Фильтрация при наличии аномальных измерений
До сих пор при синтезе алгоритмов оценивания вектора
состояния X; динамической системы предполагали, что в выборке
непрерывных или дискретных измерений (У\ или Y^^l)
содержится информация об оцениваемом векторе xj и полностью
известны статистические характеристики погрешностей измерений
и шумов динамической системы. При решении же
практических задач радиолокации, связи, навигации и управления
встречаются случаи, когда обычный механизм образования
данных измерений нарушается и возможно появление
измерений, не содержащих информации об оцениваемом векторе
состояния x^ Такие измерения называем аномальными.
Аномальные измерения могут возникать, например, в
следующих ситуациях: 1) пропуск измерений, что типично для
радиолокационных задач; 2) появление ложных измерений при
отклонении от штатной ситуации внешних условий, в которых
работают измерительные устройства динамического объекта.
Эта ситуация типична для задач навигации и локации; 3)
возникновение перемежающихся неисправностей, приводящих к
изменению статистических характеристик измерений. Подобная
ситуация наиболее характерна для задач связи.
Использование алгоритмов оценивания, не учитывающих
возможность появления аномальных измерений, может
привести к значительному смещению оценки в задачах навигации и
срыву сопровождения объекта в радиолокационных задачах.
Из множества задач оценивания, решаемых по выборке
нормальных и аномальных измерений нарастающего объема,
для данного раздела отберем только две, в которых будет
предполагаться, что известно априорное статистическое описание
скачкообразного процесса, входящего в модель измерений, но
построение оценки самого скачкообразного процесса не
требуется.
Задача 3.20 (Фильтрация при независимых значениях
переменных переключения). Дано:
1. Модель системы
x^+i = 0(k+l\k)Xk+r(k+l\k)Wk+ak. (3.268)
2. Модель дискретных измерений
yk=Ah+yhHkX,+BkVk. (3.269)
90
3. Априорная информация:
Хо~Л^(х(0|0),Ро); v/k-N(Q; Q^; Vk-N(Q; R^);
cov(Wft, w/) =Qft6ft/; cov(Vft, Vj) = Кйб«;
cov(Wft, V/) =cov(xo, Wft) =cov(xo, Vk) =0;
k, /=1, 2...;
fl с вероятностью q^;
\0 с вероятностью I — ^^
Yft — не зависит от Xq, w^, v^ и Yj, /t^^-
(3.270)
Yft =
(3.271)
Доказать: 1. Алгоритм фильтрации задается
рекуррентными соотношениями
(3.272)
x{k\^k)=x(Щ-l) + Kk(Уh-^k-qhl^kX(k\k-\))■
Kk = qkP(k\k-l)Wk[qhilk(qkP(k\k-\) +
+ {l-qk)s{k\k-l))H^k+BkRkb\]-'; (3.273)
P(k\k) = {E-q,\Hk)Pik\k-l); Р(0|0) = Ро. (3.274)
2. Алгоритм экстраполяции задается соотношениями (3.29),
(3.30) и
8(^+1|^)=Ф(А!+1|^)8(^|^)Ф^(^+1|^) +
+ r(^+l|^)QftP(^+l|^) (3.275)
при s(0|0) = Po+x(0|0)xT(0|0),
где
s(k+l\k)=Mxy[Xh+iX\+i\Yki\.
Доказательство. В данной задаче по выборке измерений Y^i
требуется найти оценку первой компоненты вектора состояния
{Xft, ук}- Вторая компонента yk является мешающим
параметром и оценке не подлежит. Так как выполнены условия (3.270)
и (3.271), то для одношаговой процедуры оценивания
применима теорема о нормальной корреляции. Обозначив
= х(^|^-1);
М,,[{х,.- X (к I к)) (X, - X (^ I к)У I У,*] = Р (^ I ^). [ (3.276)
М^.^[{х,-х{к\к-1)){х,-х{к\к-1)У\У,'-'] =
= P(k\k-iy,
M,y[yk\Y>^-h]=yik\k-l); (3.277)
91
M,y[(Xk-x(k\k-l)){y,-y{k\k-l)y\Y>^-h] =
= Pxyik\k-l); (3.278)
M.ЛiУ>^-У(k\k-l))(y,-y(k\k-l)У\Y>^'\] =
= Руу{к\к-1), (3.279)
запишем соотношения (2.36) —(2.38) в обозначениях данной
задачи
х(^|^) = х(^| ^-1) + К,(у,-у(^И-1)); (3.280)
К, = Р,,(^1^-1)Р7; (k\k- 1); (3.281)
Р(^ I ^) = Р(^ I k—\) — %Ply(k I k- 1); (3.282)
заметив, что
Myk=qk-\ + {\—qh)-Q=qk; (3.283)
My\=q,-l^+(l-qk)-Q=qk, (3.284)
вычислим отдельно величины у(^|^—1), Pxy(k\k—\) и
Pyy(k\k—\). Используя соотношения (3.269), (3.277), (3.283)
и условие (3.271), будем иметь
y{k\k-l)=M^y[ykHkXk+Ъ,Vk\Y'^-h] =
=qkilkX(k\k—\); (3.285)
yk-yik\k-l)=Hk[ykXk-qh^{k\^-l)]+^hyh. (3.286)
Подставляя в (3.278) и (3.279) значение у/.—у(^|^—1) из
выражения (3.286) и учитывая (3.270), (3.271), (3.283) и
(3.284), определяем
Рху{к\к—1) =Mxy[{Xk—x(k\k—l)) (yhXk—
-qkXik\k-l))-H\+{x,-x{k\k-l))v-kB^k\Y^-\] =
=qkP(k\k-l)H\; (3.287)
Pyy (^1^—1) = HhMxy [ (ykXk—qhX (^1^—1)) (YftXft—
-qkX(k\k-i)У\Y^^-\]H\+ЪkKkЪ\=HkMxy[(yk(Xk-
-x(k\k-\)) + {yk-qk)x(k\k-\))(yk(xk-x(k\k-l)) +
+ (yk-qk)x(k\k)У\Y^^-']H'k+ЪkRhЪ'k=
= Hk{P(k\k-l)+qk{l-qk)x(k\k-\)x(k\k-\y}H-k+
+ BftR4B^ft. (3.288)
Заметим, что P(^^|^^—1) =s(^|^—1)—x(^^|^—1)хт(^|^—1),
где s{k\k-l)=MxyiXkX\Iy-i 1).
Подставим значение x(^|^—1)хт(^|^—1) =P(^|^—1) —
—s(^|^—1) в равенство (3.288), после элементарных
преобразований получим соотношение
Pyyik\k-l)=qkHk(^kP(k\k-l) + il-qk)sik\k-
-l))H-ft+B,R,Bv (3.289)
92
Подставляя значения у(^|^—1), Pxy(k\k—l) и Pyy(k\k—l),
задаваемые соотношениями (3.285), (3.287) и (3.289), в
соотношения (3.280) —(3.282), находим доказываемые равенства
(3.272) —(3.274).
Поскольку параметр ук не входит в соотношение (3.268),
вывод алгоритма экстраполяции для значений х(^+1|^) и
Р(^+1|^) полностью совпадает с получением соотношений
(3.29) и (3.30). Рекуррентное же соотношение (3.275)
непосредственно следует из (3.268) и (3.270) при использовании
определения матрицы s(^+l|^). А
Задача 3.21 (Фильтрация при постоянных значениях
переменных переключения на интервале наблюдения). Дано:
1. Модели системы, дискретных измерений и априорная
информация (3.268) —(3.270).
2. Y^ = Y=P. с вероятностью q; ^3.290)
[О, с вероятностью 1 — q;
Y = const, у—-не зависит от х^, w^, v^.
Доказать: 1. Алгоритм фильтрации значений х(^|^)^
=M(Xh\Y'^l) и P(^|^)=cov(x4, Xfciy^i) имеет ВИД
X (^ I ^) = X (^ I ^ - 1) + К, (у, - Н,х {k I k - 1) - А,); (3.291)
К, = ^Р (^ I ^- 1) Н,^ IН, (^Р (^ I ^ - 1)) Н,^ + B,R,B/]-';
(3.292)
Р (^ I ^) = (Е -К,Н,) P{k\k-l) + {l-q) K,H,s,; Р (010) = Р„.
(3.293)
2. Алгоритм экстраполяции значений x{k\k—1)^
=M(Xft+,|y^).
P(^+li^)=COv(Xft+b Xft+i|y*i) HS(^+1|^) =
=M[Xft+b x^ft+iiyM
задается рекуррентными соотношениями (3.29), (3.30) и
(3.275).
Доказательство. Предоставляем читателю выполнить
самостоятельно с использованием теоремы о нормальной
корреляции или непосредственно на основе минимизации
квадратичного функционала
МхМу [ (Xft+i —Xft+i) ТА (Xft+i —Xft+i) ],
где Xft+i —оценка вектора состояния х^+ь А — положительно
определенная весовая матрица.
ЭЗ
Исследование на конкретных примерах алгоритмов
оценивания, полученных в задачах 3.20 и 3.21, показывает, что
оценки х(^|^) существенно зависят от априорных допущений,
принятых для вероятности qh, с которой появляется значение yh^
^1. Поскольку на практике обычно характер измерительной
информации не соответствует допущениям относительно
параметра 7*. то это означает, что алгоритмы оценивания (3.272) —
(3.274) и (3.291) — (3.293) оказываются недостаточно
эффективными. Одним из путей улучшения качества алгоритмов
оценивания при наличии в выборке аномальных измерений
является разработка робастных алгоритмов оценивания. Эти
алгоритмы незначительно уступают в эффективности
классическим оптимальным алгоритмам оценивания при точном
выполнении условий оптимальности, но в отличие от них робастные
алгоритмы при малых отклонениях от предположений о
моделях системы или измерений ухудшают качество оценок лишь в
малой степени. В предложенной ниже задаче 3.22 приводится
один из возможных робастных алгоритмов рекуррентной
фильтрации для оценки скалярного случайного процесса по
скалярным измерениям.
Задача 3.22 (Робастный алгоритм Ершова — Липцера).
Дано:
1. Модель системы
Xk+\ = ao(k) +«1 (k) Xh+a2 (k) yk+Wkui.
2. Модель измерений
yu+i=Aoik)+Ai{k)Xh+A2ik)yk+
-Ь(1—Kh+i) V k+i+Kh+iBh+i.
3. Априорные данные и начальные условия:
Шй+1-'Л^(0, Qk+i); Vk+i^N(Q, Rh+i);
8ft+i~A^(0, Dk+i); Xo^N{xo, Po);
(3.294)
(3.295)
cov
■(
.0
0
D
I
k.
'Wj'
^kj.
r
■>kh
cov
[::]■[:;]
(a.296)
где bkj — символ Кронекера;
случайные величины "kk принимают независимые значения О
или 1; последовательность {{"kk); k^\, 2,...} и гауссовская
случайная величина Хо не зависят от {(ш^), \vh), {zh), k^\,
2,...} и г/о-
94
4. Дополнительные ограничения — алгоритм оценки
параметра Kk+i задается в следующем виде:
Я4+1 = ^' "Р" I ^ft+i I >^ (^. «) (3.297)
'о, при |Л,+1 |<с(^, а),
где
Ah+i=yk+i—Ao(k)—Ai(k)nk—A2(k)yk; (3.298)
Пк+1 = ао(к)+щ(к)Пк+а2(к)ук; По=Хо. (3.299)
При априорно известном значении а константа с {к, а)
—решение уравнения
P{\Ah+i\>cik, a)\Kk+i = 0)=a. (3.300)
Доказать, что условное математическое ожидание
^ik\k)=MiXk\Y''u 'K''i=K'i)
и условная корреляционная матрица P(^]^)^cov(-'<^ft, х^] У1^Д1*^
^X*i) удовлетворяют следующим рекуррентным
соотношениям:
+\K,+iiyk+i-^oiky-AAk)^{k I k)-A,ik)y,y: (3.301)
P {k:+ 1 I * + 1) = a,= (k) P [k I k) + Q, - K,+, [(1 -\^,) C, +
+ a,{k)P{k\klA,{k)]- (3.302)
ic,+i='[(i-v,)c,«+«i(*)A'(^ I k)Mmm-X+iWk +
+ X,,^,D,\VA^{k)P{k\k)\,] (3.303)
где.х(0|0) = :^„ ?(0|0)=:Po.
Доказательство справедливости соотношений (3.301) —
(3.303) предлагается провести читателю самостоятельно с
использованием соотношений (3.109) —(3.116), выбрав в качестве
оценки "kk значение "кн-
Предлагается также, используя (3.244) —(3.296), (3.298) и
(3.299), показать, что функция распределения P{\Kh+\\^
^c(k, a)|Xft+i=0) является гауссовской и имеет параметры
(О, A^i{k)rk+Rh), где Гк=М(Хк—Пк)'^ определяется
рекуррентным соотношением Гk+i^cfiiik)Гk-{-Qh; Го^Ро-
Количественный анализ точности работы робастного
алгоритма можно провести с позиций теории чувствительности,
поскольку соотношения для оценок x(k\k) и x{k\k)^M(Xk\Y''i,
X*i), P{k\k) и Р{к\к) =cowiXk, XklY^u X*i), где K^^,= (Xu■■■
95
...Да), имеют идентичную структуру и получаются заменой в
(3.301) — (3.303) величин Хи на Kk. С качественным анализом
робастного алгоритма можно ознакомиться в [35], где на
числовом примере проведено сравнение точности работы
робастного алгоритма с алгоритмами, как не учитывающими наличия
аномальных измерений, так и учитывающими их с априорным
предположением, что P(Kk^l),^qk- В обоих случаях робаст-
иый алгоритм обладает лучшей точностью при наличии в
выборке аномальных измерений.
Пример 3.1. В некоторых частных случаях удается
установить взаимосвязь между оптимальными в среднеквадратиче-
ском смысле оценками в задаче рекуррентной фильтрации и
оценками, получаемыми методом стохастической
аппроксимации. С этой целью найдем асимптотические соотношения для
дискретной калмановской фильтрации при неограниченном
увеличении числа измерений.
Дано:
1. Модель дискретных измерений
yft = Hx+v^, (3.304)
где Н — матрица размерности (тХп); х — неизвестный
«-мерный вектор.
2. Априорная информация:
Vft~yV(0, R); cov(Vft, \,) = ШкУ, (3.305)
хо~Л^(хо, Ро); cov(xo, Vft)=0.
Существуют обратные матрицы:
(НРоН^)-! при тфп и Н-1 при т=п.
Доказать: 1. Условное математическое ожидание
х,= М{х\ У,*) = х,_, + Ро^^ (^HP„№+R)-' (у* -
-Hx,_i); х„=х„. (3.306)
2. Асимптотические формулы для нахождения х^ при k-^схз
имеют вид: при тфп
^*=x,_, + (l/^)P„№(HPoFf)-'(y*-H^,_i); (3.307)
при т^п
Xft= Х4_1 + (1/^) Н-' (у4 — Hx4_i), или
X, = ^-'2 Н-'у*- (3-308)
1=1
Доказательство. Запишем (3.304) в следующем виде: x^+i^
^Xft; yft^Hxft.
96
Тогда соотношения (3.7) —(3.9), (3.29), (3.30) и (П. 26)
при обозначениях Р^=Р(^|^) =Р(^|^—1), Xft=x(^|^) =
^x{k\k—1) принимают вид
^, = x,_i + K,(y*-Hx,_.i); (3.309)
Kft=Pft-iH^(HPft_iH^+R)-i = PftH^R-b (3.310)
Pft=(E—KftH)Pft-i. (3.311)
Из (3.310) непосредственно следует, что
Кй=Ка_1(НКа-1 + Е)-1:=Ко(^НКо+Е)-1. (3.312)
Подставляя (3.312) в (3.309), получаем искомое
соотношение (3.306). Из (3.312) нетрудно видеть, что асимптотические
значения коэффициента усиления Ка при k-^oo могут быть
записаны в следующем виде:
припфт Kft=A;-iPoH^(HPoH^)-i;
при п^т Kft^^~'H-i.
Поэтому, используя (3.309), сразу получаем (3.307) и
(3.308). А
Найденные алгоритмы (3.306) —(3.308) имеют следующие
особенности:
1) для нахождения оценки х^ не требуется вычисления
корреляционной матрицы Pft при помощи соотношения (3.311);
2) асимптотические оценки сходятся к оптимальным при
^->-оо;
3) асимптотическая оценка (3.308) не требует знания
значения начальной корреляционной матрицы Pq.
Пример 3.2. Рассмотрим построение оптимального
непрерывного стационарного фильтра для оценивания скалярных
случайных процессов по скалярным измерениям. Предполагается,
что оцениваемые и измеряемые процессы описываются
стохастическими дифференциальными уравнениями. Интенсивности
возмущающих шумов в моделях системы и измерений неизвестны,
а задано лишь их отношение.
Дано:
1. Модель системы
dxt=btdvft, f^to. (3.313)
2. Модель измерений
dyt=Xtdt+Btdvt. (3.314)
3. Априорная информация:
{у/Л и {v;} — стандартные процессы броуновского движения
[60];
Ь; и Bi — неизвестны, но известно отношение b^/Bj (Bt#0).
7—6899 97
Доказать: что стационарное условное математическое
ожидание х(^ 10 =Af[xt|y'(o] удовлетворяет уравнению
dx(t\t)=btb-4[dyt-x(t\t)dt]. (3.315)
Доказательство. Калмановские уравнения (3.37) —(3.40),
описывающие оптимальный непрерывный фильтр,
применительно к исходным моделям системы и измерений (3.313) и
(3.314) имеют вид
dx{t\t)=P{t\t)B-2t[dyt-x(t\t)dt]; (3.316)
dP{t\t) l4t=b2f-PHt\t)B-^. (3.317)
Учитывая стационарность процесса х^, из (3.317) находим
P{t\t)=btBt. (3.318)
Подставляя (3.318) в (3.316), получаем искомое уравнение
(3.315). А
Особенностями стационарного решения x(t\t), задаваемого
уравнением (3.315), являются:
1) отсутствует необходимость вычисления на каждый
момент времени t дисперсии Р(^Ю;
2) коэффициент усиления фильтра определяется
отношением btjBt и не зависит от конкретных значений Ь^ и B^
Рассмотрим далее два простых примера для иллюстрации и
сравнения вычислительных особенностей дискретного фильтра
Калмана и алгоритма Поттера при имитации округления
результатов счета.
Пример 3.3. Дано:
1. Модель системы
(3.319)
(3.320)
(3.321)
; Vfc^yV(0, 8=); 8<1.
(3.322)
x,(k+iy
x,(k+\l
■1 0-
.0 1.
■x.iky
.^Л^).
y{k) = [\ 0]
y{k) = \\ 1]
•'ft.
2. Модели дискретных измерений:
■x^{ky
■x,{ky
3. Априорная информация:
+ "ft
xAO)
хЛО)
^N
P 1 • P =
7
1 0
0 1
98
Таблица 3.1
Реализация алгоритма
оценивания
Модель дискретных измерений а
Р (1 I 1)
К,
Р (2 I 2)
Алгоритм Калмана
(точные результаты)
Алгоритм Калмана с
имитацией округления
1 + 6=
[I]
О
1+в2
О 1
[I]
Алгоритм Поттера с
имитацией округления
[::]
2+е2
S(l|l) X
XS41|1) =
[:]
О
. О .
Г]
2
I 1
Реализация алгоритма
оценивания
Модель дискретных измерений б
К.
Р (1 1 1)
К,
Алгоритм Калмана
(точные результаты)
Алгоритм Калмана
с имитацией
округления
2+е!
['■]
[■■]
Алгоритм Поттера с
имитацией округления
[;]
_1_Г1+е2 _1 ■
2+еН —1 1 + е2
т[-\ -\]
4+^4 1 J
S(l I l)ST(i I 1)
1 Г 1 -11
-1 ll
S(l|l) =
2 [-1 iJ'
[I]
99
4. Имитация округления результатов счета:
1+е¥=1; l+e^'-^l при г=1,2... (3.323)
Доказать, что коэффициент усиления Кй оптимального
дискретного алгоритма оценивания и корреляционная матрица
P(k\k) при обработке первых двух измерений (^=1, 2) имеют
значения, представленные в табл. 3.1.
Доказательство. Из соотношений (3.319) —(3.321) следует,
что переходная матрица имеет вид
Ф{к+ I, k) =
[::]
матрицы взаимосвязи оцениваемых и измеряемых параметров
для моделей измерений а) Н(^) = [1 0]; б) Н(^) = [1 1].
Используя соотношения калмановского фильтра (3.8), (3.9)
и (3.30), получаем точные результаты, представленные
в табл. 3.1. Повторяя далее те же вычисления, но с имитацией
округления результатов счета (3.323), находим значения,
приведенные во второй строке этой таблицы.
Воспользовавшись формулами (3.185), (3.186), (3.188) —
(3.193) с имитацией округления (3.323), получим требуемые
значения коэффициента усиления и корреляционной матрицы
для алгоритма Поттера.
Результаты, представленные в табл. 3.1, позволяют
провести сравнительный анализ работы алгоритмов Калмана и
Поттера при имитации округления результатов счета.
Корреляционная матрица Р(1|1) для алгоритма Калмана
с имитацией округления для обоих моделей дискретных
измерений вырождена. Это приводит к нулевым значениям
коэффициента усиления Кг и бесполезности поступающих далее
измерений для улучшения качества оценок.
В то же время алгоритм Поттера дает в обоих вариантах
дискретных измерений не равный нулю коэффициент усиления
Кг, близкий к его точному значению, полученному при
отсутствии имитации округления. Происходит это потому, что в
алгоритме Поттера для вычисления Кг используется
невырожденная матрица S(lll), хотя матрица Р(1|1) [случай б)] может
быть и вырождена. Несмотря на тривиальность приведенных
примеров последние дают достаточно хорошее представление
о преимуществах алгоритма Поттера по сравнению с
алгоритмом Калмана при использовании их в ЦВМ, осуществляющей
округление результатов счета.
Глава 4
Адаптивная фильтрация при параметрической
априорной неопределенности
4.1. Априорная неопределенность н адаптация
Оптимальные алгоритмы оценивания, представленные
в гл. 3, являлись результатом решения соответствующих
модельных задач при наличии полной априорной статистической
информации. На практике же встречаются, как правило, такие
ситуации, в которых априорная статистическая информация
либо известна приближенно, либо полностью отсутствует.
В этом случае условия модельных задач оказываются
нарушенными, полученные алгоритмы оценивания становятся не
оптимальными, а формируемые ими оценки могут стать
несостоятельными и, более того, оказаться расходящимися.
Поэтому нужны иные подходы к конструированию алгоритмов,
основу для построения которых составляют материалы,
приведенные в § 1.4.
Степень априорной неопределенности может быть
различной.
1. Полная априорная статистическая неопределенность,
когда не известны ни виды, ни параметры законов
распределения вероятностей компонент оцениваемых и измеряемых
случайных процессов. Заданы лишь допустимые конечные области,
в которых изменяются соответствующие компоненты
случайных процессов. Синтез алгоритмов оценивания в данном слу<
чае возможен с использованием гарантирующего подхода,
рассмотренного в гл. 5.
2. Частичная априорная статистическая неопределенность,
при которой закон распределения компонент оцениваемых и
измеряемых случайных процессов известен с точностью до
некоторой совокупности параметров. Параметрическое описание
должно удовлетворять двум подчас противоречивым
требованиям. Во-первых, оно должно качественно правильно отражать
наши ограниченные априорные знания. Во-вторых, число
параметров должно быть не слишком велико. Увеличение числа
параметров приводит к ухудшению качества решения основной
задачи как из-за сложности технической реализации, так и из-
за потери доли входной информации, которую нужно
использовать для определения значений параметров или на исключение
неизвестных мешающих параметров. Таким образом, при
параметрической априорной неопределенности вместо
единственного закона распределения вероятностей случайных процессов
задаем целый класс распределений. Алгоритм оценивания дол-
101
жен выбрать из заданного класса распределений то, которое
бы обеспечило выполнение критерия оптимизации. Это
означает, что алгоритм оценивания должен быть адаптивным.
Различают три подхода к проблеме адаптации:
параметрический, подход на основе принципа инвариантности и
структурный. В последующих параграфах этой главы подробнее
остановимся только на параметрической адаптации. Под
параметрически адаптивным алгоритмом оценивания будем понимать
такой алгоритм, который на основе обработки измерительной
информации способен не только давать оценку требуемых
компонент случайных процессов, но и восстанавливать
статистические характеристики априорного описания динамической
системы и измерений. Большинство параметрически адаптивных
алгоритмов оценивания будут удовлетворять принципу
наращивания, а именно, к базовой автоматической системе (в
простейшем случае к фильтру Калмана) будет добавляться контур
самонастройки.
4.2. Рекуррентное оценивание вектора состояния
и корреляционной матрицы погрешностей измерений
Рассмотрим построение рекуррентного алгоритма
оценивания вектора состояния х^ и постоянной корреляционной
матрицы R погрешностей измерений по выборке измерений
нарастающего объема Y'^l^{yi, i^l,k}. Впервые такая задача была
поставлена и решена Борном и Тейпли [93] при использовании
линейной модели динамической системы, не содержащей
шумов. Здесь же рассмотрим более общий случай, когда линейная
модель системы может быть любой из числа использованных
в гл. 3, а модель измерений включает шум Уй в виде
произведения BftVft, где Вя — матрица, зависящая от времени.
Задача 4.1 (Обобщение алгоритма Борна и Тейпли). Дано:
1. Модель системы
Хй+1 = ао(^)+Ф(^+1 |^)Xft+b(A:)Wft. (4.1)
2. Модель измерений
Уй=Ао(А:) + НйХй+ВйУй. (4.2)
3. Априорные данные:
Wk^N{0; Q„); y^^NiO; R); (4.3)
R —const; R — неизвестная матрица; хо'-'Л/(х(0|0), Po);
COv(Wft, W,) COv(Vft, V/)=COV(Xo, Vft) =
= cov(xo, Wft)=0; ^7^/.
102
4. Критерий оптимизации — максимум совместной плотности
распределения вероятностей оцениваемых и измеряемых
параметров
maxi:(Xi*, У/ I R), /44)
Х^\ R \ • I
где X^x={\i, i=Tjk).
Доказать: 1. Алгоритм экстраполяции значений
x{k+\\k) =Af (х„+, I y*i); Р(^+11^) =cov(Xft+b x^+i | Y'',)
имеет вид
x{k+\\k)=uo{k) + <i>{k+\\k)x{k\k); (4.5)
^{к+\\к) = Ф{к+\\к)^{к\к)Ф'^{к+\\к) +
+Ъ{к)(Х,ЪЦк). (4.6)
2. Алгоритм фильтрации значений х(^|^) =Л1(Хй| y*i) и
Р(^|^) ^cov(Xft, Хд|У*1) задаются рекуррентными
соотношениями
x{k\k)=x{k\k-\) + V.kVk; (4.7)
Кй=Р(^|^-1)Н^йС-1й; (4.8)
Vft=yft—Ао(А:) —HftX(A:|A:—1); (4.9)
Cft=HftP(A:|A:-l)H^ft+BftRXBV, (4.10)
V{k\k) = {^-V.kVik)^{k\k-\); (4.11)
Rft=(l/A:)(B^ftBft)-iB^ft(vftvMBft(B^ftBft)-i+
+ (1-1Д)На_1. (4.12)
Доказательство. Преобразуем сначала критерий (4.4) к
эквивалентной форме записи. Прежде всего заметим, что
поскольку натуральный логарифм является монотонно возрастающей
функцией своего аргумента, то вместо (4.4) можно
использовать эквивалентный критерий
тах1п^(^Д y,*|R). /4 13)
Используя формулу полной вероятности, марковость
процесса (Xft, Уй) и независимость измерений угеУ^ь i^l, к,
представим совместную плотность распределения X*i и У*1 в двух
видах:
а) lnjt(X*i, y*i|R)=lnjt(l*-ii, y'=-4|R) +
+1пя(Хй, уи\Х^-'и У*-Ь, Щ=\пп{Х^-\, y'=-'i|R) +
+lnn(yft|Xft_i, Уа_1, R)+lnn(Xft|Xft_i, Уа, R) ; (4.14)
103
б) In * {Х^\ У^* I R) = lin: (Zi*) + In т: (У1* I A'l*, R) =
= In ^ (Zi*) + 2 In Чу* I ^1*, R). (4.15)
i=\
Учитывая (4.14) и (4.15), преобразуем критерий (4.13) в
составной:
maxlin:(x, I у„ х(^- 1 I k- 1), R,); (4.16)
k
max}] 1п^(уг| X^\ R), (4.17)
R i=i
где Zj = {x(i 10, t= 1, ^}; x(^ I ^) и R^ —оценки x^ и R,
полученные no выборке измерении Y^.
Оптимизация no критерию (4.16) при условии, что R^Ra,
дает обычные алгоритмы экстраполяции и фильтрации калма-
новского типа. Из соотношений (3.29), (3.30) и (3.7) —(3.9),
полученных в гл. 3 и примененных к моделям системы и
измерений (4.1) и (4.2), следуют алгоритмы экстраполяции и
фильтрации (4.5) —(4.11).
Обратимся теперь к оптимизации по критерию (4.17). Пред-
ставим сначала lnn(y,|Zi*, R) в явном виде. Для этого заметим,
что в силу линейности преобразования BjV,- и условий (4.3)
BiVi-^NiO, B.RBi^). (4.18)
Из соотношения (4.2) следует, что
B,v,=yi—HiX,—Ао(0 (4.19)
и якобиан преобразования от переменных B,v,- к переменным
уг равен единице, поэтому, учитывая (4.18) и (4.19), можно
записать
k
У (R) = yj Шт:(у, I Xj,\ R) - — (km/2)In2^ +
»=i
k - k
1
7^1 Ш\
+ ^Jln I {B,RB^T' I - 1/2 J] Vi4B,RB,r'Vb (4.20)
где v, = yj—HiX(i I i— 1) —Ao(0; it = 3, 1415 ...
104
Используя определение и свойства псевдообратной матрицы
[60], выполним следующие преобразования:
(BiRBiT)-i = BiB.+ (BiRBiT) + (Br)+BiT=Bi[(Bi^Bi)X
XR(B,TB0]+B,-=Bi(B,TB0-iR-4B^Bi)-iBi^ (4.21)
Кроме того, заметим, что
|(BiRB,T)-4 = |B,RB,T|-i. (4.22)
Подставив (4.21) и (4.22) в (4.20), получим
k
у (R) = — (kml'l) In2^ — 1/2 2 In I BjRBi^ | — ,
- 1/22 v,^B, (B,^B,)-'R- (Bi^B,)-' B,^v,. (4.23)
Необходимое .условие экстремума функционала (4.23)
описывается уравнением
dR R=Rft
которому можно придать явный вид, используя (П.8) и (П. 10):
- k (йгу+ Ыг' f 2 (Б^'Б.)"' B^'iV.^B, (в,^в,)-j яг\ = 0.
(4.24)
Транспонируя (4.24) и умножая его слева и справа на Ra,
получаем
k
К* = Y S (B''B,)-B,^v,v,-B, (В,^В,)-'. (4.25)
1=1
Записав (4.25) в виде
R,=^(B,^B,)-B,Xv/B,(B,^B,) Ч
ft—1
k-\ 1
k k-\U
Y (Bj^BO- B^v^v.^B, (B,^B,)-, (4.26)
»"=i
непосредственно приходим к рекуррентному соотношению
(4.12). Д
Замечания: 1. Алгоритм Борна и Тейпли [93] является
частным случаем алгоритма (4.5) — (4.12) при условии, что
Ь(А.)=0, Bft=E, ао(А:) = Ао(А:)=0.
105
2. Если вместо (4.1) использовать уравнение (3.1), это
приведет к таким изменениям алгоритмов фильтрации и
экстраполяции, которые приведены в гл. 3. Выражение же для оценки
Rft остается неизменным и будет задаваться соотношением
(4.12).
Исследование алгоритма (4.5) — (4.12) с использованием
ЦВМ позволяет выявить некоторые его особенности. Если диа-
гональные элементы RkH находятся в диапазоне Яисти^ЯкН^
!<15У?ист<<, t^l, т (^ист — истинная корреляционная матрица
измерений), то оценка х(^|^) мало чувствительна к изменению
элементов матрицы Ra. Если же Нкн<Яисти, то это может
привести к большим ошибкам в оценке х(^|^) в силу ухудшения
обусловленности матрицы С^. Для улучшения работы
алгоритма целесообразно использовать итерационную процедуру
вычисления матрицы Rft. Достаточно выполнить три итерации при
вычислениях оценки матрицы Ra, чтобы оценка Ra почти
перестала изменяться.
Отметим недостатки построенного алгоритма оценивания
(4.5)—(4.12): 1) алгоритм пригоден для оценки только
постоянной матрицы R; 2) алгоритм не учитывает область
допустимых значений диагональных элементов матрицы R.
Рассмотрим алгоритмы, свободные от этих недостатков.
Сначала получим алгоритм оценивания для случая, когда
элементы неизвестной матрицы Ra изменяются с течением вре»
мени.
Задача 4.2. Дано:
1. Модели системы и измерений задаются соотношениями
(4.1) и (4.2).
2. Априорные данные: (4.3) с изменением Vk'^N(0; R^),
RftT^const, Rft — неизвестная матрица.
3. Критерий оптимизации —
mas lm:(Xft, у^ | Y^"-', R^). /4 27)
Доказать: 1. Алгоритм экстраполяции описывается
соотношениями (4.5) и (4.6).
2. Алгоритм фильтрации имеет вид
x{k\k)=r.x{k\k-l)+KkVk; (4.28)
Kk=P{k\k-\)Hk'Ck-'; (4.29)
Ck=VkVk'\ (4.30)
Vk=yk-U,x(k\k-l); (4.31)
P{k\k)^.P(k\k~l)-KkCkKk'. (4.32)
106
Доказательство. Используя формулу полной вероятности,
можно записать
1пя(хьУа|У1*-', Rft)=lnn(yft|l'i*-', Rft) +
+1пя(х,|УЛ R,). (4.33)
Поэтому из (4.27) и (4.33) следует, что критерий
оптимизации может быть заменен эквивалентным составным критерием
maxlin:(Xft I Yi\ R^); ^4.34)
maxlnMyJl'i^-'.Rft). (4.35)
В силу критерия (4.34), моделей системы и измерений (4.1)
и (4.2), как было показано при решении задачи 4.1, алгоритмы
экстраполяции и фильтрации задаются соотношениями (4.5) —
(4.11). В эти соотношения входит неизвестная оценка Ra
матрицы Rft, которая должна быть найдена с использованием кри-
терпя (4.35). Заметим, что если неизвестна матрица Ra, то в
силу соотношения (4.10) неизвестна матрица С^, которая
используется при вычислении коэффициента усиления Ка с
помощью соотношения (4.8). Поэтому целесообразно находить
сразу оценку Cft, заменив критерий (4.35) на эквивалентный.
В априорных данных (4.3) можно записать
In ^ (У. I Ух*-\ R.) = - -f- In 2; - ^ In I cov (у„ у,| Y,'-\ R,)l -
—1- v,^ (cov (y„ y, I y^*-', R,))-^ v„ (4.36)
где Vft=yft—Af(yft| У1*, Rft).
Используя (4.2) и (4.5), представим выражение для невязки
Vft в следующем виде:
Vft=yft—Ао(^)—HftX(^|^—l)=Ao(^)+HftXft+BftVft—
-Ao{k)-H,x{k\k-l)=H,{x,-x{k\k-\)) + bkV,. (4.37)
Заметим, что
поэтому, учитывая (4.37) и (4.10), находим
COV (Уа, Уа|У1'=-1, Rft)=Af(vftVft^|yi*-i, Rk) =
=Н,Р {k\k-\) H,-+B,R,B,T = С. (4.38)
Подставляя (4.38) в (4.36), получаем
1п^(у. I Ух*-'. R*) = --f-ln2^~- -jirilC,] _-Lv,^C,-'v, =
= ln^(vjyi*-',C,). (4.39)
107
Отсюда критерий (4.35) заменяется критерием
maxlin:K I У^*-, С,). ^^^^^
Используя правила вычисления производных от скалярной
величины по матрице С* и соотношение (4.39), получаем
необходимое условие экстремума в виде уравнения
dln^(v, I Y,'-', C,)/dC, = _C,~4C,-'v,v/C,-' I =0,
из которого следует Ck^VkVk'', т. е. равенство (4.30)
справедливо.
Преобразуем теперь соотношение (4.11) к эквивалентной
форме записи. Для этрго, обращаясь к последовательности
KftVft, определим ее корреляционную матрицу, учитывая (4.38),
^KftCftKft''.
Подставив в полученное выражение вместо Ка'^ значение,
определяемое соотношением (4.8), получим
KftCftKft^=K,C,(C,-i)TH,P(A:|A.-l) = K,H,P(A:|A:-l),
поэтому соотношение (4.11) приобретает следующий вид:
P{k\k) = P{k\k-\)-Kk4kP{k\k-\) = P{k\k-l)-KkCkKk^.
Доказана справедливость соотношения (4.32). Д
Особенностью алгоритма (4.28) — (4.32) является то, что
оценка матрицы R^ не производится, а вместо этого
оценивается матрица Си, линейно зависящая от Rft. Это модификация
приводит к тому, что коэффициент усиления фильтра Ка и
апостериорная корреляционная матрица Р(|й|^) зависят уже не только
от априорной информации, но и от реальной измерительной
информации. Данное обстоятельство имеет существенное
значение, когда априорная информация задана неточно.
4.3. Адаптивная фильтрация при использовании
стационарных систем
Построим адаптивный алгоритм для оценивания вектора
состояния стационарной динамической системы и
корреляционных матриц стационарных шумов, входящих в линейные
дискретные модели системы и измерений. Рассматриваемый здесь
подход к решению задачи был предложен Мехра [63].
Задача 4.3 (Алгоритм Мехра). Дано;
1. Модель системы
Xft+i = Фхй+Г\Уй; Ф и г — const. (4.41)
т
2. Модель измерений
yft=HXft+Vft; Н —const. (4.42);
3. Алгоритм формирования оценок С; корреляционной
матрицы Ci^M{vkV'^k-i), обновляемой последовательности
невязок уа=Уа—Нх(^|^—1) имеет вид
^■-т.
VftVft-/,
(4.43)
k=i
где x(k\k—l)^7W(Xft| У]*-!); N—число выборочных значений.
4. Априорные данные:
yfk-'N (О, Q); Vk^N (О, R); Xo-iV [х (010), Ро];
Q и R — постоянные неизвестные матрицы;
Qo и Ro — априорные значения Q и R; (4.44)
COV (Wft, W,)=COV (Vft, V,)=COV (Xo, Wft)=COV (Xo, Vft)=0.
Система полностью наблюдаема и управляема, т. е.
гапд[Н\(НФ)т (НФ"-1)^] = п;
rang[r, ФГ, ..., Ф"-1Г]=п. (4.45)
Доказать: 1. Стационарный фильтр имеет вид
х(к+1\к)=Фх{к\к); (4.46)
x{k\k)=x{k\k-l)+Kvk; (4.47)
Vk=y,—Hx{k\k—l); (4.48)
K=(№)(H(PH^)+R)-i; (4.49)
Р=Ф[Е—КН]РФт+ГОР, (4.50)
гле x(k+l\k)=M(xu+i\Y,''); xik\k)=M(x,\Y,'');
P=cov (xft+1, Xft+i| У1^) при ^^c».
2. Алгоритм формирования оценки матрицы R:
'Я.д — при первом обращении;
R =
Cj—H_(PFr) —при последующих обращениях:
PqH'^ — при первом обращении;
(4.51)
Р1Г =
КС„+А+
И-
при последующих обращениях, (4.52)
А =
НФ
НФ(Е—КН)Ф
Н [Ф (Е — КН)Г-'Ф_
(4.53)
109
A+^ (A'^A)-iA'^ — псевдообратная матрица для А.
3. Алгоритм формирования оценки матрицы Q:
2 нФтоп(Ф'-7 = НР(Ф-7Н' —НФ'Рн" —
—2 НФ''Й(Ф''-ТН\ 1= 1, ...,/г, (4.54)
1=0
где
Й=Ф[—КНР—РН^К^+КСоК^Ф^. (4.55)
Число неизвестных матрицы Q меньше или равно nX,ni.
Доказательство. Используя соотношения (3.29), (3.30) и
(3.7) — (3.9), определяющие фильтр Калмана применительно к
модели (4.41), (4.42), будем иметь соотношения (4.46) — (4.48),
а также
Kk=P{k\k—l)H^[HP(k\k—l)H^+R\-'; (4.56)
Р(А>|А>—1)=ФР(А>—1|А.—1)фт+Г0Г^; (4.57)
P(k\k) = (E—KH)P(k\k—l). (4.58)
В качестве значений R и Q выберем априорные значения
R^Ro и Q=Qo. В силу того что соотношения (4.57) и (4.58) не
зависят от измерительной, а определяются только априорной
информацией и номером шага k, то при ^^-оо элементы
корреляционных матриц P{k\k) и P{k\k—1) стремятся к
стационарному значению Р, которое может быть найдено путем расчета
по рекуррентным зависимостям (4.57) и (4.58) в ускоренном
масштабе времени либо путем решения уравнения (4.50),
непосредственно следующего из (4.57) и (4.58) при P{k\k—1)=Р.
Найденное значение Р, а следовательно, и коэффициент
усиления К являются функциями от Qo и Ro, которые не совпадают
с их фактическими значениями. Поэтому по измерительной
информации (4.43) найдем оценку Q и R. Для этого получим
соотношения, связывающие матрицы Сг, Q и R.
Из (4.48) и (4.42) следует
Vk=Uk+Vk, (4.59)
где /ft^Xft—x{k\k—1). В силу априорных данных (4.44) и
соотношения (4.59) имеем
С, = COV (V,, v,_i) = M(v,vl-i) = им {IJl^i) Н' +
+ НМ (/,vL,) + М (v,/LO Н' + М {v.vUi) =
^ НМ {ljl_i) Н' + НМ {iy,_i), если i > 0; ^^^^^
НРН^ + R, если 1 = 0.
по
Вычислим M{lfk-t) и M{li,vl-t) при А:>0. Из (4.41) и (4.46)
следует
и=Хи—х{к\к—1)=Ф{Х;,-1—х{к—1\к—1)-\-Гу/^-1. (4.61)
Заметим, что в силу (4.42), (4.47) и (4.48) можно записать
x(k—l\k~l)=x(k—l\k—2)^K[yk-i—4x(k—l\k—2)] =
=x{k—l\k—2)±K[Hxk-i-}-Vk-i—4x{k—l\k—2)] =
■ =x(A:-l|A:-2)+KH/ft-i+Kvft-i. (4.62)
Подставляя в (4.61) значение х(^—l\k—1), вычисленное
при помощи соотношения (4.62), находим
1и=Ф [Xk-i-x{k-l\k-2)-KHlk-i-Kvk-i+rw,-i =
=Ф(Е-КН)/а_,-ФКуа-,+Глуа_,. (4.63)
Отсюда, учитывая i предыдущих значений U, v^ и w^, по
индукции получаем
/,=[Ф (Е-КН)]' /,_1-2 [Ф (Е - KH)]'-'OKv,_j +
+2[0(E-KH)]/-rw,_^. (4.64)
Умножая (4.64) справа на ll-i и применяя операцию
математического ожидания, определяем
М [l,ll-i\ = [Ф (Е - КН)]' Р, (4.65)
где P=cov (Ik-i, Ik-i).
Выражение для Р в стационарном случае можно сразу по-
лучить из (4.63) в виде
Р=Ф(Е—КН)Р(Е—КН)тфт+ФКНК^Ф^+ГОП. (4.66)
После умножения (4.64) справа на \k-i и использования
операции математического ожидания получим
М (Ik-vl-i) = — [Ф (Е — КН)]'-' ФШ. (4.67)
Используем (4.60), (4.65) и (4.67) при i>0, тогда
Ci=H [Ф(Е—КН)]»-1Ф [РН^—КСо]. (4.68)
Перепишем (4.68) для i^l, 2, ..., п в ином виде
НФ (РН" — КС„) = с,;
НФ (Е — КН) Ф (РН^ — КС„) = С,;
Н [Ф (Е - КН)]»-' Ф (PIT - КСо) = С„,
111
отсюда
РН"=КС„+А+
С,
lC„j
(4.69)
Здесь А+ — псевдообратная матрица для матрицы
НФ
НФ (Е — КН) Ф
А =
_НФ(Е —КН)"-'Ф
(4.70)
Заметим, что матрица А содержит произведение
невырожденных матриц Н, Ф и Е—КН, поэтому rang(A)^n и А+=
^(A'^A)-iA'^. Обозначая оценку матриц РН'^ и R соответственно
РН^ и R, с учетом (4.60) и (4.70), получаем (4.51) и (4.52).
Перейдем теперь к оценке матрицы Q при помощи
соотношения (4.66). Ограничиваясь случаем, когда число неизвестных
элементов матрицы Q меньше или равно п\т, из (4.66)
находим
Р=ФРфт-|-й-|-ГОП, ^4.71)
где матрица Й = Ф [—КНР—РН^К^+КСоК^]Ф^
Подставляя (4.66) в правую часть (4.71), получаем .
р=ф2р(ф2)т_|_ф^фт-|-^_|_фГ0Гт. (4.72)
Повторяя упомянутую процедуру п раз, перенося при этом
члены, зависящие от Q, в левую часть уравнения, приходим
к соотношениям
/-1
/—1
2 Ф'Тог^ (фО' = р—ф'р (ф г - 2 ф'^ (ф')'.
(4.73)
/=о
i=l,2 п.
/=о
Теперь умножим правые и левые части (4.73) справа на
(ф-г)тнт и слева на Н, тогда
1=1
2 НФ^ГОП {Ф'-'yW = HP (ф-у Н^ — НФ'РН' —
г—1
- 2 НФ'Й(Ф''-')'Н^ 1= 1, 2, ...,/г. (4.74)
/=о
Правая часть (4.74) полностью определена, если известны
матрицы РН'^ и Со. Подставим в правую часть (4.74) оценки
этих матриц, получим требуемые соотношения (4.54) и (4.55).
112
Система уравнений (4.54) не является линейно независимой.
В каждом конкретном случае всегда надлежит из (4.54)
выбрать систему линейно независимых уравнений. Д
Недостатками алгоритма Мехра являются: 1) большой объ-
ем вычислений при определении оценки Q как решения уравне-
ния (4.54); 2) формирование оценок Q и R не в темпе
поступления измерений; требуется накопление измерительной инфор-
мации; 3) существенная зависимость оценок Q и R от
априорных значений Qo и Ro.
4.4. Адаптивная фильтрация по последовательности
скалярных измерений
Рассмотренные в предыдущем параграфе алгоритмы Мехра,
позволяющие оценивать матрицы Q и R совместно с вектором
состояния, требуют для реализации больших вычислительных
мощностей: памяти и быстродействия ЦВМ. В тех случаях,
когда вычислительные возможности ЦВМ невелики, а требуется
построить оценку вектора состояния и диагональной матрицы
Q по последовательности скалярных измерений, необходима
разработка иного алгоритма оценивания. Такой алгоритм был
получен Язвинским [121] для нестационарных моделей системы
и измерений; он является результатом решения следующей
задачи.
Задача 4.5 (Алгоритм Язвинского). Дано:
1. Модель системы
Хи+,=Ф{к+\\к)хи+Г{к+1\к)у/и; k=0, 1... (4.75)
2. Модель измерений
yk=HkXu-\-Vk; «/ft —скаляр. (4.76)
3. Априорные данные:
Wft^Л/(0, Q); t»ft-i\^(0, Rk); хо-Л^(х(0|0), Р(0|0));
^^iq„ecmi = j; _ ^^.77)
10, если 1ф1; i, j = I, г
COV (Wft, t>/)=COV (Хо, Wft)=COV (Хо, f/)=0.
4. Критерий оптимизации
•maxi:(Xft, Ух* I Q). (4 78)
где It (Xft, У1* IQ)—-совместная плотность распределения
вероятностей Xk и У1*.
8—6899 113
Доказать: 1. Алгоритм экстраполяции значений
x(k+\\k)=M[xk+i\Y,'',Q];V(k+l\k)=cow{Xk+i,
Xft+i|y,*, Q)
имеет вид
х{к^1\к)=Ф(к+\\к)х{к\к); (4.79)
+Г{к^1\к)С1ГЦк+1\к). (4.80)
2. Алгоритм фильтрации значений x{k\k)=M{Xk\Yi'^, Q) и
P{k[k)^cow {Xk, Xftiy,*, Q) задается соотношениями
x{k\k)=x{k\k-\)+KkVk;. (4.81)
Vk=yk—4kX(k\k—l); (4.82)
Kk=P{k\k-\)H,{H,P{k\k-l)H,-+R,)-i; (4.83)
P(A:|A:) = (E-KftHft)P(A:|A:-l). (4.84)
3. Алгоритм оценки элементов матрицы Q по выборке
измерений У^, где г^Л:
а) при Я\ФЯ2Ф ... фЦт имеет вид
q= (А"А)-'А"е, . (4.85)
где
q=[fl'i. •••, ЯтУ\ e=[ei, ..., ZtY\ A=||ai/IUx'-;
ап=^^,Щт\Ь^(\\\-Ш\ (4.86)
НгФ(1|/)Г(/|/—1))/ —элемент строки НгФ(1|/)Г(/|/—1);
ег=гг2-Н^Ф(1|0)Р(0|0)Ф^(1|0)Нг-/?^; (4.87)
б) при Ц\^Ц2= ... ^Цт имеем
_ fei/[Hir(l|0)r(l|0)H/], если 81 >0; ^^gg^
О , если ei<0.
Доказательство. По формуле полной вероятности можно
записать
г-[
п{х,, У,*|0)=я(У,*|0)я(х,|УЛО)
или
1пя(ха, У,*|0)=1пя(У1*|0)+1пя(ха|У1*, Q). (4.89)
114
в силу (4.89) критерий (4.78) равносилен следующему
составному критерию:
rmaxlin:(x, I У1*, Q); (4.90)
J х*
ImaxIn^ (У^* I Q) = lin: (У^" \ Q), (4.91)
^ Q
где Q — оценка Q по критерию (4.91) по части выборки
измерений У1''с=У1*, k^n.
Из критерия (4.90) и соотношений (4.75), (4.76),
определяющих модели системы и измерений, следует, что алгоритмами
экстраполяции и фильтрации являются соотношения Калмана,
имеющие в обозначениях данной задачи вид (4.79) — (4.84).
Этими соотношениями можно будет воспользоваться для
оценки вектора состояния, начиная с того момента времени, на
который будут найдены оценки диагональных элементов матрицы
Q. Найдем оценки qu i^\, г с использованием критерия (4.91).
В силу взаимной независимости измерений можно записать
к к
ln^(yi*|Q)=S ln^(i/i|Q) = 2 ^^'^(^'l ^(0\0), P(0|0),Q).
;=i 1=1
(4.92)
В силу гауссовости плотности распределения вероятностей
jt(«/j|x(0|0), Q), линейности моделей системы и измерений
(4.75) и (4.76) и соотношения (4.92) критерий оптимизации
(4.91) можно записать в следующем виде:
k
max V lin: (V, I X (О I 0), q^ ... q,); (4.93)
9i .., 9» ",
TAevi=yi—M{yi\x{0\0),Q).
Вычислим эквивалентный измеряемый параметр Vi и найдем
взаимосвязь его с искомыми параметрами qi, ..., qr. Для этого
из соотношения (4.75), использованного последовательно i раз,
можно записать
Xi = Ф (i I 0) х„ + 2 Ф (И /) Г (/ I / - 1) w^_„ (4.94)
/=1
где Ф{1\0)=Ф(1
= Ф{1\1—1)Ф{1—1
1_1)Ф(/_1|;_2). ... .Ф(1|0); Ф{1\П =
i-2). ... .Ф(/+1|/).
8* 115
Подставляя в соотношение (4.76) при k^i значение хи
взятое из (4.94), определяем
i
yt = HiX, + v,= Н^Ф (И 0) x„ + S Н,Ф {i I /) Г (/1 /-2) wj_i+v,.
(4.95)
В силу соотношения (4.95) и априорных данных (4.77)
невязка Vi может быть вычислена следующим способом:
х,=у,-Н,х{1\0)=у—Н,Ф{1\0)х{0\0). (4.96)
Получим теперь выражение для плотности распределения
вероятностей n(vj|x(0|0), Q). Для этого достаточно найти
7W(vt^|x(0|0), Q). Преобразуем правую часть соотношения
(4.96), подставив выражение из (4.95)
Vi=HiO(i|0)(x„-x(0|0)) +
+2 "*Ф i^ I /) Г а I / - 1) W;-i + V,- (4.97)
Из (4.97) и априорных данных (4.77) следует
Af(vi|x(0|0), Q)=0; (4.98)
M{vi' I х(0 I 0), Q) = HiO(i I 0)P(0 I 0)ФЦ1 I 0)Hj^ +
+ н,Г5;ф(^' I /)Г(/1 /-1)0гч/1 /- i)o(t I /)]H,^ + R,=
L/=i
= н,Ф(ло)Р(0|0)ФЧ^|0)н,^ + 2'7г2(н,Ф(И/)Г(л/-
-lYi + Ri, (4.99)
где (HiO(i|/)r(/|/—l))/ —элемент строки Н(Ф(1|/)Г(Л/—1).
С учетом гауссовости n(vi|x(0|0), Р(0|0), Q) и
соотношений (4.98) и (4.99) критерий принимает вид
k
шах 2 (-1пЛГ(Vi= I X (О I 0), Р(0 I 0), q^... ^,) -
-v,W-'(v,^ I Х(0 I 0), Р(0 I 0), <7х ... Яг)).
Необходимые условия экстремума задаются уравнениями
ZjI М(^) dqi ' ^ ' dqi J '
116
или
k
Jj(v,= -Af(.))M-M)^^ = 0, (4.100)
rfleAf(.)=Af(vi2(x(0|0), P(0|0), ^i ... ^r).
Используя (4.99), находим
^=J] (Н,Ф {i I /) Г (/ I / - 1)),- / = —r.
/=i
Поскольку M-2(.)>o и dM{-)/dqi>0, то достаточными
условиями справедливости равенства (4.100) будут
Vi2=Af(vi2|x(0|0), P(0|0),Q).
Подставив в (4.99) вместо M(vi2|A:(0|0), Р(0|0), Q)
значение Vt^, получим
Vi' = HiФi{i I 0)Р(0 I 0)Ф'{1 \ 0)Нг^ +
+S '^г S (HiO (i I /) г (/1 / - w + R*. (4.101)
Поскольку система (4.101) линейна относительно
параметров qi, l^l, г, то для нахождения этих параметров достаточно
r^k независимых невязок v,. Начиная с номера измерения
г-\-1, может быть оценен уже вектор состояния х.
Обозначим
2 {ntO{i\j)r{j\j-W=au, i = ~k,l=UT;
ei=vi2—Н^Ф(1|0)Р(0|0)Ф^(1|0)Н,-^—R,-;
e=[ei, .... ekV; A=||a«IUxr. (4.102)
В этом случае система уравнений (4.101) принимает вид
Aq=e. (4.103)
Решая уравнение (4.103), получаем q^^A+e, где А+^
^(А''А)-'А'' — псевдообратная матрица по отношению к
матрице А.
В частном случае, когда qi^q2= ... ==q'r, систему уравнений
(4.101) перепишем так:
li'^ ац = Ч, 1 = ТГк. (4.104)
Система уравнений (4.104) имеет смысл при i^l, учитывая,
что qi>0, решение принимает вид (4.88). Д
117
Приведенное доказательство позволяет вскрыть недостатки
алгоритма Язвинского:
1) алгоритм (4.85) и (4.88) является квазиоптимальным.
Действительно, из (4.104) следует, что при 1ф1 оценки qi,
полученные для различных случайных ei, будут различными и
случайными. Система (4.104) несовместна. Этот результат
является следствием того, что условие (4.102) является лишь
достаточным, но не необходимым, т. е. уравнения (4.102) и (4.100)
неравносильны между собой. Вид решения уравнения (4.100)
будет меняться в зависимости от дополнительных ограничений,
накладываемых по условию каждой конкретной задачи;
2) оценка диагональной матрицы Q требует значительного
объема вычислений, связанных с обращением матрицы А;
3) алгоритм не предусматривает оценивание матрицы
измерительных шумов R.
4.5. Адаптивный алгоритм с обратной связью
по обновляемой последовательности
Рассмотрим получение алгоритма оценивания при
использовании моделей системы и измерений, имеющих постоянные
коэффициенты и нестационарные шумы, корреляционные
матрицы которых Qk и Rft неизвестны, но являются функциями
времени.
Задача 4.6. Дано:
1. Модель системы
Хй+1=Фхд,-|-Гшд,;, Ф, r=const. (4.105)
2. Модель измерений
yft+i = Hxft+i-|-Vft+i; H=const. (4.106)
3. Априорные данные:
vfk^N{0, Qft); Vft+,~A^(0, R^+i); Хо~'Л^(х(0|0), Po),
где Qft, Rft+i, Po — неизвестны;
cov (Wft, w„) =0; cov (vs, v/) =0; cov (xo, Wft) =
=cov (xo, Vft)=0. (4.107)
4. Критерий оптимизации
max lni:(Xft+i, y*:{ | У?, P», Q*, Ra+i). (4.108)
x*. Po. Qa. Rft+i
Доказать: 1. Алгоритм экстраполяции значений x{k-\-
-|-l|^)=Af(Xft+i|yi*) имеет вид
х{к-\-1\к)=Фх{к\к). (4.109)
118
2. Алгоритм фильтрации значений x(k-^l\k-\-l) =
=Af (Xft+i| У1*+') задается рекуррентными соотношениями
x{k+l\k-\-l)=x{k-\-l\k)-j-Kk+iv{k-\-l\k);
v(k-\-\\k)=y,+i-Hx(k+\\k);
K,+,=s+Afv(v(A!+l|A!)v-(A!+l|A!)-';
s+=(s''s)-'s''.
М =
v{k+l\ k) v^{k + l I k)
s =
H
НФ
НФ'
(4.110)
(4.111)
(4.112)
(4.113)
(4.114)
_v(k + l\k) \Цк + 1\к)^
Доказательство. Преобразуем критерий (4.108) в
эквивалентный составной критерий. Для этого, используя формулу
полной вероятности и условное обозначение (•).=:(Ро, Qa,
Rft+i), можно записать
1пЧх*+1. YtX[\Yl{.)) = ln^{Ytt[\Yl, (•)) + 1пЧх|УГ',(-)).
(4.115)
Используя (4.115) вместо критерия (4.108), запишем
эквивалентный составной критерий
maxlni:(Xjfe+i I У1*+', ?„, Q*, Rft+,);
"A+i
/k+l
maxln-K{Y%Vi I П, P», Q*, R*+i).
(4.116)
(4.117)
где P„, Од,, R^+i — оценки Po, Q^, R^+i, удовлетворяющие
критерию (4.117).
Критерий (4.116) определяет задачу интерполяции с
закрепленной точкой Xft+i. Для решения же задачи фильтрации
требуется использование только части выборки измерений 7]*+',
а именно, выборки У1*+', поэтому вместо (4.116) следует
пользоваться критерием
maxlni:(x,+i|yi* + ', Р„, О*, Rft+i).
(4.118)
Как показано в гл. 3, модели системы и измерений (4.105) —
(4.107) и критерий (4.118) определяют рекуррентные
соотношения алгоритмов экстраполяции и фильтрации, которые
имеют следующий вид:
х{к-\-1\к) = Фх(к\к); (4.119)
р{к+1\к)=ФР(к\к)Ф'-\-ткГ; (4.120)
x(k-\-\\k-\-l)=x(k-\-l\k)-\-Kk+iv,+i; (4.121)
v{k+l\k)=yi,+i-\ix(k-^\\k); (4.122)
119
K,V=P(^+1 |^)Н^СГЛ;
P(^+l |^+l) = (E-K,+,H)P(^+l 1^).
(4.123.
')
(4.124)
(4.125)
Так как в данной задаче ставим перед собой цель найти
только первые статистические моменты x{k-]-l\k), x{k-\-l\k-\-
+ 1), то соотношения (4.120) и (4.125) желательно исключить
из алгоритмов экстраполяции и фильтрации. Поэтому в
алгоритмы экстраполяции и фильтрации войдут только
соотношения (4.119), (4.121) и (4.122). В этих соотношениях неизвестен
коэффициент усиления Kt+i, зависящий от неизвестных матриц
Р(^+1|^) и Са+1. Матрицы же P{k-\-l\k) и Ca+i зависят от
оценок Qk, Ra+1 и Pq. Как следует из (4.123), для нахождения
Ка+1 достаточно по выборке измерений Ykti найти оценки
P(^fe+l|^) и Сй+1 и тогда отпадет необходимость в нахожде-
НИИ оценок Qk, R^+i, Ро и использования соотношений (4.123)
и (4.124). Выясним, как при этом должен измениться критерий
оптимизации (4.117). Рассмотрим вектор
' k+i —
У*
+1
-Уй+1J
Так как векторы у^+ь ..., у^+г независимы и гауссовы, то
вектор YkXi — гауссов. Тогда
ln^{YtX\\Yl (•)) = -^1^2^-Т^''
—^(vtXWDT'ivttb,
D, -
(4.126)
где
Vft+i =
■v(^+l.|^)
k+i
Ук+1
Ук+1 J
V {k+l I k)_
Hx (^ -f 1
Yn[-M[YlX{\Yl {■)] =
H\{k-\-l
k)
k+i
о;=соу(УГь nriin, (•))
H(x,+i-x(^-fl|^)) + v,+i-
H(x,+,-x(^-f/| ^))+v,+j
(4.127)
(4.128)
Непосредственное вычисление математического ожидания
k+i
и корреляционной матрицы невязки Vft+i,
120
описываемой соот-
ношением (4.127), дает
M(v^:{|yf, (•)) = 0;
(4.129)
(4.130)
поэтому
Ы'к {YtXi I yf , (•)) = lti'K{vtl{ I yf. (.)) = lni:(vU'i I yf, D,).
(4.131)
В силу (4.131) критерий (4.117) может быть заменен
критерием
max in It (vi^+{ I Yi Dj) = raax7 (D,). (4.132)
Необходимое условие экстремума (4.132) с учетом равенств
(4.131) и (4.126) принимает вид
cU{Di)ldDi = Q или DT'-DT'[vtX{(vtX[y]DT' = 0. (4.133)
Отсюда, умножая равенство (4.133) слева и справа на D;,
получаем
v{k-{- 1 I к)\Цк+ 1 I k) ... v(k+ 1 I k)v'(k + l I k)
v{k + l\ k)v''{k+\ \ k) ... v{k + l\ k)v''{k+l I k)
(4.134)
В силу теоремы о нормальной корреляции и равенства
(4.106),
(4.135)
•N y-s y-s
C,+t =- cov(y,+i, y^+i I УГ. Po, Qk, Ra+i); i= 1. ',
поэтому матрица D;, определяемая равенством (4.130), может
быть записана в виде
D, =
^ftfl "12 •■• "и
"21 ^ft+2 ■•• "2I
L"a "12
^ft+i .
(4.136)
где
d,i = cov{v{k+i\k)v^k + j\k)\ Y,\ (•)).
Из (4.134) и (4.136) следует:
c.+,=v(^+l|^)v-(^+l|^);
dii=y{k+i\k)v^{k-\-l\k), i=2, 3 /.
(4.137)
(4.138)
(4.139)
121
На основе (4.137), (4.127) и априорных данных (4.107)
можно записать
dii = Н cov(x (^ +1\ к).хЦк+1\ k)\ У^*, (^)) Н\ i = ZJ,
(4.140)
где
x{k-\-i\k) =Xk+i~^{k+i\k). (4.141)
Используя последовательно i раз (i^2,/) соотношения
(4.105) и (4.109), получаем
х*+* = Ф'-'х,+ 1+ 2Ф^-''ш*+^-.; (4.142)
/=2
х{к+1\к)=Ф'-'х{к+1\к). (4.143)
Подставляя (4.142) и (4.143) в (4.141), находим
i
X{k + i\k) = Ф'-' X (^ + 1 I ^) + S *'"' ^k+j-v (4.144)
/=2
Учитывая априорные данные (4.107), соотношения (4.144)
и (4.140), определяем
с1п = НФ'-'Р{к+1\к)Н\ i=2J. (4.145)
Сравнивая равенства (4.139) и (4.145), получаем систему
уравнений для нахождения Р(^-|-1|^) Н'':
НФ'-'Р{к-\-1\к)Н^=у{к+1\к)х^{к+1\к), 1=271. (4.146)
С помощью (4.114) систему уравнений (4.146) приводим
к виду
sP{k+l\k)H^=M^. (4.147)
и находим решение
P{k+l\k)W=s+M^, (4.148)
где S+—псевдообратная матрица, задаваемая равенством
(4.113).
Подставляя значения Р(^+1|^)Н'' и Ck+i из равенств
(4.148) и (4.138) в (4.123), получаем искомое выражение
(4.112) для нахождения коэффициента усиления Кь+ь А
4.6. Оптимальные оценки и управление моделью системы
В данном параграфе получим решение задачи оценивания,
отличающейся от рассмотренных ранее задач следующими
тремя особенностями:
122
1) систематические ошибки входят только в модель
системы, являются неизвестными функциями времени и могут
рассматриваться как параметры, управляющие моделью системы.
Начальные значения систематических ошибок неизвестны;
2) оценивание вектора состояния должно быть выполнено
на фиксированном промежутке времени;
3) за критерий качества принимается минимум
математического ожидания квадратичной формы от переменных
состояния и управления на фиксированном интервале времени.
Таким образом, сначала построим закон изменения
управляющих параметров на заданном промежутке времени, тогда
станет возможным построение оптимального алгоритма
оценивания. Критерий качества и фиксированность промежутка
времени оценивания накладывают на задачу весьма существенные
ограничения, поэтому в данной задаче выбран простейший
квадратичный критерий, обеспечивающий конструктивный
подход к решению задачи.
Задача 4.7 (Дискретная фильтрация и управление). Дано:
1. Модель системы
x,+, = 0(^+l|^)Xft+r(^+l|^)Wft+>F(.^+l|^)u,. (4.149)
2. Модель измерений
yft+i = Hft+iXft+i+Vft+i. (4.150)
3. Априорные данные:
vfk^NiO, Qft); Vk~N{0, R^); хо-Л^(х(0|0), Po);
C0V(W/, W,)=C0V(V/, V,)=COv(Wi, V/)=COv(Xo, Wi) =
= cov(xo, v/)=0; t#/. (4.151)
4. Критерий оптимизации
f *-i
J, = rain rain M { x/ S^ x^ -f V [(^i+i - ^t+iY P~'(t +
Щ"
1=0
+ 1 |t + l)(x^+i-x..+i)-f (хЛ иЛ
A, Л,'
С;)). (4.152)
Доказать: 1. Алгоритм экстраполяции значений
x(t+l|t)=Af(Xi+i|y*i); P(t+l|t) = cov (х,+1, Xi+i|y*i) имеет вид
x{i-\-l\i)=Ф{i-\-l\i)x{i\i)+W{i+\\i)ni■, (4.153)
Р (t+110 = Ф (t+111) Р (t I i) Ф- {i+111) +
+r(t+l|t)Q,r-(t+l|t). (4.154)
2. Алгоритм фильтрации значений x(t+l|t+l)^
=M(x,+i|i'i'+'); P(t+l|t+l)=cov(x,+b Xi+l\Yl^+^) задается
123
рекуррентными соотношениями
x,+i=x(t+l|i+l)=x(t+l|t)+K,+iV,+i; (4.155)
v,+i = y.+i—Hi+ix(t+l|0; (4.156)
K,+i = P(t+l|OHl+iDr+'i; (4.157)
Df+i = Hj+i P (t + 1 I 0 HI+, + R,+i; (4.158)
P(t+lli+l) = (E-KwH,+i)P(t+l|t). (4.159)
3. Алгоритм построения оценки управляющего параметра
Ui=—Cix{i\i); (4.160)
С,= {W- (t+11 i) S.+i^^i+i+B,) -1 {W^ (t+11 i) S,+,X
ХФ(1+1|0+Л,-); (4.161)
8,=Ф-(1+1 |08тФ(1+1 |t+A,-C,-(>F-(t+l |t)SmX
X>F(t+l|t) + B,)Ci, (4.162)
где Sat —задано, t=A^—1, N—2,..., 1, 0.
Доказательство опускаем, поскольку оно может быть
выполнено приемами, аналогичными тем, которые изложены
в [11] и [62].
Решение этой задачи показывает, что применительно к
линейным дискретным системам справедлив принцип разделения.
В линейных системах с квадратичным критерием ошибки
при гауссовских входных воздействиях оптимальный
стохастический регулятор представляет собой последовательное
соединение оптимального линейного фильтра и детерминированного
оптимального линейного управляющего устройства.
Параметры этих двух частей системы управления определяются
раздельно.
Принцип разделения впервые был доказан Калманом и
Кепке. Наиболее важной особенностью этого принципа, как
следует из соотношений (4.152) — (4.162), является то, что
оптимальный фильтр не зависит от вида матриц критерия
качества управления, в то же время матрицы передачи обратной
связи сцстемы управления не зависят от статистических
параметров задачи.
Из (4.160) — (4.162) очевиден рекуррентный характер
вычислений, проводимых при формировании управляющей
последовательности. Особенность нахождения оценок и,- состоит
в том, что матричные коэффициенты С,- вычисляют в обратном
времени, поэтому до начала работы следует предварительно
вычислить все значения матриц С,-, i^k—1,..., О и до момента
использования хранить их в запоминающем устройстве.
Недостатками предлагаемого здесь алгоритма являются:
1) необходимость запоминания значений коэффициентов С,-
124
на весь интервал времени вычисления оценок параметров х,-;
2) потребность в знании априорных значений матриц 8лг, А,>
Л,- и В,-.
Рассмотрим теперь задачу построения непрерывного
линейного стохастического регулятора.
Задача 4.8 (Непрерывная фильтрация и управление). Дано:
1. Модель системы
dxt/dt=F (t) Xi+G (t) Wt-\-W (t) Ut.
2. Модель измерений
yt=H(t)xt+Vt.
3. Априорные данные:
vft^N{0, Qt6{t—x)); vt-^NiO, Rtb{t—x))
M{vft,\t^)=0; t,x>to;
Хо~Л^(х(0|0),Ро);
COv(Xo, Wi)=COv(Xo, Vi)=0.
4. Критерий оптимизации rain 7, где
ГА, A,
(4.163)
(4.164)
7 = м|х^^8,.х,^ + |[хЛиЛ
А,^ В,
di
(4.165)
(4.166)
t^ti ЭВО-
Доказать: 1. Для моментов времени i
люция статистических моментов х(/|/) =ЛГ (хг| У^' ) и Р(/|/) =
=iCOV (Xi, Xi| FJ) описывается уравнениями
k{t\t)=F{t)x{t\t)+G{t)ut+Kt[yt-4(t)x(t\t)]; (4.167)
Kt=P{t\t)H-(t)Rr'; (4.168)
P(/|/)=F(/)P(/|/)+P(/|/)FT(/)+G(/)QiG-(/)-
-КгКгКЛ (4.169)
2. Оптимальная оценка U; управляющего параметра Ut, при
te[/o, ^i] задается соотношениями:
^Ut=-Ctx{t\t); (4.170)
Ct=Br4rinSt+At-'); (4.171)
St=—F^ (t) St-StF (t) -Xt+Ct'^BtCt. (4.172)
Доказательство. Предлагаем читателю доказать
самостоятельно по следующему плану: 1) перейти к эквивалентной
задаче с дискретным временем [62],преобразовав (4.163), (4.164)
и функционал (4.166) (временной шаг дискретности At); 2)
использовать результаты решения задачи 4.7; 3) выполнить
предельный переход к непрерывному времени при Д/->-0.
12S
4.7. Адаптивный регуляриэованный алгоритм
дискретной фильтрации
При решении навигационных задач в условиях
существенной априорной неопределенности знания статистических
характеристик оцениваемых и измеряемых параметров возникает
необходимость оценивания не только компонент вектора хг,
описывающего движение ЦМ объекта, но и ряда дополнительных
параметров. Рассмотрим тот случай, когда одни и те же
дополнительные параметры входят как в состав описания
систематических ошибок оцениваемых и измеряемых параметров, так
и в диагональные элементы корреляционных матриц случайных
процессов, используемых в моделях системы и измерений.
Задача 4.9. Дано:
1. Модель системы
х(^+1)=т1,в,(^)+Ф(^+1, k)x{k)-\-w,{k). (4.173)
2. Модель измерений
y(^+l)=r,2e,[^+l) + H(^+l)x(^+l)+W2(^+l). (4.174)
3. Априорная информация:
Хо'-'Л^(х(0|0), Р(0|0)); w,(^), t=l, 2 — винеровские
процессы, имеющие Afw,(^)^0 и
M{Wi{k)wr{<k))=^i{k)Cfii^^k)-\-Ri{k)b{i-2); ■ (4.175)
t|, = diag(T],s, s=l, г); Ci=diag{Cis, s=l, г)—известные
матрицы;
Qi^k) = {Qts{k), 5=1Гг} и ¥i(^) = diag(e.,(^), s=l7~r) —
неизвестные вектор и матрица;
л, при t = 1;
' /, при i = 2,
где Хо, Wi (k) и W2 (k) — независимы между собой.
4. Критерий оптимизации
raaxi:(Xi(^+l). ^1*+'I в(^+1)) =
= ^(х^^+ 1 И+ 1), У,*+' I S{k+\)), (4.176)
где я(«)—совместная плотность распределения вероятностей
оцениваемых и измеряемых параметров; в^(^+1) =^[8/(^+1).
Доказать, что оценки x^{k-\-l\k-\-l)^x(k-\-\\k-\-l, в) и
G{k-\-\) задаются совместным решением, системы, состоящей
из рекуррентных соотношений
X (^ + 1 I ^, в) = лхвх {к+1) + Ф{к+\, k)x{k\ k, в); (4.177)
126
P (^ + 1 I ^. в) = Ф (^ и-1, ^) P (^ I ^, в) ФМ^ + 1, ^) +
+ e,(^+l)CiV(^+l); (4.178)
x(^+l 1^+1. в) = х(^+1 I ^, в) +
+K(^+l, e)v(A+l l^.'e); (4.179)
• v(^+l \k, e) = y,+i-Tj,e,(^)-H(^+l)x(^+l 1^, в);
(4.180)
К(^ + 1. в) = P(^ + 1 I ^, в) FT(^ + 1) B-' (^ + 1 I ^, в);
(4.181)
B(^ + 1 I ^fe, в) = H (^fe + 1) P (^ + 1 I ^, в) H^ (^ + 1) +
+ R(^ + 1) +^j^ + l)C,V(k + 1); (4-182)
P(^+l 1^+1, в) = [Е-К(^+1, в)Н(^+1)]Р(^+1 I k, в)
(4.183)
и следующего нелинейного матричного уравнения относительно
6(^+1):
tr{P-'(^+l 1^+1, e)Vf Р(^+1 1^+1, в)} +
+ Str{B-(s+l |5, e).f(E-v(5+l |s, в)Х
Xv^(s+1 Is, e)B-'(s+l \s, e))-v?B(5+l Is, в) +
+ 2v(s + 1 I s, e)Vf vMs + 1 I s. в)]} = 0. (4.184)
Градиенты ^g P(^+ l | й+ 1, в), vg B(s + 1 | s, в) и Vg- ^"{s+
+ 1 I s, 9) имеют своими элементами соответственно частные
производные ^Р(^+ 1 I ^-f 1, ^IdQij, ^B(s + 1 I s, Щ|дQ^j и <?v(s +
+ 1 I s, Q)/dQij, которые удовлетворяют системе рекуррентных
соотношений
3P(ft+l I ft-i-1, "в)
дВц
Е —К(^+ 1, в)Н(^^+ 1)
X
X
дР(к-^1\к,в) аК(^ + 1. в)
69
Ч
69
И
H(^fe+ 1)Р(^+ 1 I ^fe, в); (4.185)
127
+ 27/Q/e,^6(l-t); (4.186)
- К (^+1, % ^В(^ + П^. Щ В-' (^ + 1 I ^. '6); (4.187)
дЬц J
-\-2C,jQljb{2 — i)J/; (4.188)
a9i/ as,/
(4.189)
59,/ ^ "^ ' Ч 59f/ 59i/
xv(fe|fe-l.e) + K(fe+l,1)^^<^i;.-''^^] +
+ 7jj^6(l-t)n/, " (4.190)
Где //'—матрицы размерности /гХ« при i^\ и /X/ при t^2,
состоящие из нулей, за исключением одного единичного
элемента, находящегося на пересечении /-й строки и /-го столбца;
/1/' — столбцы, имеющие размерности 1Х« при t^l и 1Х^
при t^2 и состоящие из нулей и одного единичного элемента
в /-Й строке;
e(i_,)=(i'^^^«^' = '-'
[О, если i^r.
Начальными условиями для решения системы соотношений
<4. 178) —(4.190) являются х(0|0), Р(0|0) и
М11^ = ^^^Ы1-1)Л/- ^Щ0^2 = 0. (4.191)
Доказательство. Для вывода требуемых соотношений
необходимо прежде всего получить математическое выражение
плотности распределения вероятностей я(х(^+1). Yi'^+^\ в).
С помощью формулы полной вероятности представим
плотность распределения вероятностей я(х(^4-1). ^i^'+'lO) в виде
двух сомножителей
я(х(^+1), У,*+Чв)=Я1(У,''+Чв)я2(х(^^+
+ 1)|У1*+',в). (4.192)
128
Применяя k раз к первому сомножителю выражения (4.192)
формулу полной вероятности, представим его в виде
произведения вероятностей перехода
k
^,(У,*+' I в) = V(y (1) I в) П V (У (5 + 1) I Уу, в). (4.193)
Вследствие гауссовости и марковости процесса {х(^), у(^)},
линейности соотношений (4.173) и (4.174) соответственно
относительно х(^) и х(^+1)—сомножители выражения (4.193)
являются гауссовскими плотностями распределения
вероятностей со следующими параметрами:
y(5+l|5,e)=M[y(5+l)|yH,e]^tl2e,(s+l)+H(5 +
+ l)x(s+l|s,e); (4.194)
B(5+l|5,,e)=C0V(y(5+l). у(5+1)|УЛ e) = H(s+l)P(5 +
+ l|s,e)H-(s+l)+R(s+l)+e,(5+l)C2e/(s +1), (4.195)
где х(5+1|5,в)=М(х(5+1)|Улв); P(s+l|s, e)=cov(x(s+
+ 1),Х(5+1)|УЛ в)
На основе теории оптимальной линейной фильтрации,
развитой в гл. 3 и примененной к случайному процессу {х(^),
у(^)}, описываемому соотношениями (4.173) и (4.174),
следует, что второй сомножитель Я2(х(^+1)1^1*"*"''в) равенства
(4.192) является гауссовской условной плотностью
распределения вероятностей х(^+1) с условным математическим
ожиданием х(^+1|^+1. e) = Af(x(^+l)|i'i''+', в)и условной
корреляционной матрицей Р(^-|-1 l^+l, в) = соу(х(^+1). х(^+
-|-l|J'i''+'e)), задаваемыми соотношениями (3.7) —(3.9) и
(3.29), (3.30). Поэтому
Я2(х(А+1)1^1"+'* в)=(2я)-"/2|Р(Л+1|;^+1,в)|-«/2Х
Хехр{-р-(^+1|^+1,в)Р-'(^+1|Л+1,в) р(^+
+ 11^+1,в)}. (4.196)
где
р(^+1|^+1, в)=х(Л+1)-х(А+1|^-Ь1,в). (4.197)
С учетом (4.192) — (4.197) плотность распределения
вероятностей я(х(А-|-1). i'i*'''Me) приобретает следующий вид:
^{x{k+1), yf+* I в) = (2^)'-«<*+'>+">/2|р{kJr\\k+\, е)|-'^2х
X П I В(5+ 1 U, в)Г'/2ехр /_-L[p»(A+ 1 I ^-Ы, е)Х
ХР-'(*+1 1^+1. в)р(^-Ь1 1^+1, в) +
k
+ 2^4s+ 1 I s, в)в-(5+ 1 I s, e)v(5+ 1 I s, в)]}, (4.198)
s-O '
9—6899 129
где
v(s+\\s, e)=y(s+l)-y(s+l|s,e). (4.199)
В целях упрощения последующих математических
выкладок при решении задачи оценивания следует заменить
оптимизацию функционала я(х(^+1), Yl>^+ЦQ)) оптимизацией
монотонно возрастающей функции его (например,
логарифмической), позволяющей преобразовать произведения, входящие
в правую часть равенства (4.198), в соответствующие суммы.
Натуральный логарифм указанной плотности вероятностей
будет иметь вид
J(x{k+\), e) = lni:(x(^+l). yf+'|e)==- ^^^+^^+"1п2^-
к
1 1г. Г D /А г 1 I А г 1 а\ I 1
-^1П
Р(^+1|^+1. в)|—i-Jjln|B(5+l|5. в|-
)
s=0
--i-p'(^+l|^+l, в)Р-(^+1|^ + 1, e)p(^-fl|^+l,e)-
k
—^Y^V(s+l\s, в) В- (s + 1 i s. в) V (s + 1 I s, в), (4.200)
s=0
Поскольку при построении математического выражения
(4.200) уже учтены ограничения, накладываемые равенствами
(4.173) и (4.174), решаемая задача становится задачей
нахождения безусловного экстремума для функционала /(х(А-Ь
,4-1),в). Необходимые условия оптимальности оценки
{х-* (^+11^+1). в (^+1)} имеют вид
V J(x(k+ 1), в)1 . =0; (4.201)
в(А+1)=в(А+1)
Ve/ (X (k + 1), в)|^(,^ ,)^^А(,^, , ,^ ,) = 0. (4.202)
щ+1)^Ъ(к+ 1)
Используя выражение (4.200), представим уравнения
(4.201) и (4.202) в явном виде. Так как оцениваемый вектор
x(^fe-|-l) входит в выражение (4.200) только при помощи
функции p(ife+l|ife+l. в), то (4.201) приобретает вид
P^(k+l\k + 1. в) Р-\(к+1 \k+l, в)|,(^,)^,А(,+, , ,^,)= 0.
(4.203)
Умножая (4.203) справа на матрицу Р(^+1 |^+1.в),
транспонируя полученный результат и учитывая (4.197), приходим
130
к следующему решению:
x^(k+l\k+l) = x{k+\\k+l,Q(k+l)). (4.204)
Равенство (4.204) показывает, что оценка x^(k-\-l\k-\-l)
должна быть построена с использованием соотношений (3.7) —
(3.9), (3.29) и (3.30) при условии, что в(^^+1)=в(^+1).
Отсюда следует справедливость равенств (4.177)^(4.183).
Приведем к явной форме записи уравнение (4.202). Для
этого применим формулу (П.6) вычисления частных
производных от логарифма нормальной плотности распределения
вероятностей случайного вектора х(^+1) по векторному
параметру в к функционалу /(х(^+1)> в), описываемому равенством
(4.200). Получим, что уравнение (4.202) превращается в (4.184)
при выполнении (4.203). Соотношения (4.185) —(4.190)
получаются непосредственным дифференцированием по параметру
соотношений (4.177) —(4.183). А
Полученные соотношения (4.177) — (4.190) с
принципиальной точки зрения решают поставленную задачу, но при этом
имеется ряд особенностей, на которых следует кратко
остановиться:
1) соотношения (4.177) — (4.183) представляют собой, более
общий результат, чем обычный регуляризованный фильтр Кал-
мана, ибо с помощью оценок параметров в, и Bj уточняются
одновременно как диагональные элементы корреляционных
матриц В(^+1|^' 0(^+1)). и Р{k-\-l\k,Q{k-\-\)) описываемых
равенствами (4.182) и (4.178), так и систематические ошибки
ij,e,(^) и т]2в2(^) описания оцениваемых и измеряемых
параметров, что следует из (4.177) и (4.180);
2) оценки в,(^+1) и 62(^+1) должны быть получены в
результате решения нелинейного уравнения (4.184) при
использовании рекуррентных соотношений (4.177) — (4.183) и
(4.185) — (4.190). Это сложная математическая задача,
допускающая численное решение. Упрощение решения может быть
достигнуто при допущении о малом различии оценки в(^^),
полученной по выборке измерений Yl'^, и истинного значения
в(^);
3) оценкив,(^+1) и ва (^+1), а следовательно, и матрица
усиления фильтра К(^+1, в) зависят не только от априорной,
но и от измерительной информации Yl'^+\ поэтому фильтр
будет обладать свойством адаптации.
Пример 4.1. При синтезе автоматических систем одной из
важных задач является получение производных выходного
сигнала объекта, которые непосредственно не измеряются. Пусть
объект наблюдения (цель) движется вдоль линии визирования
ее радиолокатором. Двигатели цели расположены вдоль линии
9* 131
визирования радиолокатора и воздействуют на цель с
расчетным значением силы тяги ф(/). Искажение силы тяги |i(/)
обусловлено неидеальностью работы двигателей и влиянием
внешней среды. Движение цели описывается системой уравнений
Xi{'t)=Xi+i{t); i=\, 2; X3(t)=ko(p(t)-\-koh{t),
где ;ifi(/), X2{t), Xait)—соответственно координата, скорость и
ускорение цели вдоль линии визирования; ko — известный
постоянный коэффициент.
Наблюдению доступна дальность до цели, искаженная
помехами |2(0>
z{t)=Xi{t)+b{t).
Измерения радиолокатора производятся с очень высокой
частотой, так что процесс z{t) можно приблизительно считать
непрерывным. Процессы |i(/) и Izit) предполагаются гауссов-
скими с нулевыми математическими ожиданиями и
корреляционными функциями
M[b{t)b{t+r)]=g4(r); M[b{t)h{t+r)]=r4{x),
причем q^ и г' — неизвестны, однако известно отношение
сигнала к шуму q/r.
Требуется по измерениям радиолокатора найти оценки
Xi{t), £2{t), Xzit), оптимальные в среднеквадратическом
смысле.
Для решения этого примера воспользуемся обозначениями
и результатами модельной задачи 3.3. Тогда
X/ = [X, (t), X, (О, X, (0]'; dwt/dt = 5х (0;
О
О
F(0 =
'0 1 0"
0 0 1
0 00
u(0 =
L^o<p(0.
G(0 =
OJ
dyt/dt=zt; A(0=0; H(/) = [! 0 0]; dvtfdt=b{t)
R{t)=r';Q{t)=q\
Из (3.37) —(3.39) получаем оптимальный линейный
нестационарный фильтр:
Xt (О = ^«+1 (О + Ри Г-' {Zt - X, (0), t = 1, 2;
Я (0 = ^0 9(0 +Л./-'(2.-^1(0);
Pci=Pi+uf+Pi,i+i-r-'PuPir. i. /=1, 2;
Pi3=Pi+i,3—r-^PuPi3,i=l,2;
P^=-r-'Pxi+K'q\
TRtP{t\t)=\\Pij\\, t,/=1,2,3.
132
Поскольку система уравнений для элементов матрицы
\\Рц\\ имеет постоянные коэффициенты, то найдем
установившиеся значения Рц, т. е. Р,7=0. Решение будем искать в виде
В стационарном случае система дифференциальных
уравнений для элементов матрицы \\Рц\\ сводится к алгебраической
системе для коэффициентов ац, которые не зависят от ^ и г:
o,i+i,j-\-ai,j+i—aiiOi/^O, i, /=1, 2;
аг+1,3—аиа1з=0, t=l, 2;
Из этой алгебраической системы легко находим
aii = 2^o'^^; 012=2^0^/^; ai3=^o, поэтому уравнения для
оценок параметров движения цели принимают окончательный
вид
Xi (t) = ^j+1 (О + «uР' (г, - X, (0), t = 1. 2;
хЛ0 = ^о?(0 + «1зР'(2^-^1(0),
где р=(7Г-')'^^-
Полученный алгоритм для оценки ПДЦМ цели
представляет собой адаптивный инвариантный по отношению к
возмущениям фильтр. Функциональная схема объекта наблюдения
и указанного фильтра приведена на рис. 4.1.
Пример 4.2. Запуск КА на орбиту осуществляется путем
вертикального старта ракеты-носителя массой т. На движущу-
W)^
объект на5люденая
ХзГО
XzftJ
1 ^.
—1-<йН
L.
Г'
H2)-*ot,j^
I
Оптимальный,
дзильтр
кр
Ы^)
LLH?41>
(П
I
I I
Рис. 4.1. Функциональная схема объекта наблюдения и оптимального линей-
ного фильтра
133
о
/// /
Х7~777~Т77-У77~777~777
Местный, горизонт
Рис. 4.2. Схема сил, действующих
на стартующий КА
юся ракету действуют: сила тяги
ракетного двигателя Ft, сила
тяжести Fg, сила сопротивления
воздуха Fc и различные
возмущающие факторы AF (рис. 4.2).
Тогда уравнение движения
ЦМ ракеты имеет вид
Xi{t)=X2{t); X2{t)=a{t)—g+
+w{t),
где . .«1 {t) — координата
ЦМ;
.«2 (/)-—скорость ЦМ; а(/) =
= (Fr—Fc) /п-' — ускорение ЦМ,
создаваемое
негравитационными силами; w{t)^AFm~^ — ускорение ЦМ от возмущающих
сил.
На ракете установлены барометрический датчик высоты и
акселерометр, измеряющие xi(t) и a{t) при наличии
возмущений соответственно vi (t) и Уг {t):
yi{t)=Xi{t)+V:{t);y2{t)=a{t)+V2{t).
Возмущения, входящие в уравнения движения ЦМ и в
описание измерений, предполагаются независимыми и гауссовски-
ми, со следующими параметрами:
w{t)~N{0, q'); Vi{t) ~М{хз, n^t)); V2{t) ^N{0, Г2'),
где q' и Гг^ — постоянные известные числа; хз — const и ri^(t) —
неизвестные числа; ^^(0)—априорно заданное значение.
Измерения производятся в дискретные моменты времени
tk {k=0, 1, 2...) с постоянным временным шагом А/, так что
h=kM:
Требуется определить оптимальные в среднеквадратиче-
ском смысле оценки параметров Xi{t), X2{t), Xsit) и ri'ii) по
выборке дискретных измерений нарастающего объема Yl^^+^^
= {«/(•(4); t=l, 2; s=0, 1, 2 ^+1} на моменты времени
проведения измерений.
Выразив a{t)=y2{t)—V2{t) и учитывая, что Хз — const,
построим следующую модель для описания данного примера:
Xi{t)=X2{t);x2{t)=-g+y2{t)+w{t);
Mi)=0;yi{k+l)=xi{k+l)+v:{k+l),
где ai(/)'~iV(0, ^2+Г2^); аргумент (^+1) в последнем
равенстве указывает на момент времени tk+i-
В матричной форме эта система уравнений будет иметь вид
\t = aoU{t) + F{t)Xt + Gwt;
«/,(^+l) = Hxfe+,-ft»,(^-fl),
134
где
^t=[xi{t), X2{t), X3{t)r; ао=[0 1 0]-;
u{t)=-g+y2it)\
F(t) =
Го 1 o1
00 0
00 0
; G =
Го]
1
0
Wf = w (t);
H = [10 0]; x,^, = {x„t = t,^,}.
Перейдем в этом матричном уравнении к дискретной
форме записи. Для этого считаем u{t) и Wt кусочно-постоянными
функциями времени. На интервале времени tk^t^tk+i, k^
= 0, 1, 2... предполагаем и{t)^Uk^const; Wt^wk^const
Тогда, используя формулу [П.23], будем иметь рекуррентное
соотношение для описания движения ЦМ КА
Xft+i = Ф (^-f 11 ^) Xft-f 4f (yfe-f 11 Л) «ft-i-r (yfe-f 11 ^) ЙА,
где переходная матрица
1
Ф (У^ + 1 I ^) ==
)^E+F(/-x) =
'1 М 0"
0 1 0
0 0 1
I
i — z о
1 о
о 1
T(k+\\k)= J Ф(У^+1 I T)GdT = [A^V2 Д/Of.
Для нахождения требуемых оценок используем обозначения
и результаты решения задачи 4.1.
Из (4.7) — (4.12) получаем уравнения оптимального
фильтра:
х,(^|^)=х,(^1^_1)+Кй(«/,(^)-д:,(^|^-1));
¥,k=Pu(k\k-\)l{Pn{k\k-\)+n4k));
Рп{к\к) = КипЦк),1=\,2,Ъ\
/,/ = 2, 3;
h4k) = -j[yi{k)-x^{k\k)Y+{\--j)r^{k-\),
где \\Pi,{k\k)\\ = ^{k\k); \\Piiik\k-\)\\ = V(k\k-\).
135
Из (4.5) и (4.6) следуют соотношения для
экстраполирующего устройства:
Гд:^;^ \k)+x,{k\ k) Ml Г0,5ДГ
Х(^+1|^)= X,{k\k) + Ы (_g+yj^));
P(^+l \k) = <i>(k+\ \k)V(k\ ^)ф^(^+1 \k) +
+ Г(^+1 |^)Г(^+1 \k){g^ + r,%
Глава 5
Задачи оценивания при статистической
априорной неопределенности
J.I. Математические операции с эллипсоидами
неопределенности (основные результаты)
Настоящий параграф является вводным к данной главе и
имеет целью напомнить читателю некоторые сведения из
области выпуклого анализа. Это необходимо в связи с тем, что
при гарантирующем подходе к решению задач оценивания
неопределенные величины задаются областями их возможных
значений, а операции над неопределенными величинами
сводятся к соответствующим операциям над областям. В
дальнейшем в качестве областей неопределенности будут
использоваться только эллипсоиды неопределенности, что удобно по
ряду причин: эллипсоиды — замкнутые выпуклые множества
[80; 105]; при линейных преобразованиях эллипсоиды
остаются эллипсоидами; для выпуклых областей с помощью
эллипсоидов можно получить удовлетворительную аппроксимацию;
эллипсоиды неопределенности можно рассматривать как
гарантированный аналог эллипсоидов рассеяния для гауссовских
случайных величин; минимизация объема эллипсоида
неопределенности соответствует методу наименьших квадратов или
методу максимума правдоподобия в теории вероятностей.
Приведем необходимые для решения задач оценивания
результаты, показывающие, как преобразуются эллипсоиды
неопределенности при выполнении некоторых операций над
неопределенными величинами.
Эллипсоид неопределенности с центром ni^[/ni,...,/п„]'' и
размерами, определяемыми симметричной положительно
определенной матрицей Р (размерности п'Х.п), представляет собой
136
замкнутое выпуклое множество Q(m, Р) векторов х^[;еь...
...уХпУ, а именно,
Q(ni, Р)={х: (X—т)Ф-»(х—т)^!}. (5.1)
Задача 5.1 (Линейное преобразование). Дапо:
1. Вектор \^Qix(mx, Рх);
Qx(mx, Px) = {x:(x—mx)'Px-'(i^—m.)^l}. (5.2>
2. Вектор y=Hx+V, (5.3)
где Н — матрица, для которой существует псевдообратная
матрица Н+^ (Н''Н)'Н''; V — вектор сдвига.
Доказать: 1. Вектор y^Qy(my, Ру);
Qyimy, Ру) = {у:{у-туУРу+{у-ту)^1}; (5.4)
2. Вектор ту=Нтх+\; Ру = НР:,Н\ (5.5)
Доказательство. Учитывая, что существует псевдообратная
матрица Н+, из равенства (5.3) находим
x=H+(y-v). (5.6)
Подставляя значение х из (5.6) в неравенство, описывающее
эллипсоид (5.2), получаем
(y-v-Hni«)T(H+)^P»-'H+(y-v-Hni«)^l. (5.7)
Замечая, что
р,-1=Р,+ и (Н+)Ф,-1Н+=(НР,Н^)+,
из (5.7) получаем (5.4) и (5.5). А
Задача 5.2 (Сложение неопределенных величин). Дано:
1. Неопределенные векторы х,- принадлежат эллипсоидам
Xi^Qiimi, Pi), i=l, 2, (5.8)
где m,- — векторы центров эллипсоидов, Pj — симметричные,
положительно определенные матрицы.
2. Неопределенный вектор x^xi+X2 принадлежит
замкнутой выпуклой области [80]
Q={x:x=Xi-fX2, Xi^Qii{mi, Р,), t=l, 2}. (5.9)
Доказать, что существует эллипсоид Qx(шж, Рх)
наименьшего объема, содержащий область Q, параметры которого
определяются при помощи уравнений
nix=nii-fm2; (5.10)
Px=(l-fa)P,-f (l-fa)P2/a, а>0, (5.11)
где а — корень алгебраического уравнения
a^-fa—rt[tr(A-faE)-']-'=0; (5.12)
[Alio -I
матрица собственных значений, определяемая
137
уравнением
det(Pi —AjPi) = 0, i=\7n. (5.13)
Доказательство справедливости выражений (5.10) — (5.12)
можно найти в работе Ф. Л. Черноусько [105]. Читателю
предлагаем показать, что построенная операция обладает
свойством коммутативности, но ассоциативность в общем случае не
имеет места. Поэтому при сложении более двух
неопределенных векторов вида (5.8) результирующий эллипсоид зависит
от порядка сложения и не совпадает с эллипсоидом
минимального объема для всех слагаемых.
Задача 5.3 (Следствие 1 задачи 5.2). Дано:
1. Справедливы соотношения (5.8), (5.9).
2. Эллипсоид Q2(ni2, Р2) такой, что
Р2 = е2Р2°, (5.14)
где е — малый параметр; Р2° — симметричная положительно
определенная матрица.
Доказать, что параметры эллипсоида
минимального объема Q,x{mx, Рж), аппроксимирующего выпуклую
область Q, задаются равенствами
тж^п11+п12; (5.15)
Px=(l+ev)Pi+e7-'P2°; (5.16)
Y=[n-4r(Pr'P2°)]'^ (5.17)
где п — размерность векторов х,-, t^l, 2.
Доказательство. Так как справедливы соотношения (5.8) и
(5.9), то из задачи 5.2 следует, что параметры эллипсоида
^х{тх, Рж) задаются уравнениями (5.10) — (5.13). Поскольку
равенство (5.10) не зависит от Р2, то справедливость (5.15)
доказана. Найдем, как преобразуются равенства (5.11) — (5.13)
при выполнении условия (5.14). Найдем собственные значения
Л,=еМгО, 1=1Гп. (5.18)
Подставляя (5.14) и (5.18) в (5.13), получаем
det(P2<'—Лг<'Р1)=0, 1=Г7^. (5.19)
Уравнение (5.19) показывает, что Аг° (i^l, п)—корни
характеристического уравнения, построенного для матриц Р2°
и Pi.
Преобразуем теперь уравнение (5.12), предварительно
записав его в эквивалентной форме:
-1
«= + «_« 21/(Лг + а)
138
= 0. (5.20)
Подставив в (5.20) значение Л; из (5.18), после
элементарных преобразований определим
п
2 (l + eMj» «-')-' = «(! +«Г'- (5.21)
1=1
Решение уравнения (5.21) будем искать в виде
а=еу. (5.22)
Подставив (5.22) в (5.21) и выполнив в обеих частях
равенства разложение в ряд Тейлора по параметру е до членов
первого порядка малости, найдем
п
2 (1 - гЛ» Y-'+ о (г)) = я (1 - SY + о (г)),
(=1
где о(е)—сумма членов более высокого порядка малости,
чем е.
Пренебрегая выражением о(е), находим
г 1 11/2
Т = «"' 2 ^г° • (5-23)
Использовав (5.19), вычислим
п
2^e<'=--tr(Pr'P.°)- (5.24)
Из (5.23) и (5.24) непосредственно следует (5.17).
Наконец, преобразуем равенство (5.11), подставив вместо а его
значение из (5.22):
Px=(l+tev)Pi+(e-fe2Y)P2V'-
Пренебрегая значением е'у по сравнению с е, из этого
равенства получаем (5.16). Д
Задача 5.4 (Следствие 2 задачи 5.2). Дано:
1. Справедливы соотношения (5.8) и (5.9).
2. Эллипсоиды Qi(nii, Pi) и Q2(m2, Р2) подобны и
одинаково ориентированы, причем
P2=vPi, V —скаляр. (5.25)
Доказать, что аппроксимирующий эллипсоид Qx{mx, Рх)
задачи 5.2 имеет параметры
nix=mi-{-m2; (5.26)
P,= (l+v'/2)2p,. (5.27)
139
Доказательство: Равенство (5.26) следует из (5.10).
Уравнение (5.13) с учетом (5.25) принимает вид
(v—^,)detPi = 0, 1=\Гп.
Отсюда следует Ai^v, i^\, п, т. е. уравнение (5.13)
имеет п равных корней, поэтому (5.12) запишем в виде
и'+а. — п\ Sl/(v + a)
-1
= 0,
откуда
a2=v. (5.28)
Подставляя значение а из (5.28) в (5.11) и учитывая (5.25),
находим искомое равенство (5.27). А
Задача 5.5 (Аппроксимация области пересечения
эллипсоидов). Дано:
Неопределенный вектор х принадлежит выпуклой области
180]:
Q={x:xeQi(mi, Р,) и xeQ2(m2, Рг)}, (5.29)
где Q,(m;, Р,), i^l, 2 — эллипсоиды, центры которых задаются
векторами гп,-, а размеры — симметричными положительно
определенными матрицами Р,-.
Доказать, что существует эллипсоид Q^(m^, Р^)
наименьшего объема, параметры которого приближенно задаются
следующими равенствами:
тх = (™1 + 't'Pi^(^'Pi ^~'^'' ес-^« ^ е I-1/'^; 1]; (5.30)
1 nil , если с < — 1//г;
р-1 _ / ^^~'-*"')^^'^^Pi^~"^ + *"'Pi"'' ^"^"^ ^^^~ ^'"'^ ^^5
[ РГ' , еслис<—1//г,
(5.31)
где
/=P2-i(m2—mi); (5.32)
р= [ (m2-mi) ^P2-i (m2-mi) ]-i/2; (5.33)
c=(^P,/)-i/2(l—p)p-2; (5.34)
W= (n+l)-i.+ (l-(n+l)-')c; (5.35)
a=(l-(n+l)-i)(l-c); (5.36)
Ь2=(1+(„2_1)-1)(1_с2) (5 37)
С доказательством решения этой задачи и условиями
квазиоптимальности решения (5.30) — (5.37) можно ознакомиться
в работе [105].
140
Исследование решения задачи 5.5, выполненное Ф. Л. Чер-
ноусько, показало, что оно является квазиоптимальным в
смысле минимума объема аппроксимирующего эллипсоида. Это
решение оказывается тем более близким к оптимальному, чем
больше оси эллипсоида ЛЗгСгпг, Рг) по сравнению с fii(mi, Pi).
Поэтому (5.30) — (5.37) целесообразно применять в том случае,
когда det Pi^det Рг; в противном случае индексы 1 и 2
следует поменять местами.
5.2. Апостериорная эллипсоидальная аппроксимация
области неопределенности оцениваемых параметров
Рассмотрим задачи линейной дискретной и непрерывно
дискретной фильтрации и экстраполяции, в которых априорная
информация относительно возмущений оцениваемых и
измеряемых параметров, а также о начальных значениях
оцениваемых параметров ограничивается априорным заданием
эллипсоидов неопределенности, которым они принадлежат. Сведения
из теории выпуклого анализа, приведенные в § 5.1, позволяют
для этих задач получить на каждый момент времени довольно
грубые по точности, но простые по реализации апостериорные
аппроксимации областей допустимых значений оцениваемых
параметров при помощи эллипсоидов. Эти эллипсоиды
неопределенности гарантированно содержат оцениваемые параметры
и имеют меньшие размеры по сравнению с их априорным
заданием. Центры аппроксимирующих эллипсоидов
неопределенности можно рассматривать как один из видов
гарантированных оценок параметров, а симметричную положительно
определенную матрицу, задающую размер эллипсоида, использовать
для оценки точности решения задачи фильтрации или
экстраполяции.
Задача 5.6 (Алгоритм Черноусько). Дано:
1. Модель системы
Xk+i = iik+^{k+l\k)Xk+b,Q,. (5.38)
2. Модель измерений
yft+i = Hft+iXft+i+iift+i. (5.39)
3. Априорная информация:
XoeQo(mo, Ро); efteQe(0, Pe{k)); (5.40)
TifteQ„(0,P^(A:)),
где йо(гпо, Ро), йв(0, Pe(k)), fi,,(0, Pti(^))—эллипсоиды
неопределенности.
Доказать: 1. Параметры эллипсоида Qx(m(k-\-l\k),
Рж(^+11^) I l^i*"') минимального объема, аппроксимирующего
область, в которой находится вектор х^+ь при условии, что из-
141
вестна выборка измерений У,*-1={у5 :s=l, k—l},
описываются рекуррентными соотношениями
т(к-\-\\к)=ан+Ф{к-\-1\к)т(к\к); m(0|0)=mo; (5.41)
РАк+\\к) = {ак-^+\)Ф(к+1\к)Р:с(к\к)ФЦк+1\к) +
+ {\+ak)bkPe{k)bk\ Р„(0|0) = Ро, (5.42)
где Oft — единственный положительный корень уравнения:
Oft^+aft—rt[tr(Aft+aftE)-i]-i = 0; (5.43)
— матрица собственных значений, определяемая
уравнением
йе1{Ф{к+1\к)Р:с{к\к)ФЦк+1\к)-Лг^Ь^Ре(к)Ь^-) = 0. (5.44)
2. Параметры эллипсоида Qx{n\(k\k), Px{k\k)\Yl'^)
минимального объема, аппроксимирующего область, в которой
находится вектор Xft, при условии, что известна выборка
измерений yi''^{ys; s^l,k}, удовлетворяют соотношениям
{m(k\k-\) + <^,P^{k\k-l)l,{l,'PAk\k-l)Q~'
m(^l^)= если CfiGi[—n~\ 1];
m{k\k—l), если Cft< — «"';
(5.45)
((^r-h-V,h'{Ik PAk\k-\)ir'" +
Pr'ik I k) = \+bc'Pr'{k I ^-1), если c,^\-n~\ 1]; (5.46)
где
1,= Н\Я-1,{у,-Щт(к\к-\))- (5.47)
fik={yk-nkm{k\k-iyRk-4yk-yikm{k\k-l)); (5.48)
c,= (l^kPx (k\k-l) h) -1/2 (1-pft) rh; (5.49)
,l,ft=(rt+l)-i + (l-(n+l)-i)Cft; (5.50)
фА=(1-(и+1)-1)(1-с*); (5.51)
б2,= (1 + (и2_1)-1)(1_с2,); (5.52)
n — размерность вектора x^.
Доказательство: Так как Xk^Qx{m{k\k), Px{k\k)\Y>>{) и
вй=£2е(0, Р9(^)), то, используя (5.4) и (5.5), получаем
buQk^QiiQ; bftPe(A:)bift); (5.53)
Ф{к+\\к)хи+!Ик^^2{Ф\к+\\к)т{к\к)+йи\
Ф{к+\\к)Р«{к 1 к)Ф^{к+\ \к)). (5.54)
142
Поскольку вектор x^+i описывается соотношением (5.38),
то для нахождения параметров эллипсоида йж(гп(Л-|-11^)>
Px(k-\-l\k)\Y''-^i) можно воспользоваться результатами
решения задачи 5.2. Применяя соотношения (5.10) —(5.13) к
преобразованию (5.38) с учетом (5.53) и (5.54), получим искомые
выражения (5.41) —(5.44).
Найдем соотношения для вычисления параметров
эллипсоида Qx{tn(k\k), Px(k\k)Y''i). Предположим, что на момент
времени k отсутствует информация о том, что неопределенный
вектор Xk^Qx(m{k\k—l), Px(k\k—l)\Y^-^i) и известно посту-
гшвшее измерение у^ и r\k^Qi^(0, Р,,(Л)). Тогда, используя
(5.4) и (5.5) применительно к (5.39) и (5.40), будем иметь, что
Xft принадлежит эллипсоиду £2ж(П1а, Ра) со следуюш,ими
параметрами:
mft=H+ftyft; Pft=H+feRft(H+ft)^ (5.55)
где H+ft^ (H''ftHft)-iH'^ft —псевдообратная матрица для
матрицы Hft.
Учитывая априорную информацию, известную на момент
времени k, а именно,
Xk^Qx{m{k\k-l), Р(А:|А:-1) | У*-!,),
видим, что вектор х^ принадлежит области, являющейся
пересечением эллипсоидов Qx{m(k\k—\), Px{k\k—l)\Y^-^i) и
Qa:(nife, Pft). Для нахождения параметров эллипсоида
Qx(tn(k\k), Рж(^|Л)|У*1) можно использовать
результаты решения задачи 5.5. Воспользовавшись (5.30) —
(5.37), в которых заменим mi=m(^|^—1), Pj = Pj.(^|^—1),
тг^гпд, Pj^Pft, и используя (5.55), непосредственно получим
искомые выражения (5.45) — (5.52). Л
Из сделанных ранее замечаний к задаче 5.2 следует, что
решение (5.41) —(5.44) для одношаговой задачи экстраполяции
является оптимальным в смысле минимума объема
аппроксимирующего эллипсоида. При многократном применении этих
операций в многошаговой задаче экстраполяции построенные
оценки не являются оптимальными. В связи с замечаниями
к задаче 5.5 эллипсоид Qx{tn{k\k), Px{k\k) |y*i), определяемый
формулами (5.45) —(5.52), близок к эллипсоиду минимального
объема, содержащему апостериорную область допустимых
значений оцениваемых параметров, если все оси эллипсоида
Qx(n\{k\ik—l), Px{k\k—l)\')['^~h) много меньше, чем оси
эллипсоида Йж(п1а, Pft), задаваемого равенствами (5.55). В
противном случае, когда объем эллипсоида Qx{v^k, Ра) меньше,
чем объем эллипсоида йж(п1(Л|Л—1), Рж(^|Л—1) | У*-^),
используя для решения задачи формулы (5.30) — (5.37), первым
эллипсоидом будем считать Йж(п1а, Р^).
143
Задача 5.7 (Непрерывно-дискретное оценивание). Дано:
1. Модель системы
dxt/dt=ai(t)+Fit)xt+b(t)Qt, t>to. (5.56)
2. Модель дискретных измерений
Ук=Чк^к+Щк, k=l, 2. (5.57)
3. Априорная информация:
xoeQo(mo, Pq); Qt^Q&{0, Ре(0);
TifteQ„(0, Р„(А:)). (5.58)
Доказать: 1. В промежутке между k-м и Л+1-м
измерениями параметры эллипсоида йж(гпг, Pi|y*i) минимального
объема, аппроксимирующего область, в которой находится
вектор Xt, при условии, что известна выборка измерений У'ь
удовлетворяют уравнениям
dmtl4t=a(t)+F{t)mt; (5.59)
dPtldt=F{t) Pt+PtF' (t) +ytPt+
+V-^b(OPe(Ob^(0; (5.60)
Vt={«-Hr[P-^b(OPe(Ob^(0]}^/^
tk<i<tk+i (5.61)
при начальных условиях
Pt = Px{k\k);mt==:m{k\k).
2. На моменты проведения измерений параметры аппрок-
y*i) задаются
симирующего эллипсоида Qx(i^(k\k), Px{k\k)
соотношениями (5.45) —(5.52), в которых т(^
P^(k\k—1) = P<6_ являются решениями уравнений (5.59) —
(5.61) на момент времени tk-i-
Доказательство. Задавшись малым приращением времени
А^ представим уравнение (5.56) в интегральной форме:
t + At
х,+д^ = х,+ j [F(t)x, + b(t)e, + ajdx. (5.62)
t
Применим теорему о среднем для вычисления интеграла,
входящего в (5.62),
Xt+^t^{E+F(t+XM)At) +
+b {t-\-^t) Qt+шМ+а (t+KM)At, (5.63)
где 0<Л,<1.
144
Так как xt^Qx{mt, Pt\Y^i) и Qt+e&t^Qe(0, Pe{t+lM)), то,
используя (5.4) и (5.5), получаем
(E-\-F{t-\-hM)At)xt+a{t+},M)M^
^Qi{{E+F{t+kAt)At)mt-\-ei(t+kAt)At,
(E+F{t+KAt)At)Pt(E+F{t+},At)At)-')); (5.64)
Д^Ь {t-\-XAt) в1+ш^^2 (О At^b (t+
+lAt) Ре {t+XAt)b-'{t+KAt)). (5.65)
Рассматривая At как малый параметр, применим
результаты решения задачи 5.3 для нахождения параметров эллипсоида
Qx{tnt+^t, Pi+Ai|Y*i), которому принадлежит вектор х^+д^.
Подставляя (5.15) —(5.17) в (5.63) —(5.65), получаем
mt+^t=mt-\-At{F{t+XAt)mt-\-&(t-\-KAt)); (5.66)
Pt+^t=(l+Atyt) (E+F{t+XAt)At)Pt{E+
+F{t+XAt)At) ^+Aty-4b (t+lAt) Pe (t+XM) b^ (^+
-]-XAt) = Pt+At[F{t+hAt)Pt+PtF^t+XAt)+yPt+
-j-V"'ib (t+lAt) Pe (t+XAt) b- (t+lAt) ] +o (At), (5.67)
Y= [п-Чг{[ (E-j-F(^-j-iMO АО PKE-j-F(^-j-
+lAt) Aty] -lb (^-j-ЯАО Pe (t+XAt) b^ (^+ЯДО } ] •/^=
= [rt-Hr {P-i^b (^-j-MO P9(^-j-M0bT (^-j-
+XAt)}y/^+o{At), (5.68)
где o(A0 —члены более высокого порядка малости, чем А^.
Разделив (5.66) —(5.68) на Д^ и переходя к пределу при
At-^0, получим дифференциальные уравнения (5.59), (5.60) и
равенство (5.61). Доказательство справедливости того, что
xt^Qx{m(k\k), Px{k\k)Y''i) при t^tk, и определение
параметров этого эллипсоида полностью аналогичны задаче 5.6. Л
5.3. Апостериорные эллипсоидальные аппроксимации
области достижимости оптимальных
среднеквадратических оценок
В сравнении с предыдущим параграфом здесь рассмотрим
более общий случай, часто встречающийся при решении
прикладных задач оценивания, когда относительно возмущений
в системе и в канале наблюдений известна комбинированная
информация как статистического, так и неопределенного
характера. Если статистические возмущения являются гауссовскими,
а задача оценивания — линейная, то для формирования
апостериорных оценок могут быть использованы методы,
изложенные в гл. 3, в предположении, что неопределенные возмущения
10—6899 145
известны. Возникает вопрос: какой области гарантированно
будут принадлежать эти оценки при изменении неопределенных
возмущений в пределах их областей допустимых значений.
Если алгоритмы формирования оценок (в предположении, что
неопределенные возмущения известны) являются линейными
относительно этих возмущений, а априорные области
неопределенности возмущений замкнуты, выпуклы и симметричны, то
апостериорная область оценок будет также симметричной,
причем центр симметрии ее есть образ центров симметрии
областей допустимых значений возмущений [46, 80]. Конфигурация
же области оценок может быть сложной, поэтому если в
качестве гарантированной оценки используется центр построенной
области допустимых значений оценок, то определение
максимальной погрешности этой оценки представляет собой весьма
трудоемкую задачу. Упростить ее и грубо определить
максимальную ошибку гарантированной оценки можно, если область
оценок аппроксимировать эллипсоидом минимального объема,
содержащим ее. В этом случае большая полуось эллипсоида
будет давать искомую максимальную погрешность
гарантированной оценки. Рассмотрим построение таких
аппроксимирующих эллипсоидов в линейных задачах дискретной и
непрерывно-дискретной фильтрации и экстраполяции.
Задача 5.8. Дано:
1. Модель системы
Хк+1=Ф{к+1 [k)Xh+bkQk+GkVfh. (5.69)
2. Модель дискретных измерений
yk = VLkXk+Bkr\k+Vk. (5.70)
3. Статистическая априорная информация:
хо-Л^(хо; Ро); w,~iV(0; Qft); Vft-iV(0; R,);
Xo не зависит от w^ и v*;
>
V
* -
\
0 Rft.
где 6fe, —символ Кронекера; xq — неизвестно.
4. Априорная информация об областях неопределенности:
Хо, Qk, щ — неизвестны и принадлажат эллипсоидам
неопределенности с известными параметрами
XoeQo(mo, Рж(0)); Qk^Qe(Qk, Ре(^));
щ^а^Ы, Ря(^)), (5.72)
где Рж(0), Ре(^) и Р,, (Л) — положительно определенные
матрицы.
146
Доказать: 1. Оценка х(Л+1 |^)=M[Xft+i| У*,, 9^, Т1*ь Xq}
принадлежит выпуклой области, аппроксимируемой
эллипсоидом неопределенности Qx{m{k-\-l\k), Px(k-\-l\k))
минимального объема, параметры которого удовлетворяют соотношениям
т(к-\-\\к)=Ф{к+1\к)т{к\к)+Ъ.ъО'^-,
m(0|0)=mo; (5.73)
Рх(к+\\к) = (а-^-\-1)Ф{к+1\к)Рх{к\к)ФЦк+
+ l|fe) + (l+laft)b,fePe(A:)b^, (5.74)
где Oft — положительный корень уравнения
a2ft+.aft-rt[tr(Aft+afeE)-i]-i = 0; (5.75)
L'O' '.А„'А
А;^ =■••;_ • I — матрица собственных знач(.ний, определяемых
уравнением
йе1{Ф{к+1\к)Рх(к\к)ФЦк+1\к)-
-Ai,,bkPe{k)b\)=0, i=lT^ (5.76)
Y\ = {t/i Ук}; e"! = {01, ..., Gft}; Ti*i = {тц ..., Tift}.
2. Оценка x{k\k)^M[xk\Y>'i, 9*~4, •n'^i, Xq] принадлежит
выпуклой области, аппроксимируемой эллипсоидом
неопределенности Йж(п1(^|^), Рх{к\к)) минимального объема,
параметры которого задаются соотношениями
m{k\k)=m{k\k-l)+Kk{yk-yikm{k\k~l)-Bk^h); (5.77)
P,(k\k) = {^-h+l) (E-KftHft)P4^|^-l) (Е-
-KftHft)--j-(l-j-pft)KftBftP„(A:)B-ftrft; (5.78)
Kk=Pik\k-l)H\[HkP(k\k-l)H\+Rf,]-i; (5.79)
P{k\ к—1)==Ф{к\к — 1)Р{к—1 I к~1)Ф^{к \k—l) +
+ G*_xQft_iGLr, (5.80)
Р{к\к) = {Е-К^П,)Р{к\к-1); P(0|0) = Po, (5.81)
где ph—положительный корень уравнения
p2ft-j-p,fe-rt[tr(Aft-j-pftE)-i]-i = 0; (5.82)
L'o 'kA~
Xi^ = \ • • ■ ■• I—матрица собственных значений, определяемая
уравнением
uet[{E-Kknk)Px(k\k-l) {Е-КкП,у-
-UKftBftP„(A:)B^K^,fe] = 0, 1=1, rt. (5.83)
10* 147
Доказательство._Из условий (5.69) —(5.71) в
предположении, что известны хо, 9*i, 11*1 и выборка измерений У*1,
следует, что калмановские соотношения (3.7) —(3.9), (3.29) и (3.30)
применимы для определения условных математических
ожиданий
х{к+1\к) = Ф{k+\ \k)x{k\k) +b,4eft; (5.84)
x(k\k) = iE-Kkn,)x{k\k-l)+Kkyk—KkBkr\k, (5.85)
где коэффициент усиления Kk вычисляется при помощи
соотношений (5.79) —(5.81), в которых
P(A.|A.)=cov(Xft, Xft|y*i, е*-Ч, Ti",, Хо);
P(k[k-\)=coY(Xk, Xk\Y^^-h, е^-Ч, Ti^-ii, Хо).
Как следует из (5.79) —(5.81), матрицы P{k\k), Р(А!|А!—1),
а следовательно, и коэффициент усиления Кь не зависят от
того, какие конкретно значения принимают Xq, 64 и т1^ в
эллипсоидах неопределенности (5.72), поэтому для вычисления К*
достаточно априорной статистической информации (5.71).
Используя (5.4), (5.5), (5.10)-(5.13), (5.72), (5.84) и
(5.85), нетрудно показать справедливость соотношений
(5.73) —(5.78), (5.82) и (5.83). Читателю предлагается
проделать эти операции самостоятельно аналогично решению первой
части задачи 5.6. Л
Задача 5.9. Дано:
1. Модель системы описывается стохастическим
дифференциальным уравнением
dxt=F (t)xtdt-\-b{t)Qtdt-\-G{t)dwt. (5.86)
2. Модель дискретных измерений
y.k=HhXi-\-Bkr\k-\-Vk. (5.87)
3. Статистическая априорная информация:
Wt — процесс броуновского движения с нулевым математи-
•lecKHM ожиданием и
M[dwtdw\] = Qt6 (t—t) dtdx;
Xo~iV(xo; Po); Vk~N{Q; R*); (5.88)
cov(Vb v/) = Rft6ft/, 6ft/ —символ Кронекера; Xq, {w^} и {Vft}—
независимы; xq — неизвестно.
4. Априорная информация об областях неопределенности:
Хо, Эг, ц-г принадлежат эллипсоидам неопределенности с
известными параметрами
XoeQo'(rno,Px"(0)); Qt^^QiQt, Ре(0);
Ti4eQ„(Tift, Рл(А:)). (5,89)
148
Доказать. 1. Оценка x{t\k)=M[xt\Y''u G'o, 11*1, xq] при
t^[tk, tk+i] принадлежит выпуклой области,
аппроксимируемой эллипсоидом неопределенности Qx(tn(i\k), Рж(^|^))
минимального объема, параметры которого удовлетворяют
уравнениям
dm(t\k)ldt=F{t)m(t\k); (5.90)
dP:c{t\k)ldt=F{t)Px(t\k)-\-Px(t\k)F^t) +
+ytP.(t\k)+y-hb(t)Pe{t)b^t); (5.91)
yt={n-4T[P-^4t\k)b(t)Pe(t)bm)]V'' (5.92)
с начальными условиями m(t\k)^m{k\k)_и Рж(^|^)^Рж(^|^).
2. Оценка x(k\k)^M[xh\Y'^l, Q%, ti''i, xq] принадлежит
выпуклой области, аппроксимируемой эллипсоидом
неопределенности Qx{^n{k\k), Px{k\k)) минимального объема с
параметрами, задаваемыми соотношениями (5.77) — (5.79), (5.81) —
(5.83), где условная корреляционная матрица P{k\k—1)^
^P{t\k—1) при t^tk является решением уравнения
dP{t\k-l)/dt=F{t)P(t\k-l)+P{t\k-l)F^t) +
+ G{t)QtGHt) (5.93)
с начальным условием Pit\k—1)^Р(Л—1|Л—1).
Доказательство. Из условий (5.86) —(5.88) в
предположении, что известны
х"о, 9*0= {Эх: 0<т<0. ^^1= {Ль • • - пО
и выборка измерений У*1^{у1,... ,Уй}, следует, что для
определения x(t\k), t^[t-i, tk+i] и x{k\k) применимы уравнения
(3.5)-(3.9)..
При t^[U, tk+i]
dx{t\k)/dt=F{t)x(t\k); (5.94)
dP{t\k)/dt=F{t)P{t\k) +
-\-P{t\k)F^t) + G{t)QtGHt). (5.95)
При t^t-i
x(k\k)=x(t\k-\)-\-K-,(yk-likX(t\k-l)-Bkr\k); (5.96)
K,= P(t\k-l)li^k[4kP(t\k-l)li^k+Rk]-'; (5.97)
P(k\k) = {E-Kk4k)P{t\k-l). (5.98)
Используя (5.94), (5.89) и повторяя последовательно все
этапы доказательства первой части задачи 5.7, получаем
искомые уравнения (5.90) —(5.92).
Используя (5.4), (5.5), (5.10) —(5.13), (5.95) —(5.98) и (5.89),
непосредственно убеждаемся в справедливости второй части
этой задачи. Д
149
5.4. Минимаксное оценивание в статистически
неопределенных ситуациях
Методы решения задач оценивания, в которых возмущения
системы и измерений имеют как известное статиститеское
описание, так и описание при помощи замкнутых выпуклых
областей неопределенности, могут быть различны. Один из таких
методов, сводящийся к построению информационного
множества, был рассмотрен в § 5.2 и 5.3. Здесь же остановимся на
минимаксном подходе, суть которого заключается в том, чтобы
построить такие оценки, максимальное расстояние от которых
до границы множества было бы минимальным из возможных.
Минимаксную оценку х* на замкнутом выпуклом
множестве Qx, удовлетворяющую условию
•ч •ч
max {(х — \*У (х — х*)] = min max [(х — х)"' (х — х)],
будем называть чебышевским центром множества Qx [50].
Если замкнутое выпуклое множество Qx имеет центр симметрии с,
то х*^с [50, 80]. Использование метода динамического
программирования [8] позволяет реализовать построение
минимаксных оценок в рамках рекуррентной динамической фильтрации.
Задача 5.10. (Алгоритм Ананьева и Ширяева). Дано:
1. Модели системы, дискретных измерений — статистическая
априорная информация и области неопределенности —
описаны в (5.69)-(5.72).
2. Критерий оптимизации
1^ = min max М [(х^ — х^)' (х^ — х^) | /,*, 4-1*] =
ik Ф1*е2(Ф1*) ^ ^
= max Ж[(х, -хЦк\ Щу (х, -хЦк\ Щ) \ 1,\ ф,*], (5.99)
Ф1*е2(Ф1*)
где il)ft=(xo, Oft-i, Tift); г1?\= (г^ь • •.,ilJft); Q{^\)=_{^i: xqS
gQo(mo, P„(0)); e,--i^Qe(e,-b Pe(i-l)); Ц1^йц{ци Рл(0).
i=\,k}.
Доказать: 1. Минимаксную оценку x*{k\k) находим при
помощи рекуррентного соотношения
x*{k\k) = {^-V<kV^k){^{k\k-\)x*{k-\\k-\) +
+bfte*ft]+Kft(yft-B,,Ti*A), (5.100)
в котором коэффициент усиления Кь определяем
соотношениями (5.79) —(5.81), а х*(0|0), 9**, ii*ft —суть экстремальные
элементы задачи динамического программирования
Sft= max tr(/i/^ (5.101)
Ф1*е2(Ф1*)
150
где
и=(Е-К^Щ)Ф(к\к-1)_1и~1+
+ (E-KftHft)bft-i(e4-i-eft-i)-KftBfe(Tift—nj). (5.102)
2. Ошибка минимаксного оценивания
If,=tTP{k\k)+Sk-{m{k\k)-
-х*{к\к))Цт(к\к)-х*{к\к)), (5.103)
где m(k\k) и P{k\k) определяются соотношениями (5.77),
(5.78), (5.80) и (5.81).
Доказательство. Если известна выборка измерений Y^^l и
множество значений ifi*!, то оценка x{k\k), удовлетворяющая
критерию
М [(X, -x(k\ k)y (X, -x(k\k))\ Y,\ ф,*] =
= min М [(X, - x,)^ (X, - X,) I Y,", Ф,*],
представляет собой условное математическое ожидание
x(^|^)^M[Xft| У*1, ifi^ij, вычисляемое калмановскими
соотношениями вида (3.7) —(3.9), (3.29) и (3.30). Тогда из (3.7) и
(3.29) применительно к (5.69) — (5.71) имеем
x{k\k) = {E—Kknk)[^{k\k-\)x(k-l\k-l) +
+Квл\+Кч{Ук-Ъ1,ц,). (5.104)
Коэффициент усиления К* вычисляем с использованием
(3.8), (3.9) и (3.30), которые применительно к постановке
данной задачи имеют вид (5.79) —(5.81). Из (5.80) следует, что
P(^|^) = cov(Xft, Xft|y*i, if)*i) не зависит от ifi*!.
Минимаксную оценку x*(k\k) будем искать в виде
соотношения (5.104) при 9а^Э*4 и х]к^х]*к, которое в этом случае
принимает вид (5.100). Значения х*(0|0), 9*^ и ti*^ находим
с помощью критерия (5.99). Представим (5.99) в виде
/ft^tr P{k\ k)+ max {(X {k\ k) — X* {k \ k)y X
X(x(^ 1 k)-x*(k I k))]=^tTP{k I k) + S,~
— (m {k I k)—x* {k I k)y (m {k\k)— X* {k I k)), (5.105)
где
Sft = max [(x{k\k) — m(k\ k)y(x{k \ k)— m{k\A:))]; (5.106)
Ф1*е2(Ф1*)
m(^l^)—центр симметрии области допустимых оптимальных
среднеквадратических оценок, вычисляемый с помощью (5.77)
и (5.73).
Обозначим
lu={x{k\k)-m{k\k)Y. (5.107)
151
Используя (5.77), (5.73) и (5.104), представим (5.107) в
виде (5.102), а (5.106) в виде (5.101). Л
Сопоставление алгоритмов (5.73), (5.77) и (5.100) с учетом
замечания И. Я. Каца [46] о том, что центр симметрии
замкнутой выпуклой области совпадает с чебышевским центром,
позволяет сделать заключение об идентичности этих оценок. Как
следует из (5.103), максимальная ошибка оценивания в этом
случае будет определяться соотношением /fe=tr P(^|^)+Sfe.
Задача 5.11 (Алгоритм Куржанского). Дано:
1. Модель системы
dxtldt=F{t)xt+b(t)Qt, to^t^t. (5.108)
2. Модель непрерывных измерений
yt=H{t)xt+r]t. (5.109)
3. Априорная информация:
Qt и Tii — детерминированы, неизвестны и удовлетворяют
интегральному ограничению
J [ 6/ Ре (О % + Я= 11/ Р, (О ъ1<И<1>^\ (5.110)
где Ре (О и Pti(0—положительно определенные матрицы,
непрерывные по^; К и ц — известные числовые параметры; хо
неизвестно и принадлежит эллипсоиду с известными центром
то и положительно определенной матрицей Рх(0)
XosQ (mo, Рх (0)) = {Хо: (Xq—то) ^P-i^ (0) (xq—
-moXl}. (5.111)
4. Критерий оптимизации
/ = max (X, —lit*)" i^t— ^t*) =
= шш max (X; —Хг)''(Х; —X;), (5.112)
xt Фге2(Фг)
где фг=(хо, Qt, r]t); Q(^t) = {^t: XQ^Q(mo, Px(0)), 9^ и ti;
удовлетворяют (5.110), ^о^^^т}.
Доказать: 1. Минимаксная оценка x*t по измерениям
y'o={ys: to^^t} задается решением уравнений
dXtVdt = F (О X,* + Я= Р (О Н^ (О Р, (О X
Х(у^-Н(Ох,*); V=mo; (5.113)
dP(t)ldt=F{t)P{t) + P(t)F^t)+b(t)Pe{t)bHt)-
-х^р (t) н^ (О Ря (О н (О Р (О; Р (О = Р« (0) • (5. i и)
152
2. Погрешность минимаксного оценивания l*=xt—\*t
принадлежит эллипсоиду Q(0; P{t)):
/*eQ(0; P{t)) = {l: t^P-4t)l^n2-h^(t)], (5.115)
где
dh' (t)idt = я= (у, - н (О х,*)^ р, (О (у, -
-Н(Ох,*)>0, /г(д = 0. (5.116)
Максимальная погрешность оценивания определяется
длиной большой полуоси этого эллипсоида
тах/*=(ц2-Л2(^))1/2^,, (5.117)
где ^1 — наибольшее собственное значение положительно
определенной матрицы P{t).
Доказательство сформулированной задачи изложено в [50].
Из (5.115) и (5.117) следует, что чем меньше сокращаются
размеры эллипсоида, зависящие от разности [i^—h^{t), тем
меньше происходит уточнение информации в ходе фильтрации.
В предельном случае при h(t)^0 размеры эллипсоида не
сокращаются. В этом случае реализация вычислительных
процедур упрощается.
Аналогично задаче 5.10 может быть решена минимаксная
задача оценивания, когда в соотношениях (5.69) и (5.70)
отсутствуют неопределенные величины 9 ь и т|й, а
неопределенными являются матрицы Qa и Ra, которые считаются
диагональными, и множества, определяющие их, имеют вид
QQ={Qk: <7min<tr Q%<(7max} ; йл= {Rft: rmin^trRfe^rmax}.
В этом случае критерий оптимизации удовлетворяет
достаточным условиям теоремы о минимаксе, поэтому
min max trМ[{\^—^^)(\^ — х^У \ УД \, Qftl =
= max min 1гуИ[(Ха—Xft)(Xft — x^)^ | Yi*, R^, 0^] =
= max trcov(Xft, x^ | У1*, R^ Qa).
QftG^Q
5.5. Коррекция регулярных оценок параметров
при учете ограниченности множества их значений
Модельные задачи оценивания лишь приближенно
описывают реальные технические задачи. Степень приближения
определяется необходимостью соблюдения компромисса между
153
требуемой точностью решения задачи и приемлемой
сложностью реализации его в ЦВМ. Поэтому в ряде случаев
используются регулярные оценки [78], которые строят в
предположении, что отсутствуют ограничения на множество допустимых
значений оцениваемых параметров.
Возникает вопрос: как следует провести коррекцию
регулярных оценок, чтобы можно было использовать информацию
об ограниченности области их допустимых значений? При этом
С экономической точки зрения желательно сохранить
функционирующие алгоритмы формирования регулярных оценок, а
коррекцию этих оценок выполнять с помощью дополнительных
алгоритмических блоков, подсоединяемых к выходу
автоматических систем, дающих регулярные оценки. Рассмотрение
вопроса о коррекции регулярных оценок начнем с решения задачи,
носящей вспомогательный характер по отношению к задачам
динамической фильтрации.
Задача 5.12 (Вспомогательная задача). Дано:
1. а —скалярная величина, а^[а, а], где_а и а —известные
числа.
2. Модель измерений
уА=Ь(а, Xft, Wft), (5.118)
где h(-)—произвольная функция своих аргументов; х^, w^ —
случайные процессы, не зависящие от а.
3. Функционал оптимизации
( J (а \ Yi''), если а — случайная величина:
J(d Y )={ (5 119)
^ ' ^' \J(Yi''\ ^). ^^^^ ^ — неслучайная величина,
где У1*-={Уь /=1Г^}.
4. min/(a, Г1*) = /(аь1'1*); (5-120)
min _ J (а, ¥,") = ! {а,*, YА (5.121)
а е [а, а]
Доказать, что
а, если flft < Oj
а^, если flftGla, а[; (5.122)
0^, если Oft > а.
Доказательство. Область а^а^а преобразуется в систему
неравенств
а—а^О; а—а^О. (5.123)
154
Составим обобщенную функцию Лагранжа
Ф{а, h, Я2)=/(а, Y''i)+Xi(a-a)+%2{a-a), (5.124)
где li и Яг — неопределенные множители Лагранжа.
Введем обозначения
и=дФ{а, Ки X2)/da=dJ(a, У*,)/aa+Ai-Aa; (5.125)
Vi = —d0{a, Яь l2)/dli = a—a; (5.126)
V2=—d0(a,XuX2)ldK2=—a-\-a. (5.127)
В (5.125) —(5.127) условия Куна —Таккера [56]
приобретают следующий вид:
_ы=0; 1*1^0; У2>0; ^iyi = 0; ^2^2=0; Ai^O; ^2^0. (5.128)
Найдем решение системы уравнений и неравенств (5.128),
разбив множество изменения параметра а на три области:
]—00, ^J, ]а;"а[ и ]а[+оо[.
Если dk^a и а*^а, то У1>0, У2^0. Сравнивая эти
неравенства с (5.128), заключаем Ях = 0; У2|а_а* =0, поэтому a*k^
k
Если flftSj^; а[ и a*fte]a; а[, то У1>0, У2>0. Вновь
сравнивая полученные неравенства с (5.128), получаем Ai^O; ]к2=
= 0; «1а=йА=0или -E^l2i2i!)_ I . ==0. Отсюда и из (5.120)
заключаем, что а*^^^^.
Если uk^a и a*k^a, то fi^O, У2>0. Из сравнения этих
неравенств с (5.128) следует, что Vi]^_^, = О, Я2=0 или а*А^
k
Таким образом, равенство (5.122) справедливо. Л
Применим теперь результаты решения этой задачи для
оценивания вектора состояния и постоянной диагональной
корреляционной матрицы R^diag(^,;, i^\,m) погрешности
измерений в том случае, когда априорно известны области
допустимых значений для диагональных элементов Ru, i=l,m:
Задача 5.13. Дано:
1. Модели системы и измерений — (4.1) и (4.2), в которых
В,= Е.
2. Априорные данные—(4.3) и дополнительная
информация относительно матрицы
R=diag(^n,. ..,Rmm) с неизвестными элементами Rih_£=
= 1,т; R,i^[Rjh__^ii], /=!.'". где Rg и )?j, —известные
граничные значения.
155
3. Критерий оптимизации
max max _ -^{Х^^ У^* | R^^ R^). (5.129)
Доказать: 1. Алгоритм экстраполяции — (4.5) и (4.6).
2. Алгоритм фильтрации—(4.7) —(4.9), (4.11) и (4.12)
Cft=H4 P(A:|A:-l)H^ft+R**; (5.130)
Rj^, если Uk],<R]£,
^lii = 5Ш' ^"^^ ^кИeIRj,Rjj[; (5.131)
R^j, если Rkji^Rjj, j = iTtn;
R* = T ^* V + (l - 4") ^*-i' (5-132)
где R/ = diag || ^I//1| , R^^ = diag || J^^jj \\.
Доказательство. Поступая аналогично решению задачи 4.1,
преобразуем критерий (5.129) в эквивалентный составной
критерий, аналогичный (4.16), (4.17):
шах Ini: (X, I у,, X (^ - 1 I ^ - 1), R,*); (5.133)
max _ 21п''(У| I ^1*, Rn,-. ^mJ, (5.134)
где ^*ft —оценка R по выборке измерений У*1, с учетом
ограниченности элементов ^j7,/^1, т.
Оптимизация по критерию (5.133) дает алгоритм
экстраполяции (4.5) и (4.6) и алгоритм фильтрации (4.7) —(4.9), (4.11)
и (5.130).
Преобразуем выражение (4.20) в эквивалентной форме
записи, учитывая, что B,fe^E и матрица R диагональна. После
элементарных упрощений получим
к
/(R)= 21п''(Уг|хЛ R) =
т km
= __^in2;-f±5]«^^—i-SS"^^''" ^^-^^^^
где ajj = RJi^, j = I, т.
Заметим, что в функционал (5.135) каждая скалярная
составляющая ац входит аддитивно и независимо от других со-
156
ставляющих Css, зФ]. Тогда оптимизация по критерию (5.134)
сводится к последовательному использованию решений задач
4.1 и 5.16, поэтому из (4.12) и (5.122) следует справедливость
(5.131) и (5.132). Л
В заключение параграфа рассмотрим, как влияет на
смещение, дисперсию и средний квадрат ошибки оценки учет
информации об ограниченности областей допустимых значений
исследуемых параметров и их оценок.
Задача 5.14. Дано:
1. Несмещенная регулярная оценка Xi скалярного
неслучайного параметра Xi, полученная в предположении, что областью
допустимых значений Xt и ^^ является неограниченное множество
действительных чисел, т. е. xi^Qao и xi^Qo^. Плотность
распределения вероятностей оценки xi является нормальной:
nmxi) = {2n)-^'^<rh&x^{-Q,ba-^i{Xi-Xi)^), (5.136)
где <s^i^M[(xi—Xi)^\Xi\=consi.
2. Параметрически скорректированная регулярная оценка
x'^i, позволяющая учесть информацию об ограниченности
области допустимых значений параметра xi^^xr, xi\, задается
в виде
xh^Ui+{\-%)^i, (5.137)
где t\i^O,b{xi-\-Xi), а параметр Я, удовлетворяет минимаксному
критерию
min max M\{x) — XiY\-ni\. (5.138)
3. Над регулярной оценкой x^i осуществляется нелинейное
преобразование, позволяющее учесть информацию об
ограниченности множества допустимых значений, принимаемых
оценкой параметра хг.
(5.139)
Найти: 1. Относительное смещение b{Xi)^c-^iM[x*i-
—Xi\Xi'\.
2. Относительный средний квадрат ошибки
R{xi)=(r^M[{x*i-XiY\Xi].
3. Относительную дисперсию
D{Xi)=<rSM[{x*i-M{x*i\xi)y\xi\.
Xt —
Xi, если x\kxi]
х), если^ Хг<4<^г;
Xi, 1 если Xi ^ Xi.
15Г
Решение. В силу следующих очевидных равенств
^[(х?-хг)Чх,] »f'
(5.141)
Ml(x)-M(x}\xi))4xi] ' 4^ ~
= D*{xt)D'^{Xt) (5.142)
решение поставленной задачи сводится к последовательному
нахождению сначала значений b^{Xi), R^{Xi) и D^{Xi),
соответствующих преобразованию (5.137), а затем b*{xi), R*{Xi) и
B*{xi), удовлетворяющих преобразованию (5.139).
Решим первую подзадачу. В силу линейности
преобразования (5.137) относительно xt и условия (5.136) плотность
распределения вероятностей n{x^t\x!) оценки x^i будет
нормальной. Используя соотношение (5.137), составим разность
х\—х1=К{^С1—Х1) + {1—К){ц{—Х1). (5.143)
Тогда с учетом несмещенности оценки i,- имеем
bHXi) = {l-l){^,-x,)a-'u (5.144)
RHxi)=l^+{l-Kyir\i-Xiy(r-^i; (5.145)
РМл:,)=Я,2. (5.146)
Из (5.144) следует, что в общем случае оценка x'^i
является смещенной. Несмещенность оценки x'^i возможна лишь
в единственном частном случае, когда r\i^Xi, т. е. когда
параметр Xi совпадает с серединой области [Х£, xi].
В силу квадратичной зависимости /?*• от Xi, определяемой
равенством (5.145), условий Tii^0,5(jf£-|-^i) и Xi^[xi, xi]
находим, что максимум выражения {rit—Xi)^ по xi достигается на
границах области [xt^Xi\ и равен {xi—xi)^/4, поэтому
тах_ R^{Xi) = X' + {l — Xy{Xi — xp'/{W)- (5.147)
Вычисляя первую и вторую производные по X от
выражения (5.147) и используя необходимое и достаточное условия
158
экстремума функции, убеждаемся, что минимаксный критерий
(5.138) будет выполнен при следующем значении параметра К:
Я* = 1 / [ 1+402,. {xi-xi) -2]. (5.148)
С учетом равенств (5.144) —(5.146) легко получим
следующие неравенства, описывающие области изменения
относительных смещения, дисперсии и среднего квадрата погрешности
параметрической оценки x^'i ограниченного параметра Xi^
\b^*{xt)\^\a\{l+a'')-^; (5.149)
D^*{xi)=^{X*y<l; (5.150)
{'k*)^<R^*{Xi)^'k*<l, (5.151)
где
а= {xi-xj) {2ai)-^\ 1* = аЦ1+а^)-К (5.152)
Из (5.150) и (5.151) следует, что параметрическое
преобразование (5.137) регулярной оценки jf,-, учитывающее
информацию об ограниченности параметра xi, приводит к
гарантированному выигрышу в точности оценивания.
Зависимости b^*{Xi), R^*{Xi) и D^*{Xi) от значения
параметра Xi, при фиксированном а представлены на рис. 5.1,а и б,
а зависимости областей изменения b^*{Xi) и R^*{Xi) от
значения параметра а изображены на рис. Б.2,а и б.
Решим вторую подзадачу. Определим значения b*{Xi),
R*{Xi) HD*{Xi).
В силу линейности преобразования (5.137) относительно xt
и условия (5.136) плотность распределения вероятностей
ni{x\\xi) оцерки x^i будет нормальной с математическим
ожиданием и дисперсией соответственно
ch=M[x\\Xi[='k*Xi+{l—l)r\i; (5.153)
Р2_^*2(^2.. (5.154)
Найдем плотность распределения вероятностей n2{x*i\Xi)
нерегулярной оценки x*i, определяемой преобразованием
(5.139),
с»
■^AXi* I ^|) = J %(4 I ^*)8[^**-Ф(^?)1^^.^. (5-1^^)
где б[-] —дельта-фувкция Дирака; if (л;>ч) — обозначение
(5.139).
15Э
i'-bik
Рис. 5.1. Зависимости относительных смещения, дисперсии и среднего
квадрата погрешности от параметра xf.
■а —зависимость j, от параметра Xj при а=0,5; б — зависимости D^* и R^» от
параметра дг,- при а=0,5
к^Ъ0;'^^*Сн)
1,0
0,8
0,6
0,t
0,2
/
^
А
¥
'1
Ф
*
fez
ZUL
В)
о 0,5 1,0 1,5 2,0 2,5 а О 0,5 1,0 1,5 2,0 2,5 а.
Рис. 5.2. Эволюция областей относительных значений смещения и среднего
квадрата погрешности в зависимости от параметра о:
а — зависимость области изменения Ь >>* (дг,) от параметра а; б — зависимость области
изменения R >■* (х-) от параметра а
Представим интеграл в правой части (5.155) как сумму
интегралов и, учитывая свойства б-функции, получим
,t,(^i*Ui)= lira \ ^A^\\Xi)b(Xi*-Xi)dx) +
+ 1™ [4(x)\Xi)b{Xi'-~Xi)dx):=
=Я1 (;c*i I Xi) [1 (д;*.—;c.) -1 (;c*.—^0 ] +
+Fl (ЛГ; I Xi)\b(,X*i-Xi) + [ I--F1 (.Xi IJCO Jfi (^*'—^0 .
(5.156)
160
и
где Fi{u I х.)= J li^ix) I Jr,)dA^;
—00
1 / « \ f 0. если Лг*<ы:
I 1, если Xj*> u;
u^Xi или и^;с<.
Выражение (5.156) позволяет непосредственно, после
несложных преобразований, вычислить математические
ожидания
Ж[х,*|л,] = «[^-Фо(«)]-
-> («) + и [ -^ Фо («)] + Ф (и) + ^«; (5.157)
M\(Xi*-«,)= \x^]=^|« J-i-_Ф,(«)j_ф(;7)| + Ф,(й) +
+ ^ {ff [Т + "^о ^"^] + 'Р ^-^} ~ ^' ^"J • ^^- ^^^^
где " = (^« —а«)/Р«; « = (f г — ««)/Р«;
Фо(«) = (2^)~''Чехр(—/72)d^; ф(ы) = (2Й)-''2ехр(_и72).
о
Используя (5.157) и (5.158), получаем искомые оценки
решения второй подзадачи:
b*(xi)=A(u)-A{-u); (5.159)
R*{Xi)^B{u)+B{-u); (5.160)
D*(Xi)=R*(Xi)-(b*{xi)y, (5.161)
где А (s) =s [ 1/2-Фо («) ] -ф («); 5 (s) =5Л (s) +Фо (s).
По графикам зависимости Ь*, R* и D* от значений
параметра Xi при а*=2 (рис. 5.3) определим, что оценка x*i почти
всегда смещенная (исключение Xi=4]i) и смещение возрастает
по мере приближения параметра xi к границам области [xi,
Xi]. Средний квадрат погрешности нерегулярной оценки .«*i
всегда меньше среднего квадрата погрешности регулярной
оценки x^i, причем имеется существенная зависимость его' от
значения величины (Xi—Xi){2fii)~^ = a* (рис. 5.4).
11—6899 161
R*(>
1,0
0,75
0,50
0,25
Q
Ч)
s
Щ
///////
wi
'//////
¥///,
V////
Ш
0,5 1,0 1,5 2,0 2,5 a*
2/£-A 0 A Ч'-Щ-Pi 0 Pi Xj
Рис. 5.3. Зависимости b*, R* и D* от Рис. 5.4. Зависимость области изме-
параметра Xi при о*=2 нения R*{Xi) от величины а*
Наконец, учитывая (5.140) —(5.142), (5.144)-(5.146),
(5.159)-(5.161), (5.153)-(5.154), находим
Мх,) = (1-Я^
L Of
■ni—Xi
R i^i) = [(я*)^ + (1 - ху ^-^Ц^'] X
■ г,-
^]_
(5.162)
1 Xi —
(5.163)
0(^,) = (Я71/?(х,)-&Ч^«)]- (5Л64)
Использование графика зависимостей (R(Xi) от а (рис. 5.5)
позволяет режить вопрос о целесообразности коррекции
регулярной оценки Xi в том или ином случае.
Полученные здесь результаты могут быть распространены
и на случай коррекции векторных регулярных оценок с
независимыми скалярными составляющими.
Пример 5.1, Рассмотрим
эллипсоид Qx(tn, Р)^{х: (х—
—т)тр-'(х—mXl}, у
которого
(5.165)
X =
р =
' Xi '
Хг
■5 4
4 5
: т =
}
■3 "
4
(
а Рис. 5.5. Зависимость области
изменения R(Xi) от величины а
162
Рис. 5.6. Эллипсоид Qx(m, Р)
Требуется построить этот эллипсоид, найти длины его
полуосей, угол наклона большой полуоси эллипсоида к
координатной оси OXi и проекции эллипсоида на координатные оси
системы координат XiOX2.
Координаты центра эллипсоида задаются вектором т^
^[3; 4]'^. Собственные числа матрицы Р равны квадратам
длин полуосей эллипсоида. Для определения собственных чисел
матрицы Р составим характеристическое уравнение
Г5—Я 4
4 5 —
I. Следовательно,
= 0.
решениями которого являются Xi^9 и ^2=
большая ось эллипса а^З, а малая b^l.
Ориентация осей эллипсоида определяется собственными
векторами матрицы Р. Для определения собственных векторов
рассмотрим систему координат .«°i0.«°2, оси которой совпадают
по направлению с осями эллипса (рис. 5.6). Система
координат .«°i0jc°2 повернута относительно .«iOjco на неизвестный угол
ф. Нетрудно заметить, что ортогональная матрица перехода от
системы координат .«°i0.«°2 к системе координат .jci0.«2 имеет вид
cos ф — sin '
Т = I ,„ ' I— матрица собственных векторов матрицы
Fcos ф — sin ф1
[sin ф cos ф]
Р = Т'ЛТ, где Л
После перемножения матриц найдем
Р =
{Xi + Лг) — (Я1 — Яг)сО$ 2<р {Xi — Яг) sin 2ф
(Лх — Яг) sin 2ф {Xi + Яг) Н- (^1 — Яг) COS 2ф
IV
. (5.166)
163
Из (5.165) и (5.166) приходим к системе уравнений
со8 2ф^0; sin2<p=l,
определяющей минимальный угол ф=я/,4. Таким образом,
большая полуось эллипса наклонена к оси Oxi под углом я/4.
Определим проекции эллипса на оси координат. Для этого
вычислим опорные функции эллипса [105] dl^m4+fFPl, где
I — единичный вектор. Поскольку координатные векторы Ь^
= [1 0]^; 12= [О l]^ то d(li)=3+V5; d(l2)=4+y5. На рис. 5.6
построен эллипс и указаны его параметры.
Пример 5.2, Взаимосвязь измеряемых и постоянных
оцениваемых параметров задается соотношением
[::]
+
Ъ J
(5.167)
Неопределенные постоянные оцениваемые параметры [.«1.JC2J''
и возмущения [111112]^ принадлежат априорно известным
эллипсоидам неопределенности
80'
=[::]
ч:;]'
:Q.
;йг
[о[[
08
О
(5.168)
По поступившему измерению у^[2 2]'' и априорной
информации (5.167) и (5.168) требуется построить области Qx, йг],
Q(m, Р) = {х:у—xe'Q„}, Qxiy=Qx^(m, Р) и эллипсоид
неопределенности минимального объема, аппроксимирующий
область Qxivr Построение областей Qx и Qti очевидно и
представлено на рис. 5.7,а и б.
Для построения эллипсоида Q(m, Р) определим его центр и
матрицу, задающую размеры этого эллипсоида. Перепишем
(5.167) в виде
2'
и. воспользовавшись формулами (5.5), получим
-[
Р =
— 1
О
— 1
О
О
-1
о
—1
■о
о
1 о
о 1
им
][-о JH
1 о
о 1
Область Q(m, Р) изображена на рис. 5.7,в.
164
7,67 2 ]Z/T\f X,
-^;
Рис. 5.7. Построение областей Q^, Q_, Q(m, P), Q;!)» и аппроксимирующего
эллипсоида:
fl —область a^; б — область Е.^. в — область Q(m, Р) при у=[2 2]т; г —область
Q^ly=a^f]Q(m, Р); а — аппроксимирующий эллипсоид
Построение пересечения областей Qx и Q(m, Р)
представлено на рис. 5.7,г.
Найдем теперь параметры эллипсоида, аппроксимирующего
область Qxiy. С этой целью воспользуемся формулами (5.30) —
(5.37), положив в них
т,
2"
2
; Pi =
■1 0'
и 1
■> Ша =
■0'
0
: Р.=
■8 0
0 8
Тогда
/=-0,25[1 1]т; 6=1; с=0; ijj-Vs; а=7з;
8
6'= 4/3; т,^1.67[1 If; Р, = ^
3 —1
— 1 3
(5.169)
Длины полуосей эллипса j/A^ =|/32/21=sl,23; j/^^ =>/" 16/21 ?:«
«0,87. Используя (5.166) и (5.169), определяем угол ф
наклона большой оси эллипса к оси OXi: <р=:—я/4.
Аппроксимирующий эллипс изображен на рис. 5.7,(5.
165
пример 5.3. Скалярные модели системы и измерений имеют
следующий вид:
Xk+i = 0Xk-\-Q-{-Wk; yk = Hxk+'r\-{-Vk. (5.170)
Априорная информация:
9eQe(0; 4) = {9: |9|<2};
tr]eQ,(0;4) = {^:hl<2};
Xo^N(0; Ро); Ф>0; Я>0. (5.171)
Требуется построить алгоритм для формирования
минимаксной оценки x*{k\k) в смысле критерия (5.99).
Используя (5.79) —(5.81) и (5.171), имеем
K,=P(k\k-l)Hl[P{k\k-l)H^+r\;
P{k 1 ^—1) = ф'р(^—1 \k—l)+q-
Pik\k)= P(^l^-l)^ .
^ ' ' lP(k\k—l)H^ + r]
В силу (5.100) и (5.172) оценка
(5.172)
x*{k 1 k) =-
^ ' ' P{k\k-
, P(k\k—\)H
[ФхЦк-1 1^-1)+9Л +
P(k I k — \)H^+r
Найдем 9*й и х\*к- Соотношение (5.102) запишем в виде
гФ
L
+
P(k\k-])m-+r
г
К-1 +
е-
p(k I k—\)
■п,
P(k\k—\)H^+r P(k\k—l)H^ + r
поэтому экстремальные элементы для (5.101) с учетом (5.171)
будут
9*ft = 2sign/ft-i; Т1*й=—sign/ft-i.
Пример 5.4. Оцениваемый и измеряемый случайные
скалярные параметры связаны линейным соотношением
y=Hx-[-v, (5.173)
в котором
COV
:[:]■ [:]
(5.174)
166
Пусть измерение уо поступило с измерительного прибора,
имеющего зону нечувствительности по каждому измерению
[—Л; А]. Найти оптимальную в среднеквадратическом смысле
оценку параметра х, смещение этой оценки и дисперсию ее как
с учетом, так и без учета зоны нечувствительности прибора.
Сначала получим оценку М{х\уо) в предположении, что
у прибора отсутствует зона нечувствительности. В этом случае
применима теорема о нормальной корреляции (см. задачу 2.5).
Из соотношений (2.36) —(2.38), (5.173) —(5.174) следует:
М {X 1 у о) = т^ + Р^у р;^' {уо — Шу);
D{x\yo) = P,,-PlyF-yl;
Ь{х\уа)=М[т:,-М{х\уо)]=0, (5.175)
где Р^у=Р„Н-{-Рх^; Pyy=PxxH^+Pvv; О(х\уо)=со^(х, х\уо);
ту=Нтх-{-т^.
Теперь посмотрим, какой станет оценка параметра х при
учете, что истинное значение измеряемого параметра
неизвестно и принадлежит области у^[уо—2А; г/о+2А] (событие С).
Оценку, смещение и дисперсию при условии, что известно
событие С, будем обозначать соответственно М(х\С), 5(х\С)
и D{x\C). Воспользуемся обобщенной теоремой о нормальной
корреляции. Из соотношений (2.57) —(2.62) и (5.173) —(5.175)
получаем
М{х\С} = М(х\у,)-
{уо — 'Пу — '
' Ф(и)—Ф(а)
Ых\С)^-Р^уР-у^'^-1^.=:^;
Ф(и) — Ф(и)
D\{x \C) = D{x\y^) +
+ PiyP-Al + I^JZ!^ _ (jP(fLzll^y 1 (5Л76)
[ Ф(и)-Ф(а) \Ф{и)-Ф(и.)) ]
где ы = a + 6; и= a — b; а = Р'^у'^{уо — гПу); b = 2P7<J'^Д;
и
Ф (ы) = (УЩ~' ехр (— 0,5ы^); Ф (и) = (^2^)"' j ехр (— 0,5г') dz.
о
Сравнение (5.175) и (5.176) показывает:
1. Оценка М{х\уо) является несмещенной, а оценка
М(л:IС)—смещенной относительно априорного значения /и^.
2. Дисперсия D{x\C) больше, чем дисперсия О{х\уо) и
П{х\С)-^0{х\уо) при А-^0.
167
Глава 6
Аппроксимация нелинейных алгоритмов
оценивания
6.1. Алгоритмы оценивания, линеаризованные
относительно опорной траектории
Во многих практически важных случаях физические
системы и взаимосвязь измеряемых параметров с оцениваемыми
нельзя описать обыкновенными линейными
дифференциальными уравнениями или линейными рекуррентными
соотношениями, для этой цели следует использовать системы нелинейных
уравнений или нелинейных рекуррентных соотношений.
Поэтому проблема оценивания в применении к техническим задачам
практики является существенной нелинейной проблемой.
Теоретические методы построения нелинейных алгоритмов
оценивания по выборке измерений нарастающего объема были
рассмотрены в гл. 2. В каждом случае точные нелинейные
алгоритмы оценивания, вообще говоря, представляют собой
бесконечномерные цепочки уравнений. При помощи различных
аппроксимаций могут быть получены конечномерные
вычислительные алгоритмы оценивания. Существуют различные
методы аппроксимации [74] нелинейных функций (плотностей
распределения вероятностей, нелинейных функций, входящих
в модели системы и измерений). Рассмотрим аппроксимацию
только с помощью рядов ортонормированных функций. Как
показано в [74], при больших отклонениях аргументов
функций от истинного их значения целесообразно использовать
полиномы Эрмита, зато при очень малых отклонениях
предпочтительными являются ряды Тейлора. Это объясняется двумя
обстоятельствами.
1. Весовая функция при аппроксимации рядом Тейлора
является дельта-функцией, что обеспечивает высокую точность
аппроксимации в очень узкой окрестности истинного значения
аргумента.
Критерий оптимизации при аппроксимации, например,
скалярной функции f{x) суммой 5„=Ло+Л1Х1+...-f Л„х„ при
скалярном аргументе х и истинном значении его, равном нулю,
имеет вид
/= f [f(x)-s„]4{x)dx.,
"-00
2. С инженерной точки зрения, вычисление коэффициентов
ряда Тейлора легко реализуется с использованием частных про-
168
изводных функции f(x) даже в ЦВМ с небольшими
оперативным объемом памяти и быстродействием. В дальнейшем
ограничимся решением только таких технических задач, для
которых достаточную точность аппроксимации дает разложение
нелинейных функций в ряды Тейлора. Рассмотрение процедуры
линеаризации начнем с технических задач, в которых известна
опорная траектория, т. е. значения оцениваемых параметров
для любого момента времени, достаточно близкие к истинным.
Задача 6.1. (Дискретный линеаризованный фильтр). Дано:
1. Модель системы
Xft+i = f(xft)-fb(Xft). (6.1)
2. Модель измерений
yft+i=h(Xft+i) + B(Xft+i)vft+i. (6.2)
3. Априорная информация:
Хо-Л^(Хо, Ро); Wft-#(0; Qk); vk ~ N {0; R^);
cov(Wft, w/)=Qft6fti; cov(Vft, Vj) = Rk8ki;
cov(Wft, Vi)=cov(xo, Wft)=cov(xo, Vft)=0; (6.3)
5ftj — символ Кронекера, k, /^1, 2...
4. Выборка измерений y*i={ys; s=l,^}.
5. Опорная траектория
Xft+i = f(x,"); x„"=x„. (6.4)
6. Аппроксимирующие предложения: функции f(Xft), Ь(Хй)
и h(Xft+i), B(Xft+i) раскладываются в ряды Тейлора
соответственно в окрестности точек х"й и x"ft+i; пренебречь значениями
(x,-x,")Wft, (x,+i-xj+,)v,+i, о(х,-Хй"), o{x,+i-xU и
статистическими моментами выше третьего порядка;
о(-)—бесконечно малая величина относительно своего
аргумента.
Доказать: 1. Алгоритм экстраполяции значений х(^+
+ l|^)=Af(Xft+i|yfti) и P(^+l|^)=cov(Xft+i, Xft+i|y*i) имеет
вид
х(^+1|Л)=хПй+1+Ф(хПй)(х(^|^)-х"й); (6.5)
Р (^+1 I ^) = Ф (ХП;^) Р (^ I ^) Фт (xHft) +b (XHft) Qftb^(xnft) ; (6.6)
Ф(хп,) = у^^(хп,). (6.7)
2. Алгоритм фильтрации значений х(^+1|^+1)==
=M(Xft+i|yft+S) и P(^+l|^+l)=cov(Xft+i, Xft+i|y*+>i) задает-
169
ся рекуррентными соотношениями
xik+\\k+\) = x{k+\\k) + K,^Ay,.i-i44+i)-
- Н (х,"^,) {x(k+l\k) - х^^,)]; (6.8)
К,+1 = Р(^+ 1 I k)H^x",J[H{xl^^)P(k+l I ^)Н^(хп^,) +
+ B(xn^,)R,+iB4x^^,)r; (6.9)
Р(^+ 1 I к+ l) = (E-K,+iH(xn^,))P(^+ 1 I k); (6.10)
H(xn^,) = V/h(xn^,). (6.11)
Доказательство. Обозначим
^Xft = Xft —Xft"; ДХй+1 = Хй+1 —х^^,; Ауй+1 = Уй+1—h(x^^,)•
(6.l2)
Так как значение Хо неслучайно и соотношение (6.4)
детерминировано, то, вычисляя условное математическое ожидание
M(-|y*i) выражений (6.12), получим
Дх(^|^) = х(^|^)-х/; Дх(А+1 \k) = x,+^-x-^,;
Ду(^+ 1 \k) = y{k+l\ A)-h(xn^,). (6.13)
Из (6.13) следует:
х(^|^) = х/+Дх(^|^); х(^+1|^)=х^^,+Дх(^+1|^), (6.14)
где Ax{k\k)=M{AXk\Y''i) и Лх(^+1 |^)=Af(AXft+i| У*,).
Таким образом, чтобы решить поставленную задачу,
достаточно найти оценки Ax{k\k) и Ах(^+1|^).
Линеаризуем задачу. Разложим функции f(Xfe), b(Xft) и
h(Xft+i), B(Xft+i) в ряды Тейлора соответственно в окрестностях
точек Х;^" и х^^, с точностью до членов первого порядка
малости относительно Дх^ и Дхй+ь Соотношения (6.1) и (6.2)
предстанут в следующем виде:
Хй+1==!(х"й) + Ф(х"й)ЛХй+Ь(х"й)дУй+
+ {Ф{х\)АхиУ/к+о{Ахн)); (6.15)
Уй+1 = Ь(х^^,) + Н(х^^,)ДХй+1 + В(х^^,)у,+1 +
+ (Н(х2^,)Дх,+1У,+1 + о(Дх,+1)), (6.16)
где Ф(хЛ = V/f(x.") и H(xn^,) = v/h(xn^,).
Вычитая из (6.15) соотношение (6.4) и пренебрегая
слагаемым Ф(х"й)АхйДУй-1-о(Ахй), найдем
АХй+1 = Ф(х"й)АХй+Ь(х"й)дУй. (6.17)
170
Учитывая (6.12) и пренебрегая слагаемым Н(хД,) ДХ;,+1
Vft+i + о (AXft+x) в соотношении (6.16), можно записать
Ду,+1=Н(х^^,)Дх,+1 + В(х^^,)у,+1. (6.18)
Соотношения (6.17) и (6.18) и аппроксимирующее
предложение условия данной задачи позволяют приближенно считать
дискретный процесс {Ax^, Ду^} условно гауссовским. Поэтому
для нахождения оценок Ах(^|^) и Ах(^+1|^) можно
применить результаты решения задач 3.1 и 3.2. Заметим, что
cov(AXft, iAXft|y*i)=cov(Xft, Xft|y*,) = P(fe|^);
cov(AXft+i, AXft+i|yfti)=cov(Xft+i, Xft+i| У*|) = Р(^+11^).
Тогда из (3.7) —(3.9), (3.29), (3.30) с учетом (6.14)
непосредственно следует справедливость соотношений (6.5) — (6.11). Л
Задача 6.2 (Непрерывный линеаризованный фильтр). Дано:
1. Модели системы и измерений описываются
стохастическими дифференциальными уравнениями Ито:
dxt=f{xt)dt-{-G{t)dwt; t>to; (6.19)
dyt=h{xt)dt-{-dvt; t>ti>to, (6.20)
2. Априорная информация:
{w^, f^to} и {v^, f^ti} — соответственно n- и /и-мерные
процессы броуновского движения;
M[dwtdv/\]=Qt8it-x)dt; M[dvtdV^r\ = Rt6it-'c)dt; (6.21)
б(-)—дельта-функция; Хо'~Л^(хо, Ро); Хо, {w;} и
{vj—независимы. _
3. Опорная траектория x(t)—решение уравнения dxt^
= i(xt)dt.
4. Аппроксимирующее предложение: при разложении
функций f(x^) и h(x^) в ряд Тейлора в окрестности точки х^
пренебречь значениями o{xt—Xt), а также статистическими
моментами выше третьего порядка.
Доказать: 1. Для моментов времени t^[to, ti] уравнения
эволюции Xt^M{xt) и P(^)=cov(x^, х^) имеют вид
dxt = [f (xt) Н-Ф(xt) (x^—xt)]dt; (6.22)
dPt=[PtФ■'{xt)-{-Ф{xt)P■^t+G{t)QtG■^{t)]dt, (6.23)
где _
Ф{Х() = ^хЦх1). (6.24)
2. Для времени t ^f^ эволюция статистических моментов
X (^ I ^i) = М (х^ I У?,) и P{t \ tj) = COV (х^, х^ I Yli) описывается
171
уравнениями
йгх(^|^1) = [!(хО+Ф(хО(х(ф1)-ЗГО]йг^+
-H{xt){x{t\ti)-xt)dt]; (6.25)
йгР(^|^1) = Ф(хОР(^|^1) + Р(Л^1)Ф^(х;) +
+ G(t)QtG^t)-P{t\ti)H^Xt)R-4H(xt)Pit\ti), (6.26)
где _
H{Xt) = 'V^xh{xt), (6.27)
с начальными условиями
x(^Mi)='^^; P{t,\h) = Ptr (6.28)
Доказательство. Разложим функции f(x^) и h(x^) в ряд
Тейлора в окрестности точки х^ до членов первого порядка
малости относительно разности х^—x^ Уравнения (6.19) и (6.20)
принимают следующий вид:
dxt = |f (х^) — Ф (х^) Xtjdt + Ф (Xt) Xtdt + G (t) dw^; (6.29)
^y^ = [h(X,) - H(x,) Xt]dt+H(X,) X, dt + dv,. (6.30)
Значения Ф(х^) и Н(х^) задаются выражениями (6.24) и (6.27).
Для нахождения оценок х^, Р^, x(t\t]) и P(^|^i) можно
непосредственно воспользоваться уравнениями (2.14), (2.15),
(2.29) и (2.30), дающими оптимальное точное решение
нелинейной задачи оценивания. Однако этот путь требует
проведения громоздких вычислений. С другой стороны, при
аппроксимирующем предложении можно приближенно считать, что
процесс {х^, у^}, описываемый уравнениями (6.29) и (6.30),
нормальный. Для нахождения указанных оценок с помощью
уравнений (3.5), (3.6), (3.37) —(3.40) получим непосредственно
требуемые выражения (6.22) —(6.28). Читателю же
предоставляем возможность найти те же уравнения (6.22) —(6.28) с
использованием первого из указанных выше способов. Л
Задача 6.3. (Непрерывно-дискретный линеаризованный
фильтр). Дано:
1. Модель системы
dxtldt=F{xt), t>to. (6.31)
2. Модель измерений
yft+i=h(Xft+i)+Vft+i, (6.32)
где Xft, Xft+i — значения вектора х^ при t^tk или t^tk-{-tAt,
k = 0, 1, 2...
172
3. Априорная информация:
x„^A^(i„, Р„); v,^A^(0, R,); j
cov(Vft, Vj) = R^b^j; 5;^^ —символ Кронекера; / (6.33)
cov(v^, Xo) = 0. J
4. Выборка измерений У *1 = {у5, s=l,^}.
5. Опорная траектория
х".+, = ф(х/); х„"=7„ (6.34)
— решение уравнения (6.19), выполненное численным методом
(например, методом Рунге —Кутта).
6. Аппроксимирующие предложения:
при разложении функций F(x^), h(Xft+i) в ряды Тейлора
пренебречь значениями о (Д^^), o(Xft —х^") и o(Xft+i —х^^,) и
статистическими моментами выше третьего порядка;
о(-)—бесконечно малая величина относительно своего
аргумента.
Доказать: 1. Алгоритм экстраполяции значений х^^
^М(х^) и P^^cov(Xb х^) при отсутствии измерений в момент
времени t имеет вид
dxt = [F (хЛ + А(х,") (X, - хПЩ (6.35)
dPt= [Р Д^ (х"0 +А (хп^ P^t]dt (6.36)
2. Алгоритм экстраполяции значений х(^+1|^)^
=Af(Xft+i|yfti) и P(^+l|^)=cov(Xft+i, Xft+i|y*i) описывается
соотношениями
X(Л+l|^)=f(XП;,)+ф(xп,)(x(^|^)-XПй); (6.37)
Р (^+1 I ^) = ф (xHft) Р (^ I ^) Фт (xHft) , (6.38)
где
i{x\)=x"k+F{x\)At+A{x\)F{x''k)MV2; (6.39)
A(xn,) = V^;.F(xn,); (6.40)
Ф(хПй) = УМ(хПй). (6.41)
3. Алгоритм фильтрации значений х(^+1|^+1)^
=Af(Xft+i|h+ii) и P(^+l|^+l)=cov(Xft+b Xft+i|y*+4)
задается соотношениями (6.8) —(6.11), в которых В(х"й) = Е.
Доказательство. Для нахождения оценок х^ и Р^ следует
поступить аналогично решению задачи 6.2, разложив функции
f(x) и h(x) в ряд Тейлора в окрестности точки х"^ являющейся
решением уравнения (6.31), полученным численным методом
(6.34). Используем уравнения (6.22) и (6.23), в которых заме-
173
ним х^ на х"^ Ф(х^) на A{x^'t) = 'V''xF{x"t) и G(^)=0, тогда
получим искомые уравнения (6.35) и (6.36).
Теперь перейдем к выводу алгоритмов экстраполяции и
фильтрации для моментов времени tk, на которые выполнены
измерения. Уравнение (6.19) приведем к дискретной форме
записи. Для этого разложим х^+д^ в ряд Тейлора по t до членов
второго порядка малости относительно А^ (А^ — временной
шаг):
х^+д^ = Xt + XtAt + x (О Д^72 + о (Д^) =
= х^ + F (х^) Д^ + А (х^) F (х^) MV2 + o{l4'), (6,42)
где А(х^) = \7''л:Р(х^) —матрица Якоби.
Обозначив
f(xO=x,+F(xOA^+A(xOF(xOAm (6.43)
и пренебрегая o{Afi), придадим соотношению (6.42)
следующий вид:
Xft+i«f(Xft). (6.44)
Вычтем из (6.44) равенство (6.34) и разложим функцию
f(Xft) в ряд Тейлора в окрестности точки х"й с точностью до
членов o(Xft—x"ft). В обозначениях (6.12) будем иметь
следующий результат:
Axft+i=/ (x"ft) —ф (xHft) + V^ J (x"ft) AXft+0 (AXft). (6.45)
Используя обозначение (6.41) и
ао(х"й)=!(х"й)-ф(хПй), (6.46)
запишем (6.45) в виде
AXft+i = «о (xHft) + Ф (xHft) Axft. (6.47)
Выражение для отклонения измеренных значений ук+х от
расчетных значений h(x"ft+i) получается аналогично
соотношению (6.18) и имеет вид
Ду,+1 = Н(хп^,)Дх^^+1 + у^,+1, (6.48)
где H(x"ft+i) задается с помощью (6.11),
Линейность соотношений (6.47) и (6.48) относительно
оцениваемых параметров и априорная информация (6.33)
позволяет приближенно считать процесс {Ах^, Аул} условно гауссов-
ским. Это дает возможность использовать выражения калма-
новского фильтра (3.7) — (3.9) и (3.29), (3.30) аналогично тому,
как было выполнено при решении задачи 6.1, поэтому из (3.29)
с учетом (6.14), (6.34) и (6.46) следует (6.37).
174
Из (6.43) следует (6.39) при х^=х"й. Соотношение (6.38)
получается из (6.6) при Ь(х"й)^0. Алгоритм фильтрации
очевидным образом совпадает с алгоритмом (6.8) — (6.11). Л
6.2. Расширенные линеаризованные фильтры
Как отмечалось в § 6.1, увеличение точности оценивания
параметров по выборке измерений нарастающего объема
можно достигнуть путем приближения опорных значений
оцениваемых параметров, в окрестности которых производим
разложение нелинейных функций в ряд Тейлора, к истинным их
значениям. В рассмотренных выше задачах опорная траектория
строилась только на основе априорной информации. По задан-
ному на момент времени ^о значению Хо находились прогнозные
значения х"^ оцениваемых параметров на текущие моменты
времени tk и tu+At (моменты времени проведения дискретных
измерений). С увеличением интервала времени tk—t^
возрастает отличие х"^ от истинного значения оцениваемых параметров
x^ Тем самым нарушаются допустимые условия применимости
рядов Тейлора для разложения нелинейных функций моделей
системы и измерений. Исправить эту ситуацию можно двумя
путями: использованием измерительной информации для полу-
•ч
чения оценки х^ на момент времени t^tk; уменьшением
интервала прогноза с tk—^0 до минимального значения, т. е. экстра-
полируется значение х^+а< по начальным условиям Х(.
•ч
При правильной работе алгоритма оценивания значения х^
и х^+д^ будут ближе к истинным х^ и х^+д^, чем прогнозные
значения х"^ и х^'^д^ опорной траектории, расширяем класс
опорных траекторий. Построив указанным способом новые опорные
траектории, расширяем класс опорных траекторий, введенных
в § 6.1. Алгоритмы оценивания, построенные с использованием
процедуры линеаризации нелинейных функций моделей
системы и измерений в точках расширенного класса опорных
траекторий, будем называть расширенными линеаризованными
алгоритмами оценивания.
Задача 6.4 (Расширенный дискретный фильтр). Дано:
1. Модель системы
Xft+i=f(Xft)+GftWft. (6.49)
2. Модель дискретных измерений
yft+i=h(Xft+i)+Vft+i. (6.50)
3. Априорная информация (6.3).
175
4. Выборка измерений Pi^{ys, s=l,^}.
5. Аппроксимирующие предложения: функции f(Xft) и
h(Xft+i) раскладываются в ряды Тейлора соответственно в
окрестности точек x{k\k)=M{Xk\Yi'i) и х(^+1|^) =Af (Xfc+i| У*,),
пренебрегая значениями o{Xk—x{Ji\k)) и o(xft+i—х(^^+1)^^)),
где о(-) —бесконечно малая величина относительно своего
аргумента; пренебречь статистическими моментами третьего и
более высоких порядков.
Доказать: 1. Алгоритм экстраполяции значений х(^+
+ l|^)=Af(Xft+,|y*,) и P(^+l|^)=cov(Xft+b Xft+i|y*i) имеет
вид
x(^+l|^)=f(x(^|^)); (6.51)
P{k+l\k) = Ф{x{k\k))P{k\k)Ф{x{k\k)) + G,Q,G^,, (6.52)
где
Ф{x{k\k)) = 'V■'xf{xik\k)). (6.53)
2. Алгоритм фильтрации значений х(^+1|^+1)^
=Af(Xft+,|y*+i,) и P(^+l|^+l)=cov(Xft+,, Xft+ijy*+ii)
задается рекуррентными соотношениями
х(^+1|^+1)=х(^+1|^)+Кй+1[уй+1-
-h(x(^+l|^))]; (6.54)
Р(^+1|^+1) = (Е—Kft+iH(x(^+l|^)))P(^+l|^); (6.55)
Kft+i=P(^+l|^)H^(x(^+l|^))[H(x(^+l|^)P(^+l|^)X
XH-(x(^+l|^))+Rft+i]-S (6.56)
где
H(x(^+l|^)) = V^;.h(x(^+l|^)). (6.57)
Доказательство. Данную задачу можно рассматривать как
частный случай задачи 6.1. После получения выборки
измерений У*1 два значения оцениваемого вектора х, соответствующие
последовательным моментам времени tk и tk+\ и
принадлежащие опорной траектории, могут быть выбраны так, что х"^^
=x{k\k) и xVl=x(^+l|^)•
Kpoмe того, сопоставление условий задач 6.1 и 6.4
показывает, что G(Xft)^Gft и не зависит от оцениваемого процесса
{Xft}, а B(Xft+i)^E, поэтому из соотношений (6.5) —(6.11), как
частный случай, следует справедливость равенств (6.51) —
(6.57). Л
Задача 6.5 (Расширенный непрерывно-дискретный фильтр).
Дано:
1. Модели системы, измерений и априорная информация
(6.31)-(6.33).
2. Выборка измерений У*1^{у8, s^l,k}.
176
3. Аппроксимирующие предложения: выполнить
разложение в ряд Тейлора функции F(x^) и ее частных производных
в окрестности точки х(^|^)=ЛГ(Хй| y*i), а функции h(Xft+i)
в окрестности точки х(^-|-11^) ^Af(Xft+i| У*,) пренебречь
значениями о(А^2), o(Xft—х(^|^)), o(Xft+i—х(^-|-1|^)) и
статистическими моментами оцениваемых параметров выше третьего
порядка.
Доказать: 1. Алгоритм экстраполяции значений х^^
^M{xt) и -P^^covCx^, х^) при отсутствии измерений в момент
времени t имеет вид
dif = F (X,) dt; (6.58)
dP, = [Р, А^(^,) + А(х,) P^dt, (6.59)
где
A(^,)=v/F(x,). (6.60)
2. Алгоритм экстраполяции значений х(^+1|^)^
=Af(Xft+i|yfti) и P(^+l|^)=cov(Xft+i, Xft+i|y*i) описывается
соотношениями
x(^+l|^)=f(x(^|^)); (6.61)
Р(^+1|^)=Ф(х(^|^))Р(^|^)фт(х(^|^)), (6.62)
где
f(x(^|^))=x(^|^) + F(x(^|^))A^+
+А(х (^ I ^)) F(X (^ I ^)) X A^V2; (6.63)
A(x(^|^)) = V^;.F(x(^|^)); (6.64)
Ф(х(А:|^)) = У^;.!(х(^|^)). (6.65)
3. Алгоритм фильтрации значений х(^+1|^+1)^
=Л[(Хй+,[У*+1,) и P(^+l|^+l)=cov(Xft+„ Xft+i|y*+ii)
задается рекуррентными соотношениями (6.54) — (6.57).
Доказательство. Соотношения (6.58) — (6.62)
непосредственно следуют как частный случай из (6.35) — (6.41) при условии,
чтох"^=х^, х"й=х(^|^) и x-J^i = х(^+1 I k)-
Алгоритм фильтрации следует, очевидно, из сопоставления
решения задач 6.3 и 6.4 при условии, что х"й=х(^|^) и x'j^^,=
= х(^+1 1^). Л
6.3. Скалярные фильтры второго порядка
В интересах дальнейшего (по сравнению с расширенными
линеаризованными фильтрами) повышения точности оценок
при построении нелинейных фильтров стремятся наиболее пол-
12—6899 177
но и точно учесть влияние на получаемую оценку нелинейно-
стей, входящих в модели системы и измерений. Это достигается
двумя путями: учитывают частные производные высокого
порядка при разложении в ряд Тейлора нелинейных функций,
входящих в модели системы и измерений; повторяют
линеаризацию нелинейных функций.
Первый путь рассматривается в данном параграфе,
второй — в § 6.4.
Задача 6.6 (Усеченный непрерывный скалярный фильтр
второго порядка). Дано:
1. {Xt, t^to} и {yt, f^to}—непрерывные скалярные
случайные процессы, удовлетворяющие стохастическим уравнениям
Ито:
dxt=f(xt)di-\-g(xt)dwu i>io; (6.66)
dyt=h(xt)di-\-dvt, i>ti>io. (6.67)
2. Априорные данные:
{Wt, t^io} и {vt, f^ti^io} — процессы броуновского
движения;
M[dwtdw^] = Qtdit—i)dtdx;
M[dvtdv,]=Rt8it—t)dtdx; Xo^N{xo, Po); (6.68)
Xo, {^t}, {vt}—независимы.
3. Измерения образуют реализацию Y'o^{ys, s^[to, t]}.
4. Аппроксимирующее предложение: функции f(xt), h(xt) и
g^{xt) раскладываются в ряды Тейлора в окрестности точки
x^M{xt\Y^o) до членов второго порядка малости относительно
{xt—Xt); предполагаем, что третьи и более высокого порядка
центральные моменты — незначительны.
Доказать. Условное математическое ожидание xt^
=M(xt\Y'o) и условная дисперсия Pt=M[{xt—^t)^\y'o\
описываются уравнениями
dxt^ [f (Jct) + (1/2) Pthx{Xt)]di+Pthx(Xt)R-' (t) [dyt-
-{h{xt) + (l/2)PtH,4xt))di]; (6.69)
dPt^ [2PtU{xt) +e''Qt-Pthx[Xt)R-'thx{xt)Pt]di-
-{ll2)P2tfixxi^t)R-'t[dyt-ih{^t) +
+ (1/2) PtH:cA^t))dt], (6.70)
где
e'=g4xt)+g4xt)Pt+g(xt)gxxi^t)Pt. (6.71)
Доказательство. Точное решение поставленной задачи
дается уравнениями (2.29) и (2.30). Используя аппроксимирую-
178
щее предложение 4, получим уравнения усеченного фильтра
второго порядка. Для этого сначала разложим функции fixt),
h{xt) и g^ixt) в ряды Тейлора в окрестности точки xt до членов
второго порядка малости относительно xt—^t:
f(xt)=f (Xt) +tx i^t) Xt+il/2) hx (Xt) x^t+o (x't); (6.72)
h (Xt) =h (£t) +Ях i^t) Xt+ (1/2) H:cx (Xt)xh+0 (X^t) ; (6.73)
g' {Xt) =g' (i/) -{-2g (^t) g^ (h) xt+ (g\ (^t) +
+g(xt)g^(xt))x\+o{x^t), (6.74)
где Xt=xt—xu o{x^t) —бесконечно малая величина
относительно Xt.
Вычислим условные математические ожидания f{xt)^
=M[\(xt)\Yi^\, R{xt)=M[h{xt)\Yt,-\ и f^M=ЩёЧxt)\Y^^>\,
используя разложения (6.72) —(6.74) и пренебрегая
значениями o{x^t):
fixt)=fixt) + ill2)Ptfxx(^t); (6.75)
n(xt)=h(xt) + (ll2)Ptfi^x{^t); (6.76)
fi^t) = g^ {Xt) +g2, (Jct) Pt+g (Л) gxx (Xt) Pt. (6.77)
Аналогичным способом найдем аппроксимации для
остальных величин, входящих в равенства (2.29) и (2.30).
Используя разложение (6.72), запишем:
Xtt{xt)=xt{t{^t)+U{xt)xt+(\/2)Ux(xt)xh+
+0 (РО) =xt! (^t) + [xt+h) и {^t) xt+
+ {xt+Xt)(\l2ytxx{xt)x''t+o(x''t) =
= Xtf (xt) +tx i^t) Pt+Xtf i^t) Xt+
+ ill2)fxx (Xt) x^t+ (1/2) xthx (Xt) x^t+o (x^t). (6.78)
Вычислим условное математическое ожидание Xtf{xt)^
^M{xtf{xt)\Y'o), используя (6.78) и пренебрегая o(F/):
^J(^t)=Xtf(xt)+f4xt)Pt+(ll2)xtU{xt)Pt, (6.79)
или
xth (xt) =xth (xt) -\-hx (Xt) Pt+ (1 l2)xtRxx [Xt) Pt. (6.80)
Используя (6.75), (6.76), (6.79) и (6.80), находим разности
^^^)-hnxt)=U{xt)Pt; (6.81)
^^^)-xtf{xt)=hAxt)Pt. (6.82)
12* 179
Разложение выражения x^th{xt) в ряд Тейлора в
окрестности точки xt имеет вид
x^h{xt)=Jc^th{Jct) + {2m{^t)+X^thx(xt))xt+
+ (h{Xt)+2Jtth:c{xt) + {ll2)Jc^th:cx(xt))x^t+o{xb). (6.83)
Используя (6.83), определим
x^th{xt)=M[x^h(xt)]=X^h{xt)+h{xt)Pt+
+2xth^ {xt)Pt+{\/2) ^hh:cx {xt) Pt. (6.84)
Выражения (6.76), (6.80), (6.84) и x'^t=M{x^t\Y'o) = {xty+
-\-Pt позволяют вычислить
x^th{xt)—x^tli{xt)—2ittXth{xt) +
+2 {Xt) Щ {xt)=-{ 1/2) n^x i^t) P't. (6.85)
Подставляя (6.75) —(6.77), (6.81), (6.82) и (6.85) в (2.29)
и (2.30), получим искомые уравнения (6.69) —(6.71). Л
Задача 6.7 (Полный непрерывный скалярный фильтр
второго порядка). Дано:
1. Справедливы условия 1, 2 и 3 задачи 6.6.
2. Аппроксимирующие предложения: функции f{xt), h{xt)
и g{xt) раскладываются в ряд Тейлора в окрестности точки
xt=M{xt\Y'Q); центральные моменты четвертого порядка
оцениваемых параметров вычисляются по формуле M[{xt—
—xt)*\Y^o]^iP^t; центральными моментами оцениваемых
параметров выше четвертого порядка, а также нечетными
моментами пренебречь.
Доказать: 1. Условное математическое ожидание ^t
удовлетворяет уравнению (6.69).
2. Условная дисперсия Pt=M[{xt—xt)'^\Yto] является
решением уравнения
dPt= [2Ptfx{xt) +^Qt-P^hx^t)P-'t]dt+
+P^tfixx{^t)R-4[dyt-{h{^t)-{ll2)Ptn^:c{^t))dt], (6.86)
где
i'=g' (^t) + (g^x (^t) +g (Xt)gxx i^t) ) Pt+
+ W^)g^x(xt)F't. (6.87)
Доказательство предлагается выполнить читателю
аналогично решению задачи 6.6.
Распространение результатов решения задач 6.6 и 6.7 на
векторный случай приводится в задачах 6.8 и 6.9.
Задача 6.8 (Усеченный непрерывный фильтр второго
порядка). Дано:
1. Модели системы и измерений и априорная информация
(6.19)-(6.21).
180
2. Реализация измерений Y'^^={ys, s^[tu t]}.
3. Аппроксимирующее предложение: функции f{xt), h{xt)
разложить в ряды Тейлора в окрестности точки xt^M{xt\Pt,)
до членов второго порядка малости относительно xt—^r,
пренебречь статистическими моментами третьего и более высоких
порядков.
Доказать, что условное математическое ожидание х^ =
= Ж(Х;|У;,) и условная корреляционная матрица Р;з=соу(Х;,
X; I YtJ являются решениями следующих уравнений:
dxt = [i{Xt) +(1/2) а {t)]dt +
+ Р, Ф (О Rr'ldyt - (h (X,) + (1/2) р(0) dt\, (6.88)
dPt=[Ф{f)Pt+PtФЦt) + Git)QtG■'{t)-PtФЦt)R-'Ф{t)Pt]dt +
+ (1/2) Р, р^ (О R- [Ф, - h (X,) + (1/2) р (0) dt], (6.89)
где
Ф(t)=v/n'^t) и Н(0= Д/Н(х,) (6.90)
— матрицы Якоби соответственно для функций f(Xf) и h(Xf);
«(0= 2^^trICax,)P,]; (6.91)
л
Р(0= 2^.-^г(1>Лх.)РЛ; (6.92)
C,-(i;) = V«VJi(iO, J=lT«" (6.93)
и
D/(х;) = V;cV^;ch/(х^), j=\Tm (6.94)
— квадратные матрицы Гесса соответственно для i-й и у'-й
компонент функций f{xt) и h(Xf);
e-i=[0,...,0, 1, 0,...,0]^; t=T« (6.95)
— вектор, имеющий единичную, отличную от нуля, i-ю
компоненту.
Доказательство. Решение задачи 6.8 выполняется
аналогично решению задачи 6.6, но с более громоздкими вычислениями,
поскольку здесь рассматривается векторный случай задачи
оценивания; таким образом ограничимся только
основополагающими указаниями, пользуясь которыми, читатель может
получить интересующий его математический вывод.
181
Разложение функций i(xt) и h(X() в ряды Тейлора в окрест-
ности точки Xt до членов второго порядка малости относительно
Xt^xt—Xt при использовании обозначений (6.90), (6.93) —
(6.95) имеют вид
п
i (X,) = f (X,) + Ф (О X, + ^ J] в, tr [С, (X,) X, X,']; (6.96)
1=1
т
h (X,) = h (X,) + Н (О X, + Y S ^' ^'^^' ^^'^^' ''''^- ^^'^^
Находим условные математические ожидания f (х^) =
= M[f(X;) I Y't^] и h(X;) = M[h(X;) I У;.] при обозначениях (6.91)
и (6.92):
T(x,) = f(x,) + (l/2)a(0; h(x,) = h(>r,) + (l/2)p(0. (6.98)
Проводя выкладки, аналогичные (6.78) — (6.85), получаем
х'Я^,) - Xtf^t) = Р^Ф' (0; х'ДгГх,) - x,h^ (X,) = Р,Н^ (ty,
(6.99)
XiXjh (Xf) — XiXj h (X;) — Xi xjh (x^) — x^ Xjh (x^) +
+ 2x^h(x,) = -(l/2)P,^ 5] ^^^P^r, i=h n, /= 1, ™.
«'.'■=1 *
(6.100)
Подставляя (6.96) —(6.100) в уравнения (2.29) и (2.30),
находим искомые уравнения (6.88) и (6.89). Л
Задача 6.9 (Полный непрерывный фильтр второго порядка).
Дано:
1. Справедливы условия 1 и 2 задачи 6.8.
2. Аппроксимирующее предложение: производные функций
h(Xf) и i{xt) третьего и более высоких порядков считать
равными нулю.
Доказать, что условное математическое ожидание х^^
= M.{Xf\Y*^) удовлетворяет уравнению (6.88), а условная
корреляционная матрица Р^ = cov (х^, х^ | Yt) является
решением уравнения
^Р,=[Ф(0Р,+Р,Ф"(0 + О(0О^ОМ0-Р^ФЧ0К"'Ф(0Р^^+
+ L,|Rr'[dy,-(h(x,)+ yP(0)^]}. (6.101)
182
где
" "^ "*■ '"' ' (6.102)
^'(y=[S(SW^''S''*
4k
-k=\ ^g,r=l
— дифференциальный оператор, примененный к /n-мерному
вектору 1= [gi, ...,U]"; Р(0 задается (6.92); Р;= ||Р,-;!!„х«.
Доказательство предлагается выполнить читателю
аналогично решению задач 6.7 и 6.8 при условии, что в
предположении нормального распределения компонент вектора х имеет
место равенство
М К^г — хО {Xj — Xj) (к^ — х^) {Xi — Хг)] =
^PijPki + PikPji + PfAi- А
Задача 6.10 (Дискретный скалярный фильтр второго
порядка). Дано:
1. Модель системы
Xk+i=f{Xk)+G{Xk)Wk; Xft+i —скаляр. (6.103)
2. Модель дискретных измерений
yk+i=h{Xk+i)+Vk+u i/ft+i — скаляр. (6.104)
3. Априорная информация:
xo'^N{xo; Ро); Wk^N{0; Q*); Vk^N{0; Rk);
M{WkWj)=Qk8kr, M{VkVj)=Rkbkr,
M{w„Vj)=M{xoWk)=M{xoVk)=0. (6.105)
4. Выборка измерений 1'*1 = {у«, s^\,k}.
5. Аппроксимирующие предложения: условную плотность
распределения вероятностей n{bXk+\, Ьук+\\У''\) считать
приближенно гауссовской;
Л1(Дд;3^|У*1)=0; M{^xh\Y^^^)=ЪPЦk\k)■, (6.106)
M{bx\+i\Y^,)=Q; M{bxh+x\Yh) =ЪРЦк+\\к), (6.107)
где
AXk=Xk—x{k\k); bXf:+i=Xk+i—x{k-\-l\k);
6yk+i=yk+i-M{y,+i\Y>'i)i (6.108)
x{k\k)=M{Xk\Y^,); P(k\k)=cov(Xk, Xk\Y^i);
x{k+l\k)=M{Xk+i\Y\);P{k+l\k)=cov(Xk+u
x,+i\Y^i); (6.109)
функции f(Xk), G(xk) и h{xk+i) разложить в ряды Тейлора
соответственно в окрестности точек x{k\k) и x{k-\-l\k), ограни-
183
P{k+l\k) =
чиваясь вторыми частными производными этих функций (для
полного фильтра второго порядка);
дополнительно пренебречь центральными моментами третьего
и более высоких порядков (для усеченного фильтра второго
порядка).
Доказать 1. Алгоритм экстраполяции имеет вид
x(k+\\k)=f{x{k\k)) + {l/2yU,P{k\k); (6.110)
f/ P{k\k)-^ (1/2)]L P' {k\k) + GVk +
+ [G/+GG,, + {3/4)GL]P{k I k)Q,
— для полного фильтра;
f/P{k I k)-{m)}lP^ {k\k) + G'Q, +
+ [G/ + GG,,]P{k\k)Q,-
— для усеченного фильтра.
(6.111)
2. Алгоритм фильтрации представляют следующие
соотношения:
x{k+l\k+l)=x{k+l\k)+Kk+i[yk+i-
-h(x(k+\\k))-(\l2)fi^^P(k+\\k)]; (6.112)
P{k+l\k+l)=^.{l-K,+^hx)P{k+i\ky, (6-113)
^*+i = 'P(^+l 1^)й.^Й,; (6-114)
VP{k 4-;i I k) + (1/2)hi,РЦк+\\Щ + /?,+!
— для полного фильтра;
Л> Р{к+\\к)- (1/4) hi, РЧ^ + 1 I ^) + ^*+1
— для усеченного фильтра,
(6.115)
где /; = /, {X {k I k)); I, = I, {x{k\k)y, G = G {x {k \ k)) • G, =
== G, {X {k I k))- G\, = G,, {X {k I k))- K = hAx{k+\\ k))-
Kx == hxx {X{k^\\ k)).
Доказательство. Получим сначала уравнения
экстраполяции. Для этого разложим функции f{Xk) и G{Xk) в ряды
Тейлора в окрестности точки x{k\k). Используя обозначения
(6.108) и (6.109), получаем вместо (6.103) следующее
рекуррентное соотношение:
Xk+x=f{x{k\k))-\-f^Xk+{\l2yfxx^xh+
+ [G{x{k\k))+Q^^Xk+{\|:2)G,Лxh'\Wk-\-o{^xh), (6.116)
где o(Ax2ft) —величина бесконечно малая по отношению к Дх^^.
184
Rk+\
Вычислим условное математическое ожидание x{k-\-l\k);
пренебрегая значением o{Ax^k) и предполагая, что AXk и Wk
независимы, получим соотношение (6.110).
Вычитая из (6.116) выражение (6.110), находим
6Xk+i=UAxh+{H2yhx{Axh—P{li\li)) +
+ [G(x(k\k))+G^Xk+{ll2)Ux^xh]Wk. (6.117)
Используя (6.117), определяем
(8Xk+iy=f^xh+fxfxx (Axh-P {k I k) AXk) +
+ {\1^)1\х{Ах^-2Ах\Р{к\к)+РЦк\к)) +
+2[fAXk+{\l2)Ux{Ax\—P{k\k)^[G{x{k k)) +
+0хАХк+{\12)ОххАх'к\хю^+[0Цх(к\к))+0\Ах\+
+ (1/4) OhxAxh+2G {x{k\k)) QxAXk+
+ G{x{k\k))U^^Axh+OxGx^xhWk. (6.118)
Вычислим условное математическое ожидание Р{к-\-\\к)^
^М{Ьх^к+\\У''\), используя соотношение (6.118) и аппрокси-
мируюш,ие предложения условия этой задачи. Получим
соотношение (6.111).
Построим алгоритм фильтрации. Разложим функцию
h{Xk+\) в ряд Тейлора в окрестности точки х{к-\-\\к). Тогда
соотношение (6.104) примет следуюш,ий вид:
. yk+\=h{x{k+\\k))+hKbXk^i+
+ {\!2)nxx{bXk+,Y+Vk+,+o{bxh.H). (6.119)
Вычислим условное математическое ожидание y{k-\-\\k)^
=Al(«/ft+i| y*i), используя обозначения (6.108), (6.109) и
пренебрегая o{bx^k+\)'-
1/(^+1 |^)=Л(д;(^+1|^)) + (1/2)Я;.;.Р(^+1|^). (6.120)
Вычитая из (6.119) выражение (6.120), получаем
ЬУкМ » hxbXk+i +{\12)Пхх[ {jbXk+i) 2-
-P{k+\\k)^-^Vk+x. (6.121)
Согласно аппроксимируюш,ему предложению условная
плотность распределения вероятностей n{bXk+\, &Ук+\\^''\)
приближенно гауссовская, а поэтому для нахождения Л» (idx^+i | У*1) и
М(6^2^+1 iy*i) можно воспользоваться теоремой о нормальной
корреляции. Равенства (2.36) —(2.38) будут иметь следующий
вид: ^
М [5х,+11 У^'П = М (6х,+11Y,') + К,+1 [Ьу,^, - М (8i/*+i^^^iJ'
COV [Ьх1^, I У1*+'1 = COV [Ьх1^, I I'll -
_K,+iC0v[6i/,+i, bx,+:,\Y,% (6.123)
К,,, = GOV [Ьу,^„ Ьх,,, I Y,'\lcov\byl^^ I У/]. (6.124)
185
в силу (6.108) имеем M[6Xk+i\Y^i]=0; M[byk+i\Y>'i]=0;
M[6Xk+i\Yi'^h\^x{k+l\k+'l)-x{k+l k), поэтому (6.120) и
(6.122) дают искомое соотношение (6.112).
Вычисляем отдельно каждый член соотношений (6.123) и
(6.124), используя (6.117), (6.121):
cov(i6xA+i, bXk+x\Y^+\)=M[{Xk+,-x{k+\\k)-
-x{k+X\k+\)+x{k+\\k)y\Y'^+\} =
= Р(^+1|^+1); (6.125)
cov(6x^+1, bXk+i\Y>'x)=M[{Xk+i—x{k-\-\\k) —
-д;(^+1|^)+д;(^+1|.^))2|УМ=Р(^+1|^); (6.126)
COV(iJCft+l, Ьук+\ I Y\) =M[bXk+x {Я:^6Хк+1+{1/2)Нхх {bx\+i—
-Pik±l 1 k)) +0,+,) I Y\]=P,+,n.; (6.127)
^ГЛ cov (6r/,+i, 6r/,+, I y,*) = M [hi 8xUi +
+ (1/4)hx(8л1+,-2P(^ + 1 I ^) bxUx + P (^ + 1 I ^)) +
+ h/h^, (8x1+1—P{k+ 1 I ^)8JC,+i) + t)|+i +
+ 2 (Л;. 6д;,+, + (1/2) h,, (6л|+, - P (^ + 1 I k))) t;,+i | У^*] =
Л^Р(^ + 1 I ^) + l/2hlxP' (^ + 1 I ^) + R,+t
—для полного фильтра;
li! P{k+l I k)-{l/4)hlP'{k+l |^)+^?ft+i
— для усеченного фильтра. (6.128;
Подставляя (6.125) —(6.128) в равенства (6.123), (6.124),
находим искомые соотношения (6.113) —(6.115). Л
Посмотрим, какие аппроксимируюш,ие предложения
целесообразно использовать для построения практически реализуемых
квазиоптимальных алгоритмов непрерывно-дискретного
оценивания. Задача 2.2 дает оптимальные алгоритмы непрерывно-
дискретного оценивания. В промежутке между измерениями
алгоритм экстраполяции описывается уравнениями (2.14) и
(2.15), из которых видно, что аппроксимируюш,ее предложение
должно касаться возможности разложения в ряд функций
f(Xf), G(Xf) и использования отрезков этих рядов.
Для моментов времени проведения измерений оптимальные
оценки x(k\k) и P(k\k) формируются с помош,ью (2.16) и
(2.17), из которых видно, что одно из аппроксимируюш,их
предложений может состоять в возможности разложения в ряд
условной плотности распределения вероятностей п{ук\^к) и
использовании конечного отрезка этого ряда. Однако такой
подход нельзя считать удовлетворительным. Наличие в (2.16) и
(2.17) дроби делает алгоритм очень чувствительным к
используемому отрезку ряда, представляюш,его п{Ук\^к). Поэтому
будем в дальнейшем использовать другой подход, при котором
186
x(^l^) и P(^l^) представляются отрезком степенного ряда по
степеням измеряемых параметров с неопределенными
коэффициентами. Для нахождения этих коэффициентов необходимо
иметь вспомогательное соотношение.
Используя формулу Байеса, получаем рекуррентное
соотношение для вычисления условной плотности распределения
вероятности на моменты времени проведения дискретных
измерений:
Чх. I Y,') = Цу, I X,) 7. (X, I Y,'-y^ (у, I У,*-). (6.129)
В силу соотношения (6.104) я(Уа|ха)=я(Уй|хй, ^i*-'), а по
формуле полной вероятности
я(у*|х,, У,''-1)я(х,| У,*-1) =я(х,, уй| У,*-1).
Поэтому (6.129) принимает вид
я(х,, у*|У1''-1)=я(х,|У,*)я(у*|У1*-1). (6.130)
Используя (6.130), вычислим для произвольных нелинейных
функций s(Xft) и и(ук) условное математическое ожидание
произведения
со 00
= J J s (х^) u (у^) Tt (х^, у^ I yi*-')dXfe% =
-00 —00
00 00
J J s(x,)u(y,)4x, I У,*)Цу, I y,*-)dx,dy.
—GO—00
GO Г 00 -|
= J J s(x,)^{x, I yi*)dxJu(y,)7.(y, I y/-)dy.=
= лГ{ЖИх,)|У1*1и(у,)|У1*-}.
Таким образом, рабочее соотношение, которое будет
использоваться в дальнейшем, имеет вид
М{8{х,)и(у,) I Y,^^-^}=M{M [s(x,) | У,*]ы(у,) I У,*-1}. (6.131)
Задача 6.11. (Непрерывно-дискретный скалярный фильтр
второго порядка). Дано:
1. Модель системы описывается стохастическим
дифференциальным уравнением Ито
dxt=f{xt)dt-\-q{xt)dwt, t>to, (6.132)
где Xt — скаляр.
2. Модель дискретных измерений
yk=h{Xk)-\-Vk,
где Xk^xt при t^th, k=l, 2 ..
•; Ук-
- скаляр.
(6.133)
187
3. Априорная информация:
{wt, t^to} — процесс броуновского движения;
М [dwtdw^] = Qi6(t—x)dtdx;
Vk'-^NiO; Rk); cov {Vk\ Vj)=Rkbki;
Xq, {^t}, {Vk} — независимы. (6.134)
4. Выборка измерений yi*^{«/s, s^l, k).
5. Аппроксимирующие предложения:
x{k\k)=a+b{yk-y{k\k-\)); (6.135)
P{k\k)=C+D{yk-y{k\k-\)); (6.136)
где
x{k\k)=M [x^\ y,*J; y{k\k-\)=M [yu\ Y,^];
P{k\k)=M[{Xh—x{k\k)y\Yh]; (6.137)
a, b, C, D — неизвестные параметры;
функции f{xt), q{xt) и h{Xk) разложить в ряды Тейлора
соответственно в окрестностях точек &t и x{k\k—1),
ограничиваясь вторыми частными производными этих функций;
для полного фильтра второго порядка вычислить третьи и
четвертые центральные моменты оцениваемых параметров
аналогично гауссовскому процессу, пренебрегая всеми остальными
центральными моментами;
для усеченного фильтра второго порядка дополнительно
пренебречь третьими и четвертыми центральными моментами
оцениваемых параметров.
Доказать: 1. Для моментов времени t^\tk-u tk]
уравнения эволюции xt=M{xt\Yi'^-^) и Pt=M [{xt—xt)^\Yl^-^] имеют
вид
dxt=[f {xt)-\-{ 1/2) Pthx (xt) ] dt; (6.138)
dPt=[2Ptfx (xt) -\-ё' (Xt) Qt]dt, (6.139)
где i^(xt) задается выражением (6.71) для усеченного фильтра
и (6.87) для полного фильтра второго порядка.
2. На момент времени проведения измерений значения
x{k]k) и P{k\k) вычисляют с помощью рекуррентных
соотношений
x{k\k)=x(k\k-\)-\-Kk{yk-y(k\k-l)); (6.140)
P(:k\k) = [\-Kkli4x{k\k-\))\P(k\k-l)-\-
-\-D,{y,-y{k\k-l)), (6.141)
где
x{k\k—l)=xr, P{k\k—l)=Pt при t=tk; (6.142)
y(k\k—\)=h(x(k\k—l))-\-(l/2)P{k\k—l)fix,; (6.143)
Kk=P{k\k-l)n:cRk-'; (6.144)
188
2
XX
•i,2
■XX
D,
P{k\ k—\)h^' + R^ — {i/4)P'{k I k — i)'fi:
— усеченный фильтр;
P(k\k-l)h/ + R, + (l/2)P^k\k-iyh
— полный фильтр; (6.145)
— усеченный фильтр;
J^i2- (9-ад-НА + (^A)j
— полный фильтр; (6.146)
Nk=P4k\k-l)H:cxRk
(6.147)
В выражениях (6.143)—(6.147) у функций lix{x{k\k—1)) и
fixx{x(k\k—1)) опущен аргумент x{k\k—1) для краткости
записи.
Доказательство. Сначала получим уравнения эволюции Jct и
Pt. Для этого сопоставим результаты решения задач 2.2 и 2.4.
В промежутках между измерениями уравнения эволюции xt и
Pt (2.14), (2.15) являются частным случаем уравнений (2.29) и
(2.30) при условии, что R-^^0. Поэтому, используя уравнения
(6.69) — (6.71), описывающие результаты решения задач 6.6 и
6.7 и полагая в них ^?-i^0, получим искомые уравнения (6.138)
и (6.139), в которых q'^(xt) задается выражением (6.71) для
усеченного фильтра и (6.87) для полного фильтра второго
порядка.
Теперь перейдем к построению соотношений для вычисления
x{k\k) и P{k\k) на моменты времени проведения измерений.
Для этого воспользуемся соотношениями (6.131), (6.135) и
(6.136). Получим значения коэффициентов а, Ь, С и D,
последовательно выбирая следующие пары значений: s{Xh)^Xii и
" (!/*) = !; s{Xk)=Xk и и{ук)=Ук—у{к
—x{k
-y{k
k)y
и{Ук)=1; s{Xk) = (Xk—x{k
k)y
s{Xk) = {Xk—
и{Ук)=Ук—
k—1) и вычисляя при этих значениях левую и правую
части уравнения (6.131) с учетом (6.135) и (6.136).
Найдем:
b={xh—M)R-'=Kk;
C = P{k\ k—l) — b(xh—lcl);
D=.{M [{X - xy h \Yt'] - 2bM [{X -i) {h-h)h\ yf'] +
+ bm[{h—hyh I yf~4 —сЛ} R~',
(6.148)
(6.149)
(6.150)
(6.151)
189
где
R={h—1iY + R; (6.152)
(•)=М{- I ^1*"') — обозначение условного математического
ожидания (аргументы функций, относящиеся к моменту 4,
опущены для краткости записи).
Подставляя (6.73), (6.76) и (6.82) в (6.149) —(6.152), после
несложных, но громоздких вычислений определим искомые
равенства (6.144) —(6.147). Д
6.4. Одношаговый итерационно-последовательный фильтр
Итерационный метод — метод приближенного решения
задачи оценивания, основанный на многократном использовании
алгоритма фильтрации с целью получения оценок,
последовательно приближающихся к истинному значению оцениваемых
параметров. В состав итерационного алгоритма входят:
линеаризованный фильтр, работающий по измерительной
информации нарастающего объема; алгоритмы экстраполяции и
интерполяции, используемые для расчета коэффициентов
линеаризованного фильтра.
Рассмотрим итерационные алгоритмы, выполняющие только
один итерационный шаг. Особенности рассматриваемого
итерационного алгоритма следующие: линеаризованный фильтр
имеет постоянную структуру. На каждом итерационном шаге
обновляются коэффициенты фильтра и начальные условия его
работы за счет информации, выработанной на предыдущем
итерационном шаге. Каждая новая пара итерационных шагов
выполняется при одном и том же значении измеряемого параметра;
смысл изменения коэффициентов линеаризованного фильтра
состоит в повторной линеаризации нелинейных функций,
входящих в модели системы и измерений в точках, приближающихся
к истинным значениям оцениваемых параметров.
Применительно к нелинейным функциям f(Xft), b(Xft) и h(Xft+i) и B(Xft+i),
входящим в состав уравнений (6.1) и (6.2), это означает
следующее. При построении расширенного линеаризованного
фильтра нелинейные функции f(Xk) и Ь(ха) линеаризуются в
окрестности оценки x{k\k), а нелинейные функции h(Xft+i) и B{Xk+\) —
в окрестности оценки х(^+1|^). При поступлении нового
измерения Ук+1 вычисляется интерполированная оценка х(^|^+1) и
оценка х(^+1|^+1). Предположим, что оценки х(^|^+1) и
х(^+1|^-[-1) ближе к истинным значениям Xh и x^+i, чем
соответствующие оценки x{k\k) и x(fe+l|^). В интересах
повышения точности аппроксимации нелинейных функций следует
провести новую линеаризацию для функций f{Xk) и b(Xfe) в окрест-
190
^-^—i-Щ
Рис. 6.1. Схема бортовых навигационных измерений
ности оценки х(^|^+1), а для функций h(X;t+i) и B(Xft+i)—■
в окрестности оценки х(^+1|^+1)-
Порядок вычислительных операций при работе
итерационного алгоритма следующий:
1. Рассматривая оценки т^{к\к) и Р(^|^) как начальные
условия работы линеаризованного фильтра на момент времени
tk и полагая Хй"^х(^ к), с помощью выражений (6.4) — (6.7)
находим экстраполированные значения х((^+1|^) и Р(^+1|^).
2. По поступившему измерению y^+i, значениям Р(^+1|^) и
х(^+1|^) с помощью выражений (6.9) — (6.11) (полагая в них
Xft+i"=x(^+l|^) определяем оценких(^+1|^+1) иР(^+1|^+1).
3. По измерению" у^+ь значениям х(^+1|^) и Р(^+1|^)
с помощью соотношений (3.66) — (3.69) получаем
интерполированную оценку х(^|^+1).
4. Используя значения х(^+1|^+1). Р(^+1|^+1) и
полагая Xft"=x(^|^+1), по (6.4) — (6.7) вычисляем новые значения
yi{k^\\k) и V{k-^\\k).
5. Вновь используя измерение y^+i, новые
экстраполированные значения х(^+1|^) и Р(^+1|^) и полагая x^^+i^x (^+11^) >
с помощью соотношений (6.9) — (6.11) находим новые оценки
х(^+1|^+1) и Р(^+1|^+1). На этом обработка
измерительной информации для момента времени 4+i заканчивается.
6. Для каждого момента U, i^k-\-2, k-\-3 ... этапы 1—5
итерационного цикла повторяются.
Пример 6.1. Рассмотрим навигационный алгоритм для
определения ПДЦМ КА, движущегося относительно Земли —
сферы, по бортовым измерениям высоты полета КА и двух углов
между местной вертикалью и направлениями на две звезды
(рис. 6.1).
191
Векторное уравнение движения центра масс КА в ГЭСК
имеет вид
f=—цг/гз,
где F—радиус-вектор ЦМ КА; г=|г|; ц — коэффициент,
равный произведению гравитационной постоянной на массу Земли.
В координатной форме этому уравнению равносильна
система уравнений,
Xi^Xi+s; JC<+3=—а</, i=\, 2, 3, где х<, х<+з (J=l, 2, 3)
—координаты и проекции скорости ЦМ КА на оси ГЭСК:
Пусть в моменты времени t, t-\-At ... производятся
измерения с постоянным временным шагом А^. Бортовая
навигационная аппаратура измеряет высоту h и два угла звезда —
вертикаль Pi и Рг соответственно с ошибками V\, Иг, v^; yi^h-\-Vi;
!/2=Pi+W2; !/з=Р2+из. где h, Pi, Рг —истинные значения
указанных параметров.
Погрешности измерений не коррелированы и подчиняются
нормальному закону распределения вероятностей
Vi^N{0,Ri),i= 1,2,3.
Высота центра масс КА над обш,еземным эллипсоидом
h=r—R^{l—yX3h-^),
где Нэ — экваториальный радиус Земли; у — коэффициент
сжатия эллипсоида.
Единичные векторы N, Li, L2, определяюш,ие линии
визирования местной вертикали и двух звезд, выражаются через
координаты Х{ (i^l, 2, 3) ЦМ КА и экваториальные координаты
звезд («33 , Sg^ ), /=1,2 в следующем виде:
N=(xir-i, Х2/-1, Хзг-^)^; L/=:(Li/, L2/, ^з/)^;
где Lif = cos 633^ cos «33^; L,^ = cos 63^^ sina33^; L,^ = sin 633^.
Углы
P;=arccos {х1Г-Чи+Х2Г-Ч21-\-ХзГ-Чз,), /=1, 2.
Предположим, что построена опорная орбита как результат
решения уравнений движения ЦМ КА по начальным условиям
Хо=||х;(^о)11. /^ГД. Элементы опорной орбиты на момент
времени t обозначим Xf"=||X;"(^)||, /=1,6.
Требуется построить алгоритм оценивания ПДЦМ х<=
=||л;г(/)||, /=1,6, обеспечивающий минимум средне-квадратиче-
ской ошибки оценки, используя последовательно поступаюш,ие
192
дискретные измерения
yk+i = [yi{tk+M), y^itk+M), Уз{к+М)]\
где ^=0, 1, 2 ...
Данный технический пример укладывается в модельную
схему задачи 6.3, поэтому, пользуясь обозначениями задачи 6.3
и ограничиваясь в (6.39) членами первого порядка малости
относительно Д^, можно в данном случае записать:
F(x,)=
А(хЛ =
ЕзДГ
s(x/4t,))=\\Sii{xj'4t,))\\,
Xk+i=[xi{tk+M), Xi+3{tk-\-At)]^;
h(Xft+i)=[ft(Xft+i), pi(Xft+i), p2(xft+i)]'';
0
.^g(xj'4t,))r-'(xj'4t,))s(Xj"(t,))At
Ф(хЛ = Е, + А(хЛ
[3 П1/2
IiiXj"{t,)Y
sйix]чt.))^-i^^^''^^^'^^^~'' "P"^ = '
I «i (^/ (^*)) «J (X/ (^,)) при J ^ /, r, / = 1, 2, 3;
Ез и Еб — единичные матрицы соответственно размерности 3X3
и 6X6.
Матрица Н(х^^,),определяемая равенством (6.11), в данном
случае приобретает конкретный вид:
где i, у=1, 2, 3; /=1,6.
Опуская далее для краткости записи аргумент л:/"(4+Л0>
выпишем элементы матрицы Н(х^^,):
Г [ 1 - 2ауг-' (а,= г-= + 6,,)] х,г-' при i = 1, / = 1, 2, 3;
Нп = I [Njtcosр,-/.я!(/• sinpi)-' при J = 2, 3, у, /=1,2, 3;
[ О при / = 4, 5, 6.
Навигационный алгоритм, как следует из задачи 6.3, будет
описываться уравнениями (6.8) — (6.10), (6.35)—.(6.38).
13—6899 193
в заключение отметим некоторые возможные направления
будущих исследований.
1. Построение оптимальных линейных и нелинейных
алгоритмов оценивания при негауссовских шумах.
2. Разработка методов, позволяющих сократить до
минимума время переходных процессов при решении задач оценивания
в случае несоответствия априорной и реальной информации,
использованной при построении автоматической системы.
3. Оценка эффективности работы алгоритмов оценивания
при наличии недостоверной априорной статистической
информации.
4. Совместное оптимальное решение нелинейных задач
прогнозирования и оценивания при больших по времени перерывах
между измерениями.
5. Оптимальное управление наблюдениями в нелинейных
автоматических системах оценивания и прогнозирования
случайных процессов.
6. Решение задачи декомпозиции автоматической системы
оценивания на подсистемы меньшей размерности, выполняющие
периферийные вычисления и управляемые из центральной
подсистемы, формирующей окончательную оценку случайного
процесса.
7. Комплексное оптимальное решение задач обнаружения и
оценивания с целью получения оценок случайного процесса,
находящихся в требуемом диапазоне значений.
Приложение
Векторное дифференцирование. 1. Оператор градиента по компонентам
вектора х:
х=[д;1, Хг, ..., ХпУ\ А{х.) — скаляр;
Г дА дА
дА 1
дхп
Vx V/ ^ =
d'xidx]
. «, / = 1, п,
(П.1)
*= [/i. Ь,. •. . fn]^ — векторная функция;
dh
dfn
v*f^=
dxi \ dxi
5fi : dfn
_ дХп • дХп .
>
Л=х-Рх; х=х(е); 6 = [9,, .... 9*]^;
Р — матрица размерности «Хя;
уИ=(Р+Р^)х;
Ve^=\
7ехЧ9)уИ;
(П.2)
(П.З)
{П.4)
{П.5)
7:(х|в)=(2;^) "''|Р(9)| '''expj_ J-b''(9)p(9)-ib(e)
где Р(9) —матрица размерности пХп;
b(9)=[bi(e) 6п(9)]-
ainn(x| 8)
У„1П7:(х|в) =
дЬ,
t = 1, п;
^JM^„-4-.-|p-.[(B-bb.P-.):^+2^b,]} ,п.е)
(аргумент 9 опущен у Р(9), Ь{9)).
13»
195
2. Производная скаляра по матрице
rf(x^Px)/rfP-xx^;
rf(x^P-'x)dP—Р-1ххф-1;
rf|P|/rfP-|P|(P->)\
rflnl P|/rfP-(P-')^
3. Производная по скаляру
rfP-i
д
р-1 р-1.
-^ (Ь^Р- Ь) = tr [ - Р-1 ЬГ Р-^] + 2Ь^Р- ^
Некоторые интегралы. 1. Интегралы Дирихле:
v= J - -
rfx =
{П.7)
(П.8)
{П.9)
(П.10)
(П.11)
(П.12)
(П. 13)
(П. 14)
_ , Г(п/2 + 1) |Р|1/2'
'= I ..-»(^)~^«[r(f+.)]-.
х^х < 1
где d-x.=dxi-dx2- ... -dxn; Г(-)—гамма-функция; с — константа; Р
—симметричная положительно определенная магрица.
2. Несобственные интегралы
00
f exp(-xTPx)rfx = n'''^ |Р f''^ (П.15)
DO
Г expf/u'^x-—x''Px]dx= (2n)"'2lP Г'/2ехр[-—u'^P-iuV (П.16)
—00
Лемма об обращении матриц. Если положительно определенные
невырожденные матрицы А„^„,В„^„, R^x^H произвольная матрица Н^^„ связаны
соотношением
то
A=B-BH^[HB№-fR]-'HB,
A-i = B-i+H^R->H.
{П.17)
(П. 18)
Разложение матрицы на произведение треугольных матриц. 1. Метод Чо-
леского [97]. Если матрица А симметрична и положительно определена, то
существует нижнетреугольная не особенная матрица В, такая, что А=ВВ''.
Матрица В имеет следующие элементы:
6» =
а\{^, при t= 1;
г 1—1 \1/2
'*"—2*ift • при»=2,3 п;
(П.19)
196
Ьц =
о,
при / < ;■;
при ;■ = 1; (= 2, 3,.
п\
а^/-2 6fft&/ft U//, при» >;•>!.
(П. 20)
2. Вычисление квадратного корня из матрицы с использованием
собственных значений матрицы. Пусть А — положительно определенная матрица,
имеющая положительные собственные значения Я), Лг, ..., Яп и матрицу
собственных векторов Т. Тогда
В=а1/2 = Т
■х}/2
О
О
хУ^
(П.21)
Решение системы неоднородных линейных дифференциальных уравнений
с постоянными коэффициентами. Пусть
rfx/rf<=A(x)-f*(0.
(П,22)
где х=[д;1 л»]', Ап^п—постоянная матрица; f(0=[fi(0 /"(ОГ
имеет вид
x(0=exp(A(<-<o))x(0)+Jexp(A(<-t))f (t)dt,
(П.23)
где х(0) — значение х(<) при <=0,
Эквивалентные формы представления коэффициента усиления и
апостериорной корреляционной матрицы в фильтре Калмана. Коэффициент усиления
Ка = Р(й|й-1)На-Ма-';
Ка = Р(й|й)На-Ка-',
гце Ма = НаР(й|й-1)На--|-Ка.
Апостериорная корреляционная матрица;
Р(й|й) = (Е-КаНа)Р(й|й-1);
Р(й|й)=Р(й|й-1)-Р(й|й—1)Н*-М*-1Р(й|й-1);
Р(й|й) = (Р-1(й|й-1)4-Н*-К*-1Н*)-';
Р(й|й)=Р(й|й-1)(Е-|-Н*-К*-1Н*Р(й|й-1))-ь
Р(й|й)=Р(й|й-1)-К*М*К*\
Р(й|й) = (Е-КаНа)Р(й|й-1)(Е-КаН0т-|-КаКаКа^
(П,24)
(П,25)
(П.26)
(П,27)
{П.28)
{П.29)
(П.ЗО)
{П,31)
(П,32)
(при условии п. 26).
Формула Ито для стохастических дифференциалов [23]. Если случайный
процесс X/ удовлетворяет стохастическому дифференциальному уравнению Ито
197
(2,1), a ф(х/, <)—скалярная функция, непрерывно дифференцируемая по t
и имеющая непрерывные частные производные по х/ до второго порядка, то
случайный процесс ф==ф(х/, t) имеет стохастический дифференциал Ито
(аргументы функций опущены д^гя краткости записи):
^ift+^lf + Y^' (GQG'te)) dt + ^lGdv/t,
(П.ЗЗ)
где Х(=[д;1
<fxx —
..., XnY; (px''=ldq>/dxi,
- d2^ Qi^ -
dxi 2 дх^дхп
d^<f d^<f
d(f/dxn];
dXndXi
fir 2
OXn -J
уравнение Колмогорова «вперед» [40]. Переходная плотность
распределения вероятностей-я (х/, <|хо, to) случайного процесса х/, описываемого
стохастическим дифференциальным уравнением Ито (2,1), является решением
следующего уравнения в частных производных:
dn(xt, t\xo, to)/dt'^L{n{xt, t\xo, to)),
(П,34)
где
L(.) = -
d(-h)
дх{
It
4 Б
^г(-000т)^у
dxi dXj
— производящий оператор; ^(xq, <q | Xq, <o) = ^ (xf — ^Iq) — дельта-функция.
В линейном случае, когда в уравнении (2.1) f(x/, t)=F(t)xt и G(x/, t) =
= G(t), уравнение (П.34) имеет вид
dn/dt=-ntTF—n.-'Px+(l/2) tr (GQG-Я;,;,)
(П.35)
(аргументы функций опущены для краткости записи).
Формула Кушнера [122]. Если непрерывный (л-Ьт)-мерный случайный
процесс {х/, у/} описывается стохастическими дифференциальными уравнения'
ми Ито (2.1) и (2.2) и измерению доступна реализация Уо' = {у>. «е[0, ф, то
условная плотность распределения вероятностей я=я(х(, t\Yo') удовлетворяет
уравнению
dn= L(n)dt + (h — h)^ R-i(rf y^ — h dt)n,
(П.36)
где L(-) —производящий оператор; h=Al[h|yo']; (аргументы функций
опущены для краткости записи).
198
Вероятность попадания случайного вектора в эллипсоид. Пусть п-мерный
случайный вектор х имеет нормальный закон распределения. Тогда
вероятность Р(п, с) попадания этого вектора внутрь эллипсоида х''Р~^\=с^, где
Р — симметричная положительно определенная матрица, может быть
вычислена по конечной формуле
Р(л, с)= Г (2п)-"/2 I р|-1/2ехр ^-—(x^p-ix)] rfx =
х'^р—lx<c«
1 — \ d"-i exp (— ц2/2) dv
2"'^ Г (л/2+1) J
или с помощью рекуррентного соотношения
2
Р(л, с) =Р{л —2, с)——— с«-2ехр(—с2/2);
А(п)
где
А(п) = (п-2) А(п-2);
А(1) = У^:
Л (2) =2;
Р(1, с) = erf (с);
Р(2, с) = 1 —ехр (_с2/2);
Г(-) —гамма-функция.
Список литературы
1. Алберт А. Регрессия, псевдоииверсия и рекуррентное оценнванне: Пер.
с англ. /Под ред. Я. 3. Цыпкнна. М.: Наука, 1977.
2. Андреев Н. И. Смещенные оценки параметров процессов управления//
Автоматика и телемеханика. 1977. № 9. С. 30—43.
3. Ананьев Б. И., Ширяев В. И. Определение наихудших сигналов в
задачах гарантированного оценивания// Автоматика и телемеханика. 1987. № 3.
С. 49—58.
4. Бажинов И. К., Почукаев В. Н, Оценка параметров траектории полета
космического аппарата при неизвестной матрице вторых моментов ошибок
навигационных измерений// Космические исследования. 1971. Т. IX. Вып. 2.
С. 173—178.
5. Бахшиян Б. Ц., Назиров Р. Р., Эльясберг П. Е. Определение и
коррекция движения (гарантирующий подход). М.: Наука, 1980.
6. Бебенин Г. Г., Скребушевский Б. С, Соколов Г. А. Системы
управления полетом космических аппаратов. М.: Машиностроение. 1978.
7. Беллантони Д. Е., Додж К. Ю. Новые методы фильтрации Калмана —
Шмидта// Ракетная техника и космонавтика. 1967. Т. 5, № 7. С. 117—123.
8. Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит.
1960.
9. Беллман Р. Введение в теорию матриц: Пер. с англ./ Под ред.
В. Б. Лидского. М.: Наука, 1976.
10. Богуславский И. А. Методы навигации и управления по неполной
статистической информации. М.: Машиностроение, 1970.,
И. Брайсон А. Е,, Хо Ю-Ши. Прикладная теория оптимального
управления: Пер. с англ./ Под ред. А. М. Летова, М.: Мир, 1972.
12. Браммер К., Зиффлинг Г. Фильтр Калмана — Бьюси: Пер. с англ./
Под ред. И. Е. Казакова. М.: Наука. 1982.
13. Брандин В. Н., Разоренов Г. Н. Определение траекторий космических
аппаратов. М.: Машиностроение, 1978.
14. Бранец В. Н., Шмыглевский И. П. Применение кватернионов в
задачах ориентации твердого тела. М.: Наука. 1973.
15. Брандин В. Н., Васильев А. А., Х]|дяков С. Т. Основы
экспериментальной космической баллистики М.: Машиностроение. 1974.
16. Бэттин Р. Наведение в космосе. М.: Машиностроение, 1966.
17. Ван Трис Г. Теория обнаружения, оценок и модуляции: Пер. с англ./
Под ред. В. И. Тихонова. М.: Советское радио, 1972. Т. I.
18. Васильев Ф. П. Методы решения экстремальных задач. М.: Наука.
1981.
19. Венгеров А. А., Щаренский В. А. Прикладные вопросы оптимальной
линейной фильтрации. М.: Эирргоиздат. 1982.
20. Витерби Э. Д, Принципы когерентной связи: Пер. с англ./ Под ред.
Б. Р. Левина. М.: Советское радио. 1970.
21. Гантмахер Ф. Р. Теория матриц. М.; Наука, 1966.
200
22. Гарантированное оценивание н задачи управлепня. Свердловск: УНЦ
АН СССР. 1986.
23. Гнхман И. И., Скороход А. В. Введение в теорию случайных
процессов. М.: Наука, 1965.
24. Глонти О. А. Последовательная фильтрация и интерполяция
компонент марковской цепи// Литовский математический сборник. 1969. Т. 9. № 2.
С. 263—279.
25. Глонти О. А. Экстраполяция компонент марковской цепи// Литовский
математический сборник. 1969. Т. 9. № 4. С. 741—754.
26. Гончаревский В. С. Радиоуправление сближением космических
аппаратов. М.: Советское радио. 1976.
27. Грень Е. Статистические игры и их применение: Пер. с польск./ Под
ред. Г. Г. Пирогова, С. Д. Горшенина. М.: Статистика. 1975.
28. Григорьев Ф. Н., Кузнецов Н. А., Серебровский А. П. Управление
наблюдениями в автоматических системах. М.: Наука, 1986.
29. Дашевский М. А., Липцер Р. Ш. Применение условных
семиинвариантов в задачах нелинейной фильтрации марковских процессов// Автоматика и
телемеханика. 1967. № 6. С. 63—74.
30. Двайт Г. Б. Таблицы интегралов и другие математические формулы:
Пер. с англ./ Под ред. К. А. Семендяева. М.: Наука. 1977.
31. Де Гроот М. X. Оптимальные статистические решения: Пер. с англ./
Под ред. Ю. В. Линийка и А. М. Кагана. М.: Мир. 1974.
32. Демин Н. С. Оптимальное оценивание и оптимальная классификация
стохастических систем со случайными скачкообразными процессами в канале
измерения// Автоматика и телемеханика. 1976. С. 25—33.
33. Дуб Д. Л. Вероятностные процессы. М.: Изд-во иностр. лит. 1956.
34. Евтушенко Ю. Г. Л^етоды решения экстремальных задач и их
применение в системах оптимизации. М.: Наука. 1982.
35. Ершов А. А., Липцер Р. Ш. Робастный фильтр Калмана в
дискретном времени// Автоматика и телемеханика. 1978. № 3. С. 60—69.
36. Ершов А. .\. Стабильные методы оценки параметров// Автоматика и
телемеханика. 1978. № 8. С. 66—100.
37. Жданюк Б. Ф. Основы статистической обработки траекторных
измерений. М.: Советское радио. 1978.
38. Зангвилл У. И. Нелинейное программирование. Пер. с англ. М.:
Советское радио. 1973.
39. Иванов Ю. П., Синяков А. Н., Филатов И. В. Комплексирование
информационно-измерительных устройств летательных аппаратов. Л.:
Машиностроение. 1984.
40. Казаков В. А. Введение в теорию .марковских процессов и некоторые
радиотехйнческие задачи. М.; Советское радио. 1973.
41. Калачев М. Г. Аналитический расчет стационарного фильтра
Калмана — Бьюси в одной многомерной задаче фильтрации// Автоматика и
телемеханика. 1972. № 1. с. 46—50.
42. Калачев М. Г., Петровский А. М. Многократное дифференцирование
сигнала с ограниченным спектром// Автоматика и телемеханика 1982, № 3
С. 28—34.
43. Калман Р. Е., Бьюси Р. С. Новые результаты в теории линейной
фильтрации и прогнозирования: Пер. с англ.// Тр. американского общества
инженеров-механиков. 1961. Т. 83, № 1. С. 123—141.
44. Каминский П. Д., Брайсон А. Е., Шмидт С. Ф. Обзор современных
методов дискретной фильтрации, использующих квадратные корни из матриц:
Пер. с англ.// Зарубежная радиоэлектроника. 1973. № 6. С. 37—53.
45. Карлсон Н. А. Быстрая треугольная форма реализации фильтра
Калмана методом, использующим извлечение корней квадратных из матриц:
Пер. с англ.// Ракетная техника и космонавтика. 1973. Т. И. № 9. С. 54—83.
46. Кац И. Я. Минимаксно стохастические задачи в многошаговых систе-
201
мах// Оценивание в условиях неопределенности. Свердловск: УНЦ АН СССР.
1982. С. 43—59.
47. Кац И. Я; Куржанский А. Б. Минимаксная многошаговая фильтрация
в статистически неопределенных ситуациях// Автоматика и телемеханика.
1978, № И. С. 79—87.
48. Кривоцюк В. И. Фильтр Калмапа в задачах измерения параметров
нелинейных динамических систем// Измерительная техника. 1986, № 7.
С. 8—10.
49. Кузнецов Н. А., Лубков А. В. Адаптивная фильтрация компонентов
марковских процессов// Автоматика и телемеханика. 1975. № 4. С. 49—55.
50. Куржанский А. Б. Управление и наблюдение в условиях
неопределенности. М.: Наука. 1977.
51. Кицул П. И. О непрерывно-дискретной фильтрации марковских
процессов диффузионного типа// Автоматика и телемеханика. 1970. № И.
С. 29—37.
52. Крамер Г. Математические методы статистики: Пер. с англ./ Под ред.
А. И. Колмогорова. М.: Мир. 1975.
53. Крогман У. Фильтр Калмана, теория и возможности применения его
в системах инерцнальной навигации// Механика. 1973. Т. 141. № 5. С. 17—30.
54. Кузовков Н. Т., Салычев О. С. Инерцнальная навигация и
оптимальная фильтрация. М.: Машиностроение. 1982.
55. Куландин А. А., Тимашев С. В., Иванов В. П. Энергетические
системы космических аппаратов. М.: Машиностроение. 1979.
56. Кюнци Г. П., Крелле В. Нелинейное программирование: Пер. с нем./
Под ред. Г. А. Соколова. М.: Советское радио. 1965.
57. Лебедев А. А., Соколов В. Б. Встреча на орбите. М.:
Машиностроение. 1969.
58. Ли Р. Оптимальные оценки, определение характеристик и управление:
Пер. с англ./ Под ред. Я. 3. Цыпкина. М.: Наука. 1966.
59. Липцер Р. Ш. Уравнения почти оптимального фильтра Калмана при
особенной матрице коварнаций шума в наблюдениях// Автоматика и
телемеханика. 1974. № J. С. 35—41,
60. Липцер Р. Ш., Ширяев А. Н. Статистика случайных процессов. М.:
Наука. 1974.
61. Логинов В. П., Устинов Н. Д. Приближенные алгоритмы нелинейной
фильтрации// Зарубежная радиоэлектроника. Ч. 1. 1974. № 2. С. 28—48/
Ч. 2. 1976. № 2. С. 3—28.
62. Медич Дж. Статистически оптимальные линейные оценки и
управление: Пер. с англ./ Под ред. А. С. Шаталова. М.: Энергия. 1973.
63. Мехра Р. К. Идентификация и адаптивная фильтрация Калмана//
Механика. 1971. Т. 127. j4o 3. С. 34—51.
64. Мехра Р. К. Сравнение нескольких нелинейных фильтров для системы
слежения за входящими в атмосферу летательными аппаратами: Пер.
с англ.// Вопросы ракетной техники. 1973. № 1. С. 3—23.
65. Миллер Р. В. Асимптотическое поведение фильтра Калмана с
экспоненциальным старением данных// Ракетная техника и космонавтика. 1971.
Т. 9. № 3. С. 239—241.
66. Мишкин Э. Аналитическая теория нелинейных систем/ Сб.:
Приспосабливающиеся автоматические системы. М.: Изд-во иностр. лит. 1963.
С. 346—378.
67. Мудров В. Н., Кушко В. Л. Методы обработки измерений. М.:
Советское радио. 1976.
68. Невельсон М. Б., Хасьмниский Р. 3. Стохастическая аппроксимация и
рекуррентное оценивание. М.; Наука. 1972.
69. Неволько М. П., Чаплинский В. С, Каинов А. Ф. Об использовании
динамического программирования и нелинейной рекуррентной фильтрации
в задачах оценки вектора состояния космического аппарата// Космические
исследования. 1973. Т. П. Вып. 6. С. 819—827.
202
70. Огарков М. А, Априорная модель случайных блужданий точки в
сферическом секторе/ Сб. рефератов депоинроваииых рукописей. М.: Всесоюзный
институт межотраслевой информации. 1973. Вып. 9.
71. Огарков М. А. О линеаризации стохастических дифференциальных
уравнений/ Сб. рефер.атов депонированных рукописей. М.: Всесоюзный
институт межотраслевой информации. 1973. Вып. 9.
72. Основы теории полета космических аппаратов/ В. С. Авдуевский,
Б. М. Антонов, А. А. Анфимов и др. М.: Машиностроение, 1972.
73. Оценивание вектора состояния динамической системы при наличии
аномальных измерений/ А. А. Кириченко, Т. А. Коломейцева, В. П. Логинов
и др.// Зарубежная радиоэлектроника. 1981. № 12. С. 3—23.
74. Приспосабливающиеся автоматические системы: Пер. с англ./ Под ред.
Э. Мишкина, Л. Брауна, Я. 3. Цыпкина: Изд-во иностр. лит. 1963.
75. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. М.: Наука.
1967.
76. Рао С. Р. Линейные статистические методы и их применение: Пер.
с англ./ Под ред. Ю. В. Линийка. М.: Наука. 1968.
77. Раушенбах Б. В., Токарь Е. Н. Управление ориентацией космических
аппаратов. М.: Наука. 1974.
78. Репин В. Г., Тартакозский Г. П. Статистический синтез при априорной
неопределенности и адаптация информационных систем. М.: Советское
радио. 1977.
79. Ривкин С. С, Ивановский Р. И., Костров А. В. Статистическая
оптимизация навигационных систем. Л.: Судостроение. 1976.
80. Рокафеллар Р. Т. Выпуклый анализ. М.: Мир. 1973.
81. Романенко А. Ф., Огарков М. А. К определению несмещенных оценок,
минимизирующих нижнюю границу среднего квадрата ошибки// Научные
чтения по авиации и космонавтике. М.; Наука. 1981. С. 274.
82. Рябова-Орешкова А. П. К вопросу о линейной фильтрации на ЦВМ//
Техническая кибернетика. 1969. № 3. С. 175—188.
83. Рябова-Орешкова А. П. Об устойчивости фильтров Калмана//
Техническая кибернетика. 1970. № 5. С. 203—212.
84. Сейдж Э., Меле Дж. Теория оценивания и ее применение в связи и
управлении: Пер. с англ./ Под ред. Б. Р. Левина. М.: Связь. 1976.
85. Семушни И. В. Активная адаптация оптимальных дискретных
фильтров// Техническая кибернетика. 1975. № 5. С. 192—198.
86. Серебровский А. П. О регулиризацни дискретного фильтра Калмана//
Автоматика и телемеханика. 1975. № 3. С. 70—74.
87. Симкин М. М. О рекуррентной фильтрации при
взаимно-коррелированных шумах объекта и измерителя// Автоматика и телемеханика. 1980.
№ 1. С. 71—80.
88. Смит Дж. Л. Последовательная оценка дисперсии ошибок измерений
R задаче определения траектории: Пер с англ.// Ракетная техника и
космонавтика. 1967. Т. 5. № И. С. 55—63.
89. Сосулин Ю. Г. Теория обнаружения и оценивания стохастических
сигналов. М.: Советское радио. 1978.
90. Справочник по вероятностным расчетам/ Г. Г. Абезгауз, А. П. Тронь,
Ю. Н. Копенкни и др. М.: МО СССР, 1970.
91. Статистические методы в экспериментальной физике/ В. Т. Идье,
Д. Драйард, Ф. Е. Джеймс и др. М.: Атомиздат. 1976.
92. Тарн Ци-йонг, Заборшский Дж. Практически нерасходящийся фильтр:
Пер. с англ.// Ракетная техника и космонавтика. 1970. Т. 8. № 6. С. 173—180.
93. Тейпли Б. Д., Бори Д. X. Последовательная процедура оценки
состояния и ковариационной матрицы ошибок наблюдений. Пер. с англ.// Ракетная
техника и космонавтика. 1971. Т. 9, № 2. С. 27—34.
94. Тихонов А. Н. О регуляризации некорректно поставленных задач//
Доклады АН СССР. 1963. Т. 153. № 1. С. 49—52.
95. Тихонов А. Н. О некорректных задачах линейной алгебры и устойчи-
203
BOM методе их решения// Доклады АН СССР. 1965. Т. 163, № 3. С. 591—594.
96. Тихонов В. И., Кульман Н. К. Нелинейная фильтрация и квазиопти-
мальиый прием сигналов. М.: Советское радио. 1975.
97. Фаддеев Д. К., Фаддеева В. Н. Вычислительные методы линейной
алгебры. М.: Физматгиз. I960.
98. Фомин В. Н. Рекуррентное оценивание и адаптивная фильтрация. М.:
Наука. 1984.
99. Хазен Э. М. Методы оптимальных статистических решений и задачи
оптимального управления. М.: Советское радио. 1968.
100. Хачинсон С. Е., Д'Апполнто Д. Д., Бонджиовани П. Л.
Минимаксное проектирование фильтров калмановского типа при наличии
неопределенности параметров системы// Ракетная техника и космонавтика. 1973. Т. И.
Ло 5. С. 150—157.
101. Хацкевич И. Г. Метод обработки одного типа измерительной
информации/ Сб. Математическое обеспечение космических экспериментов. М.:
Наука. 1978. С. 82—87.
102. Цыпкин Я. 3. Адаптация и обучение в автоматических системах. М.:
Наука. 1968.
103. Черкай А. Д. Критерий максимальной плотности доверия в задачах
оценки ограниченных параметров// Техническая кибернетика. 1976. № 4.
С. 151—157.
104. Черноусько Ф. Л. Оптимальные гарантированные оценки
неопределенностей с помощью эллипсоидов// Техническая кибернетика. 1980. № 3.
С. 3-II/1980. № 4. С. 3-II/1980. № 5. С. 5—11.
105. Черноусько Ф. Л. Оценивание фазового состояния динамических
систем. Метод эллипсоидов. М.: Наука. 1988.
106. Шапиро Е. И. Рекурсивный алгоритм фильтрации с учетом
аномальных ошибок// Радиотехника и электроника. 1980. № 2. С. 290—295.
107. Шкирятов В. В. Радионавигационные системы и устройства. М.:
Радио и связь. 1984.
108. Шли Ф. X., Стэндиш Ц. Д., Тода Н. Ф. Расходимость фильтрации
по Калману// Ракетная техника и космонавтика. 1967. Т. 5. № 6. С. 73—81.
109. Эльясберг П. Е. Определение движения по результатам измерений.
М.Г Наука, 1976.
110. Эндрюс А. Формулировка уравнений фильтра Калмана с
использованием квадратных корней из ковариационных матриц: Пер. с англ.//
Ракетная техника и космонавтика. 1968. Т. 6. № 6. С. 217—219.
ill. Юдин Д. Б. Математические методы управления в условиях
неполной информации. М.: Советское радио. 1974.
112. Яшин А. И. Фильтрация скачкообразного марковского процесса с
неизвестными вероятностными характеристиками при аддитивной помехе//
Автоматика и телемеханика. 1968. № 12. С. 25—30.
ИЗ. Яшин А. И. О выделении скачкообразно меняющихся параметров
многомерных процессов// Автоматика и телемеханика. 1969. № 10. С. 60—67.
114. Яшин А. И. Условные семиинварианты в задачах фильтрации со
скачкообразными компонентами// Автоматика и телемеханика. 1970. № 2.
С. 20—26.
115. Athans М., Wishner R. Р., Bertolini А. Suboptimal state estimation
for continuous — time nonlinear systems from discrete noisy measurements//
IEEE Transactions on Automatic Control. 1968. Vol. AC-13. № 5. P. 504—514.
116. Bierman G. J. Factorization methods for discrete sequential estimation.
N. Y.: Academic Press. 1977.
117. Bobrovsky В., Zakat M. A lower bound on the estimation error for
Markov processes// IEEE Trans. Autom. Control. 1975. Vol. AC-20. N 6.
P. 785—788.
118. Buoy R. S., Joseph P. D. Filtering for stochastic processes with
application to guidance. N. Y.: Interscience. 1968.
119. Cox H. On the estimation of state variables and parameters for noisy
204
dynamic systems// IEEE Transactions on Automatic Control. 1964. Vol. AC-9,
N 1. P. 5—12.
120. Ho Y. C, Lee R. С A Bajesian approach to problems in stochastic
estimation and control// IEEE Trans. Autom. Control. 1964. Vol. AC-9. N 4,
P. 333—339.
121. Jazwinski A. H. Adaptive filtering// Automatica, 1969. Vol. 5. № 4.
P. 475—485.
122. Jazwinski A. H. Stochastic processes and filtering theory, N. Y.
Academic Press. 1970.
123. Kalman R. E. A new approach to linear filtering and prediction
problems// Journal of Basic Enginiering, 1960. Vol. 82. № 1. P. 35—45.
124. Mehra R. K. Approaches to adaptive filtering// IEEE Transactions on
Automatic Control, 1972. Vol. AC-17. № 5. P. 693—698.
125. Monzingo R. A. Discrete optimal linear smoothing for Systems with
Uncertain Observations// IEEE Trans, on Inform. Theory, 1975. Vol. IT-21,
№ 3. P. 271—275.
126. Nahi N. E. Optimal Recursive Estimation with uncertain Observation//
IEEE Trans, on Inform. Theory, 1969. Vol. IT-15. № 4. P. 457—462.
127. Schweppe F. C. Uncertain dynamic systems. New Jersey: Prentice-Hall.
Inc. Englewood cliffs. 1973.
128. Sorenson H. W. Kalman filtering techniques// Advances in Control
Systems. 1966. Vol. 3. P. 73—79,
129. Wishner R. P., Tabaczynski J. A., Athans M. A comparison of three
non —linear filters. Automatica, 1969. Vol. 5. № 4. P. 487—496.
Оглавление
предисловие 3
Глава 1. Постановка задачи оценивания 6
1.1. Некоторые технические задачи оценивания 6
1.2. Общая формулировка задачи оценивания 11
1.3. Критерии оптимизации при вероятностном подходе .... 13
1.4. Критерии оптимизации при наличии априорной
неопределенности ' 17
Глава 2. Элементы теории оценивания . . . , 20
2.1. Эволюция статистических моментов 20
2.2. Обобщенная теорема о нормальной корреляции 30
2.3. Комплексированне регулярных оценок ....... 36
2.4. Нерегулярные оценки с ограниченным множеством значений 40
Глава 3. Оптимальные линейные- алгоритмы оценивания при полной
априорной информации 44
3.1. Фильтрация и экстраполяция при некоррелированных помехах 44
3.2. Последовательная обработка дискретных измерений ... 51
3.3. Интерполяция компонент гауссовских процессов .... 55
3.4. Учет старения измерений при оптимальной фильтрации ... 62
3.5. Фильтрация при взаимной коррелированности шумов моделей
системы и измерений 64
3.6. Фильтрация при наличии автокоррелированных шумов ... 74
3.7. Методы фильтрации на основе использования квадратных
корней из матриц 77
3.8. Фильтрация при наличии аномальных измерений .... 90
Глава 4. Адаптивная фильтрация при параметрической априорной
неопределенности ,101
4.1. Априорная неопределенность и адаптация 101
4.2. Рекуррентное оценивание вектора состояния и корреляционной
матрицы погрешностей измерений 102
4.3. Адаптивная фильтрация при использовании стационарных систем 108
4.4. Адаптивная фильтрация по последовательности скалярных
измерений ИЗ
4.5. Адаптивный алгоритм с обратной связью по обновляемой
последовательности 118
4.6. Оптимальные оценки и управление моделью системы . . . 122
4.7. Адаптивный регуляризованный алгоритм дискретной фильтрации 126
206
Глава 5. Задачи оценивания при статистической априорной
неопределенности 136
5.1. Математические операции с эллипсоидами неопределенности
(основные результаты) 136
5.2. Апостериорная эллипсоидальная аппроксимация области
неопределенности оцениваемых параметров 141
5.3. Апостериорные эллипсоидальные аппроксимации области
достижимости оптимальных среднеквадратических оценок . , . 145
5.4. Минимаксное оценивание в статистически неопределенных
ситуациях 150
5.5. Коррекция регулярных оценок параметров при учете
ограниченности множества их значений 153
Глава 6. Аппроксимация нелинейных алгоритмов оценивания ... 168
6.1. Алгоритмы оценивания, линеаризованные относительно опорной
траектории 168
6.2. Расширенные линеаризованные фильтры 175
6.3. Скалярные фильтры второго порядка 177
6.4. Одношаговый итерационно-последовательный фильтр . . . 190
Приложение , . 195
Список литературы . , 200
Производственное издание
Огарков Михаил Алексеевич
Методы статистического оценивания
параметров случайных процессов
Редактор С. А. Шаталов
Редактор издательства В. И. Петухова
Художественные редакторы Т. А. Дворецкова, А. А. Белоус
Технический редактор Т. Ю. Андреева
Корректор Л. С. Тимохова
ИБ № 2182
Сдано в набор 02.11.89. Подписано в печать 06.04.90. Т-08267
Формат 60X88* / IJ. Бумага типографская J* 2 Гарнитура литературная
Печать высокая. Усл.печ.л. 12.74 Усл.кр.-отт. 12,93
Уч.-изд.л.[12.99 Тираж 6500 зкз. Заказ 6899 Цеиаббк.
Энергоатомиздат. 113114 Москва, М-114, Шлюзовая наб., 10.
Ордена Октябрьской Революции и ордена Трудового Красного Знамени
МПО «Первая образцовая типография» Государственного комитета
СССР по печати. 113054, Москва, Валовая, 28.