/
Author: Григоренко Н.Л.
Tags: вычислительная математика численный анализ математика системный анализ учебное пособие теория управления математические методы
ISBN: 5-211-00954-1
Year: 1990
Text
вмк
Н.Л. ГРИГОРЕНКО
Математические
методы
управления
несколькими
динамическими
процессами
ИЗДАТЕЛЬСТВО
МОСКОВСКОГО
УНИВЕРСИТЕТА
Н. Л. ГРИГОРЕНКО
МАТЕМАТИЧЕСКИЕ
МЕТОДЫ
УПРАВЛЕНИЯ НЕСКОЛЬКИМИ
ДИНАМИЧЕСКИМИ
ПРОЦЕССАМИ
Допущено Государственным комитетом
СССР по народному образованию в ка-
честве учебного пособия для студентов
вузов, обучающихся по специальности
«Прикладная математика»
ИЗДАТЕЛЬСТВО
МОСКОВСКОГО УНИВЕРСИТЕТА
1990
ББК 22.18
Г 83
УДК 519.6
Рецензенты-.
кафедра высшей математики Л|ФТИ,
член-корреспондент АН СССР Л. Б. Куржанский
Григоренко Н. Л.
83 Математические методы управления несколькими динами-,
ческими процессами. — М.: Изд-во Моск, ун-та, 1990. —
197 с.: ил.
ISBN 5—211—00954—1.
В учебном пособии рассматриваются задачи управления несколькими
динамическими системами, которые описываются дифференциальными
уравнениями. Особенность подобных задач — в неполноте информации о
помехах, действующих на управляемые объекты. Приводятся методы по-
строения алгоритмов управления и их реализации на ЭВМ. Разбирается
большое количество модельных примеров. Изложен нетрадиционный ма-
тематический аппарат, используемый при исследовании задач управления
в условиях неопределенности.
Для студентов вузов по специальности «прикладная математика».
1402060000(4309000000)—129
077(02)—90
ББК 22.18
ISBN 5—211—00954—1
© Григоренко Н. Л., 1990
ОГЛАВЛЕНИЕ
Список основных обозначений................................................... 4
Предисловие .................................................................... 5
Введение ....................................................................... 7
Глава 1. Дифференциальные игры двух игроков............................16
§ 1. Дифференциальная игра преследования — уклонения двух иг-
роков ............................................................16
§ 2. Первый прямой метод преследования Л. С. Понтрягина . . 20
§ 3. Метод убегания Л. С. Понтрягина и Е. Ф. Мищенко ... 31
Глава 2. Игровые задачи управления несколькими объектами. Постанов-
ка задач...............................................................42
Глава 3. Решения игровых задач, обладающих простым движением 53
§ 1. Решение игры простого преследования — убегания. Теорема
Б. Н. Пшеничного..................................................53
§ 2. Простое преследование — убегание, на компакте. Метод пре-
следования Р. П. Иванова .........................................67
§ 3. Задача уклонения от многих преследователей. Метод уклоне-
ния Ф. Л. Черноусько .............................................73
§ 4. Задача простого преследования тремя преследователями двух
убегающих . . ...................................90
Глава 4. Метод гарантированного неухудшения позиции для дифферен-
циальных игр преследования несколькими объектами и его обоб-
щения . . ...................................95
§ 1. Метод гарантированного неухудшения позиции............................95
§ 2. Групповое преследование при r-кратной поимке убегающего . 110
§ 3. Групповое преследование при задержке поступления информа-
ции об убегающем ................................................113
§ 4. Возможности использования метода гарантированного неухуд-
шения позиции в нелинейных дифференциальных играх пресле-
дования несколькими объектами ...................................118
§ 5. «Тонкий» случай в задаче группового преследования . . . 126 ~
Глава 5. Методы группового преследования разнотипными объектами . 133
§ 1. Метод покрытия.............................................133
§ 2. Метод загонщиков...........................................137
§ 3. Метод прочесывания . . ............................141
§ 4. Метод блокирования убегающего . . . .' . . . 149
§ 5. Преследование несколькими разнотипными объектами . . . 157
Глава 6. Игровые задачи управления с переменной структурой . . . 163
§ 1. Групповое преследование в дифференциальных играх с перемен-
ной структурой, управляемой убегающим ...........................163
§ 2. Групповое преследование в дифференциальных играх с перемен-
ной структурой, управляемой преследователями .... 170
Глава 7. Групповое преследование двух убегающих................................182
§ 1. Достаточные условия поимки группой преследователей двух убе-
гающих . . . . ............................182
Приложение.....................................................................189
Комментарии . ............................................192
Литература . ................................................194
3
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИЙ
Rn............
М- . . . •
п
(х. y)=YiXiyi •
г=1
||х—а||<р) . .
0 ... .
[а, Ь] . . .
лив ИЛВ) .
Int А . . .
дА ... .
с (4, ф).
со {Л, В, С} .
Л+В . . .
л±в. . .
Е=Еп . . .
Сп
.евклидово /г-мерное пространство;
.евклидова норма х в Rn;
.скалярное произведение векторов х и у в /?п;
.замкнутый шар радиуса р с центром в точке
а в Rn-,
. пустое множество;
.интервал с концами а и &;
.объединение (пересечение) множеств Л и В;
.внутренность множества Л;
.граница множества Л;
.опорная функция множества Л;
.выпуклая оболочка системы множеств А, В,
С;
.алгебраическая сумма множеств А и В, Д-Ь
+ В=С={с|с—а+ Ь, а^А, Ь^В}-,
.геометрическая разность множеств Л и В,
Д^в=С={с|с+ВеЛ};
. единичная матрица порядка п;
.число сочетаний из т чисел по п чисел.
Предисловие
Настоящее учебное пособие возникло на материале курса лекций, читавше-
гося автором в течение ряда лет на факультете вычислительной математики и
кибернетики Московского государственного университета. Книга задумана как
пособие для студентов, специализирующихся в области прикладной математи-
ки. Цель пособия — ввести читателя в круг постановок задач управления не-
сколькими динамическими процессами в условиях неопределенности и ознако-
мить его с математическими методами решения таких задач.
Из всего многообразия задач управления несколькими динамическими про-
цессами в условиях неопределенности выбрана задача преследования группы
преследователей и одного или двух убегающих и отобраны несколько наиболее
содержательных и в то же время не слишком громоздких методов решения. На
этих примерах показаны самые существенные проблемы, возникающие в про-
цессе решения задач управления несколькими динамическими процессами в ус-
ловиях неопределенности, и результаты, которые можно получить на этом пути.
Автор стремился не слишком сложно и в меру строго сформулировать за-
дачу, установить существование ее решения, изучить его свойства и указать
осуществимый на деле способ формирования управления, гарантирующего тре-
буемый результат. Теория иллюстрируется модельными примерами. Они дово-
дятся до обозримой качественной картины и вычислительных процедур.
Книга состоит из семи глав. В первой главе приведены постановки задач
преследования и убегания для дифференциальных игр двух игроков, прямой
метод Л. С. Понтрягина решения задачи преследования и метод убегания
Л. С. Понтрягина и Е. Ф. Мищенко. Приведенные на их основе расчеты мо-
дельных примеров призваны создать четкое представление об условиях разре-
шимости соответствующих задач и возможных видах управлений, решающих
эти задачи. Вторая глава содержит ряд постановок задач преследования для
дифференциальных игр многих лиц. Третья глава содержит решение задач пре-
следования— убегания для дифференциальных игр с простой динамикой: игры
простого преследования — убегания, игры простого преследования на компакте,
задачи уклонения от многих преследователей, решение игры трех преследовате-
лей и двух убегающих. В четвертой, пятой и шестой главах приведены доста-
точные условия разрешимости задач преследования в дифференциальных играх
группы преследователей и одного или двух убегающих, методы группового
преследования разнотипными объектами и достаточные условия разрешимости
задачи преследования для дифференциальных игр с переменной структурой.
В седьмой главе приведены достаточные условия разрешимости задачи пресле-
дования для дифференциальной игры группы преследователей и двух убе-
гающих.
5
В пособии затрагивается один из разделов теории дифференциальных игр,
имеющий обширную библиографию. Список литературы, который приведен в
конце книги, содержит лишь те работы, которые были непосредственно исполь-
зованы в книге или близко примыкают к ней, дополняя ее содержание.
Нумерация формул (теорем, лемм, утверждений) в каждом параграфе са-
мостоятельная и состоит из двух чисел: номера параграфа и порядкового но-
мера формулы (теоремы, леммы, утверждения). При ссылке на формул} (тео-
рему, лемму, утверждение) из другой главы, впереди добавляется третье число:
номер главы, содержащей эту формулу (теорему, лемму, утверждение). Нуме-
рация рисунков состоит из трех чисел: номера главы, номера параграфа, но-
мера рисунка. В приложении приведены формулировки теорем, используемых
в пособии. Ссылки на них состоят из буквы П и цифры, порядкового номера
утверждения в приложении.
Автор выражает глубокую благодарность академикам Л. С. Понтрягину,
Е. Ф. Мищенко, А. Н. Тихонову, чл.-кор. АН СССР Р. В. Гамкрелидзе,
А. Б. Куржанскому за внимание и поддержку при написании книги. Д. В. Ано-
сову, В. И. Благодатских, Ф. П. Васильеву, В. А. Вязгнну, М. И. Гусеву,
А. А. Григоренко, Р. П. Иванову, Ю. С. Ледяеву, М. С. Никольскому, Л. А. Пет-
росяну, Е. С. Половинкину, Б. Н. Пшеничному, Н. Ю. Сатимову, А. И. Суббо-
тину, Н. Н. Субботиной, Ф. Л. Черноусько, А. А. Чикрий, Г. Ц. Чикрий,
Б. М. Щедрину за многочисленные полезные дискуссии и советы, способство-
вавшие улучшению содержания книги.
Н. Л. Григоренко
Введение
Настоящее пособие посвящено математической теории управ-
ления. Она строит абстрактные модели управляемых процессов,
исследует эти модели и способствует управлению на практике,
особенно с использованием ЭВМ.
Обычная схема управляемой системы такова. Имеются объек-
ты Ft,...,Fm, состояние которых в каждый момент времени t опи-
сывается фазовой переменной Xt, i-й объект подвер-
жен управляющему воздействию U{. Воздействие и{ вырабаты-
вается в органе управления Ui. На объекты действует помеха и
от внешней среды V. Сведения о состоянии системы доставляют-
ся в орган управления информационной переменной у. Матема-
тический характер переменных хг, uit у, yit i— l,.,.,m, определя-
ется природой системы.
Например, при управлении каскадом водохранилищ буква Х{
может означать объем воды в i-м водохранилище, щ — набор пе-
ременных, которые характеризуют пропуск воды из t-го водохра-
нилища, v — приток воды в водохранилище, у — показания при-
боров [68, 69].
Термин «управление» и данная схема носят весьма общий ха-
рактер. Почти всякий реальный процесс можно трактовать как
управляемый. Например, в медицине объектами могут стать
органы человека, буква х, обозначает набор объективных харак-
теристик состояния i-го органа. Воздействием щ может быть, на-
пример, доза лекарства. Помеху v составят прочие влияния на
организм, не все из которых подвластны врачу. В качестве ком-
понент вектора v могут выступать параметры объекта Fi, о кото-
рых известно, что они принадлежат некоторому множеству [70].
Информационную переменную у составят данные обследования
больного и т. д. При составлении и анализе долгосрочных планов
сельскохозяйственного производства объектами Fi могут стать
многолетние сельскохозяйственные культуры. Буква xt может
обозначать совокупность показателей: урожайность взрослых де-
ревьев и концентрацию удобрений в почве. Воздействием мо-
жет быть количество удобрений, вносимых в единицу времени на
единицу площади, моменты обновления посадок. Вектор помех у
составят погодные условия, коэффициенты потерь удобрений,
стоимость рубки старых деревьев и посадки новых на единице
площади [71, 72]. В вопросе об определении сроков замены не-
скольких видов производственного оборудования объектами
7
управления Fi могут быть объемы имеющегося оборудования.
Буквой Xi обозначается совокупность величин: физического изно-i
са оборудования, производственных затрат. Воздействием щ мо-
жет быть длительность планового периода, в течение которого
рассматривается функционирование той или иной экономической
цели. Помеху v составит влияние научно-технического процесса
на спрос производимой продукции [73].
В настоящей книге мы рассматриваем системы, эволюция ко-
торых описывается дифференциальными уравнениями. Предпола-
гается, что знания о внешней среде V являются неполными.
Вследствие недостатка информации о будущей помехе нельзя'
предсказать однозначно реакцию системы на управляющее воз-'
действие. Поэтому мы ставим задачу о таком способе управления,
который гарантирует желаемый результат даже при самом не-
благоприятном влиянии внешней среды. Эти задачи включаются
в круг дифференциальных игр.
Будем считать, что для каждой (t=l,... ,т) управляемой си-
стемы назначены свой показатель у; для качества i-ro процесса и
положительное число уг°. Пусть i-й процесс рассматривается, на-
чиная от момента t0. Тогда показателем качества будет некото-
рый функционал, вычисляемый на реализациях движения хг(т),
управления щ(т) и помехи п(т) на отрезке времени Тре-
буется управлять так, чтобы показатели уг- оказались в некото-
рые моменты 0г>/о равными значениям уД Цель управления
выбирается некоторым «центром» для всей совокупности управ-
ляемых систем. Ею может быть, например, достижение каждой
системой качества уг°. В ряде моделей внешнее воздействие v по
своему влиянию на изменения фазового вектора соизмеримо или
даже превосходит влияние управляющего параметра щ. То есть
встречаются модели, в которых для любого наперед заданного
i-ro процесса существуют значения помех, при которых для i-й си-
стемы значение функционала уг-° не может быть достигнуто ни
при каком допустимом управлении щ. Для таких процессов мо-
жет быть поставлена задача о достижении не менее чем г,
системами соответствующих значений показателей уг-°, 1=
— (Разумеется, задача приобретает четкий смысл лишь
при условии строгого определения понятия допустимого способа
управления. В данной книге это определение формализует прак-
тические способы регулирования на основе текущей информации
о реализующихся значениях v(t), x(t).)
Например, в случае задачи об управлении каскадом водохра-
нилищ t-м целевым функционалом может быть величина ежесу-
точно вырабатываемой электроэнергии или объем воды, отпус-
каемой в г-м водохранилище на нужды города, орошения, нор-
мального функционирования водохранилищ, расположенных ниже
по течению.
При исследовании математических моделей в медицине t-м це-
левым функционалом может быть концентрация некоторых ве-
ществ в t-м органе человека. При составлении планов досрочного
8
планирования t-м целевым функционалом может быть суммарная
дисконтированная прибыль от производства t-й культуры. При
определении сроков износа оборудования i-м функционалом мо-
жет быть стоимость продукции, которая может быть произведена
на данном оборудовании.
Теория дифференциальных игр возникла в результате матема-
тической идеализации технических задач [25, 7, 10]. Она исполь-
зует специальную терминологию для обозначения управляемых
параметров: управление преследователя (иногда игрока—союзни-
ка) и управление убегающего (иногда игрока—противника, ино-
гда вектор неопределенных параметров) для выделения двух
групп управляющих векторов. Первой группой векторов распоря-
жается лицо, управляющее динамической системой для достиже-
ния своей цели. Второй группой векторов оно распоряжаться не
может, и информация о будущем изменении этих векторов неиз-
вестна. Для того чтобы иметь конкретный пример, вообразим, что
группа самолетов преследует одинокий самолет. Цель группы са-
молетов— догнать одинокий самолет, цель одинокого самолета —
уйти от преследования. Каждый пилот управляет своим самоле-
том, имея в виду свою цель и пользуясь информацией о ситуа-
ции. Информация состоит из двух частей: первая — это полное
знание технических возможностей всех самолетов, вторая — это
сведения о поведении всех самолетов. Сведения о поведении са-
молетов могут включать в себя различные данные об их состоя-
нии за период, предшествующий данному моменту, но ничего
нельзя считать известным о будущем поведении самолетов, так
как они управляемы, и в любой момент времени летчик может
изменить положение рулей, изменив тем самым поведение само-
лета. В действительности, каждый из пилотов может получать
сведения о самолетах лишь с некоторым запаздыванием, однако
нет надобности включать это обстоятельство в идеализацию, бо-
лее того, можно даже предполагать известным поведение одино-
кого самолета с некоторым опережением и строить математиче-
скую идеализацию на этой основе, а затем уже показать, что по-
лученная теория может быть использована для приближенного
решения реальной задачи.
Перейдем к математическому описанию процесса преследова-
ния группой преследователей одного убегающего [7]. В этом про-
цессе участвует тч-1 управляемый объект: группа из m пресле-
дователей и один убегающий. Состояние каждого из объектов в
любой момент времени определяется его фазовым вектором. Фа-
зовый вектор i-ro преследователя обозначим хг-, а фазовый вектор
убегающего — у, уравнения объектов запишем в обычной форме:
Xi=fi(Xi, щ), y=g(y, v), (1)
где точка означает производную по времени, а щ и v суть управ-
ления. Так как х,- и у являются фазовыми векторами, то каждый
из них распадается на две части:
xi2), «/= (£/i, £/2),
9
где xilf у{ определяют геометрическое положение объектов, a xi2
и г/г — их скорости. Считается, что процесс преследования закан-
чивается в тот момент времени, когда наступает хотя бы при од-
ном i равенство
Хц—yi, (2)
т. е. тогда, когда объекты геометрически совпадают. Упомянутая
ранее первая часть информации состоит из уравнений (1). Эти
уравнения дают не сами движения объектов, а записывают лишь,
их возможности, так как при различных управлениях и
V=v(t) мы получаем различные движения. Таким образом, в при-
мере с самолетами уравнения (1) описывают технические воз-
можности самолетов.
Сам процесс преследования мы можем рассматривать с двух,
различных точек зрения.
1. Мы можем отождествлять себя с группой преследующих;
объектов. В этом случае наша цель заключается в завершении|
процесса преследования, и управление щ, 1=1,... ,т, находится в!
нашем распоряжении для достижения этой цели. Таким образом,!
в каждый момент времени мы должны конструировать значения?
z=l,...,т, управлений Ui, i=\,...,m, зная уравнение (1),1
т. е. первую часть информации, и используя вторую ее часть в ви-|
де знания функций хДз), i/(s), o(s) на отрезке t—где
Q — подходящим образом выбранное положительное число.
2. Мы можем отождествить себя с убегающим объектом.
В этом случае наша цель состоит в предотвращении конца пре-
следования, и управление v находится в нашем распоряжении для
достижения этой цели. Таким образом, в каждый момент време-
ни t мы должны конструировать значение v(t) управления о, зная
уравнение (1), т. е. первую часть информации, и используя вто-
рую ее часть в виде знания функций Xj(s), y(s), Ui(s) на отрезке
t—
Такова математическая идеализация процесса преследования,
принадлежащая Л. С. Понтрягину [1, 7], которую мы используем
в этой книге и которая неизбежно расщепляет задачу на две за-
дачи: задачу преследования и задачу убегания. Расщепление про-
исходит из-за того, что при двух различных подходах мы исполь-
зуем различные информации.
Дифференциальная игра из процесса преследования возникает
в результате естественного стремления упростить обозначения.
Введем новые фазовые векторы Zi=(xi, у), i=l,... ,т, образуя
пг фазовых пространств Rj игры как прямых произведений фазо-
вых пространств векторов хг-, у, и запишем т дифференциальных
уравнений:
Zt—FiiZi, v), i=l, ..., пг. (3)
Соотношения (2) определяют в векторных пространствах Ri
некоторые подмногообразия Mi. Теперь мы можем определить
дифференциальную игру независимо от исходного процесса пре-
10
следования. Дифференциальная игра группы преследователей и
одного убегающего задана, если заданы ее фазовые векторные
пространства Ri, уравнения (3), где z^^R^ a Fi— некоторые
функции трех переменных, причем и,—i-e управление преследова-
ния, v — управление убегания, и сверх того в пространствах Ri
заданы некоторые множества Mt> на которых игра оканчивается.
Как и в случае процесса преследования, мы связываем с диф-
ференциальной игрой две различные задачи.
1. Нашей целью является завершение игры, т. е. приведение
хотя бы одной точки ?i на соответствующее множество Mi, при
этом для осуществления этой цели в нашем распоряжении нахо-
дятся управления преследователей так что в каждый момент
времени t мы выбираем значения «ДО, ... ,т, используя
функции Zj(s), n(s), т, на отрезке t—Таковы
правила игры преследования группы преследователей и одного
убегающего.
2. Нашей целью является предотвращение конца игры, т. е.
предотвращение прихода точек Zi на множества при этом для
осуществления этой цели в нашем распоряжении находится управ-
ление v убегания, так что в каждый момент времени t мы выби-
раем значение v(t) этого управления, используя функции аДз) и
Иг($) на отрезке t—Таковы правила игры убегания одно-
го объекта от группы преследователей.
Заметим, что дифференциальную игру, соответствующую про-
цессу преследования группы преследователей и одного убегающе-
го, можно записать и в более общем виде, введя новый фазовый
вектор го=(Х1,... ,хт, у) пространства R, являющегося прямым
произведением фазовых пространств векторов Х],...,хт, у, новый
вектор управления н= (щ,..., ит) и записывая уравнение (1) в
виде одного уравнения:
ьу=Ф(и\ и, и). (4)
Соотношения (2) определяют в векторном пространстве R не-
которые подмногообразия Л12, i=l,...,m. Дифференциальная
игра с т терминальными множествами—задача управления при
наличии неопределенных параметров с т терминальными множе-
ствами— определяется аналогично. Однако учет специфики диф-
ференциальных уравнений вида (3) помогает при исследовании.
В настоящей книге мы формулируем теоремы о разрешимости
задач преследования и убегания вида (3). Соответствующие фор-
мулировки для игр вида (4) получаются непосредственно.
Исследованию различных классов дифференциальных игр по-
священы фундаментальные исследования советских ученых школ
Л. С. Понтрягина [1—7, 18, 34—36, 47—48], Н. Н. Красовского
[10—12, 16, 20—23, 39, 40], а также работы киевских [21, 22, 49—
51] и ленинградских [44, 19, 67, 45] математиков. Они послужили
основой для исследования задачи преследования несколькими иг-
роками одного убегающего [14, 15, 17, 21, 22, 31—33, 41, 52, 55,
57, 62, 63]. Оказалось, что в зависимости от состава группы пре-
11
следователей можно организовать процесс преследования так,
что группа преследователей может окончить игру преследования,
тогда как отдельные игроки либо отдельные подгруппы игроков
убегающего поймать не могут. В настоящем пособии мы излагаем
способы преследования, позволяющие эффективно распределить
усилия каждого преследователя в зависимости от его динамиче-
ских возможностей для успешного завершения игры, основанные
на идее первого прямого метода Л. С. Понтрягина [2]. |
Приведенные в. книге достаточные условия разрешимости за|
дачи преследования иллюстрируются на примерах специального!
вида. Для удобства их классификации мы приведем для таких
управляемых объектов понятие инерционности. В евклидовом
пространстве размерности v>l рассмотрим движения двух то-
чек (игроков) х и у, которые задаются уравнениями
+ • • • A-aP-\x-]-avx=u,
(5)
«/(9) + М^-1)+ • • • A-bq-iy + bqy^V.
Здесь и у^ суть производные порядка i по времени t от век-
торов х и у, /=1,...,р, суть линейные отображе-
ния пространства в себя, а и и v— управляющие векторы, при-
надлежащие пространству и удовлетворяющие условиям
<р, IlflKo.
Если p=q, то будем говорить, что инерционность игроков х и
у равна; если p>q, то инерционность игрока х больше инерцион-
ности игрока у\ если p<q — инерционность игрока х меньше
инерционности игрока у. В случае p=q будем говорить, что игрок
х имеет большие, равные или меньшие динамические возможно-
сти по сравнению с игроком у, если р>о, р = о, р<о соответ-
ственно.
Изложение методов решения задач группового преследова-
ния— убегания мы начинаем в гл. 3 для объектов, обладающих
Простыми движениями. В § 1 приведены необходимые и достаточ-
ные условия разрешимости задачи преследования и убегания в
случае равных динамических возможностей объектов при отсут-
ствии фазовых ограничений (теорема Б. Н. Пшеничного [22]), в
§2 — в случае наличия фазовых ограничений (теорема Р. П. Ива'
нова [15]). В § 3 показана разрешимость задачи убегания в том
случае, если убегающий имеет большие динамические возможно-
сти по сравнению с преследователями (теорема Ф. Л. Черноусько
[24]). В § 4 исследуется дифференциальная игра трех преследо-
вателей и двух убегающих, обладающих простыми движениями и
одинаковыми максимальными скоростями. Описаны множества
начальных позиций, из которых убегают оба убегающих; пресле-
дователи на свой выбор ловят любого из убегающих, а другой
убегающий при этом убегает; один из двух убегающих убегает
(независимо от воли преследователей), а второго преследователи
ловят. Приведены стратегии игроков, решающие соответствующие
задачи.
12
В гл. 4 приведены достаточные условия на параметры управ-
ляемой системы, при которых динамика преследователей позво-
ляет, используя текущую информацию, так строить преследова-
ние, что позиция каждого из преследователей относительно убе-
гающего в определенном смысле не ухудшается, и хотя бы для
одного преследователя строго улучшается. Такие способы пресле-
дования мы называем способами гарантированного неухудшения
позиции. Они эффективны в тех случаях, когда динамические
возможности преследователей в определенном смысле близки к
динамическим возможностям убегающего. Для тех случаев, ко-
гда среди преследователей есть игроки, динамические возможно-
сти которых отличаются от динамических возможностей убегаю-
щего, возникает необходимость в методах преследования, более
полно учитывающих специфику динамических возможностей от-
дельных преследователей. Изложению таких методов посвящена
гл. 5. В гл. 5 для различных вариантов состава группы преследо-
вателей предложены достаточные условия разрешимости задачи
преследования, процедуры нахождения начальных позиций, для
которых разрешима задача преследования, методы построения
стратегий преследования, процедуры вычисления гарантированно-
го времени преследования. Исследование задачи группового пре-
следования для объектов, динамика которых описывается урав-
нением (5) с помощью метода покрытия гл. 5, § 1 показывает,
что предлагаемый способ преследования позволяет исследовать
примеры дифференциальных игр, в которых инерционность пре-
следователей больше инерционности убегающего, и предписывает
преследователям выходить в такие позиции, относительно кото-
рых терминальные множества покрывают область неопределенно-
сти убегающего, образующуюся в процессе игры.
В § 2 приведен метод загонщиков для решения задачи пресле-
дования группой преследователей одного убегающего, получены
достаточные условия разрешимости задачи группового преследо-
вания по предлагаемому методу. Исследование примеров показы-
вает, что предлагаемый метод преследования позволяет решать
дифференциальные игры, в которых среди преследователей есть
игроки как с более высокой инерционностью, чем инерционность
убегающего, так и игроки с такой же инерционностью, как инер-
ционность убегающего, и может быть интерпретирован следую-
щим образом. Такой способ преследования отводит роль загон-
щиков преследователям, имеющим либо более высокую инерцион-
ность, либо большие динамические возможности по сравнению с
убегающим, другими словами, убегающий, уклоняясь от встречи
с преследователями, имеющими превосходство, вынужден сбли-
жаться с остальными преследователями.
В § 3 предложен метод прочесывания для решения задачи
преследования группой преследователей одного убегающего, по-
лучены достаточные условия разрешимости задачи группового
преследования по предлагаемому методу. Такие условия эффек-
тивны, например, для примеров, в которых среди преследователей
13
есть как игроки с такой же инерционностью как у убегающего,
так и игроки с инерционностью, отличающейся от инерционности
убегающего. Согласно методу прочесывания преследователи в
процессе преследования разделяются на две группы, первая из
которых удерживает убегающего в некоторой области (если убе-
гающий выходит из этой области, он будет пойман), а вторая осу-
ществляет прочесывание этой области, гарантирующее поимку
убегающего в случае его нахождения в этой области.
В § 4 задача преследования группой преследователей одного
убегающего рассматривается для процесса преследования. Полу-
чены достаточные условия разрешимости задачи об окончании
процесса преследования и способ взаимодействия преследовате-
лей, предполагающий разделение преследователей на две груп-
пы, взаимодействующих таким образом, что убегающий, уклоня-
ясь от встречи с преследователями первой группы, вынужден пе-
ресекать некоторое множество в фазовом пространстве, на кото-
ром его в таком случае поймают игроки второй группы. Такие ус-
ловия позволяют исследовать примеры дифференциальных игр, в
которых среди преследователей есть как игроки с равными дина-
мическими возможностями по сравнению с убегающим, так и иг-
роки с инерционностью или динамическими возможностями, отли-
чающимися от инерционности или динамических возможностей
убегающего.
В § 5 изложен способ преследования несколькими разнотипны-
ми объектами для решения задачи преследования в дифференци-
альной игре группы преследователей и одного убегающего, полу-
чены достаточные условия разрешимости задачи группового пре-
следования по предлагаемому способу. При исследовании приме-
ров такие условия эффективны при наличии среди преследовате-
лей трех подгрупп игроков: у первой группы динамические воз-
можности совпадают с динамическими возможностями убегающе-
го, у игроков второй группы они больше, у игроков третьей груп-
пы они меньше. Предлагаемый способ взаимодействия преследо-
вателей в процессе преследования может быть охарактеризован
следующим образом. Среди преследователей выделяются три под-
группы игроков, первая из которых сковывает действия убегаю-
щего, заставляя его находиться в некоторой области (иначе, он
будет пойман), игроки второй подгруппы играют роль загонщи-
ков, т. е., уклоняясь от встречи с ними, убегающий вынужден
сближаться с игроками первой и третьей подгрупп, а игроки
третьей подгруппы ведут поиск убегающего в определенной об-
ласти.
Глава 6 состоит из двух параграфов. В ней излагаются мето-
ды группового преследования в дифференциальных играх группы
преследователей и одного убегающего с переменной структурой.
В § 1 исследуется дифференциальная игра группы преследова-
телей и одного убегающего, в которой в управление убегающего
входит момент переключения с одной управляемой системы на
другую, при этом порядок переключения фиксирован. Получены
14
достаточные условия разрешимости задачи преследования в диф-
ференциальной игре с переменной структурой, управляемой убе-
гающим.
В § 2 рассматриваются дифференциальные игры группы пре-
следователей и одного убегающего в том случае, когда в распо-
ряжении каждого из преследователей находится выбор одной из
двух систем, описывающих динамику игры, и момента переклю-
чения с одной системы на другую, при этом переключаться раз-
решается не более одного раза.
Получены достаточные условия разрешимости задачи пресле-
дования в дифференциальной игре с переменной структурой,
управляемой преследователями.
В гл. 7 исследуются дифференциальные игры группы пресле-
дователей и двух убегающих. Приведены достаточные условия
разрешимости задачи поимки обоих убегающих за конечное вре-
мя. Предлагаемый способ преследования предполагает выделение
двух групп преследователей, первая из которых может поймать
одного убегающего за конечное время, а вторая, если она сама
второго убегающего не ловит, может обеспечить такие позиции
игры в момент поимки первой группой первого убегающего, что
вместе они ловят второго убегающего.
Глава 1
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ ДВУХ ИГРОКОВ
§ 1. Дифференциальная игра преследования — уклонения
двух игроков
В теории дифференциальных игр преследования и убегания
рассматривается движение конфликтно управляемого объекта z,
описываемое в «-мерном евклидовом пространстве Rn следующим
уравнением:
z=F(z, t, и, у), (1.1)
где z^Rn, u^PczRp, v^QaRi; Р, Q — компакты из евклидовых
пространств Rp, R4. Вектор и находится в распоряжении игрока,
которого мы будем называть догоняющим. Вектор v находится в
распоряжении другого игрока, которого мы будем называть убе-
гающим. Движение начинается при t=t0 из начального состояния
(zq, t0) и протекает под воздействием измеримых по Лебегу функ-
ций u(t)^P, v(t)^Q, Относительно векторной функции F(z, t, uf
v) будем предполагать, что она определена и непрерывна на
RnXR'XPxQ', на каждом компакте RczRnxR1 и всевозможных
ueP, ueQ удовлетворяет условию Липшица ЦК (s', t, и, v) —
—F(z", t, и, v) ||^Дк1|У-~У/11, где — константа, зависящая от К;
и удовлетворяет следующему неравенству: ||F(z, t, и, п)11^
(t) (1 + ||z||), где Ci(Z)—непрерывная функция. Эти условия
обеспечивают существование, единственность и продолжимость
при всех решения задачи Коши: z=F (z, t, u(t), v(t)), z(t0) =
=z0 в классе абсолютно непрерывных функций при произвольных
измеримых u(t)^P, v(t)^Q.
В Rn выделено некоторое непустое замкнутое множество М„
которое называется терминальным. Цель догоняющего — добить-
ся по возможности быстрее выполнения включения z(t-,)^M при
некотором В момент первого попадания точки z(t) на М
преследование считается законченным. Убегающий стремится от-
далить момент попадания z(t) на М или, если это возможно,
обеспечить при всех условие z(t)^M. Таким образом, цели
игроков не совпадают, и точка z(t) находится под воздействием
противоборствующих управлений u(t), v(t).
Физической моделью для дифференциальных игр преследова-
ния и убегания является задача преследования одним объектом х
(догоняющим) другого объекта у (убегающего). Пусть динами-
ческие возможности объекта х описываются уравнением
x=f(t, х, й), (1.2)
16
где xeRk, u^P<=Rp, а динамические возможности объекта у опи-
сываются уравнением
У=ё(У, t, v), (1.3)
где y^R1, v^Qt^Ri. В Rn=RkXRl выделено замкнутое множест-
во М. Преследование считается законченным, когда вектор
впервые попадет на М. Полагая z= уравнения (1.2), (1.3)
можно записать в виде (1.1). Отметим, однако, что дифференци-
альная игра (1.1) (если не сделано специальных предположений
относительно F(z, t, и, и)) имеет более общий характер, нежели
игра (1.2), (1.3), так как в последние уравнения и, v входят раз-
деленным образом, что нередко существенно упрощает исследова-
ния.
Другой физической моделью для дифференциальных игр пре-
следования и убегания является задача управления объектом при
наличии помех, возмущений, которые невозможно вычислить до
начала процесса и влияние которых сказывается в ходе управле-
ния. В роли противодействующего фактора целям управления иг-
рока здесь выступает природа. Простым примером, поясняющим
сказанное, является следующий. Рассмотрим управляемый объект
вида z=f(z, П+Л(п)п, где u^PczRp, Л (у)—непрерывная по
rsQcJ?9 матрица. Здесь и — вектор, находящийся в распоряже-
нии управляющего системой, у —вектор, моделирующий помехи,
возмущения, независящий от управляющего системой. Таким об-
разом можно учесть, например, явления типа люфта.
Следуя Л. С. Понтрягину [1—3], мы будем отдельно рассмат-
ривать дифференциальную игру (1.1) с точки зрения догоняюще-
го и с точки зрения убегающего.
При первом подходе предполагается, что догоняющий знает;
1) динамический возможности конфликтно управляемого объекта
z, т. е. знает функцию F(z, t, и, v) множества Р, Q; 2) начальное
состояние игры (z0, ?о); 3) Vt(-) функцию y(s) при где
t — текущий момент игры. Определим стратегию догоняющего
u(t) = U(z0, t0, щ(-)) как отображение, определенное на множест-
ве произвольных измеримых функций v(t)^Q, t>to, и обладаю-
щее следующим свойством: для произвольной измеримой п(/)^
gQ, t>t0, функция u(f)=U(z0, t0, измерима no t и u(t)^
ееР.
Важными для приложений являются следующие задачи.
Задача А. Найти начальные состояния (z0, /0), для которых до-
гоняющий обладает такой стратегией, что она обеспечивает окон-
чание преследования для произвольной измеримой v(t)^Q не
позже некоторого конечного момента.
Такие состояния (z0, С) далее мы называем решениями зада-
чи А.
Если данная начальная точка (z0, 4>) принадлежит множеству
3l={(z, Q)cz/?n+1, состоящему из решений задачи А с гарантий-
17
ной оценкой Л^т(г0, t0), то будем говорить, что из этой началь-
ной точки догоняющий может завершить преследование,за время
t(z0, /0)—^о, а время т(г0, to)-~to будем называть гарантирован-
ным временем преследования.
Замечание 1. Для построения преследующего управления
мы разрешили использование функции оД-). В приложениях убе-
гающий вряд ли будет сообщать свое управление цД-), так как
это снижает его возможности для уклонения. С точки зрения фи-
зической сути задачи преследования предположение о знании
оД-) является нежелательным. Тем не менее введение такого
предположения может быть оправдано в общем случае тем, что ре-
зультаты, полученные при таком предположении, можно, как пра-
вило, использовать для позиционного способа управления с ис-
пользованием процедуры управления с поводырем Н. Н. Красов-
ского и А. И. Субботина [11], т. е. при замене предположения о
знании функции vt(-) на предположение о знании лишь текущей
позиции игры t).
При втором подходе предполагается, что убегающий знает:
1) динамические возможности объекта z, т. е. знает функцию
F (z, t, и, и), множества Р, Q; 2) начальное состояние игры (z0,
/о); 3) ut(-)—функцию u(s) при где t — текущий мо-
мент игры.
Определим стратегию убегающего = to, как
отображение, определенное на множестве произвольных измери-
мых функций и обладающее следующим свойством; для
произвольной измеримой u(t), функция y(0=K(zo, tQ,
измерима no t и y(/)eQ.
Важной для приложений является следующая
Задача Б. Найти начальные состояния (z0, t0), для которых
убегающий обладает такой стратегией, что она обеспечивает бес-
конечную продолжительность игры, т. е. при всех
при произвольной измеримой u(t)^P.
Такие состояния (z0, Д) далее мы называем решением зада-
чи Б.
Если (z0, £0) принадлежит множеству 55 ={(z, t)со-
стоящему из решений задачи Б, то будем говорить, что из этой
начальной точки убегающий может обеспечить убегание.
Замечание 2. Для построения убегающего управления ис-
пользуется знание функции пД-). Далее можно легко перефор-
мулировать замечание 1 применительно ко второму подходу к иг-
ре (1-1).
Определим глобальную стратегию убегающего y(/) = V(z0, t0,
как оператор, определенный для всех (z0, to), где zoeAf, и
произвольных измеримых u(t)^P, причем такой, что при любых
фиксированных (z0, t0), z0<=M, n(O=V(zo, t0, ut(-)) является
стратегией убегающего.
Задача В. Для игры (1.1) с терминальным множеством М най-
ти такую глобальную стратегию убегающего, что с ее помощью
18
убегающий может обеспечить убегание из всех начальных состоя-
ний (z0, to),
Если глобальная стратегия убегающего V(z0, t0, и((-)) являет-
ся решением задачи В, то будем ее называть глобальной страте-
гией убегания.
Задачи А, Б, В иногда называют задачами качества.
Для теории дифференциальных игр и ее приложений большое
значение имеет исследование отдельных конкретных задач. В тео-
рии дифференциальных игр преследования и убегания хорошо из-
вестным является, например, контрольный пример Л. С. Понтря-
гина [1]
х + ах=ри, у + Ру = сгу, (1.4}
где х, у, н, v<=Rv, v>l, а, (3, р, ае4, |М<1, IMCL Р, о>0.
Фазовым пространством этой игры является R4v, в котором z
определяется соотношением z=(x, х, у, у). Уравнения (1.4) опи-
сывают движения двух инерционных точек с учетом сил трения,
Точка х — догоняющая, а точка у — убегающая.
Более общей задачей является задача преследования объек-
том х:
4-aiX(p~1) + •.. + (1.5)
объекта у:
у(« + М(,?~1)+ • Л-Ьд-ху-^Ьяу=и, (1.6)
где р, q, ai, bj — постоянные числа i=l,..., р, /=1,..., q, v^Q,
ueP, P, Q — выпуклые компакты из Rv. Фазовым пространством
этой игры является в котором z определяется уравнением
г= (х, х, х,..., у, у,... ,y((i~1')). Игры вида (1.5), (1.6) были
введены в обиход теории дифференциальных игр Л. С. Понтря-
гиным.
Сформулированные нами задачи А—В не исчерпывают круг
основных задач теории дифференциальных игр преследования и
убегания. Возможны другие подходы к дифференциальным играм,
другие их формализации, другие предположения об информиро-
ванности игроков и другие постановки задач, вытекающие из них
[10, 11, 51, 25].
Среди уравнений (1.1) выделим квазилинейный случай:
z=A(t)z-\-f(t, и, у), z(t,)=z°, (1.7)
и линейный стационарный случай:
z—Az 4- Ви—Си, z(0)=z°. (1.8)-
Здесь в случае уравнения (1.7) /( t, и, у)—непрерывная вектор-
ная функция; A(t)—квадратные матрицы, непрерывно завися-
щие or t; в случае уравнения (1.8) А, В, С — постоянные матри-
цы, u<=PczRp, v^QczR^, pt Q — выпуклые компакты.
19?
Отметим, что в стационарных играх можно считать fo=O, по-
этому для таких игр в дальнейшем to не пишется в качестве аргу-
ментов соответствующих операторов.
Будем считать, что >
М=М' + М2, (1.9) ;
где М1—линейное подпространство пространства Rn, М2 — вы--
пуклый компакт, M2c=Ll, Ll®M{=^Rn-, л — оператор ортогональ-^
ного проектирования из Rn-*-U.
Перейдем к изложению методов решения задач А—В.
§ 2. Первый прямой метод преследования Л. С. Понтрягина
Рассмотрим задачу А для линейной дифференциальной игры
преследования (1.8),
Обозначим
Р(т)—лехА ВР,
Q(r)=nexACQ.
Пусть О(т)—квадратная матрица размерности 4=dimL1, непре-
рывным образом зависящая от т, т>0. При т>0, рас-
смотрим множества
^(t)=P(t)A-D(t)Q(t)= П (Р(т)—Е>(т)летЛСо), (2.1)
t
M3(f)=M2^\(D(x)—E)nexACQdT. (2.2)
о
Предположение 2.1. Для дифференциальной игры (1.8)
существует матрица £>(т), непрерывно зависящая от т, такая, что
множество да(т) непусто при О<т<0, множество M3(t) непусто
при O^/=sC0, где 0 — некоторое положительное число.
Это предположение является основным в первом прямом ме-
тоде Л. С. Понтрягина. Если оно не выполнено (т. е. не сущест-
вует матрицы D(t) и отрезка [0, 0], где 0>О, для которых w(t)
и Л13(£) непусты одновременно), то метод не работает. Непустота
множества w(t) при данном т>0 «физически» означает наличие
некоторого превосходства догоняющего над частью ресурса убе-
гающего (например, D (т) =d (г) Е, где d(r)—непрерывная функ-
ция, 0^</(т)^1, Е — единичная матрица). Непустота множества
M3(t) при данном «физически» означает массивность терми-
нального множества. Рассмотрим при данном zQ^Rn следующее
включение при /е [0, 0]:
t
n.eiAz0 е? M3(t) -I- (—to(T))dT. (2.3)
o‘J
20
Теорема 2.1. Пусть для дифференциальной игры (1.8) вы-
полнено предположение 2.1 и для данной точки z0^M, хотя бы
при одном T=T(z0)<=[0, 0], выполнено включение (2.3). Тогда
точка z0 принадлежит решению задачи А.
Доказательство. Отметим, что так как аоеЛ1, то Т>0.
В силу выполнения включения (2.3) в момент времени Т, опреде-
ления алгебраической суммы двух множеств и интеграла от мно-
гозначного отображения следует существование суммируемой
функции (й(т)е^(т), О^Ст^Т’,
т
леТАг0<=МЦТ)А-\(—®(т))4т. (2.4)
б
Из определения w(T—s') (см. (2.1)), где OcscT, и свойств гео-
метрической разности множеств следует, что
D(T—s)xeH-VACQ + 7d(T-~ s)<= ле^-^ВР, se[0,TJ. (2.5)
Положим значение вектора u = U(s, о), 0<s<7', v^Q, при фикси-
рованных s и v равным лексикографическому минимуму среди
векторов меР, удовлетворяющих равенству
пе^т-^А Bu=D(T—s)neH-^A Со (2.6)
Пользуясь теоремой Филиппова (см. П. 7), можно утверждать,
что функция u(s) =U(s, v (s)) измерима на [О, Т], если d(s)gQ
измерима на [О, Л - При произвольной измеримой на
[О, Т] выполняется равенство
ле(г-змви(5)—D(T—s) ne(T~^ACv (s)=w(T—s). (2.7)
Применяя формулу Коши при w(s)=h(s) и произвольной измери-
мой v(s)eeQ и пользуясь равенствами (2.7), (2.4), (2.2), полу-
чаем
Т Т
лг(Г) = леТАг0 + j netT~s)ABU(s)ds—j D(T—s)ne(-T-~s')ACv(s)dsA~
0 о
т т.
+ (D(T—s)—Е)ne(T~s)ACv(s')ds=neTAz0ф- j со(7—$)с/зф-
0 0
T
+ J (D(T~s)~E)ne<T-vACv(s)ds ^M3(T) +
о
T
+ ^(D(T—s)—E)neH~^ACv(s)ds^M2. (2.8)
d'
Таким образом, при произвольной измеримой v (s) управление
u(s) = U(s, u(s)) гарантирует приход z(t) на М не позже момента
Т. Теорема доказана.
21
Приведенная теорема, в случае выполнения перечисленных ус-
ловий, отвечает на вопрос о разрешимости задачи преследования
из данной начальной позиции z0, содержит способ вычисления га-
рантированного времени преследования Т (z0) и способ построе-
ния управления V(s, y(s)). Перечислим этапы решения задачи А
на основании теоремы 2.1.
t
Этап 1. Найти множества w (т)=Р (т) — D (т) Q (т), J w (т) dr,
о
t t
J (D(r)—E)ne^CQdr, M3(t)=M2J (D(т)—E)nexACQdr.
о (Г
Этап 2. Найти T(z0)=T, для которого
ад
jtgHz,) AZo Д|3 (T _j_ J ( —w(T)) JT
0
Этап 3. Найти функцию а>(т)еш(т), такую, что
Г(г0) ~
л?0 4- J о (т) dr е М3 (Т (z0)).
о
Этап 4. Найти «(/) как решение уравнения
ле(т(г.)-/)л Ви(t)=D(Tne<T^-w Cv(t)(г0)—О,
при заданном допустимом v(t)^Q,
Замечание 2.1. а) Используя аппарат опорных функций,
можно показать, что число Т (г0) при z()<^M является корнем урав-
нения
t
р(0= inf [с(/И3(7), ф) + fc(—ф)с/т—(л£/лг0, ф)] = 0,
11<Й1=1L о
где с( 31, ф) —опорная функция множества 9lcz7?v,
с (91, ф)=зир (а, ф).
б) Важным элементом при построении стратегии йЦ) являет-
ся функция to (т). Приведем полезную для приложений интерпре-
тацию функции со(т), О^т^Т. Рассмотрим управляемый процесс
х=оэ, х(0)=0, где хе=Р\ с терминальным множеством
M3(t) —netAz0. Целью управления является наибыстрейшее вы-
ведение точки х на терминальное множество. Функция <о(т), яв-
ляющаяся решением этой экстремальной задачи, может быть взя-
та в качестве функции со (т) на этапе 3. Она может быть найдена
из принципа максимума Л. С. Понтрягина [9]. Для функции ы(т)г
22
О^лг^Т, существует такой вектор 1|ф0|| = 1, что почти всю-
ду на [О, Г]
(®(т), ф0) = max (со, ф0).
<oGu»(r)
Приведенный в доказательстве теоремы 2.1 способ преследо-
вания гарантирует приведение траектории игры на терминальное
множество точно в момент 7'(г0) и никак не наказывает убегаю-
щего за «ошибки». Приведем другой способ преследования, при-
надлежащий Л. С. Понтрягину [2], обладающий свойством
уменьшать время преследования при ошибочных действиях убе-
гающего. Отметим, что второй способ преследования гарантирует
приведение фазового вектора в малую окрестность терминально-
го множества и использует иную информацию об управлении убе-
гающего, чем управления преследования теоремы 2.1.
Рассмотрим игру преследования (1.8). Пусть выполнено пред-
положение 2.1 и для данной точки z0^M хотя бы при одном Те
е [0, 0] выполнено включение (2.3), е — положительная констан-
та, 8<Т. По условию задачи с течением времени преследователь
получает информацию об управлении убегающего v(t). Положим
v(t)=v(t—е), v (t)=vQ^Q, 0^f<8. Опишем способ выбора
управления u(t) на отрезке [0, е]. Согласно (2.1)
w(T~s)c ле^-^ВР—D(T~s)ne(r-s)^Cv(s). (2.9)
Отсюда
— [ w (Т—s) ds cz — $ r“s)A BP ds-\-^D(T—s) ne< A Cv (s) ds.
0 0 0
(2.10)
Прибавим к обеим частям выпуклое множество М3(Т) 4- W(T, s),
где
т Т-е
W(T, s)ds=W(T—е, 0)= J (~щ(Г—-8—т))б/т.
е 0
Получим
M*(T)-PW(T, 0)c=M3(T) + U7(T, е)—
— А BP ds + D (Г—s) г-5>л Cv (s) ds.
б о
Таким образом, в силу (2.3) имеет место включение
леТАг0 е M3(T) + W(Г, e) —j ne(T~dABPds+ §D(T—е) ne(r~*>ACv(s)ds.
о о
(2.Н)
23
Пусть Т\ — минимальное Т, для которого оно выполняется. В си-
лу определения алгебраической суммы множеств и интеграла от
многозначного отображения следует, что существует измеримое
управление u(s), такое, что
е е
лег>л20 + ле(7*—5)ЛВи (s) ds— J D (7\—e) ne<ri—5)л Cv (s) ds e
о о
еЛР(7\) + Г(7\, e). (2.12)
Преобразуем это включение:
ле<г1-е)л (еЕЛ20 + e^~s)ABu(s)ds—j* е{е~^А Cv (s) ds]—
о о
— J (D (7\—s)—£) пе^-^Си (s) ds—л^<г»-Е)л2 (e)—
о
— J (D (7\—s)—E) ле<rt-sM Cv(s)ds «= M3(7\) + W(7\—8, 0).
о
Следовательно,
(s) e= M3 (7\) + J (D (7\—s)—£) ne^~s>A Cv (s) ds +
о
?!
+ №(7\—e, 0)=M3(7\) + f (O(7\)—E)nexACv(Tl—x) dx
e
7\ Ti
4-№(7\ —8, 0)cz (m2JL §(D(x)—E)ne'ACQdx] + J (D(t)~ E) летЛх
0 Ti— e
Tt—s
xCQdx + W (7\—e, 0) cz (M2 Л_ (D (т)—E) ne'ACQ dx] +
6
+ Г(Л—8, 0)=M3(7\~8) + №(7\-8, 0). (2.13)
Таким образом, используя информацию об управлении v(t), дого-
няющий может построить свое управление так на [0, е], что вы-
полняется включение (2.13).
Для точки z(e) имеем Т (2(е))^Т—е, т. е. построенное управ-
ление преследования на отрезке [0, е] приводит фазовый вектор
в положение, для которого гарантированное время окончания иг-
ры уменьшилось по крайней мере на 8. Проведем подобные шаги
далее, вплоть до момента T(z0). Управление u(t), выбираемое со-
гласно (2.12), обозначим U(t, е). Траектория ?(/) уравнения
(1.8), соответствующая управлениям u(t)—U(t, g), v(t), за время,
24
не превосходящее T(z0), приходит на терминальное множество.
Оценим разность ||z(0—z(Z)||, где z(t)—траектория уравнения
(1.8), соответствующая управлениям u(t) =U(Z, g), v(t). Имеем
t t
z(0—z(/) = J esACv(t —s)ds— J esACv(t—s)ds~
6 z о
t t
= ^esACv(t—s)ds—^esACv(t—s—e)ds. ' (2,14)
6 о
Заменяя s+ензг во втором интеграле в (2.14), получаем
t
esACv(t—s—&)ds= e^~^ACv(t—x)dx=
0 F
t e /4-е
= ]е(т-еМСу(г—T)dx—Je<T-FHCo(Z—t)Jt+ J е(*-гИСо(/—т) dr.
о о t
Заменяя в (2.14) s на т в первом интеграле, получим
t
z(t)—z (t) = § (етЛ—e(T~E)л) Cv (t—т) dx 4-
о
e <+s
+ J e(^~E}ACv (t—x)dx— j e^~e>>ACv(t—x)dx.
0 i
Следовательно, ||z(Z)—z(t) ||^е/, где l зависит от отрезка [0, Z]
игры. Так как t^.T(z0), то константа I оценивается через T(z0) и
величины, зависящие от игры. Таким образом, выбирая в доста-
точно малым, мы можем добиться включения z(T) е /ИЦ-5^(0),
где SeZ(0)— шар радиусом в/ с центром в нуле размерности
v=dimL’; I — положительная константа, зависящая от z0 и игры,
но не зависящая от s.
Пусть а — положительная малая константа. Нами доказана
следующая теорема.
Теорема 2.2. Пусть для дифференциальной игры (1.8) с тер-
минальным множеством M + Sa(ty выполнено предположение 1
и для данной точки zoeM-S« (0), хотя бы при одном Те [О, 0],
выполнено включение (2.3). Тогда точка z0 принадлежит реше-
нию задачи А.
Замечание 2.2. Теоремы 2.1 и 2.2 дают решение задачи А
в разных подклассах стратегий преследования, определенных в
§ 1. Так, управление преследования u(t), являющееся решением
уравнения (2.7), использует информацию об управлении v(t)
только в момент времени t, тогда как управление u(t), являю-
щееся решением включения (2.12), использует информацию об
управлении v(t) на отрезке времени длиной е. Таким образом,
25
большая информация об управлении v(t) позволяет конструиро-
вать управление u(t), обладающее свойством уменьшать гаран-
тированное время преследования при «ошибочных» действиях убе-
гающего.
Перечислим основные этапы решения задачи А на основании
теоремы 2.2.
Этапы 1 и 2 остаются теми же, что и в теореме 2.1. Выберем
е из условия приведения траектории в данную окрестность терми-
нального множества. Обозначим Ti(u(-), k&) — момент времени
Т1, для которого справедливо включение (2.11), если zG=z(k&)f
k=l, 2,... На каждом из отрезков [бе, min{(6 + 1)е,
бе)}, 6=1, 2,.., принимая за г0 значение z(k&) проведем следую-
щие вычисления.
Этап 3. Находим —бе, для которого справедливо вклю-
чение (2.11).
Этап 4. Находим функцию В(т) еле<Т1-т)АВР такую, что
neT'Az() + J | (т) dx— (s) ds gz М3 (7\) 4- W (Tlf s).
о 6
Этап 5. Находим и(х) как решение уравнения
(т) (г).
Проведем исследование конкретных дифференциальных игр с
помощью теоремы 2.1.
1. Игра «мальчик и крокодил». Пусть уравнения дви-
жения преследователя и убегающего имеют вид
Здесь х, у, a, b<=Rv, v>2, а и Ь — управляющие векторы, Ца[|^р,
||б||^ст. Преследование считается завершенным, если в некоторый
момент времени t ||х(0—р, о, I — положительные кон-
станты.
Перейдем к соответствующей дифференциальной игре. Поло-
жим z^=x—у, г%=х, z=(z1( z2). В силу системы (2.15) имеем
?i=za—b, z2=a,
D г (ь\
Ви — , Cv— Л .
\ а / \ 0 /
Следовательно, Р= : [[а||^pj,
= fz=Pi'):||z1||=su].
( \ ^2 / J
(2.16)
||&1|<о , М=
26
[_Р.
Положим Р(т)=р(т)£, где ц(т)=’ а
Проводя вычисления этапа 1 для игры (2.16), получаем
f / z. \ „) /0, Е\ (Е, tE\
£==К 0 ) J’ Л==\0, 0/’ \0, Е )’
ае{АВР=5^(0), netACQ=Sa(0).
о
55 Р
о
Р ’
В этом случае
w(t) =
S^(O),
О ,
р
о .
Р ’
О
Р
W(t, 0)=
5/ Г а! \
Р
а
Р
t> —
Р
мз(о=!
14, «• > (°).
V—2^/
Условие непустоты множества Л43(0 при />0 выполняется,
где у(0=/ + -д^
I2
at.
если
при
2р
При этом условии у (/) возрастающая функция t и у (/) -> оо
t —*- оо.
Гарантированное время преследования T(zQ) равно наименьшему t,
при котором справедливо включение
neiAz0—21 е (0).
Таким образом, Т(г0)—минимальный положительный корень:
т2(0=1Ю2+2(4 2°)Ж14Н2^
Решение этого уравнения составляет этап 2. Результаты вычисле-
ний на этапах 3 и 4 имеют следующий вид:
~ 2° 4- 2°Т
если ||г»+гоТ||^О, то а(т)=- ?(т), ЭД()+
11 г1 + Z27 И
если ||zj4-z°T|j = 0,
то ы(т) = 0, u(t)=]x(T—t)v(t)/(T— t).
2. Игра «два крокодила». Пусть уравнения движения
преследователя и убегающего имеют вид
х=а, у=Ь. (2.17)
Здесь .г, у, a, b^R*, v>2, а и b — управляющие векторы,
ИИ^п. Преследование считается завершенным, если в некоторый
27
конечный момент времени t ||х(()—z/(/)||<Z; р, <т, I — положитель-
ные константы. Перейдем к соответствующей дифференциальной
игре. Положим zx=x—у, zs=x—у, z=(zlt z2). В силу системы
(2.17) имеем
Zi=z2. z2=a—b.
(2.18)
Следовательно, Bu=(®\, Cv=f£V BP=[f°\ : ||a|| C pL
(00/ \a/ \bj [\a] )
CQ=f W jw^BP=S*t(0), ne^CQ=S2T(0), neMz°=
=z°-Hz°, M = {z: Hzjll l}. Если p>o, то можно положить»
например, £)(т)=£. Проводя вычисления согласно этапу 1 для
игры (2.18), получаем
^('г) = 5?(т)(0), где |(т)=т(р—о)
(w(t)=^0 для т^О, если р>о);
W(t, 0)=Sb)(0), где П(/)=(Р-О)Д..
Гарантированное время преследования: T(z0)—корень уравне-
ния (/+ т| (г1))2^ || г® Л2-|-2^ (г®, z°)-|-Z2 ||z° ||2. Решение этого урав-
нения составляет этап 2. Результаты вычислений на этапах 3 и 4
имеют следующий вид: если ||z° + T(z°)z° || #= 0, то
г? + Т (г») z° z? + Т (г°) г°
(о(т)=----jr————(р—а)т, u(t)=v(t)-------й------й- (р—о);
Цг° + Т (г«) 411 w Hz?+Т (г*) 4
если 1| z° Т (z°)z® || = 0, то б)(т) = О, u(t)=v(t).
Пусть р^о. Положим, например, 2)(т)=ц0Р, где 0<ро<-^-, и
проведем вычисления этапов 1—4 в этом случае. Имеем
Ш(т)=£^-Мо0)т(0)1 W(t, 0)=s; i' (0),
ip—
/(H»-1)SS,(O)л=3’ (0).
Множество Л13(/)#=0, если /^}/2//((l — р0)о)=Г.
Согласно теореме 2.1 из позиции z° в данном случае разрешима
задача преследования, если найдется момент времени Г, удовле-
творяющий уравнению
[jzO-l-Tz3И—Z + (p—о)72/2, такой, что
28
Функция (о (т) е w (т) имеет вид
w(т)=(—? + Tz2) (р — ц0о) т)/|| г? + Tz211.
Управление u(t), решающее задачу преследования, таково:
«(0=Но^ (0—(2? + Tty (р—Роп)/П г? + Tz° ||.
3. Контрольный пример Л. С. Понтрягина [1].
Пусть уравнения преследователя и убегающего имеют вид
х + ах = а, // + £«/=&. (2.19)
Здесь х, у, a, b^Rv, v>2, а и b — управляющие векторы, ||а||^р,
ЦН^о, а, (3, р, о>0. Преследование считается завершенным, если
в некоторый конечный момент времени t имеем ||x(Z) — y(t) |(<Z,
I — неотрицательная константа.
Построим соответствующую дифференциальную игру.
Положим 2i=x—*/, z2=x, г3=г/, z~(zr, z2, z3).
В силу системы (2.19) имеем
2X = 22—Z3,
2а= —az2 + a,
23=— 023 + &,
(2.20)
Ви=(0, а 0), Си=(0, 0, —Ь).
Следовательно, M={z: ||2il|^Z},
ВР={(0, а, 0) : И1<р}, CQ=={(0, 0, -6) : ||Ы1<о}.
Проводя вычисления согласно этапу 1 для игры (2.20), получаем
/0 Е —Е\
L={(zr, 0, 0):21(-^}, Л = ( 0 —а£ 0 1
\0 0 — $е)
1 1 __ р~₽* \
Е -------Е--—-—Е\
а ₽ I
0 е-^Е 0 I
0 0 J
(Е—единичная, v—мерная матрица),
1 р—at J р—Р*
netA z°=г? Ч----z°---------- z°;
1 а 2 ₽
{1 р—а* 1
——а: IIаIIСр =^„(0), где
а J
29
Г 1 ‘ “ p; Q (t)=netACQ— \.l.-.i2Lb : ||ty| <я) =S^„ (0).
a I p J
1 - e"p/
где s(t)—--------a.
P
Если /=0, то множество M2 в данном примере состоит из нулево- ;
го вектора. Для непустоты множества M3(t) (см. (2.2)) нам оста-
ется выбрать D(x)=E. Таким образом,
w(t)=P(t)±-Q(t)=Slw(% Где ^(0=r(0-s(0;
W(t, 0)=S$m(0), где 7(/)=^(т)Л. )
о
Для положительности £(/) и y{t) при всех достаточно [1J, чтобы,
р о, однако одновременные превращения обоих этих нера-;
венств в точные равенства исключаются.
Для определения гарантированного времени преследования
7 (г9) мы найдем наименьший момент времени t;
ее (0),
т. e. T (z°) — наименьший положительный корень уравнения
у2 (/)=(лемг°, лемг°). .
Решение этого уравнения составляет этап 2. Результаты вычисле*-
яий на этапах 3 и 4 имеют следующий вид: ]
~ T(z«)A0 I
а) если II ле^^Аг0 II =# 0, то со(т)=-тгт—-(т)- J
' 11 ПлеГ(г )Az°]rv ’ |
а Г 1 __ р-₽(Г(г’)-0 _ 1 1
и(0=-,--е_<.%(г.)_-п- [ -~-р-----------ий-'-оИГ(2.21)
б) если || лег<г’)Аг°|| = 0, то со(т) = 0,
« 1 _ р-₽(Т(2«)-/)
“(0=у f(0- (2-22)
Пусть />0. Если условие £(/)>0 для 1^0 не выполнено, то поло-^
жим D(t) =jx(/)E, T](t) = r(t) — p(Z) s(t), где 0 p (/) <*
<max(-£—— 1 ~e 1). Тогда w (0); W(/,O)=Sx(o (0), где
о al — e p j
*(0 = ^n(T)dT; M3(/) = S^_E(O)(0), где £(0 = o J (ц (т)—1) —dr.
и 0
30
Условия теоремы 2.1 будут выполнены при данном I для t е [О, Т]
если найдется функция р(/), такая, что Y|(()^0 и /;>£(/), t ее [О, Т].
В этом случае этап 2 состоит в нахождении корня уравнения
леглг0 е 3(/—с(г>4-п(Т)> (°)-
Результаты вычислений на этапах 3 и 4 имеют следующий вид:
T(zO)A о
а) если ||лег<г‘)л20||=/=0, то ы(о) = — —т л «(0
|| ле ' ' 2° ]|
вид (2.21);
б) если || ле^^Аг01| = 0, то <о(т) = О, u(t) имеет вид (2.22).
имеет
§ 3. Метод убегания Л. С. Понтрягина и Е. Ф. Мищенко
1. Введение. Рассмотрим задачу В для линейной дифференци-
альной игры (1.8) с терминальным множеством (1.9) при усло-
вии, что множество М2 состоит из одной точки me/?. Af1—ли-
нейное подпространство в Rn, dimAP^n—2. Пусть W— двумер-
ное подпространство пространства L1, л — оператор ортогональ-
ного проектирования из Rn на W. Каждой точке z^Rn поставим
в соответствие два неотрицательных числа г—>-(£, т]), где £— рас-
стояние точки z до А41, т) — ее расстояние до L1.
Предположение 3.1. Существуют двумерное подпростран-
ство Wcz.L\ натуральное число k, такое, что:
а) каждое из множеств
lyVCQ, i=0, 2,
лА^ВР, (=0, 1,....,£—2, (3.1)
есть точка;
б) множество nAk~'CQ содержит более одной точки и справед-
ливо включение
лА^СЦ лАк~1ВР => S2a (b), (3.2)
где Sa2(b) —двумерный шар радиуса а>0 с центром в точке
еУ
Теорема 3.1. Если для игры (1.8) выполнено предположе-
ние 3.1, то при любом начальном значении z0, zQ^M, существуют
эффективно конструируемые глобальные стратегии убегания и,
кроме того, для расстояния точки z(t) до М имеет место ниже-
следующая оценка.
Найдутся положительные константы 0, е, с, I и натуральное k,
зависящие только от игры, а не от ее начального значения и не от
ее хода, что игру убегания можно вести таким образом, что:
1. при £0>е имеем £(/) >cefc/(l +т) (0 )ft, 0<^<оо; (3.3)
2. при g0<e имеем g (() >c£oh/(l +т] (0 )\ 0<^С©, (3.4)
?(0>eeV(l + n(0)\
31
либо таким образом, что:
1. при |о>е имеем £(/)>/, 0<7<оо;
2. при имеем (1 + л(0)к> О<7=С0, (3.5)
0^<оо.
2. Маневр обхода. В этом пункте приводятся конструкции
Л. С. Понтрягина [7], используемые далее для построения управ-
ления убегающего, гарантирующего, чтобы точка z(t) не попала
на М.
А) Сначала мы приведем без доказательства простую лемму о
конечномерном линейном семействе 2 вещественных аналитиче-
ских функций вещественной переменной t, которые определены
на интервале /: 0^fc£Cl. Семейство 2 является линейным, если
вместе с произвольными двумя функциями Л (О и f2(0 из 2 функ-
ция aifi (0 + a2f2(/) принадлежит 2, если си и а2 — вещественные
числа. Семейство 2 называется конечномерным, если существует
конечное число функций (/),..., fr(t) из 2, таких, что каждая
функция f(Z)<=2 может быть записана в виде f + ...
...+arfr(t). Справедливо утверждение. Для конечномерного ли-
нейного семейства 2 существует натуральное число т, такое, что
любая функция f(Z)e2, не равная тождественно нулю, имеет на
отрезке I не более т нулей с учетом их кратности.
Б) Пусть 2 — конечномерное линейное семейство функций,
рассматриваемых и аналитических на некотором отрезке 1, при-
надлежащем отрезку 0^7^ 1; W— двумерное векторное евклидо-
во пространство с фиксированной в нем ортогональной системой
координат; да=(ш1, ш2)е№; Г — квадрат, определяемый неравен-
ствами
| wl | 1=1, 2, а>0, (3.6)
k — целое число, Тогда существует такое положительное
число у, что для любого вектора ф (/) = (ф1 (t), ф2(£)), компоненты
которого принадлежат 2, найдется такой квадрат Г'сГ со сторо-
ной 2у, что точка v (t) задаваемая равенствами
* = 1, 2, (3-7)
при t s I, a=(aT, а2)еГ', (3.8)
удовлетворяет условию
(3.9)
Для доказательства расширим семейство 2, присоединив к не-
му функцию t\ до семейства 2', и пусть т — число, соответствую-
щее этому семейству. Пусть
р>2т+1 (3.10)
есть целое число. Разобьем квадрат Г равностоящими друг от
друга вертикальными и горизонтальными прямыми:
32
ы)г==а1., t = l, 2, /=0, 1, р,
(З.И)
°о = — а'Р=а’
на р2 малых квадратов со стороной 2а!р. В плоскости W рассмот-
рим кривую
£’=1. 2- (3.12)
Покажем, что кривая (3.12) не может проходить через все по-
строенные малые квадраты. В самом деле, при входе в любой из
этих малых квадратов кривая должна пересечь одну из его сто-
рон, т. е. либо одну из вертикальных прямых системы (3.11), ли-
бо одну из горизонтальных прямых системы (3.11). Таким обра-
зом, либо число пересечений с вертикальными прямыми не мень-
ше чем (р2—1)/2, либо число пересечений с горизонтальными
прямыми не меньше чем (р2—1)/2. Допустим для определенности,
что имеет место первое. Так как вертикальных прямых в системе
(3.11) имеется р+1, то хотя бы одну из них, например прямую
w1—^1, она должна пересечь не менее чем (р—1)/2 раз. Это
означает, что функция <р'(0—имеет не менее (р—1)/2>т
нулей (см. (3.10)). Так как эта функция принадлежит семейству
2', то она тождественно равна нулю, а это значит, что кривая
(3.12) вся лежит на вертикальной прямой wx=aA, и поэтому она
не может проходить через все малые квадраты. Обозначим через
Г" тот малый квадрат из Г', через который кривая (3.12) не про-
ходит, через у'— одну четверть стороны квадрата Г" и Г'—квад-
рат со стороной 2yz, центр которого совпадает с центром квадра-
та Г". Так как кривая (3.12) не проходит через квадрат Г", то
при выполнении условий (3.8) при каждом фиксированном t хотя
бы одно из чисел |ь+(?)—аг|, г=1, 2, больше или равно у. Из это-
го непосредственно вытекает
II v (/) || >yih.
Итак, предложение Б) доказано.
3. Управление убегания. Вернемся к задаче убегания. Пусть
u(t) и v(t)—некоторые допустимые управления на отрезке [0, 1]
и z(t)—решение уравнения (1.8), z(0)=20, соответствующее
этим управлениям. Согласно формуле Коши для решения уравне-
ния (1.8) имеем
i
m(t)=лема0 + J летА(Ви(1—т)—Cv(t—т))<Д. (3.13)
о
Если и и v произвольные векторы из множеств Р и Q соответ-
ственно, то согласно условию а) предположения 3.1 имеем
_2
С0=^ + 91т+ ... +
. . _л-1
+ «.4 1 (Bu—Cv) +h(u, v, т), (3.14)
2 H. Л. Григоренко
33
где qi^nAi (BP— CQ), i==0, —2, фиксированные векторы
W, причем справедлива оценка
\\h(u, v, (3.15)
I — положительная константа, зависящая от параметров игры и
не зависящая от векторов и и v. Учитывая (3.14), из (3.13) полу-
чаем
*-2 f+i z fe-i
»z(0=neMz(,+£’?, [яЛ‘-| (Ct,(s)_Bu(s))]<fc+
i=0 ’ 0
+ ti(u(-), v(-), t), (3.16)
t
где h(u(-)t v(-), f) = ^h(u(s), v(s), s')ds.
6
В силу (3.15) равномерно по w(-), v(-) на отрезке [0, 1]
||/г(и(-), о(-), f)i| НZ1Tft+1. (3.17)
Первые два члена в формуле (3.16) определяются игрой и на-
чальным положением z0. Рассмотрим третий член в соотношении
(3.16), на который может влиять убегающий. В силу условия б)
предположения 3.1 справедливо включение
nXfc"lCQ=>jT4fe~,BP + S^(0) + /). (3.18)
Таким образом, для вектора w^W, ||ьу||^а и произвольного век-
тора и^.Р найдется вектор v^Q, такой, что
nAk~xCv^nAk~}Bu-\ кН Ъ. (3.19)
Если векторов v, удовлетворяющих равенству (3.19) более одно-
го, то выбираем v как лексикографический минимум из всех век-
торов, удовлетворяющих (3.19). Согласно теореме Филиппова
(см. П 7) если u(t)—измеримая функция, u(t)^P, то такой
способ выбора значения o(Z)^Q в момент времени t обеспечи-
вает измеримую зависимость от t функции v (t). Итак, управле-
ние v(t) на отрезке {0, 1] удовлетворяет соотношению
stAk~lCv (t)=nAk~lBu (t)-^wA-b. (3.20)
При таком способе выбора управления убегающего в силу (3 16),
(3.20) для функции лг(0, te[0, 1], справедливо представление
fe—2
, . /2-1-1 fk ik —
nc(0=neM2o+J^ —-——b-—w- + h(u(-), v(-), t). (3.21)
i=0
Цель убегающего состоит теперь в том, чтобы так выбрать вектор
34
w^S^fO), чтобы для ^е[0, 0], О<0^1, выполнялось неравен-
ство
11лг(0!1>0. (3.22)
Для решения задачи о выборе вектора да^5а2(0) и константы 0,
которые обеспечивают соотношение (3.22), применим маневр об-
хода Понтрягина (см. п. 2).
Положим
k_2
Ч>(0= = лем20+ У qi --------Ь—, (3.23)
\Ф2(0/ Li (J + 1)! А!
i=0
|=—wjk\ ц=а/£!, и рассмотрим шар с центром в нуле подпрост-_
ранства W радиусом о. Впишем в него квадрат Г со стороной 0^2.
Согласно (3.21), (3.22) имеем
лг(0^(0+^ + М«(-)> ^(-). 0), (3.24)
где ||/i3(u(-), а(«), 0 сз— константа, не зависящая от и и
V, Применим к функции (3.24) лемму о маневре обхода. Семей-
ство S, которому принадлежит функция ф(/) (см. (3.23)), имеет
базис, состоящий из функций tt и функций pi (0> • • •»₽и(0>
через которые выражаются решения уравнения z=Az (см. [8]).
Определяя согласно утверждению А) п. 2 для семейства S кон-
станту т и проводя разбиение квадрата Г согласно утверждению
Б) п. 2, получаем, что в квадрате Г найдется квадрат Г' такой,
что если |+/i3(«(-), у(-), то для (3,24) справедлива
оценка
||л?(/) (3.25)
Пусть g — центр квадрата Г', 0^min{l, у/с3}. Тогда g + /i3(«(-),
а(-), /)^ГЛ для te[O, 0], и имеет место оценка (3.25). Далее
управление у(£), ti + 0], выбранное как решение уравнения
(3,20), где ?i>0, мы называем специальным управлением
убегания и обозначаем z(t[), «(•)), u(-)={«(0,
Л + 0]. Таким образом, применяя специальное управление убега-
ния v(t) на отрезке постоянной длины 0, убегающий обеспечи-
вает соотношение (3.25) для /е[0, 0]. Повторяя этот процесс на
каждом из отрезков [и0, (л+ 1)0], п>1, убегающий обеспечи-
вает соотношение ||jtz(t) ||>0 для £>0.
4. Процесс убегания. Здесь мы опишем два способа построе-
ния глобальной стратегии убегания и укажем оценку снизу для
расстояния от траектории игры до терминального множества в
процессе игры.
Первый способ выбора глобальной стратегии убегания состоит
в том, что специальное управление убегания включается только
тогда, когда фазовый вектор процесса находится достаточно
близко к М. Опишем его и приведем оценку снизу для расстояния
от z(t) до М в процессе игры.
2* 35
Утверждение 1. Каково бы ни было начальное значение
Zo игры, при применении специального управления убегания мы к
концу периода 0 приведем игру в положение z(0), удовлетворяю-
щее условию
|(0)>е=?0\ (3.26)
Это вытекает непосредственно из (3.25), так как ||nz(0) ||<£0).
Утверждение 2. Для рассматриваемой игры существует
такая положительная константа с, что каково бы ни было началь-
ное значение z0, причем применяя специальное управление
убегания, мы будем вести точку z{t) так, что на всем отрезке
^^0 для нее выполняется условие
t (0 > сЙ/(1 +Л(0)‘. 0 < t 57 0. (3.27)
Для доказательства заметим, что каковы бы ни были
управления u(t) и о(£), заданные на отрезке О^/^0, мы имеем
оценки
(l+n(0)/(l+no) >а, (3.28)
l|z(0—ZolKpU+noH, (3.29)
где а и р — положительные константы, зависящие только от игры
и числа .0 (считаем £о^1.) Действительно,
t
Il2(0—£|| l|20|| +Jci(0)^^c2Zi|zo||+<?1^<
о
<^(1^0| + Ш)+^Р(1+Ш
где с1=с1(0)—константа, зависящая от 0, _P==max(q, с2). I£ol< 1-
Далее, учитывая (3.29), имеем
1 + п (О = 1 + По — По + и (*) 1 — In (Q —По1 1 — II z (/) — 20 Н
1 + По 1 + По . 1 + По 1 + По
1 — ос1
Таким образом, если 1—р0>а, т. е. —-—1>0, то неравенство
(3.28) выполнено. (Заметим, что в качестве ц можно взять лю-
бое а: 0<а^1—00.) Перейдем к доказательству утверждения 2.
Из (3.29) следует, что при ^|о/(2р(1 + т]о)) мы имеем
(3.30)
Далее, если v(t)—специальное управление убегания, то при
-------^2---- из (3.25), (3.28) имеем
2₽(1+По)-----* ' '
? /л > > y^ak
“ (20)* (1 + Ho)fe (20)* (1 +п (0)* ’
Полагая c=min(l/2, ya*/(20)fe), получаем (3.27).
36
Утверждение 3. Игру убегания при произвольном началь-
ном значении можно вести так, что имеет место оценка
1(1) <се*/(Ц-т|(0)ь при 0<7<оо. (3.31)
Если начальное значение z0 удовлетворяет условию £о>8, то оцен-
ка (3.31) имеет место для всех значений £>0. Если начальное
значение z0 не удовлетворяет условию so>s, то имеет место
оценка $
|(0>с^/(1 +П(О)" приО^/<@. (3.32)
Доказательство утверждения 3 состоит из описания про-
цесса убегания. Если начальное значение z0 удовлетворяет усло-
вию то на отрезке времени мы применяем специ-
альное управление убегания и в силу утверждения 2 получаем
оценку (3.32) на отрезке Причем в конце отрезка имеет
место оценка (3.26). Таким образом, либо для точки z0, либо для
точки г(0) выполнено условие £о>«, £(0)>е. Начиная с этого
момента, т. е. с момента t = 0 или /=0, мы применяем следующий
способ управления: если для z(t), £(£)>g, то управление v(t)
берется произвольным образом до тех пор, пока не наступает мо-
мент времени t0, такой, что Ц/0)=е. Начиная с момента to, к
точке z((o) применяется специальное управление убегания. Таким
образом, утверждение 3 доказано.
Второй способ выбора глобальной стратегии будет состоять в
том, что специальное управление убегания будем включать на
каждом из отрезков [/г0, (п+ 1)0], я=0, 1, 2,... .
Положим рп=л0/2, п=0, 1, 2,... , и будем строить управление
с(/) на каждом из отрезков /п==[р,г, Pn+i), п—0, 1, 2,..., как спе-
циальное управление убегания:
fn={V*(Pn, zn, ип), un={u(t), te=In}, zn=z$n).
Выпишем оценку снизу для расстояния от z(t) до М при таком
выборе глобальной стратегии убегания.
1. В силу (3.25) для £e[pn, pn+i] имеем
II яг (ОН > II(/; pn> zn, и*п, 0*)||>у^.
2. Если п>1, то для te/n=[pn, pn+i)
лг(/)=лгп(/; 0П_Ь zn-i, iQ + ji(z(/; pn, zn, w*, t/)—
^Zn(t, Pn—1 > Zn— 1, Vn^),
ГДе Un°^={u (t) Pn— 1 tPn4-1}> (Pn— 1» Zn— 1» ^n0)> ^€=[Pn— 1»
Pn]}. Заметим, что так как р„=п0/2, то специальное управление
Убегания определено на P„-i t p„+i. Имеем
37
t
II z(f)-z„ (OH=|| z(M + J' (Az (s) + (s)-Cv'n(s))ds-zn (₽„)—
0/1
i t
- J[(A:n(s)+B«’(s)-Cv; (s))ds|k $ (fe||z(s)-z„(s)||+D)ds,
₽n 0/1
где zn(s)=z(t-, pn_i, z^-i, и* t>*), k и D—положительные константы.
В силу неравенства Гронуолла (см. П. 6);
ПгЮ-г» <01! < D [?»-«-. l]/fe£ h (*—₽„), t е
Следовательно, || яг (t)—rtzn (/)|| < ||z (f)—zn (ОН < h / е /д-
Учитывая это неравенство, имеем
II лг (Oil > II nza (ОН — II nz (t)—nzn (0Н> у (t—— h (/—₽„) >
^sp(/— prt), t^Tn~[Pn, ₽n+ij; h, y, p—положительные константы.
Таким образом,
||лг(0Н>тах{у(^—pu)\ p(t—pn)}, t ge In—[?n, prt+i].
Если r(s)—ysk, p(s)=r(@/2 — s)—D(ek’ — V)/k, p(s)=max{r(s), p(s)},
to min p(s)=/. Так как r(s)>-0) se[0, 0/2], p(O)=z (@/2)>0,
s£ [0,9/2]
to |i(s)>0, O^s^0/2, откуда в силу непрерывности p(s) следует
положительность I.
Таким образом, при таком способе построения глобальной
стратегии убегания для />0/2, £(0>0 для 0<С/^©/2, £(/)>
^oW+n
5. Примеры. Приведем на примере игры «мальчик и крокодил»
вычисления, необходимые для построения управления убегания
по методу Л. С. Понтрягина, Е. Ф. Мищенко. Закон движения
преследующего и убегающего объектов задается уравнениями
х = н, y=vt (3.33)
где х, у, и, v — векторы евклидова пространства 7?2, и и v —
управляющие параметры, ||н||^р, ||y||^o, х — геометрическое по-
ложение преследующего объекта («крокодила»), у — геометриче-
ское положение убегающего объекта («мальчика»). Преследова-
ние считается законченным, когда х—у. Полагая z=(zit 22)==,
= (у~х, —х), получим дифференциальную игру
Множество Р состоит из всех векторов вида (0, н), множество
Q — из всех векторов вида (и, 0), а множество окончания игры
38
M={2i=0). Непосредственно проверяется, что L—{z2=0}, матрица
1 /Е 0\
-t имеет вид ®\, где Е — двумерная единичная матрица,
,ха__(ЕЕх\ ^_1Е Ех\
’ — U E I ’ U О J *
Таким образом, согласно формуле Коши
nz (t)=
Е Et
О О
\ /z°i \ С ~(Е Ет\ / v(t—т) \ /'£ Ет\
/ U02/+J \ О О Л О J 1о О I
! ' о L 4 /ч ' 4 '
( °
\u(t—т)
dx.
Отбрасывая две последние нулевые строки вектора лг(0, полу-
чаем
t
[nz(/)]c=(z? + z20+ —т)—ти(/—x))dx.
б
(3.35)
В нашем случае лС(?=£о(0), лВР=0, таким образом, согласно
теории Л. С. Понтрягина, Е. Ф. Мищенко k—\ и управление убе-
гания имеет вид v(t)=—р0, где Р0=(Ро, Ро).
Подставляя v (t) =р0 в (3.35), получаем
[лг(/)]с = 2° + 2°/ —Р(/ + £1(0»
где
i
та (t—x)dx.
о
(3.36)
t
Из (3.36) получаем || £i (01! тР^т==р/2/2.
б
Укажем способ Л. С. Понтрягина и Е. Ф. Мищенко нахожде-
ния вектора (30.
По условию т. е. управление убегающего выбирается
в круге радиусом о с центром в начале координат. Впишем в
круг квадрат Г со сторонами, равными а/У2 и параллельными
осям координат. (Мы считаем, что в плоскости зафиксирована си-
стема координат.)
Согласно лемме о маневре обхода мы должны изучить пове-
дение параметрически заданной кривой
w(t) = <р (3.37)
где y(t) = z<[+z02t,
на квадрате Г. Если Zi°¥=0, то точка w(t) при />0 двигается по
прямой на плоскости. Семейство 2' в нашем примере имеет две
базисные функции а и Ы, где а и b — константы. Таким образом,
39
число нулей любой функции семейства Далее, полагая р—
=2т + 2=4, разбиваем квадрат Г на р2=16 маленьких квадратов
Г' прямыми, равноотстоящими друг от друга и параллельными
осям координат. Сторона квадрата Г' равна сг/(4у2). Опишем
теперь один из возможных методов нахождения центра квад-
рата Г', через который не проходит кривая w(f).
А. Пронумеруем квадраты Г'.
Б. Считаем расстояние р от центра первого квадрата по пря-
мой (3.37), 2i0#=0. ~
' В. Сравниваем р с половиной длины диагонали квадрата Г',
равной о/8. Если р<о/8, то переходим к следующему квадрату и
повторяем процедуры Б, В. Если рхт/8, то полагаем равным
центру этого квадрата.
Рассмотрим в квадрате Г' со стороной сг/(4у2) квадратик Г",
центр которого совпадает с центром квадрата Г', а сторона рав-
на а=о/(12У2).
Расстояние от квадратика Г" до границы квадрата Г' не
меньше а.
Положим v(t—т)=ро. Имеем nz(O=2:io + 22O£+£(Po-H2(O)> где
||^(/)1!<р-//2.
Выберем положительную константу 01 следующим образом:
в1^о/(р-оУ2).
Тогда ||^(0Н^а и 11М0!1>^===~^=~ при i [0, ©J.
Непосредственно проверяется, что константы 5, а, фигурирую-
щие в оценках ||г(/)—||20[[^5(1 + ц0)1! и (1 + ц(£))/(1 + цо)>а со-
ответственно, справедливых при могут быть выбраны в ви-
де Ь— 14-а+р/2, если te[0, 1], и а=1/2, если /se[0, 1/(25)].
Положим 0=min{0j, 1, 1/(25)} = min [—, --------------(, е =
* 1 " ( бУ2р 2(1 + о + р/2) /
=—£__.0
12 У2 °’
Тогда согласно лемме о маневре обхода £(6)>е.
Опишем процесс убегания. Если начальное значение г0 удов-
летворяет условию то на отрезке времени О<Л^0 приме-
няем управление убегания, при этом имеет место оценка £(/)>af.
В момент 0 ^(0)>е. Таким образом, либо точки zG, либо для
точки г(0) выполнено условие
£0>8, g(0)>8.
Начиная с этого момента, т. е. с момента £=0 или /=0, мы при-
меняем следующий способ управления: если для z(t) то
управление и(/) берется равным нулю до тех пор, пока не насту-
пает момент времени t0, такой, что £(/о)=е- Начиная с момента
/о, убегающий применяет управление убегания и т. д.
40
Оценка снизу для £(/) будет иметь вид:
а) при £0<е £(0><W+n(O), £(0>се/(1 Ч-П(0)>
оо;
б) при g0>8 g(O>c-e/(l + r](O), 0^/<оо, где
____________а_______
С~' 24 Д/2 (1 +а +р/2) ’
Замечание 3.1. Нетрудно видеть, что описанный способ
позволяет выделить несколько векторов [Зо, причем,- выбрав любой
из них в качестве значения управления убегающего, мы гаранти-
руем убегание.
Замечание 3.2. Приведенные рассуждения остаются в си-
ле, если квадрат Г разбить на 4 равных квадрата Г'. При этом
оценка для g (/) улучшается. j
Замечание 3.3. Для получения улучшенной оценки для
£(/) в процессе игры мы должны, уметь выбирать вектор р из не-
которого ограниченного множества, наиболее удаленным от кри-
вой w(t). В нашем примере эта задача решается следующим об-
разом. В качестве вектора ро, llpoll^a, выберем точку окружности
радиуса а с центром в нуле, наиболее удаленную от кривой
w(t)=q(t)/t, /е[0, 1]. (Для точки Ро нетрудно выписать анали-
тические соотношения.)
Обозначим р (г0) расстояние от р до w(t), [0, 1]. Очевидно,
р(г0)>а. В этом случае
© = min f а/p, --------k 8=а©/2, с =-----------.
I 2(l + a4-p/2)J 4(1+о + р,'2)
Найдем значения параметров в контрольном примере
Л. С. Понтрягина и игре «два крокодила», при которых выполне-
но достаточное условие разрешимости задачи убегания, теоре-
ма 3.1.
«Контрольный пример Л. С. Понтрягина». Рассмотрим для
дифференциальной игры (2.16) задачу убегания. Проверим вы-
полнимость условий предположения 3.1. Имеем п=(Е, 0, 0), где
Е—v-мерная единичная матрица, 0—v-мерная нулевая матрица;
лВР=лСЗ={0}, лЛВР=5р(0), лАСЗ=5„(0).
Таким образом, k = 2 и предположение 3.1 выполнено, если а>р.
«Два крокодила». Рассмотрим для дифференциальной игры
(2.18) задачу убегания. Проверяем условия предположения 3.1,
Имеем л=ДЕ, 0), где Е—v-мерная единичная матрица.
nBP=nCQ^{Q}, лЛВР=5р(0), n4CQ = Sa(0).
Таким образом, k=2 и предположение 3.1 выполнено, если а>р.
Для нахождения специального управления убегания надо про-
вести построения п. 3 для рассматриваемых игр.
41
Глава 2
ИГРОВЫЕ ЗАДАЧИ УПРАВЛЕНИЯ
НЕСКОЛЬКИМИ ОБЪЕКТАМИ. ПОСТАНОВКА ЗАДАЧ
А. В теории дифференциальных игр группы т преследовате-
лей и одного убегающего рассматривается движение конфликтно
управляемых объектов z,-, описываемое в «г-мерном
евклидовом пространстве Rni следующими уравнениями:
v(t)), 1^=2?, (0.1)
где
z^KX ui(t)^Pi(t)<ziRpi, v(t)EEQ(f)cz R^-, Q(t)—
непустые непрерывные компактные отображения при t^t0. Век-
тор ut находится в распоряжении t-го преследователя, вектор и
находится в распоряжении убегающего. Движение начинается в
момент t=tQ из начального состояния (z^, t0) и протекает под
воздействием измеримых по Лебегу функций
^Рг(1). Относительно векторной функции Fj(t, гг, uiy v) будем
предполагать, что она определена и непрерывна на [Д, со)х/?”гХ
XRPixRq‘, на каждом компакте [К gz [/0, &>)х/^ги всевозможных
Ui^Pi(t), v^Q(t) удовлетворяет условию Липшица НЛ(Л Щ,
о)—Ff(/, 2г, пг, ц)Ц ||—ZiH, где — константа, завися-
щая от К, и удовлетворяет следующему неравенству: ||ГД/, zt, uit
v)l]^C4t)(l + ||2г'||), где Ci(t)—непрерывная функция. Эти усло-
вия обеспечивают существование, единственность и продолжи-
мость при всех />/0 решения задачи Коши Zi=Fi(t, zh Ui(t), v(ty),
Zi^^—Zt, в классе абсолютно непрерывных функций при про-
извольных измеримых Ui (t) ^Рг (0, В RX выделено
некоторое непустое выпуклое замкнутое множество МД/), кото-
рое называется терминальным. Цель группы преследователей —
добиться по возможности быстрее выполнения включения иД/Де
хотя бы при одном i при некотором /г>/0. В момент
первого попадания одной из точек гД/) на соответствующее мно-
жество Mi(t) преследование считается законченным. Убегающий
стремится отдалить момент попадания гД/) на МД/), i=l,... ,т,
или, если это возможно, обеспечить при всех />/0 условие
Zi(f) для всех /=1, 2,..., т. s
Перечисленными выше данными описана дифференциальная;
игра нескольких лиц (0.1), в которой принимает участие группа
42
преследователей, в распоряжении которой вектор управления и=
==(wi,..., и™), и преследуемый игрок, в распоряжении которого
вектор v. Физической моделью для дифференциальных игр груп-
пы преследователей и одного убегающего является процесс пре-
следования группой преследующих объектов лу, 1=1,..., т, одно-
го убегающего объекта у. Пусть динамические возможности объ-
екта Xi описываются уравнением
Д = t, ut), (0.2)
где x^Rk'1, Ui^PidRpi, а динамические возможности объекта
у описываются уравнением
У=ё(У, t, v), (0.3)
где y^R1, v<=QaiRn. В Rni = RkixRl выделено замкнутое множе-
ство Mi. Преследование' считается законченным, когда вектор
(Xi(Z), i/(0) впервые попадает на М{. Полагая Zi=(x'i, у), уравне-
ния (0.2), (0.3) можно записать в виде (0.1). Отметим, однако,
что дифференциальная игра (0.1) (если не сделано специальных
предположений относительно Fi(t, zit щ, п)) имеет более общий
характер, нежели игра (0.2), (0.3), так как в последние уравнения
Ui, v входят разделенным образом, что нередко существенно упро-
щает исследование.
Следуя Л, С. Понтрягину [4], мы будем отдельно рассматри-
вать дифференциальную игру (0.1) с точки зрения группы пре-
следователей и с точки зрения убегающего.
При первом подходе предполагается, что i-й догоняющий зна-
ет: 1) динамические возможности конфликтно управляемых объ-
ектов Zj, ]'=!,..., т, т. е. знает функции F$(t, Zj, щ, п) множества
РД0, Q(/), Afj(£), f>/o, j=l,...,m; 2) начальное состояние иг-
ры (г°, С)=(2?, ^т, С); 3) vt(-) —функцию v(s) при
где t — текущий момент игры.
Определим стратегию г-го преследователя u^t) = Ui(t, Zq, to,
пг(-)) как отображение, определенное на множестве произволь-
ных измеримых функций и обладающее сле-
дующими свойствами: для произвольной измеримой t>-
>0, функция Ui(t) = Ui(t, z°, t0, измерима no t, t>to,
M0, и если п1(0==у2(0 почти всюду для t0>t>r, то
Ui(t, 2", /(), (.))=[/;(С 2°, fj(O) почти всюду для
Стратегией преследования назовем вектор U (Z7:,..., Um), где
Ui — стратегия i-ro преследователя.
Задача 1—задача преследования — формулируется следую-
щим образом. Найти начальные состояния z°, t0, для которых су-
ществует такая стратегия преследования t/=(lZb ..., Um), что при
любом управлении убегающего по крайней мере один вектор
2г (0 > 1, • • > rn, являющийся решением уравнения
г, (0=^(0 *00. Udi, *°, 0. ^(0), (0.4)
zf(0)=*i,
43
приходит на соответствующее терминальное множество Mj(t) не
позднее некоторого конечного времени.
Если данная начальная точка (z°, /о) принадлежит множест-
т
ву 3l = {(z°, t0)}dRn, n=(£nz) + l, являющемуся решением за-
г— 1
дачи преследования с гарантированной оценкой t^x(zQ, /0), то
мы будем говорить, что из этой начальной точки группа пресле-
дователей может завершить преследование за время т(г°, —tQ,
а время t(z°, t0)—to будем называть гарантированным временем
преследования.
Под решением задачи преследования мы будем понимать:
1) нахождение эффективных достаточных условий существования
решения задачи преследования; 2) описание процедуры нахожде-
ния точек z°, для которых разрешима задача преследования;
3) описание процедуры построения стратегии преследования;
4) описание процедуры вычисления гарантированного времени
преследования. Изучению задачи преследования посвящены гл. 3,
§ 1; гл. 4, § 1—5; гл. 5, § 1—5. В гл. 4, § 4; гл. 5, § 4 задача пре-
следования рассматривается в классах стратегий, отличающихся от
описанных выше. Соответствующие пояснения мы делаем в нача-
ле соответствующего параграфа.
При втором подходе предполагается, что убегающий знает:
1) динамические возможности всех объектов zit t=l,... ,т,
т. е. знает функции Л(/, zit у), множества
Q(Z), Mf{t), 4 = 1, .... т, t>t^
2) начальное состояние игры (z°, t^ — (z\, .... zQm,
3) М1Д-)....—функции 44j(s), 4=1,...,m при
где t — текущий момент игры.
Определим стратегию убегающего z(l, t0, 4 = 1,
..., m) как отображение, определенное на множестве произ-
вольных измеримых функций ui{t')^Pi(t), t^to, t=l,..., m, и об-
ладающее следующими свойствами: для произвольных измери-
мых 4=1,...,т, функция v(t)=V(t, z°, t0, 4 = 1,
..., т) измерима по t, и если (t) =иг2 3 (t), 4=1,...
..., т, почти всюду для то
V(C z°, /0, u/Д-), 4 = 1, ..., m)=V(C z°, /0, щ2(-), 4 = 1, ..., гп)
ПОЧТИ всюду ДЛЯ
Задача 2 —задача убегания — формулируется следующим об-
разом. Найти начальные состояния z°, t0, для которых существует
такая стратегия убегающего что при любых управлениях
преследователей ни один вектор гДО, 4=1,...,т, являющийся
решением уравнения
44
zdtR=Fi(.L zt(t), Ui(t), V(t, z°, t0, Z=l, ..., rn)),
(0.5)
ZiGo)=4
не приходит на соответствующее терминальное множество Af*(f)
для всех />^о-
Под решением задачи убегания будем понимать: 1) нахожде-
ние эффективных достаточных условий существования решения
задачи убегания; 2) описание процедуры нахождения точек z°,
t0, для которых разрешима задача убегания; 3) описание процеду-
ры построения управления убегающего, решающего задачу убе-
гания.
Среди уравнений (0.1) особо выделим квазилинейный случай
Fi(t, zb uit v) (0.6)
и линейный стационарный случай
Fi(t, zb иь v^^AiZiA-BiUi—CiV. (0.7)
В случае (0.6) уравнение (0.1) имеет вид
Zt = Ai(t)zi-{-fi(t, u^—qAt, 0, z/(/0)=zi°, (0.8)
где Zi^Rnit «, (/)(= Pi(f)cz RPi, cz Rq, A^t)—квадратные
матрицы порядка nit элементы которых являются непрерывными
функциями при Pi (0, Q(t)—непустые, непрерывные ком-
пактнозначные отображения при gi(t, v), fi(t, щ), ^-мер-
ные векторные функции, непрерывные по совокупности аргумен-
тов. При этом будем считать, что множества Мj(0,...,Mm(t)
имеют вид Mi(t)=Mix+Mi2(t), где АГ*1—линейное подпростран-
ство пространства Rni, М.1— непустые непрерывные, выпукло-
значные отображения, такие, что для каждого te[f0, сю), MA(t)<zz
<zzLA, где — ортогональное дополнение к подпространству
Mi в В случае (0.7) уравнение (0.1) имеет вид
zi=Aizi-\-BiUi —CiV, Zi(ty=zot, (0.9)
где zt^R\ u-t Pt<zz RPi, v^Qc^R\ pj^l, p^l, Pi, Q—непус-
тые выпуклые компакты, A,, Bit Ci — постоянные матрицы раз-
мерности tiiXiti, riiXPi, niXq соответственно. При этом мы будем
считать, что множества Mi(t) от t не зависят, М,=МА + МА, где
Afi1 — линейное подпространство пространства RA1, М%— непу-
стой выпуклый компакт: Af^czL,1, LA— ортогональное дополне-
ние к подпространству М} в RnA
Б. Наряду с задачами преследования и убегания важными для
приложений являются задача преследования при r-кратном взаи-
модействии с убегающим, задача уклонения от r-кратного взаи-
модействия с преследователями, задача преследования при за-
держке поступления информации об убегающем. Перейдем к их
формулировке.
45
Задача 3 — задача преследования при r-кратном взаимодей-
ствии с убегающим для дифференциальной игры группы пресле-
дователей и одного убегающего вида (0.9)—формулируется сле-
дующим образом. Найти начальные состояния z0 — (г?,..., z°m)f
для которых существует такая стратегия преследования £7 =
= (£Д, .. ., Um), что при любом управлении убегающего, по край-
ней мере г, l^r^m, разных функций zt-(/), / —1, .г, являю-
щихся решением уравнения z£/- == А^-^В^и^ (t, z°, 0, оД-))—
—Ci.vtt), приходят на соответствующие терминальные
множества Mi не позднее некоторого конечного момента времени
(приход траектории г,(/) на М{ может происходить в разные мо-
менты времени).
Задача 4 — задача уклонения от r-кратного взаимодействия с
преследователями для дифференциальной игры группы преследо-
вателей и одного убегающего вида (0.9)—формулируется так.
Найти начальные состояния z°=(zi0,.. .,z°m), для которых ’ суще-
ствует такая стратегия убегающего V, что при любых управле-
ниях преследователей, не менее чем для т—г+1 индексов i, для
траекторий Zt(t), являющихся решением уравнений -
0, ич{,\ f-I, ...» m),
^г(0) = г?.
выполняется соотношение гД£)^Л1£, £>0. Изучению задач 3 и 4
посвящены гл. 3, § 1 и гл. 4, § 2.
В. Перейдем к формулировке задачи преследования при за-
держке поступления информации об убегающем.
Рассмотрим дифференциальную игру нескольких лиц (0,9), в
которой принимают участие группа преследователей, в распоря-
жении которой вектор управления н=(щ,..., ит), и преследуе-
мый игрок, в распоряжении которого вектор v. Предполагается,
что преследователям известны уравнения (0.9), множества Q,
Mi, t=l,..., m, начальное состояние игры z°= (zA,..., z°m); в каж-
дый момент />0 i-му преследователю известно а(-, гг(0) —функ-
ция у(х) при 0^s^7—г£(0, МО при />0 неотрицательная не-
прерывная, кусочно-непрерывно дифференцируемая функция с ко-
нечным числом разрывов производной на каждом конечном от-
резке, г,(0)=0. Далее в точках разрыва за значение про-
изводной будем принимать значения правой производной.
Стратегию z-го преследователя при задержке поступления ин-
формации об убегающем определим как отображение Ui(z°, tr
о(*, МО)), ^>0, определенное на множестве произвольных изме-
римых функций —гД£) и множестве произволь-
т
ных векторов (z°, />0, и обладающее сле-
г -!
дующими свойствами: для любого измеримого
46
z°^Rn, Ui(z°, t, w(-, (/)))—как функция t измери-
ма; Ui(z°, i, v(', Гг(/)))еЛ; для любого a>0, если u1(s)=y2(s)
почти всюду для sf=[O, а—г, (a)], то CA(z°, t, щ(-, r, (t))) =Ui (z°,
i, v2(-, почти всюду для Ze [0, a].
Стратегией преследования при задержке поступления информа-
ции об убегающем назовем вектор u(t) — (щ (Z),..., um(t)), где
Ui — стратегия z-го преследователя при задержке поступления ин-
формации об убегающем.
Задача 5 — задача преследования при задержке поступления
информации об убегающем — формулируется следующим обра-
зом. Найти начальные состояния 2°, для которых существует та-
кая стратегия преследования при задержке поступления информа-
ции «* (Z) = («i* (Z),..., ыто* (/)), что при любом программном
управлении убегающего по крайней мере один вектор z* (Z), i=
являющийся решением уравнения Zi=AiZt +BiUi* (Z)—
—C,y(Z), 21(0)=2г°, приходит на соответствующее терминальное
множество Mi не позже некоторого конечного момента времени.
Изучению задачи 5 посвящен § 3 гл. 4.
Г. Наряду с дифференциальными играми вида (0.9) мы бу-
дем рассматривать процесс преследования т преследователями,
движение которых описывается уравнениями
хг -фц(-, f'=l, т, хг(0)=х?,
(0.10)
хг- s Rn, Ui^Pitz Rn,
одного убегающего, движение которого описывается уравнением
i/ = Hy-rV, t/(O) = z/°,
(О.Н)
у е Rn, v е Q cz Rn.
Процесс преследования оканчивается, если хотя бы для одно-
го ie{1,..., т} в некоторый момент времени
nixi(i)-\-^i—>niy(t'). (0.12)
Здесь Gt, Н, лг-— квадратные матрицы порядка п, Pt, Q, Mi — не-
пустые, выпуклые компакты из Rn.
Определим стратегию Z-ro преследователя в процессе преследо-
вания Wi(Z)=f7j(Z, хД t/°, щ(-)) как отображение, определенное
на множестве произвольных измеримых функций v(t)<=Q, t^Q, и
обладающее следующим свойством: для произвольной измеримой
Z>0, функция Ui{t}=Ui{t, Xi°, у°, t>0, измерима
no t, tii(f)^Pt, и если y1(Z)=u2(Z) почти всюду для O^Z^t, то
Ui(t, хА, у°, vtl (•)) = Ui(t, хА, y(), щ2(-)) почти всюду для Z>0.
Стратегией преследования в процессе преследования назовем
вектор u(t) = (Ui (t),..., где щ(1)—стратегия i-ro пресле-
дователя в процессе преследования.
47
Задача 6 — задача об окончании процесса преследования —
формулируется следующим образом. Найти начальные состояния
xR, для которых существует такая стратегия преследования в
процессе преследования u(t) = (щ (t),..., um(t)), что при любом
управлении убегающего t-'(QEQ, ^>0, по крайней мере один век^
тор Хг (/), i=l,..., т, являющийся решением уравнения 1
хг(0=СЛ(0 + (/г(/, 4 У°, f(s).
хг(0)=х°,
удовлетворяет условию Лг*г(0 не позднее некоторое
го конечного момента времени. Здесь y(t)—решение уравнений
(0.11) при v=v(t).
Под решением задачи об окончании процесса преследования
мы будем понимать: 1) нахождение эффективных достаточных ус-<
ловий существования решения задачи преследования; 2) описание
процедуры нахождения точек хг°, у, для которых разрешима зада-?
ча преследования; 3) описание процедуры построения стратегии
преследования; 4) описание процедуры вычисления гарантирован-
ного времени преследования.
Изучению задачи 6 посвящен § 4 из гл. 5.
Д. Перейдем к формулировке задачи преследования для диф-
ференциальных игр группы преследователей и одного убегающего
с переменной структурой. Из всех возможных видов дифференци-
альных игр с переменной структурой мы рассмотрим два: диффе-
ренциальные игры группы преследователей и одного убегающего
с переменной структурой, управляемой убегающим (при этом
фиксирован порядок использования уравнений, описывающих иг-
ру, убегающим), и дифференциальные игры группы преследовате-
лей и одного убегающего с переменной структурой, управляемой
преследователями, в которой преследователи располагают воз-
можностью выбора последовательности использования уравнений,
описывающих игру. Этим видам присущи характерные особенно-
сти дифференциальных игр с переменной структурой.
Сформулируем задачу, преследования для дифференциальной
игры группы преследователей и одного убегающего с переменной
структурой, управляемой убегающим.
Пусть движение векторов Xi, y^.Rn описывается уравнениями
хг=Л{х{ + г4 — сА, Х|(0)=х?, 0^<т, (0.13)
yi=Biyi + u‘i—и*, yi(x) = Jixi(x)i t^x, (0.14)
i = 1, . .., m,
где xit yit uR, uR, v\ u2<=Rn, Ait Bif /t — постоянные квадратные
матрицы порядка n, upGPRczRn, v^Q^Rn, /=1, 2, Qi, PR—не-а
пустые выпуклые компакты. Пусть далее в Rn заданы множества!
где M^MR R-MR, MR— линейное подпростран-1
ство пространства Rn, MR—выпуклый компакт в LR, LR — орто-|
48 1
г0нальное дополнение к подпространству мр в R™. Игра начи-
нается в момент t=0 из начальных состояний хг-° и оканчивается
в тот момент времени i>0, когда хотя бы при одном i
(если переключения не произошло, то условие окончания
^Мг)- Выбором момента переключения т с системы (0.13) на си-
стему (0.14) распоряжается убегающий. Преследователи момент
переключения заранее не знают и узнают о том, что переключе-
ние происходит, только в момент переключения. Под стратегией
убегающего условимся понимать всевозможные тройки
т, о2(-))> гДе О^^т; u2(i)eQ2, t>T.
Пусть /<={1, 2}, <?={1, 2}\/. Обозначим через СМ класс функ-
ций Up: [0, оо) xQ}-+Rn, для которого выполнены следующие ус-
ловия: 1) Up(t, vp^Pp для всех ^>0, to’eQ3; 2) суперпозиция
Up(t, о3(0) измерима по Лебегу при i>0 для произвольной из-
меримой t>3(f)GQ3. Обозначим через Ор(г) класс функций Up:
: [т, оо) xQq-+Rn, для которого выполнены следующие условия:
1) Up(t, vp^Pp для всех 2) суперпозиция Up(t,
измерима по Лебегу при />т для произвольной измеримой
gQ'/. Под стратегией i-ro преследователя условимся пони-
мать всевозможные тройки а=(1Д1, т, Up), где Up^UP, Up^
еС^(т). Решение уравнений (0.13), (0.14) при фиксированных
стратегиях убегающего и i-ro преследователя: у<=(щ, 0) опреде-
ляется следующим образом. Если и1^)—измеримая функция со
значениями из Q1, />0, UP^OP, то хг(/, уг)—абсолютно непре-
рывное решение уравнения (0.13) для при щ—
— Up(t, v’(i)). Начиная с момента т, выбираемого убегающим,
для v2(t)—измеримой функции со значением из Q2, Up^
^Uppt), yi(t\ уР)—абсолютно непрерывное решение уравнения
(0.14), i>r, с начальным условием ^(т)=7^(т) при о2=о2(0,
Иг2(0=^2(^ У2(0)-
Стратегией преследования назовем вектор «= (си,..., а™), где
аг-— стратегия i-ro преследователя.
Группа догоняющих стремится к тому, чтобы хотя бы одна
точка yi(t; уР) побыстрее попала на Afi, а убегающий стремится
оттянуть попадание yi(t; уг) на
Перечисленными выше данными описана дифференциальная
игра нескольких лиц (0.13), (0.14) с переменной структурой,
управляемой убегающим, в которой принимают участие группа
преследователей, в распоряжении которой вектор управления и=
= (си,..., ат), и преследуемый игрок, в распоряжении которого
параметр р.
Задача 7 — задача преследования в дифференциальной игре с
переменной структурой, управляемой убегающим, — формулиру-
ется следующим образом. Найти начальные состояния x°=(xi°,...
для которых существует такая стратегия преследования
(щ,..., am), что при любой стратегии убегающего р по край-
ней мере один вектор Уг(р; ур приходит на соответствующее тер-
минальное множество Mi не позднее некоторого конечного момен-
та времени.
4»
Сформулируем задачу преследования для дифференциальной
игры группы преследователей и одного убегающего с переменной
структурой, управляемой преследователями.
Пусть движение векторов описывается уравнениями
хц~АиХц + «//—у/, * = 1, •••» т, /=1, 2, (0.15)
где Uij, v^.Rn, Aij — постоянные квадратные матрицы порядка п,
Uij^PijdRn, Vj^Qj<^Rn, Рц, Qj — непустые выпуклые компакты.
Пусть далее в Rn выделены множества Mij, / = 1, 2,
где Ми = М1и + М2ц, Мхц — линейное подпространство простран-
ства Rn, — выпуклый компакт в — ортогональное
дополнение к подпространству в Rn. Игра начинается в мо-
мент t=Q из начального состояния х°= (хоц,..., x°mi, х°12,..., x°m2)
и оканчивается в тот момент времени t>Q, когда хотя бы при од-
ной паре индексов ij выполнено включение убегающий
распоряжается выбором измеримых /=1, 2, £>0. Дого-
няющий с номером i распоряжается выбором вектора (/, и^(^),
Tij), причем значения /=/(i)e{l, 2} выбираются им в момент на-
чала игры, Tij — момент переключения i-ro преследователя с урав-
нения (0.15) для при индексе /^{1, 2} на уравнения
(0.15) для при индексе <?={1, 2}\/, в котором считается вы-
полненным краевое условие xiq(xiA=JijXij(xiA, где Л/ —квадрат-
ные матрицы порядка пу t=l,..., т, q=A, 2; (t) ^Рц — из-
меримые функции для Z>0. Под стратегиями г'-го догоняющего
условимся понимать всевозможные четверки <Хг=(/, Up, Up^A,
xiA, где тг/>0, ир<=ир, Up^Ofl^xtA, / = 1, 2; а под стратегиями
убегающего™всевозможные пары программных управлений 0=
= (fi (•), fa(•)), где —измеримая функция.
Стратегией преследования назовем вектор и= (си,..., ат) > где
щ — стратегия i-ro преследователя.
Решение уравнения (0.15) при фиксированных стратегиях убе-
гающего и i-ro преследователя у^ (щ, 0) определяется следую-
щим образом. В момент начала игры i-й преследователь опреде-
ляет номер / и момент переключения Если иД/) — измеримая
функция со значением из Q/, Uii&Jii, O^^Tjj, то Хц(1\ уА— аб-
солютно непрерывное решение уравнения (0.15), при
U/ = t>/(0, Uij=Uii(t, vi (/)). Начиная с момента Xij, xiq{t; уА —аб-
солютно непрерывная функция, являющаяся решением уравнения
(0.15) при vq=vq(t), UiQ=^Viq(t> vq(A) с начальным условием
Xiq^iA^JijXijlxiA Группа догоняющих стремится к тому, чтобы
хотя бы одна из точек xiq(t’, уА побыстрее попала на Miq, а убе-
гающий стремится оттянуть попадание хг*д(^; уА на Miq.
Перечисленными выше данными описана дифференциальная
игра нескольких лиц (0.15) с переменной структурой, управляе-
мой преследователями, в которой принимают участие группа пре-
следователей, в распоряжении которой вектор (си,..., aw), и
преследуемый игрок, в распоряжении которого параметр 0.
50
Задача 8 —задача преследования в дифференциальной игре с
переменной структурой, управляемой преследователями, — форму-
1Ируется следующим образом. Найти начальные состояния х°=
= (х°п,.. • -V°i2,..., х°т2), для которых существует такая
стратегия преследования «= (со,..., ат), что при любой стратегии
убегающего р по крайней мере один вектор Xij(t', у4) приходит на
соответствующее терминальное множество Мц не позднее некото-
рого конечного момента времени.
Исследованию задач 7 и 8 посвящена гл. 6.
Е. Перейдем к формулировке задачи преследования для диф-
ференциальной игры группы преследующих объектов и двух убе-
гающих.
Пусть движение векторов Zij^Rn описывается уравнениями
%ij == (0 %1] f ij (Jr ®j)> %ij (^tr)z=^ijt i==l, / === 1 > 2,
(0.16)
где uj (Z) <= Pi (Z) cz Rp, Vj (Z) ge Q/ (Z) c= RQ, |Y0, оо). Ац (/)—-квадрат-
ные матрицы порядка п, непрерывно зависящие от щ, Vj— пара-
метры управлений i-ro преследователя и /-го убегающего, Pi(t)t
Qj(i)—непрерывные в метрике Хаусдорфа компактнозначные
отображения, fa(t, uif v})—непрерывные по совокупности аргу-
ментов функции. Преследователь с номером i распоряжается вы-
бором вектора «Ц/), где й,(/)еР,-(/) — измеримая функция для
t>-to. Убегающий с номером j распоряжается выбором
—измеримой функции для Z>Z0. Терминальные множест-
ва <=jRn имеют вид A4ij(i)=Af1^+Af2^(i), где —линей-
ные подпространства из Rn, М2ц (Z) — выпуклозначное отображе-
ние из 1Ац — ортогональное дополнение к Л!1^- в Rn. Игра
начинается в момент t~t0 и считается оконченной, если найдутся
номера ii, i2s{l,...,m) и конечные времена такие,,
что
?pi (^) е (ij), zM (f2) ge Mh2 (Z2).
Цель группы преследователей —- побыстрее окончить игру, цель
убегающих противоположна. Перечисленные выше данные описы-
вают дифференциальную игру группы преследователей и двух
убегающих (0.16), в которой в распоряжении группы преследова-
телей вектор u=(ui(t),..., а в распоряжении убегающих
вектор о=(щ(/), Обозначим через ГсЦо, °°) XRqXRq
график произведения многозначных отображений Q/: [Zo, оо)->
/=1, 2, через — класс функций Ui: для которых
выполнены следующие условия: 1) Ui(t, щ, v2)^Pi(t) для всех
Z>io, всех /=1, 2; 2) суперпозиция Ui(t, i>i(Z), и2(^))
измерима по Лебегу при Z>Z0 Для произвольной измеримой
t >>t0, /=1, 2. Под стратегией i-ro преследователя
условимся понимать всевозможные функции, где а под
стратегией j-ro убегающего—всевозможные программные изме-
римые функции Vj(i)^Qj(i), Z>Z0.
51
Стратегией преследования назовем вектор u = U1,..., Um), где
Ui — стратегия i-ro преследователя.
Задача 9 — задача преследования для дифференциальной игры
труппы преследователей и двух убегающих—формулируется сле-
дующим образом. Найти начальные состояния zQ= (г°ц,..., z°ml,
z°i2,..., z°m2), для которых существует такая стратегия преследо-
вания, что при любых стратегиях убегающих найдутся номера i],
i2e{l,..., т}, такие, что в некоторые конечные моменты времени
решения уравнения (0.16) с индексами i\, i2 при так выбранных
управлениях придут на терминальные множества Mi2q соот-
ветственно, где 9={1, 2}\/. Изучению задачи 9 посвящена гл. 7.
В следующих главах мы приведем решения задач 1—9.
Глава 3
РЕШЕНИЯ ИГРОВЫХ ЗАДАЧ,
ОБЛАДАЮЩИХ ПРОСТЫМ ДВИЖЕНИЕМ
В настоящей главе мы приводим решения ряда задач пресле-
дования—убегания группы преследователей и одного или двух
убегающих для объектов, обладающих простыми движениями.
Они отражают специфику задач группового преследования—убе-
гания и формируют представление об условиях разрешимости
таких задач и возможных методах построения управлений, реша-
ющих соответствующие задачи. Простая динамика игры позволя-
ет в ряде случаев получить полное решение задачи аналитичес-
кими методами.
§ 1. Решение игры простого преследования — убегания.
Теорема Б. Н. Пшеничного
В этом параграфе приводится решение дифференциальной
игры преследования — убегания нескольких однотипных пресле-
дователей, обладающих простым движением, и одного убегающе-
го того же типа. Теорема о разрешимости такого класса задач
предложена Б. Н. Пшеничным в работе [22]. Ниже мы приводим
один из вариантов этой теоремы (теорема 1.1) и ряд результатов
по исследованию задачи простого преследования—убегания, появ-
ление которых стимулировала работа [22].
1. Постановка задачи. Теорема преследования—убегания.
Пусть движение т преследующих объектов описывается уравне-
ниями
Xi~ub Х|(0)=х?, Z=l, ..., т,
(1-1)
где X', Ui^Rn, Ui^eP, Р — выпуклый компакт. Убегающий объект
описывается аналогично:
у=и, у(О)=у°,
(1-2)
где у, v^Rn, и^Р. Игра оканчивается, если хотя бы для одного
* в некоторый конечный момент времени t Xi(t)—y(t)&Mi, Mi —
выпуклые компакты.
53
Введем переменную zt=Xj—у. Тогда из (1.1) и (1.2) имеем
Zi=Ui — V, Zi(0) = Zi,
(1.35
Zh Щ, V е Rn, Щ^Р, V<^ Р.
Уравнение (1.3), множества Р и Mi описывают дифференциаль-
ную игру нескольких лиц (1.3), в которой принимают участие
группа преследователей, в распоряжении которой вектор управ-
ления и=(м1, ..., ит), и преследуемый игрок, в распоряжении
которого вектор v. Рассмотрим для дифференциальной игры (1.3)
задачи преследования и убегания, сформулированные в гл, 2.
Пусть z°=(zf, ..., г^), М={МГ, Mmj, z^^M, z = l, .т
K(i, и, z9, ЛД)=тах {X : О, —X(z{—7Иг)П(—иДР)=^=0},
6(2°, m)=min max X(t, о, z9, МД
(Рис. 3.1.1 иллюстрирует определения функции К (t, v, 2Д Mi)
в R2. Для параметров zt°, гД Mi, Mj, v, Р, изображенных на.
рис. 3.1.1, A(i, v, zR, М/)=0, %(/, v, zR, Лф)>0.)
В силу утверждения П. 4. такое определение функции б(г°, т)
корректно. Из определения функции 6(z°, т) следует, что
б (г°, т) =0 тогда и только тогда, когда существует вектор щеР,
такой, что для каждого i=l, ..., т, X(i, Vo, 2Д Л1») =0. Обозна-
чим 1>о=ц(2Д М).
54
Теорема 1.1,
а) Если для z°, 6(z°, m)>0, то для позиции zQ разрешима за-
дача преследования за конечное время t(z°), для которого спра-
ведлива оценка t(z°)^m/8(z0, пг). Этот результат гарантируют
стратегии преследователей, описываемые далее формулой (1.4),
б) Если z° такова, что 8(z°, m)=0, то для позиции z° разре-
шима задача убегания. Убегание гарантирует следующее управ-
ление убегающего: v(t)=v(&, М),
Доказательство. Пусть для позиции z° выполнено усло-
вие а) теоремы 1.1. Предпишем i-му преследователю выбирать
функции ut(t)^P, как лексикографический минимум
решений уравнения
«ДД—о(/)=—о(/), г?, Mi)($—
(1.4)
(Рис. 3.1.2 иллюстрирует способ выбора управления Ui(t) в R2.
Отметим, что если K(k, v (t), zk°, Mk)=0, то uk(t)=v (t).)
A 2
P -&(t)
iw
Рис. 3.1.2
~Z: +M;
-Л(I, v(Mi)(mi(t) - z°)
Если v(t) — измеримая функция t, то функция X(i, v(t), zp,
Mt) в силу утверждения П. 2 измерима по t и в силу теоремы
Филиппова (см. п. 7.) так получаемые функции нД/), тД/) из-
55
меримым образом зависят от t. Для решения уравнения (1.3)
в силу (1.4) справедливо представление
t
J X(t, о(т), 2?, M/)(si?~mf(T))dT =
—z9 (1 — Jx(Z, o(t), 2°, Mt)dr) 4- J m} (t)%(/, d(t), 2°, Mt)dx. (1.5]
о о
В силу утверждения П. 3 и определения функции 6(2°, т)
t
min fl — fx(r, o(s), 2° Mf)ds^ =
0
t
= 1— max ( X,(i, o(s), z° M^ds^
t m
---v(s), z° MJds^l i-6(2o(
m J Li m
о i=l
Таким образом, не позже момента if (z°)^m/6 (z°, т) хотя бы
одна из величин 1 — § МЛ v(s)t Mt)ds обратится в нуль. Обо-
6
значим этот момент t*. Тогда
2г(Г)=У/п^т)Х(4, о(т), z9, Mi)dx <=
о
Таким образом, хотя бы один из преследователей ловит к момен-
ту t(z°) убегающего.
Пусть для позиции 2° выполнено условие б) теоремы 1.1. Тог-
да существует вектор v0—v(z?t 7И), такой, что для любого i вы-
полняется соотношение
{-vo + P}fU-K(zO-M£), Ь>0} = {0}. (1.6)
Положим o(/)=t»o- Если ut(t) — произвольное допустимое
управление i-го преследователя, то
t
2/ (0=+ J (—+ Ui (т)) dx е 2й,—tv0 + tP
о
для В силу (1.6) для всех i, t^Q,
{<(-f« + O}n(-W(z»-M,), Л>0} = {0}
56
л, следовательно,
X>O} = {z°}. (1.7)
) -Гак как {zT—Xf(z?—/И,-), Х^О, /^0}оЛ1; и 29ё=Мг, то из (1.7)
' следует, что для любого i и любого />0 {?9-Н(—v0 + Р)} АМг = 0
И1 следовательно, ни в какой конечный момент времени t ни при
каком I Zi(t) не попадет на Л1£, т. е. убегающий не будет пойман
ни одним из преследователей. Теорема доказана.
2. Вычисление функции Х(-). Для нахождения управлений
nt (t), 1=1, т, гарантирующих выполнение пункта а) теоре-
мы 1.1, необходимо уметь вычислять функции X(f, v, zp, Mi).
Приведем представление функции X(t, v, Zt°, Mi) через опорные
функции множеств, входящие в определение функции X(t, v, zp,
Мд-
Лемма 1.1. Пусть Р выпуклый компакт в Rn, Zi°^Mi, i=
= 1, ..., m. Тогда X(f, v, z?, M)= inf c(P—v, ф), где Л(2(°) =
T e Л(г°)
={ф; фе/?га, с(М—Zi°, —ф) = — 1), с(Р—v, ф) — опорная функция
соответствующего множества.
Доказательство. Так как v^P, то справедливо включе-
ние Ое—v + P для всех v^P, которое эквивалентно неравенству
с (Р—v, ф)>0 для всех фе7?\ Непустота пересечения в опреде-
лении функции X равносильна неравенству с(Р—v, ф)+
+ c(X(Af—z(°), —ф)^0 для всех фе/?п. Таким образом,
с(Р—у, ф)4-Хс(М—z9, —ф) 0, или с(Р—v, ф)^— Хс(Л1——ф).
(1-8)
Если с(М—zt°, —ф)^>0, то неравенство (1.8) выполнено при всех
Х^О. Если с(М—ztQ, —ф)<0, то, положив с(Л1—zp, —ф) =—1,
получим с(Р—V, ф)^Х.
, Таким образом, X (i, у, z°., Mt)= inf (с(Р—v, ф)), где
фел(г^)
Л(г^) = {ф : Rn‘, с(М—г®, —ф)=— 1).
Для исследования конкретных примеров и проведения численных
расчетов полезно иметь явный вид функции X(i, v, zp, mi) для
тех случаев, когда Р — многогранник или эллипсоид, а множест-
во одноточечно. Вычислим X(i, и, z,0, mi), когда Р — мно-
гогранник и Р — эллипсоид в Rn.
Пусть Р=Р(рь .. pk, alr .. ., ak)={u<=Rn, (ph u)^af, p^
^Rn, a^R1, /=1, ..., k} — многогранник. Будем считать, cc/^O,
/=1, k. Из определения X=X(i, v, zS, md) следует, что
"Х(гг°—mi) +v^P, т. е. X — наибольшее положительное число,
такое, что для каждого / выполняется неравенство
Х(р/, т7—zO)^az—(р/, о). (1.9)
57
Так как ueP, то а;—(р/, и)^0. Следовательно, для тех j, для
которых (р/, тг—г,°)>0, неравенство (1.9) выполняется, если
( / а,- — (pi, v) \
Ш V, z°, /<=={!, .... k},
гъ—2°)>0
(1.Ю)
для тех /, для которых (р/, т,—Zi°)^0, неравенство (1.9) выпол-
няется для любого положительного Л. Таким образом, если Р —
многогранник, то функция 1(1, v, зД тг) определяется формулой
(1.10).
Пусть Р=Р(а, Q, p)={w: {и—a, Q(u—а))^р2}, а, и<=Рт, ре
е??1, р¥=0, Q—пХп — симметрическая, положительно-определен-
ная матрица. Здесь Р — эллипсоид с центром в точке а и матри-
цей —— Q. Из определения 1=1(1, и, zp, mi) следует, что
Р !
1(тг—гр) +veP. Следовательно, X — наибольший корень урав-
нения гР) +у—a, kQ(mi—zP) +Q(v—а))=р2, откуда
A(t, v, гР, mi)={(Q{zP—mi), v—а) + [(Q(zP—тР), v—a)2+(zP—
—mi, Q(zp—mi)) (p2— (y—a, Q(y—a)))] 1/2}/(z;°— mit Q(zP-mi)).
3. Описание множеств начальных позиций, из которых разре-
шимы задачи преследования и убегания. Согласно утверждениям
а) и б) теоремы 1.1 для начальных позиций из множества
{z: б (z, т)=0} разрешима задача убегания, для позиций
{z:6(z, m)>0} — задача преследования. Опишем первое множе-
ство. Согласно определению 6(z°, m)=0 тогда и только тогда,
когда существует вектор vQ^P, такой, что для всех i, г=1, ..., m,
/^0 выполнено соотношение (1.6). Таким образом, если конус
Л(уо)={^Уо+/(—Р), />0} при каком-то v0^P не пересекается со
множествами гр—Mi, 1=1, ..., т, то из этой позиции z°=
= (zi°, .... z,7i°) возможно убегание. Вообще говоря, конус 7<(по)
может оказаться незамкнутым. Ясно, что если o0eIntP, то
Int(y0—Р)^0, и конус К(и0) совпадает с несущей плоскостью
множества Р. Если же vQ^dP — граничная точка множества Р
относительно его несущей плоскости, то конус К(уо) не совпада-
ет со всей несущей плоскостью (см. [27, 54]). Граница Р может
включать в себя как точки строгой выпуклости, так и точки мно-
жеств Hf]P, где Н — гиперплоскость соответствующей размернос-
ти. Справедливо следующее утверждение.
Утверждение 1.1 [27]. Каждый конус K(v0), v0 — гра-
ничная точка выпуклого множества Р, содержит хотя бы один
конус К(ур), где у0! — крайняя точка множества Р.
Обозначим Ж (у0) =K(v0), если v0 — крайняя точка Р. Таким
образом, в силу утверждения 1.1 для того чтобы ответить на воп-
рос, какая из двух задач — задача преследования или задача
убегания — разрешима в позиции 2°, нам достаточно изучить
вопрос о пересечении конусов J4f(yo) и множеств zp—Mi, i=
58
==1> ..., tn. Если в одном из конусов □Г(и0) нет ни одной точки
одного из множеств z( ЛЕ, i 1, ..., tn, то для позиции z° воз-
можно убегание. Если в каждом из конусов J4f(u0) есть точки
множеств Zz°—Mlt то эти точки есть и во всех конусах /С(у0),
v0GdP. В силу доказанного из этих позиций г° разрешима задача
преследования. Таким образом, получаем следующее утверж-
дение.
Утверждение 1.2.
а) Для позиции разрешима задача преследования, если для
всех крайних точек о0 множества Р каждый конус имеет
непустое пересечение хотя бы с одним из множеств zp—Mi.
б) Для позиции z° разрешима задача убегания, если найдется
хотя бы один конус Jif(oo), где о0 — крайняя точка множества Р,
не пересекающийся ни с одним из множеств zp—Mi, i=\, ..., m.
4. Примеры. Приведем описание множеств {z : 6(z, m)—ty и
{z:6(z, m)>0) для нескольких видов множества Р, когда Mi —
произвольные выпуклые компакты.
1) Если Р — треугольник в R1 2, то строим три конуса
где v0 — вершины треугольника Р (рис. 3.1.3). Если хотя бы
в одном из них нет ни одной точки множества zp—Mi, i=l, ...
..., tn, то для позиции z° разрешима задача убегания. Если
в каждом из этих конусов есть хотя бы одна точка одного из
59
множеств 2Х°—М,, i=l, .... m, то для позиции 2° разрешима за-
дача преследования. Таким образом, минимальное число игроков,
для которых разрешима задача преследования в случае Л4Х—{0},
i=l, 2, 3, есть три. В общем случае есть начальные позиции а
множества Mi, для которых ловят убегающего и два игрока, на-
пример:
Р—треугольник с вершинами {(0, 1), (—1/3/2, —1/2), (1/3/2, —1/2) \
m = 2, z? = (2 1/2, 2), ^ = ( —]/3~1), М1=511(0), Л12={0}.
2) Если Р — четырехугольник в R2, строим четыре конуса
Ж(и0), где и0 — вершины треугольника (рис. 3.1.4, 3.1.5; на
рис. 3.1.5 Р — квадрат). Если хотя бы в одном из них нет ни
одной точки множеств 2х-°—Mi, /=1, т, то для позиции 2а
разрешима задача убегания. Если в каждом конусе есзь
хотя бы одна точка одного из множеств zp—Mi, то для позиции
2° разрешима задача преследования. Особенностью игры с Р —
четырехугольником в У?2 является тот факт, что в случае Mi={Qi}
/=1, ..., т, есть начальные позиции, для которых два игрока ло
вят убегающего, например:
Р={х:хеЯ2, |xf|C 1. / = К 2), m=2, 2®=(0, a), z°=(0, ~р),
или Zi°= (у, 0), 2г°= (—£, 0) для любых а, р, у, а>0, р>0
У>0, £>0.
3) Если Р — /-угольник в R2, то строим I конусов где
у о — вершина /-угольника Р (рис. 3.1.6). Если хотя бы один из
них не пересекается ни с одним из множеств 2Х°—Afx, i=l, 2, . .L
..., m, то для позиции 2° разрешима задача убегания. Если каж-i
дый конус J£f(flo) пересекается хотя бы с одним из множеств
2Х°—/И;, то для позиции 2° разрешима задача преследования.
4) Р — сектор в R2: часть круга с центром в точке А=(0, —1}
радиусом 2, ограниченная двумя радиусами АВ и АС, симмет-
ричными относительно вертикальной оси, /ВАС=а<л/2
(рис. 3.1.7). Крайние точки Р:
А = (0, —1), В = 2sin-p 2cos-y-—lj,
С = (2,sin—, 2 cos —-1)
\ 2 2 /
и все точки дуги ВС. Рассматриваем соответствующие конусы
Ж(Уо). В их число входят конусы Ж (А), Ж{Р}> Ж (С) и полу-
плоскости, соответствующие точкам Уо на дуге ВС. Если хотя бы
один из конусов J4f(y0) не пересекается ни с одним из множеств
Zi°—Mi, /=1, ..., т, то для позиции 2° разрешима задача убега-
ния. Если каждый из конусов Ж (vo) пересекается хотя бы с од-
ним из множеств 2Х°—Mi, то для позиции 2° разрешима задача
преследования.
60
Рис. 3.1.5
Рис 3.1.7
5) Р — строго выпуклое тело в Rn (например, эллипсоид)
Если хотя бы одно из полупространств Ж(п0) ={/(у0—
i^e пересекается ни с одним из множеств 2г°—Mi, то для позиции
разрешима задача убегания. Если каждое из описанных полу-
пространств пересекается хотя бы с одним из множеств z(°—Л1;,
т0 в позиции z° разрешима задача преследования. Заметим, что
сформулированные условия экви-
валентны следующим (см. [17,
57]):
а) для позиции z° разрешима
задача убегания, если
Oelnt co{z°— Mlt .... 2^—Мт};
б) для позиции 2° разрешима
задача преследования, если
Os Int co{z°—Mlf
Таким образом, для ответа на
вопрос о разрешимости задачи
преследования или убегания в
случае строго выпуклого множест-
ва Р надо рассмотреть множест-
во А, являющееся выпуклой обо-
лочкой множеств —Mi, z=l, ..., т (рис. 3.1.8 в случае /г=2)_
Если начало координат принадлежит внутренности множества А,
то из соответствующих позиций разрешима задача преследования.
Если начало координат не принадлежит множеству А, то из дан-
ных начальных позиций разрешима задача убегания.
5. Простое преследование—убегание при r-кратной поимке
убегающего. Рассмотрим для дифференциальной игры нескольких
лиц (1.3) задачу преследования при r-кратной поимке убегаю-
щего и задачу убегания от r-кратной поимки, сформулированные
в гл. 2.
Пусть
г°=(4..., ^), ....Мт),
z = l, ..., т, A(i, v, z$, Лф-)=тах {А,;
А^О, —A(z°—Л1г)<=—vR-P}, &(tn, г, z°)=
— min шах min А (г, v, z?, Мг).
v£P {i,...греигщц...ir}
В силу утверждения П. 4 минимум в определении функции
6(m, г, 2°) достигается. Из определения функции 6(m, г, 2°)
следует, что 6(m, г, z°) =0 тогда и только тогда, когда существует
вектор vr°^P, такой, что для не менее чем т—г+1 номеров i
А (г, vrQ, zR, Mi)=0. Обозначим vr0 = vr(z0, М).
63
Теорема 1.2. а) Если для позиции zG:f)(rn, г, z°)>0, то для
игры (1.3) в позиции z° разрешима задача r-кратной поимки убе-
гающего за конечное время T(zQ), для которого справедлива
оценка T(z<))^Crnr/6(m, г, z°). Этот результат гарантируют стра-
тегии преследователей, описываемые формулой (1.4).
б) Если позиция z° такова, что &(m, г, z°)=0, то для игры
(1.3) в позиции z° разрешима задача об уклонении от г-кратной
поимки. Уклонение гарантирует следующее управление убегаю-
щего: v(t)=vr(z°, М), г^О.
Доказательство. Пусть для позиции 2° 6(m, г, z°)>0.
Предпишем t-му преследователю выбирать функции цД/)еР,
как лексикографический минимум решений уравнения
(1.4). В силу определения функции 6(m, г, z°)
, t
min max ( 1 — I X(z, v(s}, z$, M^ds
r r 0
t
= 1— max min I A(t, u($), zf, M^ds^.
{t1(...идей} J
r r о
t
1-----min Z°i'
Cm Lie{ii............7} J J
я=1 0
1--Д"б(т' r> Z0)-
Таким образом, не позже момента Т(z°) (m, г, z°), не ме-
нее г величин 1 —Jx(t, y(s)> 2i> M^dsобратится в нуль. Соглас-
о
но (1.5) это означает, что не менее г преследователей поймают
убегающего к моменту Т(2°). Доказательство п. б) теоремы 1.2
может быть проведено аналогично доказательству п. б) теоре-
мы 1.1.
Проводя рассуждения для функции 6(m, г, 2°) аналогично ис-
следованию функции 6(m, г, 2°) в § 1, можно доказать следующее
утверждение.
Утверждение 1.3. а) В игре (1.3) для позиции & разре-
шима задача преследования при r-кратной поимке убегающего,
если во всех крайних точках v0 множества Р каждый конус
(уо)={^о+Д—Р), />0} имеет непустое пересечение не менее
чем с г множествами zp—Mi, t=l, ..., m.
б) В игре (1.3) для позиции z° разрешима задача уклонения
от r-кратной поимки, если найдется хотя бы один конус
где v0 — крайняя точка множества Р, пересекающийся менее чем
с г множествами гр—Mi, t=l, ..., m.
64
Заметим, что если Р — строго выпуклое тело в Rn, то из ут-
верждения 1.3 следует, что для позиции 2° разрешима задача
преследования при r-кратной поимке убегающего, если
О slot
Ни
I CO {г^— Mt
J€(l..m}
—Mt };
для позиции z° разрешима задача уклонения от r-кратной поимки,
если
Oelnt fl eo{zp. — Milt ..., z? — Mi }.
............J1 l^f
На рис. 3.1.8 изображен случай m=5, r=2, P — строго выпуклое
тело в R2. Для позиции z°= (zi°, ..., z5°) разрешима задача о дву-
кратной поимке убегающего, если внутренность множества ABCD
содержит начало координат.
Рис. 3.1.9
Если Р — треугольник в R2, г=2, т=5, то согласно утвержде-
нию 1.3 строим три конуса W(vo), где о0 — вершины треугольни-
ка Р (рис. 3.1.9). Если хотя бы один из них пересекается меньше
чем с двумя множествами из семейства z®—Mi, t==l, .т, то
3 Н Л. Григоренко
65
для позиции 2° разрешима задача уклонения от r-кратной поим-
ки. Если в каждом из этих конусов есть точки не менее чем двух
множеств из семейства zt°—Mt, i=l, т, то для позиции г°
разрешима задача r-кратной поимки убегающего. На рис. 3.1 9
такой случай.
Замечание. Заметим, что по определению r-кратной поимки
г встреч разных преследователей с убегающим происходят в об-
щем случае в разные моменты времени.
6. Построение стратегии убегающего, обеспечивающей его од-
новременную поимку всеми преследователями. Анализируя ре-
зультат, гарантируемый теоремой 1.1, можно заметить, что при
большом количестве преследователей в процессе преследования
часть их может оказаться лишней, если нас интересует только ре-
шение задачи качества, т. е. обеспечение поимки, и не интересует
вопрос о минимизации времени поимки. Для лишних игроков воз-
можно перенацеливание. Следующая теорема 1 3 показывает, что
в случае выполнимости в позиции 2° для дифференциальной игры
(1.3) условия а) теоремы 1.1 убегающий может организовать
свое управление таким образом, что он будет «стягивать» на себя
определенное количество убегающих.
Рассмотрим дифференциальную игру преследования (1.3)
в случае Л4г={0} czRn, P=5i"(0). Пусть преследователи могут ис-
пользовать стратегии вида Ui(t) = Ul(t, z(s), v(s), а убе-
гающий — позиционные стратегии v(t) = V(t, z(t)) (см. гл. 2).
Заметим, что в этом случае условие 6(z°, п+1)>0 эквивалентно
условию
Ое intco{z°, ..., z°+1). (1.11)
Теорема 1.3. Для любого удовлетворяющего (1.11), и
для любых допустимых управлений преследователей, гарантирую-
щих окончание игры, существует позиционное управление убегаю-
щего, при котором в момент окончания игры его ловят не менее-
чем п+1 преследователей, т. е. если Т — момент окончания игры,
то zt(T)=0, i~ 1, ..., п+1, и zt(t)¥=Q для всех i и 2s [О, 71).
Доказательство. Зафиксируем произвольную числовую после-
довательность /=1, 2, ..., /,>0, /у->0 при /—>-оо. Опишем ре-
куррентный процесс выбора управления убегающего для каждого /?.
Возьмем /х. По условию задачи zt (0) =/= 0 для всех I. Если для всех
п + 1 номеров i справедливо включение zt (0) е Sz, (0), то переходим
к следующему числу /2. В противном случае для номеров z\, .., ik,
&<п + 1, выполнено включение гг (0) е Sz, (0), £=1, . .., k. Выберем
tz(s) = Oi, ||щ||=1, (щ, г°)<0, 2=1, ..., 1, ц1+1, ..., in+\, (fx,
’П1Ё={21, 4} для s е [0, 2Д, где момент определяется
соотношениями z( ОД s Sti (0), z, (s)£=Sy (0) при $<ДГ Это воз-
можно, так как условие {0} ge i nt со {<+(/), zn+i(2)} должно выпол-
няться для всех моментов времени t s [0, 7Д а по теореме отдели-
мости для любого «-мерного симплекса со^, . . ., zt j 0, z,^^, • ••
66
Zm-i} существует опорная гиперплоскость {г:(г, их)=0}, т. е.
(у1?^)^0, 1=1, .... Ль-ь Ц14-1> •••» zn+i, (У1, При таком
управлении v(s) ни один из преследователей с номерами г#=гТ11 убе-
гающего не ловит. Действительно, при v(t)—vt —t»1Z4-5((0)=
=^Ai(t). Для расстояния от множества At(t) до начала координат
р(Л(0, 0)= \f ||z? ||2=2(z°, v^t-K2—t имеет место следующая оцен-
ка: р(Л(7), 0)>—(z°, t\). Если (z°, Ui)<0, то р(А(/), 0)>—(г?,
+)>0 и, следовательно, гг(^)=/=0 для всех t. 'Если (г9, ^ = 0, то,
используя явный вид функции р(ЛД/), 0), легко показать, что ни при
каком конечном t функция р(Лг(7), 0) не равна нулю.
Пусть tr—первый момент времени, когда преследующий игрок с но-
мером гТ)1 окажется в множестве Sit (0). Если найдется преследователь
с номером для которого ^(Z^TZS/, (0), то аналогично + выби-
раем о2: ||^|| = 1, (v2, ^0^0, Z=l, ..Z^-i, Z^+i, .... Zn+i,
(у2» ^ri2(^i))> О для s s [Zx, Z2], где момент t2 определяется соотноше-
нием (t2) e Sil (0), z» (s) ^SZ1 (0) при ^.s 'C t2. Выбирая далее
аналогичным образом управление у3, и т. д., убегающий соберет
в Sit (0) п+1 игроков, иначе он не будет пойман. Заметим, что на
протяжении этого процесса zI (£)=+() для всех игроков.
Повторим этот процесс для /2, /з и т. д. Выбранное управле-
ние убегания для любого // обеспечивает существование такого
момента времени /(//), что одновременно выполняется соотноше-
ние е S/. (0), 2j(s)=#0, i=l, п+1. (Мы счита-
ем, что управления преследователей таковы, что они стремятся
окончить игру, т. е. времена ti. конечны). Покажем, что такое
управление убегающего обеспечивает результат, сформулирован-
ный в теореме. Предположим противное: поимка состоялась, но
не все п+1 преследователи поймали убегающего, т. е. существует
момент времени Т, для которого z^(T)=0, £=1, ..., п—т, п—1>
>пг>1, причем для КТ выполнены условия + (Z)+0, 1=1, ...
.., п+1. Возьмем I <min {]|z?ft{Z)||, t <Т, k=n—m+ 1, ..., n + 1};
/>•0. Тогда при существуют номера i, для которых
z£(Z)eS/(0), например in-m+i, in+\, а при t>T существуют
номера Z, например i{, ..., i+, для которых z,(Z)=O. Таким обра-
зом, v(t) таково, что существует такое />0, что для любого t
не выполняются одновременно условия Zj(Z)=+O и zt (t) eSz (0),
t==l, ..., п+1. Это противоречит выбору управления и(-). Теоре-
ма доказана.
§ 2. Простое преследование — убегание на компакте.
Метод преследования Р. П. Иванова
В этом параграфе рассмотрим задачу преследования—убегания
одного убегающего объекта и нескольких преследующих объектов
на ограниченном множестве в n-мерном пространстве, причем все
3*
67
объекты обладают простым движением" и одинаковыми динами-
ческими возможностями. Таким образом, единственное преимуще-
ство у преследующих — их количество. Однако число преследо-
вателей, которые могут поймать убегающего, в таких играх мень-
ше, чем аналогичное число в игре § 1. Наличие фазового огра-
ничения на позицию игроков при определенных управлениях пре-
следователей может создать «эффект лишнего преследователя».
Показано, что если количество преследующих не меньше п, то
игру можно закончить за конечное время, иначе убегающий иг-
рок может уклоняться от встречи бесконечно долго. Теорема
о разрешимости такого класса задач предложена Р. П. Ивано-
вым в работе [15].
1. Постановка задачи. Теорема убегания. Пусть уравнения
движения т преследователей и одного убегающего описываются
уравнениями
Xi^ui, i=l, ..., tn, jlw/IKl, y—v, ||y||^l, (2.1)
где Xi, tii, y, vE=Rn. Пусть далее в Rn задан связанный компакт
N, имеющий непустую внутренность, причем для всех моментов
времени £>0 должно выполняться фазовое ограничение: Xi^N,
i=l, ..., tn, y^N. Игра считается оконченной в момент времени
Т, если для некоторого i, xt(T)=y{T). Будем предпола-
гать, что в момент времени t всем игрокам известны позиции
Xi(0, #(0> а преследующим — и измеримая функция ц(т) при
На основе этой информации требуется найти такие уп-
равления игроков, являющиеся измеримыми функциями t для'
любых абсолютно непрерывных траекторий Xi(i), y(f), которые
в задаче убегания обеспечивают уклонение убегающего от ветре-]
чи с преследующими при всех t^Q и при любых управлениях!
преследователей, измеримым образом зависящих от t, а в зада-
че преследования обеспечивают окончание игры за конечное
время при любом измеримом управлении убегающего.
Определение. Позиционной, кусочно-постоянной стратегией
убегающего назовем такую функцию v(xx(t), x2(t), ..., xm(t),
y(t)), что v(xx(r), .... xm(T), y(x) )=U(X1 (tj), .... Xm(tj), y(tj))
при где 0=^</2< .. • <t,< ... и lim t}= + oo.
/_><»
Отметим, что позиционная кусочно-постоянная стратегия убе-
гающего как функция t измерима по t и у уравнения (2.1) су-
ществует единственное нелокально продолжаемое решение в клас-
се абсолютно непрерывных функций.
Теорема 2.1. Если т<п и xoe!ntJV, то у убегающего игрока
существует позиционная кусочно-постоянная стратегия, которая
гарантирует ему уклонение от встречи с преследующими при
/>0.
Доказательство. Поскольку в начальный момент време-
ни все расстояния от преследующих до убегающего строго поло-
жительны, то, не ограничивая общности доказательства, можно
считать, что у (0) принадлежит внутренности компакта N. Возь-
68
мем такой шар Sr(z) в N, который содержит у(0) в качестве
внутренней точки. Пусть е — минимальное расстояние от у(0)
до границы шара 5г(г) (здесь z — центр шара, г — его ра-
диус). Определим индуктивно позиционную кусочно-постоянную
стратегию убегающего:
i>(Xi(t), ... , хт(т), г/(т))={у7: г s [th 0+i], 0+i=0 + e/(/+l),
/=1, 2, ..., 0=0, (vf, y(j)—xk(j))=O, k=l, ..., m,
(z-y(j), 17) >0, ||и/1| = 1}. (2.2)
Управление (2.2) — единичный вектор ортогональный к плоскос-
ти, содержащей точки г/(/), хДД, ..., xm(f) и направленный
в сторону полупространства, содержащего центр z шара Sr(z).
Такой вектор существует, так как т<п. Покажем, что, применяя
управление (2.2), убегающий избежит поимки, находясь внутри
X. Для этого докажем два вспомогательных утверждения.
Утверждение 2.1. При применении убегающим управления
(2.2) на отрезке (О, O'+i] ни один из преследователей убегающего
не ловит.
Доказательство. В условиях утверждения 1 для /е
€=[//, О+i] имеем y(t)=y(tj) xk(i)^xk(tj) +5(Ж/)(0),
l^Z^m. Следовательно, для расстояния от y(t) до области дос-
тижимости &-го преследователя в момент времени t справедлива
оценка
р(1/(1), 5<(_(?(хЛО)=1Ц(0-^Ю11-а-М=
=и(.о-хио+ч(‘-!/))-V-iг=
= /||z/«/)-xft(Z/)||2 + ((-//)2 + 2(y((/)-xft(i,), ViHt-t/) -
Так как 1/(1/)=^ xk(t/) для k=l.m, то nty(i), SV-i(xk(t,)))>0
для 0+i], £=1, ..., rn, что доказывает утверждение 2.1.
Утверждение 2. 2. При применении убегающим управления
(2.2) на отрезке [tj, 0+i], y(t)^lntN при 0+ib
Доказательство. Если в момент О
II */(/)—II 8//, (2.3)
то в момент 0+1 в силу выбора управления (2.2) и неравенств
е<г, /^1 имеем
\\y(j+ = + =
= VII!/(/)—z||2 + («/+i — /,.)2 + 2(у(й—г, о,.)(/;+1—
< V(r-e//)2 + e2/(j + l)2Cr-e/(j + Ч-
69
Так как при /=1 неравенство (2.3) выполнено, то неравенство
(2.3) выполнено для всех />1. Утверждение 2.2 доказано.
Следовательно, для [/у, :
а) точка y(t) оказывается не менее чем на расстоянии
е/(/+1) от границы шара Sr(z) и таким образом из этого шара
y(t) не выходит, т. е. остается в IV;
б) если xk=^у(tj), /г=1, ..., т, то Xk(t)^y(t) для /е
е Vi, ^/+1] Так как
/-1 у-i }
limG=lim S ,&+i— Q>elimУ}—7 = oo>
j—>oo j-+<X> вМ /->OO ЛяЛ s -ф- 1
S—1 S=i
то за конечное время ни один из преследователей убегающего не
поймает. Теорема доказана.
2. Теорема преследования. Следующая теорема дает условие
разрешимости задачи преследования на выпуклом компакте в Rn.
Теорема 2.2. Пусть на выпуклом компакте NczRn задана
игра (2.1) с п преследующими и одним убегающим объектами.
Тогда преследователи могут окончить игру за время не более
О(п3).
Для доказательства теоремы 2.2 рассмотрим вспомогательные
утверждения. Пусть N — единичный куб в первом ортанте, ei,
1=1, п, — единичные координатные векторы.
Утверждение 2.3. Пусть на п-мерном единичном кубе /V
задана игра преследования (2.1) с такой начальной позицией, что
(г/(0)—хДО), еО=||г/(0)—xf(0)||, г = 1, п, т=п.
Тогда преследователи могут окончить игру не позже, чем за время
Т=п.
Доказательство. Определим управление преследователей
следующим образом:
e/)=(v, еЦ, (щ, ег)>0, = /#=/, 1 (2.4)
Заметим, что* компоненты вектора щ, найденного согласно (2.4)
для j¥=i, повторяют компоненты и; для j—i они таковы, что точки
Xi(t), yV) не удаляются друг от друга, если (v, е,)^0, и сбли-
жаются, если (у, ег)<0. Ясно, что если о(/) — измеримая по t
функция, то иц /=1, п, — измеримые по t функции. Введем
вспомогательный параллелепипед П(t) ={w<^Rri : (w, y(t)~~
—xk(t))^0, k=l, ..., n, находящийся внутри единич-
ного куба /V, грани которого параллельны граням куба, ребра
проходят через точки xk(t), внутри которого находится убегаю-
щий y(t). При использовании преследователями управлений (2.4)
при выходе точки у(Т) на границу П(0 либо существует i, для
которого (у(/)—хг(0, е£)=0, откуда следует у(Т) =Х; (/), так как
(#(0—=0, для всех />0 в силу выбора начального
условия игры, либо y(t) находится на границе фазового ограни-
чения jV. С течением времени t «объем» П(0 убывает, само мно-
70
жество, если убегающий к тому моменту еще не пойман, стягива-
ется в точку за конечное время, а это означает поимку убегаю-
щего. Оценим время стягивания П(/) в точку. Обозначим
п
2=У (%i, Это вершина параллелепипеда П, в котором на-
г=1
ходится убегающий y(t). Дифференцируя z, в силу системы (2.1)
п
получаем ? = У (пь ег)е£. Отсюда с учетом (2.4) имеем
Z=i
п п
!И12=£ (ui< ед2=У [(«;> ег)2 + ^(ць е/)а—£(ub е7)2].
i=l /=^=i
Сумма первых двух слагаемых по определению нормы вектора
есть У || «Л2, третье слагаемое в силу (2.4) равно — ЕЕ (и, е,-)2.
г = 1 i=l /=#1
п
Прибавляя и вычитая У (о, ef)2, получаем, что третье слагаемое
/=1
равно — (ft—1)1Н2. Таким образом, так как ||щ|| = 1, ||z|[2=ft—
— («— 1) ||у||2>1. Поскольку
п
(г, ^) = (У (uh ej)eh e^==(uiy ег)>0, (2.5)
/=i
ТО
п м п
У ^МЙ||| ||c°s (4 >1 = 1. (2.6)
i=l i=l i=i
Так как zeN и в силу (2.5), (2.6) справедливы неравенства
п п Т п
i—1 з=1 0 1—1
п п п
(z(T), £>,) = ||г(Т)|1 i|E^||cos (ЛП. £ V" =«.
i=l i=l г=1
то не позже чем за время Т=п, множество П(0 стянется в точ*
ку, т. е. игра закончится.
В случае простого преследования на кубе N маневром вдоль
координатных осей можно добиться, чтобы хотя бы одна из коор-
динат преследующего Xi, Ictcft, совпала с соответствующей ко-
°рдинатой убегающего. Не ограничивая общности конструкции,
будем считать, что преследующий с номером i только в послед-'
нк>ю очередь добьется равенства с i-й координатой убегающего.
Для описанного выше маневра потребуется время, не большее
71
единицы. В следующем утверждении мы приведем обоснование
возможности таких маневров.
Утверждение 2.4. Пусть в п-мерном единичном кубе зада-
на игра преследования (2.1), для которой выполнены соотноше-
ния
(xit es.)=(yt es.), U St с {1, • •, п} \ i,
(Xi—y, ер.)<0, Pi и s£, ^п, ш=п.
(2-7)
Тогда существуют такие управления для преследующих, когда
либо игра_ окончится за конечное время, либо для некоторого i
и rp^i, ri^\)Si, будем иметь (xt, еГ[) = (у, ен), сохраняя
равенства (2.7), причем гарантированное время не больше п.
Доказательство. Определим стратегии преследующих
игроков следующим образом:
es.)=(v, es.), (щ, er.)^0, ||w£|| = l,
(ui> — 0» Pi r~~ U Si, Г; I j 8;,
(2.8)
п
Ti=^i при Ua¥=0, s£, pi, г^п. Рассмотрим z= £ (х£, е )е ,
i=i
п
Дифференцируя, в силу системы (2.1) получим z==^T(u£> ег)ег.. За*
г=1
метим, что (г, ец^О, 1^/ С" и. Далее с учетом-(2.8) получаем
п п
11г112== Г(“ь ^)2= £[(«<> Е (иь £ («ц «7)3]>
г=Н г=1 /¥=г£
п п
i=l Ь=1/=#г£
Имеем
п п Т п
У>£) = (г(0), £ef) + j(z(T), £е£рт>Т.
i=l i=l 0 i=l
Следовательно, не позже чем за время п, либо игра закончится,
либо (хг, ег.)~(у, ег.) для некоторого i, Утверждение 2.4
доказано.
Утверждение 2.5. Пусть на единичном кубе N<^Rn задана
игра преследования (2.1) с одним убегающим и п преследовате-
лями. Тогда игру преследования можно закончить за конечное
время, причем гарантированное время Т не больше п3—2п2 + п+1.
72
Справедливость утверждения 2.5 непосредственно следует из
утверждений 2.3 и 2.4. Остановимся более подробно на оценке
гарантированного времени. Согласно утверждению 2.4, чтобы до-
вести позиции игроков до начальной позиции из утверждения
2.3, требуется время п для каждой свободной координаты каж-
дого из преследующих. Количество преследующих равно п, и
каждый из них может иметь не более п—2 свободных координат
после вышеописанного маневра. Отсюда получаем часть оценки,
а именно п2(п—2). Теперь с учетом оценки из утверждения 2.3 и
оценки выше описанного маневра получаем, что гарантированное
время —2п2 + п+1. Перейдем к доказательству теоремы 2.2.
Поскольку множество # — компакт, то будем предполагать, что
оно содержится в некотором кубе, в частности, можно считать,
что длина ребра куба не больше диаметра множества N. Введем
ФИКТИВНЫХ ИГРОКОВ Xi, i—1, ..., П, у, ДЛЯ КОТОРЫХ Xi=Ui, Х/(0) =
=Х/(0), i=l, ..., п, y=v, у(О)=у(О).
Рассмотрим игру, аналогичную игре (2.1) (т. е. с такими же
ограничениями на управление и условием окончания), для фик-
тивных преследующих Xi, !=1, ..., п, и убегающего у на кубе.
Согласно утверждению 2.5 фиктивные преследующие могут за-
кончить игру за конечное время, причем гарантированное время
не больше d- (п3—2п2+п+1), где d — длина ребра куба. Пусть
Hi, г=1, ..., п, — стратегии игроков xi, i=l, п, обеспечиваю-
щих окончание игры за конечное время. С помощью этих страте-
гий определим стратегии для игроков Xt, i=l, ..., п, таким обра-
зом, чтобы всегда выполнялось равенство PN(xi)=Xi; здесь
Pn{xi) — проекция точки xi на множество, т. е. П^ЪуС*^)—Xt |f =
= min ||у—%j||. Известно, что такая проекция единственна и ото-
BQN
бражает абсолютно непрерывную по t функцию xt в абсолютно не-
прерывную по t функцию PN(xi), t=l, ..., п. Следовательно, опи-
санные стратегии Ui, i=l, ..., п, являются измеримыми по t.
Поскольку оператор Рх(-) — сжимающий, т. е. ||Лу(х) —
—Av(y) IKIIx—у||, то из неравенства ||щ||<1 следует неравенство
llw/IKl. Итак, для каждого управления убегающего с помощью
оператора Рдг(-) мы определили измеримую по t функцию, для
которой ПОЧТИ всюду выполнено ||Ui||^l, f=l, п. Из оценки
на кубе следует оценка для гарантированного времени встречи,
а именно О(п3). Теорема 2.2 доказана.
§ 3. Задача уклонения от многих преследователей.
Метод уклонения Ф. Л. Черноусько
Ниже рассматривается уклонение безынерционной управля-
емой точки, скорость которой ограничена по величине, от встречи
с любым числом безынерционных преследующих точек, скорости
которых также ограничены по величине и строго меньше скорости
уклоняющейся точки. Построен такой способ управления, который
73
обеспечивает уклонение от всех преследователей на конечное
расстояние, причем движение уклоняющейся точки остается
в фиксированной окрестности заданного прямолинейного движе-
ния.
Выясняются требования, которые нужно наложить на инфор-
мированность преследуемого для реализации уклонения.
Предлагаемый способ уклонения основан на некоторой много-
шаговой рекуррентной процедуре. При изложении материала мы
следуем работе Ф. Л. Черноусько [78].
1. Постановка задачи. Уклонение от одного преследователя.
а) Постановка задачи. Рассмотрим движение одной безынерци-
онной уклоняющейся точки Е и п преследующих безынерционных
точек Р], ..., Рп в m-мерном пространстве, т>1. Скорости всех
точек могут произвольно изменяться по направлению и ограни-
чены по величине постоянными. Скорость точки Е не превосходит
константы v, а скорости всех преследователей Pi,, Рп не пре-
восходят kv, где k — постоянная, 0<&<1.
Таким образом, уравнения движения точек и ограничения
можно записать в виде
r=u, ri=vt, i=l.....п.
Здесь г — радиус-вектор точки £; rt — радиус-вектор точки Pt\
и — вектор скорости точки Е', — вектор скорости точки Pt.
В начальный момент времени t=to точка Е занимает положе-
ние Ео, не совпадающее ни с одной из точек ..., Рп. Заданы
луч х, проходящий через точку Бо, и число &>0. Движение точки
Е по лучу х со скоростью v будем называть номинальным. Tpe-S
буется построить способ управления точкой Е, при котором эта <
точка будет при всех находиться на ненулевом расстоянииj
от всех преследователей Pi, ..., Рп, оставаясь при этом в задан-
ной окрестности номинального движения. Сначала предполагает-
ся, что вектор скорости точки Е в каждый момент времени t
может выбираться в зависимости от положения точек Е, Рь ...
..., Рп на интервале [/0, И, а также от констант о, k, г и луча х
Для искомого способа управления требуется также оценить ми-
нимальное расстояние 6 от точки Е до точек Pi, ..., Рп при
t^tQ, т. е. величину б= min min£'Pi.
Ниже будет построен способ управления, решающий постав-
ленную задачу, и оценена для него величина б. Траектория точки
Е при этом состоит из конечного числа дуг гладких кривых (ло-
гарифмических спиралей и отрезков луча х), а при достаточно
больших t совпадает с лучом х. Для реализации движения дос-
таточно знать положения точек Рь ..., Рп лишь в те моменты
времени, когда они приближаются к точке Е на определенные
расстояния.
Таким образом, будет выяснено, что преследуемый Е не обя-
зательно должен располагать полной информацией о фазовые
74
векторах всех преследователей во все моменты времени. Более
того, он может даже не знать общего числа преследователей п.
Следуя традиции теории дифференциальных игр, дадим рас-
сматриваемой задаче название «олень и стая волков». «Олень»,
пользуясь преимуществом в скорости, может уклоняться на конеч-
ное расстояние от любого числа «волков», оставаясь в пределах
некоторой окрестности заданного номинального движения (в не-
котором коридоре). При этом «волки» могут как угодно «коопе-
рироваться»: договариваться между собой, устраивать засады,
поджидать «оленя» в какой-то точке сразу по нескольку штук
и т. д. «Олень», как выясняется, не нуждается даже в полной
информации о положении «волков» и об их числе для реализации
уклонения.
Отметим, что предлагаемый способ уклонения отнюдь не яв-
ляется оптимальным или единственно возможным.
Без нарушения общности можно считать, что т=2, т. е. что
движение происходит в плоскости. В самом деле, при т>2 выбе-
рем произвольную плоскость П, проходящую через луч х и такую,
что ни для одной из точек Pi ее проекция на эту плоскость П
не совпадает в начальный момент to с точкой Ео. В силу конеч-
ности числа п такую плоскость П выбрать можно. Далее будем
считать, что точка Е движется в этой плоскости, уклоняясь от
проекций точек Д, ..., Рп на эту плоскость. Скорости проекций,
очевидно, не превосходят kv. Если эта задача уклонения от про-
екций точек Pi будет решена, то тем самым будет решена и ис-
ходная задача уклонения от самих точек Pi для т>2. Поэтому
ниже полагаем т—2.
б) Уклонение от одной точки. Построим сначала маневр укло-
нения точки Е от одной преследующей точки Р, при котором для
всех t^t0 выполнено неравенство EP^L. Здесь L>0 — заданное
число, не .превосходящее расстояния ЕР в момент Д Движение
точки Е зададим состоящим из трех участков; первый и второй
участки могут быть, в частности, и нулевой длины. Скорость точ-
ки Е на всех участках полагается постоянной по величине и рав-
ной V.
На первом участке [Д О] точка Е движется по лучу х от на-
чальной точки Ео до такой точки А, в которой впервые выполня-
ется равенство EP=L. На втором участке [Д, /в] точка движется
по дуге некоторой кривой ДД концы которой лежат на луче х,
а на третьем участке сю) — снова по лучу х от точки В до
оо. На рис. 3.3-.1 траектория точки Е показана жирной линией.
Найдем кривую АВ из условия, что неравенство EP^L выпол-
нено даже при отсутствии измерений положения точки Р при
t>tA. Обозначим через Q положение точки Р в момент через
а — угол между лучом х и отрезком причем через
₽ — текущее расстояние QE от фиксированной точки Q до дви-
жущейся точки £; через ф — текущий угол между отрезками QE
и QA; через s — длину дуги кривой АЕ, отсчитанную от точки А
(см. рис. 3.3.1).
75
Рис. 3.3.1
По неравенству треугольника имеем EP^QE—QP=R—QP.
Так как скорость точки Р не превосходит kv, то имеем
^.kv(t—£д). Следовательно,
EPZ^QE—kv(t—tA)~R—ks. (3.1)
Здесь использовано очевидное равенство s—v(i—£4) для пути,
пройденного точкой Е.
Условие EP^L на дуге АВ будет выполнено, если положить
в (3.1)
R— ks=L. (3.2)
Дифференцируя (3.2), получим в полярных координатах
dR = kds=k(dR2-^R2d^)}/2. (3.3)
Интегрируя дифференциальное уравнение (3.3) для функции
/?(ср) при начальном условии 7^(0) =L в момент t=tA, найдем за-
висимость
Д(ср)-£а\ (3.1)
Здесь и далее используются обозначения для постоянных X, у:
%=fe(l — /^-^ctg-y, fe=X(l+XarI/2=cosy, 0<у<л/2. (3.5)
Обозначим через ф угол между отрезком XQ и касательной
к логарифмической спирали, проведенной в точке А в сторону
возрастания дуги У Нетрудно показать, что cos ф==—dRIds——k.
Здесь использовано равенство (3.3). Привлекая еще соотно-
шения (3.5), получим, что ф=л—у, причем угол ф лежит в ин-
тервале фе (л/2, л). В зависимости от значений ае[0, л] могут
представиться два случая.
1) Если ф=л—у^а^л, то спираль (3.3) для ср>0 в окрест-
ности точки А лежит по ту же сторону от луча х, что и точка Q.
В этом случае будем полагать В=Л, дуга АВ стягивается в точку.
Второй участок движения при этом отсутствует, и точка Е все
76
бремя равномерно движется по лучу х со скоростью v. При этом
угол p=ZQBx равен а и лежит в пределах [л—у, л].
2) В случае 0^а<л—у спираль АВ пересекается с лучом х
в точке В, как показано на рис. 3.3.1. Угол ср в точке В равен
р—а, где fr=ZQBx. Высота треугольника QAB, подсчитанная
двумя разными способами согласно рис. 3.3.1, равна CMsina=
^QB sin р. Подставим в это равенство OA=L и соотношение
QB=LexpX(P—а), вытекающее из (3.4) при <р=р—а. Тогда по-
лучим трансцендентное уравнение для определения угла р:
f(P)=f(a), f (р)=е^₽ sin р, ос<р<л. (3.6)
Функция f(b) из (3.6) обращается в нуль на концах интерва-
ла [Д л] и, как показывает элементарное исследование, моно-
тонно возрастает на интервале [0, л—у] и монотонно убывает на
интервале [л—у, л]. Отсюда следует, что при любом ае(0,л—у),
т. е. в рассматриваемом случае 2), уравнение (3.6) имеет в ин-
тервале [а, л] единственное решение р, лежащее в пределах р^
е(л—у, л).
Таким образом, в обоих случаях, т. е. при любом ае [0, л],
существует единственное значение угла р, причем имеем с учетом
обозначений (3.5)
л—у^Р^л, cos —k. (3.7)
Для описанного маневра уклонения на первых двух участках
До^^в) неравенство EP'^L выполнено по построению.
Рассмотрим теперь движение точки Е на третьем участке,
т. е. при t>tB. Радиус-вектор QE точки Е для этого участка по-
казан на рис. 3.3.1 пунктиром. Для произвольного момента t
третьего участка, t>tB, имеем
ЕР > QE—kv (t — tA)=(QB2 + ЕВ2 — 2EB • QB cos P)1 /2—
—kv (t—tB)—kv(tB—tA) (QB—EB (k + cos P))—ksAB. (3.8)
Здесь использованы геометрические соотношения, аналогич-
ные (3.1) и вытекающие из рис. 3.3.1. Длина sab дуги АВ сог-
ласно (3.2) равна k~l(QB—L). Используя еще неравенство (3.7),
получим из (3.8), что EP^L—£B(fe-!-cos p)^L.
Итак, построенный маневр обеспечивает неравенство EP^L
При всех t^tQ.
2. Маневр уклонения от многих преследователей, а) Постро-
ение программной траектории. В данном пункте на основе манев-
ра п. 1, б) строится способ уклонения от п преследователей. Обо-
значим через б0 минимальное из расстояний ЕРХ . .., ЕРп в момент
^о; по условию 50>0. Движение точки Е будет зависеть от пара-
метров L и х, таких, что 0<А^бо, 0<х<1. Эти параметры будут
выбраны ниже. Введем обозначение Lj=LZ~x и назовем момен-
77
том /-го сближения такой момент tj, когда впервые после начала
движения выполняется условие
minEP^L/^Lx^1, t = l, ..., п; /=1, 2, 0<х<1. (3.9)
I
Движение точки Е зададим следующим образом: в каждый
момент времени t точка Е движется с постоянной по величине
скоростью v по программной траектории для данного момента t.
Определим понятие программной траектории для каждого мо-
мента t^to. Для любого текущая программная траектория
представляет собой ориентированную кусочно-гладкую кривую
без самопересечений, начинающуюся в точке текущего положения
Е в момент t и уходящую на бесконечность вдоль луча х. При
t=t0 программная траектория есть луч х. На интервалах tj<t<
<7/+1, /=0, 1, начало программной траектории перемещается
вдоль нее вместе с точкой Е; в остальном программная траекто-
рия на этих интервалах не меняется.
В моменты сближений /у, /=1, 2, программная траектория
перестраивается следующим образом. Обозначим через А/, Qr
соответственно положения в момент tj точки Е и той из точек Pi,
для которой достигается минимум в соотношении (3.9). Если ми-
нимум (3.9) при t=tj достигается одновременно для нескольких
точек то в качестве Q/ берем для определенности ту из них,
у которой номер i меньше. Проведем две Ly-спирали, уравнения
которых имеют вид, аналогичный (3.4):
/?/ = L/exp(A.<p/), О^ф/^л, /=1, 2, .... (3.10)
Здесь Rj — текущее расстояние от точки Q/; ф/ — полярный
угол, отсчитываемый от прямой в двух противоположных на-
правлениях для двух рассматриваемых спиралей. Дуги Е/-спира-
лей (3.10) зеркально-симметричны друг другу относительно от-
резка QjAj и имеют общие концы при ф/=0 и <р/=л.
Пусть программная траектория при t=tj—0 построена; она
начинается в точке Д/. Если программная траектория для t=tj—0
не имеет с построенными Ly-спиралями (3.10) других общих то-
чек, кроме А/, то программная траектория для t=tj + O будет
той же, что и для t=tj—0. В этом случае программная траекто-
рия в момент tj не перестраивается.
В противном случае обозначим через В} точку первого после
А}- пересечения программной траектории, отвечающей моменту
времени tj—0, с замкнутой кривой, образованной дугами Еу-спи-
ралей (3.10). Программной траекторией, отвечающей /=/у + 0,
будет кривая, составленная из дуги AjBj той из Ly-спиралей, ко-
торая содержит точку В], и из оставшейся части программной
траектории для tj—O, начиная с точки В;.
Перестройка программной траектории изображена схематичес-
ки на рис. 3.3.2.
Описанный процесс рекуррентным образом определяет прог-,
раммную траекторию для любого момента времени i^t0 при
78
любом конечном числе сближений. При tj+i) программная
траектория по построению состоит из дуг L/, L/-i, ..., Li-спира-
лей, соединенных в порядке уменьшения индекса, и из части луча
х, включающей бесконечно удаленную точку. Дуги всех спиралей
отвечают полярным углам 0^ф<Сл, а некоторые дуги могут от-
сутствовать. Построение программной траектории в любой момент
времени полностью определяет и способ управления точкой Е.
Реальная траектория точки Е будет состоять из дуг /./-спиралей
и из части луча х, и для ее осуществления достаточно измерять
положение точек Pi лишь в моменты сближений. Для полного
определения способа управления точкой Е осталось выбрать пара-
метры L, х так, чтобы обеспечить конечность числа сближений
и уклонение точки Е от всех преследователей Pit ..., Рп при
сохранении ее движения в g-окрестности номинального движения.
Предварительно проведем оценки некоторых расстояний, сущест-
венные для дальнейшего.
б) Оценка расстояний. Пусть непосредственно перед /-м сбли-
жением (t—tj—0), программная траектория начинается
с дуги некоторой £р-спирали, где —1, имеющей ненулевую
длину, за которой следует ненулевая дуга /.^-спирали, где
<р—1. На рис. 3.3.2 изображена дуга АРВР Lp-спирали с полюсом
Qp и дуги двух Д-спиралей с полюсом Q/. В результате построе-
ний п. 1 получена программная траектория для момента t=tj + Q,
участок которой AjBjBp изображен на рис. 3.3,2 жирной линией
со стрелками. Оценим при tZ^tj расстояние EPi от движущейся
точки Е до той точки Pi, с которой произошло j-е сближение.
Предположим сначала, что очередное (/+ 1)-е сближение не нас-
тупает, пока точка Е движется по участку AjBjBp программной
траектории.
На дуге Л/В/Ау-спирали имеем EP^Li согласно свойству ло-
гарифмической спирали (см. п. 1, б). Оценим двумя способами
расстояние EPi при движении точки Е по дуге BjBp.
79
Введем в рассмотрение точку Е', движущуюся с постоянной
скоростью v по прямой AjBj от точки Bj в сторону, противопо-
ложную Aj. При этом пусть точка Е' находится в В; в тот же
момент t', что и точка Е. Применяя к точкам Е' и Pi рассужде-
ния, приведенные в п. 1 б) для точек Е и Р, получим, что Е'Р^
при . Согласно неравенству треугольника имеем
EP^E'Pi—EE'^Lj—EE', (3.11)
Поскольку точки Е и Е' имеют одинаковую по величине скорость
v и совпадают в момент t', имеем оценку расстояния между ними:
t
ЕЕ'~ |y^[e(Z)—(3.12)
t'
Здесь е' — орт прямой Л/L/j e(t) — орт касательной к дуге
BjBp Lp-спирали. Обозначим через s текущую длину дуги кривой
BjBp, отсчитанную от точки Bj. Получим
t S
|е(0—е'| = Ь(/')—е'4-f—|е?(Г)—е'| + f | — Ids. (3.13)
J d/ J Ids
1 ? 1 д' * ।
Орт e' секущей А/В/ равен орту касательной в некоторой про-
межуточной точке D дуги Lp-спирали, лежащей между Aj и В,.
Эта дуга показана тонкой линией на рис. 3.3.2. Обозначая через
s' длину дуги Lp-спирали от этой промежуточной точки D до
точки Bj, получим из (3.13) оценку
|е(0—— |ds + f I —Ids <•_£+< . (3.14)
J I ds I J I ds | p0 p0
о о
Здесь использовано неравенство | cZe/ds | ^Zpo1, где ро — ми-
нимальный радиус кривизны Lp-спирали, а через s" обозначена
длина дуги Л/В/ этой спирали. Радиус кривизны Lp-спирали, оп-
ределяемой уравнением (3.10), равен
P=(R2 + 4)3/2(Л2 + 2^-RSw)-' = L„(V + 1),/2гИ. (3.15)
Здесь индексы <р означают дифференцирование по фр, а индекс р
у величин R, ф опущен.
Минимальное при ф^О значение радиуса кривизны (3.15)
равно
p0=L,/^+T (3.16)
Длину s" дуги AjBj Lp-спирали оценим при помощи соотношения
(3.12) для Lp-спирали и дважды применяемого неравенства тре-
угольника:
®"=ад-еЛ)*“‘ < W' «QA + Q/A)*-1 (^-+1).
(3.17)
80
Последнее неравенство (3.17) следует из соотношений
Q,Aj=Lf, (3.18)
вытекающих из (3.10).
Подставляя неравенство (3.14) в (3.12) и интегрируя, получим
ЕЕ'с fA±£-rfs^s2 + 2ss'i, (3.19)
J Ро 2р0 v '
о
Подставляя в неравенство (3.11) оценки (3.19), (3.16), (3.17)
и пользуясь обозначениями (3.5), найдем
EPi>Lj—E^a^s2—LfL^xazs, s^O,
(3.20)
аг= 1/2 (Х2 +1)~1/2, a2=%~1 (eXn4-1).
Для оценки расстояния EPt другим способом отметим, что
в момент сближения t=tj точка Pi занимает положение Q/, а ее
скорость не превосходит kv. Поэтому
EPt > QE-QjPi > (В,Е-Q^-kv (t-t.) > BjE-Lfi^—k (s,+ s).
(3.21)
Здесь дважды использовано неравенство треугольника для
оценки расстояний EPi и QjE, а также неравенство (3.18) для
Q/B, и оценка пути, пройденного точкой Р, : QjPi^.kv(t—tj).
Через Sj в соотношении (3.21) обозначена длина дуги AjBj
Ly-спирали, показанная жирной линией на рис. 3.3.2. Оценим ве-
личину Sj, учитывая равенство (3.2) и оценки (3.18):
Sj=k-1 (QjBj-QjAj) < Ljk-1 (е^-1). (3.22)
Обозначим для сокращения записи
R=QPE, Rt=QpBj, X = ^BjQpE^Q (3.23)
и отметим равенства
= + (3.24)
вытекающие из (3.10) и (3.2) для Lp-спирали (см. рис. 3.3.2).
Используя соотношения (3.23), (3.24), получим путем элементар-
ных преобразований
BfE=(R2 + Rl—2RR* cos х)1/г=
=(R-R J [1 +4 sin2 (X/2) Ж (Я—^)~T/2=
= ks[1 +4 sin3(X/2)eu(e« — ip2]1/2=
= fej[l 4-sin2 (X/2) sh~2 (XX/2)]1/2, (0<Х<^л). (3.25)
81
Легко проверить дифференцированием, что на интервале
функция sin (х/2) sh-1 (Х%/2) при любом %>0 монотонно
убывает, и поэтому ре минимум достигается при %=л. Тогда из
(3.25) найдем, полагай х=л:
BjE > ks [ 1 + sh—2 (Хл/2)]1 /2=ks cfh (Ал/2). (3.26)
Вставляя (3.22), (3.26) в неравенство (3.21) и используя обо-
значения (3.15), будем иметь оценку
EPi^a3s—a^Lf, s^O, (3.27)
а3=k )cth (M/2)—1]=2X (1 ГГ'‘.
ц4=2еХп—1 > 1.
Сопоставляя обе оценки (3.20), (3.27), получим в итоге
EPt > max [/i (s), f2(s)] > min max [A (s), f2(s)], (3.28;
s>0
fi (E)z== Lj—Ep o(s2 ~ EjLp f2 (s) == ctgS a4Ej.
Здесь положительные постоянные ab a2, йз, определены pa-,
венет вам и (3.20) и (3-27) и зависят только от одного безразмер-
ного параметра X, связанного с отношением скоростей — пара-
метром k — формулами (3.5). В соотношениях (3.28) функция
fits) строго убывает от значения /\(0)>0 до — оо, а функция
/2(а) строго возрастает от значения /2(0)<0 до + оо, когда s из-
меняется от 0 до оо. Поэтому минимум в (3.24) по s достигается
при таком значении s*>0, для которого имеют место соотношения
EPi>f2(sJ=L/p. (3.29)
Здесь р — безразмерная величина, введенная последним соот-
ношением (3.29). Из этого соотношения, используя выражение
для )2(s) из (3.28), получим
s* =Ef(a4 + p.) а~(3.30)
Подставим в первое уравнение (3.29) выражения (3.28) для
функций /), f2 и равенство (3.30) для s*. Полученное уравнение
разрешим относительно L/. Получим после указанных преобразо-
ваний
(3.31)
g (р)=aj (1 — И)/(а4 + р) (а4а4 + о2н3 + а^р).
Функция g(p) строго убывает на сегменте [0, 1], причем
g(l)=0. Следовательно, существует обратная функция g~\ не-
прерывная и строго убывающая на интервале [0, g (0) ]. Поэтому,
82
учитывая еще соотношения (3.9) и неравенства /—р^1, х<1,
получим из (3.31)
Н=йг~1 (*w) > g~l (х), 0 < х < g(0). (3.32}
Заметим, что из (3.31), (3.20), (3.27) следует цепочка неравенств
g (0) —а2а4 1 (й]й4 4~ аг^з) 1 2&i 1 £1з^1 1 =
= 8А2 (1 + КТ1 /2 — 1 Г2 < 8 [А/(е^ — 1 )]2 < 8л-2 < 1.
Поэтому неравенства (3.32) для х гарантируют выполнение также
и условия х<1. Подставляя (3.32) в (3.29), будем иметь
EP^L^Ljg-Цк). (3.33)
Итак, для любого х из интервала
0<x<g(0)<l (3.34)
справедлива оценка (3.33) при движении точки Е по дуге BjBp
Lp-спирали.
Из определения (3.31) функции g(p) следует, что g(1) =0,
поэтому для обратной функции получим g-I(0)=l. Функция
g-1 (х) строго убывает на сегменте [0, g (0) ], поэтому согласно
неравенствам (3.34) имеем
g~l (x)<g-1 (0)=1. (3.35)
На дуге AjBj Lj-спирали имеем неравенство EP^Lj согласно
свойству построенных спиралей. Следовательно, с учетом (3.35)
на этой дуге справедливо также и неравенство (3.33).
Таким образом, выполнение условий (3.34) гарантирует оцен-
ку (3.33) при движении точки Е от А, до ,ее выхода в точке Вр
на дугу Lp-спирали, q^p—1. Это утверждение справедливо, ко-
нечно, и в том случае, когда одна или обе дуги AjBj, BjBp ну-
левые.
Выше предполагалось, что при движении точки Е по участку
А]В;ВР не происходит очередного (/ + 1)-го сближения. Теперь
откажемся от этого предположения. Пусть точка Е после момен-
та tj испытывает еще сближения с точками ..., Рп, и v(0^
^0 — число этих сближений на интервале (tj, t). Через т обо-
значим такой момент времени, когда точка Е впервые после точки
Вр выходит на программную траекторию, соответствующую мо-
менту tj + Q. Другими словами, т — первый после tj момент вы-
хода точки Е на некоторую Д-спираль, где —1.
Рассмотрим точку £*, движущуюся со скоростью v по участку
AjBjBp программной траектории. Пусть точка £* в момент tj
совпадает с £ и приходит в точку Вр в момент т*. Тогда согласно
неравенству треугольника и полученной оценке (3.33), примени-
мой для точки Е*, имеем
EPi>EJ>t—ЕЕ* ^Ljg-' (х)—ЕЕ*, t/^t^r*. (3.36)
83
Оценим расстояние между точками Е и £*:
t
ЕЕ. = | $ [v(0—М<)]*|, :</<«<*.. (3.37)
Ч
Здесь v(f), у*(/) — векторы скорости точек Е, Е* соответственно,
равные по величине постоянной и. Для участков траектории точ-
ки Е, принадлежащих траектории точки £*, соответствующий
вклад в интеграл (3.37) равен нулю. Для остальных участков ин-
теграл (3.37) мажорируется удвоенной суммарной длиной этих
участков, т. е.
££*^22, (3.38)
Здесь 5 — сумма длин дуг £/+i, ..., £/+,-спиралей, по кото-
рым движется точка £, отклоняясь от траектории AjB,BP точки
£*. Эту сумму оценим при помощи неравенства (3.22) и формулы
(3.9):
2 S/H “bS)+2+ • • 4's;+v^ k 1 (eXn— 1) (^ж +^/4-2+ • • • +b/4-v) =
= (еКя— 1) х(1 -{-x4-x®4- ••• 4~xv~1) =
= £/£-1(^—1)х(1—х*)(1~х)Л (3.39
Если т^Ст*, то оценки (3.38), (3.39), справедливые на сегменте
[Zy, т*], верны также и на интервале [tj, т].Если же т>г*, то тре-
буется еще рассмотреть интервал /<= [т*, т]. Путь, пройденный
точкой £ за время [^, , где /е [т*, т], не более чем на сумму
дуг 2 превышает путь, пройденный точкой £* за время [t}, т*].
Скорости обеих точек £, £* по величине равны v. Поэтому за
время t~т* точка £ пройдет путь не более 3 и t—т*^2/п. За это
время расстояние EPt может уменьшиться не более чем на вели-
чину
о(1 + ^)(Ж-т,)^(1+^)2. (3.40)
Здесь учтено, что точки £ и Pt могут удаляться друг от друга
со скоростью, не большей, чем сумма их скоростей v(1+k). Вы-
читая величину (3.40) из правой части неравенства (3.36) и ис-
пользуя неравенства (3.36), (3.39), получим искомую оценку для
всего интервала:
ЕР, > Llg~' (х)--(З + k) 2 > L, [g-i (х)—
—(3k~' + !)(<"— 1)х(1 — х»)(1 —х)"'], (3.41)
Отметим, что из (3.39) вытекает ограниченность 2, а следова-
тельно, и т при v-^-oo.
84
в) Выбор параметров маневра. Перейдем к выбору парамет-
ров L, х, обеспечивающих решение задачи уклонения. Потребуем,
чтобы при всех целых v выполнялось неравенство
+1)(<ЛЛ—1)х(1—xv)(l—x)_,+xv+i. (3.42)
Из (3.41) при условии (3.42) следует EPi>L/+v+1 при всех
t Это означает, что среди v сближений, происходящих
в интервале (//, t), не наступит сближения с точкой Pi. Поэтому
при условии (3.42) на всем интервале (tj, т) не произойдет сбли-
жений с точкой Pi.
Условие (3.42) перепишем в виде
g-' (х)>&х — xv+* (&— 1),
6 = (3^~! + 1)(еХл—1)(1— х)—1. (3.43)
Оценим величину Ь, пользуясь формулами (3.5):
&>3&-1Хл>Зл> 1.
Поэтому неравенство (3.43) будет выполнено при всех v^O, если
оно выполнено при v=0. Подставляя v=0 в (3.43), получим ус-
ловие ^-1(х)>х. Учитывая монотонное убывание функции g, бу-
дем иметь отсюда неравенство g(x)<x. Последнее неравенство
означает
0<х<х*, (3.44)
где х* — единственный положительный корень уравнения
g(x*)=x*, 0<х*<1. (3.45)
Отметим, что в силу монотонности функции g’(x) имеем
g(x*)<g(0), поэтому согласно (3.45) будет х*<£(0). Следова-
тельно, выполнение условий (3.44), (3.45) обеспечивает также вы-
полнение условий (3.34), наложенных ранее.
Параметр х выбираем в дальнейшем из интервала (3.44).
При этом движение точки Е, описанное в п. 2, будет обладать
следующим свойством. Если /-е сближение произошло с точкой
Pi при движении точки Е по дуге Лр-спирали, —1, то следу-
ющее сближение с этой же точкой Pi может произойти не ранее,
чем после выхода точки Е на дугу £г-спирали, г^р—1. Это свой-
ство распространяется и на луч х, который можно считать Ло-спи-
ралью.
Пусть без нарушения общности точки Pi пронумерованы
в том порядке, в каком происходят их первые сближения с точ-
кой Е. Тогда первое сближение с точкой Pi происходит на луче
х, и согласно установленному свойству других сближений с этой
точкой не произойдет никогда. Первое сближение с точкой Р%
Может произойти либо на дуге £гспирали, либо на луче х после
85
схода с этой дуги. В первом случае повторное сближение с точ.
кой Р2 может произойти лишь после выхода на луч х, а во второе
случае его вообще не будет.
Оценим общее максимальное число сближений N (п) с п пре-
следователями. Из предыдущих рассуждений следует A(l)=sCl,
А (2)^3. На рис. 3.3.3 схематически, без соблюдения масштаба,
изображены типичные траектории точки Е при п=2 и 3, цифрами
указаны номера сближений. Покажем по индукции, что
ЛГ(п)^2«—1. (3.46)
При п=1, 2 неравенство (3.46) верно. Пусть оно верно для
некоторого п. Тогда в случае п+1 преследователей общее число
сближений можно оценить следующим образом. После первого
сближения с точкой Pi точка Е будет двигаться по £гспирали и
может сближаться с оставшимися п точками. До выхода на луч
х может произойти не более N (п) сближений с этими точками.
После выхода на луч х точку Pi можно не учитывать, так как
с ней больше не произойдет сближений, а с остальными точками
может произойти еще не более N (п) сближений. Таким образом,
с учетом (3.46) общее число сближений оценивается следующим
образом:
Л^п+^Т+ЛДпИЛДп)^^1—1,
и неравенство (3.46) доказано по индукции.
Оценим теперь расстояние между точкой Е и точкой Е°, совер-
шающей номинальное движение. Аналогично неравенствам
(3.37) — (3.39) получим
2 [s, + s,+ •. +зЛ(„)] < 2UT' (<**-1)(1 -«)“*. (3.47)
86
Движение точки Е должно лежать в е-окрестности номиналь-
ного движения, т. е. EEQ^e. Для этого согласно (3.47) достаточ-
но принять
0<L<min ^efe(l — х)(е*л— 1)“’, 60J . (3.48)
Здесь учтено также наложенное выше условие L^60.
Итак, параметры L, к следует выбирать в границах, указан-
ных неравенствами (3.44), (3.48). При этом маневр уклонения
из п. 1 будет удовлетворять всем наложенным условиям, а число
сближений будет конечным числом, удовлетворяющим неравенст-
ву (3.46).
Определение числа х* требует согласно (3.45), (3.31) решения
кубического уравнения. Получим простое явное выражение х—хо,
лежащее в пределах (3.44). Рассмотрим для этого наряду с функ-
цией g(p) из (3.31) следующую линейную функцию:
g0(p)=(l — р)^, g1=al (а4+1)-1 (ар^адЛ- 1)~*. (3.49)
Функция go(p) отличается от g(p) тем, что в знаменателе выра-
жения (3.31) для g(p) принято ц=1. Так как знаменатель при
этом не уменьшился, то видим, что ?о(ц)^(ц) при O^p^l.
Поэтому корень хо уравнения
£о(><о)=хо (3.50)
заведомо лежит в пределах (3.44). Разрешая линейное уравнение
(3.50) с учетом (3.49), найдем искомую величину
Хо=£1/(1 +£1)- (3.51)
Оценим еще минимальное расстояние б между точками Е и
Pi, ..., Рп при t^t0. Так как максимальное число сближений
не превышает N(n), то сближение под номером N(n) + 1 никогда
не наступит. Следовательно, минимальное расстояние EPi будет
не меньше LN(n)+i. На основании неравенства (3.46) и соотноше-
ния (3.9) получим
6= min min ЕРLN{n)+i=L*NW . (3.52)
Наибольшая величина правой части неравенства (3.52), т. е.
наилучшая оценка для б, получится, если выбирать максимально
возможное L, допускаемое неравенством (3.48). Тогда из (3.52)
получим
б> min [Cn(Zj) в, С*(/г)б0],
(3.53)
Сп(£)^-^/г(1—х)(еЛл—ip’x*2"-1’,
87
В качестве х здесь можно взять любое число из интервала (3.44)
например хо из (3.51). Явные выражения для хо, Cn(k), Cn*(Jt)
получим, подставляя в формулы (3.51), (3.53) соотношения
(3.50) для gx, (3.20) и (3.27) для at, (3.5) для Л.
г) Обсуждение результатов. Остановимся сначала на одном
интересном частном случае. Пусть возможности преследователей
(«волков) близки к возможностям преследуемого («оленя), т. е.
&->1. При этом согласно равенствам (3.15) имеем
Л=Л(1— %2)“1/2-^оо,'^-> 1. (3 54)
Получим асимптотические оценки при %->-оо величин а\, а2, аз, а±,
определяемых равенствами (3.20) и (3.27):
ах ~~ 0,5% *, а2 а3 2е~Кл, а4 2еХл, (3 55)
Подставим эти выражения в соотношение (3.31) для
g(x) при хе [0, 1]. Получим асимптотически
а? (1 — к) ~
g (х) = 2Хе~'4лК (1 — х), % —оо.
функции
(3.56)
Заметим, что функция go(x) из (3.49) имеет такое же асимп-
тотическое представление (3.56) при %->оо, что и функция g(x).
В этом нетрудно убедиться, подставляя формулы (3.55) в соотно-
шения (3.49). Следовательно, корни х* и хо уравнений (3.55) и
(3.50) будут, с точностью до малых высшего порядка, опреде-
ляться одним и тем же асимптотическим представлением. Из со-
отношения (3.56) и уравнения (3.45) найдем это представление:
х. х0 2Ке~4лК-^ 0, %->оо. (3.57)
Подставляя найденное выражение в формулы (3.53), получим
при условии (3.54)
C^n(k) , %~>оо. (3.58)
Формулы (3.58) показывают, что константы Си(й), Cn*(k), а
вместе с ними и гарантированная величина минимального рас-
стояния б из (3.53) очень быстро убывают при &->1.
Отметим, что при %^1 поставленная задача уклонения нераз-
решима даже при п=\. Единственный преследователь («волк»)
Pi, обладающий скоростью, равной или большей скорости «оле-
ня» Е, может не пропустить его в направлении луча х, т. е. не
позволить ему избежать встречи, оставаясь в е-окрестности но-
минального движения.
В самом деле, пусть в начальный момент преследователь Pi
располагается на луче х на некотором расстоянии бо от точки Ео
и пусть %=1. Зададим следующую стратегию преследователя:
в каждый момент времени его скорость перпендикулярна лучу х
и равна проекции скорости точки Е на плоскость, перпендикуляр-
88
ную этому лучу. Такое движение точки Pi совместимо с нало-
женными ограничениями при равенстве скоростей точек Е и Р\.
При этом «олень» Е не сможет пересечь плоскость, перпендику-
лярную лучу х, в которой движется «волк» Р1г избежав встречи
с ним.
Следовательно, при любом п>1 и k^l поставленная задача
уклонения с учетом требования о сохранении движения точки Е
в е-окрестности номинального движения неразрешима, по крайней
мере, при некоторых начальных условиях. Если же &>1, то
«олень» Е вообще не может избежать встречи с «волком», кото-
рый будет направлять свою скорость по вектору PiE.
В другом случае, при k=0, задача уклонения, очевидно, три-
виально разрешима при любом конечном п. «Оленю» при этом
нужно просто обойти неподвижно стоящих «волков». Однако при
/2=00 поставленная задача снова может быть неразрешима, даже
если k=Q. В самом деле, пусть счетное число неподвижных «пре-
следователей» располагается всюду плотно вокруг точки Е (на-
пример, по поверхности сферы радиуса бо). Тогда, очевидно, точ-
ка Е не может уклониться от них на конечное расстояние б, ос-
таваясь в е-окрестности номинального движения.
Итак, поставленная задача уклонения зависит от параметров
k, п, 8 и от начального расположения преследователей. Будем
предполагать, как и выше, что минимальное расстояние бо от
точки Е до точек Pt при t=t0 положительно, бо>0. Величина 8>
>0, очевидно, может быть принята равной единице за счет выбо-
ра масштаба длины и поэтому не играет существенной роли.
Зависимость решения задачи от параметров k, п характеризуется
согласно изложенному следующим образом:
а) 0^^<1, 1^п<оо — задача уклонения разрешима при
любой начальной ситуации;
б) k^\, п — любое или п=оо, k — любое есть начальные
ситуации, в которых задача уклонения неразрешима.
Построенный в данном параграфе способ управления решает
поставленную задачу при 0<&<1 и любом конечном п. Справед-
ливость остальной части утверждений а), б) была показана выше.
Как уже отмечалось, стратегия уклонения точки Е при 0<£<
<1 и конечном п, построенная в данном параграфе, требует для
своей реализации следующей информации. В моменты сближений
ti, определяемые условиями (3.9), преследуемый должен знать
положение той точки Pt, с которой происходит сближение. Если
этих точек несколько, то достаточно знать положение хотя бы
одной из них. Эта информация используется для построения
^/-спиралей (3.10) и для перестройки программной траектории
в моменты tj согласно процедуре, описанной в п. 2, а).
Как показано в п. 2, в), параметры способа уклонения L, х
Должны выбираться в пределах, указанных неравенствами (3.44),
(3.31). Границы, определяемые этими неравенствами, зависят от
чисел Р, е, бо и не зависят от числа преследователей п. В этом
нетрудно убедиться, если заметить, что функция £(ц) из (3.31),
89
входящая в уравнение (3.45) для х*, не зависит от числа Про-
цедура уклонения, описанная в п. 2, а), также не зависит от п.
Таким образом, построенный способ уклонения не зависит от чис-
ла преследователей п, и для его реализации преследуемому не
требуется знать это число, важно лишь, что оно конечно. Отме-
тим, однако, что гарантированная величина минимального рассто-
яния 6 согласно (3.53) зависит от п и очень быстро стремится
к нулю при н->оо.
§ 4. Задача простого преследования
тремя преследователями двух убегающих
В этом параграфе мы покажем, что множество начальных по
зиций в дифференциальной игре трех преследователей и двух y6i
гающих, обладающих простыми движениями и одинаковыми мат
симальными скоростями, может быть разделено на три подмш
жества. Из первого — убегают оба убегающих. Из второго -
убегает один убегающий, а второго убегающего преследовател
ловят. Из третьего — преследователи на свой выбор могут по;
мать любого из убегающих, а другой, при согласованном выбо{
управлений обоих убегающих, убегает.
Пусть движение трех преследующих объектов описываете
уравнениями
хг=иг, хг(0)=х°, г = 1,...,3, (4.
где xh ut^Rn, П Uf IK 1.
Убегающие объекты описываются аналогично
У/(0)=/Д /=1, 2, (4.2)
где yh Vj^Rn, ||щ1К1- Убегающий с номером / считается пой-,
манным, если существуют номер i и момент времени t, такие, что
МО
Введем переменную 2ц=Х[—у,. Тогда из (4.1), (4.2) имеем
zf/(0)=4/r (4.3]
ziZ, щ, Vj^Rn, 1КЖ 1» lIMKh •••> 2.
Игра преследования для /-го убегающего считается окончен*
ной, если найдется номер /е{1, 2, 3} и момент времени
Zi : 2ц(/1)=0.
Рассмотрим для дифференциальной игры (4.3) задачи пресле-
дования и убегания, сформулированные в гл. 2. Пусть начальная
позиция 2°=(z1°1, z°p гй12, г°2, д°2) такова, что все г9К0. Обо-
значим £={1, 2}\/, /е{1, 2).
Теорема 4.1. а) Если начальные позиции Zy, t=l, 2, 3|
/=1, 2, таковы, что существуют такие векторы рх и р2, ||p/||=li
90
/==1, 2, что max(plt 41)=^ 0, max(p2, z?2)^0, то убегающие игро-
ки с номерами 1, 2 избегут поимки.
б) Евли начальные позиции z®., 1=1, 2, 3, /—1, 2, таковы, что
существуют номер j и такой вектор р/, ||р/1| = 1, что max (pj,
1^г^3
?Р.)^0, а 6оЬ= min max (р, z9,/|]z° ||) >> О, то k-й убегающий может
быть пойман преследователями, а j-й убегающий избежит поимки.
в) Если начальная позиция г^, г= 1, . .. , 3, /= 1, 2, такова, что
a0/=min max (р, z?/||zo ||)>0,
W=1 г/ 4
60fe=min max (р, z?fe/|| zQik ||) > О,
l|Pl|=l
то один из убегающих, либо j, либо k на выбор преследователей,
чожет быть пойман преследователями, второй убегающий избе-
жит поимки.
Доказательство. Утверждение а) теоремы 4.1 следует из
теоремы 1.1, применяемой для каждого убегающего. Управление
/-го убегающего, гарантирующее такой результат, имеет вид
(/) =Р;.
Утверждение б) теоремы 4.1 следует из теоремы 1.1, применя-
емой для каждого убегающего. Управление j-го убегающего, га-
рантирующее уклонение от поимки, имеет вид щ(/)=р/. Управле-
ние /-го преследователя, гарантирующее поимку преследователя-
ми /г-го убегающего, имеет вид (1.4).
Перейдем к доказательству утверждения в) теоремы 4.1. В си-
лу теоремы 1.1 преследователи, выбрав любого из убегающих,
либо /-го, либо k-vo, ловят его за конечное время, используя уп-
равления щ(0, имеющие вид (1.4). Покажем, что второй убега-
ющий может при этом избежать поимки. Если й, i2, h — различ-
ные номера из множества {1, 2, 3}, то из (1.2), (1.3) имеем
2^,1 ^г21 == 2j3l “^г21 == ^ia2 ^г22?
2/jl — 2г31 — Z,s2, — Zi32 = 2j2i — 21^2=2^1 —2^2-
Рассмотрим случай В этом случае векторы —2°2, —
—zP2, z?г—г?2 равны между собой, отличны от нулевого, и сущест-
вуют индексы Zlf й, /3, для которых (г9,—z?2, zPj—zP?1)#=O. Зафйкси-
руем некоторые индексы й, 12, й, удовлетворяющие последнему
неравенству, и рассмотрим единичный вектор е\
(е, г?,1-гы) = 0' <е- 2. 3}\((„ /,}. (4.4)
В силу условия в) теоремы 4.1 такой вектор существует и при
этом
(z°i, е)=(г°р г)<0, (z°2, е)>0, (гг?2, e)=(z^, е)<0.
91
Положим для ^=1(6, 2°^— гр2)|/2 (не исключает^
случай и /х=0),
y1(/)=sign(e, грз1— z°2)e,
(4.5
v2(0=— sign (a, 2fsl —г°2)е. .
Для решения уравнения (4.3) при таких управлениях убегающих
имеем
(е, г£а1(/)—г£з2(/))=(е, гра1—гг°2) + J (ща (s), e)ds—
о
t t t
— ((t'i(s), e)ds—1(«(1 (s), e)ds : ( (aa(s), e)ds—
=(«. zf,1-zw)-2sign(e, z«,-2«2)^=
=sign(e, г«1-г»2)[|(г, z’j-zyi-2/J.
Таким образом, в момент tx справедливо соотношение
(б, (^1) гг32(^1)) = 0.
За время [О, ни один из убегающих пойман быть не может.
Действительно, если (a, 2?j—2°2)>>0, то в силу (4.3), (4.5) и ус-
ловия в) теоремы 4.1 имеем
(2M(Z), e)C(^j, е)<0, (гщ (0, ?Х(г?р е)<0,
fa,1(0, е)>(г°р е)—2/1 = (2г?2, е)>0, (z£12(/), e)<(z°2, г)+ 2/^
=(2°р е)<0, (zij2(/), еХ(г°2, е) + 2/1=(гг?1, е)<0,
(2/з2(/), е)>(гра2, е)>0.
Если (е, г?,—г9 )<;0, то имеют место соотношения
(г,.,(О, e)<(z?,„ е)+2#1=(г»2, г)<0,
(г,-21(/), e)<(z9p e) + 2^=(2°2, е)<0,
(z£si(f), е)Х??р <?)>0,
(г£12(/), eX(zpi2, е)<0,
(2£22(0, e)^(zo2, е)<0,
(zij2(0, е)>(гг?2, е)—2^=^, е)>0.
Для t'^t1 положим v1(i)=v2(t)=e.
92
Покажем, что такое управление исключает поимку обоих иг*
роков. Имеем
(М4 е)=(гга(/3), е)+ f (4 (4 e)ds—(t—/3)< (zilt (/3), е)<0, '
it
e)=(4i(G)» е) + J (uit (s'), e)ds—(t—t1)^(zhi(t1), e)<Q,
ti
t
(zi^t), e)=(42(*i)» e)+ \ (4 ($), e)ds—(t—y<(zil2(f3), e)<0,
(42Ю, e)=(ztt2(Q, e)+J(tti,(s), e)ds—(*—GXfe&X e)<0,
£
и, таким образом, преследователи с номерами и /2 для />0 убе-
гающих поймать не могут. Для Zi3i (/) и гг-з2(?) при таком выборе
управления убегающих имеем
i t
II 41 (0 — ^,2(011 = 11 (^д(О) —МО)) + f Ui3 (S) ds— J V1 (s) ds —
6 Л
t t
— $ 4 (s) ds + ^v2(s)ds ||== Ц41 (0)“М0)П-
t, ti
Таким образом, если в начальный момент /3 ||Zisi(0)—42&)11#:(\
то для всех i>tlt ||4i(/)—42(ОН=# 0. Если в момент
4i(0)=0, то ||Zj,2(0)ll = IIM0)—42 (0)11 и Для ^>0 имеем
t
Zi'2(t)=z(t2 (0) +J 4 (s)ds—e(t—t2),
ia
1142 (011 > 1142 (0)—(t — 0) 11 — (t—t2)=
1
= (Цг<.2(УП2-2(*-«(е. г,.2(У)+ (/-(,)’)2
т. e. вектор ?г12(0 ни в какой конечный момент времени в нуль
не обращается. Соотношение Zi3i (0)=4г(0) не может быть вы-
полнено в силу того, что индексы 4 г2, 1з мы выбираем так, что
(zOj—.z° 2?j—zOJaj&O. Действительно, в силу выбора управле-
ния v(t) на отрезке [0, 0) по формуле (4.5) в случае выполнения
соотношения Zjsi(0)==42 (0) для начальных позиций справедливо
равенство (??— г(?2, Если У°1=У^ т- е- ^1=г?,2’ <i =
93
=zf°2’ z?^ — г?2, то предлагается выбирать управления убегающих
по следующему правилу. Обозначим
p=min max (р, 2°/||z° ||);
ЦрЦ-1 l^i^3 1
ei-(^ ех)=1, (е, г^ — 2?21)=0, (еъ zy>0;
е2:(е2) е2)=1, (е2, е1)=0.
Положим для t е [0, р/3] У1(0 = ^2> ^(0= — е2-> Для > Р/3 щ(0 =
За время р/3 убегающие не будут пойманы, так как время дви-
жения преследователей до множества 5р/з(0) больше р/3. Далее
убегающие находятся в ситуации, рассмотренной выше. Теоре-
ма 4.1 доказана.
Замечание 4.1. Пусть в игре (4.1) — (4.2) три преследова-
теля и любое конечное число N убегающих. Тогда справедливо
следующее утверждение. Для убегающих с номерами /е{1,..., jV},
для которых со (%1°, Х2°, Хз°), разрешима задача уклоне-
ния от встречи с группой преследователей. Для убегающих с но-
мерами /е{1, ..., А/}, для которых t//oelnt co(xi°, Х2°, хз°), имеет
место такой факт. Преследователи могут поймать только одного
из них, любого по усмотрению преследователей, остальные убега-
ющие могут уклониться от встречи. Приведенное утверждение до-
казывается повторением выкладок, используемых при доказатель-
стве теоремы 4.1.
Глава 4
МЕТОД ГАРАНТИРОВАННОГО НЕУХУДШЕНИЯ
ПОЗИЦИИ ДЛЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР
ПРЕСЛЕДОВАНИЯ НЕСКОЛЬКИМИ ОБЪЕКТАМИ
И ЕГО ОБОБЩЕНИЯ
§ 1. Метод гарантированного неухудшения позиции
В настоящем параграфе мы приводим достаточные условия
разрешимости задачи преследования, группой преследующих объ-
ектов одного убегающего объекта. В начале параграфа они фор-
мулируются в упрощенном виде для дифференциальной игры
вида (2.0.9), во второй части параграфа — для дифференциаль-
ной игры вида (2.0.8). При этих условиях динамика преследо-
вателей позволяет, используя текущую информацию, так строить
преследование, что позиция каждого из преследователей относи-
тельно убегающего в определенном смысле не ухудшается, а хо-
тя бы для одного преследователя строго улучшается.
Рассмотрим задачу преследования из начального положения
z° для игры (2.0.1), описанную в гл. 2, в том случае, когда урав-
нения имеют вид (2.0.9):
Cfv, zi(S>)=z°i, / = 1, .... m, (1.1}
где Zi^Rni, PfCZ RPiy v^QczRQ, Pit Q—выпуклые компакты.
Предположение 1.1. Множества тце^В^ — со-
держат нулевой вектор для />0, iV=l,..., m.
Определим для />0, те[0, /], функции
cc(z, I, т, v, mi, z°) —
max{a:a^0, —а(лгеЛ412°—тг) (nie{i~i:}A^BiPi—
—если тр,
= | 2т//2, ’если "nieiAizii = mi\
I ' t
Р(/, z°)=sup min (1— a(i, t, т, v, mt, z^dx\
( f(-) ' Q
где o(-) — измеримая на интервале [0, /] функция, принимающая
значения из множества Q.
Теорема 1.1. Пусть для игры (1.1) в позиции 2°==(г1°, ...
2ОТ°) выполнено предположение 1.1 и существуют векторы
для которых функция р(/, 2°) имеет положительный ко-
рень Т, Тогда для позиции zG разрешима задача преследования
для дифференциальной игры (1.1) за конечное время Т.
95
Доказательство. Пусть для начальной стадии z° выпол-
нены требования теоремы 1.1. Если для номера i справедливо
соотношение =/= тг для всех £е[0, Г], то предпишем !-му
преследователю строить свое управление следующим образом.
Если в момент ^<0 величина
t
v(-))=l— J оф', T, т, d(t), mh zf)dx>Q,
о
то функция — решение уравнения
(Г)-ще<Т~пА‘Ср (f)=
= — а(/, Т, t, v(t), mi, г°)(п;егл*г°—nij). (1-2)
Если /р — первый момент времени, для которого Ьф?; о(-)) =
—0, то для 7], ut(V)<=Pi — решение уравнения
л/т~^В^ (/)=л^{Т~^А^С^ (t). (1.3)
Если для номера i справедливо соотношение лге iZi = mt при не-
котором т, то из определения функции р(£, 2°) следует, что т>
>7. Предпишем такому преследователю строить свое управление
как решение уравнения (1.3) для fe[0, Т]. В силу предположе-
ния 1.1 существует одно или много решений уравнений (1.2),
(1.3). Согласно утверждению П.2 функция a(i, Т, t, v(t), mit
Zi°) — измеримая функция t при фиксированных i, Т, zp, mi. Сле-
довательно, в силу теоремы Филиппова (см. П. 7) уравнения
(1.2), (1.3) разрешимы в классе измеримых функций. Покажем,
что, применяя стратегии выбранные как решения уравне-
ний (1.2), (1.3), преследователи могут гарантировать окончание
преследования в момент времени Т. Действительно, если v(t) —
произвольная измеримая функция, принимающая значения из Q,
то возможны две ситуации: либо существует номере i0, для ко-
торого либо для каждого i, i=l, 2, ..., m, bi(T-, u(-))>
>0. В первом случае, преследователь с номером i0 ловит убегаю-
щего в момент времени Т, так как согласно выбору стратегии
преследования
л/о2й(Т)=(’1«/Л/о4—mio)(l — J Л т, у(т), mia, zl)dx} +
о
+ mZo = mio.
Второй случай невозможен в силу требования р(Т, z°)=0. Таким
образом, в момент времени Т хотя бы один из преследователей
поймает убегающего. Теорема 1.1 доказана.
Пример 1.1. Пусть уравнения движения пг преследователей
и одного убегающего имеют вид i=l, m; y—v. Здесь
96
Xi, У, v>I, llwJIср/, ||б||<ст. Преследование считается
завершенным, если хотя бы для одного i х^у, р/, а — положи-
тельные константы. Перейдем к соответствующей дифференциаль-
ной игре вида (1.1). Для этого положим z=(zn, zi2) = (x(—у, xt—
—у). Тогда
Zii = Zi2, zH, z/2ge#v,
• (1.4)
Zi^Ut—V, IIUflKpi, Ill’ll <0, Л1; —{z : zit = 0}.
Имеем
n/^z?=z°i i + /z®2, лietAt (BtUt~Civ)=t (Ui—v).
Предположение 1.1 выполнено, например, если рг>о для всех
i. Вычислим функцию
a(i, t, х, v, z°)=max{a: a>0, —a(z°i+z?2/) e S(/-X)p. (0)—(/-—т) t>}.
Так как по определению вектор
—a(z°j +Zi2t) + (t—т)р
лежит на границе шара *S(/_T)P. (0), то
(—a(£?i +2i2/) + (t—т) v, —cc(zt\ H-Zf2Z) т) и)=р^ (/ т)2.
Решая получающееся относительно а квадратное уравнение, по-
лучаем
a(z, t, т, v, t, v, z*)(t—т), (1.5)
где
, (( у/2
v) ' н*л+м*2 н2 /
Согласно (1.5) в данном примере
Р(С z°)<l—/2min^ k (i, t, v, z°t).
licit i=l
Положим
nt
<p(/, o) = Jj k(it t, v, &), т)(/, z0)—min <p(/, u).
i=l Й<а ,
Нетрудно видеть, что если pi>o, i=l, т, то л(Л 2°)>0, и ес-
ли pi>a, i=l, т, то т](?, z°)>0. Зафиксируем t. Справедливы
следующие утверждения, легко доказываемые от противного.
4 Н. Л. Григоренко
97
Утверждение 1.1. Если v* — точка минимума функции
<р(/, с), то (о*, Х1 + .. .+хт) <0, где
2н+г^
г II г?, + ^112'
Утверждение 1.2. Если v* — точка минимума функции
<p(t, v), то ||5*||=а. ~
В силу утверждений 1.1, 1.2 min(p(7, t>)=min ср (t, v), и за-
дача отыскания минимума функции <р (t, v) есть задача на услов-
ный экстремум. Для его вычисления можно применять известные
методы.
Приведем значения т|(/, z°)=min(p(/, и) для т=3,
z?t=(0; 1), z?2=(0; 0), ^ = (-/3/2; -1/2), 2&=(0; 0),
гз°1 = (УЗ/2; -1/2), zS2=(O; 0):
1) Pj = p2=P3=a» Ш г°)=УЗа; __
2) Р1=Р2=^ Рз><0 П(0 г°)=(УЗ/2) o-hl/pf—оМ;
3) рг=а, р2=р3>а, Ш z°)=2 Ур2—о2/4;
4) Pi —р2=Рз>о, л(0 г°)=Ур2—о24-2Ур2—оа/4.
Заметим, что в данном случае в силу выбора z°2, z°2, z°2 величи-
на ц(0 2°) не зависит от Л Таким образом, для игры (1.4) 0 —
первый корень уравнения 2/п=ц(/, z°)t2. Управление преследо-
вания Ого игрока имеет вид
иг(/)=у(/) —
г?1 + вг«2
Н1+М2П2'
V (0 +
[Д^ + вгОХ 7
pf—(70. 70) V/2
jjz^+Szys / .
(4+0z°2) (1.6)
для /е[0, /?], где 7 — первый корень уравнения
t
vC))=l-((e-rW, 0, ?(г), г?)Л=0, (1.7)
о'
йх(0=5(() для /е(0’, 0].
Перейдем к рассмотрению задачи преследования из началь-
ного положения (t0, z°) для игры (2.0.1) в том случае, когда урав-
нения (2.0.1) имеют следующий вид:
гг=Д(0^ + Д(0 нг)—qt(t, п), гМ=2-, (1.8)
98
где Zi е Rni, щ RPi, v Rq, P£(Z), Q(f)—
компакты, непрерывным образом зависящие от t\ At(t) — квад-
ратные матрицы порядка п(, непрерывно зависящие от /e|Y0, оо),
ft(t, и/), qi(t, v) — непрерывные по совокупности переменных
функции, i=l, т; fi(t, — выпуклые компакты для
Пусть 0>/о.
Предположение 1.2. Существуют множества сгЛ\
Mi3czLi[f дифференцируемые и монотонно возрастающие
числовые функции 3C(tQ)=t0, при много-
значные отображения ЭЛ,3(т) <=£?, для которых выполнены усло-
вия:
а) М? + Л*} <= Mf ({/,(&)),
б) 2Jli3(T) — непустые, компактные, выпуклые множества для
всех те[/0, 0], зависящие непрерывным образом от те^о, 0];
в
в) j3n?(T)drc= Ml
^0
г) для /о<г<0 непусты множества
ЧШ, *)=[-*«? (Ч+ММгме). Ч><(е. *))Ж(в,т),Рг(<р((е, т»)]^-
— [я£Фг-(ёГ£(0), ф£(0, Т))^(фг(0, т), QOPt (0, т))) <J/i (0—T-HJ],
(1.9)
где <pj(0, т) —с>Гг(0) —0 + т, фг (0, т)=^г (0)— еГг (0—t + Q-Ho,
Ф£(/, т)— фундаментальная матрица решений для уравнения
x=Ai(t)x, причем Ф£(т, х)=Е при всех Е — единичная мат-
рица.
Из предположений 1.2 и условий на параметры игры (1.8) сле-
дует, что многозначные отображения $\(0, т) полунепрерывным
сверху образом зависят от т.
Предположение 1.3. Существует непрерывная векторная
функция уг(0, т)е1^; (0, т), /о<т<0.
Зафиксируем некоторые функции у£(0, т), удовлетворяющие
предположению 1.3. Положим
Ф£(®До)
5£(0)=лгФ/(аг(0), /0)zJ+ $ л£Фг(аг(0), s)/(s, P(s))ds +
©
+ $?/(©> x)dx. (1.10)
to
Рассмотрим для те|70, 0], «(s)eP(s), /o<s<q)i(0, Zo),
функции
4*
99
р(/, 0, T, и, z°) =
тах{ц:ц>0, — р (л{Фг (аг (0), Д)гДг \ лгФДаД0), s)x
Л»
6
Xfi(s, u(s))ds—M4t+ т)б?т) П(—ЯП?(т) +
__ ' Z0
+ лгФДаД0), <pf(0, т))^(фД0, т), P (<рг (8, т))) + лгФг (аД0),
ФД0, Т))Я(ФД®> т),и)аг(0—т + г0)—Yi(0, т))#=0},
если Bt (0) П Л1|=0;
^(0)ПМ;#=0;
е о-11)
х(0, z°)=supmax (1 —Л рД/, ®> т, &(•), (1.12)
v{-)lGNi i}0 z
где и(-) — измеримая функция гДфД0, т))eQ(ф<(0, т)), ?
<т<0.
Теорема 1.2. Пусть для игры (1.8) в позиции z° существуют
0>/о, множества МД Л4Д 9Jh3(r), функции уг(0, т)е!^Д0, т),
Д<т<0, u(s)^P(s), i^o<s<срД0, 4), такие, что выполнены пред-
положения 1.2, 1.3 и х(0, z°)=0. Тогда для позиции 29 разрешима
задача преследования за время max Л(0).
iewi
Доказательство. Пусть для игры (1.8) в позиции t0, z0
выполнены условия теоремы 1.2 и и(/) — произвольная измери-
мая функция со значениями из Q(t). Предпишем i-му преследо-
вателю строить свое управление в момент te[/0, фД0, t0))
в виде ut{t)=iii(t)г где tii(t) — измеримая функция из условий
теоремы 1.2, а в момент /е[фД0, t0), ^ДО)] — следующим об-
разом. Если в момент фД0, £) >фД0, t0) (значения ф/(0, t) за-
висят от параметра t^[tQ, 0]) величина
t
li(t- сД.))=1-$н(Ё О, t, Дт), />)dT>0, (1.13)
to
то функции иДф,(0, /))еР(Д<рД0, t)), nii3[t)^Sti2(t), md(t)^
— решения уравнения
— тДО + ^гФДа7Д0), фД0, t))finite, t), /))) +
Ч-лгФДс7Д0), фД0, Д)яДФД0, t), гДФД0, /)))<^Д0-/-Нй) =
= ?Д0» о—Н(Ё ©, t, О(ФД0, Д), г°) [лД)г(^г(0), /0)г° +
чрре.О в
+ \ ^гФДё7Д0). s)ft(s, «i(s))ds + 5 Yi(0, t) dt—m* Д)].(1.14)
^0 to
100
Если t\l — значение параметра te[0, 0], когда впервые
п(-))=0, то для /<=(Д, 0] функции «/(ф/(0, 0)еР((фг(0, 0),
m,3(0e 3JV(0 —решение уравнения
— тЗ(/)+Л;фг(<^(0), фД©, 0)0 (<Р/(0, 0, «|(фг(0, 0)) +
+ Л;фг((^(0), ^(©, 0)g(1рг(0, 0, п(фД0, 0))-d0(0—* + 0) =
=Ъ(в, () (1.15)
В силу предположения 1.2 существует одно или много решений
уравнений (1.14), (1.15). Согласно условиям на игру (1.8) и
предположениям 1.2, 1.3 функции ц(/, 0, t, v, zp) полунепрерыв-
ны сверху по совокупности переменных t, v при фиксированных
Z, 0, 2i°. Следовательно, функции ц(ц 0, t, v (ф,(0, 0), z?) — из-
меримые функции t, 0], и в силу теоремы Филиппова (см.
П. 7) уравнения (1.14), (1.15) разрешимы в классе измеримых
функций Ui(cpi(Q, 0)еА(фх(0, 0), тг-3(0 (=3J03(0, т/4(0 еЛ1г-4.
Покажем, что, применяя описанные управления tp(0, преследова-
тели могут гарантировать окончание преследования к моменту
max о0(0). Для произвольной измеримой функции ”u(t)gQ(t),
те[/0, max о0(0)] возможны две ситуации: либо существует
Iq&Ni, для которого /]° 0, либо для каждого i,
£/(0, и())>(). Второй случай невозможен в силу предположе-
ния о том, что 0 — корень уравнения х(0 z°)=0. Действительно,
в этом случае для всех ieJVi
о
Ь(0; »(•))=!-W. в, t, 0). г?)Л>0,
^0
следовательно, min^(0; !»(•))> О и х(0, Zq) >0, получили проти-
texi
воречие.
В первом случае, учитывая (1.14), (1.15), имеем
U<+ $ лг.Ф|.«М0). s)x
^0
е
X0e(s, ufo (s)) ds+J(nu<Dio ((17i#(0), фго(0, 0)ЛО (<И0 (0, 0,
to
МфйЖ 0))+rtio<MeM©)> ^-„(0, O’ v(^o(0, 0))x
X^I. (0-/ + <„))Л=Л1вф, .(<?,. (0), t„)zl+ 5 л1оф!о(^|,(0), s)x
to
101
« I»
*М<М0)^+^ И/0 + vU©, J p.(t0, 0, t, п(фг.(0, 0),
io io
<F/O(0.io)
*?,) [(«г»ф*0 (^io (®). h) + $ J4<Dio (&ia (0), s) fi, (st uio (s)) ds 4-
^0
0
+ jT1,(0, М-тЦ0]«=(п).Ф(,('!М9). W4.+
в
+ 5 я*оф*о (^io (®)> s)/<0 (s, Uit(s))ds-^-\yia (0, t)dt) X (1.16)
f0 Гф
/ $ ' ?
x(l — J hO'o, 0, t, v(i|)fe(0, 0), zy dt) + \ /И^(0^4-
г» io
+ fn(»0. e. t, o('l>!, (0,/)), г»о)m*(оЛeЛ4?.+MtcM?.(<y;.(©)).
io
Таким образом, к моменту шах^/Д©) хотя бы один из преследо-
i€^i
вателей с номерами из множества Ni ловит убегающего.
Теорема 1.2 доказана.
Замечание 1.1. В зависимости от задач, стоящих перед
группой преследователей, возможен и другой способ выбора уп-
равлений преследователей, гарантирующий результат теоремы 1.2.
Предпишем i-му преследователю, i^Nlt строить управление
Ui(t)^Pi(f) как решение уравнения (1.14) до тех пор, пока хотя
бы одна из функций t»(-)) не обратится в 0. Тот игрок io,
для которого £ie(0e; 0, далее на отрезке (0’о, 0] выбирает
управление щ(0, как решение уравнения (1.15), что гарантирует
ему окончание преследования к моменту 0. Для остальных пре-
следователей, в зависимости от целей дальнейшего использова-
ния, возможно перенацеливание в момент t\0.
Замечание 1.2. В соответствии с теоремой 1.2 решение за-
дачи преследования распадается на следующие этапы.
Этап 1. Найти множества лгФ;(£, т)Д(т, А(т)), Л/Фг(0 т) X
lXgi(r, Q(t)), векторы щФ<(0 to)Zi°, подобрать функции и
множества ЮЪ3(т), Мр, М>\ для которых выполнено предположе-
ние 1.2, найти множества т).
Этап 2. Выбрать функции уД/, т), для которых выполнено
предположение 1.3.
Этап 3. Н айти функции ц(г, t, т, v, zt°).
Этап 4. Найти функцию х(0 z°), и если существует 0 — ко-
рень уравнения х(/, 2°)=0, то найти щ(0 как решение уравнений
(114), (1.15).
102
Для функции x(Z, 2°) можно в силу утверждения П.З и [26, 38]
выписать следующую оценку сверху:
t
x(t, z0) = supminf 1 — Ср (г, t, т, у (г), ?0)бйЛ<
«() \ J /
^0
т f
^sup 1-------V \ р (Z, I, х, v(x), zf)dx\ =
t>( ) L m. Ld J 1 J
г=1 ta
t m
= 1----— inffVp(Z, t, x, u(t), zfidxs^.
m &(•) J
ta 1=1
t m
1---— CinfV]p(Z, t, x, v, z?)dr—Xi(/, z°). (Ы7)
tn J c£Q
Го i=l
Пусть 0! — корень уравнения xi (t, z°). Нетрудно видеть, что за-
мена в формулах (1.14) и (1.15) 0 на 01 гарантирует преследую-
щим окончание игры к моменту 0Ь так как до момента 0! хотя
г
бы одно из выражений 1 — p.(Z, т> v(x)~ztydx обратится
К
в 0.
Перейдем к рассмотрению примеров.
Пример 1.2. Пусть уравнения движения т преследователей
и одного убегающего имеют вид
+ Z=l, 2, .... tn, [|w4||^Pi,
У+&У=и, (1.18)
здесь Xi, у, th, v^Rv, v>l, m>l. Преследование считается за-
вершенным, если хотя бы для одного i Xi—y. Перейдем к соответ-
ствующей дифференциальной игре вида (1.8). Для этого поло-
жим 2==(2/1, 2/2, Z$) = (Xi—у, Xi, у). Тогда
- I %Н — Z3 , 2ц, Z(2, Z3 (ЕЕ R , zj2=—ад2+“ь (i-i9) \z3=—₽Z3-H. Мг={г:?41=0}.
Имеем / -аЩ-т) -₽Р—т)\
/£, nf=i 0, \о, 0, 0\ (e, £ 1-e - , —E— \ 0, 0 ф.(/ т)=| "j , & 1, no/’ |0> £^(r-x) , 0 f ’ 7 \0, 0 , J
103
Е — единичная матрица размером vXv,
1 _ _ e-fW-*) -
т)(/г(т, “i)~gi(x, f)) =-------- «I-------r-----V,
ai P
—a-(t -T)
t) z-~ z?i +1------------ Zi2
«i
1_е-₽(/-т) 0
-------Z-----z3
Предположение 1.2 выполнено, например, если pt<^o, piP>ocQ
для всех i. В этом случае $\(/, т)эО, и можно положить
т)=0, Вычислим функцию
[ / । _ е—“р
р (i, t, х, v, 2?)=тах{р: р>0, —р Zji+-—-----z°2—
I \ «i
, 1 е с / . —а.(/—т)
--------2з i ЕЕ о ( 1 — е 1
Р / I -------------------------
X Щ
Так как вектор
аг
лежит на границе шара S 1 —е-г)
(0), то
₽ °||
.J
=Р| ---------
Решая получающееся относительно р квадратное уравнение, получаем
p(Z, t, х, v, Zi)=
1
IlnHW
1 _ е-р(/-т)
---Й---*>)) , М0=г?14
, р / / J
1 — о
Р 23 •
(1.20)
Предположение 1.2 выполнено для любой начальной позиции
^1’ *12' z°, если р(>о, pipXTai, причем одновременное превра-
щение обоих неравенств в точные равенства исключается. Если
pi=cr, р=а<, то из (1.17), (1.20) следует, что предположение 1.2
для позиции 2ц, z?2, 2° выполнено, например, если существует
104
положительная константа 0, такая, что одновременно выполнены
два неравенства:
6= min max f—t
wi=l 2=1,....m Ullnf (0)11 /
~^-(e-₽0 + ₽0— l)>m max ||^ (0)||.
fP 2=1...m
Заметим, что последнее неравенство выполняется при достаточ-
но больших © для любой начальной позиции z°p z?2,
Пример 1.3, Рассмотрим задачу о «мягкой встрече» группы
преследователей и одного убегающего:
х,- + а2хг=р£«г, г=1, ..., т, £/|Pz/=cw,
ПМ< 1, llv 11=^1, хь у,~щ, vt=R\
at, P, Pi, ст—положительные константы,
Мг={(хг, xit y, y):xt=y, Xi=y}.
Перейдем к соответствующей дифференциальной игре вида (1.8).
Для этого положим
Za) = (Xt у, Xt, у).
Тогда
( ZiX = Zi2 — z3,
j Zf2= —агг£2 + иг,
(1.21)
Zu, Zi2, z3^Rv, II Mii|<Pi, IIV IK a,
—{(Z{i, Zj2, z3): 2ц—0, —z3)
Имеем Л1(={(0, a, a), b<=Rv}, ,E, 1 o, "i = | \0, f E, E- o, \0, Ое/Л Li={(e, — b, b), c^Rvt 0 , 0 x — E, LjA 2 2 I’ Фг^’ T) = -E, — E 1 2 2/ £ I аг p I 0 • o ; /
105
Е—единичная матрица размером vXy,
Нг) =
л4Ф4(/, т)^(т, v)=
—a.(f—r)
------u,
± е~“^>и.
2
--Le-^^Ui
2
-----— у
---!_£—P(^~t)y;
2
_—g—fW—T)y
2
„0 । 1 — e 1 о
2jl ~1-------------------^i2
at
1— £ — Q
23
3
— е-^а-^ zo—L e-w-t^zl
2 2
—Le-'M'-<.>;4+2_,,-iw-(.>4
2 1 2
Предположение 1.2 выполнено, например, если
^,(0=4-lnf-L(ев<'-1)+1\ «;>₽, ’И’)-»-
р \ аг / ai р
Действительно, т)^0, если существует вектор
d=(dlt ds), di^R4, г = 1, 2, такой, что для каждого v, ||о||^а
найдется вектор нг: [|иг|[^рь такой, что одновременно
(0 ---v + d, Ю=—-«i.
Р «г
^^e-^v+d,
Так как это соотношение должно выполняться и при и=0, то
d2(0=-j-e-“4?, ||«? (К Pi-
106
Таким образом, для каждого v, |]и|К(У, должен найтись вектор иг,’
ЦиЛСРь такой, что одновременно
~ /я\ 1 —е 1 — е Г Оч
g7i (/) v— (Ut t/j),
р «г
(t) i <'> ;= J_ fa-tf).
Выражая (u4—ы°) из второго уравнения и подставляя в^первое,^полу-
чим уравнение для е7{(/):
1 — g 1 1 — g *
«i
решая которое
функцию
получаем ё/г (/)=-^-tln ((е“г<
Р \ ®i
Вычислим
[л(г, t, t—т, v, z°)=
=шах
р:р^0, —и
t -a^At) , -Р5М0
п । 1 — e 1 1 о 1 — e 1 n
ZH 4--------------2j2---------------2з
P
I 1 Z3
JLe-<VM«4 ' e
2 2
^.(О—t / 1 е 11
1
2
и, (s) ds
о
—a (t—т)
1 —- е 1
U;
az
2-е-‘М'-т,«|
2 ’
£ (0)
(f-т) \
1 — e 1 \
- V \
2 / «i
Из вида функции р(/, i, t—т, v, z°) следует, что
jx(i, t, t—т, v, zO)=min{p/(-), M-)),
107
где
p1(-)=max — p-i
-a^U) -m/) \
,0. , 1 —e .„9 ! —e 1 „0 1 ,
Zil “Г %i2 ~ %3 “b
P /
Ctf
"f ’ 71- | - ] I -
I i ---------- I u. ds e------
Sv (0)—
p{
Имеем
a-(f—I)-'-
e 1 v
0 ( a/f-i) _
a£
ц2(.)=тах(н2:Р2>0, — p2 ^-|-
Д_«-₽^£о)„о\ । C 1 P-ai^i^-sr,
^-e ‘ Z3I+ \ ~e 1 ‘ i \
еЛе-».('-ч5^(0)_±е-
Г / 1
l/o । 1 — e * 1
— Ha zn H-----------
Zj2
w(-(s)dsj
ff, (t)~t
С 1 1 1 _ -₽^(/-г) .
\ --------------Ui (s) ds I H-------—— Vt^i (t—t)
—a At—t)
J — e 1
= Pi------------------
a£
е^М>&_^е^1Мг°\ + Г -Le-
0
о
0
o
-P^.(f-T)
I 1 v
_L (,«<«-’>
1
1 — e « о
p 3
0
0
i*i(-)=lh!(i)ir2
MO, —-----------&i(t-T)o j-b
108
// 1 _ е“^М*~т) . ~\2 / /, -а/*-т)\2
-Ь I I 'Hi (0» 7 &i {I т) У ) + || "Hi W I Pi ( ----------------- I
\\ Р / \ \ «I /
—\2 ДХ 1/2
^^4-<м*-'О й 3
р }!>.
где
--------------- Ui(s)ds,
о
t4(-)=idw [ +
+ ((ЬЮ, -у + (Oil* (P? (-Ге~°‘‘,'~Т)'Г~
\ \ 2 / \ \ 4 /
где
Ь (/)=-!-е-“г<(,,г?2—Le-^1(Oz» + 'y ‘j -Le-^^-^^ds.
О
Таким образом, для позиции z° разрешима задача преследования
с мягкой встречей, если существуют положительная константа 0
и номер i’o, для которых выполнены неравенства
6j = min max f—^5^), ib^7>0,
11ФН=1 i==l.m \ ]] Hi (0)ll /
62 = min max f —
M=1 i—1....m \ || gf (в)II
г})
>0.
26га V -L~e ----#ia (0-T)dT> |hi0 (0)||2,
e
62a f (0-T)dT>||b. (0)ll2.
0
109
§ 2. Групповое преследование
при г-кратной поимке убегающего
В настоящем параграфе мы приведем достаточные условия
разрешимости задачи преследования группой преследующих одно-
го убегающего (см. гл. 2) в том случае, когда уравнение (2.0.1)
имеет вид (2.0,9), а под окончанием игры понимается поимка убе-
гающего к некоторому конечному моменту времени не менее г
преследователями.
Рассмотрим дифференциальную игру (2.0.9) группы преследо-
вателей и одного убегающего, сформулированную в гл. 2. Она
описывается уравнениями
Ctv, zl(O)=z°t1 1=1, (2.1)
где Zi e Ut (=Pi <= if1, уе Qc Pt, Q—выпуклые компакты,
Ai, Bi, Ci — постоянные матрицы размерности riiXm, гцХРц ntX
Xq соответственно.
Перейдем к изучению задачи преследования при г-кратной
поимке убегающего, сформулированную в п. Б гл. 2, для игры
(2.1). Будем считать, что для игры (3.1) выполнено следующее
предположение.
Предположение 2.1. Существуют множество N\aN, П;Х
ХЩ матрицы Di(t) и функции \i(t), непрерывным образом
зависящие от t, £>0, такие, что для />0, непусты множе-
ства
S, (0=я(емад — я(О, (0 ем<С|<3,
t
и у, (/) е (/).
6
Для начальной позиции z° возможны два случая.
1. Существуют номера /=1, ..., и моменты времени tt{,
такие, что
(л,/гАг?+? г,,(т)Л)ПМ?,(«|,)чЬ0. (2.2)
о
+ J Wi (т) dxj
о
(2.3)
Обозначим множество номеров для которых выпол-
нено соотношение (2.2). В первом случае согласно первому мето-
ду преследования Л. С. Понтрягина | игроков могут поймать
убегающего в моменты времени tu при любом допустимом управ-
110
лении у(-) [2]. Таким образом, если £>г, то задача преследова-
ния для позиции 2(°, ZeA/'i, имеет решение. Рассмотрим случай
g<r, а также тот случай, когда для всех i и всех справедли-
во соотношение (2.3). Обозначим т)=г—Имеем Не
ограничивая общности, будем считать, что мы решаем задачу о
iq-кратной поимке убегающего, и для i<=Ni={l, ..., 6} выполнено
соотношение (2.3). Обозначим через /С/={А, .... Ц произвольную
совокупность t] повторяющихся чисел, из множества а
31 — {К/,-1 Cl1}, CJ!—число сочетаний из k чисел по -q чисел.
Рассмотрим для f>0, 0<т<Т функции
t
X(z, /, т, v, г?)=шахр,: Х>0, — % —М?(0+ ^?г(т)</т)Г|
о
л (2.4)
i
р (t, z0)—sup min max fl — ^%(t, T> V(T)» ^°) dr), (2.5)
1 r(-) xze® teKj \ J /
где y(-) — измеримая функция на отрезке [0, fl, принимающая
значения из Q. Обозначим ЛДз0) корень уравнения pfl(£, z°)=0.
Предположение 2.2. Для позиции & ТДз0) <оо.
Теорема 2.1. Если для игры (2.1) в позиции z° можно ука-
зать множество A^czJV, для которого выполнены предположения
2.1 и 2.2, то для позиции z° разрешима задача преследования при
г-кратнойлоимке убегающего не позднее момента T=max(7\ (z°),
... , /,g), где h. — моменты времени, определяемые соот-
ношениями (2.2).
Доказательство. Пусть для игры (2.1) в позиции z° вы-
полнены предположения 2.1 и 2.2 и v(t) — произвольное про-
граммное управление убегающего. Предпишем z-му преследова-
телю, строить свое управление в момент t, fe[0, Tn(z°)],
следующим образом. Если в момент времени величина
t
ht(f; И(.))=1-(Л«, Т, т, »(т), z?)dt>0. (2.6)
О
то функции zz((flePf, me (t) s M3t (Т), решение уравнения
(/)— лА (Т— t)e(T~t}Aictv (/) =
т
Т, t, v(t), (2.7)
о
Если t{—первый момент времени, когда и(-)) = 0 то для /е
е (fl, Т], Ui{t)GPi—решение уравнения
^e{T-i)Ai BiUt Щ—лДЬ (T—t) e{T^i)Ai Ctv (/) = Yi (T—t). (2.8)
Ш
В силу предположения 2.1 существует одно или много решений
уравнений (2.7), (2.8). Согласно утверждению П. 2 функции
X.(i, Т, t, v(t), гр) — измеримые функции t при фиксированных
i, Т, гД Следовательно, в силу теоремы Филиппова (см. П. 7)
уравнения (2.7), (2.8) разрешимы в классе измеримых функций.
Покажем, что, применяя описанные управления w((Z), преследо-
ватели могут гарантировать окончание преследования к момен-
ту Т.
Для данного v(t), /е[0, 7\], возможны две ситуации: либо су-
ществуют номера t'i, из множества У], для которых
*/=1, л, либо менее чем для k—iq+1 номеров i,
i^Ni, f(-))>0. Второй случай невозможен в силу пред-
положения 2.2. Действительно, в этом случае не менее чем k—
—т)+ 1 номеров i из множества
т
ht(T^ МЛ т, v(T), г?)А>0,
О
следовательно,
min max ht(T-n‘, ^(-))>Д
...
что противоречит предположению 2.2.
В первом случае для j=l, ...» т) имеем
т гп
”Zf. (Т„)=nlf е у., (т) dx — J yf (т) du +
о 1 о 1
+ j (т)~Л!.Рг. (7n-T)e(^~™f/C(/u(T))dT +
7
+ j л,. (Z)(j (Г,- т) - Е) е,Т"~'>Л1/ CljV (5) dt=
О
т
у л Т) 1
==(niye 11 Vj (t)drj (1— J МО, т, ц(т), zJ)dT)-f-
0 о
+ X(t/, т, и(т), z°ij)mij(x)d't^-
о
+ jj щ. (Di. е(Тт1 Х}АЧ Ct)u(T:)dxе Mj., (2 9)
о
112
Таким образом, к моменту не менее т| преследователей с номе-
рами из множества ловят убегающего. Теорема 2.1 доказана.
Перейдем к рассмотрению примера.
Пример 2.1. Пусть дифференциальная игра описывается си-
стемами уравнений (1.19). Рассмотрим для этой игры задачу
преследования при r-кратной поимке убегающего.
Предположение 2.1 для игры (1.19) выполнено для всех />0,
если pi>o, ргрхгщ-. Достаточным условием выполнимости пред-
положения 2.2 для игры (1.19) является, например, следующее
условие. Существует такая положительная константа Т, что одно-
временно выполнены неравенства
6= min max min 1 v , ф > О,
ПЧ>1 =1 KjG* i£Kj \ IlBj (ЛИ /
Г» 1 _ а—Р(Т—Т)
126с-1—Ц----------шах ПЫЛИ). (2.10)
J ₽ i=l, ... , m
0
где
t /Тх _0 ,1 - - о 1 — о
It U ) = Ч-------------Zit-----~л-----2з.
Действительно, функция Л (г, Г, t, v, гр), вычисленная для приме-
ра (1.19), равна функции p(i, t, т, v, Zi°), приведенной в соотно-
шении (1.20); используя ее явный вид и неравенства р;>сг, ргр>
>оаг-, имеем
т
pr(T, z°) = l — inf max min С X (i, T, т, и(т), z°)dx^.
v() к.-esi «ек,-J
3 3 0
x ГГ 0(1 —е~₽(Т-г))2б 1 .
1 — \ ------------------------- dx.
J C^P ( max ||Bi(7')||)
0 L i=l........m J
Заметим, что неравенство (2.10) выполняется при достаточно
больших Т для любой позиции zfi, Zi2, £з. Если pi>o, piP>oa«,
то предположения 2.1 и 2.2 выполнены для 2ц, z°2, ?з из некото-
рой окрестности множества Mi.
§ 3. Групповое преследование при задержке
поступления информации об убегающем
В этом параграфе приведены достаточные условия разрешимо-
сти задачи преследования группой преследователей одного убе-
гающего, в которой информация об управлении убегающего по-
ступает i-му догоняющему с запаздыванием, характеризующим-
ся некоторой функцией /ДО» 1=1> •••» т-
Рассмотрим задачу преследования при задержке поступления
информации об убегающем, сформулированную в гл. 2, п. В, для
113
дифференциальной игры группы преследователей и одного убе-
гающего вида (2.0.9):
Zi = Лггг + Вгцг—Ср, г==1, .... rn, (3.1)
где 2, едщ е Pt cz Rpi, v e Q cz lct/cn,, Pit
Q — выпуклые компакты, Ai, Bi, Ci — постоянные матрицы раз-
мерности riiXrii, tiiXpi, riiXq соответственно. Предполагается, что
преследователям известны уравнения (3.1), множества Pi, Q, М{,
i=l, ..., т, начальное состояние z°=(zi, , 2^); в каждый мо-
мент />0 i-му преследователю известна v(-, г((/)) — функция
^(s) при 0<s</—а(0, где ri(t) при />0 неотрицательная не-
прерывная, кусочно-непрерывно дифференцируемая функция с
конечным числом разрывов производной на каждом конечном от-
резке, ri(t)^.t, гД®)=0 (значение производной в точках разрыва
принимается равным значению правой производной).
Перейдем к формулировке достаточных условий окончания иг-
ры преследования при задержке поступления информации об убе-
гающем в игре (3.1). Положим <р((/)=/—^(t). Согласно опреде-
лению функции г{(1) функция qn(t) определена для />0, кусочно-
непрерывна и имеет конечное число разрывов на каждом конеч-
ном отрезке.
Предположение 3.1. Существует множество N^ccM, непре-
рывные по г функции \i(t, т) и dt(t, т), Осте/, di(t, т)>0, та-
кие, что для 0ет</, igA/i непусты множества
М?(/)=Мг? —
Gt (t, т) — BiPi-d^t. т) Ml (<)] - [я/'-'Т'»^ C,(frt (г)]
и уг(/, т)е=Сг(/, т).
Зафиксируем некоторые функции у{(/, т), удовлетворяющие
предположению 3.1.
Предположение 3.2. Для всех i^Ni и всех />0
i
(^‘zl + ^Gdt, т)ат)ПЛ1?(О = 0. (3.2)
О
Замечание 3.1. Если предположение 3.2 для некоторых
ieA/i и /* не выполнено, то убегающего ловит игрок с номером
г’о в момент времени /* при любом допустимом управлении п(-)
(см. § 1, теорема 1.1).
В условиях предположений 3.1 и 3.2 рассмотрим функции
K(i, t, г, v, 2i)=max(X: Л>0, [ — Х(лге<Л'2? +
114
+ $Т<(Л T)dT)]n[«zeu x}AiB{Pt—di(t, т)М?(0—
б
т)]#=0}. (3.3)
Рассмотрим функцию
t
p(d z°)=supmin(l— VМ*, Ъ т, и(Ф*(т))> (3.4)
* t>(-) ieAV 0«> >
где £>(•) — измеримая на интервале [0, d функция, принимаю-
щая значения из Q. Обозначим через T(zP) корень уравнения
p(d z°)=0.
Предположение 3.3. Для позиции г° T(z°)<oo.
Теорема 3.1. Пусть для игры (3.1) в позиции z? можно
указать множество для которого выполнены предположе-
т
ния 3.1—3.3, причем т)с/т=1, i^Nr. Тогда для позиции
о
г° разрешима задача преследования при задержке поступления
информации об убегающем, причем Т (z°) — гарантированное вре-
мя преследования.
Доказательство. Пусть для позиции z° выполнены пред-
положения 3.1—3.3 и v(t) — произвольное программное управле-
ние убегающего. Определим при />0 функцию
t
Pi(t\ и(ф;(т)), 0<т<:/)=1— j X(t, Т, т, о(фг(т)), z°)dT. (3.5)
о
Обозначим через t\ первый корень уравнений рг(t\\ о(ф1(т)),
5^ /1)-—0 (если рг(Р, и(фДт)), О^т^0>О для всех /е[0, Т], то
полагаем i\=T). Выберем функции цДт)еРг, ml (т) е Ml (Т), в мо-
мент т е [0, /1] как решение уравнения
л/г-™гBiUi(T)—dt(T, т)ml(т)—л/г-ф*<Г),л«(т))фДт)=
т
==Yi(/t т)—Х(г, Г, т, п(фДт)), zl) ^ieTAiz° + ^ уДТ, т)с/т), (3.6)
о
а в момент tg(/J, Т] функции «г(т)еРь rn? (т) е Ml (Т) как реше-
ние уравнения
лге(7’-г)Л* Byut (т)—dt (Т, т) ml (т)—
— л/г"(рг(т))^С^(фг(т))ф1.(т)=уг-(/, т). (3.7)
В силу предположения 3.1 существует одно или много реше-
ний уравнений (3.6), (3.7). Согласно утверждению П.2 функции
115
X(i, T, t, y(<pi(O), Zi°) — измеримые функции t при фиксирован-
ных i, гД Г. Следовательно, в силу теоремы Филиппова (см.
П. 7) уравнения (3.6), (3.7) разрешимы в классе измеримых функ-
ций. При этом в момент т, Т, t-й преследователь строит свое
управление по информации в момент <р£(х)=х—г£(х) об управле-
нии убегающего. Покажем, что, применяя описанные управления
преследователи могут гарантировать окончание преследова-
ния к моменту Т. Для данного у(т), re[0, Г}, возможны две си-
туации: либо существует Для которого либо для
каждого i, р£(Г; у(ф£(х)), 0<тсТ) >0. Второй случай не-
возможен в силу предположения 3.3. Действительно, в этом слу-
чае min pf (Г; п(<рг(х)), 0^х^Т')> 0, что противоречит предполо-
жен
жению 3.3.
В первом случае имеем
т
П/,2|,(Т)=лг,етл^0 -ф JJ niae{T~s'>Ai‘Bituit(s)ds~-
о
т
“ j Cjet»(s)ds— J лг,е(Г s}Ai*Ciev(s)ds.
о 7-о/Т)
Полагая з=ф/в(т), в силу предположения 3.1 имеем
7-0/7) т
J Сг, v (s)ds -= яг/Г~Ф‘»(Т))Л*‘ Ciov (<pie (x)) <р£, (т) dx.
о о
Таким образом,
л<.г,. (0=л./'М. + {В,.^ (s) -
О
- nf.е(Т-^}А^ Ct,v(<Pi. (s))(s)] ds- $ 3Tise(r-s)^. Citv (s) ds =
7-0/7)
==(nieerMe + jjyi, (T, %)dx^ (1— j X(r0, T, t, v(q>ie(r)), zojdx) —
о 0
Г T
— J nite{T''x}Ai* Citv (t) dx + f dio (T, x) mie (x) dx=
7-0, (T) 6
T T
= [ di,(T, x)/7ii, (x)dx— ni,e(r“sMi«Ci,u(s)dse Mi,.
0 T-o,(T)
316
Таким образом, в момент Т хотя бы один из преследователей с
номером 10 из множества Nx ловит убегающего. Теорема доказана.
Проиллюстрируем теорему 3.1 на примере.
Пример 3.1. Пусть уравнения движения преследователей и
убегающего имеют вид
Xt=uit ... , m, у=и.
(3.8)
Здесь xt, у, uit v<=Rn, я>1, ||щ||ср, ||v||<o. Преследование счи-
тается завершенным, если хотя бы для одного i ||х£—I, р,
о — положительные константы. Информация об убегающем посту-
пает преследователям с задержкой rt(£)=r(/), где r(t) имеет
вид
(з-9)
( v2//, t v > 0.
Имеем
о,
т—v2/r,
т,
<Рг(т)= . , 2. 2
( 1 4-V2/T2,
0 т <z v,
Воспользуемся вычислениями примера 1.1. Предположение 3.1 вы-
полнено, если, например, р>2о,
/>o2v2+2vo/.
В этом случае Gi(t, т)э0, можно положить у£(/, т)=0. Проводя
рассуждения, аналогичные рассуждениям § 1 при выводе соотно-
шения (1.5), можно показать, что
X(t, т, v, Zj)=<p(/, т) [ ( - , сА + ( (—, uV +
V 7 k 'L\ Hi (0II ) UllUOII2 )
Ч——f (f’ T) — (a, v)B 2 1, (3.10)
llii(01l2 \ Ф20, t) v // J v 7
Ы0=г?1 + гУ’ <P(*» t) = ^—r +
Используя соотношение (1.17), можно показать, что предположе-
ние 3.3 для начальной позиции z°2, t = l, ... , m, выполнено,
например, если существует положительная константа Т, такая, что
б== min max ftp, —> О,
]|^|| = l i=l......m. \ Hi (Т) У /
т m max ]|& (Т) ||
о
I oav2 4- 2voT.
117
Исследование начальных позиций z?i, zi2, t = l, ... , tn, для игры
(3.8), из которых разрешима задача преследования, а также вы*
числение гарантированного времени преследования удобно про-
водить численно, используя явный вид формулы (3.10) в (3.4).
Замечание 3.2. Из доказательства теоремы 3.1 следует
справедливость также следующей теоремы.
Теорема 3.2. Пусть для игры (3.1) в позиции zQ существуют
множество положительная константа T=T(zfi), непрерыв-
т
ные по т, ОстсТ, неотрицательные функции ^(Т, т), J di (Т,
о
T)dr=l, непрерывные по т функции уНТ, х), такие, что для 0<
leA/’i непусты множества
Л4?(Т)=М|— J
Т-Г.(Т)
0,(7, Т)Л1!(Т)]-
Т
для всех i е уг (Т, т) е GJT, т), [ще7'4^ + J Сг(Т, т) dxj П
о
ПЛ4^(Т)=0; функция р(7, г°), построенная согласно (ЗА), удовлет-
воряет условию р(Т, z°)=0. Тогда для позиции z° разрешима за-
дача преследования при задержке поступления информации об
убегающем, причем T=T(z°) — гарантированное время преследо-
вания.
§ 4. Возможности использования метода гарантированного
неухудшения позиции в нелинейных дифференциальных играх
преследования несколькими объектами
В этом параграфе приведены достаточные условия разреши-
мости задачи преследования группой преследователей одного убе-
гающего для одного класса нелинейных дифференциальных игр.
Конкретизируем постановку задачи преследования из гл. 2 при-
менительно к рассматриваемому случаю.
Пусть движение векторов zb ..., zm в «-мерном евклидовом
пространстве Rn описывается дифференциальными уравнениями
zi = fi(zi, щ, v), i = m, (4.1)
v^Q, tPt—компакт из RPi, г —1, ... , m, Q — компакт из
RQ, функции fi (&, щ, v), i = 1, ... , tn, удовлетворяют условиям:
a) fi(zi, щ, v) непрерывна на Rn XeP,xQ;
б) существуют положительные константы А и В, такие, что (zb
fi(Zi, щ, v))^ A \\zt [|а'+В, для всех (щ, и)е^\ х Q;
118
в) для каждого #>0 существует константа CR, такая, что если
то || fi (zh щ, vj—ftiZi, uh v) || Сл||гг—- zt II
для всех (щ, v) х Q.
Пусть далее в Rn заданы выпуклые множества Mh ..., Мт,
где Mi—MP + Mi2, Mi1 — линейное подпространство пространства
Мр — подмножество в Л1, — ортогональное дополнение
к подпространству Мр в Rn- Перечисленными выше данными опи-
сана дифференциальная игра нескольких лиц (4.1), в которой при-
нимают участие группа преследователей, в распоряжении кото-
рой вектор управления «==(«1, ит), и преследуемый игрок, в
распоряжении которого вектор и. Рассмотрим для дифференци-
альной игры (4.1) задачу преследования.
Будем называть стратегией i-го преследователя ui(t') = U{(Zi>!i
Х(/—е), v (t), z°) отображение, определенное для положительных
постоянных е на множестве произвольных измеримых управле-
ний :'(/)eQ и множестве абсолютно непрерывных функций
£/($), —ecs<Z—е, таких, что Zi(s), se[0, t—е] — решение диф-
ференциального включения Zit-fitZi, Q), zf(0) = z°; Zi(s),
—e, 0] — произвольная абсолютно непрерывная функция, Для
которой Zj(0)==2i, и удовлетворяющее следующим свойствам: Для
любого измеримого v(t) и абсолютно непрерывного (s), —
<1/—е, Ui(t) = Ut (Zi (t—e), v(t), zf) измерима no t и Ui(t)^&t-
Стратегией преследования назовем вектор u(t)-=(ui(i),
где ui(t) — стратегия t-го преследователя.
Задача преследования формулируется следующим образом.
Найти начальные состояния г£°, для которых существует такая
стратегия преследования w(^) = («i(0, •••> «™(0), что по крайней
мере один вектор z((Z), i=l, ..., пг, являющийся решением урав-
нения
Ult(zt(t~&), v(t), z-),
г((0)=г?.
приходит в сколько угодно малую окрестность соответствующего
терминального множества Mi не позднее некоторого конечного мо-
мента времени.
Перейдем к формулировке достаточных условий разрешимо-
сти задачи преследования.
Обозначим через Л{ оператор ортогонального проектирования
из Rn на Li1. Образуем последовательность функций pu(Zi) и
Hi, у), /=1, .т, />1, удовлетворяющих следующим со-
отношениям:
^ifi(Zi, щ, и^Р^д+чн.^, v), <42)
(Vz.Pi/(Zi))fi(Zb Hi, п)=Рг/+1СМ + <Р£/+1(2г, Щ, v),
119
где S/zPatzi)—п X «-матрица частных производных компонент вектора
р1} по г1, ... , г”. Пусть
П,(г?, T)={si«. ?„<?), г,(0)=г?, 0<т<Л,
Г,(г», Т)={гь Яте[0, Г],. ?,=?,(*), г,(т)ЕП((г?, Л}-
В силу условий а)—в) на систему (4.1) I\(z?, Т)— ограниченная об-
ласть в Rn.
Предположение 4.1. Существуют натуральные числа ki,
непрерывно дифференцируемые вектор-функции pij(Zi), вектор-
функции ui, о), /=1, ..., kt, положительная константа 0,
такие, что для всех те[0, 0], i=l, ..., m, ueQ, 0), мно-
жества Ki(Zi, f?i, v, т) выпуклы,
(}Дгь т)= П K(zit v> I) (4.3)
veQ
непусты, где
ki
Ki(zlt щ V, т)=У <Pj/(zb uh у) -1 . (4.4)
/=1
Пусть
__ fej-i
Gi(zh T)—Gi(zi, т) + -2—— ргЧ (zj). (4.5)
(Rj — 1 >1 *
Предположение 4.2. Для позиции zp, i—1, ..., m, суще-
ствует положительная константа Т<0 и векторные функции а»(т),
yi(zi, т), те[0, Г], непрерывным образом зависящие от совокуп-
ности своих аргументов, сн(т) +yt(Zi, x)&(ji(zi, т), для которых:
а) множество
ЛГ,=Л1?Л-{$?1(г,«. T-z)dr, MtJelVz», Т)}
О
непусто;
б) существует вектор 0, е такой, что
Ъкг-Х (г«, Т)=л/г?+Л1(гО)Т+ ... +
/i-1 л
“77---Г7Г + I ai <т—т)dT—°’ (4-6>
• * J * *»
0
У IIЛ||—f inf inf (У Л(/, T—т, T, zh v)\dt^Or
7 (4.7)
120
где
X(i, т, Т, 2°, 0=тах|х : О, [—(г°. Л)1П
V1
П [jGfe *><. V’ т»~‘Ч(г')-(£Го7
Vl (г;. Т)—«|(т>|= 01.
(4.8)
Ч-> (4 О=
E|t|-i (4- Т)
НЦ-i (г?. Т) ||
»=1, ...
позиции
Теорема 4.1. Пусть для игры (4,1) в позиции zf,
m, выполнены предположения 4.1—4.2. Тогда для
2л' i—\t ? т, разрешима задача преследования, причем Т —
гарантированное время поимки.
Доказательство. Пусть в позиции г,0, 1=1, .щ, для
игры (4.1) выполнены предположения 4.1—4.2. Если пД/), v(t) —
некоторые допустимые управления и гДД — решение уравнения
(4.1) соответствующее этим управлениям, zt(0) —zp, /€=е=[0, Т]5 то
z’ t
+ j KifitZt, uh u)dx.
о
Используя соотношения (4.2), с помощью интегрирования по ча-
стям получим формулу
ад(/)=ф^-1(^ £) +
t (t \
+JрШМ, «М »<*), <4-9>
о
(t, +
функции pik (Zi), Ki(zh uh v, т) определяются соотношениями
(4.2) и (4.4) соответственно. Пусть е — произвольно малая по-
ложительная константа, величину которой мы укажем далее,
2/(т)=л°, те[—е, 0].
Предпишем г-му преследователю строить свое управление щ в
момент t следующим образом. Если в момент />0 величина
Pi(^; 2j(T—8), о(т), 0^T</)=||^ft._i (z°, Т)]| —
J Я, (Л Т—х, Т, Zi(T—&), y(x))dT>0,
о
121
то ut(t)—решение уравнения
Kt&ft-e), и„ и(0, r-O + P,t.fe(f-e)) =
1 1)1
= »i(0 + Yi(^i(/— е), T — f) —
-Ж T—t, T, z^-8), T). (4.10)
Если t\—первый момент времени, когда р4(/1; Zt(T—е), п(т), О^т^
/1)=0, то для t е (t\, Т], мг(/)—решение уравнения
е), щ, v(t), T—t) + Piti(zt(t—e))
=а,(/)+Т|(г,(/-е), T-t). (4.11)
В силу предположения 4.2 существует одно или много реше-
ний уравнений (4.10) и (4.11). Покажем, что среди них можно
выбрать измеримое. Согласно утверждению П.2 функция Х(г, Т—
—т, Т, у(т), z/(t—е)) — измеримая функция т при фиксирован-
ных i и Т. Поэтому из предположений 4.1 и 4.2 в силу теоремы
Филиппова (см. П.7) следует разрешимость уравнений (4.10) и
(4.11) в классе измеримых функций. Таким образом, управление
преследователя и, (f)=Ui (/—е), v(t), Т—е, г?) — измеримая
функция t. Подставляя ее в уравнение (4.1), получаем, что гД/),
2г(0)=гг° — решение уравнения
2г(/)=Л(гг(0, Щ&Ц— е), v(t\ T—t, z°), v(t))=Fi(Zi(t), t, u(/)),
существует и единственно на каждом из отрезков [ле, (тг+ !)«!
/2=0, 1, ..., и, таким образом, определено для всех />0.
Покажем, что, применяя стратегии Ui(t), выбранные как ре-
шения уравнений (4.10) и (4.11), преследователи могут гаранти-
ровать окончание преследования к моменту Т. Действительно, со-
гласно (4.9) для векторов zt(T), i=l....m, справедливо пред-
ставление
nizi(T)=coi(T)-l-^(T) + (o3(T),
где
т т
(01(Т)=^г_1 (Т, 2°)—Pi+ j af(T—т)б/т) + J (КДгДт—е), цДт).
о о
Л_1
v (г), Т—т) + ptk (Zt (т — 8)) -----(Т—г)—(^ (т—s),
Т
Т-х))Лт, Г-т)Л+₽„
(4.12Q
122
* / k_J \
tf(T) = f ИМ). Ш f(T), T~T)+p.A (zf(r)) -(-^-I)-~ J dx —
U \ i (tfj —1)1 /
T / fc_| X
— J \ Ki(Zi(x—e), щ(х), v(r), T—r)^ptfei(zf (r—e)) j dx.
В силу предположения 4.1 если щ(/), v(t) — произвольные допу-
стимые управления, то IIсо;3(Г) НсС^, где С — константа, зави-
сящая от игры (4.1) и Т. Из (4.10)—-(4.12) следует
П(11ц_1й, Л11-
т
—j*M*> Т—х, Т, е), v(x))dx).
о
Если v(t) — произвольная стратегия убегающего, то возможны
две ситуации: либо существует номе;р j01 для которого ли-
бо для каждого i, i=l, ..., tn, рД у; гДт-в), о(т), 0<т<7,)>0.
В первом случае преследователь с номером io приводит траекто-
рию zj0(/) в любую ех-окрестность множества М в момент вре-
мени Т при е=в1/с, так как согласно выбору стратегии преследо-
вания
Т) Q || Ьл_, (г»о, Т)||-
<’•
- f Л(/„ Т-х, Т, г,.(г-е), ао(т))Л-Ьш|1(Т) + Ч<Л=
о
== JJ Т/о (т—8)> т—т)dx -Ж- Pi.+®t СО е
б
Второй случай невозможен в силуэт предположения 4.2. Действи-
тельно, если имеет место второй слу^учай, то для всех i
II И?(О + ^(ПП1 ||=|1Ц-|(г?. Л II-
т
— J X (Z, Т — т, Т, zt (”) (т—е), Дт)) dx > 0.
о
Следовательно,
m m
£ ||«ft(n-Mf(T)-o)?(T)liloil=£ll^-i(4- ЛИ-
i=i i=l
Т m
— § Т—т» Тх 2,(т—е)( v (?)) dx > 0,
О 1=1
123
что противоречит предположению 4.2. Таким образом, в момент
времени Т хотя бы один из преследователей поймает убегающего.
Это завершает доказательство.
Пример 4.1. Проиллюстрируем приведенные условия пресле-
дования на примере. Законы движения преследующих и убегаю-
щего объектов задаются уравнениями
Х{4-/1(л:£)=р£иг, /=1, ... , т, (4.13)
у + Цу)=ои. (4.14)
Здесь Xit у, ui, v — векторы h(xi), 1(у)—х-мерные С1 (/?*)-
функции, удовлетворяющие сформулированным в начале парагра-
фа условиям а)—в), ц,-, v — управляющие параметры ||Нх||<1,
||v|| <1; pi, о — положительные константы. Преследование считает-
ся законченным, если для некоторого i в некоторый момент
t Xt (t) + Sr (0) до у (t), S?(0)—шар в RK с центром в нуле радиуса
r>0.
Перейдем к соответствующей дифференциальной игре. Для
этого положим
2i = (2iV г;2, z3, z4) = (Xi, х^ у, y)t=R\
Из (4.13) и (4.14) имеем
^•1=^2» ^2= ~Л(^2) +Р,«г, г3=г4, z4=—Z(z4) + oy. (4.15)
Терминальное множество Mt имеет вид zfl + S* (0)zoz3j;
0, ~Zil+*8-, о\.
1 \ 2 2 Г
Положим
h (z/2)=p sin (v £ zQ e, I (z4)=pcos (v J z'4je,
' /=i V /=i 7
где e—х-мерный вектор, все компоненты которого единицы, е и х—
положительные константы. Пусть
<»=(?, 0, Ч0)е11, СеR*.
обозначим л(о=£. Для проверки предположений 4.1 и 4.2 необхо-
димо выбрать ki и провести вычисления в следующем порядке:
(4.2), (4.4), (4.3), (4.5), (4.7), (4.8), (4.6). Выпишем предполо-
жения 4.1, 4.2 при k^2, ki=3, t=l, ..., m, для игры (4.15).
Если ki=2, i=l, ..., т, то
124
лК^г,, ut, v, т)= р№2 t, nGi(zh т) =
= Sp._„ JO), xGt (z„ т)=3^ J0) + (/W-
2 —2
_ 7° — 2° 2° — 2°
-Л(М)(т/2), ^г1(г?,Т)=-^г^ + -^-^Т.
Положим лаг (г) = О, луг (zit t)=~-(Z(z4)—h(zi2))r, pf = 0. Таким об-
разом, предположение 4.1 будет выполнено, если р^о, i=l, ...
..., т. Согласно (4.8)
МЛ т, T,z?,v)=~
( "Sa (г?. Г) \
V №(??, Dll /
D \ 2 , 2 2/ Л4-
—----------, V CT2 + p2 —О2(у, V) 2
I№(Z?, Dll J J
Обозначим
m
min VX(Z, т, T, v)=8(z°, D—.
IMKl 2
1=1
Предположение 4.2 будет выполнено, если найдется такое Т>0,
что
tn
6(4 Т)>0, ||лЕ(1 (4 Т)||<6(4 Т)^~, г>рТ.
1=1
Отметим, что если pi>o, i=l, пг, то величина 6(гД Т) всегда
положительна, если р/=о, то условие б (гД Т)>0 — это условие
на начальной позиции и момент времени Т.
Если ki=3, i=l, .tn, то
лргз ((V^)/i—(у*/) /),
™ргз (г4)=4- (G (Vj) v~ Ре u0.
л/Ct (zt, ut v, т)= piUi2 т + -j- (о (v2/)o—Pi (vz. й) ut)
Л&2 D=---------------1----о----"T-------"a... 1
125
Положим
n?i (zb т)=-1-((уг ft) h—ft 1)1)
ла{ (r) = 0, пре a 0.
Пусть
x
at (2f8, T)= M—p-vcos zQ -y),
x /=1
и
bi (Z4, T) = f -Ь -I- pV sin ( £ ~ ) -
\=i
Согласно (4.8)
1 / • T 0 -j b i Я^2 (4» П ।
r, T, zt, zb v)=obi(z^, t)I —---------, v +
V ||лЬ(2?> T)|| J
/ 9 / n|i2 (г?, T) V „ \ —
+1 o2bi (zif т) I —--------, V + р?п2(гг-2, v—v bt (z4, x) (у, r) 2 .
V ll"b (*?, T)ll ) J
Обозначим
m j
min min V Х(г, т, T, zb zb у)=6(т, z°).
ZieRx MKt
Предположения 4.1, 4.2 будут выполнены, если найдется положи-
тельная константа Т, такая, что б(т, z°)>0, О^т^П
m т
^1|й|{2 (z°i, Т)|К^6(т, z^dx, р><2/Г, ог>3о,
i=i о
Заметим, что предположения 4.1 и 4.2 имеют различный ха-
рактер в зависимости от величины ki. Предположениям 4.1 и 4.2
можно удовлетворить при /г(-=2 выбором у, при любом конечном
v, а при ki=3 выбором v при любом конечном р.
§ 5. «Тонкий» случай в задаче группового преследования
Способ преследования, описанный в § 1 этой главы, суще-
ственно использует функции у (t, т, v, Zi°), определяемые соот-
ношением (1.11). Они строятся по параметрам задачи и в зави-
симости от параметра v могут либо равняться нулю, либо быть
положительными. С их помощью удается описать так называемую
«ситуацию окружения» преследователями убегающего: при лю-
бом управлении v убегающий сближается хотя бы с одним из
126
преследующих. Положительность функции p(i, 0, т, и, zP) как
раз характеризует сближение убегающего с Ам преследователем.
Анализируя определение функции p(i, 0, т, v, z/°), можно заме-
тить, что если параметры игры (1.8) таковы, что множество
ЛгФг(^(0), <Pi(0, т))^(<рг(0, т), Р{(фг(0, г)))—т?(т, 0)
как многозначное отображение, зависящее от те [0, ©], например
поворачивающийся отрезок, то функция р. (/, 8, г, v, z(°) равна
нулю при почти всех те [0, 0], и теорема 1.1 перестает быть эф-
фективной. Параметры игры, при которых функция p(t, 8, т, v,
zt°) равна нулю для почти всех те [0, 0] мы далее будем назы-
вать «тонким» случаем в задаче группового преследования.
В этом параграфе мы приведем модификацию способа преследо-
вания § 1, позволяющую исследовать задачу группового преследо-
вания в «тонком» случае.
Рассмотрим для дифференциальной игры (1.8) задачу пресле-
дования, сформулированную в гл. 2, в которой под окончанием
процесса преследования будем понимать попадание траекторий
в малую окрестность терминальных множеств (а не на сами тер-
минальные множества). Пусть g — положительное, малое число.
Обозначим /С*(/)=шах |о, —— j — lj, где [] — целая часть
числа.
Предположение 5.1. Существуют матрицы Ft(t) и суммиру-
емые по т функции yt(t, т, в) при фиксированных /, g, такие, что
для всех i=l, ..., tn, непусты множества
J леФг(/, s)fi(s, Pt(s))ds J s)gi(s, Q(s))ds=
<‘o+K*(t)e i'04-7<*(T)e
= w\(t, T, 8), (5.1)
М-(К*(т)+1)е М-(Д*(г)+1)е
j Л(«))^^(0 J
t т
x gi (s, Q (s)) ds—wt (A t, e),
р,<м. s)gl(s;Q(s))ds,
io
T АМК’ЙНЩ
т, e) еэ | yt(t, s, e)ds, t, s) =э J yt (t, s. e) ds.
*о+К*(т)е т
Положим
Вг(/)=л^г(/, ^)г4(/0) + у^(^, Т, e)tfr. (5.2)
io
127
Определим для те[/0, /], i'6Q|s) функции
Л(/, т,
Л МД,
тах|Л:%^=0, — Х(л^ФД/, f0)zi(t0) +
+ §уД*, Ь е) dx—M3i (0]} Л
П[ J MM*» s)fi(s> p.(s))ds—
<o+K*(r)8
(5.3)
—Л (О | л4ФД/, s)gi(s, y(s))dsj^0,
А>+К*(т)е
если В,<<) Л Af?(O=0;
(«—У*, если В, (ОП«’(0=^0!
_ К*(0
р(1; z°, е)= sup min (1— V X(z, /е, t, иД-), е)—
»/(•) i=1..............т {
— к(г, t, t, уД-), e)j, (5.4)
где vt(‘) — измеримая на интервале До, Д] функция, принимаю-
щая значения из множества Q(s). Обозначим через T(zQ) поло-
жительный корень уравнения р{/; 2°, е)=0.
Предположение 5.2. T(z°)<oo,
Теорема 5.1. Пусть для дифференциальной игры (1.8)
с терминальными множествами Mi+Ske(Q) в позиции zQ выполне-
ны предположения 5.1—5.2. Тогда для позиции 2° разрешима за*
дача преследования к моменту времени Т (2°). Здесь k — положи-
тельная константа, зависящая от игры (1.8).
Доказательство. Пусть для ^позиции 2° выполнены пред-
положения 5.1 и 5.2 и v(f) — произвольная измеримая функция
/е[/о, Т], Определим функцию v(t): для [0, е),
v(t) — произвольная измеримая функция со значениями из Q(i)
для Qss, v(t)=v(t—в). Зафиксируем т, to^x^T, и определим
векторы т/3( Г, т)&И/3(Г), шДт)е J л;ФДТ, s)fi(s, Pi(s))ds,
К*(г)8
удовлетворяющие уравнению
wi(T)—j л4ФДЛ sjgt (s, v (s)) ds=
fo+K*(T)e
= Yi(^> s> eMs—T» v(-)> e) x
i»+K4T)8
r
X (П|ФДТ, ^)гД^)-т?(Г, т) + |уДТ, s, e)ds).
128
В силу предположения 5.1 такие векторы существуют. Предпишем
t-му преследователю строить свое управление Ui(t) на отрезке
Uo+1)е> ^о + ^е], fc=l, k*(T), следующим образом. Если
величина
k ~
p(fe; y(s), /0 + /г8)=1—£ Mg ^8> T, v(-), e)>0, (5.5)
/=i
то значение функции «((/)еРД0 в момент времени t — лексико*
графический минимум решений уравнения
лгФ4(Л Ш «{(0)=о>/(Т, /), (5.6)
где вн(Т, f) — измеримый селектор многозначного отображения
sttOi(7’} , такой, что
J <Oi(T, s)ds=Fi(T) J nACG s)gj(s, u(s))ds4-
(k— 1) e (*—l)e
te ~
+ yJP, s, e)ds—X(t, &8, T, v(-), e) x
(*—1)8
X (л4Ф((Г, t)zQi — m3(T, £e)+|Ti(P, s, e)ds].
^0
Если при некотором k, 1 ^k^Zk* (T), величина p(&; v(s),
t0 + k&) < 0, то рассмотрим для 11 e |7У + (k—1) e, Zo 4- £&] функцию
— k~~1 ~
Pi O'; v(s), £ Mg /e, T, t^(-), 8)—•
i-i
—Mg t. T, vt(-\ 8). (5.8)
Обозначим td — первый момент времени, когда pi (^‘; f(s)>
Для t^[k+(k—l)e, M], «ДО — лексикографичес-
кий минимум решений уравнения (5.6), причем измеримая по t
функция ®t(T, /) удовлетворяет условию
J Wi(T, s)dt=Fi(T) J Л/Фг-(Т, s)gi(s, v(s)) ds +
(*—l)e (*— l)e
4
4- J Vi^. s> ®)ds—Z(z, t\, T,v(>), 8) x
(*—1)8
X + s, e)dsj. (5.9)
^0
5 H Л Гри'^р'ч;.о
129
Для Zs(£/, /о+^е] значение функции «/(/) в момент времени
t — лексикографический минимум решений уравнения (5.6), при
том условии, что измеримая по t функция он (7, t) удовлетворяет
уравнению
J ®f(7, s)ds=Fi(T) J лгФг(7, s)gi(s, v(s))ds + $ у^Т, s, e)ds.
4 4 4 (5.Ю)
На отрезке (Лге, 7] управление ui(t) строится так: на каждом
из отрезков [&е, (Л+1)е], [(& + 1)е, (6 + 2)е], ... [£*(7) в, 7],
«г(0 — решение уравнений (5.6), причем функция 0/(7, t) удов-
летворяет условию (5.7) при X(t, т, 7, v (•), где т — пра-
вый конец соответствующего отрезка, и в формуле (5.7) сделаны
соответствующие замены ke и (k—1)е на границы рассматривае-
мого отрезка. В силу предположения 5.1 уравнение (5.7) разре-
шимо в классе измеримых функций. Согласно приведенным пост-
роениям и в силу теоремы Филиппова (см. П. 7) функции
ui(t) — измеримые функции t, 7]. Покажем, что, применяя
описанные управления щ(0> преследователи могут гарантировать
окончание преследования к моменту 7(г°). В силу предположения
5.2 существует номер inEF, для которого /1г'°^7 (доказывается
от противного). Согласно (5.7), (5.9), (5.10) имеем
т т
niQZio СО=лгоФ,0 (Т, ЪАТ> s’ e)rfs+ \ лг„Фго (7, s)x
Т
х ft, (s, Uio (s))ds—Fie (7) $ Л;оф;о (7, s) g.* (s, v (s)) ds—
it
T T
— s’ s)ds+(fie(7)—E)J( л2оФго (7, s)^.o(s, v(s))ds=
го t 0
T **(4°) M-/e
= (л/4Ф^(7, /e)z°0 + J ?г,(Л s, e)ds)+ £ [ J Я(Д(7, s)x
i=l fo+U-Ue
io-He
X fi (S, uio (s)) ds—Fi, (7) $ лг„Ф/(, (7, s) g (s, v(s)) ds—
io+0-Пе
fo+^8 4°
— J s> e)dsj-f-£ лгвФ|0(7, uj0 (s)) ds—
/Жг-1)в 4+й*(4°)е
4’ ^i°
-F,.(T) $ я,.Ф,.(Г, v(s))ds- у T(i(T, s, e)ds]+
io4-fe*(ije^e * (i 1°) £
130
г т
+ i" (Л s)/i(s, uia(s))ds—Fi(T) s)g. (s, v(s))ds~
4° 4°
г т
s> е>^ +<^(Т)-Е)\п1аФ1о(Т, s)g. (s, v(s))ds=
4» it
T k*(i\O)
= (ягоФ10(ЛМ2г00-^^у/о(Г, s, г) ds) — £ [%(г, 1г, T, v(-), e)x
х(л|.Ф!.(Л/»)г”.+ 5?!.(Л s, e)ds-m’/r, /в))]—
fo
T
—[%(Z, T, v(-), в)(л1.Ф(.(Т,<Х + $?(.(Т, s, s)ds-
to
T
-тЦТ. #))] + (Fi. (T)-E)$ Ж.Ф.. (T, s)g (s, »(»))*=
I»
**(4°>
- £ K(l, te, T, v(-), /в) + МЛ t'l', T, v( ), e}m?AT, <{•)+
1=1
\T
+ (f,. (T)-E) J it,.®,. (T, s)glt (s, o(s»<fa> M(T). (5.11)
to
Таким образом, в момент Т хотя бы один из преследователей
обеспечивает приведение траектории игры на терминальное мно-
жество по информации о фиктивном управлении убегающего
v(t). Повторяя рассуждения § 2 гл. 1, нетрудно показать, что тра-
ектория игры при реальном управлении v(t) отклонится от траек-
тории игры при фиктивном управлении v(t) на величину, не пре-
восходящую ke, где k — константа, зависящая от параметров
игры. Таким образом, в момент Т хотя бы один из преследовате-
лей окажется в ^е-окрестности терминального множества. Выби-
рая е достаточно малым, мы можем окончить игру в любой доста-
точно малой окрестности терминального множества. Теорема 5.1
доказана.
Пример 5.1. Рассмотрим дифференциальную игру m пресле-
дователей и одного убегающего, описываемую уравнениями
г=1......т’ г*(°)=4 <512)
5*
131
где
z^jR2, щ<= Р с= R1, v^QczR1, P={u:u<=R\ |и|^ 1}, Q =
= {у:у^/?1, |и[^1).
Терминальное множество Л14={гь zf = 0}, е—л. Обозначим Г(/)==
Г sin 11
= Lcos/J ‘ ®ычислим § F(t)dT, используя аппарат опорных функ-
₽
ций [13], Имеем c(F(t), ф)= |sin/4-Ч>2cos/1. Если 1|ф|| = 1, то
обозначим ip1=cosa, \[?a=sina, откуда c(F(t), ф)= [sin(/-f-a)[. Тогда
₽+л р-}-Л р+л
c(F(f), ^)dt— J |sin(/-[-a)]d/ = 2, следовательно, F(t)dt,
P ₽ ₽
i]))—2 для всех ф, ||г|)|1 = 1, и в силу свойств интеграла Лебега [13,
₽4-л
20] получаем, что j" F (t) dt=Sl (0). Таким образом, предположение
₽
5.1 для игры (5.12) выполнено. Функция %(i, k&, v, е) имеет вид
Ш k&, v, V) v)2 + (z°i, z?)(4—(?, a))],
II г1 11
~ f rsin/ъ
где v= \ I qs Jp(f)dt. Предположим, что начальные позиции
(fe—i)8 L
z(° таковы, что
6(z°)= min max
S-sAn, ?==1..m
vES2(0)
zi
Ин
Тогда, используя (5.5), явный вид функции K(i, ke, v, &) и ут-
верждение IL 3 для функции р(£е, 2°, е), получаем оценку
Р (fee, z°, е) 1
26 (*°)
max' || z? || т
• 1
Таким образом, если 6 (z°) >0, то игра преследования из позиции
2° разрешима, причем ["( max || z°|| /п)/(26(z0))"]л— гарантиро-
i— 1, .. . ,т
ванное время преследования. Здесь Г — наименьшее целое чис-
ло, большее или равное t.
Глава 5
МЕТОДЫ ГРУППОВОГО ПРЕСЛЕДОВАНИЯ
РАЗНОТИПНЫМИ ОБЪЕКТАМИ
§ 1. Метод покрытия
В этом параграфе мы приводим достаточные условия разре-
шимости задачи преследования группой преследователей одного
убегающего в том случае, когда инерционность преследователей
больше инерционности убегающего. Предлагаемый способ пресле-
дования предписывает преследователям выходить в такие пози-
ции, относительно которых терминальные множества покрывают
область неопределенности убегающего, образующуюся в процессе
игры.
Рассмотрим дифференциальную игру группы преследователей
и одного убегающего (2.9), описанную в гл. 2:
z^AiZi-^BiUi—Civ, (1.1)
где Zi е Rni, Pi cz RPi, yeQcT?17, p^l, q1, Pif Q—вы-
пуклые компакты, At, Bi, Ci — постоянные матрицы размерности
riiXrii, tiiXpi, n-iXq соответственно. Пусть /V—{1, 2, .m}.
Предположение 1.1. Существуют множество щХщ
матрицы Di(t), измеримым образом зависящее от t, />0,
такие, что для t>Q непусты множества
(t)=TCietAiBiPi^-niDi (/) etAiCtQ, i е А\.
Предположение 1.2. Для позиции z° существуют векторы
L\, Zi^ Rn*, Pjd RPi, ^y(t) -^.ieiAiBiPiJLniDi(C)eiAi C&,
i e Ар и положительная константа T, такие, что:
а) для любого
т
— ftieTAiz°i е ot + jj coj (т)(/т; (1.2)
о
б) для любой измеримой функции у(т), те [0, Г] со значени-
ями из Q существует номер i^Ni, такой, что
т
J лг (Di (Т—т) —Е) еА^х}С^(т) t/т е= ссг + Mj. (1.3)
б
Теорема 1.1. Если для игры (1.1) в позиции z° найдется
множество Аь для которого выполнены предположения 1.1 и 1.2,
то для позиции zQ разрешима задача преследования к моменту Т.
133
Замечание 1.1. Если dim Z.?=vz=v, и существуют
линейные, взаимно однозначные отображения Л: такие,
т
что векторы —т)—Е)е(Г-т)Л'Сгр(т)с1т не зависят от i,
о
i^Ni для произвольной измеримой функции у(-) со значениями
из Q, то условие б) предположения 1.2 имеет вид
т
*€Л\ о
Таким образом, в этом случае проверка условия б) есть решение
задачи о покрытии выпуклой области системой заданных мно-
жеств.
Доказательство. Пусть для игры (1.1) в позиции 2° для
множества Afi выполнены предположения 1.1 и 1.2. В силу усло-
вия а) предположения 1.2 и определения интеграла Лебега от
многозначного отображения [13, 20] для zp существует измери-
мая функция такая, что
т
-~л/’Л‘’4=а;+§МгНт- (1-4)
о
Предпишем i-му, ielVi, преследователю строить свое управление
ut в момент t, [0, 7], как решение уравнения
л/г-,|Л1В!«г(/)=п1О1(Т-0е,’'-',лгС^(/) + о!(7’-1). (1.5)
В силу теоремы Филиппова (см. П. 7) уравнение (1.5) разрешимо
в классе измеримых функций u((/)ePi, Если преследователи
с номерами используют управление являющееся ре-
шением уравнения (1.5), a v(t) — произвольное измеримое уп-
равление убегающего, то для векторов mzi(T) в силу (1.4), (1.5)
имеем
т
о
т
+ $ (Df (Т—т)—Е) е(Т x}AiCiV (?) dx=
о
т
=-а,+f л, (О, (Т-т)-£) e(T-T)V|t> (т) Л. (1.6)
о
Таким образом, если выполнены предположения 1.1 и 1.2, то в
силу (1.6), (1.3) найдется номер такой, что (Т) е MiB.
134
Пример 1.1. Пусть уравнения движения т преследователей
и одного убегающего имеют вид
/ = 1, 2, т,
y=v.
Здесь Xi, tit, у, tri^A, ||и/!Кр, ||w||<or. Преследование счи-
тается завершенным, если хотя бы для одного i Цх,—I, р,
а, о — положительные константы. Положим z=(zn, Zi2) — (Xi—у,
Xi),
Тогда
Zn=2i2— V,
—azi2-\-Ui, 4 = 1, ..., m.
Терминальное множество Mi={z: i=l, .... m. Имеем
A-tr. l — e~at A,tr
пге 1 BiUi —----щ, rtje * Сго=и,
a
^={1, ..., tn}.
Предположение 1.1. и условие а) предположения 1.2 выполнены,
например если Р/(т)=Ц4 (т)£,
р>оо, Fi~E.
При проверке условия б) предположения 1.2 будем учитывать,
что для примера 1.1 выполнены условия, сформулированные
в замечании 1.1. Таким образом, щ, 4=1, ..., т, — центры т
кругов радиусом I, покрывающих круг радиусом р, где
Приведем значения о<, I для т=2, 3, ..., 7:
m=2, ai=a2=0, /=Р;
m=3, oi, аг, аз — три равноудаленные точки окружности ради-
усом р/2, /=узр/2;
т=4, си, аг, «з, ал — четыре равноудаленные точки окружности
радиусом р/У2, /=р/У2;
/п=5, щ, «2, ..., «5 — пять равноудаленных точек окружности
радиусом 2р/(1 +У5), /=2р/ (1 + У5);
/п=6, oi, аг, os — шесть равноудаленных точек окружности
радиусом р/УЗ, /=Р/У3;
135
tn—7, <xi=O, О2,_. •., a? — семь равноудаленных точек окружнос-
ти радиусом ТЗр/2, Z=(J/2.
При указанных I и т игра преследования разрешима из всех на»
чальных позиций.
Заметим, что приведенные значения a/, I в случае т=2, 3, 4, 7
являются наиболее экономичными [64]. В случае т=5, радиус
наиболее экономичного покрытия предположительно равен Z(5) я».
«0,609 Д; т=6, радиус наиболее экономичного покрытия предпо-
136
ложительно равен /(6) — 0,557 р
[64]. Такие покрытия изображе-
ны на рис. 5.1.1—5.1.5.
При больших т, согласно ре-
зультатам теории покрытий в R2
[53], для 1(т) имеет место сле-
дующая асимптотическая фор-
мула:
~|/2л 1 7 0.55
2|<27 Vт \ т
4-Р(т))Р, где--------------> 0.
/ ___ __ т->оо
~\/т
§ 2. Метод загонщиков
В этом параграфе мы приводим достаточные условия разре-
шимости задачи преследования группой преследующих одного
убегающего в том случае, когда среди преследующих есть игроки
как с более высокой инерционностью, чем инерционность убегаю-
щего, так и игроки с такой же инерционностью, как и инерцион-
ность убегающего. Предполагаемый способ преследования отво-
дит роль загонщиков игрокам, имеющим превосходство над убе-
гающим, другими словами, убегающий, уклоняясь от встречи
с преследователями, имеющими превосходство, вынужден сбли-
жаться с остальными преследователями.
Рассмотрим задачу преследования, описанную в гл. 2 для диф-
ференциальной игры группы преследователей и одного убегаю-
щего вида (2.0.9). Пусть N={1, ..., щ].
Предположение 2.1. Существуют множества Ni и
ад2=0, щ X ^-матрицы Д(т) и функции уг(т), непрерывным
образом зависящие от т, тТ^О, такие, что для непусты
множества
ш, (т)=я^ад -И1о( (т) ехА‘С&,
t
J ^i(Di(i—T)~E)eiLi~x)AiCiQdT, ieNlt
0
we (т) =э уг (t), ie=Nx.
Будем считать, что в позиции г° для игры (2.0.9) выполнено
соотношение (4.2.3) (иначе убегающий ловится одним из пресле-
дователей в силу теоремы 1.2.1), а функция pi(/, z°), построенная
Для (см. (4.2.5)), не имеет положительных корней (иначе
6 Н. Л. Григоренко 137
убегающий ловится одним из преследователей, с номерами из
множества jVi в силу теоремы 4.2.1). Определим функции
Л( i, t, т, v, z£°) согласно (4.2.4). Положим
t
E(t, Т, 2°)={о(т): c(t)£Q, О^т^/^7’, j X(г, Т, г, и(т), 2°)dx<
о
< 1 для всех i <= .
Предположение 2.2. Для позиции z° существуют нату-
ральное число р, неотрицательные константы 6/, Тр j=l, ..., р,
О=Т'о^Г1^... ^ТР=Т, векторы a/eLi1, /=1, р, такие, что:
а) для любого teAf2 и любого
Tj
-л(е(ТГГ/-1>Л1г.(рн)еа/^ J шДт)с1т, (2.1)
Ti-i
где at(0)=z°h Q,(Tl^)={zt(Ti-i):’zl(i) e= A,zt(t) + BtPt-CA, t<=
е[Л-2, Г,_,К г.Р’йеб.М, /=2, 3...............p;
б) для любого "^(tJeQ, те [Л-ь T/], и каждого /<={1, p}
либо существует i^N%, для которого
Ti
\ лДПДТ,— t)—E)e(Tr^AiCiv(r')d% ее ai+Ml, (2.2)
T>
J-l
либо существует i^.Nb для которого
Ti
\ X(z, T, t, y(-t), г?)dr >6^
Ti-i
причем если для u(r)sQ при каждом Je{l, •••» p},
Ti
J nf(Di(Tj~t)—E)e{Ti~^AiCiv(T)dT^a’i + M2i, (2.3)
T.
то хотя бы при одном i^Ni
£б',>1. (2.4)
/=1
Теорема 2.1. Если для игры (2.9) в позиции z° найдутся
множества и Nz, ^¥10^2=0, для которых выполнены предпо-
ложения 2.1 и 2.2, то для позиции zQ разрешима задача пресле-
дования к моменту Т.
Доказательство. Пусть для игры (2.9) в позиции г° для
множеств Ni и N2 выполнены предположения 2.1 и 2.2, В силу ус-
ловия а) предположения 2.2 и определения интеграла от множест-
ве
ва (см. [13]) для любого существует измери-
мая функция он(т, Tj, zi(7’/_i) )е<оДт), такая, что
Ti
-п,е,т/-Ч.1>л<г.(7’/_1) = а{+ \ ю,(т, Т,, г^Т^Лх. (2.5)
Предпишем i-му, i^N2, преследователю строить свое управление
щ в момент t, t^=.[Tj—\, Tj], как решение уравнения
(2.6)
В силу теоремы Филиппова (см. П. 7) уравнение (2.6) разрешимо
в классе измеримых функций Если преследователи
с номерами используют управления «ДО, являющиеся ре-
шением уравнения (2.6), a v(t) — произвольное управление
убегающего, то для векторов n,tZi(Tj) в силу (2.5), (2.6) имеем
г/
Ti-i
Ti
^niD^Tj — ^r^iCiV (т)) dr4- лДОДТ/ —т)—E)e(^“™iX
у.
/-1
Ti
xCiv(x)dx~—о4+ § ni(Di(Tj—т)—E) Д^~т)?,’С^(т)^т. (2.7)
т.
J-1
Предпишем i-му игроку, i^Ni, строить свое управление Ut(t)
в момент [О, 7] как решение уравнений (4.2.7) и (4.2.8) в за-
висимости от того, больше либо равна нулю величина /гД7, с(-))
(см. (4.2.6)), построенная в гл. 4, § 2. Покажем, что, применяя
стратегии «ДО, выбранные как решение уравнений
(2.6) для i^A^2, (4.2.7), (4.2.8) для преследователи могут
гарантировать окончание преследования к моменту времени Т.
Действительно, если о(т) — произвольное управление убегаю-
щего, то либо v{r)^.E(t, Т, z°) для всех либо существует
t*^T, для которого у(т)е£Д*, Т, z°). Во втором случае в силу
определения множества E(t, Т, z°), (2.1), (4,2.7), (4.2.8), убегаю-
щего ловит один из преследователей с номером из множества
Рассмотрим первый случай. В силу условия б) предположения
2.2 либо существуют номера i0^N2, jo^{l, 2, .... р}, для которых
выполнено (2.2), либо для всех i^N2, /е{1, 2, ..., р} выполнено
(2.3) и (2.4). Если существуют io, /о, для которых выполнено
(2.2), то согласно (2.7) и (2.2) (7\) <= М.1О, и, таким обра-
зом, игра преследования заканчивается в момент TJe^T. Если
для всех l^N2, /е{1, 2, ..., р], выполнено (2.3), то в силу усло-
6* 139
вия б) предположения 2.2 и (2.4), (2.5) следует, что убегающего
к моменту Т ловит один из преследователей с номерами из мно-
жества Теорема 2.1 доказана.
В соответствии с теоремой 2.1 решение задачи преследования
распадается на следующие этапы.
Этап 1. Найти множества векторы nietAt^it
подобрать матрицы Лг(0 и функции ул-(£),множества Nt и JV2’
для которых выполнено предположение 2.1, найти множества
МО, W(Q.
Этап 2. Если 7Vi=0, найти векторы аД константу 7Ь для
которых выполнены условия а), б) предположения 2.2. Найти
iii(t) как решение уравнения (2.6).
Этап 3. Если N^0t найти функции A.(i, t, т, v, Zi°),
найти векторы а/, i^N2, константы р, Т\, Т2, .... ТР) для которых
выполнены условия а) и б) предположения 2.2. Найти «/(/) как
решение уравнений (2.6) для (4.2.7), (4.2.8) для геДД
Перейдем к рассмотрению примеров.
Пример 2.1. Пусть уравнения движения трех преследовате-
лей и одного убегающего имеют вид
xi — ui> х2=и21 х3=и3, y=v.
Здесь хь щ, y,~uf^R\ || щ || рь ||у||<а, z = l, 2, 3, р] = р2=р,
р3—ст. Преследование считается завершенным, если хотя бы для одного
i 1|х£—J/Ц^Д где li=l2=l, /з=0, рь о, I — положительные конс-
танты.
Положим
(^il> ^г*2, ^з) (Xi У> Xii Х3 У)> I 2.
Тогда
zi2—V, zi2=Ui, z3 = u3 —v, t = 1, 2.
Терминальные множества Л4г = {гг: |[ zix || 1}, z = 1, 2, M3 — {zx: z3==
= 0} (J {22: z3=0). Имеем BiUi — tui, K^^CjV—v, z = I, 2,
n3eAsiB3u3—u3, n3eAsiC3u==v, {3}, Лг2={1, 2). Предположение 2.1
выполнено, если для i^.N3, /Д (т)==р((т)Е,
тр/(Г, если О^т^о/р,
1 , если т>а/о,
Г)3(т) = Е; уДт) = 0, Z=l, 2, 3.
Так как для г^^1 <о(-(Т)=‘5тр-иг<т)о (0), 3Л(0) шар с радиусом
г и центром в начале координат, то для любых конечных zlX{Tj-x)9
140
00=4
aj, найдется конечное число Th для которого выполне-
но условие а) предположения 2.2:
Ti
J лДО; (Ту —т)—£)е(7 “т)Л'С,г-(т)б/т se 5^(0),
TJ 1 2р
jT3ec»TzO=2O; условие б) предположения 2.2 выполнено, если
ai{=at, г=1, 2, /=1, 2, ..., р;
/ЛЧ 1 I 2з / о2
a{ = af(6) =—------------------—
2 \ ||Z0|] 2р
ст4 . <726
2р2 .iv
z=/(6)=-l-
где векторы щ, W = 1, определяются условием (£з°, ei)=0, ei=—e2t
6 — положительный параметр, который мы можем выбирать.
При этом
Р 26
j Л(3, Т, T—t, v(f),
!2311 1 . 1 г л
ij — целая часть числа, и игра
разрешима из всех
Таким образом, р =
преследования при указанных 1=1 (б), б>0,
начальных позиций.
Заметим, что величину б имеет смысл выбирать в пределах
0<б^-^—, так как при больших б убегающего может поймать
2р
каждый (либо первый, либо второй) преследователь (см. теорему
1.2.1).
§ 3. Метод прочесывания
В этом параграфе приведены достаточные условия разреши-
мости задачи преследования группой преследующих одного убе-
гающего в том случае, когда среди преследователей есть игроки
как с равными динамическими возможностями по сравнению
с убегающим, так и с динамическими возможностями, отличаю-
щимися от динамических возможностей убегающего.
Предлагаемый метод взаимодействия преследователей предпо-
лагает разделение преследующих игроков на две группы, первая
из которых удерживает убегающего в некоторой области, иначе
убегающий будет пойман, а второй осуществляет прочесывание
этой области, гарантирующее поимку убегающего в случае его
нахождения в этой области.
14L
Рассмотрим дифференциальную игру группы преследователей
и одного убегающего, описанную в гл. 2 в том случае, когда ди-
намика игры описывается уравнениями (2.9). Пусть 7V={1, 2,
т}, AifW3=0.
Предположение 3.1. Для i^Ni выполнено предположение
(4.2.1), однако функция pi (£, z°) (см. (2.2.5)) не имеет положи-
тельных корней. (Если N\=0, то считаем N3=N.)
Пусть Т — произвольная положительная константа, н/(т) —
произвольное программное управление, /<=Аз, Обозначим
£(/, Т, а°)={у(т):0<т<Т, o(t)g=Q,
i
J%(i, Т, т, и(т), z?)dx<l, jeAfJ.
о
П р е д п о л о ж е н и е 3.2. dim L;l=v,=v, teAfj, существуют ли-
нейные взаимно однозначные отображения Fi: такие, что
t
векторы ~х}А^Сщ (т) dx не зависят от i, i^N3 для всех
д
v(t)^E(1, Г, д°),
Рассмотрим для teA3, (е [О, Г] множества
t
Q(/, Т, ?<>) = { —JР^~х]А^С^(х)дх, у(т)«=Е(/, Т, z0)},
о
t
-FiTtie^izl- Finie^^BiU^dx + FiMl,
о
M(t)= и вд
Предположение 3.3. Для позиции г° существуют положи-
тельная константа Т и допустимые управления щ(1),
/сеЛ'з. такие, что для некоторого момента t*^T,
^>Q(t„ Т, zQ).
Условие А. Скажем, что для множеств M(t), Q(t, Т, zQ)
выполнено условие А на отрезке [Т1, Т2], (условие-
прочесывания множеством M(t) множества Q(t, Т, z°) на от-
резке [Л, Т2]), если существует непрерывная функция £(х, /):
RvX[Tl, T2]->-Rl, такая, что:
a) Q(T\ Т, &)с:{х:Цх, П)^0),
<2(Г, Т, г°)П{*:£(*> ^)=О}=^0;
б) М(0=э(?а, Т, 2°) П (х: 1(х, 0=0} для всех [Г1, Т2];
в) М (Г2) о Q(Т2, Т, 2°) П {х: В (х, Т2) 0}.
Предположение 3.4. Для позиции zQ существуют управ-
ления и(, ieAT3, и положительные константы Tl, Т2, Т,
Q^Tl^CT2^T, такие, что для множеств M(t), Q(t, Т, zQ) выпол-
нено условие А на отрезке [Г1, Г2].
142
Теорема 3.1. Если для игры (2.9) в позиции z® можно ука-
зать множества N\ и Ns, для которых выполнены либо предполо-
жения 3.1—3.3, либо 3.1, 3.2, 3.4, то для позиции z° разрешима
задача преследования к моменту Т.
Доказательство. Пусть для игры (2.9) в позиции 2° для
множеств АГ] и Л'3 выполнены предположения 3.1—3.3. Предпи-
шем i-му преследователю, i^Nl} строить свое управление
в момент ie [О, Г] как решение уравнений (4.2.7), (4.2.8), а i-му
преследователю, геЛг3, выбирать управления z/((f), для которых
выполнено предположение 3.3. Покажем, что, применяя стратегии
mit), преследователи могут гарантировать окончание преследова-
ния к моменту Т. Пусть v(t) — произвольное управление убега-
ющего. Если хотя бы для одного
t
— $ Т, г°),
о
то убегающего в момент Т ловит один из преследователей с номе-
ром из множества Afb Действительно, в этом случае найдется но-
мер й<=Л/ь такой, что
t
^%(/\, Т, т, о(т),
о 1
Обозначим через первый момент t, когда
j Х(Д, У, т, о(т), zj)dr==l.
о 1
Тогда согласно (4.2.9) при /=1 получаем, что преследователь
с номером ц ловит убегающего в момент Т. Если
t
— лге(/—т)ЛгС/п(т) dx s Q(t, Т, z°) для всех
о
то в момент убегающего ловит один из преследователей
с номером /еЛ73 в силу предположения 3.3.
Пусть для позиции z° выполнены предположения 3.1, 3,2, 3.4,
Предпишем i-му преследователю, i^ATi, строить свое управление
ut (t) как решение уравнений (4.2.7), (4.2.8), а i-му преследова-
телю, геЛ'з, выбирать управления ыД/), для которых выполнено
предположение 3.4. Покажем, что, применяя стратегии Ut(t), пре-
следователи могут гарантировать окончание преследования к мо-
менту Т. Пусть v(t) — произвольное программное управление
убегающего. Если хотя бы для одного
'*
—J т, z°),
о
143
то убегающего в момент Т ловит один из преследователей с но.
мером (см. (4.2.9)). Пусть для всех моментов времени
t
— i (т) dx s Q (t, T, z°).
о
Для такого управления n(Z), [О, Л, могут быть два случая:
либо для всех /, fs [Г1, Т2],
t
—Г, 2°)A{z:^(2, Z)<0},
о
либо существует момент времени t*, Z*s [Л, Г2], такой, что
г»
— Т, 2°)A{z:£(2, Г)>0}.
о
В первом случае, согласно предположению 3.4 и пп. б), в) усло-
вия А, убегающего ловит один из преследователей с номером
isAr3 к моменту Т2, Во втором случае имеем
Г1
В (— $ Ttje{Tt-x}AiCjV (т) dx, Т1) < 0,
о
t*
В ( — J л^-х)А!С^(т) dx, f) > О,
о
откуда в силу непрерывности В по совокупности аргументов
следует существование момента 0s [Г1, /*], для которого
о
В (— $ 7t/e~x)AiCjv (т) dx, ©)=0.
о
Последнее равенство в силу предположения 3.4. и п. б) условия
А означает, что убегающего ловит один из преследователей с но*
мером из множества N3 в момент 8. Теорема 3.1 доказана.
Проиллюстрируем предположения 3.2—3.4 и рассмотрим при-
меры.
Замечание 3.1. Предположение 3.2 выполняется, например,
для такого класса игр. Уравнения движения преследующих объ-
ектов Xi=AtXi + Ui, Ui^Pi, i=l, ..., m, Xi, u^Rn, уравнения дви-
жения убегающего y=By-\-v, ueQ, у, vt=Rn, Pi, Q — выпуклые
компакты, Ai, В — матрицы соответствующей размерности. Игра
оканчивается, если хотя бы для одного i в некоторый момент t
где (/Х«)-матрицы, Mi — вы-
пуклый компакт в R1. В этом случае предположение 3.2 — это
предположение nt=n, i^N3.
ш
Замечание 3.2. Условие А (условие прочесывания множест-
вом M(t) множества Q(t, Т, 2°) на отрезке [Л, Т2]), есть усло-
вие разрешимости следующей задачи управляемости. В каждый
момент /е [Г1, Т2] точки
t
— ztj-eiAizj— J nje^^^iBjUj (т) dx — af (f)
о
должны располагаться на непрерывной поверхности {2:^(2, t) —
=0}, так, чтобы была разрешима задача покрытия:
U (a/(0+^)3Q(^ Т, 0=0),
/ед^
причем в момент Т2 выполняется условие
M(T2)^Q(T2, Т, Т2)<0}.
Поверхность {z : E,(z, /) =0}, /е [Л, Г2], должна удовлетворять
двум условиям:
а) перегораживать множество Q(t, Т, г°), т. е. для любой не-
прерывной кривой
ф(/)е<Ж Т, z°), /е[Л, Г2],
такой, что
Мф(^), /о)<О, £(<р(/1М1)>0, Л^/0<А<Г2,
существует момент 0], такой, что £(ф(/*)> /*)=0;
б) ее пересечение с Q(t, Т, 20) можно покрыть множествами
Mj(t) при некоторых допустимых
Для решения задачи покрытия можно использовать результа-
ты о решетчатых покрытиях шарами, обобщенными цилиндрами
и другими выпуклыми телами (см. [53, 58]). Решением задачи
о покрытии является информация о множестве Л/(О — возмож-
ных положениях узлов решетки а/(0^Л/(0, при котором разре-
шима задача покрытия множествами множества
Q(t, Г, 2°) 1Д2 : g(z, 0=0}. Задача управляемости тогда состоит
в решении вопроса о возможности удержания а/(О в множестве
ЛД0 при некоторых допустимых и,(1) на отрезке [Л, Т2].
В следующих ниже примерах мы приводим конкретные приме-
ры выбора поверхности {z:£(z, 0=0} и выбора управлений М/(0>
обеспечивающих выполнение предположений 3.1—3.4. Примеры
3.1 и 3.2 иллюстрируют варианты прочесывания для преследова-
телей, уступающих в динамических возможностях убегающему,
пример 3.3 иллюстрирует возможность прочесывания преследова-
телем, инерционность которого выше инерционности убегающего.
Пример 3.1. Пусть в уравнении (2.9) пг=2, Дг=0, В;=Сг=Е2,
£>г=£2.(0), Q=S2(0), Л4- = {0}, М- = 4(0), щ=Е\ Z=l,.. ., /и;
рг=о, /г = 0, геА1={1, ..., k}, pj<cr, /УО 0, i е А3={k +1, ...
145
..m}; E2—2х2-единичная матрица. В рассматриваемом случае пред,
положение 3.1 выполнено; согласно (4.2.4) имеем
Л((, I, T,t>,z5)=[(z,°, o) + ((z?, о/ + |1г?|рх(а2-(о, v)))“]/||z?||2,
..., k,
t t
3(Л 7, z°)^K(t, Т, z°)={ — ^(s)ds: \v(s)ds]>
6 о
> — ||Zf|F/2, i = (3.1)
[Таким образом, в рассматриваемом случае множество Q (f, Т, 2°)
принадлежит полиэдральному выпуклому множеству
K = {z:(z, z“/||z“||)>-||z?||/2, < = 1, .... А). (3.2)
Приведем три характерных случая прочесывания множеством
'M(t) множества Q(t, Т, z°) (внутри К).
А) /г=3, т=5; рг=сг= 1, i = 1, 2, 3; р/!=0.5, /, = 1,6, / = 4,5.
z°=(2; 0), г° = (3; 2), г° = (-2; 1), z° = (3; -^7), г°=(-3.5; -10.5)’
Множество 7<={z:z1>—1; 3zr-J-2z2> —6.5; —2zj+ z2> —2.5}‘
Положим /)=z? + 0..5/—J0.5r Управления
Us(t), 0^/^7, которые при t=Ti=l обеспечивают выполнение’
п. а) условия А, имеют вид w4(/) = (—0.5; 0), ^5(/) = (0; 0.5); уп-
равления w4(/), «5(0, обеспечивающие выполнение п. б), в) ус-
ловия А, имеют вид w4(/) = (0; 0.5), u5(t) = (0; 0.5), 7с/<27, Т2 =
=27. Заметим, что в этой позиции игра преследования разрешима
и без участия преследующего игрока с номером 2, однако его на-
личие позволяет преследователям уменьшить время поимки.
Б) k~2, m=\-, рг=о=1, 7=1, 2; pz=o.5, /z=0.75, / = 3, 4;
zj* = (O; —1), z®=(0; 2), z° = (—5; 2.75), z°=(5; —2.25). Множество
K={z : — 1 <z2<0.5}. Положим £(z, /)=<|+ (z2 + 0.25)2 — (7.5 —
—0.5/)2, />5, 7я = 5. Управления u3(t), и4(г), 0^/^5, которые
при /=ТХ = 5 обеспечивают выполнение п. а) условия А, имеют вид
и3(/) = (0; —0.5), и4(/)=(0; 0.5), а управления ц3(/), u4(t), обеспечи-
вающие выполнение пп. б), в) условия А, имеют вид ц3(/)=(0.5; 0),
и4 (/)=(—0.5; 0), 15, Т2=15.
В) k—0, т—8, а=1, р/=0.5, //—4, /=1, ..., 8; г°=(—15; 0),
г$=(-(ЮД/2+5); -Ю/У5), г?=(0; —15), <’=(10//2; -10/V2-
-5),_г?=(15; 0), z?=(10/V2 + 5; 10/V2), z?=(5; 10). zJ=(-10/V2;
10/У2Ц-5). Множество Положим Е(г, /)=г2 + г,—(15—
—0.5/)2, /^10, Tx=10. Управления «/(/), j=^\, .... 8, ОЙ^/^Ю,
которые при t—T^—10 обеспечивают выполнение п. а) условия А,
имеют вид
^=(0.5; 0),-ц2=(0.5; 0), и3=(0; 0.5), «4 = (0; 0.5);
w5=(—0.5; 0), «6=(—0.5; 0), и7 = (—0.5; 0), ц8 = (0; —0.5),
146
а управления j=l, ...» s, обеспечивающие выполнение пп. б),
в) условия А, имеют вид
и1(/)=(0.5; 0), u,(0=(l/(2/2); 1/(2 V2)), «,(/)=(0; 0.5),
«,Ю=(-1/(2У2); 1/(2 1/2)), М0=(-0-5; 0), «,(0=(-1/(2 V2);
-1/(2У2)),ГИ,(0=(О; —0.5),
“8(0=(т4/=г; V 10</<22, ;Г=22.
84 ’ \ (2V2) (2V2) )
Пример 3.2. Пусть в уравнении (2.9) п=4, А=(о &—
( 0\ /0 \
единичная матрица размером 2x2, В; = Сг=Е4, 1 ~ 1, у=1 ~ L
«ге52г(0), ;G^(0),
Е2 тЕ2
Лф={(3), пе^(°)}’ Чоо)’ л^=(о‘То“)’ /г=0’ рг=а’
г^Л\={1, ..., &}; рг С о, /?>0,/еЛ?3= {Hh ..., mY Положим
^=(2^, zit), zfl, zit е У?2, Z=l, .т. В рассматриваемом случае
предположение 3.1 выполнено; согласно (4.2.4)
Л (к t, %, v, z°)=[(z°+^, (*—т) о)+ ((*£ +z?/, (/ —т)о)2 +
+ II4,+4* |Но*(/-т)г-(и, В)(/-г)а))'/2]/||г?, + г?/||2.
г = 1, 2, ..., k,
[ / г9 + z? Т \
Q(k Tf T, z«)= z: z, -1.1— >
Приведем характерный случай прочесывания множеством М (/) множе-
ства Q(t, Т, z°) (внутри Д'(/, Т, 2°)). Положим
k=2, m=4, р1=о=1, 1=1, 2; ру = 0.5, /у=2, /=3, 4;
z01=(0; -3), z°2=(0; 0.5), ^^=(0; 2), z|2=(-l/6; -4/3),
z01=(-4.5; -1), z°2=(4; 0), z°I = (-4.5; 3), 2»=(4- -0.75).
Перебирая Г>0 и исследуя возможность решения задачи проче-
сывания для области K(t, Т, z°), заметим, что задача разрешима,
например ппи Т=3, для
147
K(t, 3, z°)= z:zs R\ (z. 3)/—0.75;
*
, /___1_4X 1
(z, I ^'417 j )>(/—3)t — ।,
V X VtF// 4 J
|(z, /)=z,-(4.5-4/—, />0, 71=0.
Управления «з(0, u4(f), fe [0, 3], обеспечивающие выполнение
[условия А, имеют вид «з(/) = (0,5; 0), u4(t) = (0,5; 0).
Пример 3.3. Пусть управления движения трех преследова-
телей и одного убегающего имеют вид
Х1 = Н1, X2=U2> Х3=«3, y=*V.
Здесь Xi, Ui, у, v^R2, lluill^p, ||«г!Ко, ||w3|Ka, llull^o. Преследо-
вание считается законченным, если хотя бы для одного i
||х£-—где l\=l, 12=1з=0, p, a, I — положительные константы.
Положим z=(zn, Z12, z2, г3) = (xl—y, xi} x2—y, хз—у), j=2, 3.
Тогда соответствующая дифференциальная игра имеет вид
211=212—V, Z12=H1, Zj—Uj— V, j=2, 3;
терминальные множества Mi={2: [|2ц1К7}, Af2={2 : г2=0}, Af3=
= {z:z3 = 0}. Положим Ni={2, 3}, M3={1}. В рассматриваемом слу-
чае предположение 3.1 выполнено, функция Z(i, t, т, v, zp), по-
строенная для i^Ni, имеет вид (3.1), а множество Q(t, Т, 2°)
принадлежит полиэдральному выпуклому множеству К, имеюще-
му вид (3.2). Приведем характерный случай прочесывания мно-
жеством 2ц(0 +5? (0) множества R. Пусть 2ц°=(1; —5,5), 212°=
= (0; 1), 22°=(0; —2), 23°=(0; 2), р=1, о=1, 1=1, 1. Множество
/(={2; 2= (21, 22), —1<22<1}. ПОЛОЖИМ
Цг, 6+ (l+2jV5V2)2.A , 1 +2 /б /2 ,
Т1=1 + 2УГ5 V2. ____
Управление «1(0, которое при Т1—! +2]//^5 ~\/2 обеспечивает
выполнение п. а) условия А, имеет вид
«!(0=(0; -1), 0</< 1; И1(0=(^Н_;
1 + /5/2 1+21^5 V2;
148
а управление иД1), обеспечивающее выполнение пп. б), в) усло-
вия А, имеет вид
щ (Z)=(— IJ 0), t > 1 + 2/б ]/2 6,92;
Л= 1 + V13 +2 (1 +21^5 V2)+ (1+2 К5 V2J2 9,1.
§ 4. Метод блокирования убегающего
В этом параграфе мы рассмотрим задачу преследования для
процесса преследования, описанного в гл. 2. Это связано с тем,
что для иллюстрации метода предлагается пример дифференци-
альной игры с фазовыми ограничениями, которую удобно форму-
лировать для процесса преследования. Приведены достаточные
условия разрешимости задачи преследования группой преследо-
вателей одного убегающего в случае, когда среди преследователей
находятся игроки как с равными, так и с отличающимися дина-
мическими возможностями по сравнению с убегающим. Предла-
гаемый метод взаимодействия преследователей предполагает раз-
деление преследующих на две группы, при этом убегающий, ук-
лоняясь от встречи с преследователями первой группы, вынужден
пересекать некоторое множество в фазовом пространстве, на ко-
тором его могут поймать игроки второй группы.
Рассмотрим процесс преследования группой преследователей
одного убегающего (2.0.10), (2.0.11), (2.0.12), описанный в гл. 2.
Пусть
W={1, ..., = •••, 4)-
Предположение 4.1. Существуют множества N^czN, функ-
ции 'yi('t), непрерывным образом зависящие от t, такие, что мно-
гозначные отображения
юг (т;)=л4ет<?гР4 —
непусты для и у£(т)^$((г).
Предположения 4.2. Для всех и
i
[щеЫуъ—J уг (т) dx] П Мг = 0.
о
Замечание 4.1. Если предположение 4.2 не выполнено, то
среди преследователей найдется игрок, который может поймать
убегающего за конечное время по первому методу преследования
Понтрягина (см. теорему 1.2.1).
Положим для z&Vi
Р (/, t, т, г/°, х°, о(т))=тах|р:
149
Р + Mt + J Yi (т) dx) П
о
n(nfe(/_t)GiPi—лге^-т)^—YttZ—т))=^ 0), (4.1)
t
Pi(/, *Л p(-))=l—max ГР(Л /, x, у0, x®, v(x))dx. (4.2)
0
Пусть Ui(t)—Ui(t, y°, Xt, o(-))—стратегия z-го преследователя в про-
цессе преследования, определенная в гл. 2, &i(t) — дифференци-
руемая функция R{-+Rl, ^f(0)=0, Положим
р2(/, «()> “(•)» »(-))=min min IIл^^у0—л^^^х]—
iEAZ, mi£Mi
IС JVj
t
— $ (s) ds + 5 (nZ(a->%(tf,(i—s)) ff\ (t—s)_
0 0
— n.ie{t~s}Gtu} (tfi (t}—t—s)) ds—mt l|, (4.3)
Р3(/, A «(•). u(-))=suPmin{Pi(C У°, x°, o(-)),
v()
P2(^ «(•). «(•). и(-))}. (4.4)
где u(-) — измеримая функция, принимающая значения из мно-
жества Q, m(-) = (ui(-), ит(-)) —измеримая на интервале
[О, —/] функция, принимающая значения из множества Pi,
й(-) = (й1(-), ..., йт(-)) — стратегия преследования в процессе
преследования (см. гл. 2).
Предположение 4.3. Для позиции х°, у° существуют диффе-
ренцируемые функции «7/(0)=0, измеримые функ-
ции ui(t)^Pi, —t, и стратегия преследования в про-
цессе преследования u(t), такие, что функция р3(/, у0, х°, и(-),
й (•)) имеет положительный корень Т (г/°, х°).
Теорема 4.1. Если для процесса преследования (2.10) —
(2.12) в позиции х°, у° выполнены предположения 4.1—4.3, то для
позиции у°, х° разрешима задача окончания процесса преследова-
ния к моменту 6=тах{^»(Т(£/°, х0)), ie7V3}.
Доказательство. Пусть для процесса преследования
(2.0.10) — (2.0.12) в позиции х°, у° выполнены предположения
4.1—4.3 и v(t) — некоторая измеримая функция, y(/)^Q, /е
е= [0, Л, Т=Т(у°, х°). Положим hi(t, Т, у°, xl v(-))= 1 — J₽(г, Т,
о
т, р°, х®, v(xy)dx. Предпишем t-му преследователю, i^N, стро-
ить свое управление ut(t) в момент te[0, 7] следующим
150
образом. Если в момент времени />0 . величина hi(t, Т, у\
Xi°, а(•))>(), то решение уравнения
= Т,СГ-*) + Р(Ё Т, t, у\ 4
т
—nieoirx°i+mi(t)+ £уДт)1/т). (4.5)
о
Если /р — первый момент времени, когда hi(t, Г, р°, хД £>(•)) =
=0, то для Л» w«(0 — решение уравнения
(/)—(T—t). (4.6)
В силу предположения 4.1 существует одно или много решений
уравнений (4.5), (4.6). Так как функции (3(i, Т, т, yQ, хД о(т))
(см. утверждение П. 2) — измеримые функции т, то в силу тео-
ремы Филиппова (см. П. 7) уравнения (4.5), (4.6) разрешимы
в классе измеримых функций. Пусть i-й преследователь, ('еД,
выбирает управления Ui(t)f Ui(t), для которых выполнено предпо-
ложение 4.3. Покажем, что, применяя описанные управления, пре-
следователи могут гарантировать окончание преследования к мо-
менту 0. Для данного v(t) в силу предположения 4.3 возможны
два случая: либо pi (Г, у°, хр, v ()) =0, либо р2(Г, п(-), й(-),
??(•)) =0. В случае выполнения первого равенства согласно
(2.0.10), (2.0.11), (4.5), (4.6), повторяя выкладки, аналогичные
(4.2.9), получаем, что существует номер для которого
nit/(Г) —mXi (Т) еД. Если выполнено второе равенство, то из
формулы Коши для (2.0.10), (2.0.11) и (2.4) следует существова-
ние номера i(=W3» такого, что iuy(&i(T)) — niXi(^i(T))^.Mi. Тео-
рема доказана.
t
Обозначим E(t, Т, у°, х°)={в(т): Т,
о
т, у\ х9, v(т))dx < 1, 1 е iVj. Тогда предположение 4.3—предполо-
жение о существовании стратегии преследования в процессе пре-
следования для игроков с номерами /еА/'з, для которой функция
р2(/, «(•), й(-), о(-)) обращается в нуль не позже некоторого
конечного момента времени Т для v(-)^E(T, Т, yQ, х°). Для про-
верки предположения 4.3 на примере нам понадобится решение
следующей модельной задачи о предотвращении прорыва гра-
ницы.
Постановка задачи. Рассмотрим движение двух объектов Р и
Е, динамика которых описывается уравнениями
Р'.х—и, х, u^R\ и=(иъ и2), ur~Q, lu2|^p, х(0)=(0, х°); (4.7)
151
E \y=v, у, v<=R2, v=(vt, п2),
(4.8)
M<a, t/(0)=(f/5, y*), y°O, a>p;
и и v — управляющие параметры игроков Р и Е соответственно.
Фазовые координаты игроков удовлетворяют следующим ограни-
чениям:
G1={x1=0, b=Cx2<J—b},
G2={— oo<r/1< + oo, 0<
Игрок P поймал игрока E, если {xi(Z)=#i(f)=O, |x2(Z)—£/г(0 |<
<&}. Цель игрока E — перейти из области G2~={yl<0,
в область G2+={t/i>0, не будучи пойманным Р. Цель
Р — воспрепятствовать этому. Игра оканчивается, если либо Я
поймал Е, либо Е оказался в области G2+, не будучи пойман-
ным Р.
Скажем, что для позиции (х°, t/°) разрешима задача удержа-
ния убегающего в области G2_, если для любого измеримого про-
граммного управления v(t) существует функция U(t, v), измери-
мым по Борелю образом зависящая от аргументов t, v, такая, что
либо i/(f)eGs^ для всех £>(), либо существует момент /*, такой,
что |х2(/*)—у2(t*) | <6, х1(/*)=«/1(/*)=0. Здесь x(t) — решение
уравнения (4.7) при u=U(t, п(0), y(t) — решение уравнения
(4.8) при v=v(t).
Скажем, что для позиции (х°, t/°) разрешима задача прорыва
в область G2+, если для любого измеримого программного управ-
ления u(t) существует функция V(Z, и), измеримым по Борелю
образом зависящая от параметров t, и, и существует момент G
такие, что справедливы соотношения
^i(^i)=«/i(/i)=0, \y2(ti)—x2(tl)\>b.
Здесь x(t) — решение уравнения (4.7) при u=u(t), y(t) — реше-
ние уравнения (4.8) при v=V{t, u(t)).
Задача 1. Для заданных параметров а, р, &, /, указать по-
зиции (х°, у°), для которых разрешима задача удержания объек-
та Е в области G2~~.
Задача 2. Для заданных параметров о, р, b, I указать пози-
ции (х°, у°), для которых разрешима задача прорыва в область
G2+.
Справедливы следующие утверждения.
Утверждение 1. Если 2Ь<(1—p/o)Z, то для любой пары
(х°, г/°), x°eG], t/°eG2-} разрешима задача прорыва в область
G2+.
Утверждение 2. Если 2&>(1—р/сг) Z и начальная позиция
(х°, t/°), x°gG|, y°^G2~, такова, что выполнено хотя бы одно из
неравенств
152
p p
то для позиции (x°, t/°) разрешима задача прорыва в область Gt.
Утверждение 3. Если 26>(1—p/о)/ и начальная позиция
(х°, у6) такова, что одновременно выполнены два неравенства-.
* * р* *
то для позиции (х°, z/°) разрешима задача удержания объекта Е
в области G% .
Доказательство утверждения 1. Управление объек-
та Е, разрешающее задачу прорыва в условиях утверждения 1,
таково:
/ °Л Г —£/? — е "I
“НоРег PH'
е — любое положительное число,
Интегрируя уравнение (4.8), при таком управлении v(t) убеж-
—у\ — е
даемся, что в момент -----объект Е подходит на расстояние е
О
к множеству {*/i=0; 0<z/2<0- Положим
Г / 1 Р \ 1 1 СТ е
е= 1-----I — 2о ------, 0=--;---•
L \ ст / J Юр о
Рассмотрим величину х2(0)-—у%. Управление v(t) для
ст
выбирается следующим образом:
а) если х2(0)—+ v(t)=[ % А
° ° уЦ Уе2+у?
б) если — е + &—/fl-——*а(®) + — У?* v(t)~ / £ Ах
а \ а / п у — ув/
X °— Интегрируя уравнения (4.8) при указанных в случаях
Ke* + U-^)2
а) и б) управлениях v(t), убеждаемся, что для />0 объект Е
движется с максимальной скоростью в случае а) в точку (0, 0), в
случае б) в точку (0, /). В силу условий утверждения 1 объект
Е приходит в одну из этих точек раньше, чем Р вместе с терми-
нальным множеством.
153.
Замечание 4.1. Нетрудно видеть, что условия а) и б) не-
противоречивы, так как по условию утверждения 1 2b < f 1-LA
\ О J
и для любого вектора х2(0)—выполнены либо а), либо б)
Доказательство утверждения 2. Пусть выполнено
первое неравенство для начальных позиций из утверждения
/ — I/O \ а
Тогда при v(f)=l * I — j-
в точку (0, 0) равно Vу{2 + < а
время движения
объекта
объекта
2.
Е
время движения
— ь
равно _±____ т.
Р
и, таким образом, возможен
вместе с терминальным множеством
(0, 0) объект Е окажется раньше Р
прорыв. Если выполнено второе неравенство для начальных по-
зиций из утверждения 2, выбираем v(t)=[ '1 —; —...А — ...
¥~У°2/ Уу1Ч(1-у2)2
Время движения при таком управлении объекта Е в точку (0, /)
меньше, чем время движения объекта Р в точку (0, /), т. е. воз-
можен прорыв.
Доказательство утверждения 3. Управление объ-
екта Р, предотвращающее прорыв объекта Ь в область G2+, та-
ково:
€СЛИ
е. в точке
Р
а) — I \ 1---—Ь, то u2(t) = — (v(t),e2), (4.9)
ст \ ст / о
где е2—единичный вектор оси х2;
если
б) — у2>Ь—I fl--— \то н2(/)=р, О^<0, где 0—
о \ я / i
первый момент времени, когда
—»ие)=*.<е)-/(1--е-)+б. (4-Ю)
и \ О /
для />©, н2(0=~ (у (0> ег);
с
•если
в) — Ь, (4.11)
ст
то u2(f)=—р, где ©i—первый момент времени, когда
~£/2(®1) = *а(©1)—Для />0Ь «2(0 = —(^(0, е2).
а о
154
Покажем, что в случае б) обязательно наступит момент 0, для
которого будет выполнено (4.10). Пусть е2 — единичный вектор
оси х2. Если v(t) произвольное управление игрока Е, a U2{t)=p,.
t^-0, то для решений уравнений (4.7), (4.8) имеем
t
— f/2(0=“^+~ f (v(s), e2)dst
о о z о J
о
Х2(0-ф — -Н-Н& = ^2-/ ( 1-------W+P*-
\ о / \ а /
t
Вейлу фазового ограничения y2(t)^t, + S (y(sX e2Ms</, и,
о
t
таким образом, (v(s), e2)ds^.l—у®, следовательно,
6
— у2 (0-х2 (о +1 f 1 - -П -&= ^-х° +1 f 1-----И —6] +
а \ а / [ а \ а / J
t
+ -В- C(t,(s), e,)ds-p<< IS-yO X<> + 1 (1-e_\+ JL(f-rfb-
a J \ а \ а / / а
о
— pt = (l—xg — b)—pt.
Следовательно, обязательно наступит момент 0, что будет вы-
полнено (4.10). Аналогично показывается, что в случае а) обяза-
тельно наступит момент 0Ь для которого будет выполнено (4.11).
Покажем, что условие (4.9) выполнится раньше, чем yi(t) станет
равным 0. Пусть для начальной позиции (х°, t/°) выполнено усло-
вие —Ь-Так как управление преследователя и2(£) =
=—р, то максимальное расстояние в положительном направлении
по оси pi, на которое может сместиться объект р/с Е до выполне-
ния равенства “ #2(0)=х2(0)—& есть ^х°—b—— —(х°—
Ут В силу первого неравенства утверждения 3 +
+ откУДа '&) ——Ут Таким обра-
* * р р
зом условие (4.9) будет выполнено до того момента, когда y\(t)
сможет быть равным нулю. Пусть теперь для начальной позиции
(х°, у0) выполнено условие -у #£>&—Ц1 + х° .Так как
управление преследователя м2(/)=р, то максимальное расстояние-
в положительном направлении оси r/i, на которое может сместить-
ся объект — Е до выполнения равенства — t/2(0)x=x2(0)—t(l —
155-
—+ 6, есть (-£- у® —х®—bj ~=у®—(х® 4-6) у.
го неравенства утверждения 3 имеем
В силу второ.
У0! + (Z-^) > УуГ + (/-^)2 > — —6) > Z-(x®-6)
р р
откуда (х°—х)-^-.
Таким образом, условие (4.9) будет выполнено до того мо-
мента, когда z/i(0 сможет быть равным нулю. Покажем теперь,
что в случае а) либо в случае б) или в), начиная с момента 0,
управление м2(/)=— е2) решает задачу о предотвращении
о
прорыва. Если в момент 0 мы добьемся соотношения 6^х2(0)—
------------------—Ь, то, используя u2(0, °о),
О \ (7 /
имеем
6>x2(Z)—— у2(0>/ (1-----— ^—6;
о \ ° /
прибавляя к обеим частям
о — р
-------ys(i), получаем
а
6>6 —(1—р/о)у2(/)>х2 (0—^2
т. е. прорыв невозможен, так как объект Р держит перед объек-
том Е терминальное множество.
Пример 4.1. Пусть движения трех преследователей и од-
ного убегающего описываются уравнениями Xi=«i, х2=«2> х3=«з,
y=v, где х(, У, til, v<=R2, t=l, 2, 3; ||«ill<o, ||м2||<а, «з=(«з1, «з2),
«з1 = 0, |«з2|<р, ]|у||<ст, р<(Т. Игра оканчивается, если хотя бы
для одного i в некоторый конечный момент времени t справедли-
во включение x1(f) , где Л11=Л12={0},
ч={( ° ), -»<₽<>}.
Положим Лг1={1, 2}, N3={3}, у(/)=0, В рассматривае-
мой игре предположения 4.1 и 4.2 выполнены, функция fj(i, t, т,
у°, хг°, v), построенная для имеет вид (3.1), где вместо zt°
надо взять х(°—yQ. Положим Xj°=(3; —1), х2°=(1, 3), i/°= (3; 1),
-Гз1=10, 0сх32<10, о=2, р=1. В этом случае для тех п(-), для ко-
торых функция pi(7, у°, х°, у(•))>() при всех Z>0, траектория убе-
гающего находится в области {xjX), Осхгсх^ и пересекает мно-
жество Л={х:х1=10, 0<х2<10} в некоторый конечный момент
времени, зависящий от управления убегающего. Из утвержде-
ния 3 для задачи (4.7), (4.8) получаем, что если 6=2,5, то в рас-
сматриваемом примере утверждение 4.3 для данных xt°, х2°, у°,
<г=2, р=1, Хз1=Ю, 0<Хз2<10, 6=2,5 выполнено, и в какой бы точ-
156
ке множества Л ни находился третий преследователь, он может
предотвратить прорыв через это множество игрока Е.
Замечание 4.2. В примере 4.1, если 6<2,5, в силу утверж-
дения 1 возможно уклонение игрока у от встречи с преследовате-
лями.
§ 5. Преследование несколькими разнотипными объектами
В этом параграфе приведены достаточные условия разрешимо-
сти задачи преследования группой преследующих одного убегаю-
щего в том случае, когда среди преследователей можно выде-
лить три группы игроков: у первой группы динамические возмож-
ности совпадают с динамическими возможностями убегающего,
у игроков второй группы они больше, у игроков третьей группы —
меньше. Предлагаемый метод взаимодействия преследователей
предусматривает сковывание действий убегающего игроками
первой группы, которые заставляют его находиться в некоторой
области (иначе он будет пойман), игроки второй группы играют
роль загонщиков, т. е., уклоняясь от встречи с ними, убегающий
вынужден сближаться с игроками первой и третьей групп, а иг-
роки третьей группы ведут поиск убегающего в определенной
области.
Рассмотрим игру (2.9). Путь У={1, 2, ... , т} = =
={1, ..., k), М2={&+1, ...» /}Дз={/+1, ...» ^}, Т — положитель-
ная константа.
Предположение 5.1. Для выполнено предпо-
ложение 2.1.
Предположение 5.2. dimL?=v/=v, для позиции
(Zi°, ..., гш°) существуют натуральное число р, неотрица-
тельные константы Tj, j=l, ..., р, O=7'o<7’i<-• .<ТР=Т,
векторы i^N2, /=1, ..., р, линейные взаимно однознач-
ные отображения Fi'.Li[—>-R\ такие, что:
а) для любого if=N2 и любого г, (T/-i) <= (Tj_ i),
P -
r/-i
G,(0)=4 G((7’;_I)={Z,(T,_,) : г‘ (l)e А^+В,Р,-СД.
T^,], /=2, 3, .... p;
г б) векторы
Ti
\ FiUj (Dj (Tj-—i)—E) e(T^)AiCiV (r)t/r
не зависят от i, i^N2, для всех v(>) e E (T, T, z°) (cm. § 2);
157
в) для любой функции i'(')eII(O, Т), П(0, T)={o(-'):v ()<=£
, Ti
еЦО, Т), t/(r)<=Q, те[О, Т], для /=1, р, ieeN2, ( J /}тс(х
Tj х
X(Di(7’J-T)-E)e(T/-’MiCj0(T) A) f| ( U (F,a't + F,M?))= 0}, хотя бы
ieN> 1
для одного i е Л\ \ A (I, Т, т, v (т), z°) dr > 0.
г-
j-i
Предположение 5.3. dim£?=vf=v, i^N3, существуют
линейные, взаимно однозначные отображения FitLi1-^^, такие,
что векторы £'inie(/~’t)j4iCiy (т)^т, не зависят от i, для всех
о
u(-)g=S(T, Т, г°)ПП(О, Т).
Положим
f(0=max{/—1, /е{1, ...» р},
Л J шах {Т/_г, /=1, р}, если N2=£ 0.,
Т (t) j q ' еСЛИ ДГ^—0
Рассмотрим для i е Аг3, / е [О, Г] множество
t
V(t, f(t), Т, z°) = { — f Fi^-^Ctv^dT-.v^^EiT, T, z°)n
0
t
ПП(О, T), jlh, T, r. «(T), zJ)A<l-
T(t)
— S 5T’T* z??£iT’
/==1 Ti-i
Пусть «г(т), teAr31 —произвольные программные управ-
ления. Обозначим
Л1г (*)= — nietAiz°i — лге(/—(х)йт 4-Л1?,
о
iEEN3i M(t)= U (О,
iGWa
Предположение 5.4. Для позиции zQ существуют поло-
жительная константа Т и допустимые управления ut(t),
/еА/’з, такие, что для некоторого момента t*^T, M(t^)^
T(t*), T, z°).
158
Условие Б. Скажем, что для множеств M(t), V(t, T{t), Т,
2°) выполнено условие Б на отрезке [Г1, Т2], Т^с/сТ^сТ {усло-
вие прочесывания множеством М{1) множества V{t, T(t), Т, z°)
на отрезке [Г1, Т2], если существует непрерывная функция
Z):7?VX[7,1> T2]^Rl, такая, что:
a) VtT1, Т(Л), Т, z°)<={x:£(x, Г)<0}, V(Tl, Т(Г), Т, ?°)П
Л{х:£(х, Г)=О}#=0;
б) T(t), Т, z°)fl{x :|(х, 0=0} для всех К= [Г1, Т2];
в) Л4(Г)=эУ(Т2, Т{Т*), Т, г°)П {*:£(*, Т2)^0}.
Предположение 5.5. Для позиции 2° существуют управле-
ния Ui(t), i^Ns, t>-Q, и положительные константы Tl, Т2, Т, 0<
сГс^сЛ такие, что для множеств Л4(/), V{t, T(t), Т, z°) вы-
полнено условие Б на отрезке [Г1, Т2].
Теорема 5.1. Если для игры (2.0.9) в позиции z° можно
указать множества N\, N2, N3, для которых выполнены предполо-
жения 5.1—5.4 либо 5.1—5.3, 5.5, то для позиции z° разрешима
задача преследования к моменту Т.
Доказательство. Пусть в позиции z° выполнены предпо-
ложения 5.1—5.4. Предпишем преследователям с номерами
строить свои управления u:{t) как решения уравнений (4.2.7),
(4.2.8), управления Ui{t), i^N?, как решения уравнения (2.6); в
качестве управлений Ui{t), ielV3, выберем те управления, для ко-
торых выполняется предположение 5.4. Покажем, что, применяя
описанные управления ui{t), преследователи могут гарантиро-
вать окончание преследования к моменту Т. Пусть v(t) — произ-
вольное допустимое управление убегающего. Если хотя бы для од-
ного t<ct*
t
-JW'-’’V10(T)dreV(i, T(t), T, ?),
о
то убегающего к моменту Т ловит один из преследователей с но-
мером £&ViUA'2. Действительно, в этом случае либо ц(-)<=
еП(0, Т), либо найдется номер такой, что
t
^X(i0, Т, т, с(т), zyd-r>l.
6
В первом случае убегающего ловит один из преследователей с
номерами из Рассмотрим второй случай. Обозначим через
ti, первый момент t, когда
'1.
j Х(»о, Т, т, v(T), 2»t)dz=l.
о
159
Тогда в силу (4.2.9) получаем, что один из преследователей с но-
мером ловит убегающего к моменту Т. Если
t
— Т(0, т, У)
о
для всех то в момент t*^.T убегающего ловит один из
преследователей с номером i^N3 в силу предположения 5.4.
Пусть в позиции 2° выполнены предположения 5.1—5.3, 5.5.
Предпишем преследователям с номерами i^Ni выбирать управ-
ление ui(t) как решение уравнений (4.2.7), (4.2.8), управление
i^N2, как решение уравнений (2.5), (2.6), в качестве уп-
равления выбираются управления, для которых вы-
полнено предположение 5.5. Покажем, что, применяя стратегии
in(t), преследователи могут гарантировать окончание преследо-
вания к моменту Т. Пусть v(t) — произвольное управление убе-
гающего. Если хотя бы для одного
t.
W'-~’MiCiB(T)dreV(/., ?(/.), Т, г»),
б
то убегающего к моменту Т ловит один из преследователей с но-
мером Пусть для всех моментов времени
t
— T(t)t Т, z°).
о
Для такого управления v (/), te[0, Т], могут быть два случая:
а) для всех ^[Г1, Т2]
t
— \ (t, T(t), T, 2°)П{х:£(х,
о
б) существует момент времени Т2], такой, что
— J Лл^(^-г)Л^ц(т)dx^ V(t\ Т, 2°)П{х:£(х, О>0}.
о
В первом случае согласно предположению 5.5 и пп. б), в) усло-
вия Б убегающего ловит один из преследователей с номером ie
7V3 к моменту Т2. Во втором случае имеем
7-1
е( — J ^л/Г1“™^(т)йт, Г)<О,
б
t*
£ (— J (т) dxt Г) > О,
о
160
откуда в силу непрерывности | по совокупности аргументов сле-
дует существование момента Z*], такого, что
Е(-| е) = 0.
О
Следовательно, в силу предположения 5.5 и п. б) условия Б убе-
гающего ловит один из преследователей с номером в мо-
мент 0. Теорема 5.1 доказана.
Пример 5.1. Пусть уравнения движения семи преследова-
телей и одного убегающего имеют вид
Х^ — > % & ~~ X^^=U^,
х2=и2, хА=и*, Xe=uG, y=v.
Здесь xit ut, у, ve=R2, |]иг||<Рь ||v||<a, р1==р2= ... =р5=ст=1,
р6=о7=ь0.5. Преследование считается завершенным, если хотя бы для
одного i Цхг—y[\^lf, /1=/2=/3 = 0, /4=/5=(]/3/4), /6= 1,125,
/t = 0,75. Положим
z=(zls z2, z3, z4l, z42, z51, z62, z6, z7)==
= (хх —I/, x2—y, x3—y, Xi—y, x4, x5—y, x5, x6—y, x7—y).
Тогда
r Zi = Ui—v, Z=l, 2, 3, 6, 7,
z71=z j2 v,
= /=4, 5.
Терминальные множества Mi={z: ||zj| <lt}, Z=l, 2, 3, 6, 7; Mt=
={z: l!zdl</t}, i=4, 5. Имеем jVi={1, 2, 3}, 5}, ZV3={6, 7}.
Предположение 5.1 выполнено, если Di(x)=yi{x)E, i=4, 5, где
[т, 0 t 1,
T>1,
Dt(x)=E, f=l, 2, 3.
Согласно (4.2.4) X(Z, t, j, v, z°)=[(z®, y)4-((z?, u)2 + ||z°||2(a2—(u,
«)))1/2]/l|z?ll2, <=1, 2, 3;
V(t, 0, T, z°)ge{— ^v(s)ds:[z<>, —p(s)dsj>^-, [Z=l, 2, 3| =
о 0
= K(t, 0, T, z°).
161
Приведем характерный случай взаимодействия преследующих игроков
Положим z« = (0; —4), Z° = (4; 0), == (0; 4), ^, = (1; 0), z°2=(0; 0)"
4M0; 1,125), г02=={0; о), 2o=(6; 2,125), z°=(6; -2,75). Предполо-
жения 5.2, 5.5 будут выполнены, например, если
Ti=3, 7= 19, с4 = (УЗ/8, 1/8), а|=( —Т/3/8, 1/8),
6^ = 0,25, i=4, 5, а{=( —1/8, УЗ/8), «{=( —1/8, —УЗ/8\
/>2; «6(/) = (0; —0,5), u7(t) = (0; 0,5);
0с/<3; Ыб(О = (—0,5; 0), «7 (/) = (—0,5; 0),
/>3; |(f, z)=zl~~7,5+0,5£, />3, Т‘=3.
При этом V(t, 0, 19, z°)cz{—2<z2<2, z >—2}, V(t, 3, 19, zQcz
cz{—1<22< 1,75, 2i>—2}, к моменту t=3 игроки с номерами ге
еЛг2 заставляют убегающего сблизиться с игроком с номером 1
(иначе убегающий будет пойман), а при t>3 заставляют сбли-
жаться с игроком с номером 2. Для />3 игроки с номерами 6, 7
прочесывают область V(t, 3, 19, г°).
Глава 6
ИГРОВЫЕ ЗАДАЧИ УПРАВЛЕНИЯ
С ПЕРЕМЕННОЙ СТРУКТУРОЙ
§ 1. Групповое преследование в дифференциальных играх
с переменной структурой, управляемой убегающим
В этом параграфе рассматриваются дифференциальные игры
группы преследователей и одного убегающего, в которых в уп-
равление убегающего входит момент переключения с одной си-
стемы на другую, при этом фиксирован порядок использования
уравнений, описывающих игру убегающим.
Рассмотрим дифференциальную игру группы преследователей
и одного убегающего с переменной структурой (см. гл. 2, п. Д),
описываемую уравнениями
л:г = ЛгХ/ + ^ — D1, Xi(0)—Xi, 0^/:^Го,
(1.1)
+ и2, */г(т0)^<£Ггхг(т0), />т0, z = l,...,m,
где Xi, yif Ui\ v1, up, v2^Rn, Ai, Bi, SC — постоянные квадратные
матрицы порядка п, Ui^Pi'czR'1, v'(=Q'czRn, /=1, 2, Pi1, QJ — не-
пустые выпуклые компакты. Игра оканчивается, если хотя бы
для одного номера is{l, ..., tn} и положительного числа t вы-
полнено включение туАр) (условие окончания игры без
переключения л^/мД^е/И,2).
Предположение 1.1. Существует множество Л^с:М=
={1, ..., tn}, пхп-матрицы О,л(т), векторные функции ул(т), не-
прерывным образом зависящие от т, т>0, такие, что
Й (т)=(т) 0,
у' (т) & й (т),
t
(GJ (t — s)-E)eA^'s}Q1ds^=0.
о
Зафиксируем функции у* (т) и положим
i
& (/, х°)= щЯ^х” + J у! (s) ds;
о
0(z, t, t—s, v1, х9)=
163
I—co-(Z, s)M$i(i)—^iSiG1i(i — s)eAi(t~s}v1—y](t~s))},
~ I если ti(t, x9)¥=0, >
(7-1, если £г (t, Xi)=O,
где ojP^, s) — некоторые неотрицательные непрерывные no s
функции, OcscZ;
t
rAt, K°\=sup min (l — t, t—s, ^(s), x^dsl, (l.3\
где уЦ-) — измеримая функция со значениями из множества Q1.
Обозначим через F(x°) положительный корень уравнения
rx(t, х°)=0, если у уравнения х°)=0 положительных корней
нет, то полагаем Т1(^°)=оо.
Пр едположение 1.2. Для игры (1.1) в позиции х° сущест-
вует множество NiCiN, для которого выполнено предположение
1.1, и существуют непрерывные по s, неотрицательные
t
функции s}, J“i(^ s)^s=l. такие, что Tx(xP)<oo.
о
При выполнении предположений 1.1 и 1.2 для игры (1.1) спра-
ведлива теорема 4.1.2 (с соответствующими изменениями), и, та-
ким образом, для позиции х° разрешима задача преследования за
время ТДх°). Опишем управление i-го преследователя, гаранти-
рующее поимку. Пусть vl(t) — произвольная измеримая функция
со значениями из Q1. Введем функции
t
h(i, t, Т1, уЧ-), х°)=1 —Jp(Z, Т1, Т1—s, пЧ')» tyds. (1.4)
о
Если и момент Т1!, t, Т1, уЦЧ, то значения
функций (t) ^Р’Л, — лексикографический ми-
нимум решений уравнения
«| (/)-<»' (Т1, О т? (0-(Г—0 e-’i'’1-'1!/1 (/)=
Г»
=TiI(7’1. 0-₽(Л Т1, 'n-t, v(i), (1.5)
О
Если — первое значение параметра te[0, Т1], для которого
Л(г, Г1, i>4’), х,°)==0, то для fe(^i', Т1] значения функций
— лексикографический минимум решений
уравнения
'>«; (0—и! (Т*. 0т?(О—
-я tafi\ (T'-t) «)=т| (7-1-0. (1.6)
164
Управление Ui'lt), выбранное в соответствии с описанным пра-
вилом (1.4) — (1.6), мы далее обозначаем й(’(/, уЦ-)). Если т0>
>Г1(х°), то к моменту Т1 (х0) один из преследователей ловит убе-
гающего, и, таким образом, задача преследования разрешима.
Пусть выбираемый убегающим объектом момент то<Л(х°).
Пр едположение 1.3. Существуют множество пХ
Хп-матрицы Сг-2(т), векторные функции у,2(т), непрерывным об-
разом зависящие от т, такие, что для t, т0, т, ОстосГ’(х°), Ост?
то-С/:
в? (т)=me^Pl - afil (т) eBiTQs =# 0,
Ti(r)e
A# (Z)=M? — л, (G? (I—s)-E) <!S!('~s|Q2 ds =£ 0.
To
Зафиксируем функции у/2(т) и положим
Й(Л ux(.), х?)=лг^(/-То)^ге-^т^ +
То
+ J лг^(^То)а/гелг1То"5) Й (S, <(•))—vl(-)‘)ds-,
о
ц(7, t, t—s, тп, uz, ux(-), xp =
( t
max[n; n>0, —п(Й(*. vx(-), х°) + ^ т?(т)йт) «= щев^~8)Р2—
To
—©f (t, s) Mt (/)—лгС? (t-s)eBi{i-s}v2-y2i (t-s)}
(1.7>
если ux(-), x?) +j y2(t)
To
f
(t—т0)-‘, если $(t, tA(-), X?) + J Y?(T)dT=O,
где (d,2(/, s) — некоторые неотрицательные, непрерывные no s,
0<s<^, функции;
t
r2(i, x°)= sup min(l— Ct|(4, t, t—s, t0, u2(s), t»x(-)» *i)ds), (1.8)
(u( • ) ,T0) i GTVa y0
где v(-) — измеримая функция, определенная на отрезке [0, d
и v(s) (s)eQ1 для Осsсто, u(s)=u2(s)eQ2 для t0<s</. Обо-
значим через Г2(х0) положительный корень уравнения r2(t, х°)=0,
если у уравнения положительных корней нет, то полагаем 72(х°) =
=оо.
165
Предположение 1.4. Для позиции х° существуют непре-
рывные по s, неотрицательные функции <о?(/, s),
То
s)ds=l, такие, что r2(x0)<oo.
Теорема 1.1. Если для игры (1.1) в позиции х° выполнены
предположения 1.1—1.4, то для позиции х° разрешима задача 7 —
задача преследования для дифференциальной игры с переменной
структурой, управляемой убегающим, за время max {Т1 (х°)
Т2(х0)}.
Доказательство. Пусть для игры (1.1) в позиции х° вы-
полнены предположения 1.1—1.4 и пара (у(-), то) — произволь-
ное допустимое управление убегающего. Если то>Т!(х°), то, при-
меняя управление u^t, иЦ-)), выбранное по правилу (1.4) —
(1.6), согласно (4.1.16) преследователи добиваются, что хотя бы
при одном соответствующая траектория приходит на терми-
нальное множество Mt. Если то<Т*(х°), то для />т0 выберем
iz;2(/) следующим образом. Если в момент t, то</<72(хе), функ-
ция
X(z, t, Л, т0, ц1(-Х ^(-), х°)=1-
t
— ^т](Ё Е2, Т2—s, т0, н2(-), v1 (s), %?) ds (1.9)
То
положительна, то Ui2(t)^.Pi2, в момент t — лек-
сикографический минимум решений уравнения
= 72(Т2-0-П(г1 Т2, T2—t, т0, v2(0, иЧ-),
х(Й(П »»(•), (1.10)
А
Если t\‘ — первое значение параметра /е[т0, Т2(х0)], для которо-
го функция (1.9) равна нулю, то для /е(/р, Т2(х0)] значения
функций Ui2(t)^P^, m/4(Z)sAft4(T2) в момент t — лексикографи-
ческий минимум решений уравнения
л,(Л<г’_',и!(0-и?Т“, t)m*(t)-
—л$(Та—t)e®i|r‘~',o“(Z)=T|(T2—0. (1.Н)
Согласно утверждению П.2 и теореме Филиппова (см. П.7) так
построенные функции ui'ft), ut2(t), т^(Р) — измеримые
функции t. Пусть управление i-ro преследователя строится на от-
резке [0, то] как решение уравнений (1.5), (1.6), а на отрезке
(т0, Т2] как решение уравнений (1.10), (1.11). Согласно условию
теоремы 1.1 найдется номер i^N2, для которого при данном
166
(У2(‘), То) функция x(t, t, Т2, То, оЧ*). иЦ-)> */°), определяемая
соотношением (1.9), обратится в нуль (в противном случае полу-
чаем противоречие с предположением 1.4). Тогда для траектории
уравнения (1.1) при i=ii имеем
Я11У|, (П=^ А**?, + Jл,. X
о
(й,(s, о1 ())-о1 (s))ds+$ л,1А<г’~5!(u?,(s)—
-o2(s))ds=|? (Г, v'(-), х») + 5(л,,А”',-'Й1(«)-
То
(Г-s)А|Г’~’>И2 (s)) ds + jn,. (Gl (T»-s)-E)X
To
xeB^T2~s)v2(s)ds=^1(T2, &(), + $ (nGeBH(Ti-s)4(s)—
T°
7"2
-ni.Gf, (T*-s)eB^-‘>v*(s))ds+ f (ni,Al’"-”u? (s)-
Тг
—Jtf.G? (Г—s)eB^T2~sy(s))ds+ f (G? (Г—s)-£)eBji(7’*“sV(s)ds=
To
=Й(П оЧ-), x?,) + 5“?,(T2, s)m?,(s)<fc-b2,(T', v^), Л»,)Х
To
4.
X J life, r, r-s, T„, v^(s), v'( ). 4)* +
To
+ $ «11(G?,(Ta-s)-E)eBi-'r,-"o2(s)ds=$4(7’2, s)mf,(s)*+
To To
T«
+ Jnil(Gil(T2-s)-E)AtrM(/!(s)dse<. (1.12)
To
Таким образом, либо к моменту ТЦх0) (если тъ^-ТЧх0)), либо
к моменту Т2(х°) один из преследователей ловит убегающего.
Теорема 1.1 доказана.
167
Если структура убегающего объекта изменяется так, что его
инерционность уменьшается по сравнению с инерционностью дого-
няющих, то метод преследования можно предложить такой.
Будем считать, что для дифференциальной игры выполнены
предположения 1.1 и 1.2 и Ui1 (s, пЦ-)) — управление, выбранное
согласно правилам (1.4) — (1.6). Будем считать, что то<Т](х°)-
Пр едположение 1.5. Существуют множество N3^N, пХ
Хп-матрицы. непрерывным образом зависящие от т, такие,
что для всех t, s, т0, 0<то<Т1(х°), T0<s<f,
Предположение 1.6. Для позиции х° и для любой изме-
римой функции ^(sJeQ1, s&[0, т0], существуют положительная
константа Т3, векторы aif=Li{, такие, что:
а) — (л;ел;(П~То)^^Тох°4- J лгев»(р“го)^£еА£(То-5) (ц] (s, о1 (•))—
о
т>
--иг( •)) ds) GE CCi + да? (s) ds;
6) dim Lil^vi=v, i^.N3, и существуют линейные взаимно одно-
значные отображения Fi:Lil-^Rv, такие, что векторы
т»
$ F&i (G? (Т3—s)—Е) eBi(T>~s)v* (s) ds
•to
не зависят от i, i^N3, для произвольной измеримой функции
г>2(-) со значениями из Q2-,
Т3
В) и (F1<x, + F1M?)=>^F)3li(G?(7'=-S)-E)i!ai(r’-s,Q>ds.
г £
Теорема 1.2. Если для игры (1.1) в позиции х° найдутся
множества Л\, /V3, для которых выполнены предположения 1.1,
1.2, 1.5, 1.6, то для позиции х° разрешима задача 7 — задача пре-
следования для дифференциальной игры с переменной структурой,
управляемой убегающим, к моменту max {Т1 (х°), Т3}.
Доказательство. Пусть для позиции х° выполнены пред-
положения 1.1, 1.2, 1.5, 1.6 и (у(-), т) — допустимое управление
убегающего. Предпишем i-му преследователю, i^Nx, на отрезке
<)</<То применять управление Ui(t)=Ui'{t, оЦ-)), выбираемое
по правилу (1.4) —(1.6), а на отрезке то<^<Т3 — управление
Ut(t), выбираемое следующим образом. В силу условия а) пред-
положения 1.6 и определения интеграла Лебега от многозначного
отображения [13, 20] для х,° и и*(-) существует измеримая функ-/
ция 0113(т)£Й'?(т), такая, что i
j
168
— (S, V1 ( •)) —
О
т»
—tA (•))</$]=af + jf со® (т) dr. (1-13)
io
Пусть i-й преследователь, i^Na, для ie(xo, T3) строит управ-
ление Ui2(t), Ui2(/) <^Pi2, в момент t как лексикографический ми-
нимум решений уравнения
^eBi{73~t}ul (0=л$ (Ts—t) eB^V (i) + ©1 (T3-t). (1.14)
В силу теоремы Филиппова (см. П.7) построенная таким образом
функция Ui2(t) — измеримая функция I, ир(1)^Рр. Для траекто-
рии системы (1.1) при так выбранных управлениях в силу (1.13),
(1.14) будем иметь
, щ (Т3)=Л1ев^т’-^^1еА^х- +1 щев^Тз~Г!>}&,еА^} (ц| (s, ^ (•))-
о
—и1 (•))ds+ J (n^^M (s)—ntG3t (T3—s)eBi(r’“s)v2(s))ds +
To
7’
+ J s)—E)eBi{T1~s}v2(s)ds=
To
7*
= _a. + J л. (Gt (T3—s)—E) eBi{TS~s}v2 (s) ds.
To
Отсюда в силу условий б), в) предположения 1.6 следует, что
найдется номер ieA/’3> для которого выполнено включение
3iiZi(T3)^Mi2. Теорема 1.2 доказана.
Пример 1.1 Пусть уравнения движения преследователей имеют вид
Zi = Ui, zf(O)=z°, zf(0)=Zi, i=l,...,m,
а уравнение движения убегающего—
=£>!, w1(Q)=w\, Wi(0)~wi,
ш2==п2, ^>T0, w2(x0)=w1(r()),
где
Zf, Wj_, w2,uit vlf ||«i||<l. IbllKh 1NIC1-
Преследование считается завершенным, если для некоторых i,
i>0, ||2Z(0 —W2(0ll<^ Перейдем к соответствующей дифферен-
7 Н. Л. Григоренко
169
циальной игре вида (1.1). Положим
x=(xl-1, xi2, Xi, x2)=(zb zif wn Wi), y=(yilf yi2, y2)=(zh zh twa).
Тогда для Ос^сто соответствующая дифференциальная игра име-
ет вид
Х/2 == U[t
I ---^2»
I x2 = ult
ДЛЯ t>T0
Уи=Уа,
Уа~иь
У2-=Щ,
и матрица еЛ имеет вид
/В 0 0\
<J7£=( EQ 0 -
\Е О QJ
Используя результаты расчетов примеров гл. 4, § 1; гл. 5, § 1, по-
лучаем, что предположения 1.1, 1.2, 1.5, 1.6 выполнены, если для
„ О "О О 'О
начальной позиции Zj, zt, Wi, существует такая положи-
тельная константа Т, что одновременно выполнены два неравен-
ства:
6=min шах (<р, ,Пг(Т))>0,
№=1 ?=1.....m
tn
8T!>2l|5i(nil,
i—1
где ^(T)=4—+ w-)T^:0, МЛ=&(Л/11&СО1Ь и если m=
= 1,2, то если щ=3, то Zi>]/3/4, еслит=4, rof> 1/(21Л2),
если т=5, то I 1/(1 +1^5), если т=6, то /^0.279.
§ 2. Групповое преследование в дифференциальных играх
с переменной структурой, управляемой преследователями
В этом параграфе рассматриваются дифференциальные игры
группы преследователей и одного убегающего в том случае, ког-
да в распоряжении каждого преследователя находится выбор од-
ной из двух систем, описывающих динамику игры, и момента пе-
реключения с одной системы на другую, при этом переключать-
ся разрешается не более одного раза.
170
Рассмотрим дифференциальную игру группы преследовате-
лей и одного убегающего с переменной структурой (см. гл. 2,
п. Д), описываемую уравнениями
%и—AjjXjj -j- щj~~vJt i — 1, ... , m, j 1, 2,
xtl{0)=x°n, (2.1)
где xij, иц, Vj^.Rn, Ац — постоянные квадратные матрицы поряд-
ка п, Uij^PijdRn, Vj^QjC:Rn, Рц, Q/ — непустые выпуклые
компакты. Преследователь с номером i распоряжается выбором
вектора j(i, щщ), тщр), причем значение 2) выби-
рается в момент начала игры, т»/(0 — момент переключения i-ro
преследователя с уравнений (2.1) для 0</<tz;(i) при индексе
j^{l, 2} на уравнение (2.1) для хц(1)<Л при индексе {1, 2}\/.
Положим k={l, 2}\j (т. е. k=2, если /=1; &=1, если /=2)
Тогда начальные условия для системы (2.1) после переключения
имеют вид Xik(xii)^^ijXij(xij). Игра оканчивается, если хотя бы
при одной паре ij выполнено включение лцХц&Мц2. Следующие
построения мы приведем для такого случая, когда i-й преследо-
ватель сначала выбирает систему (2.1) с индексом k(i), а начиная
с момента систему (2.1) с индексом /={1, 2}\Д Положим для
7=1, 2,
W„(t, ха, 5) = ЯцА'‘-’«> PIKJL
^aG,\ (Tife-s) eA^-> Qk
при
при 0 < s
Tife
(Г
—E)eAik{xi^s}Qhds+ J nn(Gl(t—s)—E)eAn{t-5)Qjds^
x'ih
Предположение 2.1. Существуют множество N± a N =
={1, ... ,m}, n x п-матрицы Gj/(xfft—s), Gq(t—s) и функции yu(t,
xih, s), непрерывным образом зависящие от s, такие, что для всех
(г, Л Л Ък, «), i A^i, / = 1, 2, 0 <rffe< t множества Wu(t, xik, s)#= 0,
^i/(^ Ъъ) и yi} (/, xih, s) e= Wu(t, s).
Зафиксируем функции ya(t, xik, s) и положим для t^xik^Q
t
Xife)=nijA(<-T«) ») ds,
6
7*
171
C(Z, /, t, s, vk, x°ik, xik) =
1 max{C, £>0, — £&f/(Z, x
X &iheAi^h~s) Рл—<щ^, x£ft, s)M3ij(t,Ti}l)—
= v„-
0 (2-2)
—у lift, tih, $)}, если йгД/, xik)=£Q,
t~\ если Xj/j)=0, -
для se[0, Тгй],
£(Л /, t, s, v/t x°ik, xik)=
j max{£, £>0, — tfiiAt, x°ik)^ nijeAH{i~s'> Ptj—
j (^> T‘k> s)A4£j(Z, Tife) Л;£/?г/(/ S) X (2 З]
x eAiiu~s} xih, s)}, если ^-(Z, xaik)=£0,
t~\ если 0ц (Z, x£fe) = 0,
для TjfcCs^Z, где ^(t, xik, s)—некоторая неотрицательная непре-
t
рывная no s функция, s)ds=l;
о
y(s)=yft(s)eQft> 0<s^Tib v(s)=vj(s)f==Qj, T£fe<s<Z; (2.4>‘
t
p(Z, j (1), ... , j (m),Tife,x°)=sup min (1 — £ (Z, j (Z), t, s, v (s), x°*, xik) ds],
»(•) ieNt V у 7
где u(-) — измеримая функция, определяемая соотношением
(2.4).
Предположение 2.2. Для начальной' позиции х° игры
(2.1) существуют j(i), xtk(i), i=l, ...» tnf функции ya(t, xtk, s),
xtk, s), такие, что уравнение p(Z, /(1), ...» /(/n), xik, x°)=O
имеет положительный корень T (x9fc).
Теорема 2.1. Если для игры (2.1) в позиции х° выполнены
предположения 2.1, 2.2, то для позиции х° разрешима задача 8 —
задача преследования в дифференциальной игре с переменной
структурой, управляемой преследователями, и Т — гарантиро-
ванное время преследования.
Доказательство. Пусть для игры (2.1) в позиции х° вы-
полнены предположения 2.1, 2.2 и v(t) — произвольное допусти-
мое управление убегающего. Вектор (/(Z), тг-/(()), находя-
щийся в распоряжении Z-го преследователя, выберем следующим
образом. В момент начала игры для позиции х° находим /(0>
удовлетворяющие предположению 2.2, а функцию «//(Z)
строим по такому правилу. Если для данного n(Z) функция
172
q(i, j(i), t, Т, !>(•), a£*)=1 —J* £(Л /(0- Л s, v(s), x3k, xih)ds (2.5)
о
положительна, то для О =С t < ?ik (i')> uu (0 pih ml (O.e M-j (T,
Tih)—решение уравнения
^еА^т~^^.кеА^~^ Uih (t)— .
— ®и(Т, xih, &ih%
xGu(Tift-Z)A(^“%ft(Z)=ya(T, Tfh, Z)—
—C(i, /, Л t, Vk(t), x°k, xih)fti}(T, xQtk). (2.6)
а для тгед</<7\ Uij (Z) e Pih т^)—решение урав-
нения
ntjeA^~i} u^it)-^(T, xik>
xih, t)-
“№?/, T, t, x^ xik)^(T, [(2.7)
Если Zi/(l)—первое значение параметра для которого
?(Z, /(/), T, п(-), x°fe)=0, то, если 0 £г/<г> ^Тщг), для tlj
< t < Utj(Z) е Рц, ml (Z) е М3ц(Т, xih)—решение уравнения
—“>iATt xth, t)mld)~^ueAii{T~Xik} e/ffe X
X Gk ^ik-t)eAi^-iyvk (t^j (T, xih, I), (2.8)
а для u^ (Z) e Рц, ml (Z) e M3j (T, tifl)—решение уравнения
^цеАи{Т~1}ии(1)—<otj(T, xik,
~«fjG? (T-Z)e^(7’“^ Vjd)^ (T, xihrt). (2.9)
Если то для ZiJ(!’<Z<T, uW)'(Z) mtj(Z)e
f=Ml(T, xih)—решение уравнения (2.9). Функция C(Z, /, T, t, u(Z),
^.k' xik) согласно утверждению П.2 измерима по Z, поэтому из пред-
положений 2.1 и 2.2 в ’силу теоремы Филлипова (см. П.7) следует-
разрешимость уравнений (2.6) — (2.9) в классе измеримых функций
Wi;(Z), ш?.(Z), 0<Z<T. Так выбранные управления utj(t) будут га-
рантировать окончание игры (2.1) к моменту Т. Действительно, [сог-
ласно предположению 2.2 для управления v(Z) найдется номер i (v(*)) е
е^и существуют моменты Z]/(l), 0 ZV(t) Т, такие, что q(i, j (i),
Zi/<z), T, v(-), x°ik) = 0. Обозначим
173
^ik
N„(T, »(•))= С яцА<г~т<»>driM(G|,(T№-s)-£) X
(Г
T
X e^<Tib“s) Vft(s)ds+ J ^(Gij (T—s)—E)eAn(T~s) Vj(s)ds.
x\h
Для номера имеем
Tife
Я|Л«(Л="^Л‘''1Г_'“’'г'»гЛ“',|‘4+ J X
(Г
T
X (uih (s)—vk (s)) ds + (j ЛцвAii{T~s} (Ulj (s)—
xik
—Vjtsfids^ftutT, x°ik) — |уг>(Л s)ds+
0
+ f IvV7’-^ <£^еА^х^ uih(s)—
о
—nf/VT~Tifc) tfihGlik (Tift—s) eAib(xib~s} vk (s)] ds 4-
4- Г [П„еА/<г-*>Uu^-^GliT-sje^^ v^ds^N^T,
4 (2.Ю)
Если 0<#(i)<Tfft, то из (2.10), (2,6), (2.8), (2.9) следует
XijXiAT)=$tj(Tt Xife)—Jyfj-(r, x£ft, s)ds +
o
4-J ^еАа{Т X
6
Tih Л T
X eTiftGife(Tife—5)ел«ь(т1ь s) vh (s)] ds4- j [лг;А( X
%
X ^ift/^(T^”s)Uift(s)- iti}eAt/ {T"xik> ^ik X
X (T/ft—s) eAtb(xib~s) vk (s)] ds 4-
4- J [nij/^^UiXs)—nfjG|/(T—s)Hi/(r-s)Vj(s)]1ds4-
rife
174
+Мц(Т, V (•))=’»l7 (T, x-fe)— (*Yo(7\ Tlh, s)ds +
6
4' ‘V
+ J Vu(T, Tft, s)ds + \ au(T, т1ь, s)m?,<s)<£s—
0 0
4'
— ? ^(i,/, T, s, vft(s), х?л, T/ft)^J(T,x?fe)ds,-b Y/;(T, tihtt)dt +
0 4/
+ j (T* ty mji (0 dt + J у^(Т, Tift, t)dt-\-
Ф xik
+ J (огДТ, t^, Z)mt-(0^ + ^(7, *>(•)) e=
xik
xih
<^M3}(T, TZft)+ J n.;A(T-^) ^ift(Gjfe(Tife—s)—E) x
oJ
X ^ifc(Tik-s)Qftds+ ntj{G‘2iJ(T—s)—E)eA^T-^Qjds^M2ih
x\h
Если Tift<4/(/)<T, то из (2.10), (2.6), (2.7), (2.9) получаем
— > xik) Yij (Г’ TiA> S) d$ 4~
0
xik xik
+ J Tik, t)mlj{t)dt-\- \ у^(Т, Tift, f)dt—
о 0
xik
- J W, j, T, t, v(t), А, т,ь)«0(Л 4)dz +
0
4/ 4/
+ J Tift, dt+ уи(Т, Tift, t)dt —
xik xik
— J S(f, /, T, tt x3k, xik)®ij(T, xGik)di +
x^h
175
+ ^„(T, Ъю t)m3ij(t)dt+ Tfft, tydt + NijfT, v ())<=
4/ 4/
rik
eMf,(T, rift)+ j ^fe(G?fe(Tffe—s)—E)x
6
x eAi^ik-^ Qfrds + J пи (Gif (T—s)—E) eAa(T-s> Q^s e= M2if.
Таким образом, в момент Т i=i(y{-))-fi преследователь ловит
убегающего. Теорема 2.1 доказана.
Продолжим изучение дифференциальной игры группы пресле-
дователей и одного убегающего с переменной структурой, описы-
ваемой уравнениями (2.1). Приводимые ниже метод построения
стратегий преследования и достаточные условия окончания игры
преследования отличаются от условий теоремы 2.1 и эффективны
для примеров, в которых инерционность преследователей может
меняться по сравнению с инерционностью убегающего.
Пусть —матрицы размерами п х п. По-
ложим для O^s^x
Ж»(т, s)=<Sr!t?u<’-» p.k Qt.
для T S -C t
2W. s)=(t— s) eAul,~s> Q,.
Яц&чЧ—s)—E)eA‘l(,~s,Qtds\.
И 1.5
Предположение 2.3. Существуют множество cz N, п X
X п-матрицы ^'л(т—s), —s) и функции и^(т, s), со^(/, $),
непрерывным образом зависящие от s, такие, что для всех (i, k, j,
т, s), i&Nlf k—{l,2}\j, множества Э1^(т, s)=#0,
s)&0, x)=0 и xik(T, s), coiy(Z, s)e S50-(Z, s),
Зафиксируем функции nik(y, t), s) и положим для
^т &iRn,
^ik)=^i^AihX x-k—Ctik + J x/ft(T, s)ds,
0
ф(г, k, T, s, aih, vh)=
j max{(p:(p>0, — <p^ft(x, aife) (^;кел^(т-5)Лй—
= I — k (t—s) <Ль(г-!!) vk—%ik (t—s))},
j если affe)=?fcO,
1 t-1, если aife) —0,
176
Pi(t, afft)=sup (1 — (<p(G k, t, s, aik, vh(s))ds],
где pA(.)—измеримая функция co значениями из множества Qk; для
О t
v(s)—{ ъ 1 J’ (2.11)
Пг/ T. vh (•))=л0-ел^'т) (aift+ jj dTffe X
0
t
X (^£\k (?—s)—E) vh (s) ds'j 4- J ioi} (/, s) ds;
T
ДЛЯ
4>(t, j, t, T, s, Vj vk(-), a/ft)=
тах{ф:ф>0, — ipnotf, T> vft(J)ее (n/;A(/~s)Pi}—
= — pw«, T, t)-
—$))}, если % T> fft(-))#=0,
. (t—т)-1, если т|оT> vfe(-)) = 0,
где Ро(/, т, s)—некоторая неотрицательная, непрерывная по s функ-
ция: J Pjj {t, т, s)ds=l;
т
P(t,(xik, ieN^), (aik, x^) =
t
=sup min (1 — f ш j, t, xlk, s, Vj(s), ufe(-), aift)dsY
«(.) H=Nt \ J /
xik
где у(-) — измеримая функция, определяемая соотношением
(2.11), Ост^сЛ
Предположение 2.4. Для начальной позиции х° игры (2.1)
существуют k(i), т^(г), т, векторы aih, функции xik(xih, s),
®о(^. s). xik, s), непрерывным образом зависящие от s, Ро(^»
Tjjj, s)>0, J ₽Ц(«, Tift, s)ds=l, такие, что Pi(rife, aift)=0 для всех
xik
i e а уравнение
Р(Л (xik i^NJ, (aik, ;еЛ\), x°)^0, />maxriftl
имеет положительный корень T (х°).
m
Теорема 2.2. Если для игры (2.1) в позиции х° выполнены
предположения 2.3, 2,4, то для позиции разрешима задача 8 —
задача преследования с переменной структурой, управляемой пре-
следователями, и Т — гарантированное время поимки.
Доказательство. Пусть для игры (2.1) в позиции х°
выполнены предположения 2.3, 2.4 и гДг1) — произвольное допу-
стимое управление убегающего. Вектор ищ1), тиад), находя-
щийся в распоряжении i-ro преследователя, выберем следующим
образом. В момент начала игры для позиции х° находим Л(г),
тад, удовлетворяющие предположению 2.4, а функцию
строим по такому правилу. Пусть Остст/*. Если для данного
v(-) функция
|(t, k, т, vh(-), aift)=l — J <p(i, k, xik, s, aik, vh(s))ds
о
положительна, то для 0<т<т^, и^(т) — решение уравнения
X ^(т) = хгА(тгА—т)—<p(i, k, xik, т, агА, vh(ryfiih(Tih, aih). (2.12)
Если T'fe—первое значение"параметра т, 0^т^т;а, для которого
?(г, k, rjfe, с/А(-), aiA)=0, то для тр<5<ггА, wiA(r)e ^—реше-
ние уравнения
uik (т)—т)еА^~х} vh(rffe—r). (2.13)
Пусть tik < t T(x°). Если для данного p(-) функция
t
p(i, Л xik, м-), ац)=1—j 1, Л Tift, s, Ms), M1), <*ik)ds
hk
положительна, то для riA< t < T, ui} (0 e Pih ml, (/) e М4ц (i, rik) —
решение уравнения
-MT,
—W, /, Л Tife, fj(^, fft(-), UikWuiT, ^ik, (2-14)
Если tli—первое значение параметра t, xik<Zt ^.T, для которого
р-(г\ Л ti, vk(-), aife)=o, то для цг;(0^Л/, mfy(if)e
еЛ4//(/, тгй)—решение уравнения
niieAa{T-t} u^-n^l (T-f)eW-t} УД/)-
-ЫТ, 1)т^^=в>и(Т, I). (2.15)
Функции ср(г, k, xik, т, aik, vk(r)), ф(г, /, Т, iik, т, цДт), пА(-), aik)
178
согласно утверждению измеримы по т, поэтому из предположений
2.3 и 2.4 в силу теоремы Филиппова (см. П.7) следует разреши-
мость уравнений (2.12) — (2.15) в классе измеримых функций
«//(£), /пг/4(/), Так выбранные управления будут гаран-
тировать окончание игры (2.1) к моменту Т(х9). Действительно,
согласно предположению 2.4 для управления v(t) найдется номер
i—i(t>(•)i)и момент времени iii}, xik^t^такие, что
p(i, j, Vk(-), ct(fe)=O. Для номера i —i(f(-)) согласно (2.1),
(2.12) — (2.15) имеем
xik
<S<iftxift(Tift)=dr£ft/^^x?fc-afft + J (#ikeA^~s) x
(j
X Mjfe(s)—S'ik^ik^ih— S)Uft(s))ds+ J —
0
—s)—vh(s)ds^aik==(^iheAi^x(ill—aik) X
xik
x (1 — J <p(g k, xih, x, aih, vh(x))dx^+aih +
Q
Tik
+ jj — s) — E)eAi^xih~s) vk(s) ds—
(Г
Tife я 4
0
^ijxij — Q^ihXik(^ik)
+ J nueAii{T~s}(ui}(s)—Uj(s))ds=
=nueAii(T-xik> (aift+ s)—E)'eAih(xib s) X
0*
X vk(s)dsj + J (л^ело(Г-5) uu(s)—ni}^2i}(T—s)eAu{T~s} Vj(s))ds }-
T th
+ ^u{^ii(T—s)—E)eAa(T~syvj(s) ds—
xik
x ik
=ПцеАИ{Т~х^ j e7ift(^k(Tift-“S)— E) X
о
179
- ?/
x vk(s)dsj [1 — j /, T,rikf s, Vj(s), Vh(-)t aih^ds)-\-
хл
+ J ni} (T-s)-E)Ati{T-s> Vj(s)ds e Ml,-.
xik
Таким образом, в момент Т i=i(v\)')~H преследователь ловит убе-
гающего. Теорема 2.2 доказана.
Пример 2.1. Пусть уравнени движения m преследователей
имеют вид
гг1(О)=гР1, zn))=z?b t = (2.16)
Zi2=Ui3, zfs0)=z-2. (2.17)
Если в момент тщ происходит перключение с системы (2.16) на
(2.17), то выполнено условие zt-2(ii) =zix (т£д); если в момент т12
происходит переключение с систем! (2.17) на (2.16), то выполне-
но условие 2г1 (т(2)=2£2(Т|2), 2гт(т(2=0. Уравнения движения убе-
гающего имеют вид
w~v, да((=йу°. (2-18)
Здесь гг1, zf2, u/2, w, vt=R2, 1ЫК1, 1Ы1<1, IH<1.
Преследование считается завершеным, если для некоторых t, t>
>0, ZiX(t)=w{t) либо zi2(t)=w(t).
Перейдем к: соответствующей ди>ференциальной игре вида (2.1).
Положим хг1=(хь, xt2)=(zil—w, zit xi2=(xt2, xf2)=(zi2—w, 0). Тогда
{Xц — Хц V, X i2 :— Щ2 У, #
Xji X j2 0»
<^1=^2 = (f °); /fl={xn:4=0},
Mi2={xi2: xl2=0), з1=лг2=^ <5
fat (E 0\
1,0 E )’ e ^0 ER
где E — единичная матрица вторсо порядка. Предположение 2.3
выполнено, если Spiffs) — единичая матрица четвертого поряд-
ка,
^{s)=^)EOj
.. f s, 0 1,
WMS) = | 1, S>!,
s)=0, Xi(Tu, s)=0.
180
Предположение 2.4 выполнено, если А=1, /=2. Моменты времени
ъь для рассматриваемой игры являются корнем уравнения
Такое уравнение имеет корень при любом оц. Обозначим т=
= max тп. Динамика игры (2.16) — (2.18) и метод преследова-
ния (2.12), (2.13) позволяют обеспечить соотношение рДт, Uik) =
=0 для всех te{l, т}. Уравнение р(/, т, (сьл, ie{l, ...
..., m}), х°)=0 согласно гл. 4, § 1, 2 имеет корень, если
Oelnt П со{аг1 + &н, t = l,...,m}.
6nGS д_<°)
V
Из этого условия находятся векторы сщ. Таким образом, за-
дача 8 для игры (2.16)—(2.15) разрешима из всех начальных
позиций.
Глава 7
ГРУППОВОЕ ПРЕСЛЕДОВАНИЕ ДВУХ УБЕГАЮЩИХ
§ 1. Достаточные условия поимки группой
преследователей двух убегающих
В настоящем параграфе рассматриваются дифференциальные
игры группы преследователей и двух убегающих. Исследование
конкретных примеров таких дифференциальных игр показывает,
что для них характерна следующая ситуация. Преследующая
группа может организовать преследование так, чтобы ловить лю-
бого из двух убегающих на свой выбор. Однако рациональное по-
ведение убегающих позволяет одному из убегающих избегать по-
имки. В связи с этим актуален вопрос о достаточных условиях по-
имки обоих убегающих.
Предлагаемый метод преследования предполагает выделение
двух групп преследователей, первая из которых может поймать
одного убегающего за конечное время, а вторая либо сама сможет
поймать второго убегающего, либо может обеспечить такие пози-
ции игры в момент поимки первой группой первого убегающего,
что вместе они ловят второго убегающего.
Рассмотрим дифференциальную игру группы преследователей
и двух убегающих (см. гл. 2, п. Е), описываемую уравнениями
Zij=Atf (t) Zu f и (t, щ, Vj),
1 • 1J
Zii(*о)=$ь i=l, ... , m, 1,2.
где Zij^Rn, Ut^Pi(i)czRp, Vjf=Qj(t)czR4, oo), A/(0 —
квадратные матрицы порядка п, непрерывно зависящие от «г,
vj — параметры управлений преследователей и убегающих,
А(£), Qj(O — непрерывные в метрике Хаусдорфа компактнознач-
ные отображения, щ, Vj) — непрерывные по совокупности ар-
гументов функции. Преследователь с номером i распоряжается
выбором вектора (/(Z, /), щ(/)). Терминальное множество
+ где МП1 — линейные подпространства из Rnt
Mtj2(t) — выпуклозначные отображения из Ец1, Ьц1 — ортого-
нальное дополнение к М/1 в Rn. Игра (1.1) считается оконченной,
если найдутся номера /ь Z2^{1, ..., т} и конечные времена tu t2>-
такие, что (t)^ (/j), zi22(t2) Mi12(t2). Пусть ш/ — опе-
ратор ортогонального проектирования из Rn на подпространство
Lij1. Обозначим через Йц(/, т) фундаментальную матрицу решений
уравнения х=Аг/(/)х, причем Йц(т, т)=Е для всех т>/0, где Е —
единичная матрица.
182
Предположение 1.1. Существуют квадратные матрицы
Ny(t) порядка q, непрерывным образом зависящие от t, t<=[t0, Т],
такие, что для i^N, /е{1, 2} непусто множество
M3ti(t, 1о)=Мц (t) *- ( п^и (t, (s, Pi (s), Qj (s)) ds =£ 0, te
где uh vj)=fij(s, uh uh 2Vf/(s)^).
Рассмотрим многозначные отображения
F^t, s, v, /0)=JiyQ9(f, s)fif(s, Pi(s), Nijtyv/)—
Pij (Л s, t0)Mij(t, t0), s, t0)= fl Fif (t, s, v, Iq), t s> Zo,
VjeQjts}
где s, to) — некоторые неотрицательные, непрерывные no s,
OcscZ, функции, такие, что j Pij(t, s, tQ)ds—l.
Предположение 1.2. Множество Fij(t, s, t0) непусто для
T^t^s^i0, i^N, je{l, 2}, и существуют непрерывные no s, t0^
векторные функции ya(t, s, t0)^Fij(t, s, to).
Зафиксируем некоторые функции yij(t, s, t0), удовлетворяющие
предположению 1.2, и положим
t
%ij(C *0. ^ij)==nij^ij (C A>) %ij “b Уц (Л S, t^)ds,
il
a(i, j, t, s, t0, 2°., vj) —
max{aiy, аг;>0, — а^-(/, t0, ztyf=Ftj(t, s, vh tQ)—yi}(t, s, t0)},
если lij(t, t0, z°.) =A 0, (1.2)
(/—/0)-1, если % (t, to, zl) = 0
ДЛЯ t S t0 0, Vj GE Qj (s). Положим
t
pLj(t, to, z?)=l— inf max (а(г, j, t, s, tQ, z°.., vj(s))ds, (1.3)
1 Vd ) ieN, p !
J to
где Vj(s) — измеримая на интервале [£0, /] функция, принимаю-
щая значения из множества Q/(s), ^1C^.
Предположение 1.3. Для начальной позиции z°=(zpp . ..
... , z^p z°2, ... , z^2) игры (1.1) существуют множество Nx a N=
= {1, ... , т}, номер /^{1,2}, функции yu(t, s, /0), рг>(£, s, t0), та-
кие, что уравнение Ри-(^, /0> ^°)=0 имеет положительный корень
Tl(t0, z°).
При выполнении предположений 1.1—1.3 для игры (1.1) спра-
ведлива теорема, аналогичная теореме 4.1.2 и сформулированная
183
для игры вида (1.1) при фиксированном /. Таким образом, для
позиции г° группа преследователей с номерами из множества
ловит J-ro убегающего к моменту z°). Опишем управле-
ния г-го преследователя i^N}, гарантирующие поимку группой
преследователей /-го убегающего. Пусть щ(-) — произвольное
допустимое управление /-го убегающего. Введем функцию
г
h(i, j, t, Т\ 4, уд.); г°.)=1-Л а(г, /, t, s, /0, z°/} v}(s))ds, ieNv
X (1.4)
Если в момент ie[O, T1], h(i, jf t, T1, t0, Vj(-), то значе-
ния в момент i векторов P^t), my (t) Му (Т1, t0)—лексико-
графический минимум решений уравнения
МЩТ*. Л1(/(0о,(0)—(ЩТ1, i,
=Vu<.T1, t, i, T1, t, t„, z4r t0, ty. (1.5)
Если tii} — первое значение параметра fe[O, T1], для которого
h(i, /, t, Т1, /0) щ(-), Zz70)=0, то для Т1] значения в момент
t векторов mij3(t)^Mn3(Tl, /0) — лексикографиче-
ский минимум решений уравнения
ъШТ1,
t, «m?,.(O=Ti/P'1. {, И- (1-6)
Управление m(t), выбранное в соответствии с правилом (1.4) —
(1.6), далее обозначим щ(£, щ(0). Пусть £={1, 2}\/, Zik(Tl) =
щ(-)) — значение в момент Тх решения урав-
нения (1.1) при tii(s)=Ui(s, Vj(s)), Vj(s), где f/(s) — произволь-
ная измеримая функция se[0, Г1] со значениями из Qj(s). Пусть
a(t, k, /, s, t0, Zik°, vk) — функция, определяемая соотношением
(1.2) с заменой индекса j на индекс k, a(t, k, t, т, T1,
zik(Tx), Vk) — функция, определяемая соотношением (1.2) при за-
мене индекса / на индекс k, s на т, to на Т1, zy0 на гщу^Т1),
>х>>Тх. Положим для
t
Ргь(Л ^о» Тг> 2°) = sup min (1 — fa (Л k, t—s, t0, z°k, vk (s)) dsV (1.7)
vh(-) i£N2 \ J /
для
Ргн(^> ^o> 2°)= SUP т*п minffl —
(»>(•) .»!,()) (Щ) \\
1 й
rGA'i
t
— У<х(/, k, t, s, t0, z®k, vk(s))ds,
io
t
1 — Ja(r, k, t, T, T1, zxk(I\ Vj(-)), vh(T))dsy (1.8)
. r i
184
где Vj(-) — измеримая на интервале [/0, Г1] функция, У/(з)е
eQj(s); Vk(s) — измеримая на интервале [Г1, f] функция, Ofe(s)e
eQ>;(s), ЛЛ2с=Л\ NlC\N2=0.
Предположение 1.4. Для начальной позиции 2° игры (1.1)
выполнены предположения 1.1—1.3, и существуют множество
czTV, 7Vif]^=0, функции vik(t,s,t0), fnk(t,st t0), i(=N][)N2, такие, что
уравнение p2h(t, ?0, T}, z°)=0 имеет положительный корень
ТЦ2<\ to).
Теорема 1.1. Если для игры (1.1) в позиции & выполнены
предположения 1.1—1.4, то для позиции г° разрешима задача 9 —
задача преследования для дифференциальной игры группы пре-
следователей и двух убегающих, и Титлах {Т1, Т2} — гарантиро-
ванное время окончания преследования.
Доказательство. Пусть для игры (1.1) в позиции 2° вы-
полнены предположения 1.1—1.4, Vj(t) — произвольное управле-
ние /-го убегающего. Покажем, что преследователи с номерами из
множества используя управление йДв, иДз)) (см. (1.4) —
(1.6)), ловят /-го убегающего к моменту Т1. Функция a(i, /, Т\ s,
to, Zij°, Vj(s)) согласно утверждению П.2 измерима по s, поэтому
из предположений 1.1—1.3 в силу теоремы Филиппова (см. П.7)
функции ш(s), mj;3(s), выбранные как лексикографический мини-
мум среди решений уравнений (1.5) — (1.6), измеримы по s. Из
(1.1), (1.4) — (1.6) имеем
{Т1)=яц^1} (Г1, f0) z?.4- (Г1, s) х
io
Т1
X иДз), Ni}(s)v}(s))'ds + j лгЛ(Г, s)^(s, щ (s), Vj (s)) ds=
io
=^(P, t„ s, t,)ds+
to
Д M7"1, s. ylz(7’1, s, Qds—
А» to
Д a(<, /, T*. s, t„ 2%, t, 2°4)ds+
to
+ J Qm3ij(s)ds+\) VtjiT1, s, Qds-i
185
+ J s)ff*(s, Ut(s), vj(s))dsE=
to
е=М>1(Т\ U+J«,A/(P. s)/;,(s, «,(«). Vi(s))ds<=M2tl(T'). (1.9)
to
Таким образом, к моменту Т1 один из преследователей с номера-
ми из множества IV j ловит /-го убегающего.
Для величины T2=T2(t0, z°) могут быть два случая: либо Т2<
либо Т2>Т1. В первом случае будем считать, что преследо-
ватели с номерами из множества N2 выбирают векторы щ($)е
m.ik3(s)^Mih3(T2, to) по правилу (1.4) — (1.6) с соответ- \
ствующей заменой индекса / на индекс k, Тл на Т2. Согласно (1.9), *
(1.4)— (1.6), (1.7) (при соответствующей замене индекса j на ин- ‘
деке k, Т1 на Т2) получаем, что к моменту Т2 один из преследова- ,
телей с номером из множества N2 ловит #-го убегающего. Рас-
смотрим второй случай. Будем считать, что преследователи с но-
мерами из множества Nz выбирают функции ut(s)^Pi(s),
m№3(s)eAf/fe3(T2, /0), to^s^T2, как и в первом случае, т. е. по
правилу (1.4) — (1.6) с соответствующей заменой индекса j на k,
Т1 на Т2, i на I. Опишем способ выбора управлений для преследо-
вателей с номерами г из множества AG для ПстсТ2. Введем
функцию
ф(г, k, t, Т2, Т1, vk (•), 2rh (Tl))= 1 — a(r, k, t, т, T1, z^T1'), vh (r))dr.
n (1.10)
Если в момент t e [Г1, 712], ф(г, k, T2, T1, ЪД-), ггД7Д);>0, то
ur(t) е Pr(t), m3rk(t) M3rk^, Tl) — лексикографический минимум сре-
ди решений уравнения
ялЯл(Л, и,(0. Nrk(t)vk(t))-^r, t, T')m°k(t)=
=?Л<Т*. t, T’)-a(r, k, Г, t, Г, г,к(Г^, zr„(T^.
(1-11)
Если tr2—первое значение параметра ZefT1, Т2], для которого ф(г,
k, t, Т\ vk(-), 2гк(ТуУ)=0, то для t^(t2k, Т2) функции ur(t)^
е Pr(f), m3rk(t)^ M3rk(T2, Tl)—лексикографический минимум среди
решений уравнения
лгкагк(Г, t)frk(t, u2(t), Nrh^h(t))~
-$rh(T2, t, Г)т3А(/)=7гД7Л t, Г). (1.12)
В силу измеримости no t функции a (г, k, Т2, t, Т\ 2Г^(ТХ), уа(0)
(см. утверждение П.2), предположений 1.1—1.4 и теоремы Филип-
пова (см. П.7) функции iir(t), mrhz{t), выбранные согласно прави-
лу (1.10) — (1.12) — измеримые функции t, T^t^T2. Согласно
186
предположению 1.4 при данном управлении и*(/) до момента Т2
хотя бы одна из функций — либо h(l, k, t, Т2, to, vk(-), Zik°), ли-
бо ф(г, k, t, T2, T1, Vk(-), zrk(T1)) — обратится в нуль. Повторяя
выкладки, аналогичные (1.9), получаем, что один из преследова-
телей из множества ловит fe-ro убегающего к моменту Т2.
Теорема 1.1 доказана.
Пример 1.1. Пусть уравнения движения пяти преследовате-
лей и двух убегающих имеют следующий вид:
x=uh Xi(0)=Xi, i = l, ... ,5, (1.13)
где xif щ, yh v/EeR2, Ы<1. W^l, i = l, ... ,5, j=l, 2.
Преследование считается завершенным, если для некоторых ilt i2,
1 ir 5, 1 4 5 (необязательно различных), в некоторые конеч-
ные моменты времени и /2 справедливы равенства хг1 (ti)=t/i(^),
Считаем х?=(0; 1), х£=(/3/2; —1/2), 4=(— ^3/2;
— 1/2), /4= (14; 4), х^=(14; —4), р?=(0; 0), ^=(10; 0). Перей-
дем к соответствующей дифференциальной игре вида (1.1). По-
ложим 2;/=(хг—рг). Тогда из (1.13) имеем
Vj, Zy(0)=2i/, /=1, ... ,5, j=l,2, (1.14>
щ, Vj, Zij^R2, Ilf/IK 1.
Игра оканчивается, если для некоторых 1<£\<5, 1<г2с5, ^>-0,
/2>0, Zj1i(/1)=O, ^j2 (0=0. Начальные позиции игры таковы:
Zn=(0; 1), г1Г==(УЗ/2;;—1/2), г?,=(-/3/2;-1/2)г' zSt=(14; 4),
?si=(14; —4), z!2=(—10; 1), ^=(/3/2-10; -1/2),
гз2=(—1/3/2—10; —1/2), z°2=(4; 4), z5°2=(4; —4).
Положим Nii (t)=E2, E2—единичная матрица второго порядка, у^-(С
s, /о)==0. Предположения 1.1, 1.2 для игры (1.14) выполнены. По-
ложим ^={1, 2, 3}, JV2={4,5}. Используя результаты гл. 4, §2,
получаем
а (/, /, t, s, 0, z°{., Vj)=
I!
и функция рАу (/, tn, 2°) имеет положительный корень, если
60=min max(p, z0/||^1’||)>0,
llPli=i iewi
при этом T1=(m max ||zfT(O)||)/26o. Для рассматриваемых начальных
iGAf,
187
позиций Т1=3. Рассмотрим возможные состояния игры (1.14) в
момент Т1=3. Для i—4,5 в силу правила (1.4), (1.6) и расчетов
гл. 4, § 2 будем иметь z42(T') =E4z42°, z^fT1)^^0, где
0<^|2<1. Если g4=0, то игрок с номером 4 ловит второго убегаю-
щего, если %5=0, то игрок с номером 5 ловит убегающего. Если
£4>0 и |5>0, то, вычисляя функцию §о для игроков с номерами
4, 5 и любого игрока с номером из множества Ni (например, 1),
получаем, что 60>0, Т2 = 22.5. Таким образом, для рассматривае-
мой позиции игра преследования двух убегающих разрешима.
ПРИЛОЖЕНИЕ
В настоящем приложении приводятся некоторые утверждения,
которые используются в основной части пособия. Часть утвержде-
ний приведена без доказательства с указанием источников, в ко-
торых можно найти достаточно подробное изложение соответству-
ющего материала.
Утверждение П.1 [13, 20]. Пусть А(х), В(х) — непрерыв-
ные в точке x(}<=Rl отображения Rl^Q(Rn). Тогда отображения
A(x)UB(x), А(х)+В(х) непрерывны в точке Хо, а отображения
А(х)рВ(х), А(х)— В(х) при условии А (х) (]В (х) =£0, А (х)— В (х) Ф
^=0 в некоторой окрестности точки х0 полунепрерывны сверху
по включению в точке хо.
Утверждение П.2. Пусть А (/, v) :[/0, Г]х (Еп) — вы-
пуклый компат в Еп, непрерывным образом зависящий от сово-
купности аргументов t, v, /<[/0 Т}, v^QazEv, А(/, при всех
/е[/0, Л, ueQ, Q и ВаЕп — выпуклые компакты-, х^.Еп, х^-В',
%(/, v, x)=max {X : 0, —Х(х—B)f)A(Z,
Тогда при фиксированном х функция Xff, v, х) полунепрерывна
сверху по совокупности аргументов (t, v).
Доказательство. Используя аппарат опорных функций,
можно получить следующее представление функции %(/, v, х)
[63, с. 907]:
X (Ч v, х)= inf c(A(t, о), —р),
РЕР(х)
где Р (х) =={р^Еп: (р, х)—с (В, р) = 1}, с (В, р) — опорная функция
множества В в направлении р. Зафиксируем вектор х. В силу
свойств опорной функции [13, 20] из непрерывности по совокуп-
ности аргументов t, v, компакта A{t, v) следует непрерывность
по совокупности аргументов (t, v, р) функции c(A(f, v), —р),
откуда в силу леммы об инфинуме непрерывной функции [65,
с. 174] следует полунепрерывность сверху по совокупности аргу-
ментов t, v функции h(t, v, х) при фиксированном х. Утвержде-
ние П.2 доказано.
Утверждение П.З [61]. Если уь .,,, у^.Е\ то
min уг щах уг.
i=l,..,,fe k i=l..fe
189
Продолжим сводку свойств функции X(t, V, х). Пусть A(t, и) =
=А—v, где А — выпуклый компакт в Rn, v^A, АэО.
Утверждение П.4. Пусть А, В — выпуклые компакты в
Rn, v<=A, АзО, х^ В, X(f)=max{X:X>0, —Х(х—В)ПИ—v)¥=0}.
Тогда функция Х(у) — вогнутая функция v, неА, и существует
минимум функции Х(н) по v для
Доказательство. Воспользуемся представлением X (и)
через опорные функции
Х(ц)= inf [с(А, — p) + fr, p)J,
pgp
Р={р:(р, х)—с(В, р)=1}.
Функция F(v, р)=с(А, —p) + (v, р) вогнута по и для каждого
реР. Покажем, что функция X (v)= inf F (v, p) вогнута no v для
реп
v^A. В силу вогнутости F(u, р) по v для и<=А, имеем
HF(t»i, р) + (1 —H)F(u2, p)<F(pv1H-(l — ji)u2, р)
для любого psP, Vi, v^A. В силу определения inf и не-
прерывности F(v, р) по р при фиксированном v найдется последо-
вательность векторов рп, такая, что
F(iWi + (l—Н)^2, Pn)-> inf F^-Hl — |х)и2, р).
PGP
В силу соотношения Х(п)>0, t'e4, имеем
И inf Ffa, р)4-(1—jx)inf F (t>2, pXhF(vu pj +
p&p pgp
+ o— H)F(v3, p„)^F(pUi + (l— P)v2, pn).
Таким образом, для каждого п верно неравенство
рХ (щ) + (1 — р) X (о2) < F (р^ + (1 — р) v2t рп).
Переходя к пределу при л->оо, получаем
рХ^ + Ц— р.)Х(и2Х inf F^ + vl — p)t!2 p)=X(^i+(l—|i)v2),
PGP
т. e. функция X(u) вогнута no v для i'g4. Из вогнутости X(u)
no v для v^.A и компактности А следует существование миниму-
ма функции Х(у) по v для у<=А [29]. Утверждение П.4 доказано.
Утверждение П.5. Пусть A(t, у):[^0, T]xQ^-Q(Rn) —
выпуклый компакт в Rn, непрерывным образом зависящий от со-
вокупности аргументов vt A(t, v)^0 для ecex_^[t0, Т], v^Q;
Q, M — выпуклые компакты в Rn, x^Rn, х^ М,
K{t, v, m)=max{X: Х^О, —Х(х—т)ПА(£, ц) =5^0},
Х(/, v)=max Х(/, и, т).
тем
190
Тогда функция v) полунепрерывна сверху по совокупности
аргументов t, v.
Доказательство. Воспользуемся представлением функции
Л(/, v, т) через опорные функции
Х(/, v, т)= inf c(A(t, v), '—р},
р£Р(т)
Р (т)={р: р Rn, (р, х)—(т, х)=1).
Множество Р(т) непрерывно зависит от т, т^М [20, с. 109].
Следовательно, в силу леммы об инфимуме непрерывной функции
[65, с. 18] следует полунепрерывность сверху по совокупности ар-
гументов t, v, т функции л(/, о, т). Полунепрерывность сверху
функции у) по совокупности аргументов теперь следует из
[59, с. 27, лемма 1.1]. Утверждение П.5 доказано.
Утверждение П.6 (неравенство Гронуолла [61]). Пусть ср (О,
Ч* (О» Х(0—непрерывные на [а, 5] функции и %(0>0 пРи
причем
i
Тогда
t
t J X(u)du
<p (t) ф (t) 4- ф (/) es ds
a
при axZt^b.
Перейдем к формулировке теоремы А. Ф. Филиппова. Много-
значным отображением [28] будем называть произвольную функ-
цию F: Rm-+K (Rn), т. е. функцию, аргументом которой являются
векторы x<=Rm, а значениями — элементы пространства K(Rn)
(непустые компактные множества из пространства Rn). Много-
значное отображение F(x) называется измеримым, если для лю-
бого числа 8>0 и любого непустого компакта AcrRn множество
{x^Rm:a(F(x)t А)^е} измеримо по Лебегу. Здесь а(А, В) —
хаусдорфово расстояние между множествами А и В ([28, с. 196]).
Функция f:Rm-^Rn называется однозначной ветвью (селектором)
многозначного отображения F:Rm-+K(Rn), если при всех x^Rm
выполняется включение f (x)eF(x).
Утверждение П.7, (теорема А. Ф. Филиппова [60]). Пусть
функция f(x, u):RmxRp~±Rn измерима по х и непрерывна по и.
Далее, пусть отображение U:Rm^K(Rp) и функция v:Rm-+Rn из-
меримы и v(x)^f(x, L/(x)). Тогда существует такая измеримая
ветвь ц(х) у отображения U[x), что v(x)—f(x, и(х)).
КОММЕНТАРИИ
Глава 1. Формализация Л. С. Понтрягина дифференциальной игры пре-
следования — убегания в том виде, в котором мы приводим ее в § 1, содер-
жится в работах [2—4, 7]. Первый прямой метод преследования Л. С. Понт-
рягина изложен в работах [2, 4]. Его дальнейшему развитию посвящены рабо-
ты [34, 37, 42, 47, 48], Систематическому изложению метода посвящен курс
лекций М, С. Никольского [18], Метод убегания Л. С. Понтрягина и Е. Ф. Ми-
щенко изложен в работах [6, 7]. В § 3 приведена теорема, соответствующая
«грубому» случаю в дифференциальной игре убегания. Работа [7] содержит
решение задачи убегания и в так называемом «тонком» случае. Использование
процедуры управления с «поводырем» Н. Н. Красовского и А. И. Субботина
[11, 12] позволяет строить позиционные методы решения соответствующих
задач. С другими конструктивными процедурами решения задач преследо-
вания — убегания двух игроков можно познакомиться, например, по работам
[10—12] (метод экстремального прицеливания и метод потенциала Н. Н. Кра-
совского), [49, 74] (методы преследования Б. Н. Пшеничного).
Глава 3. Основной результат § 1 — теорема Б. Н. Пшеничного о разре-
шимости задачи группового преследования, впервые сформулированная в ра-
боте [22] и породившая многочисленные исследования [17, 55—57, 77]. Резуль-
тат § 2 — теорема Р. П. Иванова о разрешимости задачи группового пресле-
дования на компакте [15]. Эффективный метод решения задачи группового
преследования при ограниченных координатах убегающего содержится в рабо-
те А. А. Чикрий [63]. В § 3 мы излагаем метод уклонения от многих пресле-
дователей Ф. Л. Черноусько, следуя работе [78]. Эффективные методы решения
задач уклонения от многих преследователей содержатся в работах [41, 55, 56].
В изложении материала § 4 о разрешимости задачи простого преследования
тремя преследователями двух убегающих мы следовали работе [79]. Для углуб-
ленного изучения рекомендуем работы [75, 19].
Глава 4. Настоящее изложение метода гарантированного неухудшения по-
зиции основано на работах [14, 31, 79, 81, 82]. Для дальнейшего изучения ре-
комендуем метод разрешающих функций в теории конфликтно управляемых про-
цессов преследования [21, 50, 52]. В этих работах предлагается схема решения
задачи, основанная на использовании некоторых функций, называемых разре-
шающими. При этом важную роль играют селекторы многозначных отображе-
ний. Установлена связь метода разрешающих функций с первым прямым ме-
тодом Л. С. Понтрягина, что позволяет изучить структуру экстремальных се-
лекторов, доставляющих минимум времени преследования в методе разрешаю-
щих функций. Такие методы применены А. А. Чикрий и его учениками для ре-
шения задачи об обходе последовательности множеств задачи преследования
192
при распределенном начальном состоянии, задач группового и поочередного пре-
следования. В работе [63] предложен вариант метода для задачи группового
преследования при ограниченных координатах'убегающего, в работе [74] — для
нелинейной задачи преследования.
Глава 5. Для дальнейшего ознакомления со способами решения задачи
группового преследования разнотипными объектами можно рекомендовать ра-
боты [14, 79, 81, 82, 88].
Глава 6. Для первоначального знакомства с проблематикой главы полез-
но изучить работу М. С. Никольского [42]. Для дальнейшего чтения рекомен-
дуем работы [84—86].
Глава 7. При изложении материала мы следовали работе [79]. Для даль-
нейшего чтения рекомендуем работы [81, 76].
ЛИТЕРАТУРА
Основная
1. Понтрягин Л. С. К теории дифференциальных игр//УМН. 1966. Т. 21,
№ 4. С. 219—275.
2. Понтрягин Л. С. О линейных дифференциальных играх. 1//ДАН СССР.
1967. Т. 174, № 6. С. 1278—1280.
3. Понтрягин Л. С. О линейных дифференциальных играх. П//ДАН СССР.
1967. Т. 175, № 4. С. 764—766.
4. Понтрягин Л. С. Линейные дифференциальные игры преследования//
//Мат. сб. 1980. Т. 112, № 3. С. 307—330.
5 Мищенко Е. Ф„ Понтрягин Л. С. Линейные дифференциальные игры//
//ДАН СССР. 1967. Т. 174, № 1. С. 27—29.
6. Понтрягин Л. С., Мищенко Е. Ф. Задача об уклонении от встречи
в линейных дифференциальных играх//Дифференц. уравнения. 1971. Т. 7,
№ 3. С. 436—445.
7. Понтрягин Л. С. Линейная дифференциальная игра убегания//Тр. МИАН
СССР. 1971. Т. 11'2. С. 30—63.
8. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М.: Нау-
ка, 1965.
9. Математическая теория оптимальных процессов/Л. С. Понтрягин, В. Г. Бол-
тянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. М.: Наука, 1969.
10. К р а с ов с к и й Н. Н. Игровые задачи о встрече движений. М.: Наука.
1970.
11. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные
игры. М.: Наука, 1974.
12. К р а с о в с к и й Н. Н. Управление динамической системой. М.: Наука, 1985.
13. Благодатских В. И. Теория дифференциальных включений. Ч. I. М.:
Изд-во МГУ, 1979.
14. Григоренко Н. Л. Дифференциальные игры преследования несколькими
объектами. М.: Изд-во МГУ, 1983.
15. Иванов Р. П. Простое преследование — убегание на компакте//ДАН
СССР. 1980. Т. 254, № 6. С. 1318—1321.
16. К у р ж а н с к и й А. Б. Управление и наблюдение в условиях неопределен-
ности. М.: Наука, 1977.
17. Лагунов В. Н. Введение в дифференциальные игры. Вильнюс: Институт
математики и кибернетики АН ЛитССР, 1979.
18. Никольский М. С. Первый прямой метод Л. С. Понтрягина в диффе-
ренциальных играх. М.: Изд-во МГУ, 1984.
19. Петросян Л. А. Дифференциальные игры преследования. Л.: Изд-во ЛГУ,
1977.
20. П о л о в и н к и н Е. С. Элементы теории многозначных отображений. М.:
МФТИ, 1982.
21. Пшеничный Б. Н., Чикрий А. А., Раппопорт И. С. Преследование
несколькими управляемыми объектами при наличии фазовых ограничений//
ДАН СССР. 1981. Т. 259, № 4. С. 786—789.
22. Пшеничный Б. Н. Простое преследование несколькими объектами//Ки-
бернетика. 1976. № 3. С. 145—146.
23. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управ-
ления. М.: Наука, 1981.
194
24. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и
поиска. М.: Наука, 1978.
Дополнительная
25. А й з е к с Р. Дифференциальные игры. М.: Мир, 1,967.
26. Аркин В. И., Левин В. Л. Выпуклость значений векторных интегралов,
теоремы измеримого выбора и вариационные задачи//УМН 1972. Т. 27, № 3.
С. 21—77.
27. Болтянский В. Г. Оптимальное управление дискретными системами. М.:
Наука, 1973.
28. Благодатских В. И., Филиппов А. Ф. Дифференциальные включения
и оптимальное управление//Тр. МИАН СССР. 1985. Т. 169. С. 194—252.
29. В а с и л ь е в Ф. П. Численные методы решения экстремальных задач. М.:
Наука, 1980.
30. Варга Дж. Оптимальное управление дифференциальными и функциональ-
ными уравнениями. М.: Наука, 1977.
31. Григоренко Н. Л. О квазилинейной задаче преследования несколькими
объектами//ДАН СССР. 1979. Т. 249, № 5. С. 1040—1043.
32. Г р и г о р е н к о Н. Л. К линейной задаче преследования несколькими объ-
ектами//ДАН СССР. 1981. Т. 258, № 2. С. 273—279.
33. Г р и г о р е н к о Н. Л. Преследование несколькими управляемыми объекта-
ми двух убегающих//ДАН СССР. 1985. Т. 282, № 5. С. 1051—1054.
34. Г у с я т н и к о в П. Б., Никольский М. С. Об оптимальности времени
преследования//ДАН СССР. 1969. Т. 184, № 3. С. 518—521.
35. Гусятников П. Б., Половинкин Е. С. Задача преследования в квази-
линейной дифференциальной игре с простой матрицей/УКибернетика. 1981.
№ 6. С. 122—124..
36. 3 ел икин М. И." Об одной дифференциальной игре с неполной информаци-
ей//ДАН СССР. 1972. Т. 202, № 5. С. 998—1000.
37. Зонневенд Д. Об одном методе преследования//ДАН СССР. 1972. Т. 204,
№ 6. С. 1296—1299.
38. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. М.: Нау-
ка, 1974.
39. Красовский Н. Н., Осипов Ю. С. Линейные дифференциально-разно-
стные игрыУ/ДАН СССР. 1)971. Т. 197, № 4. С. 777—780.
40. Красовский Н. Н., Осипов Ю. С. К теории дифференциальных игр с
неполной информацией//ДАН СССР. 1974. Т. 215, № 4. С. 780—783.
41. Мищенко Е. Ф., Никольский М. С., Сатимов Н. Ю. Задача ук-
лонения от встречи в дифференциальных играх многих лиц//Тр. МИАН
СССР. 1977. Т. 143. С. 105—129.
42. Никольский М. С. Линейные дифференциальные игры с переменной
структурой//ДАН СССР. 1984. Т. 276, № 4. С. 791—794.
43. Партхасаратхи Т., Рагхави Т. Некоторые вопросы теории игр двух
лиц. М.: Мир, 1974.
44. Петров Н. Н. Существование значения игры преследования//Дифференц.
уравнения. 1971. Т. 7, № 5. С. 825—839.
45. Петросян Л. А., Томский Г. В. Геометрия простого преследования.
Новосибирск; Наука. Сиб. отд-ние, 1983.
46. П о ж а р и ц к и й Г. К. Задача Айзекса об огибании острова//Прикл. мате-
матика и механика. 1982. Т. 46, № 5. С. 707—713.
47. Пономарев А. П., Розов Н. X. Устойчивость и сходимость альтерниро-
ванных сумм Понтрягина//Вестн. Моск, ун-та. Сер. 15. Вычисл. математика
и кибернетика. 1978. № 1. С. 82—90.
48. П о н т р я г и н Л. С., Мищенко А. С. Линейная дифференциальная игра
преследования (аналитическая теория)//Мат. сб. 1986. Т. 131, № 2
С. 131 — 158.
49. Пшеничный Б. Н. Линейные дифференциальные игры//Автоматика и те-
лемеханика. 1968. № 1. С. 65—78.
195
50. Пшенич ный Б. Н., Чикрий А. А., Раппопорт И. С. Эффективный
метод решения дифференциальных игр со многими преследователями//ДАЦ
СССР. 1981. I. 256, № 3. С. 531—535.
51 Пшеничный Б. Н. Структура дифференциальных игр//ДАН СССР. 1969.
Т. 184, № 2. С. 285—287.
52. П и т ц ы к М., Чикрий А. А. О задаче группового преследования//При-
кладная математика и механика. 1982. Т. 46, № 5. С. 730—736.
53. Роджерс К. А. Укладки и покрытия. М.: Мир, 1968.
54. Рокафеллер Р. Выпуклый анализ. М,: Мир, 1973.
55. С а т и м о в Н. Ю. О задачах преследования и уклонения от встречи в не-
линейных дифференциальных играх многих лиц//Теория игр и ее приложе-
ния. Кемерово, 1983. С. 60—75.
56. Сатимов Н. Ю. Задачи преследования и убегания для одного класса ли-
нейных дифференциальных игр многих лиц//Прикл. математика и механи-
ка. Сб. научных трудов № 670. Ташкент, 1981. С. 54—64.
57. Соловьева О. А. Простое преследование одного объекта т объектами//
//Межвузовский тематический сб. Дифференциальные бескоалиционные ко-
оперативные и антагонитические игры. Калинин, 1979. С. 94—98.
58. Тот Л. Ф. Расположение на плоскости, на сфере, в пространстве. М.: Физ-
матгиз, 1958.
59. Федоров В. В. Численные методы максимина. М.: Наука, 1979.
60. Ф и л и и п о в А. Ф. О некоторых вопросах теории оптимального регулиро-
вания//Вестн. Моск, ун-та. Сер. математика, механика, физика, химия. 1959.
№ 2. С. 34—41.
61. Харди Г. Г., Литтлвуд Д. Е., Полна Г. Неравенства. М.: ИЛ, 1948.
62. Чикрий А. А. Квазилинейная задача сближения с участием нескольких
лиц//Прикл. математика и механика. 1979. № 3. С. 451—455.
63. Чикрий А. А. Групповое преследование при ограниченных координатах
убегающего//Прикл. математика и механика. 1982. Т. 46, № 6. С. 906—
913.
64. Ш клярский Д. О., Ченцов Н. Н„ Я гл ом И. М. Геометрические оцен-
ки и задачи из комбинаторной геометрии. М/. Наука, 1974.
65. А1 f s е n Е. М. Compact convex sets and boundary integrals//ERGEBNISST
DER MATHEMATIK un IHRER GRENZGEBIETE. B. 57. Berlin, New York,
Springer—Verlag. 1971.
66. Blagniere A., Gerard F., Leitman G. Quantitative and Qualitative
Games. Academic Press, 1969.
67. Петросян Л. А., Томский Г. В. Дифференциальные игры с неполной
информацией. Иркутск: Изд-во Иркут, ут-та. 1984. С. 187.
68. Меньшиков И. С., Меньшикова О. Р. Методы оптимального управ-
ления и дифференциальных игр в задачах управления каскадом водохрани-
лищ//ВЦ АН СССР. Сообщения по прикладной математике. М., 1983. С. 40.
69. Ермолов А. Н., Меньшиков И. С. К математической теории управле-
ния каскадом водохранилищ//ВЦ АН СССР. Сообщения по прикладной ма-
тематике. М., 1983. С. 45. ’
70. Пог о ж е в И. Б. Применение математических моделей заболеваний в кли-
нической практике. М.: Наука, 1988.
71. Хачатуров В. Р., Босолейль Р., Федосеев А. В. Имитационное
моделирование и задачи оптимального управления при долгосрочном пла-
нировании производства многолетних сельскохозяйственных культур//ВЦ АН
СССР. Сообщения по прикладной математике. М., 1985. С. 60.
72. Федосеев А. В., Босолейль Р., Раимжанов Ж. Д. Ступенчатые
задачи оптимального управления сельскохозяйственным производством//
//ВЦ АН СССР. Сообщения по прикладной математике. М., 1986. С. 25.
73. Ашонов С. А. Введение в математическую экономику. М.: Наука, 1984.
74. Пшеничный Б. Н., Шишкина Н. Б. Достаточные условия конечности
времени преследования//Прикл. математика и механика. 1985. Т. 49, вып. 4.
С. 517—523.
75. Петров Н. Н., Петров Н. Н. О дифференциальной игре «казаки-раз-
бойники»//Дифференц. уравнения. 1983. Т. 19. С. 1366—1374.
196
76. Пр окоп ов ич П. В., Чикрий А. А. О взаимодействии групп управляе-
мых объектов//Теория оптимальных решений. Киев, 1987. С. 71—75.
77. Григоренко Н. Л. Игра простого преследования—убегания группы пре-
следователей и одного убегающего//Вестн. Моск, ун-та. Сер. 15. Вычисл.
математика и кибернетика. 1983. № 1. С. 41—46.
78. Черноусько Ф. Л. Одна задача уклонения от многих преследователей//
//Прикл. математика и механика. 1976. Т. 40, вып. 1. С. 14—24.
79. Г р и г о р ен ко Н. Л. Задача преследования в дифференциальных играх
многих лиц//Мат. сб. 1988. Т. 135(177), № 1. С. 36—45.
80. Лагунова Н. В. Об одном классе дифференциальных игр//Вопросы вы-
числительной математики и программного обеспечения - ЭВМ. М,; Изд-во
МГУ, 1988. С. 20—31.
81. Григоренко Н. Л. Задача преследования несколькими объектами//Тр.
Мат. ин-та АН СССР. 1984. Т. 166. С. 61—75.
82. Г р и г о р е н к о Н. Л. К задаче группового преследования//Тр. мат. ин-та
АН СССР. 1988. Т. 185. С. 66—73.
83. Григоренко Н. Л. Дифференциальные игры с переменной структурой//
//Некоторые проблемы современной математики и их приложения к зада-
чам математической физики. М.: МФТИ, 1985. С. 54—61.
84. Никольский М. С. Об одной задаче управления с нарушениями в ди-
намике//Тр. Мат ин-та АН СССР. 1988. Т. 185. С. 181—186.
85. Никольский М. С. О задаче управления системой с нарушениями//ДАН
СССР. 1986. Т. 287, № 6. С. 1317—1320.
86. Д е м и д о в К. В. Дифференциальные игры с переменной структурой груп-
пы преследующих и одного убегающего//Прикл, математика и механика.
1986. Т. 50, № 1. С. 155—159.
87. Демидов К. В. О задаче группового преследования в дифференциальных
играх с переменной структурой//Вестн. Моск, ун-та. Сер. 15, Вычисл. ма-
тематика и кибернетика. 1986. № 1. С. 62—67.
88. Чикрий А. А., Питцык М. В. Сочетание усилий преследователей с раз-
личными динамическими возможностями//ДАН УССР. Сер. А. 1984. № U
С. 73—76.
УЧЕБНОЕ ИЗДАНИЕ
ГРИГОРЕНКО Николай Леонтьевич
МАТЕМАТИЧЕСКИЕ МЕТОДЫ УПРАВЛЕНИЯ
НЕСКОЛЬКИМИ ДИНАМИЧЕСКИМИ
ПРОЦЕССАМИ
Зав. редакцией Н. М. Глазкова
Редактор И. М. Рогова
Художественный редактор Ю. М. Добрянская
Технический редактор О. В. Андреева
Корректоры И. А. Мушникова, Т. С. Милякова
И Б № 3666
Сдано в набор 10.04.90 Подписано в печать 22.11.90
Формат 60X90/16 Бумага офс. № 2
Гарнитура литературная. Высокая печать.
Уел. печ. л. 12,5 Уч.-изд. л. 13,24
Тираж 3040 экз. Заказ 288. Изд. № 1060
Цена 45 коп.
Ордена «Знак Почета» издательство Московского университета.
103009, Москва, ул. Герцена, 5/7.
Типография ордена «Знак Почета» нзд-ва МГУ
119899, Москва, Ленинские горы.