Text
                    А. Д. ИОФФЕ
В.М.ТИХОМИРОВ
Теория
ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
НЕЛИНЕЙНЫЙ АНАЛИЗ
И ЕГО ПРИЛОЖЕНИЯ
А. Д. ИОФФЕ,
В. М. ТИХОМИРОВ
ТЕОРИЯ
ЭКСТРЕМАЛЬНЫХ
ЗАДАЧ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1974
517.2 И 75
УДК 519.3
Серия «Нелинейный анализ и его приложения» выпускается под общей редакцией
Н. Н. Боголюбова, М. А. Красносельского, Ю. А. Митропольского
Теория экстремальных задач. А. Д. Иоффе, В. М. Тихомиров. Главная редакция физико-математической литературы изд-ва «Наука», М., 1974.
Книга посвящена необходимым и достаточным условиям экстремума и теоремам существования решений экстремальных задач. Особое внимание авторы уделяют общим принципам теории экстремальных задач. С единых позиций изучаются задачи математического программирования, вариационного исчисления и оптимального управления. Исследуются специальные классы задач — линейное программирование, квадратичные задачи, дискретные и линейные задачи оптимального управления. Большое число решенных задач и разобранных примеров показывают, как применять теорию в конкретных случаях.
Книга может служить учебным пособием по курсам, связанным с оптимизацией. Она рассчитана на студентов старших курсов университетов, а также на аспирантов и научных работников, занимающихся решением экстремальных задач.
Книга содержит 15 илл., библ. 313 назв.
© Издательство «Наука», 1974.
и 20203-083 _ __
И 053 (02)-74 65'73
ОГЛАВЛЕНИЕ
Предисловие ................................................. 5
Список основных обозначений	.......................... 8
0. Введение. Предварительные сведения........................11
§	0.1.	Функциональный анализ..........................22
§	0.2.	Дифференциальное исчисление....................33
§	0.3.	Выпуклый анализ............................... 56
§	0.4. Дифференциальные	уравнения	. . в...............62
Глава 1. Необходимые условия	экстремума.....................73
§	1.1. Постановки задач и формулировки основных теорем 73
§	1.2. Гладкие задачи. Правило множителей Лагранжа 85
§	1.3. Выпуклые задачи. Доказательство теоремы Куна — Таккера .............................................88
§	1.4. Гладко-выпуклые задачи. Доказательство экстремального принципа ...................................92
Глава 2. Необходимые условия экстремума в задачах классического вариационного исчисления и оптимального управления...............................................101
§ 2.1.	Постановки задач...............................101
§ 2.2.	Элементарный вывод необходимых условий экстремума для простейших задач классического вариационного исчисления.................................109
§ 2.3.	Задача Лагранжа. Уравнение Эйлера — Лагранжа 134
§ 2.4.	Принцип максимума Понтрягина. Формулировка и обсуждение .........................................143
§ 2.5.	Доказательство принципа максимума..............158
Глава 3.	Элементы выпуклого	анализа......................172
§ 3.1.	Выпуклые множества	и теоремы	отделимости . .172
>	§	3.2.	Выпуклые	функции ..............................178
§ 3.3. Сопряженные функции. Теорема Фенхеля — Моро 183
v	§	3.4.	Теоремы	двойственности.........................188
>	§	3.5.	Выпуклый	анализ в конечномерных	пространствах	194
Глава 4.	Локальный выпуклый анализ.......................202
§ 4.1.	Однородные функции и производные по направлениям ...............................................202
§ 4.2.	Субдифференциал. Основные	теоремы..............207
§ 4.3.	Конусы опорных функционалов....................216
1*
4
ОГЛАВЛЕНИЕ
§ 4.4.	Локально выпуклые функции......................219
§ 4.5.	Субдифференциалы некоторых функций .... 223
Глава 5. Локально выпуклые задачи и принцип максимума для задач с фазовыми ограничениями....................234
§ 5.1.	Локально выпуклые задачи.................234
§ 5.2.	Задачи оптимального управления с фазовыми ограничениями ..........................................244
§ 5.3.	Доказательство принципа максимума	для	задач
с фазовыми ограничениями..................251
Глава 6.	Специальные задачи.......................267
§ 6.1.	Линейное программирование................267
§ 6.2.	Теория квадратичных форм в гильбертовом пространстве ..........................................272
§ 6.3.	Квадратичные функционалы в классическом вариационном исчислении ................................ 280
§ 6.4.	Дискретные задачи оптимального управления	.	.	292
Глава 7.	Достаточные условия экстремума............299
§ 7.1.	Метод возмущений ..............................299
§ 7.2.	Гладкие задачи ................................305
§ 7.3.	Выпуклые задачи...........................314
§ 7.4.	Достаточные условия экстремума в классическом вариационном исчислении.........................318
Глава 8.	Измеримые многозначные отображения и выпуклый
анализ интегральных функционалов...........336
§ 8.1.	Многозначные отображения и измеримость	.	.	.	336
§ 8.2.	Интегрирование многозначных отображений	.	.	.	348
§ 8.3.	Интегральные функционалы..................355
Глава 9. Существование решений в задачах вариационного исчисления и оптимального управления.....................368
§ 9.1.	Полунепрерывность функционалов вариационного исчисления и компактность их лебеговских множеств 368
§ 9.2.	Теоремы существования решений..................384
§ 9.3.	Конволюционный интеграл и линейные задачи . . 401
Глава 10. Приложение теории к решению задач................421
§ 10.1.	Задачи геометрической оптики..................421
§ 10.2.	Неравенство Юнга и теорема Хелли..............431
§ 10.3.	Оптимальное возбуждение осциллятора .... 435
Задачи.....................................................440
Литература ................................................461
Предметный указатель.......................................477
ПРЕДИСЛОВИЕ
В последние годы усилия многих математиков были направлены на то, чтобы обозреть проблематику экстремальных задач с единой точки зрения, выделить общие черты в методах их исследования, разработать необходимый математический аппарат. В результате стало возможным говорить о создании теории экстремальных задач.
Три раздела этой теории приобрели ныне вполне оформленные очертания; это разделы, посвященные математическим основаниям теории, необходимым условиям экстремума и, хотя и в меньшей степени, теоремам существования решений. Бурно развивается глава теории, посвященная численным методам оптимизации. Теория достаточных условий еще не достигла полной завершенности, хотя и там получены некоторые результаты общего характера.
В предлагаемой книге затронуты все перечисленные выше основные разделы теории экстремальных. задач, кроме численных методов. Математическому аппарату и необходимым условиям экстремума посвящены первые пять глав. Достаточные условия изучаются в седьмой Главе. В восьмой и девятой главах сосредоточены теоремы существования решений задач вариационного исчисления и оптимального управления, вместе с необходимым для их доказательства математическим аппаратом. В шестой главе из общей теории, развитой в предыдущих главах, извлекаются следствия для классов задач со специфической структурой — линейной, выпуклой, квадратичной и дискретной. Последняя, десятая глава посвящена некоторым приложениям теории к решению конкретных задач. В книге имеется, кроме того, раздел «Задачи», и многие задачи снабжены решениями.
При отборе материала мы не стремились охватить все последние результаты. Главная цель книги — рас-
6
ПРЕДИСЛОВИЕ
крыть и обозреть методы, накопленные в теории экстремальных задач, и показать, как эти методы применяются в конкретных разделах: математическом программировании, вариационном исчислении и оптимальном управлении.
Первоначальным стимулом для создания теории экстремальных задач служили попытки уложить принцип максимума Понтрягина в рамки общих концепций. Эти попытки привели к рассмотрению задач со смешанной, гладко-выпуклой структурой. Один класс таких задач подробно исследуется в книге. К тем же проблемам возможны и другие подходы, — какие из них окажутся наиболее плодотворными, покажет будущее.
Книга рассчитана прежде всего на студентов старших курсов университетов, на аспирантов и научных работников, занимающихся решением экстремальных задач. При написании книги был использован опыт преподавания на механико-математическом факультете МГУ. Мы надеемся, что книга сможет служить учебным пособием по различным курсам, связанным с оптимизацией, читаемым в университетах и технических учебных заведениях.
Для полного понимания всех частей книги нужно владеть университетским курсом функционального анализа, но многое в книге рассчитано на более широкую аудиторию.
Дело в том, что формулировки большинства важнейших теорем, дающих рецепты для решения задач, можно освоить, имея существенно меньшую математическую подготовку по сравнению с той, которая нужна для понимания доказательств. Поэтому мы старались так построить изложение, чтобы формулировки основных результатов, общие комментарии к ним и решения задач были отделены от доказательств.
Книгу не обязательно читать подряд. Многие темы можно изучать независимо от остального материала. Выделим несколько таких тем. Элементарный курс вариационного исчисления и оптимального управления образуют параграфы 2.1, 2.2, 2.4 и 6.4. Они опираются, в основном, лишь на факты классического анализа. Начальный курс линейного и выпуклого программирования содержится в §§ 0.3, 1.3, 6.1 и 7.3. Теме «Необходимые и достаточные условия экстремума в задачах миними
ПРЕДИСЛОВИЕ
7
зации в линейных пространствах» посвящены глава 1 и §§ 7.1—7.3. Параграфы 2.1—2.3, 6.3, 7.4, 10.4 и пункт 9.2.4 образуют расширенный курс вариационного исчисления, хотя здесь недостаточное место уделено теории Гамильтона — Якоби. В главе 8 и §§ 9.1, 9.2 освещаются проблемы существования решения в задачах оптимального управления. Глава 8 совместно с § 9.3 дает представление о двойственных методах в теории оптимального управления. Главы 1—5, 8 и 9 образуют расширенный курс теории оптимального управления. Наконец, в главах 3, 4 и 8 содержится достаточно подробное введение в бесконечномерный выпуклый анализ.
Первоначально планировалось включить в книгу еще ряд тем: расширения вариационных задач, скользящие и особые режимы, численные методы. Однако этот материал не удалось уложить в запланированный первоначально объем, и от изложения перечисленных разделов пришлось отказаться. Следует назвать еще несколько важных вопросов, не затронутых в книге. Прежде всего это относится к вопросам взаимосвязи вариационного исчисления с классической механикой, к теории Гамильтона — Якоби и к динамическому программированию.
В комментарии после введения указаны монографии и статьи, по которым можно составить представление о темах, оставшихся за пределами книги.
В заключение нам хотелось бы поблагодарить Б. Т. Поляка, любезно предоставившего нам некоторые материалы, способствовавшие выработке принятого в книге подхода к классификации экстремальных задач. Мы признательны М. А. Красносельскому, просмотревшему рукопись и давшему ряд полезных советов, В. М. Алексееву и С. В. Фомину, с которыми обсуждались отдельные аспекты, связанные с изложением материала книги; очень существенными для нас были многочисленные дискуссии с А. А. Милютиным; мы благодарны А. В. Барыкину, Б. Лудереру, Г. Г. Магарил-Ильяеву, Е. С. Половинкину, М. А. Рвачеву, В. М. Саф-ро, М. И. Стесину и М. Тагиеву, помогавшим нам при подготовке рукописи.
Авторы,
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИИ
V — квантор общности: «для всех»,
3 — квантор существования: «существует», — квантор следования: «из ... следует
фу квантор эквивалентности,
х е А — элемент х принадлежит множеству А,
х & А — элемент х не принадлежит множеству А,
0 — пустое множество,
A U В — объединение множеств А и В,
А П В — пересечение множеств А и В,
А \ В — разность множеств А и В,
АаВ — множество А содержится в множестве В,
А X В — декартово произведение множеств Л и В, 2а — совокупность всех подмножеств множества А, {х | Рх} — совокупность элементов х, обладающих свойством Р, {хь хп, множество, состоящее из элементов
*1....хп......
F: X -> Y — отображение F множества X в множество Y,
х-> F (х) — отображение F сопоставляет элементу х эле* мент F (х),
FcG — суперпозиция отображений G и F,
F (А) — образ множества А при отображении F,
f"1 (Л) — прообраз множества Л при отображении F,
F |л — ограничение отображения F на множество Л,
R — совокупность всех действительных чисел,
R" — аффинное или евклидово n-мерное пространство,
R* = (х = (х1, ..., хп) 1 х* >О] — неотрицательный октант в R",
inf Л (sup Л) — нижняя (верхняя) грань чисел, входящих в множество Л cz R,
ал ф а (ап fa) — последовательность an, не возрастая (не убывая), сходится к а,
1х I — евклидова норма в Rn,
х || — норма элемента х в банаховом пространстве,
Р (х, у) — расстояние от элемента х до элемента у,
В (х, г) — замкнутый шар с центром х радиуса г,
U (х, г) — открытый шар с центром х радиуса г,
Л — замыкание множества Л,
int Л — внутренность множества Л,
3?af == {х ] f (х) «С а} — лебеговское множество функции f на уровне а,
X* — пж остранство, сопряженное с X,
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИЙ
9
х* — элемент сопряженного пространства, (х*, х) — значение линейного функционала х* на элементе х, (х I У) — скалярное произведение элементов х и у, L1 = {х* | (х*. х) = 0} — аннулятор подпространства L, dim L — размерность пространства L, codim L — коразмерность пространства L, X/L — фактор-пространство пространства X по подпространству L,
I — единичный оператор,
Л* — оператор, сопряженный с оператором Л,
Ker Л — ядро оператора Л,
Im Л— образ оператора Л,
(X, У) — пространство непрерывных линейных отображений пространства X в пространство У,
Л >0 —матрица Л положительно определена,
Л ^0 —матрица Л неотрицательно определена, ind Q — индекс квадратичной формы Q, (Т, 2, ц) — пространство Т с ог-алгеброй S и мерой ц, (ц~) — положительная (отрицательная) составляющие меры ц, j р, | — полная вариация меры ц, mes Л — лебеговская мера множества А, Сп (Т) — пространство непрерывных на компакте Т п-мерных вектор-функций с равномерной метрикой,
([/0, ^]) ~ пространство m раз непрерывно дифференцируемых /i-мерных вектор-функций на отрезке [/0. Л].
(Л — пространство n-мерных вектор-функций, каждая компонента которых принадлежит LP(T> S, pi),
m ({70> ^]) — пространство /г-мерных вектор-функций, у которых m-я производная абсолютно непрерывна и принадлежит
f' (х; h) — производная функции f в точке х по направлению А, 6F (х, h) — первая вариация отображения F в точке х, t)nF (х, h) — п-я вариация отображения F в точке х, Fp (х) — производная отображения F в точке х по Гато, F' (х) — производная отображения F в точке х по Фреше, /" (х) (A, h) — значение второй производной функции f на элементе А,
(хр х2)(ХР хг)) частная производная по х{ (по х2) отображения X] -> F (х!, х2) (х2 -> F (xi, х2)),
[Xi, х2] —- отрезок, соединяющий точки xi и х2, dom f — эффективное множество функции f, epi f — надграфик функции f, б(х1 Л) — индикаторная функция множества Л. s (х) Л) — опорная функция множества Л, ц (х [ Л) —- функция Минковского множества Л, N (х | Л) —- конус опорных функционалов к множеству А в точке х,
КА — конус, порожденный множеством Л, Л
10
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИИ
lin А — линейная оболочка множества Л,
aff А •— аффинная оболочка множества А, ri А — относительная внутренность множества А, cony А — выпуклая оболочка множества А, сопу А — замыкание выпуклой оболочки множества Л, df (х) ~ субдифференциал функции f в точке х, dxf (х, у) — субдифференциал функции х -> f (х, у), f* (х*) — функция, сопряженная с функцией f, или преобразование Юнга — Фенхеля функции ft
Л° — поляра множества А,
Л + В — алгебраическая сумма множеств Л и В,
h ® /г ~ конволюция функций fi и f2,
fi V f 2 •~ верхняя грань функций fi и f2*
/Л — прообраз функции f при отображении Л,
Л/ — образ функции f при отображении Л,
ft — конволюционный интеграл функций х -> f (/, х) по мере р,,
J ft — интеграл функций x->f(t, х) по мере р,,
f (х) -> inf (sup); хе С - обозначение экстремальной задачи, х* — решение экстремальной задачи,
У ~ функционал в задачах вариационного исчисления и оптимального управления,
УС — квадратичный функционал в задачах вариационного исчисления,
L = L (t, х, х) — лагранжиан,
2? — функция Лагранжа,
<8 — функция Вейерштрасса,
Н — функция Понтрягина,
$6 — гамильтониан.
0. Введение
ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Первые задачи геометрического содержания, связанные с отысканием наименьших и наибольших величин, были поставлены в древности. Упоминание об изопери-метрическом свойстве круга относится к V веку до н.э.; вопросы о максимумах и минимумах встречаются в трудах Евклида, Аполлония, Архимеда. Потребность решать экстремальные проблемы способствовала созданию математического анализа и вариационного исчисления. В XVII и XVIII веках были открыты вариационные принципы в оптике и механике и вариационное исчисление стало языком естествознания.
В наши дни в связи с запросами техники и экономики теория экстремальных задач переживает второе рождение. Бурно развиваются новые разделы: математическое программирование, теория оптимального управления, численные методы оптимизации.
Экстремальные проблемы очень разнообразны, и все-таки, несмотря на то, что старинные геометрические задачи на экстремум кажутся совсем не похожими на проблемы оптимального управления летательными аппаратами, в исследовании их можно усмотреть много общего.
Расскажем вкратце об общих свойствах, присущих экстремальным задачам, и об основных принципах исследования проблем экстремального характера. Начнем с постановок задач.
Проблема отыскания наибольшей или наименьшей величины возникает обычно не в аналитической, а в описательной форме. Для того чтобы применять математические средства, необходимо формализовать задачу. Обычно можно выделить три компоненты, составляющие математически точно поставленную проблему. Это — функция fQ(x) вместе с областью X ее определения и некоторое подмножество С множества X, которое задает ограничение в поставленной задаче. Множество
12
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
X называется классом допустимых элементов, подмножество С — множеством допустимых элементов или просто ограничением. (Под словом «функция» понимается далее отображение в расширенную вещественную прямую, когда значения +оо и —оо допускаются наряду с обычными вещественными числами.) Словесно экстремальная задача формулируется так: найти нижнюю (верхнюю) грань функции fQ(x) по всем х, принадлежащим ограничению С. Для обозначения такой экстремальной задачи используется стандартная запись:
f0 W -> inf (sup); х е С.	(1)
При строгой постановке задачи должен быть точно описан класс допустимых элементов X.
Нижняя (верхняя) грань функции fo(x) в задаче (1) называется значением этой задачи, а та точка х*, где достигается эта нижняя (верхняя) грань, называется решением задачи или ее абсолютным экстремумом — минимумом или максимумом.
Если пространство X наделено топологией, то точка х# такая, что fQ(x) fo(**) (соответственно fo(x)^2 igfo(x*)) для всех х из пересечения С с некоторой окрестностью точки х*, называется локальным минимумом (максимумом) в задаче (1).
Заметим, что всегда можно ограничиться лишь рассмотрением задач на отыскание нижней грани; для этого достаточно (если нужно) заменить fo на —fo. Значение задачи об отыскании нижней грани мы называем иногда минимумом, а ее решение — минималью.
Обычно одна и та же задача допускает разные формализации.
Рассмотрим, например, задачу о брахистохроне. Начнем с описательной постановки. В «Беседах» Галилея обсуждается такой вопрос. Пусть два одинаковых шарика начинают одновременно двигаться: один — по дуге окружности, другой — по ее хорде. Какой из шариков быстрее достигнет нижнего конца хорды? Оказывается, — тот, который движется по окружности. Напрашивается более общая постановка задачи: какую форму следует придать желобу, скатываясь по которому без трения под воздействием силы тяжести, шарик попадал бы из одной заданной точки в другую за кратчайшее время. Так описательно ставится задача о брахистохроне. Перевести ее на математический язык можно по-разному. Обычно принята такая формализация. Введем в плоскости систему координат (х, у) так, чтобы ось х была горизонтальна, а ось у
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
13
направлена вертикально вниз. Пусть у(х) есть форма' желоба. В соответствии с законом Галилея скорость шарика в точке (х,у(х)) не зависит от формы желоба, а зависит лишь от самой ординаты у(х). Эта скорость равна V 2gy (х). Следовательно, время dt, требуемое для преодоления участка кривой длины dst равно dsl^lgy (х).
Так мы приходим к следующей постановке:
V1 + у/2 (X) V^sy (*)
dx-» inf;
(2)
у (.v0) = 0, у (xt) = уь
Полученная задача относится к числу простейших задач классического вариационного исчисления. Легко понять, что минимизация функционала в (2) равносильна минимизации интеграла
J V%gy
(3)
по всем кривым (х(/), y(t))t соединяющим точки (х0, 0) и (xi,z/i). Такие задачи относятся к классу задач вариационного исчисления в параметрической форме.
Но к той же задаче можно подойти и как к проблеме о быстродействии. Выше говорилось уже, что в точке (х, у) скорость движения шарика равна	Представим себе теперь плоскую изо-
тропную оптическую среду, в которой локальная скорость распространения света в точке (х, у) равна V 2gy. Принцип Ферма в геометрической оптике гласит, что при своем движении в неоднородной среде свет выбирает такую траекторию, чтобы минимизировать время прохождения участка пути между заданными точками. В применении к среде, где скорость равна }^2gy, получается следующая постановка задачи о распространении света:
Т-> inf;
х2 4- у* = 2gy,
(4)
х(О) = хо, #(0)=0, х(Л = Х1, у(Т)=у{.
Ясно, что решение этой задачи плоской геометрической оптики дает ответ и в задаче о брахистохроне. (Отметим, что оптико-механическая аналогия послужила И. Бернулли путеводной нитью при решении задачи о брахистохроне.) Наконец, еще один путь формализации. При движении шарика по желобу у(х) на него действуют две силы, а именно, сила тяжести и реакция опоры, перпендикулярная скорости. В силу закона Ньютона ускорение шарика пропорционально действующей суммарной силе. В итоге приходим к следующей постановке задачи:
Г inf;
х = и, у = g + и, хи + yv — 0,
X (0) = х0, У (0) = 0, х (7) = Х1, у (Г) = Ух.
(5)
14
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Такие постановки характерны для оптимального управления. Отметим еще разные модификации в пределах некоторых из указанных постановок. Например, можно, следуя Эйлеру, в (2) поменять местами х и у и рассмотреть такую простейшую задачу классического вариационного исчисления:
У 2g у
dy-> inf;
л(О) = хо, x(t/i) = xi.
Можно вместо уравнения х2 + у2 = 2gy в (4) рассмотреть включение:
(*> у) е= В (о, У 2gy ),
где В(0, г) есть круг с центром в нуле радиуса г. Допустимо еще вместо последнего включения рассмотреть систему уравнений с управлениями:
X = U У2gy , у = V V2gy , и2 + V2 < 1.
Получилось довольно большое число формализаций, и каждая из них обладает и своими преимуществами и своими недостатками. Но нам хочется подчеркнуть, что сама проблема формализации решается неоднозначно, и выбор наиболее естественной формы записи задачи является искусством, которое постигается при решении большого числа задач. Следует отметить, однако, что с математической точки зрения ни одна из задач (2) — (5) еще не поставлена полностью, ибо нигде не очерчен точно класс допустимых элементов. Этот класс также может выбираться по-разному. Скажем, задачи типа (2) рассматривают обычно в классе непрерывно дифференцируемых функций. Но в этом классе решения задачи (2) не существует. Действительно, решением задачи о брахистохроне является, как известно, циклоида, которая имеет в начальной точке бесконечную производную. Если же рассмотреть класс функций, являющихся непрерывными и непрерывно дифференцируемыми на отрезке [х0, Xi] всюду, кроме, может быть, точки хо, то к этому классу циклоида будет принадлежать. Обычно рассматривают менее специальные классы: класс кусочно дифференцируемых функций, класс абсолютно непрерывных функций и др.
Ограничения в экстремальных проблемах стараются записать в виде равенств и неравенств. Такие ограничения называются функциональными. Помимо функциональных ограничений, встречаются ограничения типа включений: /еЛ, нефункционального характера. В результате экстремальная задача (1) приобретает такую
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
15
форму:
f0(x)->inf;
F(x) = y0, fi (*) < 0» i Д хе А.
Здесь У и I — некоторые множества, F: X-+Y, ff. X->R, i^I и AczX. Отметим, что различие между функциональными и нефункциональными ограничениями, вообще говоря, условно (ибо каждое включение хе А можно записать функционально), но часто оно оказывается полезным.
Перейдем теперь к обсуждению общих принципов теории экстремальных задач. Предметом этой теории является точно поставленная экстремальная проблема. В связи с каждой такой проблемой естественно возникают три вопроса. Во-первых, существует ли решение задачи? Если можно предполагать, что решение существует, то надо выяснить, каким условиям оно должно удовлетворять. Наконец, в-третьих, как фактически найти решение задачи или минимизирующую последовательность для нее? Поставленные вопросы соответствуют разделам теории экстремальных задач, где изучаются существование решений, необходимые и достаточные условия экстремума и вычислительные методы нахождения решений. Эти разделы связаны между собою, но вместе с тем каждый из них обладает достаточно большой самостоятельностью.
Расскажем сначала о необходимых уело* виях экстремума. Первый общий принцип полу-* чения необходимых условий в экстремальных задачах без ограничений был найден Ферма. Идея Ферма, выра-< женная современным языком, состоит в том, что решения гладкой задачи	следует искать среди
стационарных точек функционала f0(x), т. е. среди решений уравнения
W = 0.	(6)
Этот результат называют иногда теоремой Ферма. Для задач с ограничениями общий принцип получения необходимых условий экстремума был выдвинут Лагранжей.
16
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Замысел Лагранжа можно распространить далеко за пределы тех задач, которые он сам рассматривал. Мы раскроем его на примере той общей постановки, с которой постоянно будем иметь дело в этой книге. Пусть X и У— линейные пространства, F: X—♦ У, Д-: X—>R, i = 1, .... т, А с: X. Рассмотрим задачу:
f0(x)->inf; F(x) = 0,	1
i= 1, ..., m, x^. A. J '
Следующую функцию:
tn
2 (x, y\ Ao...........Am) = </, F (x)) + s AJi (x),
z=o
где у* — линейный функционал на У, а — числа, назовем функцией Лагранжа задачи (Г). Функционал у* и числа Af, 0 i т, называются множителями Лагранжа. (Отметим, что функция Лагранжа составлена с учетом только функциональных ограничений.) Принцип Лагранжа состоит в следующем:
Пусть точка х* есть точка локального минимума в задаче (Г). Тогда найдутся такие множители Лагранжа у*	(O^f^/n), не равные одновременно нулю,
что х# удовлетворяет необходимому условию локального минимума в задаче
2?(х, •)->inf; хе А, и при этом
=	(7)
Иными словами, необходимые условия минимума в исходной задаче совпадают с необходимыми условиями минимума функции Лагранжа (при выборе некоторых множителей Лагранжа) по множеству хе А, состоящему из ограничений, не включенных в функцию Лагранжа. Соотношения (7) называются условиями дополняющей нежесткости. Они означают, что отличные от нуля множители Лагранжа надо приписывать только тем ограничениям типа неравенства, которые существенны в данной точке, т. е. тем, где ^(х#) = 0.
Проиллюстрируем принцип Лангранжа на конечномерных задачах. Пусть в (1') X — А — Rn, т. е. X — и-мер-
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
17
ное евклидово пространство, и неравенства отсутствуют. Равенства задаются конечным числом соотношений вида
А(х)=о,.... fm(x) = O.
Таким образом, F = (fi, fm) есть отображение из Rn в R™ Все функции fo(x), .... fm(x) предполагаются гладкими. В соответствии с принципом Лагранжа надлежит составить функцию Лагранжа
ml
i=0
и написать необходимое условие в задаче без ограничений Z -+ inf. Но такое необходимое условие дается теоремой Ферма (см. (6)):	= 0. В итоге получается
система уравнений:
т ?,=2^W-o.
Полученный результат широко известен под названием правила множителей Лагранжа.
В гл. 1 мы выделим три класса задач, для которых верен принцип Лагранжа. Это — гладкие задачи, задачи выпуклого программирования, а также задачи со смешанной гладко-выпуклой структурой. Классическое вариационное исчисление относится к числу гладких задач, задачи оптимального управления могут быть редуцированы к гладко-выпуклым задачам. Эти вопросы освещаются в первых двух главах книги и в пятой главе.
Принцип Лагранжа верен для многих важных задач, но всякий раз его необходимо обосновывать. Каковы же методы доказательства принципа Лагранжа и других необходимых условий? В основе большинства подобных доказательств лежит метод вариаций. Объясним существо этого метода. Рассмотрим общую задачу (1), где X — топологическое пространство. Вариацией точки х# называется непрерывное отображение X-*x(Z) отрезка [0, е] в X такое, что х(0) = х*. Вариация называется допустимой, если для достаточно малых X все точки кривой x(Z) принадлежат С. Пусть теперь вариация х(А) такова, что функция ф(А) = fo(x(k))
18
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
является дифференцируемой в нуле. Тогда, если есть точка локального минимума в задаче (1), то функция Ф должна иметь минимум в точке нуль и, значит, должно выполняться неравенство (р'(О)^О, являющееся необходимым условием минимума функции одного переменного, заданной на отрезке [0, е]. Метод вариаций состоит в том, что ищется достаточно широкий класс допустимых вариаций и затем извлекаются следствия из соотношений д/(0)^0, написанных для каждой вариации из заданного класса.
На первом этапе развития теории применялись простейшие вариации — вариации по направлениям. Так были получены необходимые условия в задачах конечномерного анализа и в классическом вариационном исчислении. Вывод необходимых условий экстремума в классическом вариационном исчислении непосредственным применением метода вариаций проводится у нас в § 2.2. Помимо вариаций по направлениям, в вариационном исчислении применялись вариации иной природы. Для вывода необходимых условий сильного минимума Вейерштрасс применял вариации, получившие название «игольчатых». При помощи таких вариаций можно вывести простейшие варианты принципа максимума (см. § 2.4).
Как правило, множество допустимых вариаций стараются выбрать так, чтобы оно оказалось локально устроено, как выпуклое. Выпуклые задачи обладают многими замечательными особенностями. В них всякий локальный минимум является абсолютным, кроме того, с каждой выпуклой задачей можно сопоставить другую, называемую двойственной к ней; при этом решения любой из них являются множителями Лагранжа для другой. Часто двойственная задача проще устроена, чем исходная.
Вернемся снова к принципу Лагранжа. Если для поставленной задачи (или для задачи, полученной из нее применением метода вариаций) этот принцип оказывается применимым, то он приводит к некоторым уравнениям (алгебраическим, дифференциальным и т. п.). Решения этих уравнений называются экстремалями. Обычно найти экстремали удается лишь при помощи очень трудоемких вычислений. И все-таки случается, что
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
19
уравнения, полученные из необходимых условий экстремума, удается разрешить в общем виде.
Зададимся вопросом, какие свойства задачи могут облегчить решение этих уравнений. Отметим несколько таких обстоятельств. Во-первых, это — линейная структура задачи. Задачи с линейной структурой наиболее полно изучены. Сюда относятся задачи линейного программирования (ему посвящен § 6.1), квадратичные задачи в гильбертовом пространстве (см. §§ 6.2 и 6.3) — здесь линейными оказываются те уравнения, которые выражают необходимые условия, — и линейные задачи оптимального управления (см. § 9.3). В качестве второго обстоятельства отметим выпуклую структуру задачи. Об одном замечательном свойстве выпуклых задач— о возможности двойственного описания их — уже говорилось. Особенно плодотворны методы, связанные с выпуклостью, когда эта выпуклость сочетается с конечномерностью. Этим последним обстоятельством объясняется обилие решенных задач об аппроксимации в пространствах с метрикой С. В заключение отметим также, что если задача обладает какой-то инвариантной структурой, то это, как правило, влечет за собой много важной информации относительно решений задачи — теорема Нётер в вариационном исчислении и т. п. На этом мы закончим обсуждение вопросов, связанных с необходимыми условиями экстремума, и перейдем к достаточным условиям.
Раздел книги, посвященный достаточным условиям (гл. 7), занимает в ней скромное место. Дело в том, что если часть теории экстремальных задач, посвященная необходимым условиям экстремума, имеет ныне устойчивые очертания — там выработан свой язык, своя методология и получены общие и содержательные теоремы, то этого нельзя еще сказать про принципы получения достаточных условий. Здесь нам хочется обсудить возможные перспективы теории и примерный план ее построения. Суть дела видится нам в следующем. Получение достаточных условий связано с глобальным подходом, когда индивидуальная задача включается в совокупность подобных ей задач, зависящих от некоторых параметров. (Эту процедуру называют методом возму* имения.) Минимум в полученных задачах становится
20
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
функцией параметров возмущения. Эту функцию мы называем S-функцией задачи. Цель состоит в том, чтобы по данным поставленной задачи можно было судить о характере S-функции, о ее гладкости и т. п. В случае, если S-функция обладает гладкостью, принцип Лагранжа, о котором много говорилось выше, допускает фундаментальное усиление: тогда можно нелинейно подправить функцию Лагранжа так, что задача об условной минимизации становится равносильной задаче о безусловной минимизации этой подправленной функции Лагранжа. Такое утверждение мы называем принципом снятия ограничений.
Поясним сказанное на том же конечномерном примере, на котором иллюстрировался принцип Лагранжа. Пусть все функции Д-, i — 0, 1, ..., m, входящие в определение конечномерной задачи с ограничениями fi — 0, i = 1, ..., tn, являются дважды непрерывно дифференцируемыми, кроме того, функция F'(x) — =(/{(*),	отображает Rn на все Rw. Тогда при
условии, что данная точка х* является экстремалью задачи и в ней вторая производная функции Лагранжа строго положительна на ядре оператора F'(x*), получается, что поставленная задача становится равносильной следующей безусловной проблеме минимизации:
m
Z + (ф о F) (X) = f0 (х) + 2 kfi (х) + (Ф ° Л (X) -> inf,
где ф: Rm->R— некоторая эффективно строящаяся гладкая добавка к функции Лагранжа. Смысл полученного результата в том, что если выполнены некоторые условия невырожденности, то ограничения могут быть сняты. Если же из каких-то, пусть даже эвристических, соображений удается снять ограничения, то тем самым сразу оказывается, что в данной точке имеется локальный экстремум, т. е. снятие ограничения является достаточным условием экстремума.
Особой спецификой обладают задачи динамического содержания, в которых описываются процессы, изменяющиеся во времени. Таковы задачи классического вариационного исчисления и оптимального управления. Для этих задач имеется весьма плодотворная процедура
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
21
их возмущения. Такие задачи возмущают при помощи граничных условий. Полученная при помощи этого возмущения S-функция называется в вариационном исчислении функцией действия. Для нее можно написать дифференциальное уравнение в частных производных — уравнение Гамильтона — Якоби, что дает новый путь к решению поставленных задач. Аналог теории Гамильтона— Якоби в оптимальном управлении называется динамическим программированием, а основное уравнение динамического программирования называется уравнением Беллмана. При выводе уравнений Гамильтона — Якоби и Беллмана основополагающим является тот факт, что любая часть минимали сама является минималью некоторой задачи.
Скажем несколько слов относительно аппарата, при помощи которого доказываются необходимые и достаточные условия. Исчисление, разработанное для исследования экстремальных задач, базируется на двух основаниях. Это — дифференциальное исчисление в банаховых пространствах (см. § 0.2) и выпуклый анализ в линейных топологических пространствах (см. § 0.3 и гл. 3, 4). В последнее время интенсивно разрабатывается новая глава выпуклого анализа, специально ориентированная на задачи оптимального управления — выпуклый анализ интегральных функционалов (см. гл. 8). Стержнем той части дифференциального исчисления, которая обращена к экстремальным задачам, является принцип сжимающих отображений. В основании выпуклого анализа лежат теоремы отделимости. Именно эти факты решающим образом участвуют в доказательствах теорем относительно необходимых и достаточных условий. Важнейший результат выпуклого анализа интегральных функционалов — выпуклость интегралов от многозначных отображений.
Что же касается теорем существования решений в теории экстремальных задач, то в большинстве своем они основываются на том, что у всякой полунепрерывной функции на компакте нижняя грань достигается. Поэтому основное внимание в теоремах существования уделяется условиям полунепрерывности функционалов и критериям компактности множеств в функциональных пространствах (см. § 9.1). Как
22
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
правило, естественные условия полунепрерывности и компактности, с одной стороны, и необходимые условия экстремума, с другой, получаются в разных топологиях и для разных классов допустимых элементов. Преодоление этого разрыва — одна из основных задач в теории существования решений.
Перейдем к описанию математической базы теории экстремальных задач.
В § 0.1 собраны нужные нам факты из функционального анализа, важнейшие из которых — принцип сжимающих отображений, теорема Хана — Банаха и теорема Банаха об открытом отображении. Параграфы 0.2 и Q.3 содержат необходимые для первоначального знакомства с книгой факты, относящиеся к аппарату теории экстремальных задач — дифференциальному исчислению и выпуклому анализу. Главные из них — теоремы Люстерника и Моро — Рокафеллара. В § 0.4 излагается теория дифференциальных уравнений с измеримыми правыми частями. Многие доказательства, которые можно прочесть в известных учебниках (Дьедонне [1}, Картан [1], Колмогоров и Фомин [1], Люстерник и Соболев [1], Шварц (1] и др.), опущены.
§ 0.1. Функциональный анализ
0.1.1. Компактность. Напомним, что множество в топологическом пространстве называется компактным, или компактом, если всякая покрывающая его система открытых множеств содержит конечную подсистему, также покрывающую данное множество.
Элементарные свойства компактности.
1)	Топологическое пространство компактно тогда и только тогда, когда всякая центрированная система его замкнутых подмножеств имеет непустое пересечение. (Напомним, что система множеств называется центрированной, если всякая ее конечная подсистема имеет непустое пересечение.)
2)	В компактном топологическом пространстве всякое бесконечное множество имеет предельную точку.
3)	Всякое компактное множество замкнуто, и всякое замкнутое подмножество компакта компактно.
4)	Образ компактного множества при непрерывном отображении есть компакт^
§0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
23
5)	Метрическое пространство компактно тогда и только тогда, когда всякая бесконечная последовательность его элементов содержит сходящуюся подпоследовательность.
Под словом функция всюду в этой книге понимается отображение в расширенную вещественную прямую [—оо, оо], т. е. значения ±оо допускаются наравне с вещественными числами. Пусть f(x)—функция, заданная на топологическом пространстве X. Говорят, что функция f полунепрерывна снизу в точке х е X, если (когда f(x)<oo), для всякого в > 0 существует такая окрестность U точки х, что
в
для всякой точки у е U, а если f(x)=oo, то для любого N > 0 существует такая окрестность U точки х, что
ШЖ
для всякой точки у Функция f называется полунепрерывной снизу, если она полунепрерывна снизу в каждой точке из X.
Для того чтобы функция f, заданная на топологическом пространстве X, была полунепрерывной снизу, необходимо и достаточно, чтобы все ее лебеговские множества
gaf = {xt=X\f(x)^a}
были замкнуты.
Теорема Вейерштрасса. Полунепрерывная снизу функция f, заданная на топологическом пространстве X, достигает нижней грани на всяком компактном подмножестве пространства X.
Следствие. Пусть f — полунепрерывная снизу функция на топологическом пространстве X. Если некоторое лебеговское множество функции f не пусто и компактно, то f достигает нижней грани на X.
Этот факт лежит в основе большинства теорем существования решения в теории экстремальных задач.
0.1.2. Принцип сжимающих отображений. Пусть Л метрическое пространство и F — отображение пространства X в себя. Говорят* что отображение сжимающее,
24
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
если существует такое число 0, 0 < 0 < 1, что
p(F(x), F(z/))<ep(x, у)
для всех пар х, у из X. Элемент х е X называется неподвижной точкой отображения F, если F(x)=x. Отображение
F о р о ... о р k раз
обозначается символом Fk (т. е. F2(x) = F (F(x)), F3(x) = F(F(F(x))) ит. д.).
Принцип сжимающих отображений. Пусть X — полное метрическое пространство и F — отображение пространства X в себя такое, что для некоторого натурального & > 0 отображение Fk — сжимающее. Гогда в X существует ровно одна неподвижная точка отображения F.
0.1.3. Теорема Хана — Банаха. Пусть X — линейное топологическое пространство, А с: X — выпуклое открытое множество и LciX — подпространство, не имеющее общих точек с множеством А. Тогда на X существует не* прерывный линейный функционал х* такой, что
<х*, х) > 0 для всех х е А, (х*, х) = 0 для всех хе L.
Укажем три важных следствия из теоремы Хана — Банаха.
Следствие 1. Пусть X — отделимое локально выпуклое линейное топологическое пространство. Тогда для всякого х е X, х У= 0 найдется функционал х* е X* такой, что (х*, х)=#0.
Доказательство. Положим L = {0}, в качестве А возьмем произвольную выпуклую окрестность точки х, не содержащую нуля, и применим теорему.
Аннулятором линейного подпространства L локально выпуклого линейного топологического пространства X называется множество
L1 = {.V* е Г | (Z, х) = 0, Vx е L}.
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
25
Следствие 2. Пусть L — замкнутое подпространство отделимого локально выпуклого линейного топологического пространства X. Тогда ' аннулятор подпространства L содержит ненулевой элемент.
Доказательство. Пусть х ф L. Возьмем в качестве множества А выпуклую окрестность точки х, не пересекающуюся с L, и применим теорему к А и L.
Если X — нормированное пространство, то, выбирая в качестве А шар радиуса ||х|| с центром в точке х, получим из следствия 1
Следствие 3. Пусть X — линейное нормированное пространство. Тогда для всякого хеХ, х =/= 0 найдется функционал х* е X* такой, что
(X, х) = ||х||, ||х*||=1.
Часто теореме Хана — Банаха придают форму теоремы отделимости, во многих случаях более удобную для применений. Скажем, что линейный непрерывный функционал х* разделяет множества А и В, если для всех х е А, у В справедливо неравенство
<х’, х) < <х‘, у).
Теорема отделимости. Пусть А и В — выпуклые непересекающиеся множества в линейном топологическом пространстве X. Предположим, что inti4#=0. Тогда на X существует ненулевой непрерывный линейный функционал х*, разделяющий множества А и В.
В § 3.1 мы вернемся к теоремам отделимости.
Лемма о биортогональном базисе. Пусть X — отделимое локально выпуклое линейное топологическое пространство и {хь ..., хп}—конечный набор линейно независимых элементов пространства X. Тогда существуют такие элементы х*<= X*, i — 1, ...» п, (xj, х/) = б//, где
( 1, если i — /, li 1 0, если i^j.
Доказательство. Обозначим через Ц линейную оболочку векторов хь хг-1, xi+i, хп.
26
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Подпространство £< конечномерно и, значит, замкнуто ^(поскольку X отделимо). Коль скоро векторы Xj, ..., хп линейно независимы, х; ф. Lt. Поэтому существует функционал y*t е X* такой, что х{) ф 0 и — 0 при / I. Положим х* =	хг)-1 у\. Функционалы
xj, ..., х* — искомые.
0.1.4. Теорема Банаха об открытом отображении и обратном операторе. Пусть X и Y — банаховы пространства и A: X —► Y — линейный непрерывный оператор, множество значений которого есть все Y, т. е. 1тА=У. Тогда образ всякого открытого подмножества пространства X открыт в У. В частности, если в дополнение к сформулированным условиям оператор Л взаимно однозначен, т. е. если КегЛ = {0}, то Л — линейный гомеоморфизм.
Мы будем пользоваться не столько этой теоремой, сколько следствиями из нее, которые сейчас докажем.
Лемма о тройке. Пусть X, Y и Z — банаховы пространства и Л: X-*Y, М: X->Z— линейные непрерывные операторы такие, что 1mA = У и Ker Л с Ker М. Тогда существует такой линейный непрерывный оператор N: У -*Z, что М = N ° Л.
Доказательство. Если Axi = Лх2 = у, то и Mxi = Мх2, поскольку по условию Ker Л с Ker М. Поэтому для всякого {/еУ множество М(Л-1(у)) содержит ровно один элемент. Положим Ny = М (Л-1 (</)). Линейность отображения N и равенство N°A = M очевидны. Наконец, если U — открытое подмножество пространства Z, то множество M-1(t/) открыто в X из-за непрерывности оператора М, а по теореме об открытом отображении и множество Л (М-1 (U)) = N-1 (U) открыто в У. Поэтому оператор N непрерывен. Лемма доказана.
Напомним, что если X и У — локально выпуклые линейные топологические пространства и Л: X —♦ У — линейный непрерывный оператор, то сопряженный оператор Л*: У*—►%* определяется равенством (Л*у*,х)= = {у*, Ах) для всех у* е У*, х е X.
Лемма об аннуляторе. Пусть X и У — банаховы пространства мА: X —> У — линейный непрерывный оператор такой, что Im А — У. Тогда
(Кег А)х = 1тА‘ .
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
27
(г. е. аннулятор ядра равен множеству значений сопряженного оператора).
Доказательство. Если	т. е. если
х* * = А*у* при некотором у* е У*, то для любого х е е КегА справедливо равенство
<х*, х) = (А*у\ х) = {у*, Ах) = 0, откуда следует, что х* е (Кег А) .
Пусть, наоборот, х*е(КегА)±, тогда
Кег А с {х е X | <х*, х) = 0} = Кег х*.
Мы можем рассматривать х* как линейный оператор из X в R. Тогда для А: Х-*У и х*: X->R выполнены все условия леммы о тройке. Поэтому существует такой линейный непрерывный функционал у* е У*, что (//*, Ах) = (х*, х) для всякого х. Это значит, что х* = = А*г/*, т. е. х* е 1mA*. Лемма доказана.
Следствие. Пусть Хр ...» х*—линейные непрерывные функционалы на банаховом пространстве X. Положим
L=[x^X|(x*, х) = 0, /=1, ..., п].
Тогда аннулятор подпространства L совпадает с линейной оболочкой точек Хр ..., х’.
Доказательство. Без ограничения общности можно считать, что функционалы х*,..., х* линейно независимы. Рассмотрим оператор A: X->Rn, ставящий в соответствие каждому хеХ вектор Ах, равный (^Хр х), ..., (х*, х)), и применим лемму.
Отметим, что последнее предложение верно для произвольных отделимых локально выпуклых пространств.
0.1.5. Некоторые конкретные пространства. 1. Пространство Сп(Т). Пусть Т — компактное хаусдор-фово пространство. Через Сп(Т) обозначается банахово пространство непрерывных отображений (вектор-функ-ций) из Т в Rn с нормой*)
IIХ( •) 11 = 11 x(«)||c = max|x(0|. ieT
/ п Х’/г
*) Напомним, что ] х | = I (xf)2 ) .
\i=l /
28
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Нормированная топология пространства Сп(Т) называется топологией равномерной сходимости.
Теорема Рисе а. Всякий линейный непрерывный функционал х* на пространстве С(Т)—СХ(Т) можно единственным образом представить в виде
(х*, х (• )> = J X (/) du,
т
где р— регулярная борелевская мера на Т. При этом Цх’1КрЫ = |ц|(Г), т
где | р | = р+ 4- р-, а р+ и р- — положительная и отрицательная составляющие меры р.
Напомним, что подмножество А компактного хаусдорфова пространства Т называется борелевским, если оно получается из открытых множеств с помощью не более чем счетного числа операций объединения, пересечения и перехода к дополнению. Совокупность всех борелевских подмножеств пространства Т обозначается SB (Г). Множество S3 (Г) содержит дополнения и счетные объединения и пересечения своих элементов. Действительная функция р(4), определенная на S3 (Г), называется борелевской мерой на Г, если она о-аддитивна, т. е. если из 4<eS3(T), i=l, 2, Ai f) Af = 0 при i =£ j следует, что
/°°	\	оо
и U А‘ = 2 и(М
4=1 /	i=l
Если р — борелевская мера на Г, то функции р+(4) = sup {р (В) | В с: А, В<=Ъ(Т)}. р-(4) == — inf {р (В) | В с: 4, ВеЗЗ(Т)}
называются положительной и отрицательной составляющими меры р. Эти функции тоже являются борелевскими мерами на Т. При этом р = р+ — р~. Положительная борелевская мера | р | = р+ + Р~ называется полной вариацией меры р. Борелевская мера р называется регулярной, если для всякого 4е$В(Т) и всякого 8>0 можно указать такое замкнутое множество В cz 4 и такое открытое множество С А, что | р | (4 \ В) < 8, | р | (С \ 4) < е.
Пусть р — борелевская мера на Г и а(0—действительная непрерывная функция на Т. Тогда предел
оо
lim У НШеГ|Ь<а(0<(^ + 1)8})« I а(0^
Е->0	’
£=—оо
существует и называется интегралом по мере р от функции a(f). i
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
29
Подобным образом описывается сопряженное с пространством СП(Т): всякий линейный функционал на Сп(Т) единственным образом представляется в виде
п
где Ц1,	— регулярные борелевские меры на Г;
при этом
В случае, когда Т — [/0, 6L —оо < /0 < 6 < теореме Рисса можно придать такой вид. Именно, всякий линейный непрерывный функционал х* на пространстве Сп ([ Аъ Л]) можно единственным образом представить в виде
п
<х\ х( • )) = (а |х(/о)) + у; f х'(0
i=l ta
где а^Цп, а щ(/), ..., цп(0— функции ограниченной вариации, непрерывные справа и обращающиеся в нуль в точке tQ. (Можно записать по-другому:
п Ц
<x-,x(-)) = 2Jx'(0^(0, 1=1tb
где p/(Z) — функции ограниченной вариации, непрерывные справа, всюду за исключением, быть может, точки /о-) При этом / п	\’/а
||х‘||=|а|+ 2l !»<(•) Р \Z=1	/
/	/ П	у/Л
(соответственно || х* || = 21 И/ (•) I2 /> где через | (•) [
\	М=1	/ /
обозначена полная вариация функции иЛО.
2.	Пространство 61). Это пространство образовано m раз непрерывно дифференцируемыми
30
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
отображениями отрезка [/<>, в Rn. Норма в пространстве Ст задается равенством
Н*(-)И = 11*(-)1|сп = max И*(0(-)11сп.
Покажем, что всякий линейный непрерывный функционал х* на пространстве С“ (|7о, 6]) можно единственным образом представить в виде
п tt
(*., X (•)) = (а | х (t0)) + (6| х (/<>)) + 2 / X1 (0 dHi (О, 1=1
где a^Rn, b^Rn, a p,i(/), .... pn(t) —функции ограниченной вариации, непрерывные справа.
В самом деле, рассмотрим отображение d: Ci->Cn, ставящее в соответствие каждой вектор-функции x'fJeCf ее производную х(-)<^Сп. Ясно, что оператор d линеен и непрерывен, а множество его значений совпадает со всем пространством Сп (Imd = Сп), т. е. он удовлетворяет условиям леммы об аннуляторе. Наконец, ядро оператора d совпадает со множеством тождественно постоянных вектор-функций. Пусть х* е (С?). Обозначим через а, значение функционала х* на вектор-функции, i-я компонента которой тождественно равна единице, а остальные тождественно равны нулю. Рассмотрим функционал х*, определенный формулой
<%;, х(.)> = (х’, х(-))—(a|x(Q),
где a — (alt ап~). Очевидно, x*e(Kerd)x. По лемме об аннуляторе существует функционал	такой,
что x* — d*y*, т. е. такой, что для всех х(-)еС]* справедливо равенство
<х;,х(-)> = </, х(.)>,
из которого в силу теоремы Рисса следует существование вектора b е R" и непрерывных справа функций ограниченной вариации И1(0» •••» Нп(0 таких, что
п tt
{х\, х (•)) = (& | X (Q) + 2 J X1 (о (0.
/=1 /0
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
31
откуда п tt
« х (•)) = (а | х (/0)) + (Ь | х (to)) + 2 J х1 (0 dHi (t).
Z=1 /а
Единственность этого представления проверяется непосредственно.
3.	Пространства £р([4ъ 6]). При 1^р< оо символом Lp ([/о, Л]) обозначается банахово пространство измеримых по Лебегу отображений отрезка [f0, ^i] в для которых интеграл
ft
/ I X(t) fdt
fo
конечен. Норма в пространстве Lp ([Zo, 6]) задается равенством
/ Л	х 1/Р
Цх(-)||=||х(.)||р = Н|х(0ГЛ .
Vo	/
Через А«([А), Л]) обозначается банахово пространство измеримых отображений отрезка [f0, Л] в R", ограниченных на некотором множестве полной меры. Норма в пространстве L«([/o, 0]) задается равенством
Цх(-)||=||х( •)||00 = sup vrai|x(0l, где
sup vrai a (t) — inf { sup В (t) | В (t) — a (t) почти всюду}.
t- <<</,
В дальнейшем мы вместо supvraia(Z) пишем обычно просто supa(/).
При 1 p<ot> пространство, сопряженное с Lp ([/о, 01), отождествимо с Ар'фо, 0]), где 1/р+!///=!; иначе говоря, всякий линейный непрерывный функционал х* на пространстве Lp единственным образом можно представить в виде
ft
(х‘, х( •)) = J (у (01 X (t)) dt, f®
32
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
где у (•) е LnP’. При этом
II х-11=11 H-)IU
При р = 2 пространство Л"(По, Л]) превращается в гильбертово пространство, если задать скалярное произведение следующим образом:
И•)!«/( • )) = f (х(0
4.	Пространства Wp, от([/о, 6]). Символом Wp,m([^o, б]) обозначается банахово пространство абсолютно непрерывных вместе со своими производными до порядка гп — 1 включительно отображений отрезка [/0, 0] в R", m-я производная которых принадлежит L*. Норма в Wp, т может быть задана многими эквивалентными способами. Например,
m—1
||х(.)||=2 |х(0('о)1 + 1|х(т>(-)11р»
i=0
ИЛИ
т
||х( .)||= 2||х<‘>(-)||р.
i=0
Всякий линейный непрерывный функционал х* на пространстве	Л]) (1	< оо) можно единствен-
ным образом представить в виде
m—1	tt
<Л *(•)> = £ («I|x(i)tfo))+ / <=а	t.
где a0 (= R", .... am_i <= Rn, a #(•)<=	(1/p + !//== l)t
Доказательство этого факта строится по той же схеме, что и для функционалов на С?.
При р = 2 пространство W2, m ([fo, 61) превращается в гильбертово пространство, если задать скалярное произведение следующим образом:
m—1	ti
(X (•), у (•)) = X (*(i) (*о) I y{i} (^0)) + J (х^ (0 | уМ (0) di.
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
33
Подобным же образом можно ввести пространства Ст(Г), Ар(Г), Fp,m(r), где Т — ограниченная (в случае пространства — замкнутая) область в A-мерном линейном пространстве.
§ 0.2. Дифференциальное исчисление
0.2.1. Первая вариация и производные Гато и Фреше. Пусть X и У — линейные топологические пространства, [/ — окрестность точки хвХ и F: U -+Y. Допустим, что для любого вектора h е X существует предел
Нт Г1 (F (х + th) — F (х)) = 6F (х, /г). *->0
Тогда отображение h—+8F(х, ft) называется первой вариацией отображения F в точке х. Если первая вариация— линейное непрерывное отображение, т. е. если существует линейный непрерывный оператор A: X -> У такой, что Aft=6F(x, ft), то оператор А называется производной, или дифференциалом Гато отображения F в точке х и обозначается F'r(x) или просто F'(x), если это не вызывает недоразумений. Про само отображение F в этом случае говорят, что оно дифференцируемо по Гато в точке х. Другими словами, отображение F дифференцируемо по Гато в точке х в том и только том случае, когда существует линейный непрерывный оператор A: X —> У такой, что для всякого ft е X:
F(x + ih) = F (х) + tAh + о (0.
Пусть X и У—банаховы пространства и F — отображение окрестности U точки хеХвУ. Говорят, что отображение F дифференцируемо по Фреше, или сильно дифференцируемо в точке х, если существует такой линейный непрерывный оператор A: X -* У, что
F (х + А) == F(x) + Ай + г (h), где
IIГ (А) пг - IIЛ Ц-1-> 0 при ||Л||х-^0.
Сам оператор А называется при этом производной, или дифференциалом Фреше отображения F в точке х и
2 А. Д. Иоффе, В. М. Тихомиров
34
0. ВВЕДЕНИЕ, ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
обозначается Ff(x), а чаще — просто F'(x). Отображение F: X —* Y назовем регулярным в точке х, если оно дифференцируемо по Фреше в этой точке и
ImF' (х) = У.
Напомним: если X и У—банаховы пространства, то равномерной операторной топологией в пространстве S?(X, Y) линейных непрерывных отображений из X в У называется топология, порождаемая нормой
|| A ||= sup (||Ах ||г/|| х ||х). х е X
Пусть U — открытое подмножество пространства X, F: X-+Y и пространства X, Y — банаховы. Если для всех точек множества V существует производная Е'(х) и отображение х—*F'(x) непрерывно относительно равномерной операторной топологии пространства S£(X, Y) в U (в точке Xq е U), то говорят, что F непрерывно дифференцируемо в U (в точке Хо), или еще, что F есть отображение класса С\ в U (в точке Хо).
Производная функционала f(x) есть элемент сопряженного пространства. При этом
f(x + h)-f(x) = {f'(x), h) + о(||Л||).
Точка х, где f'(x) — O, называется стационарной.
Если X — гильбертово пространство, то X* можно отождествить с X. В этом случае производные функционалов, заданных на X, оказываются элементами самого пространства X и их называют градиентами. Иногда градиент функции f в точке х обозначают символом gradf(x).
Предложение 1. Справедливы следующие утверждения:
а)	операторы F'v (х) и F'f (х) определены однозначно*
б)	если отображение F окрестности точки х банахова пространства X в банахово пространство Y дифференцируемо по Фреше в точке х, то оно непрерывно в этой точке, дифференцируемо в этой точке по Гато и
F'(x) = ^(x);
в)	если отображение F окрестности точки х линейного топологического пространства X в линейное топо-
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
35
'логическое пространство Y дифференцируемо в точке х по Гато, то в этой точке определена первая вариация этого отображения и
F'r(x) h = 6F(x, h).
f Доказательство элементарно.
Пусть F: Rn—>Rm, т. е. F(x) = (f{(x), ..., fm(x)). Если отображение F дифференцируемо по Фреше в точке х, то его производная в стандартных базисах пространств Rn и Rm задается матрицей
hi. = ---:-- .
называемой матрицей Якоби. Другими словами, для всякого вектора зе Rn
(F(x)z)ft = 2
dxl
Введенные выше понятия оказываются различными даже для функций на плоскости R2. Вот два примера, иллюстрирующие эти различия.
1. Функция f(x), заданная равенством (х = (х1, х2)) z . fl, если х1 = (х2)2, х2 #= 0, f (х) = <
i 0 в остальных точках, дифференцируема по Гато в начале координат, где она даже не непрерывна, и тем более, не дифференцируема по Фреше.
2. Рассмотрим функцию, заданную в полярных координатах равенством
f (х) = г cos Зф.
В этом случае 6/(0, h)= f(h). Мы видим, что f имеет первую вариацию, но не дифференцируема по Гато, ибо первая вариация нелинейна по h.
Пусть банахово пространство X есть декартово произведение банаховых пространств Ад и Х2, т. е. X =. —	и F — отображение некоторой окрестности
точки (хь х2) е X в банахово пространство У. Тогда мы можем рассмотреть частные отображения
Fi. Xi-^P(xi, х2), Р2: x2-^F(xi, х2).
2*
36
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Будем говорить, что отображение F сильно дифференцируемо по первой (соответственно по второй) координате в точке (xi,x2), если отображение Fi (соответственно F2) дифференцируемо по Фреше в точке (соответственно х2). Производные отображений и F2 обозна-
г. г. (	дР dF \
чаются символами FXl и Fx, I или и и называются частными производными по Xi и х2 соответственно. Очевидно,
FXi: Xi-+Y> Z=l, 2.
Если же отображение F дифференцируемо по Фреше, то
F' (xi, х2) (xi, х2) = FXl (хь х2) xi + FX2(xi, хг- х2
для всех (xb х2) U.
0.2.2. Старшие производные. Пусть снова X и У — линейные топологические пространства, t/czzX — окрестность точки х и F: U —► У. Допустим, что для любого вектора h^X функция фЛ(/) = F(x +/й) дифференцируема в нуле п раз. Тогда отображение ft-*6nF(x, й) (из X в У), где
d"F(x, й)=-^фЖо.
называется n-й вариацией отображения F в точке х.
Определение старших производных по Гато далее не понадобится, и мы его не приводим. Определение старших производных по Фреше строится индуктивно. Пусть X и У — банаховы пространства и F: X —♦ У. Первую производную мы уже определили. Допустим, что отображение F дифференцируемо по Фреше в некоторой окрестности точки х. Тогда х—*F'(x) есть отображение этой окрестности в пространство 2 {X, У). Если оно дифференцируемо по Фреше в точке х (при условии, что пространство £ (X, У) рассматривается вместе с сильной операторной топологией), то его производную называют второй производной отображения F в точке х и обозначают F"(x) и т. д.
Можно указать и другое равносильное определение второй производной. Пусть Z] и Z2— линейные пространства. Отображение В: Zy^Z^-^Y называется билинейным, если частные отображения zt —»В (zb z2) и
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
37
z2) линейны при всяких 22gZ21 z\ е Zb Если пространства Zb Z2 и У — банаховы, то отображение В непрерывно в том и только том случае, когда при некотором с > 0 неравенство
||B(2l, z.,) || <с|| z, ЦП *2 II
выполняется при всех Z\ е Zb z2 е Z2. Множество всех непрерывных билинейных отображений из Z[ X 22 в У есть линейное пространство, являющееся банаховым относительно нормы
|| В || = sup{|| В (zb z2)||| || z, ||< 1, ||z2IK 1}.
Это пространство будем в дальнейшем обозначать символом 2?((ZbZ2), У). Билинейное отображение называется симметричным, если Z] = Z2 и B(zltz2) = = B(z2, Zi).
Пусть теперь F — непрерывно дифференцируемое по Фреше отображение открытого множества U банахова пространства X в банахово пространство У. Мы скажем, что отображение F дважды дифференцируемо по Фреше в точке х е U, если существует такое симметричное билинейное отображение В: Х%Х—> У, что
F(x + h) = F(x) + F'(x)h + l/2B(h, h)+r(h), где
II г (А) ||Г/Ц А ||2 -0 при ||й||л->0.
Квадратичная форма В(й, й) называется второй производной отображения F в точке х и обозначается F"(x) (h,h). Нетрудно понять, что оба введенных определения действительно равносильны. Таким же образом при помощи полилинейных отображений можно ввести определения производных более высокого порядка, однако в книге эти производные не встречаются, и мы опускаем эти определения.
Если в рассмотренной выше ситуации отображение F дважды дифференцируемо по Фреше в каждой точке множества U и при этом отображение x-*F"(x) непрерывно, то говорят, что отображение F дважды непрерывно дифференцируемо в U, или еще, что F есть ото* брожение класса С2.
38
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Непосредственно из определений следует
Предложение 2. Если отображение F дважды дифференцируемо по Фреше в точке х, то в этой точке определена и вторая вариация отображения F. При этом
62F(x, h) = F"(x) (ft, ft).
0.2.3. Основные теоремы дифференциального исчисления.
Теорема о дифференцировании сложной функции. Пусть X, Y и Z — банаховы пространства, U — открытое подмножество пространства X, а V — открытое подмножество пространства У. Пусть, далее, заданы отображения F: U—+Y и G: V—>Z. Предположим, наконец, что точка x^U такова, что F(x)<= е V. Тогда, если отображение F дифференцируемо по Фреше в точке х, а отображение G дифференцируемо по Фреше в точке F(x), то отображение Н = G°F дифференцируемо по Фреше в точке х и при этом
H'(x) = G'(F(x))<>F'(x).
Из этой теоремы сразу следует линейное свойство производных: производная отображения аЛ + pF2 (где a, peR) в точке х равна aF' (х) + pF' (*)» если, разумеется, отображения F\ и Р2 дифференцируемы в точке х.
Теорема о среднем значении. Пусть X и Y — линейные топологические пространства, U — открытое множество в X и отображение F: U -> У дифференцируемо по Гато в каждой точке отрезка*) [%, x + ft]cz cz U. Тогда
а)	если отображение z-+F'T (г) h является непрерывным отображением отрезка [х, х + ft] в У, то
1
F(x + h)~F(x) = J F'T(x + ih) h dt;
о
б)	если, кроме того, пространства X и У —банаховы, то
|| F (х + ft) - F (х) II<o<sup 11|F'T (x + th)]\ -ИЛИ
*) Отрезком, соединяющим точки xi и х2, называется множество вида [xi, х2] = {х|х = axi + (1 — a)x2, 0 a 1}.
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
39
и для всякого Л (X, У)
|| F(х + h) — F(x) — Ah ll<o|up (||F'r(x + th) — A| • || h ||.
В частности, для всякой точки z е [х, х + h]
||F(x + ^)-F(x)-FH2)a||<
< о suР , II F'r (х + /А) ~ Fr (2> || • IIh II-
Доказательство. Положим <p(Q — F(x 4- th), По определению производной Гато
^Р- = ^(х + /Л)й
при всех ^^[0, 1]. Утверждение а) следует теперь из классической формулы Ньютона — Лейбница. Утверждение б), в свою очередь, является простым следствием из а), поскольку
1
J Fp (х + th) h dt
о
sup
F'r (х + th)
•IIЛ ||.
О t < 1
Доказанная теорема может рассматриваться как бесконечномерный вариант классической формулы конечных приращений Лагранжа. Заметим, что формула конечных приращений для отображений в пространства размерности, большей единицы, уже не верна.
Следствие. Пусть X — банахово пространство и F — непрерывное отображение окрестности U точки xQ s X в банахово пространство У. Предположим, что отображение F дифференцируемо по Гато в каждой точке множества U и при этом отображение x->Fr(x)' из U в У) (рассматриваемое с равномерной операторной топологией) непрерывно. Тогда F дифферент цируемо на U по Фреше и для всех х е U
F'r(x) = F'p(x).
Доказательство. По теореме о среднем зна* чении
И(«„ + Ч- F(xa)-
< ,Prh + "")-
40
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Поскольку отображение x->Fp(x) непрерывно, для всякого в > 0 найдется б > 0 такое, что из
IIX — х0||< б следует, что
Поэтому
IIF (х0 + h) - F (х0) - F' (х0) h || = о (|| h ||),
а это и означает дифференцируемость отображения F по Фреше. Наконец, заключительная формула следует из предложения 1.
С последним утверждением близко связан следую-щий известный результат.
Теорема Ш в а р ц а. Пусть Хь Х2, Y—банаховы пространства и F — отображение открытого множества U czX! Х^2 в Y. Предположим, что F дифференцируемо по обеим координатам в множестве U и что отображения
(xi, x2)->FXl(xi, х2), (Xi, X2)“>FX2(Xi, х2)
множества U в Y) и 3?(Х2, У) соответственно непрерывны. Тогда F непрерывно дифференцируемо по Фреше на U.
Теорема о неявной функции. Пусть X, Y, Z — банаховы пространства, U — окрестность точки (х0, Уо) в декартовом произведении X X У и F: U —+Z — отображение класса Предположим далее, что F (х0, г/о) — 0 и частная производная Fy (х0, у о): У —► Z есть линейный гомеоморфизм. Тогда найдутся числа в > 0, б>0 и отображение х—*у(х) шара U(xQ,6)c7.X в шар U (yQ,E)czY такие, что
а)	на множестве U(х0, б) X U(f/o, е) соотношения F(x,y)= 0 и у = у(х) равносильны;
б)	у(х) есть отображение класса Сх и для всякого х<=и(х0, б)
у' (х) = —	(х, у (х))]-1 о Fx (х, у (х)).
0.	2.4. Теорема Л юстерника. Пусть М — подмножество банахова пространства X. Вектор хеХ'называют касательным к множеству М в точке х0 е М, если суще-
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
41
ствуют 8>0 и отображение	отрезка [0, е] в X
такие, что
х0 + ^х + г (/) е М при всех t е [0, е],
II г (/) II// -> 0	при/—>0.
Нетрудно проверить, что совокупность векторов, касательных к множеству М в некоторой точке, есть замкнутый конус (непустой, ибо он содержит нуль), называемый обычно касательным конусом к множеству М в точке х0. Если этот конус является подпространством, то он называется касательным пространством к множеству М в точке х0 и обозначается ТЛ1(Хо).
Теорема Люстерника. Пусть X и Y — банаховы пространства, U — окрестность точки х0 е X и F — дифференцируемое по Фреше отображение множества U в Y. Предположим, что отображение F регулярно в точке х0, т. е.
Im F' (х0) = У,
и его производная непрерывна в этой точке {в равномерной операторной топологии пространства 2? (X, У)). Тогда касательное пространство к множеству
M = {x^U\F(x)==F(xQ)}
в точке х0 совпадает с ядром оператора Fz(x0):
ТЛ4 (х0) = Ker F'(х0).
Более того, при выполнении условий теоремы существуют окрестность U' cz U точки х0, число К > 0 и отображение >х(£) множества U' в X такие, что
F£ + x®) = F(x0), \\x^\\^F\\F^-F(x0)\\ при всех g е U'.
Прежде чем доказывать теорему Люстерника, отметим, что первое ее утверждение является очевидным следствием второго утверждения и определений. В самом деле, в условиях теоремы всякий касательный вектор к множеству М в точке х0 принадлежит ядру оператора F'(xq), т. е.
ТМ (х0) cz KerF' (х0).
42
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Это сразу вытекает из определения касательного вектора. С другой стороны, если второе утверждение теоремы верно и g е Ker F'(xq), то при достаточно малых t > 0, очевидно, Хо + е U', ||F(x0 +.	— F (xQ) || =
= о(0» F(xq + + r(t))= F(xo), где r(t) = = x(xo + ^) и \\r(t)\\^K[\F(xQ + tl)-F{xQ)\\ = o(t).
Второе утверждение теоремы Люстерника выведем из несколько более общей теоремы, которой, в свою очередь, предпошлем три вспомогательные леммы. Первая из этих лемм представляет собой «многозначное» обобщение принципа сжимающих отображений и имеет вполне самостоятельное значение.
Пусть X и У — некоторые множества. Через 2Г обозначается совокупность всех подмножеств множества У. Всякое отображение Ф: X —>2Г называется многозначным отображением из X в У.
Пусть Z — метрическое пространство с расстоянием р. Если Ai cz Z и А2 cz Z, то уклонением множества At ат множества А2 называется величина
б (Ль Л2) = sup р (г, Л2) = sup inf р (г, w).
z^At	z^AlW^Ai
Хаусдорфовым расстоянием между множествами At и Л2 называется максимальное из уклонений б(Ль Л2), б(Л2, Л1):
h (А[, Л2)== шах {б (Л{, Л2), б(Л2, Л^)}.
Из определения сразу следует, что в случае, когда й(Л1, Л2)<а, для всякого Zie^ найдется такое г2 е А2, что p(zi, z2) < а.
Пусть Ф — многозначное отображение пространства z в себя. Мы назовем его сжимающим на множестве Л cz Z, если найдется такое число 0, 0 < 0 < 1, что неравенство
/г(Ф(£1), O(z2)X0p(zb Z2)
выполняется для любых Zi и Z2 из А.
Лемма 1 (принцип сжимающих многозначных отображений). Пусть Z — полное метрическое пространство с расстоянием р и в некотором шаре U(z0,r) = = {z|p(z, z0)<; г] (г > 0) определено многозначное отображение
Ф: U (ze, r)->2z,
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
43
причем множества Ф(г) не пусты и замкнуты для всякого z <= U (z0, г). Предположим далее, что существует число 0, 0 < 0 < 1, такое, что
a) h (Ф (zd, Ф (z2))^0p (zb z2) для любых zbz2^U (z0, г), б) p(z0, <D(z0)) < (1 — 0)г.
Тогда для всякого числа ri, удовлетворяющего неравенству
р(20, Ф (Zq)) < Г] < (1 — 0) г,
существует такой элемент z^B (z0, у 2. е)={ ® IР 2о)^
<тМ’ что
z е Ф (z).	(1)
Более того, среди точек z, удовлетворяющих этим условиям, найдется такая, что
Р (2. 2о) < Т~0 Р (2о> Ф (2о))•	(2)
Доказательство. Начнем с построения последовательности ?о, 21, ... такой, что
Zn «= и (z0, г) 2„еФ(гп_!) р (z„+b z„) < eVj
при п = 0, 1, ..., при п— 1, 2, ..., при п = 0, 1, ...
Эту последовательность будем строить индуктивно. Элемент Zq — тот же, что и в условии леммы, a zt — произвольный элемент из Ф(го) такой, что p(z0, Zi) < Допустим, что мы уже выбрали первые п -f- 1 элементов последовательности Zo, .... zn. Тогда
h (Ф (z„), Ф (z„_,)) < 0р (z„, zre_!) < eVp
Отсюда следует существование такого zn+i^O(2n)J
ЧТО p(zn+i, zn) < 0%
Далее, по неравенству треугольника, если m
п + 1,
Р	Р 2& + 1) “Ь • • • + Р 4-т—1> ^Л+m) <
< (0й + ... + О6*'"-1) гх < гь (3)
44
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Отсюда следует, что
Р (г0, г„+1) <	< г,
т. е. zn+1 е U (г0, г). Элемент гп+1 построен, индукция закончена.
Из (3) следует, что последовательность z0,	...
фундаментальна, и, поскольку пространство Z полно, она сходится к некоторому элементу ге 4 Переходя к пределу в неравенстве
Р	< 1 __q »
мы получаем, что zgB(20Ji/(1—0))cz U(zot г). С другой стороны,
р (гп+1, Ф (г)) < 6 (Ф (г„), Ф (г)) <
<й(Ф(гп), Ф(г))<0р(гп, г)->0.
Отсюда следует существование последовательности Wo, ... элементов множества Ф(г), которая сходится к z. Поэтому 2ЕФ(г), поскольку по условию множество Ф(г) замкнуто. Соотношение (1) доказано.
Если р(г0, Ф(го)) = 0, то гоеФ(го) и (2) очевидно. Если же р(2о,Ф(го))> 0, то мы выберем и так, чтобы
•у-<р(*о. ф(го)) <n < (1 —9)г.
и для этого и найдем точку ге B(zo, п/(1 — 0)), удовлетворяющую соотношению (1). Тогда
Р (2о, Z) < ~g- <	Р (z0, Ф (г0)).
Лемма доказана.
Лемма 2. Пусть X — банахово пространство и Mlf М2 — линейные многообразия в X, являющиеся сдвигами одного и того же подпространства L. Тогда
h (Afb М2) = б (Мь М2) = б (М2, Мг) =
= inf (II Xi — х2 HI Xi e= Mh x2e=M2}.
Доказательство. Достаточно проверить, что
Р (Xi, М2) = р (х2, АГ,)
§ 0.2 ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
45
для всяких XjeAlb х2<=М2. Пусть х^М1г х2еМ2; положим а( = р(хь Af2), а2 = р (х2, AfJ. Если х2 — произвольный элемент многообразия Af2 и x{ = x2 + (xi—х2), то, очевидно, х{еЛ1(. Имеем
а2<||х2 —xi|| = || Xi — х2||.
Это неравенство справедливо для всякого х2 <= ЛГ2. Поэтому
а2^а,.
Так же проверяется, что ai а2. Лемма доказана.
Л е м м а 3. Лусть X и Y — банаховы пространства и Д ^3? (X, У). Положим
С (А) = sup (|| у Г1 • inf {|| х || | х е X, Ах = у}).
у^У
Тогда, если ImA — Y, то C(A)<Z оо.
Доказательство. Если 1шА~У, то по теореме Банаха об открытом отображении образ единичного шара пространства X при отображении А содержит окрестность нуля в Y, т. е. существует такое б > 0, что для всякого у е У, \\у\\ б, найдется х^Х такой, что Hxll^l и Ах = у. Поэтому для любого у е У, У =/= 0,
inf {||х|| |хе X, Ах = у]~
= б-1 IIУII • inf {IIXII |х е X, Ах = бII у Г1 i/} < d-‘ II у II
и, значит, С(А)^ б'1. Лемма доказана.
Обобщенная теорема Люстерника. Пусть X и Y — банаховы пространства, A е 3? (X, У) и F — отображение некоторой окрестности U точки Xq^X в У. Предположим, что 1mA = У и существует число б > 0 такое, что, во-первых,
6С (А) < ’/2
и, во-вторых,
|| F(x) - Fix') - А (х - х') ||<б|| х - х'||	(4)
для всех х, х' из U. Тогда существуют окрестности, U' с U точки Хо, число К > 0 и отображение g—*х(^,
46
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
окрестности U' в X такие, что
для всех g е U'.
Доказательство. Выберем г>0 так, чтобы шар U (х0,2г) принадлежал окрестности U. Из (4) следует, что отображение F непрерывно в точке Хо. Поэтому можно указать такую окрестность U' с: U (хо, г) точки Хо, что
С (Л) sup||F(|)-F(x0)||<£	(5)
£el/'	2
(С (Л) < оо в силу леммы 3).
Зафиксируем некоторое § е U' и рассмотрим многозначное отображение х—►Ч^(х) шара {7(0, г) в X, определенное формулой
ЧЧ (х) = х - Л-’ (F Й + х) - F (х0)),
где через A-1(z/) обозначен полный прообраз точки у при отображении Л. В силу выбора г и U', g + х е J7 при всяких l^U', x^U(0,r), так, что множества ЧЧ(х) не пусты при всех хе 1/(0, г). Для всякого у <= У. множество Аг1 (у) есть линейное многообразие, параллельное подпространству КегЛ, таковы же и множества ЧЧ(х). В частности, все они замкнуты. Имеем в силу лемм 2 и 3
h (ЧЧ (х,). ЧЧ (х2)) = inf {|| Zl - z21| \Zl e= ЧЧ (xz), /=1,2} = = inf {|| z, — z21|| Azt- = Ax; - F (g + xz) + F (x0), i = 1,2}= = inf {|| z HI Az = Л (X! - x2) - F (* + *.) + F (g + x2)} <
< C (A)|| F (g + x.) —F (g + x2) - A (x, — x2) ||.
Отсюда, используя неравенство (4) и полагая 0=бС(Л) (0 < 1/2 по условию), получаем
M¥UxI),'I4(x2))<0|1x1-x2||.	(6)
Далее, в силу (5)
Р (0, **Ч (0)) = inf {|| z || | Kz = - F ® + F (х0)) <
< С (Л) || F (|) - F (х0) || < >/2 г < (1 - 0) г. (7)
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
47
Соотношения (6), (7) показывают, что отображение цг^(х) удовлетворяет всем условиям леммы 1. Поэтому существует такой вектор х=х(1), что, с одной стороны, хЙ)е^(х(Ю), т. е.
и, следовательно,
F£ + x®) = F(x0), а, с другой, в силу промежуточного неравенства в (7) — И*ШК-14ё-р(0, ЧМО))<
< IIР (I) - F (х0) || = К || F (I) - F (х0) II.
Теорема доказана.
Теорема Люстерника, точнее, ее второе утверждение, является очевидным следствием только что доказанной обобщенной теоремы. В самом деле, пусть выполнены условия теоремы Люстерника. Положим А = = F'(xq). Поскольку по условию отображение х—>Fz(x) непрерывно, мы можем указать такую выпуклую окрестность t7i cz U точки х0, что для всех х е Ut
|| F' (х) — Л || = sup (|| z Г* (F' (х) z — Az)) <	*Л) .
Тогда по теореме о среднем значении для всяких х, х' из
||F(x)-F(x')-A(x-x')||<
< sup (||F'(z) — Л||-||х — х'||) <2т4лг11х — x'lk z<=[x,x']
откуда все и следует. Теорема Люстерника полностью доказана.
0.2.5. Дифференцируемость некоторых функционалов и отображений. Пример 1. Аффинные отображения. Отображение А: X—* У одного линейного пространства в другое называется аффинным, если
А (х) = Ах + а,
48
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
где а е У, а Л — линейное отображение из X в У. Если X и У — банаховы пространства и Л — линейное непрерывное отображение, то отображение А всюду дифференцируемо по Фреше и
А' (х) = Л,
а вторая и последующие производные отображения А равны нулю. Это следует прямо из определений. В частности, для аффинной функции
а (х) = <х‘, х) + а
производная Фреше в любой точке х равна х*.
Пример 2. Квадратичные функции. Пусть X — банахово пространство, В (xi, Хг) — непрерывная билинейная функция на X X X и Q(x) = B(x, х)—соответствующая квадратичная форма. По определению
Q(x + h) = В(х, х) + В(х, Л) + В (h, х) + B(h, h) =
= Q (х) + В (х, ft) + В (h, х) + о (|| h ||).
Таким образом, функция Q дифференцируема по Фреше и
Q' (х) h = В (х, fi) + В (fi, х).
В частности, если X — гильбертово пространство, то всякая квадратичная форма имеет вид
Q(x) = 4-(Лх |х), At=£(X, X), Л‘ = Л /л
и
Q' (х) = Ах.
Квадратичной функцией в гильбертовом пространстве называется сумма квадратичной формы и аффинной функции:
k (х) = у (Лх |х) + (х Iа) + а.
Очевидно,
k'(x) = Дх + а.
Вторая производная функции k(x) равна, конечно, Л:
£"(х) = Л,
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
49
а остальные производные равны нулю. В частности, если
е(х)==1/2||Х||2=1/2(х|х))
ТО
е' (х) = х, е" (х) = I, е"’ (х) = ... =0.
Отметим следующее соотношение для квадратичных форм:
Q (х0 + х) = Q (х0) + Q' (х0) х + Q (х).
Пример 3. Норма в гильбертовом пространстве. Функция
f(x)=||x|| дифференцируема по Фреше в любой точке х, отличной от нуля, а ее производная равна
f (х) = ||х|Г,х.
Это сразу следует из формулы дифференцируемости сложной функции, если учесть, что
f = g°h, где /г(х) = (х|х), a g(t) = Vt.
Переходим к получению формул для производных конкретных функционалов и отображений, которые понадобятся нам при выводе необходимых условий экстремума в вариационном исчислении и теории оптимального управления.
Пример 4. Пусть отображение h\ Rn->Rm: /г (х) =	(х), .... hm(x))
определено и непрерывно дифференцируемо в окрестности U точки Хо е R". Рассмотрим отображение
Ят(х(-)): С’(Ко, определенное соотношением Ят(х(.)) = Л(х(т)), где т — некоторая фиксированная точка отрезка [/о, М-Это отображение определено на множестве таких х(-)е Cn([/o, ^i]), что х(т)е(Л Покажем, что если при
60
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
этом хо(т) = хо, то отображение Нх дифференцируемо по Фреше в точке х0(-), и вычислим его производную. Имеем
h (х0 + х) = h (х0) + (h' (х0) I х) + о (| х |).
Поэтому
Нх (х0 (•) + х (•)) = h (х0 (т)) + (h' (Хо (т)) | х (т)) + о (| х (т) |).
Но | х (т) | || х (•) ||. Следовательно, Нх(х0(-) + х(-)) =
= Нх(х0 (•)) + (h'(х0(т)) |х (т)) 4- о (|| х(•) ||). Это значит, что отображение Нх дифференцируемо по Фреше в точке х0(-) и его производная равна
Нх (хо (•)) х ( •) = (h' (хо (т)) |х (т)), или в координатной форме
(Ят(х0( •)х(• ))f = У-д-‘ xJ(т),	1=1, ..., т.
OXJ
Пример 5. Пусть gi(t,x), ..., gm(t, х) — действительные функции, определенные, непрерывные и непрерывно дифференцируемые по х в открытом множестве U cz R X Rn. Положим
g{t, x) = (gi(t, х).gm(t, х)).
Предположим, что график непрерывной вектор-функ-ции хо(О: I'o, ^i] ~* Rn принадлежит области (7, и рассмотрим отображение
G: Cn(no,M)->Cw([/o,M), определенное соотношением [G(X(.))](O = £(/,X(O), Покажем, что это отображение дифференцируемо по Фреше в точке Хо(-), и вычислим его производную.
Для этого мы воспользуемся следствием из теоремы о среднем. Проверим, что отображение G дифференцируемо по Гато в некоторой окрестности точки Хо(-) и его производная Гато непрерывна. Поскольку множе
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
51
ство U открыто, мы можем указать такое е > 0, что из |хо(О_х1<8 следует, что (/, x)t=U. Если же ||х(->—Хо(-)11с < е, то
lim Г G.(x(,) + Zz(l)).~G(x<-)11 (/) = gx (/, х (/)) z
Л->0 L	л	J
т. е.
[<?г (*(•))г (•)] (0 = gx (t, х (0) z (0-
Непрерывность отображения х (•) —> G'r (х (•)) сразу следует из непрерывности отображения (t, x)—*gx(t, х), Итак, отображение G дифференцируемо по Фреше и
[G'(x0( • ))z( -)](0 = ^(Л x0(0)z(0.
Пример 6. Пусть <Р1(Л х, и), q>m(t,x,u)—действительные функции, определенные, непрерывные и непрерывно дифференцируемые по х и и в некоторой области V пространства R X Rn X Rr. Положим
Ф (t, х, и) = (ф! (t, х, и), ..фт(/, х, и)).
Предположим, что вектор-функции Хо (•) С" ([/0, Л]) и «0( •) е Сг([£0» М) таковы, что (t, х0(/), м0 (/)) V при всех t е [Zo, Рассмотрим отображение
Ф: С? ([f0, t,]) X сг ([f0, М) -> Ст([/0, Л]),
[Ф(х(-), «(•))](0 = ф(^, x(t), и (t)),
Дословное повторение рассуждений из предыдущего примера позволяет доказать, что отображение Ф дифференцируемо по Фреше в точке (хо(-), Но(-)) и
[Ф'(х0(-)» Ho(-))(z(-).M-))](0 =
= фх (t, Х0 (0, «0 (0) 2! (0 + Фи (Л XQ (0, «о (0) (0.
Пример 7. Пусть m(t, х, у) — отображение в Rm, определенное, непрерывное и непрерывно дифференцируемое по х и у в некоторой области W с: R X Rn X X Rn. Предположим, что непрерывно дифференцируемая на [Zq,вектор-функция Xo(t) такова, что (t,x0(t), xo(t))e W при всех t е [/0Д1]. Рассмотрим отображение
52
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
определенное соотношением
[М (х (.))] (0 = tn (t, X (/), X (/)), /о < t < tx.
Отображение М есть, как легко видеть, суперпозиция двух отображений:
М ==М2° Мь
где Mi— линейное отображение из Сх в Сп\Сп:
[А11(х(-))](0 = (х(0,х(0)> t0<t <0,
а отображение М2: Сп \Сп->-Ст определяется так:	••
[М2(х( •), у (•))](/) = m(t, x(t),
Из предыдущего примера и из теоремы о производной суперпозиции отображений следует, что отображение М дифференцируемо по Фреше в точке х0(-) и
[М'(х0(•))*( •)](/) =
= тх (t, х0 (0, х0 (0) z (0 + ту (t, х0 (0, х0 (0) z (0.
Пример 8. Пусть в условиях предыдущего примера т (t, х,у)= L (t, х, у) — действительная функция. Рассмотрим функционал
5r(x(-)) = J L(t, х (0, x(t))dt.
*0
Этот функционал есть суперпозиция двух отображений
^ = а2о^1г где
СГ([/о,0])^С([/о,0]),
(х(•))] (0 = L (t, х (0, х (0), t0 < t < а
fl
^2(а(-))= f а(0 dt.
fo
Отображение 3f\ есть частный случай отображений, рассмотренных в предыдущем примере, а функционал Sf2 линеен и непрерывен. Сопоставив результаты при
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
53
меров 1 и 7, приходим к следующей формуле для производной Фреше отображения
= J (t, x(t),x (0) z (0 + Ly (t, x (0, x(t)) z (01 dt. tf)
Пример 9. Пусть U — некоторая область в Rn и отображение ф: fo,	*RW обладает следующими
свойствами: при всяком t е (/0, Л] отображение х-*ф(/,х) непрерывно дифференцируемо, а при всяком х е U вектор-функция >ф(/, х) измерима. (Мы покажем в гл. 9, что в этих предположениях вектор-функция /->ф(/, х(/)) измерима, если только вектор-функция х(/) измерима и принимает значения в U.) Предположим далее, что определенная и непрерывная на RoJi] вектор-функция х0(/) принимает значения в U при всех	вектор-функция /->ф(/, х0(/)) сум-
мируема и существуют такие 8 > 0 и суммируемая действительная функция р(/), что
Х)1<Р(0.
ЛИШЬ только
I X — хо(0 [< е.
Рассмотрим отображение Т: Сп([/о,	Л]),
определенное соотношением
ГУ(х(-))](0 = Ш х(0),
Пусть ||х(•)—х0(-)||с<е. Тогда при достаточно малых Л > О
I ГУ(х(-) + М-))-У(х(-))-| (/) I =
I L	A	J I
В силу теоремы Лебега об ограниченной сходимости предел левой части последнего соотношения при X—>0 существует и равен
4\(0 X(0)Z(t),
54
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
При ЭТОМ
I ФИ*, x(t)) |<р(0, т. е., поскольку |z(/)| ограничена, вектор-функция фя(/, x(t))z(t) принадлежит пространству Li1 ([to, 6]). Таким образом, отображение Т дифференцируемо по Гато в е-окрестности точки х0(*), [Т'г(х(-))2(-)](/) = фД/,Х (0)2(0,
и |фх(0 x(t)) |	р(0- Отсюда и из непрерывности ото-
бражения х-»фх(7, х) следует, что производная Гато Тг непрерывна. Поэтому отображение Т дифференцируемо по Фреше и
[¥' (х0 (•)) z (•)] (0 = Фх (t, х0 (0) z (0.
Пример 10. Пусть в условиях предыдущего примера ф(/, x)=L(t х)—действительная функция. Тогда, как и в примере 8, убеждаемся, что функционал
л
(х(•)) - J L(/, X(0) dt: Cn([t0, 0D -+ R tj
дифференцируем по Фреше в точке х0(-) и
(Хо ( • )) « ( • ) == J Lx (t, Хо (0) Z (t) dt.
Пример 11. Пусть отображение ф(/, х): [/о,/л]Х XRn-*Rrt — такое же, как и в примере 9. Однако в отличие от примера 9 предположим, что вектор-функция хо(О абсолютно непрерывна, т. е. что х0(-)е е lF"i([fo> 6]). Рассмотрим отображение
F: 1Г”1([/о,М)^Ж>'1]), определенное соотношением
[F(x(-))](t) = x(t) — ^(t,x(t)).
Это отображение есть разность двух отображений: линейного и непрерывного отображения F{: Wi,i ([/о, 6])-»-->Li(Ko, Л]),
Л (*(•)) = *(•)
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
55
и отображения F2:	(1Хо, 6] )->£?( [/о, 6]),
Как мы показали, второе отображение дифференцируемо по Фреше, если его рассматривать как отображение из Сп в L". Однако, если х(-) е IFm, то
1|х(.)||с</<||х(.)||^
Поэтому отображение F2:	тоже дифференци-
руемо по Фреше. Сопоставляя результаты примеров 1 и 9, приходим к выводу, что отображение F дифференцируемо по Фреше и
[F' (х0 (•)) z (•)] (0 = г (/) — фх (t, х0 (0) z (/).
0.2.6. Регулярность функционалов и отображений. Рассмотрим здесь лишь несколько самых простых примеров регулярных отображений.
Пример 12. Пусть X — банахово пространство и f — функция на X, дифференцируемая по Фреше. Тогда f регулярна в любой нестационарной точке х.
Действительно, если f'(xo)¥=O, то найдется такой элемент х еХ, что
а =	(х0), х) 0.
Это значит, что множество чисел
/а = <f (х0), tx)
совпадает со всей вещественной прямой R, т. е. f регу' лярна в точке х0.
Пример 13. Пусть отображение F: X->Rn, F(x) = = (f i (х), ..., fn (х)) дифференцируемо по Фреше в точке Хо. Оно регулярно в точке х0 тогда и только тогда, когда векторы f{(х0), .... f'n (х0) линейно независимы.
Необходимость этого условия очевидна. Докажем достаточность. По лемме о биортогональном базисе найдем элементы х{<=Х, i = 1, .... п, такие, что --3'
56
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Тогда каков бы ни был вектор g = (£*, ..., ^)eRn, (п \
i=l /
т. е. множество значений отображения Fz(x0) есть Rn.
Пример 14. Рассмотрим то же отображение, что и в примере 5, предполагая однако, что т= 1. Если это отображение дифференцируемо по Фреше в точке х0(-), то оно регулярно в этой точке в том и только том случае, когда gx(t,x0(t))=^ 0 при всех
Необходимость этого условия очевидна. Наоборот, если gx(t, xQ(t)) #= 0 при всех	G], то функция
l/gx(t, xQ(t)) непрерывна по условию и какова бы ни была функция z(-)e С([/о,/J),
[G'(M ‘ ))^( • > *о( * И * )](0 = г(0,
т. е. производная G,(x0(-)) отображает С([/о, М) на С([/о, М).
§ 0.3. Выпуклый анализ
В этом параграфе рассказывается о простейших фактах выпуклого анализа, используемых в гл. 1. Более подробно и полно выпуклый анализ изучается в главах 3, 4. Всюду в этом параграфе X — отделимое локально выпуклое линейное топологическое пространство.
0.3.1. Выпуклые множества и функции. Отрезком, соединяющим точки х{ и х2 из X, называется множество
[xi, х2] = {х	X | х = axt + (1 — а) х2, 0 a 1}.
Подмножество А пространства X называется выпуклым, если оно вместе с каждой парой своих точек содержит соединяющий их отрезок. Пустое множество считается выпуклым по определению.
Примеры выпуклых множеств: подпространства и линейные многообразия, треугольники и круги на плоскости, тетраэдры и шары в трехмерном пространстве, единичный шар в банаховом пространстве и т. п. Множество К cl X называется конусом, если из х е К следует, что Zx е К при всяком Л > 0. Конус К будет выпуклым тогда и только тогда, когда из Xi е К и х2 е К
§ 0.3. ВЫПУКЛЫЙ АНАЛИЗ
57
следует, что х\-\- х2^ К. Действительно, если К — выпуклый конус, то Xi + х2 = V2 (2%1 + 2x2) cz К. Наоборот, если конус К содержит суммы своих элементов, то ccxi +(1 — а)х2 е К, лишь только Xi (= К, х2^К, 0
а 1. Важный пример выпуклого конуса в Rn — неотрицательный ортант:
R^ = {x = (x1,	xrt)|x£^0, z=l, п).
Напомним, что функциями мы называем отображения в расширенную вещественную прямую. С каждой функцией f, заданной на X, можно связать два множества
domf = {х е X \f (х) < оо}, epi f = {(a, x)(=RXX|a>f (х)}.
Первое из них называется эффективным множеством функции f, а второе — ее надграфиком. Функция f называется собственной, если domf #= 0 и f (х) > —оо для всех х. Функции, не являющиеся собственными, называются несобственными.
Функция f называется выпуклой, если множество epif выпукло в пространстве RX^. Примерами выпуклых функций являются: аффинная функция
f (х) = (х*, х) + а (х* е Г, а е R);
индикаторная функция выпуклого множества A cz X
( о,
= | +„
если хеА, если х ф. А;
опорная функция множества A cz X*
s (х | Л) = sup (х‘, х). х* е А
Заметим, что норма в банаховом пространстве есть опорная функция единичного шара сопряженного пространства (это вытекает из определения нормы в сопряженном пространстве и следствия 3 из теоремы Хана — Банаха).
0.3.2. Субдифференциал. Пусть f — выпуклая собственная функция на X. Функционал х* е X* называется субградиентом функции f в точке х, если
— f (х)	(х*, z х) для всех z е X.
58
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Множество всех субградиентов функции f в точке х называется субдифференциалом функции f в точке х и обозначается df(x), т. е.
df W — {х* е X*| f (г) — f (х) > <х*, z — х), Уг е /).
Роль субдифференциалов в выпуклом анализе подобна роли производных в классическом анализе. Если функция f дифференцируема по Гато в некоторой точке, то легко показать (и это будет показано в гл. 4), что ее субдифференциал в этой точке содержит единственный элемент — производную Гато.
Если X — банахово пространство, то субдифференциал его нормы в нуле совпадает с замкнутым единичным шаром сопряженного пространства. Это следует прямо из определений. Если же х =И= 0, то
д II х || = {х‘ е Г ||| х’ || = 1, <х‘, х> = || х ||}.
Действительно, если (х*, х) = || х ||, ||х‘||=1, то ||z||^ (х‘, z) для всякого z е X и, значит,
II z || —1| х || > <х‘, z — х),
т. е. х‘ед||х||. Наоборот, если х* е д || х ||, то
- II х || = || 01| -1| х || > <х\ 0 - х) = - <х\ х),
|| х || = || 2х || —II х || > <х’, 2х — х> = <х\ х), откуда || х || = <х’, х) и для всяких z е X, К > 0
||Xz + x||—||х||>(х’, Az), т. е.
|г + г!”	г},
откуда при К —> оо следует, что ||z||>(x*z)
для всех г^Х, т. е. ||х*||	1. Но поскольку (х*, х) =
= ||х||, необходимо, чтобы ||х*|| = 1.
Субдифференциал индикаторной функции б(х|Л) не пуст в любой точке хе Л, ибо, если хе Л, то 0 е е<?6(х|Л). Вообще же по определению
д$(х | А) — {х*е X' |<х‘, z — х)<0, Vz е Л).
Легко понять, что <5б(х|Л) — это конус. Он называется конусом опорную функционалов, или нормальным кону
§ 0.3. ВЫПУКЛЫЙ АНАЛИЗ
59
сом множества А в точке х и обозначается 2У(х|Д)а В частности, если А = L есть подпространство, то
dl>(x\L)=N(x\L) = L^.
Субдифференциал функции (X = R)
,, ч ( — К1 ~	если | х I С 1,
fM = j	। । ^ f
I оо, если | х I > 1,
в точке х — 1 пуст. Однако, если функция f непрерывна в точке х, то ее субдифференциал в этой точке не пуст (см. § 4.2).
Далее нам будут встречаться функции двух (и более) переменных f(x,y). Для таких функций символами dxf(x,y), dyf(x,y) и т. д. будут обозначаться «частные» субдифференциалы, т. е. субдифференциалы функций X-*f(X,y) и y-*f(x,y).
0.3.3. Теорема Моро—Рокафеллара. Пусть fi и f2— выпуклые собственные функции на X. Тогда
d(f^f^{x)=>dfl(x) + df2(x).	(1)
Если же одна из функций непрерывна в некоторой точке, принадлежащей эффективному множеству другой функции, то
d(fl + f2)(x) = df1(x) + df2(x)	(2)
для всех х.
Напомним, что dfi(x) и df2(x) суть множества в X* и выражение d/\(x)-j- df2(x) означает алгебраическую сумму множеств.
Этот результат может рассматриваться как обобщение теоремы классического анализа о производной суммы двух дифференцируемых функций.
Доказательство. Включение (I) сразу следует из определения субдифференциала. Докажем второе утверждение теоремы. Пусть х* е д(Л + f2) (х). Нам нужно проверить, что х* допускает представление в виде суммы x* = xJ4~X2, где х,^д^(х), х^еdf2(x).
Допустим для определенности, что функция fi непрерывна в точке Хо, принадлежащей dom f2. Тогда внутренность множества epi fi cz R X X очевидно, не пуста. (В самом деле, по заданному е > 0 мы можем выбрать
60
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
такую окрестность U точки х0, что |fi(z) — А(х0)|<8 для всякого z^U. Но тогда множество
{(а,г)еКХХ|а>Л(х0)+е, z е U}
открыто и содержится в epifi.) Рассмотрим в RX^ два множества (рис. 1)
С{ = {(а, г) g= R X X |a>f, (х + z) -f, (х)},
С2 = {(а, 2) е R X X | а < <х*, z} — f2 (х + z) + f2 (х)}.
Множество есть сдвиг надграфика функции fb имен-» но,
Ci = epi Л — (f (х), х).
Поэтому С*! выпукло и int Ci = 0. Выпуклость второго
множества тоже непосредственно следует из выпуклости функции f2. Наконец, множества Ci и С2 не пересекаются, ибо иначе в некоторой точке z выполнялось бы неравенство
Рис. 1.
По теореме отделимости
<х’, z> — f2 (х + z) + + A>W >fi(x + z)— f,(x), противоречащее предположению о том, что x*<=d(f{+f2) (х).
множества С] и С2 можно
разделить ненулевым линейным непрерывным функцио-
налом, т. е. существуют такие 0 <= R и х* е X*, что либо 0#=О, либо х? #= 0 и
sup (0а + <х1, z>) < inf (0а + <xL z)).	(3)
(а, г) е Ci	(а, z) <= С2
Очевидно, р 0, так как при р > 0 верхняя грань в (3) равнялась бы + оо, а нижняя грань равнялась бы —оо. Кроме того, р =# 0, ибо при р = 0 неравенство (3) принимает вид
sup (хГ, z) inf (xj, z).
z е dom fi—х	z е dom f2-x
§ 0.3. ВЫПУКЛЫЙ АНАЛИЗ
61
Последнее соотношение, однако, противоречит условиям теоремы. В самом деле, xj #= 0, так как р = 0. Поэтому
(х*, хо — х) < sup (хТ, z) sup (xt, г) zedomfj—х
и, следовательно, inf (xj, z) (xj, Хо — х) < sup (xi, z). zedomfj-x	ZEdomh-х
Итак, р < 0 и без ограничения общности можно считать, что р = —1. Таким образом, доказано, что множества и С2 отделены гиперплоскостью а—(x*,z) = = 0 (см. рис. 1). Тогда из (3) следует неравенство
sup [(Хр z) — f, (х 4- z) — (х)] <
< inf [(х[ — х*, z) 4- f2 (х + z) - f2(x)].
При z = 0 выражения в квадратных скобках как в левой, так и в правой частях неравенства обращаются в нуль. Поэтому
f! (X 4- Z) — fl W > (Хр z)
для всех z е X и, если обозначить хг = х*— xf, то
f2(x + z)-f2(x)^(x'2, z)
для всех z е X. Первое соотношение означает, что х*едД(х), второе — что x2^.df2(x). Теорема доказана.
Теорема Моро — Рокафеллара по индукции распространяется на любое конечное число слагаемых. Именно, если ..., fn — выпуклые собственные функции на X, то
d(fi + ... 4- fn) (х) о dfi (х) 4- ... +dfn(x)
для всякой точки х. Если же в некоторой точке, принадлежащей пересечению эффективных множеств всех функций fi, ..., fn, все они, за исключением, быть мо* жет, одной, непрерывны, то
d(fi+ ... +fn)(x) = dfi(x)+ ... 4-<?fn(x) для всех х.
62
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
§ 0.4. Дифференциальные уравнения
Нам придется иметь дело с обыкновенными дифференциальными уравнениями вида
х==ф(^х)>	(1)
где ср — отображение некоторой области V cz R X Rn в пространство Rn. Как правило, мы не будем предполагать отображение ср непрерывным по совокупности переменных, как это обычно делается в большинстве руководств по теории дифференциальных уравнений. Поэтому все утверждения в этом параграфе сопровождаются полными доказательствами.
Решением уравнения (1) мы будем называть всякую определенную и абсолютно непрерывную на некотором интервале Т вектор-функцию х(/), если ее график принадлежит области определения К отображения ср и если почти при всех t выполняется соотношение
х (0 =ф (<> X (/))•
0.4.1. Линейные уравнения. Начнем с изучения линейных уравнений
х — А (/) х + а (/),	(2)
где t->A (t) — отображение отрезка [/0, в пространство 3? (Rrt, R”) линейных операторов из Rn в Rrt, а а (/): [/0, h] -> R” ~ вектор-функция. Отображение	называется измеримым, если для
всякого х е Rrt вектор -функция t -> А (/) х измерима, и суммируемым, если, кроме того, суммируема действительная функция /-> -> ||А (/)||*, где через || • || обозначена норма в пространстве 3 (Rrt, R”). (Для суммируемости отображения £->A(f) необходимо и доста, точно, чтобы были суммируемы действительные функции (A (t) ej еД Z, /=1, ..., п, где {еь ...,	— некоторый базис в Rn.)
Лемма 1. Предположим, что отображение £->A(f) и вектор-функция a(t) суммируемы на отрезке [to, /1]. Тогда для всякой век-тор-функции z(-)e Cn([tQ, ^]) и всякого tg[VJ существует одна и только одна вектор-функция х(-)е Cn([to, £i]) такая, что для всех t е= [/о, /1]
x(0=z(0+ J [A (s) х (s) + a (s)] ds.	(3)
Доказательство. Оператор Q:
t
x(-)->[Qx(-)](0=2(0+ f [A(s)x(s)4-a(s)]ds
T
отображает пространство Cn([/o> M) в себя. Положим
t
c (t) = |[A (OH. C (t) = J c (s) ds, ca = C (/,) - C (0).
%
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
63
Имеем
|[QX) (•)] (0 - [Qx2(-)j (ОК t
< J с (s) I Xj (s) — х2 (s) I ds
X
<1C (01 Iix, (•)-x2(-)||c;
I [Q2x, (•)](/)-[<2% (•)](/) К
t
J C (s) I [Qxi (•)] (s) — [Qx2 (•)] (s) [ ds T
< llxi (•) - x2(. )HC .
t
J c (s) C (s) ds
X
= '/2c* (0 ||X! (•) -X2(• )||c;
j[Qrax1 (-)](0 - [Qmx2( •)] (OK
1	cj1
< I С (0 Г II x, (•) - x2 (• )|| <	||X1 (•) - x2 (. )||c,
fill	[11Л
t. e.
c1?
IIQW X, ( . ) - Q™x2 (. )HC <	||X! (.) - x2 (• )||c.
Ho c™jm\<\ при достаточно большом m, т. е. m-я степень отображения Q — сжимающая. Требуемый результат следует теперь из принципа сжимающих отображений.
Теорема 1. Пусть отображение /~>А(/) и вектор-функция a(t) удовлетворяют условиям, указанным в формулировке леммы 1. Тогда для всяких z^Rn, т е [Zo, ^i] на отрезке [Zo, /±] существует единственное решение x(t) уравнения (2) такое, что х(т) = z.
Доказательство следует из леммы 1, если положить
Следствие. Рассмотрим отображение F:	([f0, ^]) ->
*>	(|70, определенное формулой
[Fx(-)J (0 = ^(0-ф(^ x(t)).
Предположим, что в некоторой окрестности графика вектор-функции х0 (•) е	fj]) отображение (t, х)-> ф(£, х) удовлетворяет
условиям, указанным в примере 9 из § 0.2. Тогда отображение F. регулярно в точке хо (•).
Доказательство. В примере 9 из § 0.2 было показано, что отображение F дифференцируемо по Фреше в точке Хо (•) и что его производная в этой точке есть линейный оператор из в Lj, действующий по формуле
I/7' (^о( ’)) X (.)'] (О = х (t) - А (/) х (О,
64
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
где A (0 =	(t, хо (/))• По теореме 1 уравнение
х~А(0 x = y(t)
имеет решение (принадлежащее по определению ^^д) при всяком у (•) <=	(р0, /j]), а это и означает регулярность отображения F.
Решение уравнения (2), удовлетворяющее в точке т условию x(t) = z, будет в дальнейшем обозначаться через x(t;x,z). Из о и-ределения и из теоремы 1 сразу следует равенство
х (/; т, х (т; s, z)) = х (/; s, z),	(4)
справедливое для всех t, т, s из [Zo, £±], z е Rn.
Предположим, что уравнение (2) однородно, т. е. что а(0^0, Тогда, очевидно, для всех z, zlt Z2 из Rn, Хе R,
х (/; т, Kz) = Лх (/; т, z), х (/; т, zi +z2) = x (/; т, zx) + x (t\ t, z2).
Другими словами, отображение z~>x(/;r, z) линейно, т. е. для каждых /, т из [/о, 6] существует однозначно определенный линейный оператор R(t,x)\ Rn~>Rn такой, что х(/; т, z) = R(t, t)z. При этом R(t,t) =/ (тождественный оператор) для всякого / s [/0,6]. Отображение (/, т) R(t, т) называется резольвентой однородного уравнения
х = Л(/)х.	(5)
Предложение 1. Пусть R(t,x) —резольвента уравнения (5). Тогда
а)	отображение t-^R(tfx) является решением дифференциального матричного уравнения
(6)
с начальными условиями R (т) «= /;
б)	для всяких /, т, 5 из [/о, / J справедливо равенство
R(t, т)Я(т, $) = /?(/,$).
В частности, R (/, т) R (т, t) = /, т. е.
«“'у. т) = /?(т,0;
в)	если Q (£, т) — резольвента однородного уравнения
y = -K*(t)y,	(7)
то
/г1 (А Т) = Q* (/, т).
Уравнение (7) называется обычно сопряженным с уравнением (5).
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
65
Доказательство, а) По определению для всякого ze Rn /	/ t	\
R (t, т) z = z 4- J A (s) R (s, t) z ds = I I + J A (s) R (s, r) ds j z, т	V т	/
откуда следует, что
t
R(t, T) = /4- J A(s)fl(s, r)ds.
X
б) Согласно равенству (4) для всякого zg R'1
R (/, s) z — x (/; s, z) =x (t; r, x (r; s, z)) =
— R (t, t) x (t; s, z) — R (t, r) R (r, s) z откуда
R(/> s)=R(A t)R(t, s).
в) Пусть Q (t, т) — резольвента уравнения (7). Тогда по доказанному Q (/, т) удовлетворяет дифференциальному уравнению
Q = - Л* (0 Q
и начальным условиям Q (т, т) = I. Имеем
4 - (4«')к+°' (4	+°‘AS - »
т. е. Q* (f, т) R (f, т) = const для всех ^g[/0, Л]. Но Q*(t, т) R (т, т) = /. Следовательно, Q* (t, т) R (t, т) s Z, т. е. R-1 (/, т) = Q* (t, т). Предложение доказано.
Вернемся к неоднородному уравнению (2).
Теорема 2. Пусть выполнены условия леммы 1 и — резольвента однородного уравнения (5). Тогда
t
х (t\ х, z) — R (t, т) z + R (/, т) J R (r, s) a (s) ds. т
Доказательство. Будем искать x (t; т, z) в виде
x (t; x, z) = R (t, т) у (0,	(8)
где у (t) абсолютно непрерывна и y(x)=z. Имеем в силу предложения 1
d	г d 1
х (/; т, z) == R (/, т)] у (0 + R (/, т) у (0 =
= A(0R(/, t)i/(0+R(/, т)//(0
3 А. Д. Иоффе, В. М. Тихомиров
66
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
откуда
R (Л т) у (0 = а (/), т, е.
t	t
У (/) == 2 + J /С1 (S, т) a (s) ds = z + J R (т, s) a (s)
ds.
Подставляя полученные выражения в (8), получаем требуемый результат.
0.4.2. Существование решений и их зависимость от начальных условий. Обратимся к уравнению (1). Пусть ф— отображение некоторой области V в пространстве RXRn в Rn. Скажем, что отображение ф ограничено на множестве Q cz V функцией r(t), если
| Ф (/, х) К г (/) при (/, х) s Q.
Если для каждой точки (т, х)е V найдется интервал Г,те Г, такой, что Т X {х} cz V и отображение /->ф(/, х) измеримо на Г, то мы скажем, что отображение ф измеримо по t.
Говорят, что отображение ф удовлетворяет условию Липшица по х на множестве Q cz V, если для всех /, х, х' таких, что (/, х) е Q и (f, xz) е Q, справедливо неравенство
I ф (/, х) — ф (t, х') |< k | х — xz |, k > 0.
Отображение ф называется локально липшицевым по х, если каждая точка области V может быть окружена окрестностью, в которой отображение ф ограничено суммируемой функцией и удовлетворяет условию Липшица по х.
Предположим теперь, что измеримое множество A cz R и область U с Rn таковы, что произведение А X И принадлежит области определения V отображения ф. Говорят, что ф удовлетворяет условию Каратеодори на А X если при каждом t е А отображение х~>ф(/, х) непрерывно на U, а при каждом хе(/ отображение /~>ф(/, х) измеримо на А. В гл. 9 будет показано, что при выполнении условия Каратеодори отображение ф суперпозиционно измеримо, т. е. всякая вектор-функция t-+ q(t, x(t)} измерима на А, если только х(/) — измеримое отображение множества А в R\ Если отображение ф измеримо по t и локально липшицево по х, то, очевидно, для каждой точки (/,x)eV можно указать интервал Г, содержащий i и окрестность U точки х таким образом, что Т cz V и отображение ф удовлетворяет условиям Каратеодори на Т X Поэтому, если вектор-функция x(t) непрерывна и ее график лежит в области V, то вектор-функция /->ф(/, х(/)) измерима.
Теорема 3 (локальная теорема существования и непрерывности). Пусть в области V cz R X Rn определено отображение q(t,x): V~*Rn, измеримое по i и локально липшицево по х. Тогда для всякой точки (to, Xo)eV можно указать отрезок То, содержащий внутри себя t0, и окрестность Uq точки х0 такие, что: Tq X Uo о cz V и для всякого z&Uq на отрезке То существует ровно одно решение xz(t) уравнения (1) с начальными условиями xz(to)—z. При этом, если z е Uo и Zk~+z при k~> оо, то xz& (t) -> xz (/) равномерно на То.	п
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
67
Доказательство. Выберем интервал Т и открытое множество U czRn так, чтобы Т X V cz V, to е Г, хо е U, отображение ф было ограничено на Т X U суммируемой функцией r(t) и удовлетворяло условию Липшица по х (с некоторой константой fc>0). Пусть число б таково, что замкнутый шар радиуса 26 с центром в точке хо принадлежит множеству U\ обозначим через Uo шар радиуса 6 с центром в точке хо. Выберем далее число е > 0 так, чтобы	/в+в	t.
efe<l, j r(/)rf/<6, j r(t)dt<6
tfi	t^—B
и положим To = ki, ti}* где to — e < ti < tQ< t2 < to + e, кь /2] <= T. Множества To и Uo — искомые. Действительно, рассмотрим в пространстве СП(ТО) множество
X = {х (•) е= Сп (То) 11 х (0 - хо | < 26, у/ е= То}.
Это — замкнутое подмножество пространства СП(ТО), т. е. оно само является полным метрическим пространством относительно расстояния р(х(«), //(•))= II *(-)—£/(-) 11с-
Зафиксируем z е Uo и рассмотрим отображение Pz, ставящее в соответствие каждому элементу х(-)еХ вектор-функцию
t
У (0 = [Ргх (•)] (0 = Z + | <р (т, X (т)) rfr. t.
Тогда при t е То
I \PzX (•)] (0 — z I = | ф (т, X (т)) dx <
t
t
Далее, если xi (•) е X
т. е. Р2 отображает множество X в себя, и х2 {•) G то
Р (PzXi (•), Ргх2 (•)) = max
t
j (ф (т, Xi (t)) — Ф (t, x2 (t))) dx <
t
max I k | Xi (r) — x2 (r) | dx efcp (xi (•), x2 (•)), t^T, /
т. e. отображение Pz — сжимающее. Согласно принципу сжимающих отображений существует единственная вектор-функция xz (•) е X такая, что
т- е. такая, что
существует
PzXz ( • ) == Xz ( • ).
t
Xz (0 = Z + J Ф (т, хг (t)) dx.
Первое утверждение теоремы доказано.
3*
68
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Предположим теперь, что z^ е Uo и z2 е UQ. Тогда по доказанному х2 (0 и xZi (0 определены на То и принимают значения в U. Имеем
р (xzi (’ )• хгг (‘)) Р (?zxxzx (’ )* ?z2xz2 (•))“" t
=	2[ - z2 + J (<р (r, xZi (т)) - <р (т,
хг2 W)) dT
т. е.
<| zl-z2\+ekp(xZi(.), xZ!(-)).

Поскольку zk < 1, отсюда следует второе утверждение. Теорема доказана.
Следствие. Пусть выполнены условия теоремы и Xi(t), x2(t)—dea решения уравнения (1), определенные на одном и том же отрезке [/о, 6]. Тогда, если хотя бы в одной точке этого отрезка xx(t) = x2(t), то xx(i) = х2(0 во всех точках отрезка [6, 61-
Доказательство. Достаточно проверить, что множество Д тех точек из [6,6], в которых %i(/)= x2(t), открыто и замкнуто в [6,6]. Замкнутость множества Д очевидна. Если же те Д, то в силу теоремы xi(t)—x2(t) в некоторой окрестности точки т, т. е. Д открыто в [6, 6], что и завершает доказательство.
Зафиксируем точку (т, z) е V и рассмотрим множество всех пар (Д,*(•)), где Д — некоторый интервал, содержащий точку т, a x(t)—решение уравнения (1), определенное на Д и такое, что х(т)=г. В силу теоремы 3 множество таких пар не пусто (если, конечно, отображение ф удовлетворяет наложенным в теореме условиям), а согласно следствию всякие две такие пары обладают тем свойством, что Xi(t) = x2(t) на пересечении Д1Л Дг (которое содержит точку т и, следовательно, не пусто). Обозначим через Т(т, z) объединение интервалов Д, входящих во все такие пары. Тогда на T(t,z) определена вектор-функция t x(t; t,z), обладающая тем свойством, что для всякой пары (Д,*(•)) ограничение век-тор-функции х(-;т,z) на Д совпадает с х(-). Поскольку каждая точка t е Т(т, г) содержится хотя бы в одном таком Д, вектор-функция /~>х(/;т, z) есть решение уравнения (1). Она называется максимальным решением уравнения (1) с начальным условием Х(т)= Z.
Для максимальных решений, как и в линейном случае, справедлива очевидная формула
х (t\ т, х (т; s, г)) — х (/; s, z).	(9)
Зафиксируем некоторый отрезок [6, 6] и положим
А = {z е R" | [6, 6] с Г (6, г)}.
Тогда на множестве А (если оно не пусто) определено отображение F: А -> Сп ([6,6]), ставящее в соответствие каждому z^A ограничение максимального решения х(-;6,z) на [6,6].	"
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
69
Теорема 4 (глобальная теорема существования и непрерывности). Пусть выполнены условия теоремы 3 и множество А не писто. Тогда оно открыто и отображение F непрерывно на А.
Доказательство. Пусть г s Л и последовательность {zs} сходится к z. Для доказательства теоремы нужно проверить, что, с одной стороны, отрезок [/0, ^i] принадлежит множеству T(tQ, zs), если $ достаточно велико, и с другой, что при s -> оо последовательность вектор-функций x(t\ /о, z&)_ равномерно сходится к х(/; to, z) на [/о, М. Обозначим через т верхнюю грань тех те R, для каждого из которых существует такой номер s(t), что [/0, т] cz Т(t0, zs) при s>s(t) _h x(t\ to, zs)-> x(t\ to, z) равномерно на [/о, т]. В силу теоремы 3 f > to. Для доказательства теоремы достаточно проверить, что f > ti.
Предположим, что f С /ь Тогда точка (т, х (т, t0, z)) содержится в V. По теореме 3 существует такое е > 0, что [f — е, f + е] cz cz Т (т, у) при всех т и у, удовлетворяющих неравенству | т — т |	8
и | у — т № to, z) | < е. По определению числа т найдется такое т, что т — 8 < т т, Ro, т] cz Т (to, zs) при всех s, больших некоторого s (т), и х (t; tQ, zs) -> х (t; to, z) равномерно на [f0, т]. Поэтому можно указать номер Sj такой, чтобы неравенство
|х(/; tQ, zs) — x(t-, to, z) [ < 8
выполнялось для всех s>s0 и t e [f, т]. Но в этом случае в силу выбора т, т и е решения х (/; т, х (т; tQ, zs)) определены на отрезке [т —8, т-|-8] при s^so и сходятся на этом отрезке равномерно к х (t; т, х (т; t0, z)). Однако в силу (9)
х (/; т, х (т; t3, zs)) = х (/; 10, zs).
Мы получили таким образом, что при s s0 максимальные решения x(t;_to,za) определены, по крайней мере,_ на [f0, т-j-s] (т. е. [/о,т-f- е] cz T(tQ, z&)) и сходятся на [/о.^+ е] равномерно к x(t; t0,z). Полученный результат, однако, противоречит определению т, Теорема доказана.
Теорема 5. Пусть выполнены условия теоремы 4 и z0 & А. Обозначим через xQ(t) ограничение максимального решения x(t',to,Zo) на [/о, ^i] и предположим, что отображение х-хр(/, х) непрерывно дифференцируемо во всех точках некоторой окрестности графика вектор-функции Xo(t). Тогда отображение F дифференцируемо по Фреше в точке z0(«) и для всякого z(=Rn вектор-функция [F'(z0)z](t) = y(t-, to, z) есть решение линейного дифференциального уравнения
У = Чх (Ь *о (0) У
с начальными условиями
У (to) = z.
Докажем сначала один вспомогательный результат.
•Лемма 2. Пусть V — область в RXRn w отображение <р: V -> Rn удовлетворяет условиям, указанным в теореме 3. Пусть далее вектор-функция x(t) определена и непрерывна на некотором отрезке Т и ее график принадлежит области V. Тогда в
70
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
некоторой окрестности графика вектор-функции x(t) отображение ф ограничено суммируемой функцией и удовлетворяет условию Липшица по х.
Доказательство. Пусть т е Т. Тогда по определению существует такой интервал Д(т), содержащий точку т, и такая окрестность L/(z)c:Rn точки х(т), что Д(т) X U(т)cz V, отображение ф ограничено на Д(т)Х^(т) суммируемой функцией r(t\x) и удовлетворяет условию Липшица с константой k(x). Обозначим через G график вектор-функции х(/). Тогда G — компактное подмножество области V и
ос (J (д(Т)хг/(т)).
% е Т
Поэтому можно выбрать конечное число точек Tj....тт из Т
так, чтобы
m
Gc=U(A(^)XI/(t/)).
i=l
Положим, далее, 31 = {z11 е Д (tJ),
W = {(/, х) е= V 11 е= Т, х €= U (rz), v i k = max {k (ti).........k (rm)},
r (/) = max {r (f; Tf) | i e Sf }.
Тогда W — окрестность множества G, 0 < k < оо, и функция r(t) суммируема на T. Если (/, х)е W, то /еД(тг), x^U(Xi) при некотором i и, значит,
I <Р (t X) К г (/; rz) < г (/).
т. е. отображение ф ограничено на W суммируемой функцией r(t). С другой стороны, если (t,x)&W и (^x')eW7, то точки х и х' принадлежат всем множествам U(Ti) с теми номерами t, при которых /еД(т»). Поэтому
IФ (Л х) — ф (Л х') К k (т,) |х — x'K^|x — х'|,
т. е. отображение ф удовлетворяет на множестве W условию Липшица по х с константой k. Лемма доказана.
Доказательство теоремы 5. В силу леммы мы можем выбрать числа е > 0, k > 0 и суммируемую на [^о, 6] функцию r(t) так, чтобы из t е [/0, |х — x0(f) | < е, |х' — хо(О1<® вытекали бы неравенства
IФ (Л х) — ф (/, х') |< k | х — х' |,
|ф(Л *)|<г(0.
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
71
Первое из этих неравенств приводит, в частности, к тому, что |фх (t х) К k
при всех таких t и х. Поэтому (см. пример 9 в § 0.2) отображение t
х (•) -> [й(х( •))] (0 = | ф (т, х (т)) dx
*0
дифференцируемо по Фреше в малой окрестности точки Хо(-) (в пространстве Cn([/o, h])) и его производная непрерывна и определяется формулой
[Л' (*(•)) И • )1 (0 = J Фх (*• х (*)) У wdT-
Рассмотрим отображение
G: 1ГХС»([<о,М)->С’([4». М).
определенное следующим образом:
[G (г, х (•))](/)=	{
= X (0 — z — j ф (т, X (т)) dx = X (t) — г — [ft (х {•))] (0 t,
По доказанному это отображение непрерывно дифференцируемо по х(-) в малой окрестности точки *о(-) и
t
[Gx(.) (2> X (•)) у (•)] (О = у (о — J Фх (т, X (т)) у (г) dx.
tl
Далее, G(zo, х0(’)) = 0 и в силу леммы 1 оператор Gx^ (zQ, осуществляет взаимно однозначное и непрерывное (и, следовательно, по теореме Банаха — гомеоморфное) отображение пространства Сп([/о,М) на себя. По теореме о неявной функции в малой окрестности точки Zq определено отображение z->x2(«) в Cn([t0, ^]) такое, что х2л (•) = х0 (•), G (z, хг (•)) = 0. Это отображение дифференцируемо по Фреше и его производная есть линейный оператор, ставящий в соответствие каждому zg Rn вектор-функцию
У (•) = Gx (zq9 х0 (•))	(z0,	(•)) z] = — Gx 0 (z0> Xq (•)) z (•)
(10) где z (0 s z.
Условие G (z, xz (•)) = 0 означает, что
t
Xz(t)==z + J ф (r, xz (t)) dx,
72
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
т. е. что х2(/) = х(/;/о, z). Отсюда следует дифференцируемость отображения F в точке zQ. С другой стороны, равенство (10) можно переписать в виде
°х(-)(20- *0(-)) '/(•)=2(-)-
или
t
У (0 — J Фх (Т, х0 (т)) у (т) dr = z (t) = г.
Но последнее соотношение как раз и означает, что y(t)	z)\
Теорема доказана.
Комментарий ко введению. Литература по теории # экстремальных задач огромна. Наш список не претендует на полноту/В нем собраны наиболее известные монографии, учебники и обзорные статьи, а также некоторые работы, непосредственно связанные с излагаемыми в книге вопросами.
Упомянем сначала несколько работ, посвященных осмысливанию с общих позиций принципа максимума Понтрягина, в которых развиваются общие концепции теории экстремальных задач и которые в наибольшей степени повлияли на отбор и характер материала в книге: Гамкрелидзе и Харатишвили [1]—[3], Гирсанов [1], Дубовицкий и Милютин [1]—[4], Нойштадт [2], Пшеничный [4], Рокафеллар [5], [6], [9], [14], Халкин [4], Хестенс [3].
Для ознакомления с темами, оставшимися за пределами книги, отсылаем читателя к монографиям Варги [4], Экланда и Темама [1] (расширения и скользящие режимы), Габасова и Кирилловой [1] (особые режимы), Моисеева [1], Пшеничного и Данилина [1], Cea [1] (численные методы).
К § 0.1. Материал параграфа изложен во многих учебниках и монографиях: Дапфорд и Шварц [1], Колмогоров и Фомин [1], Лю-стерник и Соболев [1] и др.
К § 0.2. Более подробно о дифференциальном исчислении см. в книгах: Дьедонне [1], Картан [1], Люстерник и Соболев [1], Шварц [1]. Обзор современного состояния предмета см. в статье Авербуха и Смолянова [1]. Теорема Люстерника доказана в работе Люстерника [1]. Наше доказательство — обработка доказательства, изложенного в книге Люстерника и Соболева [1]. О сжимающих многозначных отображениях см. Надлер [1].
К § 0.3. Выпуклый анализ комментируется в конце гл. 4.
К § 0.4. Подробнее о дифференциальных уравнениях см. в книгах: Картан [1], Коддингтон и Левинсон [1], Сансоне [1] и в статье Филиппова [2].
Глава 1
НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
В этой главе доказываются необходимые условия экстремума для трех основных классов экстремальных задач. Мы увидим, что они формулируются в полном соответствии с высказанным во введении принципом Лагранжа. Материал этой главы опирается на §§ 0.2 и 0.3.
§ 1.1. Постановки задач и формулировки основных теорем
1.1.1. Гладкие задачи с ограничениями типа равенств. Правило множителей Лагранжа. Пусть Хи Y — банаховы пространства, f — функция на X и F: X -> Y — отображение X в Y. Рассмотрим задачу
f(x)->inf;	(1)
F(x) = 0.	(2)
Соотношения вида (2) называются ограничениями типа равенств. Задачи вида (1), (2) мы будем называть гладкими задачами с ограничениями типа равенств, если функция f и отображение F удовлетворяют некоторым требованиям гладкости.
Составим функцию Лагранжа задачи (1), (2):	;
^(х, Хо, /) = W(x) + {/, F(x)>,
где Xo^R, у*еУ*. Величины Хо и у* мы называем множителями Лагранжа.
Теорема 1 (правило множителей Лагранжа). Пусть функция f и отображение F дифференцируемы по Фреше в точке х*, где F(x*)= 0, и образ пространства X при отображении х F'(х*)х замкнут. Тогда, если х*— точка локального минимума в задаче (1), (2), то найдутся такие не равные одновременно нулю множители Лагранжа Хо и у\ что
(х„ Ло, у*) = Xof' (xj + F* (хJ у* = 0.	(3)
74
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Если же отображение F принадлежит классу Ci в точке х* и является регулярным отображением в этой точке, то Хо #= 0 и можно считать, что Хо = 1.
Уравнение (3) будем называть уравнением Эйлера— Лагранжа задачи (1), (2). Оно означает, что точка х* является стационарной точкой функции Лагранжа. Таким образом, теорема 1 утверждает, что необходимое условие локального экстремума в задаче (1), (2) при некоторОхМ выборе множителей Лагранжа совпадает с необходимым условием безусловного минимума по х функции Лагранжа. Итак, для задачи (1), (2) верен принцип Лагранжа.
Пусть имеет место регулярный случай. Условие (2) и уравнение (3) означают тогда, что решение задачи х* и множитель Лагранжа у* удовлетворяют следующей системе уравнений:
<?х = 0, JZ> = 0.
Таким образом, здесь правило множителей Лагранжа утверждает, что выполнено условие стационарности функции Лагранжа по совокупности переменных (х, у*), ибо в регулярном случае множитель Лагранжа Хо равен единице. Если оба пространства X и Y конечномерны, скажем, X = Rm, Y = Rn, то написанная выше система есть система уравнений с /п + п неизвестными. Такая система имеет, вообще говоря, лишь изолированные решения. Это последнее обстоятельство и составляет алгоритмическую суть правила множителей Лагранжа.
Отметим два специальных случая задачи (1), (2). Пусть пространство Y конечномерно. Тогда, как легко понять, задача может быть записана в такой форме:
f0(x)->inf;	(4)
Ш = 0, .... fn(x) = O.	(5)
Множители Лагранжа в этом случае суть числа Хо, Xi, ..., Хп, так что функция Лагранжа здесь имеет вид
S(x, х0,.... Ч)=2Ш
/==0
5 1.1. ПОСТАНОВКИ ЗАДАЧ
75
Следствие 1. Пусть функции f0, ..., fn принадлежат классу Ci в точке х*, удовлетворяющей условиям (5). Тогда если точка х* есть точка локального минимума в задаче (4), (5), то найдутся такие не равные одновременно нулю числа Ко, .... Ап, что
v;w+  +««-»•
Если же, кроме того, функционалы П(х), • ••> линейно независимы, то Хо #= О и можно считать, что Хо = 1-
Доказательство этого утверждения немедленно следует из теоремы, поскольку всякое подпространство конечномерного пространства замкнуто и, как уже отмечалось в примере 13 из § 0.2, условие регулярности отображения х—» (fi(x),	/п(я)) означает просто
линейную независимость функционалов f'x, f'.
Другой специальный случай возникает, когда отображение F распадается на регулярное отображение в некоторое банахово пространство и отображение в Rn, т. е. когда задачу можно записать в таком виде:
f0 (х) -> inf;	(6)
F(x) = Q,	(7)
Л(х) = 0, .... Mx) = 0.	(8)
Следствие 2. Пусть функции fo, ..., fn и ото-
бражение F принадлежат классу в точке х*, удовлетворяющей равенствам (7), (8). Предположим, кроме того, что отображение F регулярно в точке х*. Тогда, если точка х* есть точка локального минимума в задаче (6) — (8), то найдутся такие не равные одновременно нулю числа Хо, ..., Хп и вектор у*, что
Ш*.)+  +».№.)+ Н*.)/»0-
Следствие 2 тоже немедленно вытекает из теоремы 1, если принять во внимание, что всякое подпространство банахова пространства, имеющее конечную коразмерность, замкнуто.
76
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
1.1.2. Выпуклые задачи. Теорема Куна — Таккера. Пусть X — линейное пространство, fo, .... fn — конечные функции на X и А — подмножество пространства X. Рассмотрим задачу
fo (х) -► inf;	(9)
AW<0--------fn(x)<0,	(Ю)
хеЛ.	(11)
Соотношения (10) называются ограничениями типа неравенств. (Соотношение (11) не имеет функционального характера, хотя и может быть записано в функциональной форме, скажем, в виде неравенства б(х|Л)^0.) Если функции f0, ..., fn и множество А выпуклы, то задачу (9) — (11) называют задачей выпуклого программирования.
Из-за того, что ограничения в нашей задаче разделены на две группы — ограничения типа неравенств и ограничения (11), мы можем по-разному составлять функцию Лагранжа задачи (9) — (11). Главным образом, мы будем иметь дело с функцией Лагранжа, в которую не включены ограничения (11):
п
S£ (X, Ло, . . .,	W*
z=o
Однако можно рассмотреть и «удлиненную» функцию Лагранжа
3? 1	Ао, • • • 9 Атг) = 2	(х) + б (х | -Д).
/=1
Условия экстремума в задачах выпуклого программирования можно записывать в двух почти эквивалентных формах: в нелокальной форме (см. ниже теорему Куна — Таккера) и в локальной форме, с помощью субдифференциалов. Это связано с тем фактом, что в таких задачах всякий локальный экстремум является и абсолютным.
Теорема 2 (теорема Куна — Таккера). Пусть функции f0, ..., fn и множество А выпуклы. Предположим, что вектор х* удовлетворяет ограничениям (10), (11). Тогда, если х*— решение задачи (9) — (11), то существуют такие не равные одновременно нулю мно
§ Lt. ПОСТАНОВКИ ЗАДАЧ
77
жители Лагранжа Zo 0, ..., Кп 0, что
2! (**, ^о> • • •> М = min 2 (х, Ло, ..Л„)	(12)
х е= А
= 0 пРи *=1» •••» п. (13)
Если же, кроме того, существует такой вектор хе Д что fi(x) <Z 0 при всех i = 1, ..., п {условие Слейтера), то Ко 0 и можно считать, что Ко — 1. В последнем случае соотношения (12), (13) достаточны для того, чтобы точка х*, удовлетворяющая условиям (10), (11), была решением задачи (9) — (11).
Соотношение (12) называется условием Куна — Так-кера, а равенства (13) — условиями дополняющей не-жесткости. Условие Куна — Таккера показывает, что для задач выпуклого программирования принцип Лагранжа справедлив даже в усиленной форме: функция Лагранжа достигает в точке х* абсолютного минимума при ограничениях, не включенных в эту функцию. Смысл условий дополняющей нежесткости в том, что отличны от нуля лишь те множители Лагранжа, которые соответствуют ограничениям, существенным в данной точке х*, т. е. таким, которые в этой точке обращаются в равенства.
Теорема 2' (субдифференциальная форма условий экстремума в выпуклом программировании). Пусть X — отделимое локально выпуклое пространство и все функции fo, ..., fn непрерывны в некоторой точке множества А (хотя они могут и не быть всюду конечными) < Пусть далее точка х* удовлетворяет условиям (10) —• (11). Если х*— решение задачи (9) — (11), то найдутся такие не равные одновременно нулю множители Лагранжа Ко 0, ..., Кп 0, что
Oe=KQdfo(xJ + ... +Wfn(xJ + tf(xJX), (12') Wi W =	* = 1, • • •» я,
где Af(x*|4) — д6(х*|Л) —нормальный конус к множеству А в точке х*. Если, кроме того, выполнено условие Слейтера, то Zo #= 0 и можно считать, что Zo= 1. В последнем случае написанные соотношения не только необходимы, но и достаточны для того, чтобы вектор хф был решением задачщ
78	гл. I. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Соотношение (12') мы также будем называть уравнением Эйлера — Лагранжа. Оно означает, что Ое ^.dxS\ и может рассматриваться как естественное распространение уравнения Эйлера — Лагранжа (3) на выпуклые задачи.
В гладком случае, когда все функции f0, ..., fn дифференцируемы, X = Rra и выполнено условие Слейтера, уравнение Эйлера — Лагранжа совместно с условиями дополняющей нежесткости образуют систему из т + п уравнений с m + п неизвестными, т. е. мы снова приходим к замкнутой системе, где число уравнений совпадает с числом неизвестных. Этот факт отражает алгоритмическую сущность теоремы Куна — Таккера.
В конце параграфа мы снова вернемся к задачам выпуклого программирования и сформулируем теорему Куна — Таккера в форме теоремы о седловой точке, которая позволит взглянуть с новых позиций и на сам принцип Лагранжа.
1.1.3. Гладко-выпуклые задачи. Экстремальный принцип в гладко-выпуклых задачах. Пусть X и У — банаховы пространства, U — произвольное множество, fo, .... fn — функции на X X U и F: Х\ U —► У — отображение произведения X X в У. Рассмотрим задачу
f0(x, м)—> inf;
F (х, и) = О,
(14)
(15)
Л(х, «)<0, .... fn(x, м)<0,	(16)
и е U.
(17)
Задачи такого типа мы будем называть гладко-выпуклыми, если функции fo, ..., fn и отображение F удовлетворяют некоторым условиям гладкости по х и выпуклости по и, точно формулируемым ниже.
Нас будут интересовать необходимые условия локального минимума в задаче (14) — (17). Однако в данном случае содержание термина «локальный минимум» требует уточнения, поскольку множество U не предполагается топологизированным. Мы скажем, что пара (х«, «*), удовлетворяющая ограничениям (15) — (17), есть точка локального минимума в задаче (14) — (17), если для всякого х из некоторой окрестности тоЧ
§ 1.1. ПОСТАНОВКИ ЗАДАЧ
79
ки х* и всякого и из U, удовлетворяющих тем же ограничениям, выполняется неравенство
fo(x„ u,)^f(x, и).
Рассмотрим, как и в предыдущих случаях, функцию Лагранжа задачи (14) — (17), включив в нее только функциональные ограничения:
S (х, и, к0,	А„, у*) = 2 Ufi (х, и) + </, F (х, и)),
t=0
где, как обычно, Ао, .... Ап — действительные числа, а у* е У*.
Теорема 3 (экстремальный принцип в гладковыпуклых задачах). Пусть точка (х#, uj удовлетворяет условиям (15) — (17). Предположим далее, что точка х» обладает такой окрестностью V с X, что
а)	при всяком u^U отображение x-+F(x,u) и функции х —► fi(x,u), i = 0...п, принадлежат клас-
су Ci в точке х*;
б)	при всяком хеУ отображение u-*F(x,u) и функции u-*fi(x, и), i = 0, ..., п, удовлетворяют следующему условию выпуклости-, для всяких «1 е U, и2еИ и	найдется такое и е U, что
F (х, и) = aF (х, «]) + (! — a) F (х, и2), ft (х, и) afi (х, щ) + (1 — а) fi (х, и2), i — 0, ..., п.
Допустим, кроме того, что
в)	множество значений линейного оператора Fx{x*,u*}-. X -> У имеет конечную коразмерность в У.
Тогда, если (x*,ut) — точка локального минимума в задаче (14) — (17), то найдутся такие не равные одновременно нулю множители Лагранжа Ао 0, ... ..., Ап 0, у* <= У*, что
X (Х,, Ut, Ад, . . . , А„, у ) = hjfix (х,, И.) -J-i=0
+ Fx(x„ ut)y- = 0, (18)
^(x., и,, Ao, ...» A„, y*) = min Z (x„ u, Ao, .... A„, /), (19)
AJi(x,, иж) = 0 при i=\,...,n.	(20)
Если же в дополнение к сформулированным условиям
80
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
г)	образ множества X X U при отображении (х, u)^Fx(x*, U,)x + F(x„ и)
содержит окрестность нуля в Y и существует точка (х, и) такая, что
Рх (*., «.) X + F(х„ и) = 0, {fix (х„ и,), х) + ft (xt, ы) < О при всех I, при которых fi(x*, и*) = 0, то Хо =# 0 и можно считать, что Хо = 1.
Соотношения (18) и (19) мы будем называть соответственно уравнением Эйлера — Лагранжа и условием Куна — Таккера, а равенства (20) суть не что иное, как условия дополняющей нежесткости. Уравнение Эйлера — Лагранжа, как и в случае гладких задач, означает, что в точке х* функция Лагранжа удовлетворяет необходимым условиям минимума по х, а условие Куна — Таккера, как и в случае выпуклых задач, означает, что функция Лагранжа достигает минимума по и в точке а*. Таким образом, согласно теореме 3, принцип Лагранжа применим к гладко-выпуклым задачам,^. е. необходимые условия минимума в задаче (14) — (17) совпадают с необходимыми условиями минимума функции Лагранжа при единственном не включенном в эту функцию ограничении u<=U.
Условие в) теоремы 3 выполняется, в частности, когда отображение F распадается на отображение Fi: X X -* У1 (где — некоторое банахово пространство) и отображение в Rw так, что отображение x->Fi(x, п*) регулярно. Таким образом, справедливо утверждение:
Следствие. Предположим, что в задаче (14) —> (17) условие F(x,u)=0 записывается следующим об* разом:
Fj (х, и) = 0,
/гг (х, и) = 0, ..., hm (х, и) = 0,
где Fc X \ U -> Уь У! — банахово пространство и hi, ..., hm — действительные функции на X X U. Предположим далее, что условие в) в формулировке теоремы заменяется следующим:
§ 1.1. ПОСТАНОВКИ ЗАДАЧ
81
в') отображение х—►7ч(х, и*) регулярно в точке х*. Тогда, если выполнены остальные условия теоремы, то ее утверждение остается в силе.
1.1.4. Замечания и обсуждения. Каждая из трех сформулированных теорем распадается на две части: первую — общую и вторую — содержащую условия регулярности, выполнение которых обеспечивает неравенство коэффициента Хо нулю. Случай Хо = 0, вообще говоря, неинтересен, поскольку при этом необходимые условия никак не связаны с минимизируемым функционалом и определяют только некоторую экстремальную структуру ограничений. Тем не менее применять теоремы удобнее в общей форме. Во-первых, зачастую Хо ¥= 0, даже если не выполнены условия регулярности. Во-вторых, что особенно важно, прямая проверка неравенства Хо =# О во многих случаях проще проверки соответствующих условий регулярности.
Равенство или неравенство коэффициента Хо нулю зависит, в частности, от того, какие ограничения включены в функцию Лагранжа, а какие оставлены за ее пределами. Это лучше всего проследить на примере задачи выпуклого программирования. В функцию Лагранжа этой задачи мы не включили ограничение хеЛ. Выше отмечалось, что это ограничение можно задать функционально, например, так: А = {x|fn+i (х)< 0}. Однако здесь возможна такая ситуация, когда не существует ни одной точки х такой, что fi(x)<0 для всех i = 1, ..., п + 1. Если бы в этом случае мы включили ограничение fn+i(x)^0 в функцию Лагранжа, то условие Слейтера было бы нарушено и нельзя было бы гарантировать неравенство коэффициента Хо нулю. Итак, стремление обеспечить неравенство коэффициента Хо нулю побуждает отбирать ограничения, включаемые в функцию Лагранжа, так, чтобы условия регулярности не нарушались. Однако, с другой стороны, чем больше ограничений включено в функцию Лагранжа, тем эффективней соответствующее необходимое условие минимума.
Заметим, кстати, что из теоремы 2 следует простое правило определения знаков множителей Лагранжа, соответствующих ограничениям типа неравенства. В задаче на минимум их следует выбирать так, чтобы
82
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
функция Лагранжа стала выпуклой по х. (Это замечание надо иметь в виду, поскольку в выпуклых задачах | часто встречаются ограничения вида g(x)^0, где g— вогнутая функция.) Конечно, в задачах на максимум J знаки множителей Лагранжа должны быть такими, что- ' бы функция Лагранжа была вогнутой. В невыпуклых i задачах знаки надо выбирать такими, как будто задача — выпуклая, и т. д.
Нетрудно видеть, что классы задач, охватываемых ! теоремами 1 и 2, не пересекаются и, наоборот, теорема • 3, по существу, содержит в себе теоремы 1 и 2, хотя и j не охватывает их целиком. В самом деле, если в уело- j виях теоремы 3 множество U состоит из единственного | элемента, а ограничения f\(x, п)^0, ..., fn(x, и) <5 О J отсутствуют, то мы получаем утверждение, аналогичное 1 теореме 1, но с дополнительным требованием конечной | коразмерности. Наоборот, если отсутствует ограничение .1 F(x,u)=0, U есть выпуклое подмножество линейного 1 пространства и функции fo, ..., fn не зависят от х и I выпуклы по и, то из теоремы 3 следуют все утвержде- I ния теоремы 2, за исключением, конечно, достаточности. I
С помощью теоремы 3 можно получить и некоторые | обобщения теорем 1 и 2. Рассмотрим такую задачу:	1
f0(x)—>inf;
F(x) = Q, fiW<0, .... f„(x)<0, х<^ А,
(21)
(22)
(23)
(24)
где, как обычно, F: X —* Y, fo, .... fn — функции на X, : A cz X и У — банахово пространство.	;
Теорема 4. Пусть X — банахово пространство и ] А = X. Предположим, что отображение F и функции < fo, ..., fn непрерывны и дифференцируемы по Фреше в J некоторой окрестности точки х*, удовлетворяющей уело- 1 виям (22) — (24), причем производная F'(x) отображе- 1 ния F непрерывна в точке х*. Допустим, наконец, что | образ пространства X при отображении x-*F'(x*)x 1 замкнут. Тогда, если х»— точка локального минимума | в задаче (21)— (24), то существуют не равные одно- | временно нулю множители Лагранжа Хо^.0,	< 1
§ 1.1. ПОСТАНОВКИ ЗАДАЧ
83
..., Хп 0 и у* g Р такие, что
..../)=2м:(\)+';'’(\)/=о.
(х.) — О» i = 1. • • •. п.
Если же, кроме того, отображение F регулярно в точке xt и существует такой вектор х е X, что
F' (xj х — 0, f' (xj х < О
для тех индексов i = 1, ..., п, при которых fi(x^) = О, то Хо 0 и можно без ограничения общности считать, что Хо = 1.
Точно так же с помощью теоремы 3 можно получить следующее обобщение теоремы 2.
Те о р е м а 5. Пусть в задаче (21) — (24)< X — линейное пространство, fa, ...» fn — выпуклые функции на X, F — аффинное отображение (г. е. F (х) = #о + Ах, где y0<=Y, а Л: Х->У— линейный оператор) и А — выпуклое множество. Тогда, если х* — решение задачи (21) — (24), то существуют не равные одновременно нулю множители Лагранжа Хо О.............Хп 0 и
у* е У* такие, что
п
& (х., Хо.....х„, у*) = 2	(х.) 4- </, F (х.)) =
i=i
= min Z (x, Xo....Xn, y')\
x e A
Xifi (xj = 0,	1=1, ...» n.
Если же, кроме того, образ множества А при отображении x-+F(x) содержит окрестность нуля пространства Y и существует такой вектор х е А, что
F(x) = 0, fi(x)<0,	i=\,...,n,
то Хо 0 и можно считать, что Хо = 1. В последнем случае написанные выше соотношения достаточны для того, чтобы точка х*, удовлетворяющая условиям (22) — (24), была решением задачи (21) — (24).
При формулировке теорем 1—3 мы всякий раз обращали внимание на то, что основные соотношения в этих теоремах находятся ЬJ Соответствии с принципом Лагранжа. Согласно этому принципу
84
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
при подходящем выборе множителей Лагранжа решение задачи с ограничениями удовлетворяет условиям стационарности (или минимальности при наличии выпуклой структуры) в задаче
без ограничений или при ограничениях, не включенных в функцию Лагранжа. Однако в теоремах фигурируют и другие условия, характеризующие множители Лагранжа. Это — условия неотрицательности множителей Лагранжа, соответствующих ограничениям типа неравенства, и условия дополняющей нежесткости. На самом деле и эти условия, как и условия, которые выводились из принципа Лагранжа, носят экстремальный характер и могут быть получены из другого, более общего экстремального принципа.
Для иллюстрации рассмотрим следующую задачу. Пусть X и У— банаховы пространства, fo— функция на X, дифференцируемая в окрестности точки х*, Ф: X -> Y — отображение, тоже дифференцируемое по Фреше в окрестности точки х*, и U — выпуклое подмножество пространства У. Тогда можно сформулировать такую задачу;
/0 (х) -> inf;	(25)
Ф (х) е U.	(26)
Эту задачу можно рассматривать как некоторое обобщение гладкой задачи из п. 1.1.1. С другой стороны, она легко сводится к гладковыпуклой задаче, если положить
F (х, и) = ф (х) — и,
а условие Ф(х)е U переписать в виде
F (х, м)=0,	(27)
и е U.	(28)
Допустим, что в получившейся гладко-выпуклой задаче выполнены все условия теоремы 3 (в точке х*). Введем функцию
(х, У*) = h fo (х) + {У*. Ф (х)) - s (/ | U),
где s(-1U)—опорная функция множества U, определенная в § 0.3. Покажем, что утверждения теоремы 3 для получившейся задачи равносильны следующей теореме.
Теорема о седловой точке. Для того чтобы х* была точкой локального минимума в задаче (25), (26), необходимо существование таких не равных одновременно нулю числа Хо 0 и вектора у* е У*, что
^х(*..у’) = Мо(х.) + ф'*(\)^ = 0-	(29)
& (х*. У*) = max S (хф, г*).	(30)
г*еУ*
Выведем из сформулированной теоремы результат теоремы 3 для задачи (25), (27), (28) (обратный вывод совсем прост). Сдбт^
§ 1.2. ГЛАДКИЕ ЗАДАЧИ
85
ношение (29) эквивалентно равенству (18) в теореме 3. Далее, поскольку Ф(х-)е[7, из определения опорной функции следует, что
{у*, Ф (ж.)) < sup (</’• «) = S (у* I U), u<=U
т. е. <//*» Ф (**)) — 5 (У* I < О- С другой стороны, (О, Ф (х,)) — з (0| £/) =0.
Поэтому
0 < max «г*. Ф (х.)> - з (г* | U)) = (у*. Ф (х.)> - з {у* | U) < 0, 2*
откуда
{у*. Ф(Х.))=3(У*|17).
Полученный результат означает, что inf (/,—«) = — sup (у',и) = u^U	u^U
= — s(y* \и) = (у*, - Ф (х j) = (у'о, - и),
и мы сразу получаем соотношение (19) из теоремы 3.
Совершенно аналогичным образом можно записать и теорему Куна — Таккера. Для этого, обозначив через R1 множество векторов из Rn с неположительными компонентами, введем функцию
$ (X, Ао, Л) = Vo (х) + 2	(х) + 6 (X | А) - з (Л | R1),
Z=1
где X = (Xi, ..., Хп). Предоставляем читателю проверить, что теорема 2 равносильна следующей теореме.
Теорема Куна — Таккера о седловой точке. Пусть выполнены условия теоремы 2, включая условие Слейтера. Для того чтобы вектор х* был решением задачи (9) —(11), необходимо существование таких не равных одновременно нулю числа Хо 0 и вектора X е Rn, что
min & (х, Хо, X) = % (х*, Хэ, X) == max 3>	х0, р).
ne=R"
§ 1.2. Гладкие задачи.
Правило множителей Лагранжа
Сформулированное в предыдущем параграфе правило множителей Лагранжа содержит условие локального экстремума. Поэтому его доказательство строится на использовании метода вариаций. Элементарный характер ограничений в гладких задачах позволяет
86
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
ограничиться простейшими вариациями — вариациями по направлениям.
1.2.1. Задачи без ограничений. Пусть X — линейное топологическое пространство и f — функция на X. Рассмотрим сначала задачу без ограничений, т. е. задачу о безусловном минимуме этой функции:
f(x)->inf.	(1)
Предложение 1. Пусть в точке х* определена первая вариация Sf(x*,h) функции f. Тогда, если х* — точка локального минимума функции f, то
bf(x„ й) = 0
для всех h X.
Доказательство. Зафиксируем h е X и положим <р(0 — f(х, + th). Если х, — точка локального минимума функции f, то t — 0 — точка локального минимума функции <р и, следовательно,
О = Ф' (0) = lim t~' [f (х. + th) - f (х.)] = df (х„ h).
<->о
Следствие. Пусть X — банахово пространство. Предположим, что функция f дифференцируема по Фреше в точке х*. Тогда, если х* — точка локального минимума функции f, то
f'(x,) = O.
Те точки, в которых первая вариация или производная функции f обращаются в нуль, называются стационарными точками функции f, а уравнение
f' (х) = 0 или 6f (х, h) = 0, VA
— условием стационарности. Таким образом, условие стационарности есть необходимое условие минимума в задаче без ограничений. Этот результат называют иногда теоремой Ферма.
Предложение 2. Пусть х. — точка локального минимума функции f. Предположим, кроме того, что в этой точке определена п-я вариация функции f. Тогда
§ 1.2. ГЛАДКИЕ ЗАДАЧИ
87
существует такое целое число I, 21 п, что df (х^ h) = 0, ...,	(х„ h) = О,
б<2/>Ж, 4)>о
для всякого вектора h е X.
Доказательство сразу следует из определения n-й вариации и соответствующей теоремы для функций одного переменного.
Следствие. Пусть X — банахово пространство. Предположим, что функция f дважды дифференцируема по Фреше в точке %*. Тогда, если %* — точка локального минимума функции f, то
Последнее соотношение означает, что квадратичная форма х -* f" (х,) (х, х) неотрицательно определена.
1.2.2. Гладкие задачи с ограничениями типа равенств. Доказательство правила множителей Лагранжа. По условию теоремы 1 множество L = F'(x.)X является замкнутым подпространством пространства У. Возможны два случая: регулярный, когда L = У, и вырожденный, когда L есть собственное подпространство пространства У.
Рассмотрим сначала регулярный случай. Если L = У, то отображение F удовлетворяет в точке х» условиям теоремы Люстерника и, следовательно, пространство, касательное к множеству {х е X |F(x) — 0} в точке х«, совпадает с ядром оператора F'(xt). Если h е Ker F' (х*), то в соответствии с определением касательного вектора мы можем построить вариацию x(t, h) = х* -f- th + r{t) точки x* такую, что
F(х(/, Л)) = 0 при — 6	1	8, 8 > 0,
Г1||г(0||->0 при /->0.
В этом случае функция <р(/) = f(x(t, h)) достигает локального минимума в точке t = 0. Поэтому
ф'(0) = <Г(х.), Л) = 0.
Это равенство должно выполняться для всякого
Кег Г,(х*). Поэтому
f'K)e(KerF'(^))X.
88
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
По лемме об аннуляторе из § 0.1 найдется такой элемент у* е У*, что
откуда
Итак, правило множителей Лагранжа в регулярном случае доказано. В процессе доказательства мы сразу получили, что Хо У= 0. Однако в регулярном случае константа Ао и не может равняться нулю. Действительно, если Zo = 0, то
(t/\ F' (х.) х) = <F'* (х.) у’, х) = 0
для всех х g X, что в силу условия регулярности влечет равенство //* = 0, а это противоречит требованию теоремы, согласно которому все множители Лагранжа не должны обращаться в нуль одновременно.
Обратимся к вырожденному случаю. Поскольку L — собственное замкнутое подпространство пространства У, аннулятор подпространства L содержит ненулевые элементы (согласно следствию 2 из теоремы Хана — Банаха). Пусть у* — такой элемент. Тогда для всех х^Х
О = (у\ F' (х,) х> = {F'* (х.) у*, х\
т. е. (если Ло = О)
&х(х., 0, /) = Х(х.)/ = 0.
Правило множителей Лагранжа полностью доказано.
§ 1.3.	Выпуклые задачи. Доказательство теоремы Куна — Таккера
Этот параграф построен по схеме § 1.2. Как и там, начнем с изучения простейших вариантов задач выпуклого программирования.
1.3.1.	Задачи без ограничений. Пусть X — локально выпуклое линейное топологическое пространство и f — выпуклая функция на X. Рассмотрим задачу о безусловном минимуме функции f:
f(x)->inf.	"(О
§ 1.3. ВЫПУКЛЫЕ ЗАДАЧИ
89
Предложение 1, Для того чтобы функция f достигала минимума в точке х*, необходимо и достаточно, чтобы выполнялось соотношение
(х,).
Последнее соотношение есть аналог теоремы Ферма из § 1.2 для гладких задач без ограничений.
Доказательство следует прямо из определения субдифференциала.
1.3.2.	Задачи с ограничениями типа равенств. Пусть снова X — локально выпуклое линейное топологическое пространство, f — выпуклая функция на X и М — линейное многообразие, параллельное подпространству L. Задачу
f (х) —> inf;	(2)
х е М	(3)
мы называем выпуклой задачей с ограничениями типа равенств.
Предложение 2. Для того чтобы точка х* была решением задачи (2), (3), достаточно, а если функция f непрерывна в некоторой точке из М, то и необходимо, чтобы
dfWFU1 #=0.
Доказательство. Достаточность сразу следует из определений. Для доказательства необходимости рассмотрим функцию
^(x) = f(x)+6(x|M).
Очевидно, х* будет решением задачи (2), (3) в том и только том случае, когда в точке х* функция Z достигает минимума. Сопоставив предложение 1 с теоремой Моро — Рокафеллара (см. § 0.3), получим
Оенд/ (х) + ^&(х, |М).
Остается заметить, что d6(x*|M) = L1-. Предложение доказано.
90
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Следствие. Пусть х*, х*—конечный набор линейных функционалов из X*, аь ...» ап — действительные числа и
М = {х е Х| (х*, х) = а., Z= 1, ...» л].
Пусть, далее, f(x) —выпуклая функция на X, непрерывная в некоторой точке множества М. В этих предположениях точка х* доставляет минимум функции f на множестве М тогда и только тогда, когда существуют такие числа Ль ..., Лп, что
лх+...
Это точный аналог правила множителей Лагранжа для выпуклых задач.
Доказательство. В силу следствия из леммы об аннуляторе есть линейная оболочка множества {4 •••.<}•
1.3.3.	Задачи с ограничениями типа неравенств. Доказательство теоремы Куна — Таккера. Обратимся к задаче (9) — (11) из § 1.1. Пусть х»— ее решение. Рассмотрим в Rn+1 множество С, чьими элементами являются те и только те векторы (go. •... p,n)^Rn+1. для каждого из которых найдется такой вектор х е А, что
fo W — fo (х.) < Pol f i W < Hi. • • •. fn (x) < jx„.
Внутренность множества С не пуста, ибо оно содержит внутренность неотрицательного ортанта в Rn+‘. (Если цо > 0, .... цп > 0, то go > fo(x*) — fo(x*) = 0 и ц, >Л(х*) при i= 1, .... п.) Далее, С —выпуклое множество, поскольку функции fi, i — 0, ..., п, выпуклы. Наконец, 0 ф. С, ибо, если 0 е С, то существует такой хе/1, что f0(x)< fo(x«) и f,(x)^O, i = 1, .... п, т. е. х* — не решение задачи.
По теореме отделимости множество С можно отделить от нуля ненулевым линейным функционалом, т. е. существуют не равные одновременно нулю числа Хо, ...» Хп такие, что
п Зх/И/>о /=0
(4).
4 1.3. ВЫПУКЛЫЕ ЗАДАЧИ
91
для всех (цо, цп)е С. Так как С содержит внутренность неотрицательного ортанта, все U неотрицательны. Тогда из (4) при p/ = fi(x),	Цо4 (fo(x)—
—fo (*.)) следует, что
(5) 1=0
для всех х е А. Если при некотором i #= О fi(x.) — = —а < 0, то при всяком е > 0 множество С содержит ТОЧКУ Цо — . . . — Щ-1 = Щ+1 = . .. = Цп = е,
= —а. Подставляя эти числа в (4) и устремляя 8 к нулю, получаем —0, откуда Ai 0. Поэтому А» — 0. Итак, А, — 0, если Д (х») < 0, и, значит,
Ki ft (х.) = 0 для всех 1=1.....п.
Но в этом случае из (5) следует, что при всех хе Л
п	п
i=0	i=0
Соотношения (12), (13) из § 1.1 доказаны.
Предположим теперь, что выполнено условие Слейтера, т. е. существует х^А такой, что fi(x)<0 при i= 1, ..., п. Если при этом Ао = 0, то, поскольку среди чисел Ai, ..., Ап есть положительные, У.Mi(x)< <0 = 2 &ifi (х„) в противоречии с доказанным утверждением. Поэтому Ао =# 0.
Наконец, если для данных х, е A, Ai 0, ... ..., Ап 0 выполнены соотношения (10), (12), (13) из § 1.1 с Ао = 1, то для всякого хеЛ такого, что. А(х)^ 0,
fo (х.) = fo (х.) + 2 Kfi (X.) < f0 (X) + 2 Kfi (X) < fo (X), t=l	i=l
t. e. x*, действительно, решение задачи. Теорема доказана.
Доказательство теоремы 2' из § 1.1, содержащей условия экстремума в субдифференциальной форме, есть простое следствие из теоремы Куна — Таккера и Моро — Рокафеллара. В самом деле, утверждение
92
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
теоремы Куна — Таккера означает, что «удлиненная» функция Лагранжа
(х, х0,..., х„)= 2 Х^ (х) + S(x I Л)
1=0
достигает минимума по х в точке х*. Согласно предложению 1 отсюда следует включение
0Е=дх2\(х*, А,о, ..М,
откуда в силу теоремы Моро — Рокафеллара следует требуемый результат:
О е kodfo(х.) + ... + Х„dfn(х.) + N(х, | Л).
§ 1.4. Гладко-выпуклые задачи. Доказательство экстремального принципа
Этот параграф целиком посвящен доказательству экстремального принципа в гладко-выпуклых задачах (теорема 3 из § 1.1). Все доказательство разбито на несколько этапов. Доказательство первой части теоремы связано с исследованием трех частных случаев, двух вырожденных и одного невырожденного, которые мы последовательно рассмотрим. На последнем этапе будет доказано заключительное утверждение теоремы, содержащее условия, гарантирующие неравенство Хо=#=О.
Будем использовать следующие обозначения:
Ло == Irn (х4, и,)сУ
— множество значений линейного оператора Fx(x«, «*), B = L0 + F(x„ U)c.Y
— совокупность тех у е У, для каждого из которых найдутся хеХ и u^U такие, что у = Рх(х*, и*)х +4 U+F(x„a),
L — lin В — линейная оболочка множества В.
По условию подпространство Lo имеет конечную коразмерность, так что Lq и L — замкнутые подпространства.
§ 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
93
1.4.1. Первый вырожденный случай. Предположим, что
L^Y.
Тогда в силу второго следствия из теоремы Хана — Банаха существует ненулевой функционал у* У*, принадлежащий аннулятору подпрострайства L. Имеем
{у\ U,)x + F(xt, U)) = 0	(1)
для всех х е X, u е U. В частности, при и — и* отсюда следует (так как F (х,, и,) = 0), что (z/*, Fx (xt, mJ х) = 0 для всех хет. е.
П(х„ и,)у’ = 0.	(2)
С другой стороны, при х = 0 для всех и е U
W, F(x„u)') = {y\F(x„u^ = 0.	(3)
Полагая Хо = ... = Хп = 0, получаем из (2) и (3) соотношения (18) — (20) из § 1.1. Итак, в данном случае утверждение теоремы 3 из § 1.1 верно.
1.4.2. Второй вырожденный случай. Пусть L = Y. Покажем, что в этом случае intBy=0. В самом деле, поскольку codim Lq < оо, фактор-пространство Y/Lq конечномерно. Обозначим через л: Y -> Y/Lq каноническое отображение в У/Lo, т. е., в частности, = nt/2 тогда и только тогда, когда yi — у2^ Lq. Поскольку линейная оболочка множества В совпадает с У, линейная оболочка множества л (В) совпадает с Y/Lq. Множество В, очевидно, выпукло (как сумма подпространства и множества, выпуклого в силу условия б) теоремы). Поэтому и множество л (В) выпукло. В § 3.5 (теорема 2 из § 3.5) мы покажем, что в конечномерном пространстве выпуклое множество, аффинная оболочка которого совпадает со всем пространством, имеет непустую внутренность.
Итак, ш1л(В)У= 0, с другой стороны, л~1(л(В)) — = В. Поскольку л — непрерывное отображение, это значит, что int В У= 0.
Предположим теперь, что
0 ф int В.
94
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Тогда по теореме отделимости существует ненулевой функционал у* е У*, разделяющий В и 0, т. е. такой, что
</.
для всех у е В. Это значит, что для всех х е X, U
<//*, u.)x + F(x„	(4)
Полагая в этом неравенстве и = и*, получаем
</>	ы.)х>>0
для всех х е X. Следовательно, Fx (х,, uj у* — 0. Если же взять х = 0, то из (4) следует, что неравенство
<У\ F(xt, «))>0 = </, F(x„ «.)>
выполняется для всех и е U. Поэтому в данном случае, как и в предыдущем, Хо = ... — Хп — 0, у* — искомые множители Лагранжа.
1.4.3. Невырожденный случай. Предположим, наконец, что
L = Y, OeintB.
Пусть для определенности f 1 (х„, «,)=.. .=fk (xt, и,)=0, fk+i u,) < О, ..., fn (x„ u.) < 0. Рассмотрим в R*+1 X Y множество С, образованное теми векторами (go, •••» Мл, у)^ е Rft+1 X Y, для каждого из которых найдутся хе X, u^U такие, что
> {fix (х„ и), Х> + fi (х„ «) — (х„ «,),	1=0....k,
y = Fx (х„ и,) х + F (х„ и) — F (х., и,).
Для доказательства теоремы 3 из § 1.1 достаточно проверить, что
intC=/=0, 0&С.	(5)
В самом деле, поскольку множество С, очевидно, выпукло, при выполнении условия (5) найдется ненулевой функционал (Ао, ..у*) е Rft+I X К*, отделяющий С от нуля, т. е. такой, что
k
2	+ {у» у) о
i=0
S 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
95
для всех (ц0> •••» Нъ У)^С. Последнее неравенство означает, что при х е X, u^U
2 Ь «fix (х.> и,)> х) + h (х.> и) — h (х,, и,)) +
+ </, Fx(xt, u.)x + F(xt, u) — F(x„ u.))>0
или (если положить = ... = An = 0),— что
(3?х (•’“<> «», ^0» • • •» ^п> У )» х) +
Н" 3F (х,, м, Ад, ..., Zn, у )	3£ (х(, и,, Лд, ..., %п, у )	0.
Полагая в этом неравенстве последовательно и — и, и х = 0, снова приходим к соотношениям, которые требуется доказать. (При этом условия дополняющей не-жесткости, очевидно, выполняются, так как Л/ = 0 при
fi (х„ и,) < 0.)
Таким образом, осталось проверить соотношения (5). Коль скоро OeintB, то, очевидно, 0eint«(B), где, как и раньше, л: У-*У/£0— каноническое отображение. Поскольку пространство У/Lg конечномерно, можно ука^ зать конечное число точек zb ..., zm из пВ, линейная оболочка которых совпадает с Y/Lo и таких, что Zi + ... -f- zm = 0. (Например, если codim Lo = г, то, отождествляя Y/Lo с Rr, можно в качестве Zj, .... zm взять вершины достаточно малого r-мерного куба, центр которого совпадает с началом координат.) По определению найдутся такие Uj е V, j = 1, .... т, что n(F(x*,«j))== Zj, т.е.
Uj)j = O.
(6)
Положим (Щ0,1)= {хеХ|||х||< 1}):
с0 = max (х„ uz) -HI fix (х„ и.) ||);
0</<£
{и е U 13aj>0, 1 m, У a, = k F (x*, и) =
= 2	2 ajfi(X',Ui)>
Bo = Fx (x., u.) U (0,0 + F (x„ Uo).
96
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Множество Во выпукло в силу условия б) теоремы и intBo¥=0 (последнее следует из п. 1.4.2, поскольку множество л(Во) содержит точки ..., zm, а Fx(**,u*)U1) открыто в Во)-
Пусть Со = Во X (RJfe+1, где RCo — полупрямая {p R | и > с0}, т. е. произведение множества Во и к + 1 экземпляров полупрямой {ц е R | р > Со}- Ясно, что int Со У= 0 и Со с: С, значит, int С =# 0. Первое соотношение в (5) доказано.
Предположим теперь, что второе соотношение в (5) неверно, т. е. существуют е X, Uq е U такие, что
Рх (х„ и.) х0 + F (х„ «о) — р (* , и,) = 0,	(7)
<fix(x„ и,), хэ> + А(х., «о)— fi(X„ «.)< — б<0,
1 = 0...k.	(8)
Зафиксируем некоторое е > 0 и рассмотрим следующее отображение пространства X X Rm+1 в Y:
& (х, а0...ая) = 11 -aj-e 2 а/}/7(х, + х, ut) +
+ Ujp(х„ 4-Х, и0) 4-е 5 Я/Р(х. + х> и/)-j=l
Отображение 3", очевидно, дифференцируемо по Фреше на множестве (V — х*) X Rm+1, где V — окрестность точки х*, участвующая в формулировке теоремы, производная Зг' непрерывна в начале координат и
(о, ..., 0) (х, аэ, .... ат) = Fx (х., и.) х 4-
т
+ аэ (Р (*.. Щ)~Р (х„ и,)) 4- в 2 а/ (Р(х„ и})—Р (х„ и,)). (9)
Очевидно, #~(0,	0) = F(x*, н«) = 0. Множество значений оператора ^"'(0,	0) содержит Во и, следова-
тельно, совпадает с Y. Далее, в силу (6) существует такой вектор х' е X, что
т
Fx(x„ u^x' + ^F^u^O.	(10)
§ 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
97
Из (7), (9), (10) следует, что
^'(0,	О)(хо4~ех', I, 1) = 0,
т. е. вектор (х0 + ex', 1,	1) принадлежит ядру one-
ратора ^'(0,	0). По теореме Люстерника найдутся
такие отображения
t -> х (0, t -> йо (0, • • •, t йш (0
некоторого отрезка [—е0, 80] (где 80, вообще говоря, зависит от е) в X и R соответственно, что при t->Q \\х (0 II + 2|	(0 1^“>0 и (при всех 0 ST (/(х0 + ex' +
+ х (0), t (Т + Йо (0), . . . Л (1 + (0)) = 0.
Полученный результат верен для всех 8 > 0. Выберем теперь е так, чтобы
8
т
{fix (х„ и,), х'} + S fi (Х„ Uj) i=i
<6/2
) ft (xt + х, ы,) 4-
gi (х, а3, .... ат) =
при всех i = 0, ..., k, и рассмотрим функции
1 — «Э — 8 з а,-/=1
+ W; К + X, но) + 8 2 a.jfi (х. + х, Uj). /=1
Тогда
( fo(x*> Ю, если / = 0,
*<°......о4 0, если i=l......................k,
функции gt дифференцируемы в нуле и
.... 0), (х, а0, .... ат)> = (^(х., ц,), х) +
+ аэ(Л(*., «о)— fi(x., н,)) + еЗ	и})—f{ (х„ «,)). (11)
J-1
Отсюда и из (8) в силу выбора е следует, что
<g;(0, ...» 0), (х0 + 8Х', 1,	1)> < - 6/2
4 А. Д. Иоффе, В. М. Тихомиров
98
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
при всех z = 0, .... k, т. е.
gi (t (х0 + гх' + х (/)), t (1 + й0 (0), ..., t (1 + ат (/))) = = gj(O,...» 0) +/<^(0.....О),(хо4-ех', 1,..., 1)> + о(0<
<gi(0.......0)-/6/2 4-0(0. (12)
Положим х (/) = х, 4~/(*о4- ex' + х (/)). Тогда, очевидно, х(/)->х, при /->0. Далее, при достаточно малых t
t 1 4" й0(0 + е 2 (1 + йу(/)) <1, L	/=i	J
1 4-йа(/)>0,	14-ат(/)>0.
Согласно условию б) теоремы 3 из § 1.1 при таких t можно указать элемент и (/) е U такой, чтобы выполнялись соотношения
F(x(t), u(t)) =
= (1 -1 (1 + й0 (0) - е/ 2 (1 4- й, (0)] F (х (/), и.) 4-
4- i (I 4- йо (0) F (х (0, «о) + е/ 2 (1 4- йу (/)) F (х (/), Ы/) =
= ^-(/(хо4-ех'4-х(0),/(1 4-йо(О). ...,/(14-йт(0)) = 0, А(х(/), и(О)<(1-/(14-йо(О)-
-8/1(1 + й/ (0)] fl (х (0, И,) + / (1 4- й0 (/)) ft (X (/), Ыо) 4-4-6/20+ “/ (0) ft (х (/), И/) = gi (/ (хЭ 4- 8Х' 4- X (/)), /(1 + йо(О).........../(1+йт(/))), 1 = 0, ..., т.
Из них и (10) — (12) следует, что при малых />0 Г(х(/), «(/)) = 0, /0(х(/), u(/))<f0(x„ «,), (х (/), и (/)) < 0, i=l,
Наконец, при	1, очевидно, Пт/г(х(/), ы(/))<2
/->0
^sfz(x., «,) < 0. Таким образом, если / достаточно
§ 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
99
мало, то (х(/),	— допустимый элемент нашей задачи, fo(*(O, и(0) <	и*) и %(/)-> х* при / 0. Но
это значит, что точка (х#, и*) не может быть точкой локального минимума, вопреки условию теоремы. Поэтому предположение о том, что 0 е С, было ошибочным и, значит, соотношения (5) верны. Первая часть теоремы 3 из § 1.1 доказана.
1.4.4. Регулярный случай. Нам осталось доказать вторую часть теоремы 3 из § 1.1. Для этого достаточно проверить, что при выполнении условия г) теоремы (предполагающего, что образ множества X X U при отображении
(х, u)->Fx(x., u,)x + F(x<f и)
содержит окрестность нуля в У и что существуют х0 е X, ий^.и такие, что
Рх (х„ ut) х0 + F (xt, и0) = 0,	(13)
и,), Xo) + f,-(x„ «о) <0 при	(14)
т. е. при тех I, при которых fi(xt, u,) = 0), соотношения
к
Рх (Х„ и,) у' + 2 htflx (х„ и,) = 0,	(15)
1=1
k
о = F (х„ «.)) + 2 h{f{ (х., «.) =
1=1
k
= min {у*, F(x„ и)> 4- 2	(х., и)
u^UL	i=l
(16)
не могут выполняться ни при каких	...,
е У*, хотя бы один из которых отличен от нуля.
В самом деле, если хотя бы одно из чисел отлично от нуля, то из (14) следует неравенство
k
2 hi [<fix (x„ и,), x0> 4- fi (x,, Uo)l < 0. f=l
откуда в силу (15)
k
- W, Fx (x., «.) XO> 4- 2 hifi (x„ u0) < 0 j=l
4*
100
ГЛ. Т. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
и, значит, согласно (13)
k
{у,	«о)> + 2 hfi (х,, м0) < 0
1=1
в противоречии с (16). Поэтому Xi = ... = Хн = 0. Если при этом у* 0, то в каждой окрестности нуля пространства Y найдется точка у такая, что {у*, у} < 0. Поэтому мы можем выбрать xg X и и е U так, чтобы
</. Fx (х., U,)x + F (х„ и)) < 0.
Но поскольку все числа X,- равны нулю, из (15) следует, что {у*, Fx(x*, и*)х} — 0 и, значит, {у*, F(x„ «))< <0 в противоречии с (16). Этим завершается доказательство экстремального принципа для гладко-выпуклых задач.
Комментарий к гл. 1. К § 1.2. Правило множителей Лагранжа для бесконечномерных задач было доказано Люстерником [1] и Голдстайном [1]. Задачи с неравенствами рассматривал Джон [1].
К § 1.3. Выпуклое программирование ведет начало с работы Куна — Таккера [1]. Условие Слейтера появилось в работе Слейтера [1]. Различные обобщения содержатся в работах Фана, Гликс-берга и Гоффмана [1], Удзавы, Гурвица (см. Эрроу, Гурвиц, Уд-зава [1]), Гольштейна [1], [2], [4], Рубинштейна [1], [2] и др.
К § 1.4. После того как был сформулирован принцип максимума Понтрягина, появились исследования, где разрабатывались общие методы получения необходимых условий экстремума, и работы, где необходимые условия выводятся для более широких классов задач. Кроме исследований на эти темы, упомянутых в комментарии ко введению, укажем на работы Гамкрелидзе [5], [6], [8], Пшеничного [3], Халкина [6]. Задачи, подобные тем, которые мы назвали гладко-выпуклыми, рассматривались Пшеничным [3]. Теорема 3 обобщает результат Пшеничного и Ненахова [1].
Глава 2
НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
В ЗАДАЧАХ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
В §§ 2.3, 2.5 с использованием теорем 1 и 3 из гл. 1 дается вывод уравнений Эйлера — Лагранжа для задачи Лагранжа классического вариационного исчисления и принципа максимума Понтрягина для задач оптимального управления; § 2.2 и п. 2.4.2 посвящены независимому от гл. 1 элементарному выводу важнейших необходимых условий минимума для простейших классов задач вариационного исчисления и оптимального управления.
§2.1. Постановки задач
2.1.1. Функционалы, ограничения, граничные условия. Мы будем рассматривать лишь одномерные задачи, когда независимое переменное /, называемое иногда временем, принадлежит некоторому отрезку [/0, М, —оо /о < Л ^ °°- В задачах, с которыми приходится иметь дело, как правило, участвуют две группы переменных: х = (ли, хп) и u = (u1, ur). Переменные х называются фазовыми, переменные и — управлениями. В задачах, относящихся к классическому вариационному исчислению или оптимальному управлению, присутствуют три элемента: функционал, ограничения на фазовые координаты и управления и граничные условия, накладываемые на фазовые координаты на концах рассматриваемого в задаче отрезка времени. На самом деле не всегда разумно устанавливать разделение на ограничения и граничные условия, но в большом числе случаев это разделение выглядит естественно и оказывается удобным.
Функционалы встречаются трех видов. Интегральные функционалы имеют такую форму:
Л
(X (•), и (•)) = J f (t, х (/), х (t), и (/)) di, (1) ^0
102
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
где ft R X R” X Rn X Rr~*R; функция f называется интегрантом.
Функционалы, зависящие от конечных значений фазовых координат, т. е. функционалы вида
У2(х( -)) = ф(/с, x(t0), tit х(О),	(2)
где ф: RXR"XRXRn-*R, называются терминальными. Наконец, встречаются функционалы смешанного вида
Ш’),	=	«(-)) + ^2(х(-)),	(3)
где — интегральное, а <72— терминальное слагаемое.
Ограничения, с которыми мы столкнемся, будут двоякого рода. Это — либо функциональные соотношения, выражаемые равенствами и неравенствами:
Gdt, x(t), x(t), u(t)) = 0, | G2(/, x(t), x(t), m(/))^0, J
где Git RXR"XR',XRr -*R4 Z=l, 2, либо нефунк-циональные соотношения, например:
и (0 е U cz Rr, A cz [/b f2J- (5)
Функциональные ограничения вида (4), не зависящие от производных и управлений, т. е. соотношения
х(/)) = 0, g2(t, х(/))<0,	(6)
будем называть фазовыми ограничениями.
Ограничения типа
х(/) = Фа, х(0,	(7)
где <р: R X R” X Rr Rn, называются ограничениями в разрешенной форме.
Уравнением (7) описываются многие управляемые объекты. Отсюда и названия — фазовые координаты и управления. Если управление задано, то уравнение (7) становится обыкновенным дифференциальным уравнением относительно х. Всякое его решение, соответствующее управлению и(-), называется фазовой траекторией, а пара (х(-),и(-)), связанная уравнением (7), называется управляемым процессом.
Граничные условия задаются выделением в пространстве R X R” X R X Rn некоторого множества Г, ко-
§ 2.1. ПОСТАНОВКИ ЗАДАЧ
103
торому должны принадлежать концы траектории, т. е. точка (/о, х(/о),	х(6)). Часто встречаются такие гра-
ничные условия:
—	закрепленные, когда значения траектории закреплены на обоих концах отрезка [/0, Л] (при этом сам отрезок предполагается фиксированным): х(/0) = Хо, x(^l)=Xi;
—	свободный правый или левый конец, когда соответствующий конец отрезка [/о, 6] предполагается фиксированным, но на нем условия на фазовую траекторию отсутствуют;
—	периодические, когда отрезок [/0, М фиксирован и фазовая траектория принимает равные значения на концах: х(/0) = х(Л).
2.1.2. Задачи классического вариационного исчисления и оптимального управления. Общая постановка:
^ (%(•), и (•))-> inf (sup);	(8)
Gi(/,x(0, х(/), w(0) = 0, G2(f, х(0, x(0, u(0)<0, (9) u(t)^U(t),	(10)
(11) охватывает большинство задач оптимального управления и вариационного исчисления. (Отрезок |70, Л] не предполагается закрепленным. Если же он фиксируется, то соответствующую задачу называют задачей с закрепленным временем.)
Если функционал (8) является интегральным, задача (8) — (11) называется задачей Лагранжа', если функционал— терминальный, то она называется задачей Майера и, наконец, если функционал — смешанный, то соответствующая задача называется задачей Больца.
Все три постановки являются в значительной мере равносильными. Если, например, задан интегральный функционал, то, введя новую координату xn+1 и пополнив систему (9) уравнением
xn+1 — / = о
с граничным условием хп+1(/о)=О, мы задачу о минимизации функционала
104
ГЛ 2. НЕОБХОДИМЫЕ УСЛОВИЯ 7
сведем к минимизации терминального функционала .
5<2 = хп+1 (Л).
Наоборот, если требуется минимизировать терминальный функционал «7г = ф(/1, *(М), скажем, при фиксированных значениях to и x(to) (тогда без ограничения общности можно считать, что ф(/о, x(to)) = 0), то, предполагая, что функция ф дифференцируема, можно положить
№^>-^4^-14
и мы получим, что
=	Х(Л))
Особенности задач классического вариационного исчисления состоят в следующем. Во-первых, в задачах классического вариационного исчисления все функции, входящие в описание задачи, предполагаются гладкими, по меньшей мере — непрерывно дифференцируемыми. С другой стороны, там отсутствуют нефункциональные ограничения вида (10). (Эти обстоятельства позволяют относить задачи вариационного исчисления к числу гладких задач, о которых речь шла в п. 1.1.1.) В задачах же оптимального управления нефункциональные ограничения играют весьма существенную роль. Само по себе множество U(t), задающее ограничение (10), может иметь самую разнообразную природу, например, оно может быть дискретным множеством. Это делает неестественным рассмотрение в задачах оптимального управления гладких и даже непрерывных управлений, а вместе с этим и допущение о гладкости отображений Gi, G2 в (9) и т. д. по управлениям и. Так что стандартные допущения в задачах вариационного исчисления—-непрерывная дифференцируемость по всем переменным, а в задачах оптимального управления — непрерывность по совокупности переменных и гладкость по переменным tux. Задачи оптимального управления будут редуцированы к гладко-выпуклым задачам, о которых речь шла в п. 1.1.3.
Приведем несколько примеров частных задач, укладывающихся в общую схему.
§2.1. ПОСТАНОВКИ ЗАДАЧ
105
Простейшей векторной задачей называется задача следующего вида:
3 (х (•)) = J L (t, х (/), X (0) -> inf;
^0
(12)
(х(/0), хОеГ.
В (12) отрезок [Mi] предполагается фиксированным, функция L — определенной и непрерывно дифференцируемой в некоторой области пространства R X X Rn, множество Г, задающее граничные условия, — произвольным подмножеством пространства Rn X Rn- Если п = 1, то задачу (12) называем коротко простейшей задачей.
Буква L для обозначения интегранта простейшей векторной задачи выбрана в честь Лагранжа. При этом производится неявная апелляция к языку и символике классической механики. В основании классической механики лежит принцип наименьшего действия (или как иногда его называют — принцип стационарного действия— что более точно). Согласно этому принципу траектории движения системы частиц в силовом поле U являются стационарными точками функционала действия
Под знаком интеграла стоит лагранжиан системы, являющийся разностью кинетической и потенциальной энергии:
L = Т - U.
В силу сказанного, интегрант L иногда называют лагранжианом, даже если задача взята не из классической механики.
п
Выражения p^L*, Н— 2 Pi*i L называются в механике 1 i=l
импульсами и энергией системы. В дальнейшем мы иногда будем употреблять эти термины, навеянные классической механикой.
Задачей Лагранжа с ограничениями в разрешенной форме и фазовыми ограничениями типа равенств и
106
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
неравенств называют следующую проблему:
У(х(- ),«(.)) = J f(t,x(f), и inf-, (13) fo
x = <p (t, x, и),	(14)
g\(t,x (/)) = 0, g2 (t, x (0) <0,	(15)
hQ (to, x (Q) = 0, (tu x (Л)) = 0,	(16)
u<=U.	(17)
Здесь интегральный функционал не зависит от х. Ограничения разделены на разрешенные — (14) и фазовые— (15). Граничные условия описываются соотношениями (16). (Так можно задать не все встречающиеся в приложениях граничные условия. Скажем, периодические условия таким путем описать нельзя. Но вместе с тем, соотношения (16) дают возможность выразить достаточно широкий класс граничных условий.)
При рассмотрении задачи Лагранжа в рамках классического вариационного исчисления будем предполагать, что отрезок [/о, fi] является фиксированным и ограничение (17) отсутствует.
Задача (13) — (17) называется автономной, если во всех входящих в ее определение функциях и отображениях отсутствует явная зависимость от времени.
Линейными задачами оптимального управления дем называть задачи с закрепленным временем следующего вида:
J ((a(01x(0)44H0l«(0)X->inf;
t,
x=A(t)x + B(t)u,
(gi (01 x (OX az (0, i = 1, ..., m,
(Aft/l*(^)) = Pft/. *=0,1, j=\,...,sk, u<=U.
Иногда требование о закрепленности времени при определении линейных задач опускают. Эти и более
§ 2.1. ПОСТАНОВКИ ЗАДАЧ
107
общие задачи оптимального управления будут исследованы в § 9.3 методами выпуклого анализа.
2.1.3. Сильный и слабый экстремум в задачах классического вариационного исчисления. Поставленные выше задачи обладают все еще неопределенностью, ибо не описан класс допустимых элементов. Задача Лагранжа (13) — (16) с фиксированным временем в рамках классического вариационного исчисления будет исследоваться в банаховых пространствах Сл([/0, Л])Х X Сг ([/о, Л]), где С?([tQl Zi]) — пространство непрерывно дифференцируемых вектор-функций, а Сг([/0, Л]) — пространство непрерывных вектор-функций. (Норму в пространстве Ci условимся обозначать для сокращения П-Ili, норму же в пространстве С, если мы хотим сопоставить ее с нормой в пространстве Ci, иногда обозначаем || • По-) Исследование простейших задач проводится в банаховых пространствах СГ([/0, М)*
Локальный минимум в пространстве С? X Сг в случае задачи Лагранжа (или в пространстве С” в случае простейших задач) называется слабым. Иначе говоря, пара (*♦(•), tt*(’)) доставляет слабый локальный минимум функционалу ЗЧх( •),#(•)) в задаче (13) — (16), если найдется такое число е > 0, что для любой допустимой пары (х(-), м(-))е Ci X Сг такой, что
Пх( •)—*.(•) Hi < е, II г/( •) — «^ (’ )По < выполняется неравенство
При этом пара называется допустимой в задаче, если она удовлетворяет ограничениям (14) и (15) и граничным условиям (16).
Совершенно аналогично определяется слабый минимум для простейшей задачи (12).
Локальный экстремум в топологии пространства С? (по х) называется сильным. Иначе говоря, допустимая пара (%*(•), «*(•)) доставляет сильный локальный минимум функционалу 3 в задаче (13) — (16), если найдется такое число 8 > 0, что для любой допустимой пары (х(-), м(-)), для которой
108
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
выполняется неравенство
Аналогичным образом определяется сильный минимум для простейшей векторной задачи (12).
Но мы будем в термин «сильный экстремум» вкладывать несколько расширенное толкование, которое свойственно этому понятию в задачах оптимального управления. Об этом речь пойдет в следующем пункте.
2.1.4. Допустимые управления и управляемые процессы в задачах оптимального управления. Оптимальные процессы. Уже упоминалось, что требование непрерывности управлений во многих случаях не является естественным. Нередко из самой постановки задачи вытекает необходимость рассматривать более широкий класс допустимых управлений. Иногда в качестве такового берут класс кусочно-непрерывных управлений. Мы же будем обычно рассматривать в качестве допустимых произвольные ограниченные измеримые управления, принимающие значения из множества U(t).
При таком выборе допустимых управлений требуется уточнить понятие управляемого процесса. Процесс (x(t),u(t)) называется управляемым на отрезке [/0, Л], если на этом отрезке функция u(t) —допустимое управление, х(/)—абсолютно непрерывная вектор-функция, удовлетворяющая почти всюду уравнению (14):
х(/) = ф(/, x(i), u(t)).
В понятие допустимого управляемого процесса включается и отрезок времени, на котором этот процесс рассматривается. Таким образом, управляемый процесс, допустимый в задаче (13) — (17), это тройка (х(/), u(t), [/о, 6]) такая, что вектор-функции х(/) и u(t) образуют управляемый процесс на отрезке [Zo, ti] и при этом фазовые переменные x(t) удовлетворяют фазовым ограничениям (15) и граничным условиям (16).
Допустимый процесс (^(0,^(0, [/0*Д1*]) назовем оптимальным, если найдется 8 > 0 такое, что для всякого другого допустимого процесса (х (/), и (/), fo, М), для которого | /о —/о* I < е, | Л — J < 8, ] x(t) —х* (/) [< е
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
109
(V/ <=Ro,^i]CIRo*, Л*]) имеет место неравенство
<?(*( J,a( J)>^.K(-), MJ).
В описанной ситуации говорят еще, что процесс (%*(/), Ro*, 6*]) доставляет сильный минимум в задаче (13) — (17).
Таким образом (возвращаясь к задачам классического вариационного исчисления), в расширенное понимание сильного минимума вкладывается следующий смысл. Проиллюстрируем его на векторной задаче классического вариационного исчисления.
Мы говорим, что вектор-функция x*(f) доставляет сильный минимум в задаче (12), если существует е > 0 такое, что для всякой функции х(/)е i(Ro, М)> удовлетворяющей граничным условиям и неравенству
||*(')~х.(’)11о<е,
имеет место неравенство
(*,(•)).
§ 2.2. Элементарный вывод необходимых условий экстремума для простейших задач классического вариационного исчисления
В этом параграфе мы даем вывод необходимых условий Эйлера, Вейерштрасса, Лежандра и Якоби, используя самые элементарные средства. Наши рассуждения всюду основаны на непосредственном применении метода вариаций.
2.2.1. Элементарный вывод уравнения Эйлера. Начнем с простейшей задачи с закрепленными концами:
^(x(.))=f L(t, x(t), x(t))dt-> ini;
t,
x(tQ) = xQt xit^x^
Предположим, что функция L(t,x,y) непрерывно дифференцируема в некоторой области U пространства R3. Задачу (1) будем исследовать на слабый экстремум, т. е. — в пространстве Ci(Ro, 6]).
110
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИ,
Вывод уравнения Эйлера состоит из трех этапов. Первый этап состоит в доказательстве того, что функционал Sf обладает первой вариацией (в любой точке х*(-) такой, что точки (/,х* (£),%*(/)),	принад-
лежат области 17), и в получении необходимого условия в терминах первой вариации. Рассмотрим функцию одного переменного
<р(А) = ^(х.(-) + Ах(-))= J ЧЧЛ А)<# = ffl
= J L (t, x, (0 + Kx (0, x, (0 + Ax (0) dt, (2) f(J
порожденную вариацией x(t, X) = x.(0 + Ax(0 точки x.(-) по направлению точки x(-). При наших допущениях относительно L, х,(-) и х(-) функция Чг(0А) является дифференцируемой по 1 при достаточно малых А, и при этом производная непрерывна, ибо
о л
= Lx (t, х. (0 + Ax (0, х. (0 + Ах (0) x (0 +
+ U (t, x, (0 + Ax (0, x, (0 + Ax (0) x (0.
Следовательно, допустимо дифференцирование в (2) под знаком интеграла и при этом
fl
ф' (0) = б5< (х. (•), х (.)) = J (q (0 х (0 + р (0 X (0) dt, t,
где
q (0 = Lx (t, x, (0, x. (0), p (0 = L, (0 x. (0, x, (0).
Далее, если функция x.(0 подозреваема на экстремум, то она допустима, и значит, для любой функции х(0, принадлежащей подпространству Lo:
Lo = {х (0 6= Ct ([f0, 0]) | х (0) = x (0) = 0}, функция x#(/)+ Ax(0 будет проходить через те же граничные точки, что и функция х»(0. Следовательно, если х.(0 есть решение задачи (1), то при условии, что
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
111
x(/)eLo> функция, определяемая соотношением (2), должна иметь минимум в точке нуль. В итоге мы приходим к такому необходимому условию экстремума:
ф'(0) = дЗЧМ-).*(-)) = 0, Vx(-)eL0.	(3)
Первый этап вывода закончен.
Второй этап состоит в преобразовании выражения для первой вариации на пространстве Lo посредством интегрирования по частям. Делают это двумя путями: следуя Лагранжу, когда интегрируют по частям второе слагаемое, и — Дюбуа-Раймону, когда интегрируют первое. Преобразование по Лагранжу предполагает дополнительное условие гладкости, а именно, допущение, что функция р (0 = L-t | (() является непрерывно дифференцируемой. При этом дополнительном предположении проинтегрируем по частям второе слагаемое в выражении для первой вариации при условии, что х(-)е£о- Мы получаем:
d^(x,(-),x(.))= J a(f)x(t)dt,	(4)
где
а(0 = <7(0-р(0'=(“4^ + £*)| ’
'	/ lx,(О
Приведем теперь преобразование первой вариации по Дюбуа-Раймону. Для этого проинтегрируем по частям первое слагаемое на пространстве Lg:
t,	t, ft,	\
J q(t)x(f)dt— — rfl J <7 (t) dx 1 x (/)— /•	t,	/
fl / fl	\
— | I j q (t) dx j x (/) dt fo м	/
и получим, что выражение для первой вариации имеет такой вид:
ft
бЗЧх.(-),х( •))==/ b(t)x(i)dt,	(5)
112
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
где tt	и
b(t)= / q(x)dx + p (0= J Lx |xUT) dx + L* |xUf). t	t
Переходим к третьему этапу вывода уравнения Эйлера.
Лемма Лагранжа. Пусть функция a(t) непрерывна на отрезке [/0, М- Предположим, что для любой непрерывно дифференцируемой функции x(t), обращающейся в нуль на концах отрезка [/о, /1], выполнено равенство
J a(t)x(t) dt = Q. to
Тогда a(t) = 0.
Доказательство. В силу непрерывности функции a(t) достаточно проверить, что а(/)== 0 во внутренних точках отрезка [/о, ti]- Предположим, что в некоторой внутренней точке отрезка т значение а(х) #= 0. Без ограничения общности можно считать, что а(т) > 0.
Выберем е>0 столь ма-’	лым, чтобы, с одной сто-
|---и ।	---1----ч—роны, отрезок До — [т— 8,
t0 r-е г г+5	1 т + е] целиком лежал бы
Рис. 2.	внутри отрезка [/0, /1], а с
другой стороны, чтобы на этом отрезке функция a(t) была бы больше некоторого положительного числа а. Возьмем теперь любую неотрицательную, но не тождественно равную нулю финитную функцию из С1ф0, Л]) с носителем в До. Например, в качестве такой функции можно взять (рис. 2)
.	( (^ —т + е)2(^ —т —е)2, t е= До,
Применив теорему о среднем из интегрального исчисления, получим:
J а (/) х (0 dt = J а (/) х (/) dt a J х (/) dt > 0. До	До
Мы пришли к противоречию. Лемма доказана.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
113
Завершим вывод уравнения Эйлера по Лагранжу. На первом этапе было установлено, что если х*(/) — решение задачи (1), то выполнено равенство (3). На втором этапе было показано, что на подпространстве Lo первая вариация (правда, при дополнительном предположении) представима в виде (4). Сопоставив эти два факта с леммой Лагранжа, приходим к выводу, что если х*(/) есть решение задачи (1), то необходимо должно выполняться соотношение
(- 4 +1.) | = - 4 и (i.x.«), i. (о) +
+ МЛ хД/), хД/)) = 0,
называемое уравнением Эйлера задачи (1) в форме Лагранжа.
Отметим, что при выводе использовались вариации х(/, Z) = хД/)+Zx(/, т, s) экстремали х*(/) по направлению х(/, т, в), изображенному на рис. 2.
Для того чтобы вывести то же самое уравнение по Дюбуа-Раймону докажем следующую лемму.
Лемма Дюбуа-Раймона. Пусть функция b(t) непрерывна на отрезке [/0, 6]- Предположим, что для любой непрерывной функции v(t), в среднем равной нулю, выполнено равенство ц
J dt — O. h
Тогда b(t)= bo = const.
Напомним, что функция v(t) называется в среднем равной нулю, если
ц
Доказательство. Допустим, что заключение леммы неверно. Тогда должны найтись две точки Ti и т2, лежащие внутри отрезка [/оЛ1], Для которых &(ti)¥= =/=&(т2), скажем, ti < т2 и 6(ti)>&(t2). Выберем
114
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
с > О столь малым, чтобы интервалы
Д1 = [Т1 — е, Т1 4- е]
и
Д2 = [т2 — е, т2 Ч- е]
не пересекались друг с другом, лежали внутри отрезка [/о, Л] и .при этом выполнялось неравенство:
р( = min b (/) > max b (t) = р2.
Очевидно, что этого можно добиться. Рассмотрим теперь любую непрерывную функцию и(/), которая вне Al U Аг равна нулю, на Ai неотрицательна и не тождественно равна нулю, а на Аг принимает противоположные значения. В качестве примера нужной функции можно взять
v(t) = v (t, tf, т2, е) =
(t — т, + е)2(— t + Т1 + 8)2. — (t — Т2 + 8)2(— t + Т2 + в)2,
f е Ди /еД2,
/е[/0, ММД^Дг).
Снова по теореме о среднем получим 1\
J b(f)v(f)dt — j b(t)v(t)dt + j b(i)v(t)dt^
Ai	A2
XP1- p2) J v(t)dt >0.
Д,
Противоречие с условием доказывает лемму.
Сопоставив соотношения (3) и (5) с леммой Дюбуа-Раймона, получаем, что если х*(/) является решением задачи (1), то необходимо должно выполняться соотношение
Л
J q(x)dr + p{t)^c0, t или, подробнее, fi
J Lx (т, х, (т), х. (т)) dr + Ц (t, х, (/), х, (/)) = с0. t
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
115
Это соотношение называют уравнением Эйлера в форме Дюбуа-Раймона.
Первое слагаемое в последнем соотношении можно продифференцировать, откуда вытекает, что и второе слагаемое является непрерывно дифференцируемым.
Итак, мы пришли к следующему утверждению.
Предложение 1. Пусть в задаче (1) лагран* жиан L непрерывно дифференцируем в некоторой области U cz R3 такой, что ей принадлежат точки (/,	/ е [/о, Л], где	Ci([/0, ZJ). Для
того чтобы функция x*(Z) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы было выполнено уравнение Эйлера в форме Лагранжа-.
(t, X, (t), х, (/)) + Lx (t, xt (/), x. (/)) = 0.	(6)
Функции x#(/), вдоль которых выполнено уравнение Эйлера, называются экстремалями.
Приведем несколько частных случаев, когда у уравнения Эйлера имеются интегралы.
Следствие 1. Если функция L не зависит от х, то для экстремальности х*(/) необходимо, чтобы было выполнено соотношение
Lx(t,xt(t)) = O,	(7)
Следствие 2. Если функция L не зависит от х, то уравнение Эйлера допускает интеграл импульса-.
р (0 = Li (t, xt (/)) =ра = const.
Следствие 3. Если функция L не зависит от t, то уравнение Эйлера допускает интеграл энергии:
H(t) = p(t)xt(t)-LM), *.(0) =
= Ei (х, (0, х„ (/)) х, (/) — L (х, (0,	(0) Но — const.
Следствия 1 и 2 непосредственно вытекают из (6). Для доказательства следствия 3 надо взять производную dff	/сч
и, воспользовавшись (6), показать, что она равна нулю.
116
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Итак, для экстремали х*(/) найдено дифференциальное уравнение (6) второго порядка. Общее решение этого уравнения зависит от двух произвольных постоянных. Они «тратятся» на удовлетворение краевых условий.
Наметим путь вывода необходимого условия экстремума для простейшей задачи Больца:
(X ( • )) = ф0 (х (/0)) 4- 1|>1 (х (/,)) + tl
+ j L(t, х (0, х -> inf, (8) h
где, в отличие от задачи (1), нет краевых условий, но функционал имеет терминальные слагаемые.
Этапы доказательства те же. В предположении о непрерывной дифференцируемости всех входящих в (8) функций, легко проверить, что для функции х»(/), лежащей в области дифференцируемости ф0, ф> и L, у функционала $ существует первая вариация и она равна
б^ (х, (•), х (•)) =
= Фо (*. (4>)) х (/0) + Ф1 (х, (Л)) х (^) + 65" (х. (•), х (•)) =
+ J (LJxUOx(/) + LJXi(Ox(f))^. (9)
-
Если х, (f) есть решение задачи (8), то очевидно, что б$(х, (•), х( • )) = О,
VxDeCUtMJ).	1 }
На подпространстве Lq, введенном нами ранее, первые вариации	и 6.7 совпадают и, следовательно, в силу
предложения 1, L*[ = р (t) есть непрерывно дифференцируемая функция и выполнено уравнение Эйлера (6). Интегрируя по частям выражение (9) для первой вариации функционала 6«$(х*( •),%(•)) по Лагранжу и
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
117
воспользовавшись уравнением Эйлера, мы приходим к тому, что
6$ (х. (•), X (•)) = (t' (х. (Q) — р (/„)) х (t0) +
+ W (*.('>)) + ? 044-
В силу соотношения (10) отсюда следует, что
^0 (х* (М)= Р (М> “ (*• (М) = Р (Q-
Мы пришли к следующему утверждению.
Предложение 2. Пусть в задаче Больца (8) функции -фо, t|)i и L являются непрерывно дифференцируемыми. Для того чтобы функция x*(t) доставляла слабый локальный минимум в задаче (8), необходимо, чтобы было выполнено уравнение Эйлера
(-4l*+l‘)I , =°	(и>
\ at	/	(0
с краевыми условиями
р (Q=Lx L. «.у=(х* (М)’
',W=L*L«.1=-4’:W'1))-	(12)
Все сказанное нами выше безо всякого труда распространяется на векторный случай. Например, если рассмотреть простейшую векторную задачу, где в (1) х(.)еС?([/0,/1]), хоеГ,	L: R X R" X R"-> R,
то мы придем к уравнению Эйлера, имеющему в векторной записи вид (6). На самом деле это — система п уравнений второго порядка:
— -^-L.i (^ х1, ..., хп, х1, ..., хп) +
+ Lxi (/, х1, ..., хп, хх, ..., хп) = 0,	(6')
где i= 1, п. Общее решение этого уравнения зависит от 2п параметров, которые «тратятся» на удовлетворение краевых условий.
Аналогично дело обстоит и с простейшей векторной задачей Больца, когда в (8) х (•) е С\ ([/0, /J), *ф0: R" —> R, R"->R, L: R X R" X R"-> R. Здесь снова уравнение Эйлера имеет в векторной записи тот же вид (11)
118
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
и при этом выполняются краевые условия (12), имеющие также векторный смысл.
Доказательство этих утверждений мы предоставляем читателю.
2.2.2.	Иллюстрации и обсуждения. Уравнение Эйлера для простейшей задачи является полным аналогом уравнения Ферма = 0, о котором мы говорили во введении. Чтобы показать это, проведем «неэлементарный», функциональный вывод уравнения Эйлера.
Рассмотрим подпространство Lo пространства Ci([/o, Л]), о котором говорилось в предыдущем пункте, и задачу (1) представим, как задачу без ограничений:
f (Х(.)) = / L(t,x, (0 + х (О, X, (0 + х (0) dt -> inf; (13)
где x#(f)—функция, подозреваемая на экстремум в задаче (I), х(-)е Lo-
Совершенно аналогично тому, как это было проделано нами в примере 8 из § 0.2, показывается, что функционал f в (13) дифференцируем по Фреше в пространстве Lo и его производная в нуле имеет вид
<f' (0), Х( •)) = / (q (t) x(t) + p (0 х (0) dt, h
где функции q(t) и p(t) были введены в предыдущем пункте.
Уравнение Ферма f'(0) = 0 равнозначно тому, что г,
j (q (t) х (/) + р (0 х (/)) dt == 0, Vx (•) <= Lo. (14)
Проинтегрировав первое слагаемое в (14) по Дюбуа-Раймону и воспользовавшись тем, что в качестве функции y(t) — x(i), x(-)eL, можно взять любую непрерывную функцию, в среднем равную нулю, мы получим, что линейный функционал в пространстве С (Ro, L]), равный
ft / ft	\
J I J Я (т) dx + р (0 I у (t) dt,
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
119
обращается в нуль на подпространстве тех функций y(t) из С([/0Л1]), Для которых
J y(t)dt = Q.
В силу следствия из леммы об аннуляторе (см. § 0.1) мы сразу получаем:
J q (т) dx + р (/) = Ло, t
а это и есть уравнение Эйлера.
В силу отмеченного обстоятельства простейшая задача вариационного исчисления есть бесконечномерный аналог задач на отыскание безусловного экстремума функций нескольких переменных. Но вместе с тем в задачах вариационного исчисления возникают дополнительные в сравнении с классическим анализом эффекты, связанные со спецификой этих проблем. Переходим к иллюстрациям.
Пример 1. Решение уравнения Эйлера существует, единственно и доставляет абсолютный экстремум в поставленной задаче:
1
J1(X(.))= [ х2(0dt-*inf; х(0) = х(1) = 0.
6
Уравнение Эйлера здесь таково: х = 0. Решение, удовлетворяющее граничным условиям, единственно: х*(/)=0. Ясно, что оно доставляет абсолютный минимум в поставленной задаче.
Пример 2. Решение уравнения Эйлера существует, единственно, дает слабый экстремум, но не дает сильного экстремума:
1
^2(х(-)) = [ х3(/)<//->inf;
6
х(0) = 0, х(1) = 1.
120
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ '
Здесь уравнение Эйлера таково: -~(3x2) = 0. Единственное решение, удовлетворяющее граничным условиям: х*(/)=/. Пусть функция x(t) принадлежит пространству Ci([0, 1]) и х(0) = х(1)=0. Тогда функция %*(/) + х(/) является допустимой. Мы получаем:
1
^2(х.( •) + *(•)) = ^(t + x(t)))3dt== о
1 1
= 5Ш(-)) + з|х(/)Л + J(3x2(/) + x3 (/))<# = о	о
1
= ^2(Х. ( •)) + J (3x2(0 + x3(0)dZ.
6
Таким образом, если	,
3х2(0 + х3(/)>0, в частности, если
||х( • ) ||!<3,
ТО 3^2 (Х. ( • ) + X ( • ))	5^2 (*. ( • )). т- е- функция X, (0 — t
доставляет слабый локальный минимум в поставленной задаче.
С другой стороны, на последовательности функций х„(0 = х.(0 + йп(0,
где ft(0) = /i(l) = 0 и
• f — У~п, 0 t 1/п, hn(t)=	.
I /п (п-i)-1, 1/п<;<1, мы получаем значения
^2(ХП( •)) = -/» +0(1)-*-оо.
Остается заметить, что функции hn(t) сколь угодно близки к нулю в метрике С([0, 1]), если п—► оо. Получилось, что сильного экстремума здесь нет и inf J2 — = —оо. Причина первого явления — невыполнение уело-
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
121
вия Вейерштрасса. Причина второго вскрывается теоремой Боголюбова (см. п. 9.2.4).
Пример 3. Решение уравнения Эйлера существует, единственно, дает абсолютный экстремум, но не является функцией класса Ср
1
«73 (х (•)) = [ ^2/з*2 (0 dt -> inf;
6
х(0) = 0, х(1) = 1.
Этот пример принадлежит Гильберту. Здесь уравнение Эйлера имеет вид
4(2ГМ =0.
Его общее решение: x(t) = С/1/3 + D. Через заданные точки проходит кривая х*(/) = /1/3. Непосредственной проверкой легко убедиться, что функция x*(t) доставляет абсолютный экстремум в поставленной задаче. Но функция x*(t) не является непрерывно дифференцируемой.
Пример 4 (сопряженная точка): т
5<4(х(.))= J (х2(0— х2(0) rf/-*inf; х (0) = х (Г) = 0. о
Покажем сначала, что если Т тс, то нижняя грань функционала «74 равна нулю. Для этого достаточно привести функционал на подпространстве LQ={x(t)^ €еС{([0, Т]), х(0) = х(Г) = 0} к виду:
т
J (* (0 — x(t) • ctg О2 dt, о
из которого следует, что при Т < л функция х#(/)=0 — единственная минималь, а при Т = л все минимали суть x*(t, С) = С sin t.
(Отметим, что из-за того, что x(t)^Ci и х(0) = = х(Т) = 0, функция ctg/-x(O не имеет особенностей на [0, Т], если Т л.)
122
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Действительно, интегрируя по частям, мы получаем: т	т
| (х — х ctgО2 dt = J (х2 + х2 ctg2/ — 2хх ctg/) dt = о	о
т	т
= j (х2 + (ctg21 — 1 /sin2 /)) dt = J (x2 — x2) dt, о	0
что и требовалось.
Разберем теперь случай, когда Т > л. Легко подсчитать, что если x(t, Х) = Хзт(л//Г), то
3, (х (•, Л)) -	(л2/Г - 1) -+ - ОО
при X—>оо.
При малых же значениях % функционал 3 ± отрицателен, в то время как сама функция х(/, X) сколь угодно близка к нулю в метрике Ci([0,7]), т. е. экстремаль х# (/) = 0 не доставляет даже слабого минимума.
Уравнение Эйлера нашего функционала имеет вид х + х = 0. Нули нетривиальных решений этого уравнения, удовлетворяющих условию х(0) = 0, называются точками, сопряженными с точкой нуль. В нашем случае такие решения имеют вид x(f, С) = С sin t. Важнейшее значение имеет то, принадлежит первая сопряженная точка отрезку [0, Т] или нет. Условие минимума, касающееся сопряженной точки, — условие Якоби — мы обсуждаем в п. 2.2.5.
Подведем итог. Мы обнаружили случаи, когда
— решение уравнения Эйлера существует, единственно, но не дает ни сильного, ни слабого экстремума: Т > л, Т #= kn\
—	решений бесчисленное множество и все они доставляют абсолютный минимум в поставленной задаче: Т = л;
—	решений бесчисленное множество, но ни одно из них не доставляет ни сильного, ни слабого минимума: Т > л, Т = kn, k > 1.
Пример 5. Не существует ни одного решения уравнения Эйлера, более того, нет абсолютно непрерывного
$ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
123
решения вообще:
1
^5(х(.))= р2х2 (/)<#-> inf; х(0) = 0, х(1) = 1 о
(ср. с примером 3).
Этот пример принадлежит Вейерштрассу. Он выдвигался Вейерштрассом в качестве аргумента против римановского обоснования принципа Дирихле.
Здесь уравнение Эйлера (2/2х) = 0. Его общее решение x(t) = Ct~x + D. Через нужные нам точки че проходит ни одна кривая этого семейства. Более того, решение задачи не существует в классе абсолютно непрерывных функций, ибо на любой такой функции 0, в то время как значение задачи равно нулю. Действительно, если взять минимизирующую последовательность Вейерштрасса
хп (0 = arctg nf/arctg п
или xn(t)— tl/n, или еще проще —
| nt, 0^/s^l/n, = | 1, !/«</< 1,
то обнаружится, что (х„ (•))-> 0 (3^ (уп (•))-> 0).
Примеры 3 и 5 являются частными случаями задачи 55; они обсуждаются в § 9.2. Там же разъясняется причина, по которой в примере Вейерштрасса нет решения.
2.2.3. Необходимое условие Вейерштрасса. Условие Вейерштрасса в отличие от уравнения Эйлера есть условие сильного экстремума. При выводе этого условия будем использовать специальные вариации, которые были введены по сути дела самим Вейерштрассом и потому мы называем их вейерштрассовскими. Производная той добавки, которая входит в определение вейер-штрассовской вариации, напоминает иголку, которая при стремлении параметра X к нулю делается более узкой, но не уменьшается в равномерной метрике. Подобные вариации будут использованы нами и при выводе простейшего варианта принципа максимума в § 2.4.
124
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Пусть f(x)— некоторая гладкая функция на прямой. Функция двух переменных (х, £): R X R-* R,
^(хд)=/а)-нх)-гт-х)	(15)
называется функцией Вейерштрасса функции f.
Геометрически <^/(х, £) есть разность между значением f в точке g и значением в той же точке аффинной функции, касательной к f в точке х (рис. 3). Отсюда, в частности, следует, что если f выпукла, то ее функция
Вейерштрасса является неотрицательной.
Данное нами определение легко распространяется на конечномерный случай. Пусть X=Rn и f: Rn—>R — гладкая функция. Функцией Вейерштрасса называется функция
&f(x, g): R"XR"->R, определяемая равенством
&) =
(15')
Переходим к выводу необходимого условия Вейерштрасса. Начнем с простейшей задачи (1). Будем предполагать, что выполнено стандартное для вариационного исчисления требование относительно гладкости, а именно, потребуем непрерывную дифференцируемость интегранта в некоторой области U пространства R3, в которой содержатся точки (/, х*(/), х*(/)), /е[/0, М, где	С1([/0Д1]). Функцией Вейерштрасса интег-
ранта L называют следующую функцию четырех переменных:
8 {t, х, х Д) = L (/, х Д) — L (t, х, х) -
— &-х)Ц(1,х,х). (16)
Мы видим, что это — функция Вейерштрасса & L относительно последнего аргумента х, a t и х играют здесь роль параметров. Наша цель теперь — доказать такое утверждение.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
125
Предложение 3. Пусть в предположениях относительно гладкости L и %*(•), о которых говорилось выше, функция x*(t) является экстремалью в задаче (1). Тогда для того, чтобы функция %*(•) доставляла сильный локальный минимум в задаче (1), необходимо, чтобы для любой точки t(=(to, /О и любого ее-	’I /X
щественного числа g	Ц /
было выполнено нера- >-------LL__________________
г г+Л
О, *Л), W
(17)
Последнее соотношение и называется условием Вейерштрас-са сильного минимума
задачи (1).
т+Л
Отметим, что условие Вейерштрасса все-
Рис. 4.
гда выполнено, если
интегрант L является выпуклой функцией последнего аргумента х. Такие интегранты называют квазирегу-лярными.
Доказательство. Нам надлежит описать класс вейерштрассовских вариаций. Пусть	Выбе-
рем 8 > 0 так, чтобы т + 8 < i[. Пусть X— число, заключенное между 0 и 8. Через h(t, X) обозначим следующую непрерывную функцию:
h (t, Л) =
О, если t ф. [т, т + в], если / = т + Л, линейна на отрезках [т, т + AJ
и [т + Л, т + е]-
На рис. 4 мы изобразили и функцию h, и ее производную. Производная функции h напоминает иголку, что и дало повод (как уже говорилось) вариации такого вида называть «игольчатыми» вариациями. Класс вейерштрассовских вариаций строится теперь так:
x(t, Л) = хД0 + Ш Л).

126
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Функция х(/Д) соединяет те же точки, что и функция х*(/). (Правда, она не является непрерывно дифференцируемой функцией, но является допустимой в том смысле, что она принадлежит IT», 1 и на ней функционал 3 определен.)
Составим функцию
ф(Х) = 5<(г(., Л)).
Распишем ее подробнее:
Ф (Л) = J L (t, х (t, Л), х (t, Л)) dt =
*	Т+Л
=	+ f L(t, x.(0 + ('-tR. *Jt) + t)dt +
T
T+e
4- j L(t, x,(t) + ^-^(e-K)-'(t-r-X),xt(t)-Т4-Л,
— Xg (e - Л)-1) dt - j L (t, x, (0, xt (0) dt. %
Дифференцируя ф (Л.) по параметру Л и положив Z = 0, мы получаем, что
ф' (+0) = L (т, х, (т), х. (т) + £) — L (т, х, (т), х. (т)) +
+ &/ Lx dt-&~l jLx dt + O^). т x.(t)	*	x*(t)
Теперь воспользуемся тем, что x*(t) есть экстремаль, т. е. тем, что она удовлетворяет уравнению Эйлера. Здесь нам удобнее форма Дюбуа-Раймона:
/ k(т)dx + к t
Используя это соотношение, мы получим:
т+е
J LX к(0 dt = (т + е> Х. (т + е)> (т + е)> — t
х((т), х. (т)),
$ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
127
следовательно,
<р' (+0) = L (*> х* (*)» А (т) +1) — L (т> (*)> (*)) —
— gix (т, х* (т), х* (т)) + g (Lx (т + 8, х* (т + е), хф (т + е)) —
Т+8
- £&-1 J Ц (/. х, (0, х, (0) dt) + О (8). %
Если x*(t) доставляет сильный минимум в задаче (1), то должно выполняться неравенство <р'(+0)^0. Переходя в последнем соотношении к пределу при е-*0, получаем неравенство
L (т, х, (т), х, (т) +1) — L (т, х, (т), х, (т)) —
— Ш (т, х. (т), х, (т)) > 0,
которое и есть искомое условие Вейерштрасса.
Для простейшей векторной задачи все наши рассуждения обобщаются очень просто. Функция Вейерштрасса для интегранта простейшей векторной задачи есть такая функция Зп + 1 переменных:
<£ (/, х, х, g) = L (/, х, g) — L (/, х, х) — (g — х | Ljt (/, x, x)).
Вейерштрассовские вариации имеют тот же вид:
х(/, Л) = хД/) + А(^ А),
где, однако, функция Л(/Д) зависит не от трех, как это было раньше, а от п + 2 параметров (ибо g = = (g1, ..., здесь вектор). В итоге мы приходим к совершенно аналогично формулируемому условию Вейерштрасса: для сильного экстремума простейшей векторной задачи необходимо, чтобы на экстремали х*(/) выполнялось неравенство
^(0, У>0, VgeR", /е(/0, Л).
Выше отмечалось, что необходимое условие Вейерштрасса всегда выполнено для квазирегулярных функционалов. В п. 9.2.4 будет доказана важная теорема Боголюбова, из которой следует, что для любой простейшей векторной задачи классического вариационного исчисления существует эквивалентная ей задача с квази-регулярным интегрантом. Это позволяет, по крайней
128
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
мере теоретически, считать, что необходимое условие Вейерштрасса всегда выполнено.
2.2.4. Условие Лежандра. Условие Лежандра, а также условие Якоби, о котором речь пойдет в следующем пункте, суть условия «второго порядка», т. е. условия, связанные со вторыми вариациями. Вторая вариация для функционалов классического вариационного исчисления — это квадратичный функционал, а условия Лежандра и Якоби — это условия, при которых этот функционал является неотрицательным. Теории квадратичных функционалов специально посвящены §§ 6.2, 6.3. Развитая там теория позволяет получить условия Лежандра и Якоби для общих задач классического вариационного исчисления. Здесь же ограничимся рассмотрением лишь простейшей задачи.
Итак, рассмотрим задачу (1). Сначала вычислим вторую вариацию функционала <7(х(-)), входящего в определение задачи (1). Здесь надлежит наложить дополнительные требования гладкости на интегрант £(/, х, у). Для того чтобы обеспечить себе полную свободу при проведении дальнейших выкладок в этом, а также и в следующем пункте, будем требовать, чтобы лагранжиан L был трижды непрерывно дифференцируемой функцией своих переменных в некоторой области t/czR3, в которую входят точки (/, x*(/),x*(0), е [/о, tij, где х* (/) — некоторая дважды непрерывно дифференцируемая функция, являющаяся экстремалью, что означает выполнение уравнения Эйлера
-»
При сделанных предположениях возможно двукратное дифференцирование функции
<р(Л) = 5<(х.(.) + М-)) =
= J L (t, xt (t) + kx (t), х, (0 + kx (/)) dt (18) ^0
под знаком интеграла. Произведя это дифференцирование, после элементарных выкладок придем к следующей
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
129
формуле:
Л
Х(х(-))==62^(хЛ-), *()) =	x(t), x(t))dt =
^0
Л
= J (Л (0 х2 (/) + В (0 х2 (/) + 2С (0 х (О X (/)) dt = 6
= ]’(л(0х2(0 + (в(П--^-С(0)х2(0)^,	(19)
где
=	В(0 = ^|хио,
С(0 = ^1хио.
В силу того что х*(0 есть экстремаль нашей задачи, получаем, что первая вариация 6«7(х*(-), %(•)) обращается в нуль на всякой функции х(/), обращающейся в нуль на концах отрезка [t0, t\]. (Совокупность таких функций, так же как и в п. 2.2.1, мы обозначим Lq.) В силу сказанного, функция <p(Z) имеет в нуле производную, равную нулю, если только функция
А из необходимого условия минимума для функции одного переменного ф,,(0)^0 получаем следующее необходимое условие минимума в задаче (1): для того чтобы экстремаль х*(/) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы квадратичный функционал У^(х) был неотрицателен на пространстве Lq.
Предложение 4. Пусть выполнены все предположения относительно гладкости лагранжиана L и функции x*(t), о которых говорилось выше. Пусть, кроме этого, функция x*(t) является экстремалью задачи (1). Тогда для того, чтобы функция x*(t) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы для любого t s [/0, ^i] выполнялось неравенство
A(t) = L^(t, xj/), хД0)>0.	(20)
Это соотношение называется условием Лежандра,
5 А. Д. Иоффе, В. М. Тихомиров
130
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Доказательство. В силу сказанного выше достаточно показать, что если в некоторой внутренней точке отрезка выполнено неравенство
А (т) < 0, tQ < т < tb
(21)
то квадратичный функционал Jjf(x) не является неотрицательным. (В силу наших допущений относительно L и %*(•) функция A(t)
1	Д	является непрерывной и
I	/\	даже дифференцируемой,
УГ	/ \kit,A,r)	поэтому допущение о
2	/ \	том, что неравенство (21)
I /	\	выполнено во внутрен-
;---------4ней точке, не нарушает
'°	‘ г+~г	общности наших рас-
смотрений.)
Рис- 5-	Пусть через /?*(/) обо-
значена функция, тождественно равная нулю. Рассмотрим следующую вариацию функции /гД/) (рис. 5):
Л /V2 —I /т |/]А при |/ —т|<Х/2, I 0 при \t — т |> Х/2.
Из определения функций h(t, %, т) сразу можно усмотреть, что при X—>0 они сами стремятся к нулю, а произведения Л(/, X, т)/г(/, X, т) при этом равномерно ограничены по модулю некоторой константой, которую мы обозначим буквой С. Следовательно:
б2У (хД • ), h (•, X, т)) max А (/) +
|т I С Л./2
+ ХС max С (t) + max В (/) • о (Л) -> А (т) < 0. р-т|<Х/2	| т | < Л/2
Мы получили, что при некотором Хо функционал (Л(«, Хо, т)) принимает отрицательное значение. Для того чтобы полностью доказать предложение, остается сгладить три угла у функции Л(-,Х0, т) с тем, чтобы получилась функция h\(t) из Ci, на которой функционал X(hi (' •)) = д2^ (хД •), /ti (•)) отрицателен. (Напомним, что речь идет о слабом экстремуме!) Предложейй^ доказано.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
131
Замечание. Предложение 4 может быть сразу выведено из условия Вейерштрасса. Действительно, если Д(т)<0, то условие Вейерштрасса для функционала в точке т не выполнено (ибо <^(/, х, х, |) равна здесь Д(/)(£— х)2). Значит, существует ломаная х(/), сколь угодно близкая в метрике С к нулю, на которой Д^(х(-))<0. Сгладив ее и умножив на малую константу, мы приходим к доказательству предложения 4.
2.2.5. Условие Якоби. Все три необходимых условия экстремума, о которых речь шла выше, а именно, уравнение Эйлера, условие Вейерштрасса и условие Лежандра, имели локальный характер в том смысле, что требовали для своей проверки вычислений в отдельных точках*). С другой стороны, ясно, что одних локальных условий недостаточно, чтобы получить удовлетворительные необходимые условия в классическом вариационном исчислении. Это видно, скажем, из такого примера. Дуга большого круга является кратчайшей линией на сфере, соединяющей две заданные точки, только при том условии, если внутри нее нет диаметрально противоположных точек сферы. Если же такие точки существуют, то она не будет давать решения о кратчайшей линии, соединяющей заданные точки. Вместе с тем любая малая часть этой дуги является кратчайшей и, следовательно, в любой точке этой дуги выполнены все локальные необходимые условия экстремума. Все дело в том, что более короткий путь, соединяющий концы нашей дуги, получается не локальной, а глобальной вариацией.
Условие Якоби как раз и является основным глобальным необходимым условием локального минимума. Так же, как и условие Лежандра, оно есть условие неотрицательности квадратичного функционала.
Итак, снова рассмотрим простейшую задачу (1) и будем считать, что выполнены все допущения, при которых мы вывели условие Лежандра. Рассмотрим квадратичный функционал, являющийся второй вариацией
*) То понятие локальности, которое обсуждается здесь, имеет иной смысл, чем ранее, когда мы говорили, скажем, о локальном экстремуме. Здесь говорится о локальности и глобальности необходимых условий (локального экстремума!), т. е. об условиях, требующих для своей проверки отдельных точек кривой или кривой В целом.
5*
132
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
функционала У(х(•)):
Х(х(-)) = д25<(%,(•), х(.)) =
f.
= | (л (О у? (О + (в (0 -4 с (0) х2 (о) dt. ta
Уравнение Эйлера функционала X имеет вид
- 4 И (О X) + (в (/) - 4с (о) X = 0.	(22)
Уравнение (22), т. е. уравнение Эйлера второй вариации функционала «7(х(-)), называется уравнением Якоби задачи (1). Уравнение Якоби — линейное дифференциальное уравнение второго порядка. Предположим, что выполнено следующее строгое неравенство:
A(t) = L^(t, хД/), О))>0.
Это неравенство называется усиленным условием Лежандра. Пусть это условие выполнено. Уравнение (22) можно переписать так (предположения относительно L и х* позволяют это сделать):
— А (/) х — А (0 х + (В (0 — С (0) х = 0, или
х— P(t)x — Q(t)x = O.	(23)
Для таких уравнений имеет место теорема существования и единственности для задачи Коши. В частности, решение Ф(/, to) уравнения Якоби с краевыми условиями Ф(/0До)=О, Ф(/оЛо) = 1 существует и единственно.
Нули этого решения, отличные от точки /0, называют точками, сопряженными с точкой to.
Предложение 5. Для того чтобы функция x*(t) доставляла слабый минимум в задаче (1) (при предположениях относительно гладкости L и х*(-), при которых было выведено предложение 4, и при выполнении усиленного условия Лежандра), необходимо, чтобы на интервале (to, t\) не было точек, сопряженных с точкой t0.
Это условие называется необходимым условием Якоби.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
133
Доказательство. Допустим, что имеет место обратное, т. е. существует точка т (/о<т<6) такая, что
Ф(т, /о) = О.
Заметим, что Ф(т, /о) ¥= 0, ибо иначе в силу единственности решения задачи Коши уравнения (23) с данными Коши х(т) = х(т) = 0 мы получили бы, что ф(/,/о) = О, что проти-воречило бы равен-ству Ф(/,/0)= 1.	уГ	X.
Обозначим через	л л
/?(/) функцию, совпа; *о	т~^т г+е t,
дающую с Ф(^До) на	Рис. 6.
[/о, т] и равную нулю при t т. Это — «ломаная экстремаль», она состоит из двух экстремальных кусков.
Покажем, что JSf (А (•)) = 0. Действительно, интегрируя по частям, мы получим:
Ж (h (•)) = J (А (I) Ф2 (t, t0) + (В (/) - С (/)) Ф2 (/, /0)) dt =
*0
=П-4и(оф(^/о)1+
+	(/)) ф (/, /о)) Ф(Л *о) dt=Q.
Построим теперь вариацию функции h (t) (рис. 6)
h (t, А, т, e) =
h (0>	г — A,
линейна на отрезке [т — X, т-|-е],
(0,	/>т + е.
Вычислим <p(Z) = Ж (h (• , Я,, т, е)). Имеем *): Ф (X) — <р (0) = ф (А) =
т+е	т
= J К(/, h(t, A.), h(t, b))dt— J K(t, h (t), h(t))dt, X—к	т—A,
*) Для сокращения мы вместо /г(^,Х,т, е) пишем h(t, X).
134
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
при этом по теореме о среднем из дифференциального исчисления	.
|й(т — Л, Л)|==|й(т —Л)| = |ЛА(О1)|, т — Л С 0!<т,
1/;(Лх)| =|-/,-^. ех) |=т^-|й(е|)|> т-л</<т + е, | Л т с I Л Е
откуда по теореме о среднем из интегрального исчисления
ф (Л.) = (Л + е) А (02) Л2 (9,)	- Ы (03) h2 (03) + о (Л),
где т — А, 62 т + в, т — Л 03 т.
Отсюда сразу
получаем, что
Ф'(+ 0) = - А (т)/г2(т) < 0.
Значит, существуют такие и 80, что Ж (А (•; Л,о, т, 80))<0. Остается «сгладить» h (/, Ло, т, 80). Предложение 5 доказано.
§ 2.3. Задача Лагранжа. Уравнение Эйлера — Лагранжа
В этом параграфе выводятся уравнения Эйлера — Лагранжа для задач классического вариационного исчисления с ограничениями. В основе вывода лежит правило множителей Лагранжа, доказанное в гл. 1. Отрезок [/0, Л] в этом параграфе предполагается фиксированным.
2.3.1. Задача Лагранжа в разрешенной форме без фазовых ограничений. Рассмотрим следующую экстре* мальную проблему:
3 (х (•), и (•)) = [ f (/, х, и) dt -> inf;
	(1)
Х = ф(/, X, и),	
Ло(х(/о)) = О, Л1(хО = 0.
Мы видим, что здесь дифференциальные ограничения имеют разрешенную .форму и фазовые ограничения отсутствуют. Будем считать, что выполнены стандартные для классического вариационного исчисления требова
§ 2.3. ЗАДАЧА ЛАГРАНЖА
135
ния гладкости, а именно, предположим, что отображения f: RXR"XRr->R, <p: R X R" X Rr-> R"
непрерывно дифференцируемы по совокупности переменных в области U cz R X R" X Rr, содержащей точки (/, х, (/)» иЛ0),	а отображения
ht-.	j = 0, 1,
непрерывно дифференцируемы в областях Vt, i = 0, 1, содержащих точки z = 0, 1. При этом (х. (t), и, (/)) принадлежит пространству С" ([/о, Л])ХСг(^о. Л]).
Обозначим через L = L(t, х, х, и, р, Лэ) функцию £ = A.of(/, х, и)-\-(р\х— q>(t, х, и)), L: R X R" X Rn X Rr X R" X R -* R.
Эту функцию будем называть лагранжианом задачи (1).
Функцию S = 2! (х (•), и (•), р ( •), /0, /i, AJ:
г,
2 = [ L(t, x(t), x(t), u(t), p(t), ka)dt +
+ (/0|Ло(хО) + (/1|А1(х(^1))),
S-. Cf ([fo, /J) X Cr ([fo, M X С? ([fo, M) X RSoXRS1XR->R, назовем функцией Лагранжа задачи (1).
Теорема 1. Для того чтобы пара (**(•), «*(•)) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы нашлись такие не равные одновременно нулю множители Лагранжа XaeR, Ло^О, / = 0, 1 и р( • )е Cf ([/о, ZJ), что
а)	выполнено уравнение Эйлера для лагранжиана L по х:
с краевыми условиями
l(x# — ho (х* (/о)) 1о,
136
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
б)	выполнено уравнение Эйлера для лагранжиана L по и:
LU 1(х#(/), и* (t)) = 0-	(4)
Совокупность уравнений (2) и (4) называется уравнением Эйлера — Лагранжа задачи (1). Приведем развернутое выражение полученных уравнений. Уравнение (2) в развернутом виде имеет форму дифференциального уравнения в векторной форме:
- Р (0 = ф; (*, (О, и* (/)) р (/) - Wx (t, ** (О, и* (/)).	(2')
(На самом деле это система п уравнений.) Его называют сопряженным уравнением. Соотношения (3) суть краевые условия для уравнения (2х):
р (/о) = ho (х. (/о)) /о,	|
= — hi (х, (Л))/ь )
Они называются обычно условиями трансверсальности. Наконец, уравнение (4) имеет вид
ч>; (t, х, (о, и, (0) р ю=(t, х, (о, и, (0).	(4')
В теореме 1 снова находит свое подтверждение принцип Лагранжа. Составив функцию Лагранжа мы пишем затем необходимые условия экстремума для задачи без ограничений:
-> inf.
Если в этой последней задаче зафиксировать «*(/), то получается простейшая векторная задача Больца и соотношения (2), (3) находятся в полном соответствии с предложением 2 предыдущего параграфа, где мы вывели необходимое условие для простейшей задачи Больца. Далее, если в функции Лагранжа зафиксировать то мы получим по и простейшую векторную задачу, где лагранжиан не зависит от й. Уравнение (4) написано в полном соответствии со следствием 1 из предложения 1 предыдущего параграфа.
Доказательство теоремы 1. Задача (1) относится к числу гладких задач, к которым применимо правило множителей Лагранжа (теорема 1 из § 1.1). Покажем это.
В силу того, что в теореме речь идет о слабом экстремуме, мы нашу задачу должны рассматривать в пространстве С\ ([/о, ^i]) X Сг ([/0» Л])‘ Для краткости обозначим это пространство через Z, а пару (х(-),и(-)) бу
5 2.3. ЗАДАЧА ЛАГРАНЖА
137
дем обозначать z. Обозначив через У пространство С" (Ко, Л])> положим:
f0(z) = ^(x(-), «(•)),	f0: Z —> R,
F(z)(t) = x(t)-q(t, x(t),	F: Z^Y,
Hi(z) = ht(x(ti)), Ht-. Z->Hsi, 1 = 0, 1.
Тогда задача (1) примет вид (6)—(8) из § 1.1: f0(z)->inf; F(z) = 0, |
Ht (z) = 0, z = 0, 1. J	'1 ’
Нужно проверить условия следствия 2 из теоремы 1 из § 1.1. Все функции и отображения, входящие в формулировку задачи (Г), являются непрерывно дифференцируемыми в окрестности точки г* = (**(• ),«*(•)). Действительно, функция fo(z) является суперпозицией fo = 3^2 aSf\ отображения
(г) = f (t, х (t), и (0),	3f{-. Z -> С ([/0> К]),
дифференцируемость которого была доказана в примере 6 из § 0.2, и линейного непрерывного функционала:
ti
= J	Sf2-. С (Ко,
fo
дифференцируемость которого была установлена в примере 1 из § 0.2. Приведем формулу для производной функции fo(z):
f'0(z.)z = Sfr(xt(-), «.(•))(х(-), «(•)) =
= J((a(0|x(0) + (b(0l«(0))^, (5) ^0
а (0 = fx У, (0, (/)), b (/) = fu (/, х, (0, и. (0).
Отображение 77(z) есть сумма непрерывного линейного отображения
z-> х
и отображения
— <р(/, х(0, и(/)),
138
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
дифференцируемость которого была доказана в примере 6 из § 0.2. Таким образом, F (z) является дифференцируемым отображением и его производная равна:
А (0 = Фх (/, xt (0, «. (/)), в (о = ф„ (/, %,(/), ил)). J
Наконец, отображения H^z), i = 0, 1, являются дифференцируемыми в силу доказанного в примере 4 из § 0.2, и их производная равна
H'i(z*)z = ViXtti), z = 0, 1,	|
/ = 0, 1. J	U
Осталось доказать регулярность отображения F(z) в z*. По определению понятия регулярности это означает, что для любого #(•)<= О ([/о, Л]) мы должны решить уравнение
х (/) — А (/) х (/) — В (/) u(t) = y (/),
где матрицы Л(/) и В (Г) определяются соотношениями 6). В силу условий, наложенных на отображение ф(/, х, ц), и в силу того, что (х*(/),и+(/))еС1 ХСГ, получаем, что матрицы 4(/) и В(1) непрерывны. Воспользовавшись теоремой 1 из § 0.4 о разрешимости системы линейных уравнений, мы получим регулярность отображения F.
Теперь применим правило множителей Лагранжа. Составим функцию Лагранжа задачи (Г):
& = Wo (2) + </, Р (*)> + (/о I Яо (г)) + (/, | /7, (г)).	(8)
В соответствии с правилом множителей Лагранжа найдутся такие множители Лагранжа z/*, /0> А, Хо, что в точке z* выполнены соотношения
<2\ = 0, ^0,	(9)
равносильные соотношению 2?z = 0.
Но Y = Сп ([/0, /J). Следовательно, в силу теоремы Рисса об общем виде линейного функционала в про
§ 2.3. ЗАДАЧА ЛАГРАНЖА
139
странстве О, существует регулярная борелевская мера и такая, что
Л
GA */(•)) = /(//(01^(0).	(Ю)
tfi
Соотношение (10) можно переписать по-другому: п tx
{у\ ?(•)) = ? f	(109
i=l fo
Здесь Цг(/)—функции ограниченной вариации, непрерывные справа, за исключением, быть может, точки /о- Подставляя (10) в (8), получаем, что
Л	Л
S = J w dt + J (X - ф I rfjx) + (/о I h0(x Ш + (/i IЛ 1(х (/,))).
Сначала исследуем первое из уравнений (9). Имеем: fi
^(г.)х(-)= / (koa(t)\x(t))dt + ffl
t,
+ J (* (t) - A (t) X (0 | du (0) + (/о I rox (Q)+(/i I r,x ao). (11)
Проинтегрируем по частям слагаемые, содержащие под знаком интеграла x(t):
t,
j (/) | х (/)) dt = t c
f./ Л	\	/ fl	X
= | I | Кйа (т) dx | x (t) j dt + I J A.oa (t) dx | x (t0) I,
fo f	'	\fo	/
J (Л (о X (t) | du (t)) = ( f	f
; = j ( J 4*(t)dH(T) |x(0j dt+'( J A'(x) dp(x) |x(/0)
X. V	J \t,	J
140
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Подставив эти выражения в (11) и воспользовавшись тем, что
f« x(*i) = x(A>) + J x(r) dr, h получим: ty / ь
(z.) X (•) = j I x (t) I J koa (x) dr — /. \ t
X	ti
- J Л* (x) du (T) + П/l | dt + J (x (/) | dp (/)) +
t	J t,
/	ft	fi	\
+ х(/0)|Го/о + П/1 +j koa(r)dr— J Л*(т)с?ц(х) . (12) \	t,	/
Выражение (12) представляет собой непрерывный линейный функционал в пространстве С":
^(z.)x(-)= J(x(O|dv(/)) + (a|x(to)),	(13)
fo где f fi
v (0 = j* (0 + / J Ka (T) dr dt — t. t
t ti
4*(T)dp(-r)^+lW, fo f fl	fl
a = Г5/о + П/i + J Aoa (x) dr - j A* (x) dp (x).
t,	f
(13')
В силу единственности представления линейного функционала в пространстве С" в виде (13) и из уравнения ^х = 0 получаем, что
v(/)s0, а = 0.	(14)
Из (14) и (13') видно, что вектор-функция ц (/) абсо. лютно непрерывна. Положим p(t) = p(t). Тогда из (14)
§2 3. ЗАДАЧА ЛАГРАНЖА
141
и (13) следует, что p(t) удовлетворяет уравнению ti	h
p(t)+ J (т) dx — j 4* (т) p (t) dx + rjZi = 0. (15) t	t
Подставив в (15) t — tQ и воспользовавшись выражением для а в (13х), получим:
р (Zo) = Го/о-
Если положить t = t{i то мы придем к равенству p(^i)= = — TiZi. Наконец, продифференцировав (15), приходим к уравнению:
— /?(/) = 4*р (/) — кда (/).
Соотношения (2х), (3х) доказаны. Подставив теперь вместо rfjui(Z) в формулу для 3?и выражение p(t)dt, получим, что линейный функционал в пространстве Cr([ZoJi]) вида
(г‘) «(•) = /	(0 - В* (0 Р (0 I и (0) dt
^0
равен нулю. По теореме Рисса отсюда следует, что
О)р(0 = W)-
Соотношение (4х), а вместе с ним и теорема 1 доказаны.
2.3.2. Изопериметрическая задача. Изопериметриче-ской задачей в вариационном исчислении называют такую проблему минимизации:
Л
3 (х (•)) = J /о *) dt -> inf; ^0
j fl (t, x, x) dt = a/t j=l, m,
Ao(x(Q) = A1(x(/1))=O,
(16)
fa RXR"XRn-*R, /=0, .... m, ht:	i = 0, 1.
142
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Если ПОЛОЖИТЬ и1 — xl,	/ = 1, ..., п,
х,+п = ff (/, X, и), j = 1, .. ., tn, то получится такая задача Лагранжа:
З' (х(-), u(-))=J fo((> я1....хП> • • •> и") dt -> inf;
*0
X1 = Ul, 1= I, . . ., П, Xn+i = Xх, Хп, UX, Un), hL(xx(t^, хп(/0)) —О, i= 1, 2, х"+/(/о) = О, xn+l =
Применив теорему 1 к этой задаче, приходим к следующему результату.
Теорема 2. Для того чтобы вектор-функция х*(0 доставляла слабый локальный минимум в задаче (16), необходимо, чтобы нашлись такие множители Лагранжа XjGR,	/iGR\ /==1, 2, не все равные
нулю, что для лагранжиана m
L (t, х, х) = S lift (t, х, х) i=<)
выполнено уравнение Эйлера
(—^Li + Lx)\ = 0;
' ai	7 lx* (О
при этом удовлетворяются следующие краевые условия'.
L* L* (tQ)=
ЬЩ) ~
Можно предложить читателю в виде упражнения получить вид необходимого условия в задаче со старшими производными:
Ц
J f (/, х, х, х, ..., х(п ) dt -> inf; to
сведя ее к задаче Лагранжа. Кроме того, непосредственно из тео
§ 2Л. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
143
ремы 1 § 1.1 легко вывести необходимое условие для задачи с фазовыми ограничениями, например, для такой:
Л
J f (t, х, х) dt -> inf; Ф(/, х) = 0, х (tQ) = xQ, х(/1) = х1,
f; R X Rn X R" -* R. Ф; R X R" -* Rw, m < n.
Для того чтобы обеспечить регулярность, достаточно потребовать выполнения условия
rank Фх (/, х (/)) = т, t^[t0, /J.
Необходимое условие в этой задаче будет также иметь вид уравнения Эйлера для лагранжиана
L = f(t,x, х) —(р (/) | Ф (t, х)).
§ 2.4. Принцип максимума Понтрягина.
Формулировка и обсуждение
Этот параграф посвящен формулировке и обсуждению основного необходимого условия экстремума в теории оптимального управления — принципа максимума Понтрягина. Мы приводим здесь также элементарное доказательство принципа максимума для специального случая задачи со свободным правым концом. Доказательство принципа максимума в полной общности содержится в § 2.5. Мы ограничиваемся в этой главе задачей оптимального управления без фазовых ограничений, отложив обсуждение задач с фазовыми ограничениями до гл. 5.
2.4.1. Формулировка принципа максимума. Задача оптимального управления без фазовых ограничений, как следует из объяснений, данных в § 2.1, формулируется следующим образом:
3 (х (•), и (•)) = J f (/, х, и) dt -> inf; (1) h
x==(f(t, x, и),	(2)
и е U cz Rf,	(3)
h0 (tQ, х(/о)) = О, AJ/j, х(/])) = 0	(4)
(f: RXR"XRr->R, <p: R X R" X Rr-> R",
hf. RXRre->R4 i = 0, 1).
144
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Предполагается, что все входящие в условие задачи функции и множества удовлетворяют условиям, указанным в п. 2.1.2. В качестве допустимых управлений, как уже отмечалось, рассматриваются ограниченные измеримые вектор-функции u(t), принимающие значения в U, а в понятие «локальный экстремум» или «оптимальный процесс» вкладывается тот же смысл, что и в п. 2.1.4.
Мы сформулируем принцип максимума в двух эквивалентных формах — «гамильтоновой» и «лагранжевой». Начнем с гамильтоновой формы.
Рассмотрим функцию
//(/, х, и, р, ^o) = (pl<₽(A	и))— W(A и)
(где peRn, Xo^R+), которую мы будем называть функцией Понтрягина. Переменные, обозначаемые буквой р, обычно называются импульсами. Наряду с функцией Понтрягина введем функцию
х, р, Хо) = sup Я (/, х, и, р, Ao), ue U
называемую гамильтонианом.
Теорема 1 (принцип максимума в гамильтоновой форме). Пусть (x*(t), u*(t))—оптимальный управляемый процесс в задаче (1) — (4), определенный на отрезке [/о*, Л*]. Тогда существуют не равные одновременно нулю число Хо 0, векторы lQ^ Rs°, 1Х s RSl и вектор-функция p(t) такие, что
а)	вектор-функция p(t) удовлетворяет сопряженному уравнению
p = — Hx = — (f>*x(t, х, (0, и, (/)) р + \fx (t, Xt (t), и, (/)) (5)
и условиям трансверсальности
Р (М ==: ^Q'C (Ah, (А)*)) А),	1
р(/ь) = ~йи(/ь, хДА*))/г, )	(6)
б)	почти при всех t из [Аг, Л*]
Н Ц, ** (0,	(0, Р М = max H(t, х* (/), и, р (/), Хо) =
и <= U
= ^x^,P®,hY, (7)
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
145
в)	гамильтониан x*(t), p(t), Л}) непрерывен на отрезке [/о*, Л*] и на концах его удовлетворяет соотношениям
х* (/о*)» р (Zo*)» Хо) — {h&t (Zos, х* (Zo*)) I Zo), ) Ж (6*, X. (6*), р (tu), М = (hxt (tu, xt (tu)) I /1). i
(8)
Отметим выражение для гамильтониана
получающееся в процессе доказательства, а также единообразную гамильтонову запись х = Нр, р — —Нх уравнений (2) и (5).
Перейдем к описанию лагранжевой формы принципа максимума. Напишем функцию Лагранжа задачи (1) — (4), такую же, как и в § 2.3:
= (/о I Йо (t0, X О) + (/, I ht (/,, х Ш + jLdt,
где
L (Z, х, х, и, р, Ло) = (р | х — ф (Z, х, и)) + W (Z, и)
— лагранжиан задачи (1) — (4).
Теорема V (принцип максимума в лагранжевой форме). Пусть (x*(Z), w*(Z))—оптимальный управляемый процесс в задаче (1) — (4), определенный на отрезке [Zo*, 6J. Тогда существуют не равные одновременно нулю число Хо 0, векторы Zo Rs°, l\ R*1 и непрерывная п-мерная вектор-функция p(t), при которых а) почти всюду на отрезке [Zo*, Л*] лагранжиан L удовлетворяет уравнению Эйлера по х\
= 0 (t) и=и* (Ц
и краевым условиям
L__f — hox (Zoi=, х* (Zo.)) /о»
1—-о*
Их — Н\х (^l*j X* (^н)) /1»
(5')
(6')
146
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
б) почти при всех t из [/о,, 1ь] лагранжиан L достигает минимума по и при u — ut (t):
L(t, х, (I), х-. (О, «. (О, Р(0> Ао) =
= min L(l, х, (I), х, (I), и, p(t), Ао); (7') u^U
в) функция Лагранжа 2? дифференцируема по справа в точке no t\ слева в точке 6» и
«TToL,..= 0' ^L.. = °’	,8'>
где через 0 [соответственно обозначены правая (левая) производные.
Проверка эквивалентности обеих формулировок принципа максимума не представляет труда. Действи-
Поэтому соотношения (5) и (5х), (6) и (6х) и (7) и (7х) попарно эквивалентны. Осталось проверить эквивалентность соотношений (8) и (8х). Отметим, что непрерывность гамильтониана не является независимым условием. Она вытекает из (5) и (7) (это будет видно из доказательства) и, следовательно, из (5х) и (7х). Далее, в силу (7х)
('о, Л, х. (•),...) = (/о I Ао do. х. (/о))) + U. IА! (Л, X. (I, ))) + л
4- / l(Pd)lx.(l))-^(i, х.(1), p(D, A0)]dl.
Поэтому при 8 > О
do. 4-е, Л, ...) — ^(to., ti, ...) =
= (lo I ЙО (to., 4- e, X. (lo. + e)) — ho (lo., X, (lo-))) — i
*o * +8
- J I(P (I) IX. (I)) - (I, X (I), p (I), A9)] dt =
= 8 (lo I hot (t0„ x. (lo.))) +
/	^0*4-8	\	/	?o*+8	\
+ I lol hox.(to„ x»(to.)) J x. (I) dt j — ip(/o»)j [ xjl)d/l4-
4- 8 Ж (lo., x. (lo.), p (to,), Ao) 4-0 (e) =
§2 4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
147
(в силу первого равенства в (6))
= е[(/о|/7оИ/о , хД^о ))) + ^(/о>, хД/оО, М] + о(е).
Полученное равенство влечет эквивалентность первых соотношений в (8) и (8'). Аналогично проверяется и эквивалентность вторых соотношений.
Теорема 1' и, следовательно, принцип максимума Понтрягина, является еще одной реализацией сформулированного во введении принципа Лагранжа, согласно которому необходимые условия экстремума в задаче с ограничениями совпадают с необходимыми условиями экстремума функции Лагранжа при ограничениях, не включенных в эту функцию. В самом деле, если множители Лагранжа Хо, /о, A, p(t) фиксированы, то функция Лагранжа 2 зависит от трех групп переменных: фазовых траекторий х(/), управлений u(t) и моментов времени /0, ti. Если теперь отрезок [to, ti] и управление u(t) зафиксировать, то задача о минимуме функции Лагранжа по x(t) имеет вид классической задачи Больца, а утверждение а) теоремы Г означает, что х#(0 удовлетворяет необходимому условию минимума функции Лагранжа по x(t) при фиксированных u(t) = u*(t) U to = to*, ti = /1*.
Точно так же, утверждение б) теоремы Г необходимо и достаточно для того, чтобы функция Лагранжа достигала минимума по всем допустимым управлениям (это единственное ограничение, не включенное в функцию Лагранжа, поскольку оно не носит функционального характера!) при фиксированном отрезке [/0*Д1*] и траектории x*(t) в точке u(t)—u*(i). (Это утверждение следует из интуитивно очевидной формулы
inf f g(t, u(t))dt= f inf g(t, u)dt, a{t)EU f	u(=U
*0	f0
строго доказанной в гл. 9 при значительно более общих предположениях.)
Отметим далее, что вектор-функции %*(/), u*(t) и p(t) можно продолжить левее точки и правее точки так, чтобы функция Лагранжа стала дифференцируемой по to и ti в точках и 6* соответственно. Для
148
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
этого нужно, чтобы х*(/) и p(t) оставались непрерывными, a u*(t) удовлетворяла соотношениям
lim H(tt %♦(/),	p(t), ko)=3@(to*, x*(M, p(tQ*)9 Zo),
t 4 ^o*
lim//(?, xt(t), ut{t), p(t), ho) = a@(ti*, x*(6*),	^o).
В этом случае из приведенной выше выкладки следует, что в силу (8') производные функции Лагранжа по /о и /1 в точках /о* и /1* соответственно равны нулю. Другими словами, утверждение в) теоремы Г означает, что моменты времени ^0* и удовлетворяют необходимым условиям минимума функции Лагранжа по /о a ti-
Выше мы отметили, что единственным ограничением, не включенным в функцию Лагранжа в теореме Г, было условие (3). Однако в конкретных случаях в функцию Лагранжа можно не включать и некоторые другие ограничения, главным образом граничные условия типа закрепленных концов и закрепленного времени. При этом соответствующие условия трансверсальности исчезают и (снова в подтверждение принципа Лагранжа) оставшиеся соотношения совпадают с необходимыми условиями минимума функции Лагранжа при ограничениях, которые в эту функцию не были включены. Действительно, если, например, hQ = х — х0 (закрепленный левый конец), то первое условие в (6) означает, что р(/0)= /0; если йо == t — а (закрепленный левый момент времени), то первое условие в (8) принимает вид 2$ |f==f =—lQ и т. д. Таким образом, множители Лагранжа, соответствующие закрепленным концам, совпадают со значениями p(t), а множители Лагранжа, соответствующие закрепленным моментам времени, — со значениями гамильтониана в соответствующих точках и не несут более никакой информации. Если р(/)==0, то и все эти множители равны нулю. Мы не коснулись условий, гарантирующих неравенство Хо =/= 0. Они очень громоздки и обычно проще непосредственно проверить, что Хо =/= 0.
До сих пор мы говорили о задаче с интегральным функционалом. В задаче с терминальным функционалом
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
149
ф(Л,х(Л)) функция Лагранжа имеет вид
£ == (Zol Ло Ро, х (/0))) + (/j I Al tfi, х (/,))) +
+ M>(/b х (ti)) + J (p(t) |x — ф (t, X, u)) dt,
и все соотношения принципа максимума получаются из нее так же, как и в теореме 1'. Соответствующее доказательство ничем, по существу, не отличается от доказательства принципа максимума для задач с интегральными функционалами.
2.4.2. Элементарное доказательство принципа максимума для задачи со свободным правым концом. Рассмотрим задачу оптимального управления со свободным правым концом и закрепленным временем:
(х( •), и (•)) = J f(/, х, и) inf; (9)
^0
х — qp (t, х, и),	(10)
и е U,	(11)
*(А)) = *о-	(12)
Принцип максимума для такой задачи доказывается совсем просто, если предположить, что оптимальное управление кусочно-непрерывно.
Прежде всего выясним, что мы должны доказать. Пусть управляемый процесс (х*(/), оптимален, причем управление u*(t) кусочно-непрерывно. Тогда по теореме 1 должны существовать не равные одновременно нулю число Ао 0 и вектор-функция p(t) такие, что а) вектор-функция p(t) удовлетворяет дифференциальному уравнению (5) и второму краевому условию в (6), принимающему в данном случае вид
р(О = 0;	(13)
б) почти при всех t выполнено соотношение (7). Если бы Хо равнялось нулю, то p(t) была бы решением уравнения
<л'	р = — <pZ<z> X, (t), u,(t))p	(14)
150
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
с условиями (13), т. е. p(t) должна была бы тождественно равняться нулю. Поэтому, случай Хо = 0 исключается, и без ограничения общности можно считать, что Хо = 1. Таким образом, нам нужно проверить, что равенство
(р (О I ф (t, X. (0, и, (/))) — f (t, xt (/), м. (/)) =
= max[(p(0 |ф(/, х.(0. u))—f(t,	u)] (15)
и e U
выполняется почти всюду на [/о, Л], если p(t)—решение сопряженного уравнения
р = —ф’((,	u*(t))p + fx(t, xt(t), (16)
с конечным условием p(ti) = 0.
Мы докажем, что равенство (15) выполняется в каждой точке непрерывности управления п*(/), принадлежа-
щей интервалу (/0, Л)-Доказательство основано на непосредственном применении «игольчатых» вариаций управления u*(t) и, по существу, представляет собой модификацию доказательства условия Вейерштрасса, которое было изложено в § 2.2.
Итак, пусть т — точка непрерывности управления Зафиксируем некоторый элемент v е U и рас-
смотрим управление
( и At), если — X, т), и(Л, т, X) = uJ/) =	*	.	. [
7	Л'7	(и, если /ет- X, т)
(17)
— игольчатую вариацию управления u*(t) (рис. 7). Обозначим через %х(/) = х(/; т, X) решение уравнения (10) с начальными условиями (12), соответствующее управлению ux(t). По условию а(/)=х*(0, если to t т — X. Кроме того, поскольку задача Коши
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
для уравнения
Х = ф(/, х, у)
разрешима в окрестности точки (т, х*(г)), вектор-функция xK(t) определена и на отрезке [т — X, т], если X достаточно мало.
Коль скоро управление u*(t) непрерывно в точке т, оно непрерывно и в некоторой ее Х-окрестпости. Поэтому и х*(/) непрерывна в этой окрестности и, следовательно,
х, (т) = х. (т — Z) + Л.х, (т —X) + о (X) =
— хДт — Л) + Лф(т — Л, хДт — X), «Дт — Л)) + о(Х).
Точно так же
хх (т) = х* (т — Л) + Лф (т — Л, х* (т — Л), v) + о (Л).
Отсюда следует, что предел
У (Т) = hm -----------
МО Л существует и равен
г/(т) = ф(т, хДт), v)— ф(т, хДт), «Дт)).	(18)
На отрезке [т, / J и хД •), и хх(-) удовлетворяют уравнению
х = ф(/, х, и ДО).
Из теоремы о непрерывности и дифференцируемости решения дифференциального уравнения по начальным данным следует, что при достаточно малых X > 0 век-тор-функции хД/) определены на [т, 0], сходятся равномерно к хД/) и предел
у (0 = hm ------------
мо	Л
существует при всяком /е[т, /J. Имеем при / > т
t
(0 = хк W + J Ф («, хк (s),	(s))ds,
т
t
щ. х. (О = xt (т) + J ф (s, xt (s), и, (s)) ds,
152
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
так что
xK(t)-x, (0 _
л ~ t
х, (т) — X, (т) Г ф(з, х. (s), и. (s)) — <p(s, х„ (s), и, (s))
= —-------------Ь —------±--------5----------------- as.
Л»	J	А*
%
Переходя к пределу при X | 0, получаем
t
y(t) = y (х) + J Фх (s> х, (s), u, ($)) у (s) ds. т
(Переход к пределу под знаком интеграла возможен, поскольку <р непрерывно дифференцируема по х, а u*(t)—ограниченная вектор-функция.) Таким образом, y(t) есть на [т,решение уравнения
Р = Фх(Л х,(/), u,(t))y
с начальными условиями (18).
Имеем при t т
4 (р (О I у (0) = (р (О I у (0) + (р (01 у (0) =
= - (ф; (t, х. (0, и, (0) р (01 у (0) + (fx (Л х. (0, н* (0) I у (0) +
+ (р (0 1фх {i, х.(0, «.(0) У (0) = (/х (^. X. (/), н,(0) IУ (0).
т. е. поскольку р (/[) = 0,
(Р (0 IУ (0) = — / (fx (s, X, (s), н, (s)) | у (s)) ds. t
В частности, согласно (18)
(р(т)|ф(т, хДт), И.(т))—ф(т, хДт), и)) =
tl
= / (fx(t, x,(t), U,(t))\y(t))dt.	(19)
т
Далее, поскольку (х, (/), и, (0) — оптимальный процесс,
Нт ^^(хД •), иД-))-5<(х.(-), «.(-))]>0,
МО	ЬЦ
§ 2.4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
153
Вычислим этот предел. Он, очевидно, равен
I
limV1 [[/(/, xK(t), —	u*(t))]dt-\-
x-K ti
+ limV' f[f(^ xK(i),	x,(t), u,(t))]dt =
Л 0 J
= f(x, x,(t), v)—f(x, x. (t), m.(t)) + r,
+ J‘(M. *.(0, u,(t))\y{t))dt.
T
Отсюда, используя равенство (19), получаем
(р(т) |ф(т, хДт), мДт)))—/(т, хДт), «Дт))>
Хр(т)|ф(т, хДт), v))—f(x, х*(т), и).
Но т — произвольная точка непрерывности управления п*(/) и v — произвольный элемент множества U. Отсюда следует, что соотношение (15) выполняется во всех точках непрерывности управления u*(t), что и требовалось
2.4.3. Принцип максимума и вариационное исчисление. Принцип максимума Понтрягина содержит необходимые условия (первого порядка) в классическом вариационном исчислении. Мы покажем сейчас, как из принципа максимума можно получить уравнение Эйлера и условия Вейерштрасса, а также канонические уравнения и условия Вейерштрасса — Эрдмана, о которых мы ранее не упоминали. Ограничимся простейшей вариационной задачей. Читатель при желании может проделать соответствующие выкладки для задач более общего вида.
Итак, рассмотрим простейшую задачу
г,
J L (/, х, x)d/->inf; x(/n) = x0, x(/i) = xb
и предположим, что функция x#(Z) (непрерывно дифференцируемая) доставляет сильный минимум в этой задаче. Можно переписать задачу в форме задачи
154
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
оптимального управления следующим образом: it
[ L (/, х, и) ^0
х = и, и е R, х(/0) = х0, х(/1) = х1.
Тогда, если положить u*(t) = х*(/), то управляемый процесс (х*(«), ц*(-)) оптимален в последней задаче. Имеем
Н = ри — XqL (/, х, и).
Сопряженное уравнение имеет вид
р = Я.0М(Л х.(0.
а из принципа максимума следует (поскольку ограничения на и отсутствуют), что
«,. = р-М.Д,......,„„ = 0	(20)
почти везде. Но поскольку управление w*(/) непрерывно, написанное соотношение должно выполняться при всех t. Если бы Хо равнялось нулю, то в силу (20) и p(t) равнялась бы тождественно нулю, что невозможно. Поэтому можно считать, что Ао — 1, и мы приходим к уравнению Эйлера
p(0 = ^M, ut(t)) = Lx(t, х, (/))•
Далее, из принципа максимума следует, что почти при всех t
max(р(0и — L(/, х. (/)> «)) = Р (0 «, (0 — Mt x,(t), и
Это равенство, очевидно, выполняется во всех точках непрерывности функции w*(Z), т- е при всех Принимая во внимание формулу (20), получаем
L(t, x,(t), u) — L(t, x„(t), *.(/)) —
— (и — х (/)) Lx (t, x, (/), x, (/)) > 0
при всех t и и. Мы пришли к условию Вейерштрасса.
Эти рассуждения позволяют, в частности, сделать вывод о том, что обычно используемое в вариационном
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
155
исчислении требование непрерывной дифференцируемости экстремальной функции является излишним. Те же соотношения выполняются (но уже не при всех, а только почти при всех /), когда экстремальная функция абсолютно непрерывна, а ее производная ограничена.
В частности, с помощью условия принципа максимума легко получаются необходимые условия Вейерштрасса — Эрдмана для так называемых ломаных экстремалей. Действительно, если сильная минималь x*(f) имеет кусочно-непрерывную производную, то уравнение Эйлера и условие Вейерштрасса должны выполняться в каждой точке ее непрерывности. Пусть при t — х функция %*(/) не дифференцируема (т. е. ее производная терпит разрыв первого рода). Во всех точках непрерывности х*(/) верна формула
х xj/), хД/))-£(/, хДО, О)) =
= W, хДО, Р(0).
Согласно принципу максимума, гамильтониан непрерывен, отсюда следует, что
X* (т — 0) Ах (т, х* (т), х* (г — 0)) — L (т, х* (т), х* (т — 0)) =
* (т + 0) Ах (т, х* (т), х* (т + 0)) — L (т, х# (т), хф (т + 0)).
Точно так же, поскольку функцияр(/)=АД/, х*(/),х*(/)), будучи решением сопряженного уравнения, непрерывна,
*+С0, хДт —0)) = £х(т, хДт), хДт + 0)).
Эти два соотношения называются условиями Вейерштрасса — Эрдмана. Они характеризуют возможные значения разрывов производных у ломаных экстремалей. Для простейшей векторной задачи условия Вейерштрасса — Эрдмана пишутся совершенно аналогично.
В заключение скажем несколько слов о канонических уравнениях. Мы уже отмечали, что в задаче оптимального управления фазовая траектория и решение сопряженного уравнения удовлетворяют системе уравнений ,
156
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Предположим теперь, что лагранжиан L простейшей задачи вариационного исчисления дважды непрерывно дифференцируем и удовлетворяет усиленному условию Лежандра:	> 0, к е., в частности, — это выпуклая
функция по последнему аргументу. Тогда по теореме о неявной функции в окрестности каждой точки (/, х*(/), х*(/)) уравнение
р = £^(/, х, и)
однозначно разрешимо относительно и, т. е. существует такая непрерывно дифференцируемая функция и(/, х, р), что
p = Lx(t, х, u(t, х, р)),
где и(/, х* (/), р(/)) = х* (/), р(/) = £Д/, х* (/), х*(/)). В точке u = u[t, х, р) производная функции и~>ри— — L(t,x,u)= H(t,x,u,p) равна нулю. Коль скоро эта функция вогнута, она достигает максимума в точке ц(£ х, р), т. е.
И (/, х, и (/, х, р), р) =
= рц(£ х, р)—£ (£ х, ц(£ х, р)) = 5^(/, х, р).
Последнее соотношение определяет так называемое преобразование Лежандра функции £ по последнему аргументу. Обобщение этого преобразования — преобразование Юнга — Фенхеля — мы будем подробно изучать в следующей главе. Имеем	_____
_ дН_ .	i f J 1 du
дх их ’ du dx dx * v x dx
Но на экстремали p = Lx(t, x* (/), x* (/))• Поэтому дЖ (/, x* (/), p (/)) OH (t, x, (Q, x* (/), p (/)) dx	dx
<	dffl dH	zni\	/ \
Аналогично = ^др и из следует, что x*(-) и p(-) являются решениями такой системы уравнений:
Полученная система уравнений первого порядка, оче;ч11 видно, эквивалентная уравнению Эйлера, называется
§ 2.4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
157
канонической формой уравнения Эйлера или просто — канонической системой.
2.4.4. Некоторые иллюстрации. Как и в классическом вариационном исчислении, при решении задач оптимального управления с помощью принципа максимума можно встретиться с самыми различными ситуациями. Для линейных задач с ограниченным множеством управлений типична ситуация, когда существует единственный допустимый управляемый процесс, удовлетворяющий принципу максимума, и этот процесс оптимален.
Пример 1. В задаче
1
| х dt -> inf; х = и, | и |	1, х (0) = 0,
о
принципу максимума удовлетворяет только процесс (%(/) =—/, u(t)=—1), очевидно, являющийся оптимальным. В самом деле, в этой задаче
Н = ри —х, сопряженное уравнение имеет вид р = 1, откуда (так как мы рассматриваем задачу со свободным правым концом и, значит, р(1) =0) p(t) — t — I и максимум функции Н достигается при и = —1.
Вообще же, в задачах оптимального управления можно столкнуться с теми же ситуациями, что и в вариационном исчислении: отсутствие решения, существование множества допустимых процессов, удовлетворяющих . принципу максимума и являющихся или не являющихся оптимальными и т. д. Тот факт, что в задачах оптимального управления часто рассматривают ограниченные множества допустимых управлений, может породить (и порой порождает) иллюзию, будто решения в таких задачах непременно существуют и всегда могут быть найдены с помощью принципа максимума. Это, конечно, неверно. Для иллюстрации рассмотрим пример, который позволит нам заодно, обратить внимание на весьма важное явление — скользящие режимы.
158
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Пример 2. Скользящий режим. Рассмотрим такую задачу
1
J x2d/->inf; х = и, | и [= 1, х(0) = а, х(1) = 0. о
При |а| > 1, очевидно, не существует ни одного допустимого управляемого процесса. При |а|= 1 такой процесс единствен и соответствует управлению u(t) = — sip’n а. Пусть теперь а = 0. Легко понять, что любому допустимому управ-ляемому процессу соответ-уч	ствует положительное зна-
X.	чение функционала. Вместе
X.	с тем на последовательно-
/Х сти	*з(0> • ••>
Ух хХ	изображенной на рис. 8,
функционал стремится к ну-°	t лю. Заметим, что здесь по-
Рис. 8.	следовательность фазовых
траекторий сходится равномерно, а последовательность управлений, наоборот, ни к чему не сходится. Такие последовательности называются скользящими режимами.
Итак, задача не имеет решения. Предлагаем читателю проверить, что ни один управляемый процесс не удовлетворяет принципу максимума (при а = 0).
§ 2.5. Доказательство принципа максимума
Напомним, что мы рассматриваем следующую задачу:
^(х(-),	«(•))= Jf(Z, х,	u)d/->inf;	(1)
*0
x = q(t, х, и),	(2)
и е U,	(3)
h0(t0, rW) = 0, h^, х(/,)) = 0.	(4)
Мы не можем воспользоваться здесь правилом множителей Лагранжа из-за ограничений, наложенных на управления, и из-за невозможности дифференцирования
$ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
159
по и. Наше доказательство опирается на экстремальный принцип для гладко-выпуклых задач. Связь его с задачей оптимального управления не столь очевидна, как, скажем, связь правила множителей Лагранжа с классической задачей Лагранжа, да и вывод принципа максимума Понтрягина из экстремального принципа для гладко-выпуклых задач требует больших усилий.
Первым шагом в наших построениях будет редукция задачи (1) — (4) к эквивалентной в некотором смысле гладко-выпуклой задаче. Мы сделаем это с помощью предложенного А. Я. Дубовицким и А. А. Милютиным
приема, использующего замену времени.
2.5.1. Редукция задачи. Пусть управляемый процесс (х,(/), «*(/)), определенный на отрезке 6*], оптимален в задаче (1) — (4). Выберем неотрицательную, ограниченную и измеримую на отрезке [0, 1] функцию у*(т), подчиненную условию
1
J v, (т) dr = — tot,	(5)
О
и положим
т
/ = ^(т)=^+ / о.(|)^, О
(6)
А (».) = |те [0, 1]|ц. (т) > 0).
Зафиксируем далее измеримую r-мерную вектор-функцию щ*(т), принимающую значения в U и почти всюду на множестве А (у*) удовлетворяющую равенству
(т) = и, (t, (т)).	(7)
Теперь мы можем сформулировать ту редукционную задачу, о которой говорилось в начале параграфа:
1
J vf(t, у, w, (т)) t/т—> inf;	(8)
о
'	/=Уф(<>	У, оу.(т)),	(9а)
t' = v,	(96)
у>0,	(10)
йо(/(0), у(0)) = 0, А,(/(1),	HD) = 0	(Ч)
(штрихами обозначены производные по т).
160
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Это тоже задача оптимального управления, и управляющим параметром в ней служит скаляр v. В качестве допустимых управлений в этой задаче мы будем брать всевозможные неотрицательные, ограниченные и измеримые функции п(т), каждая из которых обращается в нуль на одном из множеств
А* = {т е= [0, 1]| 1	(т)\^k]
(fe = 0, 1, ...)
(своем для каждой функции). Множество таких функций обозначим буквой Т.
Положим
У. =
где /*(т) определяется формулой (6).
Лемма	1. Управляе-
мый процесс (/*(т), z/*(r),
п*(т)) допустим в задаче (8) — (11) и доставляет ей локальный минимум.
Для доказательства леммы нужно более подробно рассмотреть преобразования
вида (6). Пусть функция п(т) неотрицательна, ограничена и измерима на отрезке [0, 1] (рис. 9, а). Положим
т
t (т) = t (0) + J v (я) б/т), о
Д(0=[те[О, 1]| v (т) > 0}.
Функция /(т) непрерывна и не убывает. Обратная функция тоже не убывает, но может, вообще говоря, иметь разрывы первого рода в не более чем счетном множестве точек	••• (рис. 9,6). Положим для
определенности
т(/) == min [т е [0, 1]|	= если /#=/(1), т(/(1))=1.
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
161
Предложение 1. Справедливы < следующие равенства:
<(*(£)) = £ пРи всех £е R(°). *U)b т (t (т])) = 1] почти при всех г] е А (у).
При этом т(/)еД(у) почти всюду на отрезке [/(0) /(!)]•
Доказательство. Первое равенство следует из определения функции т(0 и непрерывности функции /(т). Далее, т(/(ц))=,п, если ц не принадлежит объединению полуинтервалов (т(Ь — 0), т(£л + 0)]. На каждом из этих полуинтервалов функция /(т) постоянна и равна т. е. пересечение Д(у) Г) (r(gft — 0),	+ 0)]
имеет меру нуль. Отсюда следует второе равенство. Наконец, поскольку функция /(т) монотонна, мера образа каждого измеримого множества Acz(0,l] равна
v (т) dx,
т. е., в частности, образ множества Д(у) имеет полную меру в [/(0), /(1)]. Отсюда следует последнее утверждение.
Предложение 2. Пусть функции z(t) на [/(0), /(1)] и w(x) на [0, 1] измеримы и
z(t (т)) = ау(т)
почти при всех теД(у). Тогда, если t = t(x), то t	т
I z (g) dl = J v (л) W (ti)
t(0)	о
если эти интегралы имеют смысл.
Доказательство следует из очевидной выкладки t (т)	т	т
J z(g)dg= j z (t (я)) d (t (n)) - J v (n) w (n) dn-t (0)	о	0
Предложение 3. Пусть x(t) — определенное на [/(0),f(l)] решение уравнения (2), соответствующее допустимому управлению u(t). Если у(т) = х (/(?)) и
6 А. Д. Иоффе, В. М. Тихомиров
162
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
измеримая на [0, 1] вектор-функция w(r) такова, что u(tM)=wM почти всюду на Д(^), то у(т) есть ре* шение уравнения
/ = у(т)ф(/(т)) у, ^(Т)).	(12)
Наоборот, если w(t) ограничена, измерима на Д (у) и принимает значения из U, и у(т) — решение уравнения (12), то u(t) = w(y(t)) — допустимое управление в задаче (1) — (4), и х(/)=г/(т(/)) есть решение уравнения (2), соответствующее управлению u(t).
Доказательство. Первое утверждение сразу следует из предложения 2, поскольку почти всюду на Д(у)
<р(/(т), х(/(т)), и (I (т))) = ф (/ (т), у(х), ге»(т))	(13)
и, значит,
t (т)
У (т) = X (t (х)) = х (/ (0)) + J ф(/, x(t), u(t))dt =
НО)
%
= y(ty + J у(п)ф(/(п)> у(п), u>(n))^n-о
Для доказательства второго утверждения достаточно заметить, что и здесь равенство (13) справедливо в силу предложения 1, а затем снова применить предложение 2.
Перейдем к доказательству леммы 1. Из первой части предложения 3 сразу следует, что управляемый процесс (t*(x), у*(х), и.(т)) допустим в задаче (8) —(11). Пусть теперь (t(x),y(x),v(x))— другой допустимый управляемый процесс в этой задаче и |/(т) — /*(т)|<в, |у(т) — у*(х) | < е для всех т и некоторого.в. Коль скоро ц(т) обращается в нуль на одном из множеств Д*, вектор-функция а>«(т) ограничена на Д(о) и, значит, «(/)== — w*(x(t)) тоже ограничена в силу предложения 1. Поэтому (согласно предложению 3) (х(/),«(/)), где x(t) = y(x(t)),— допустимый управляемый процесс в задаче (1) — (4). Далее, по условию 11(0)—/о»|<е и |/(1) — /ь | < е. Тогда, если |ф(/,%,(/),	почти
всюду (такое k заведомо существует), то для всякого t,
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
163
принадлежащего пересечению отрезков [/(0), /(1)] и [/о., Л*].
I X (Z) — X, (0 I = I х (t (х)) — X, (t (т)) I <
< I X а (т)) - X, (Z. (т)) I + | х, (Z. (т)) - X. (Z (т)) I =
= I У (т) — У. (-г) | +1 X. (Z. (т)) — х. (t (т)) | < е + fee.
Если е достаточно мало, то, поскольку (х* (/), и* (/)) — оптимальный процесс в задаче (1)—(4),
1
J v(x)f у(х), w(x))dx = j f(t,x(t),u(t))dt^ о	t (0)
*1*	1
> f f(A xt (Z), ut (t))dt= J v,(x)f(t,(x), y,(x), w, (x))dx, 0
t. e. (t, (x), y„ (t), v, (?)) действительно есть оптимальный процесс в задаче (8)—(11). Лемма доказана.
2.5.2.	Необходимые условия экстремума в задаче (8)—(11).
Лемма 2. Существуют не равные одновременно нулю число Х0^0, векторы ZoeRs’, Z( е Rs‘, п-мерная вектор-функция q(x) и скалярная функция з(т) такие, что
a)	q (т) удовлетворяет дифференциальному уравнению q'= — v,(x)Hx(tt(x), yt (х), w, (х), q, %0)
и краевым условиям
q(Q) = h'Qx(t.(ty, Z/.(O))Zo, q(l) = -hlx(t,(^,
6)	s(t) удовлетворяет дифференциальному уравнению
s' = — v,(x)Ht(t,(x), у,(х), w,(x), q(x), Ло)
и краевым условиям
s(O)-(feO(a.(O), Z/.(O))|Zo), s(l) = -(feh(Z,(l), «/.(!))[/);
в)	почти при всех т е [0, 1]
У. W. ау.(т)> ?(т)> ^э) +
|=0, если т е А (ц*), + S(T)| если
6*
164
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Нетрудно видеть, что лемма 2 есть не что иное, как принцип максимума Понтрягина для задачи (8) — (11).
Доказательство. Мы покажем сначала, что задача (8) — (11) — это гладко-выпуклая задача, удовлетворяющая всем условиям теоремы 3 из § 1.1 (точнее, следствия из этой теоремы), а затем применим это следствие.
Свяжем с уравнением (9а) отображение Фр 1ГЬ1Х X НИ*, 1X W* —►	ставящее в соответствие каждым
М-)е=Ги1([0, Ц),	II) и 0(.)еГ
(напомним, что Т — множество допустимых управлений в задаче (8) — (11)) вектор-функцию
z(t) = /(t) —о(т)ф(Цт), </(т), ау,(т)).	(14)
Поскольку и(т) обращается в нуль на некотором множестве вектор-функция т-*г>(т)ф(£(т), z/(r), а>*(т)) ограничена и, значит, z(-)si". Таким же образом уравнение (96) порождает отображение Ф2: W7), 1XF-* -*Li, действующее по формуле
£(т) = Ф2(|(-), о(.))(т) = Г(т)-о(т).	(15)
Рассмотрим, наконец, отображение Ф:	i X Wi, i X
Li, являющееся «декартовым произведением» отображений Ф2 и Фь т. е. Ф(|(-), «/(•), ц(•)) = .= (£(•), z(-)), где £(т) определяется формулой (15), а z(t) — формулой (14). С помощью отображения Ф уравнения (9а) и (96) записываются в виде
Ф(/(«). У(-), о(-)) = 0.
Проверим, что при всяком п(-)е^ отображение Ф непрерывно дифференцируемо по Фреше на НТ), i X W7" i и регулярно в точке (/*(•),*/*(•))• Действительно, непрерывная дифференцируемость отображений Ф( и Ф2 следует из результатов, доказанных в § 0.2 (см. пример 11). При этом производная отображения Ф! в точке
>У*(')) есть линейный оператор
Ш У(т))->/(т) — »(т)фД/.(т), z/Дт), (т)) | (т) — — v (т) фх (/. (т), «/. (т), w, (т)) у (т), (16)
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
165
а производная отображения Ф2 — линейный оператор
§(т)->Г(т).	(17)
Если теперь £ (т) az (т) — произвольные элементы пространств L\ и Li соответственно, то, как следует из теоремы 1 из § 0.4, всегда найдутся	, и
^(•)eU7"i, связанные с £(•) и г(-) соотношениями (16) и (17). Поэтому отображение (£(•), #(•))-* ->Ф(В( •). !/(•)> *>(•)) регулярно в точке (/, (•), у* (•)) при всяком u(-)eF.
Заметим, далее, что функционал (8) тоже непрерывно дифференцируем по Фреше на IF], i X Wf, i при всяком фиксированном o(-)sF и его производная в точке (• )> У, (•)) есть линейный функционал
1
(£ (т), у (т)) -> J V (т) [ft (t, (т), у, (т), W, (т)) I (т) 4-о
+ (М^(*)» У„ (т), w, (x))[y(x))]dx.
Наконец, если и, () е Т, о2(-)еГ’, то, очевидно, при всяком фиксированном O^a^l функция оа(т) = = ао, (т) + (1 —а) о2(т) тоже принадлежит множеству F, и поскольку отображение Ф и функционал (8) линейны по v( •), то
I
J VaWMlW, у(х), йУ.(т))«/т =
О
1
= a J о, (т) f (£ (т), у (т), w, (т)) dx + о 1
+ (1 — a) J v2 (т) f (g (т), у (т), w, (т)) dx-, о*
ф(и-), у(-), »«(•)) =
= аФЙ( ), у(), ^(-)) + (1-а)Ф(и-), У(-), п2(-)),
Таким образом, задача (8) — (11) удовлетворяет всем условиям следствия из экстремального принципа для гладко-выпуклых задач (теорема 3 § 1.1). Отметим, что в условии (11) участвуют отображения в конечномерное
166	ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
пространство. Для того чтобы окончательно удостовериться в возможности воспользоваться этим следствием, нам осталось заметить, что (/*(т), z/Дт), и*(т)) — точка локального минимума в задаче (8) — (11), даже если Цт) и у(т) рассматривать в топологиях пространств 1Г1,| и IT?, 1 соответственно (это следует из леммы 1 и того факта, что топология пространств VTi.i и IFl 1 сильнее топологии пространств С и Сп). Таким образом, упомянутое следствие действительно применимо.
Напишем функцию Лагранжа задачи (8) —(11):
<? = (/о|йо(/(О), у (0))) + (/< |М/(1), х/(1))) + 1
+ J [(<7 (т) I У' (т) — v (т) <р (/ (т), у (т), wt (т))) + 6
+ s (т) (/' (т) — v (т)) + Xov (т) f (t (т), у (т), w„ (т))] dx =
= (/о|Ло(НО), У (0))) 4- (/<1/2, (7(1), 2/(1))) + 1
+ J [(<7 W Iу' W) — V (т) Н (t (т), у (т), w. (т), q (т), Ло) + о
+ s (т) (/' (т) — V (т))] dx,
где /0 *= Rs’» Л е Rs‘> Я (•) е L~, s(-)^Lx. (Отображение Ф действует в Л"+1, а пространство, сопряженное с L\+l, есть L«+1. Поэтому </(-)eLS>, s(-) е Lx.) При некотором выборе множителей Ко, l0, Ц, q(x), s(x) функция Лагранжа должна удовлетворять условиям, перечисленным в формулировке теоремы 3 из § 1.1. Выпишем эти условия, учитывая найденные ранее выражения для производных отображения Ф и функционала (8) в точке (/,(•), У, (• ))• Обозначим для краткости /г0 = = Ао(/о., у.(0)),	= МП), Я(т) = Я(7.(т), уДх),
wt(x), Хо) и т. д., Имеем
^инУ (•) = (АУо\У (0)) + (h\xh \у (1)) +
1
+ J К<7 W I У' (т)) — v, (т) Нх (т) у (т)] dx = 0 (18) о
§ 2,5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
167
для всех у (•) Wi, 1;
• ) = (41ЛоЛ(О) + (/i |А.Л(1) +
+ J [S Ь) Г (т) - V, (т) Ht (х) g (т)] dx = 0	(19)
О
для всех £( •)	W{>! и
I
J (v (т) — (т)) (Н + s) dx < 0	(20)
о
для всех v ( •) е К.
Интегрируя по частям второе подынтегральное ела-гаемое в (18) и полагая у(1) = у(0)+ j у' (x)dx> полу-о чаем
1 \
Шо + h\xh - Ju, (т) Нх dx I у (0) + о	/
1 /	I	\
+ J и(т) 4- h\xh — J v, (Т]) Нх dx\\у' (г) j dx = 0 0 \	т	/
для всех у( •) е W*, ь Это означает, что
1
hoxlo + h’xh — Ju, (т) Нх dx = 0, о
1
q (т) + h*xl\ — J и, (n) Нх dr) = 0 почти везде, т
Изменяя, если нужно, q(x) на множестве меры нуль, получаем отсюда, что q(x) абсолютно непрерывна и удовлетворяет всем условиям, сформулированным в утверждении а) доказываемой леммы.
Таким же образом из (19) следует утверждение б). Осталось проверить, что утверждение в) вытекает из (20). Действительно, если, например, Н + во всех
168
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
точках имеющего положительную меру подмножества множества Д(^*), то полагая в этих точках у(т) = = 2уДт), а в остальных у(т)=у*(т), получаем
/ (и (т) — V. (т)) (И 4- s) dx > О О
в противоречии с (20). Столь же просто доказывается и второе соотношение в условии в). Лемма доказана.
2.5.3. Завершение доказательства принципа макси* мума. Положим
т* (/) = min {т е [0, 1] К(т) = /},
Р (t) = Я (*. (0). г (t) = $ (т. (/)).
Согласно предложению 1
Р (t. (т)) = Я (т), г (tt (т)) = s (т)
почти при всех те A (t\).
Применяя предложение 3 к q(x) и p(t), получаем в силу утверждения а) леммы 2, что p(t) удовлетворяет дифференциальному уравнению
p = — Hx(t, МО, «.(0, Р, М
и граничным условиям
р (Ah) == Аох (A)к* (А)<))/о>
р (^1*) — h\x (^i*, х* (^i+))
Этим доказывается первое утверждение в формулировке принципа максимума.
Точно так же r(t) удовлетворяет дифференциальному уравнению
r =	хД/), МО, р(0, ло) (21)
н граничным условиям
г (0) = (Ао/ (Аъ, х* (/оЗ) | /о),	1
г(1) = -(М0*, хДМ JZJ. /	(22)
До сих пор нас не интересовал конкретный вид функций у*(т) и и>*(т), лишь бы выполнялись равенства (6)
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
169
и (7), оставляющие, разумеется, большую свободу выбора этих функций. Предположим теперь, что у*(т) обращается в нуль на системе (замкнутых справа) полуинтервалов Ih = (ть Xk + p/tL k=l, 2,..., устроенной таким образом, что образ их объединения при отображении т > ^*(т) плотен в [/0«,
Вот один из способов построения такой функции. Пусть {gi, g2, •••} — счетное плотное подмножество отрезка [/о*, Выберем числа Pi > 0, р2 > 0, ... так, чтобы 2 Ра = 1/2. Положим
2 (г1* го*) ~
причем суммирование справа ведется лишь по тем индексам i, при которых < g*. Тогда полуинтервалы Ik = (т£, xk + Pfc] попарно не пересекаются. Пусть теперь
V, (т) =
0	, если т е
k
2(6* — 60, если k
Проверим, что образ объединения 0Л при отображении т->/Дт) плотен в [6*, 6*] (равенство 6(1) = 6* здесь очевидно). Для этого достаточно убедиться, что t* (?) = %k для всякого т е Ik. Заметим, что rz < xk тогда и только тогда, когда	и 6 (т) = 6 (т*) для всех
х е Ik. Имеем при теб
К (т) = 6* + J Ц* (n) dx\ = о
= 6*+ 2 (6*—6ъ)2 Pi) =
k Ti<Tfe /
= 6*+ 2 (6*—6 J (xk— 2 Pi) = k	I
= 6* -h (^i* —^o*) "3
что и требовалось.
Предположим теперь, что каждый полуинтервал Л есть объединение счетного множества замкнутых справа
170
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
непустых полуинтервалов ha, .{^ь ^2, .. } — счетное плотное подмножество множества U и вектор-функция w*(r) выбрана так, что
^*(T) = ^o если
В силу неравенства в утверждении в) леммы 2
H(t. (t), г/.(т), W, (т), <7(т), Хо) + «(т)<о
почти всюду на объединении U Ik- Всякий полуинтервал Iki имеет положительную меру (ведь он не пуст по условию). Поэтому для каждых k и i найдется такое т е 1м, что
Н (t. (*)> У, СО, (О, q (О, Ао) + $(?)==
= Н (U, х, (|Д uit р &), М + г (Ь) < 0.
Так как точки £2, ••• образуют плотное подмножество отрезка [/0*, Л*], векторы мь и2, ... — плотное подмножество множества U и функция
—»//(/, х(/), ц, р(/), Хо) непрерывна, отсюда следует, что
H(t, х,(0, и, p(t), Ла) +г(0<0	(23)
для всех / е [/о*, Л*], U.
С другой стороны, равенство в утверждении в) леммы 2 в силу предложения 1 влечет почти при всех t равенство
Н (t, х. (0, и, (/), р (0, Хо) + г (0 = 0.	(24)
Поэтому почти при всех t
H(t,	p(t), Xo) =
= max H(t, u, p(t), K0) = 3@(t, xt(t), p(t), Лэ). (25) ue U
Этим доказывается второе утверждение в формулировке принципа максимума.
Поскольку управление «*(/) ограничено и функция Н(I, х,(<), и, р(0> Хо) непрерывна, из (24) следует, что
5^ (t, х, (I), р (/), Ло) + г (/) = 0.	(26)
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
171
Но r(t) — непрерывная функция. Поэтому непрерывна и функция	р(/), Хо). Сравнивая (26) с (22),
получаем
<Wo>, **(М, р(М, А,о) = —(йо/(/Ом х»(/о*)) |/о), (Лх> х* (//*), р (^i*), Л0) = (йц(6», х* (/{*)) |Zj).
Наконец, из (21) и (24) следует (8а) из § 2.4. Принцип максимума Понтрягина полностью доказан.
Комментарий к гл. 2. К § 2.2. Вариационное исчисление изложено во многих монографиях и учебниках: Адамар [1], Ахиезер [1], Больца [1], Гельфанд и Фомин [1], Каратеодори [2], Курант и Гильберт [1], Лаврентьев и Люстерник [1], [2] и др.
К § 2.3. Подробный обзор работ о задачах вариационного исчисления с ограничениями содержится в книге Блисса [1]. О многомерных задачах см. монографии Морри [1] и Клотцлера [1].
К §§ 2.4—2.5. Принцип максимума Понтрягина был выдвинут в 1956 году, и это заложило основы теории оптимального управления. Из работ раннего периода упомянем статьи Гамкрелидзе [1], [2] и обзорную статью Понтрягина [1]. Итоги этих исследований были подведены в монографии Понтрягина, Болтянского, Гамкрелидзе и Мищенко [1].
Первое доказательство (Болтянский [1]) принципа максимума было усовершенствовано Розоноэром [1] и Егоровым [2]. Дубовицкий и Милютин [2] и Xалкин [4] предложили доказательства, основанные на новых идеях. В книге мы трижды возвращаемся к доказательству принципа максимума. В § 2.4 мы следуем Понтрягину [1], в § 2.5 — Дубовицкому и Милютину [2]. Третье доказательство (в гл. 5) связано с идеями Халкина.
Укажем еще руководства и монографии по оптимальному управлению: Беллман, Гликсберг, Гросс [1], Болтянский [4], Брайсон и Хо Ю-ши [1], Красовский [3], Кротов и Гурман [1], Ли и Маркус [1], Хестепс [3], Янг [2] и др.
Глава 3
ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
В этой главе изучаются свойства выпуклых множеств и функций, характеризующие их устройство «в целом». Основные результаты связаны с возможностью двойственного описания выпуклых множеств и функций, следующей из теорем отделимости (§ 3.1). В дальнейшем наиболее важны теорема о непрерывности выпуклых функций (§ 3.2), теорема Фенхеля —Моро (§ 3.3), теоремы двойственности (§ 3.4) и теорема Каратеодори (§ 3.5). Остальные результаты при первом чтении можно опустить. На протяжении всей главы, за исключением специально оговариваемых случаев, предполагается, что X, У, ... — отделимые локально выпуклые пространства. Материал этой и следующей глав опирается только на § 0.1 и § 0.3.
§ 3.1.	Выпуклые множества и теоремы отделимости
3.1.1.	Определения и элементарные свойства. В § 0.3 мы уже ввели определения выпуклого множества и конуса. Непосредственно из первого определения следует, что
а)	сумма (алгебраическая) конечного числа выпуклых множеств — выпуклое множество;
б)	пересечение любого семейства выпуклых множеств — выпуклое множество;
в)	декартово произведение выпуклых множеств — выпуклое множество, т. е. если X = X • • • X Хп, А- — выпуклые подмножества пространств Х^ соответственно, то А = А}\...% Ап —выпуклое подмножество пространства X;
г)	образ и прообраз выпуклого множества при линейном отображении — выпуклые множества, т. е. если A: X —> Y — линейный оператор, А — выпуклое подмножество пространства X и В — выпуклое подмножество пространства У, то множества А(А) и А~1(В) выпуклы.
В дальнейшем нам удобнее использовать для обозначения образа и прообраза множеств при линейном отображении специальные символы. Именно, образ мно-
§ 3.1. ВЫПУКЛЫЕ МНОЖЕСТВА
173
жества А будем обозначать через АД (а не А (А)), а прообраз множества В —через В А (а не А*1 (В)).
Пусть A cz X. Пересечение всех выпуклых множеств, содержащих множество А, есть выпуклое подмножество пространства X, называемое выпуклой оболочкой множества А и обозначаемое через convA. Пересечение всех замкнутых выпуклых множеств, содержащих множество А, есть замкнутое выпуклое подмножество пространства X, называемое выпуклым замыканием множества А и обозначаемое через convA. Пересечение всех выпуклых конусов, содержащих множество А и начало координат, есть выпуклый конус, называемый (выпуклым) конусом, порожденным множеством А, и обозна-» чаемый Ка- Пересечение всех линейных подпространств, содержащих множество А, называется линейной оболочкой множества А и обозначается ПпА. Очевидно, что Гт А = Ка — Ка-
Если {хь ..., хп} — конечный набор точек из X, то всякая точка х е X, представимая в виде
п
X = 2 <4*1, i—1
где az^0, /= 1, ..., п, 2a/= L называется выпуклой комбинацией точек xh ..., хп- Если А — выпуклое множество, то из определения сразу следует, что всякая выпуклая комбинация любого конечного набора его точек принадлежит множеству А.
Предложение 1. Выпуклая оболочка множества А совпадает с совокупностью всех выпуклых комбинаций точек из А.
Доказательство. Непосредственно проверяется, что совокупность всех выпуклых комбинаций точек множества А есть выпуклое множество. С другой стороны, всякое выпуклое множество, содержащее А, содержит выпуклые комбинации своих точек, в частности, точек множества А.
Предложение 2. Замыкание выпуклой оболочки множества А совпадает с его выпуклым замыканием: convA = convA.
Доказательство. Согласно предыдущему предложению, всякое замкнутое выпуклое множество,
174
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
содержащее А, содержит и сопуД и, значит, сопуД. Все следует теперь из определений и предложения 4, приводимого ниже.
Предложение 3. Конус, порожденный множеством А, совпадает с конусом, порожденным множеством сопуД. Если же А — выпуклое множество, то
Ка — (J А,Д = {хе X\x = Kz9 2ЕД}.
Доказательство очевидно.
Предложение 4. Пусть A czX — выпуклое множество. Тогда его внутренность inM и замыкание А выпуклы. Если XieinM и х2еД то все точки отрезка [хь х2], за исключением, быть может, точки х2, принадлежат множеству int А. В частности, если ш1Д=#0, то А = int А и int Д = int А.
Доказательство. Пусть Xi е int А и х2е.4. Пусть U — окрестность точки хь содержащаяся в Д, и x = aXi+(l—а)х2, 0 < а < 1. Тогда а(/ + (1—а)х2 есть окрестность точки х, лежащая в А. Поэтому xeinM. Отсюда также следует, что внутренность вьь пуклого множества выпукла.
Рассмотрим далее точки Xi и х2 из Д. Пусть
х = ах1 + (1 —а)х2, 0 < а < 1.
Возьмем выпуклую окрестность нуля U. Йзхг-еД следует, что (Х; + £7) А А =/= 0, i = 1, 2. Выберем х' е(х£ + £7) П А и пусть х' = аХ| + (1—а)х'. Тогда xz + + (1—а) (х2 + U) — х + U. Мы получили, что каждая окрестность точки х пересекается с А, т. е. хе! Таким образом, замыкание выпуклого множества выпукло. Предложение доказано.
3.1.2.	Отделимость. В § 0.1 мы сформулировали теорему отделимости, утверждающую, что два непересе-кающихся выпуклых множества, одно из которых имеет непустую внутренность, можно разделить ненулевым линейным непрерывным функционалом. С помощью предложения 4 можно получить некоторое усиление этой теоремы.
Теорема 1 (первая теорема отделимости). Пусть А и В — выпуклые подмножества пространства X, и
§ 3.1. ВЫПУКЛЫЕ МНОЖЕСТВА
175
внутренность одного из них, например А, не пуста. Тогда А и В можно разделить ненулевым линейным непрерывным функционалом в том и только том случае, когда (int А) П В = 0.
Доказательство. Пусть (int/4)AB = 0. Тогда по теореме отделимости существует ненулевой функционал	разделяющий множества int Л и В, т. е.
такой, что (х*, х)^(х*,у} для всех хе int Л, у^В. В силу предложения 4 ЛстМ. Поскольку функционал х* непрерывен, получаем, что
(х*, х)<<х*, у}	(1)
для всех х е А, у е В, т. е. функционал х* разделяет множества А и В.
Предположим теперь, что функционал х* е X разделяет множества Л и В, т. е. справедливо соотношение (1). Если бы нашлись точки хе int Л и у^В такие, что (х*, х) = (х*, у), то, поскольку х* =# 0, в любой окрестности точки х и, следовательно, в Л можно было бы указать точку Xi таким образом, что (х*, Xi)>(x*, у} в противоречии с предположением. Поэтому
<х’,х)<(х*, у)
для всех хе int Л, у^В. А это означает, что множества int Л и В не могут пересекаться. Теорема доказана. Скажем, что линейный функционал х* е X сильно разделяет множества Л и В, если
<х‘, х) < (х‘, у} — 8
для всех х е Л, у В и некоторого е > О, или, что то же, если
sup (х*. х) «С inf <х‘, у) — е
хе А	у^В
при некотором е > 0.
Теорема 2 (вторая теорема отделимости). Пусть А—замкнутое выпуклое подмножество пространства X и хф А. Тогда существует функционал х*^Х*, сильно разделяющий А и х.
Доказательство. Множество XXЛ открыто и содержит х. Поэтому найдется такая выпуклая окрестность нуля U, что х -|- U cz X \ Л, т. е. (х + U) Г] Л = 0.
176
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
По теореме отделимости множества х + U и А можно разделить ненулевым линейным функционалом т. е.
у) < {х\ х) + « Z)
для всех //G Л, ZEzU. Поскольку х* У= О,
— е = inf (х*, z} < 0.
zg= и
Поэтому
<Х*, у) < <**, х> — 8
для всех у А, что и требовалось.
Отметим, что все результаты п. 3.1.1 и теорема 1 справедливы для произвольных линейных топологических пространств. Наоборот, теорема 2 верна только в локально выпуклых пространствах. Разъясним геометрическую природу отделимости.
Пусть х*еР, х* #= 0, ае R. Введем следующие обозначения:
Н (х*, а) = {х е X | <х*, х) = а}, Н+ (х\ а) = {х g= X | (х\ х) < а}, Н~ (х*, а) = {х g= X | (х*, х) > а}.
Множество /7(х*, а) есть замкнутое линейное многообразие коразмерности единица. С другой стороны, следствие 2 из теоремы Хана — Банаха показывает, что всякая замкнутая гиперплоскость в X есть множество уровня некоторого ненулевого функционала. Поэтому замкнутые гиперплоскости в X суть в точности множества вида /7(х*, а), где х* У= 0. При этом элементы х* и а, задающие гиперплоскость, определены с точностью до множителя, отличного от нуля.
Д1ножества Я+(х*, а) и Я~(х*,а) называются полупространствами, Полупространства Я+(х*, а) и Н~(х*,а) называются (противоположными) полупространствами, порожденными гиперплоскостью Н — = Н(х\ а).
Пусть теперь функционал х* X, х* У= 0 разделяет множества А и В, Это значит, что существует такое число а, что
sup <х*, х)^а< inf (х*, у),
хе А	у^В
§ 3.1. ВЫПУКЛЫЕ МНОЖЕСТВА
177
Тф е. множества А и В принадлежат различным полупространствам, порожденным гиперплоскостью Я(х*, а)==Я (рис. 10). В этом случае говорят, что гиперплоскость Н разделяет множества А и В.
Из теоремы 2 следует ряд важных свойств отделимых локально выпуклых пространств.
Следствие 1. В отделимом локально выпуклом пространстве выпуклое замыкание всякого множества совпадает с пересечением всех полупространств, содержащих это множество.	/	\
Доказательство. Пусть / д / ц .S A cz X. Поскольку всякое полу- /	/
пространство выпукло и замкну-	./S
то, оно содержит множество А тогда и только тогда, когда оно	}
содержит сопуД. С другой сто-	\	$ J
роны, если хф сопуД, то в силу теоремы 2 существует полупро-странство, содержащее сопуД и не содержащее точки х.
Доказанное следствие есть, по существу, первая теорема двойственности; Из него следует, что всякое замкнутое выпуклое множество можно описать двояким образом: внутренним, как совокупность принадлежащих ему точек, и внешним, как пересечение всех содержащих его полупространств.
Следствие 2. Замыкание выпуклого множества в отделимом локально выпуклом пространстве замкнуто в слабой топологии этого пространства.
Доказательство. Множества линейных функционалов, непрерывных в исходной и слабой топологии, совпадают по определению слабой топологии. Поэтому все полупространства слабо замкнуты и остается применить следствие 1.
Следствие 3 (теорема Мазура). Пусть X — банахово пространство и точка х принадлежит слабому замыканию множества A cz X. Тогда существует последовательность выпуклых комбинаций элементов множества Д, сходящаяся к х по норме.
178
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Доказательство. Пусть convА — выпуклое замыкание множества А в метрической топологии пространства X, Тогда согласно предыдущему следствию множество conv Л слабо замкнуто. Поэтому xeconvA = = conv А (предложение 2) и, следовательно, существует последовательность элементов множества conv А, сходящаяся к х по норме. Следствие доказано.
§ 3.2.	Выпуклые функции
3.2.1.	Определения и элементарные свойства. В § 0.3 мы определили эффективное множество и надграфик функции /, а также понятия выпуклая функция, собственная функция, несобственная функция. 1Аъ\ будем иметь дело главным образом с собственными выпуклыми функциями.
Однако несобственные функции часто возникают в результате различных операций с собственными, и их нельзя исключать из рассмотрения.
Если f — собственная функция (или хотя бы всюду большая —оо), то для выпуклости функции f необходимо и достаточно, чтобы неравенство
f (ах, + (1 —а) х2) < af (xt) + (1 — а) f (х2)	(О
выполнялось для всех Xi е X, х2еХ, OsSja^l. Проверка этого утверждения не представляет труда. Написанное неравенство называется неравенством Йенсена. Отметим, что, если f — выпуклая (не обязательно — собственная) функция, то неравенство (1) выполнено для любой пары хь х2, если только f(xt) и f(x2) не являются бесконечностями разных знаков. Эффективное множество и все лебеговские множества выпуклой функции выпуклы. Обратное заключение неверно. Например, функция |хр на R имеет выпуклые лебеговские множества, но не является выпуклой.
Функция f называется замкнутой, если ее надграфик epi f замкнут в R X X. Условие замкнутости функции (в отличие от выпуклости) можно выразить в терминах лебеговских множеств. Именно, функция f замкнута тогда и только тогда, когда все ее лебеговские множества замкнуты, т. е. когда функция f полунепрерывна
§ 3.2. ВЫПУКЛЫЕ ФУНКЦИИ
179
снизу. Действительно,
= {х е X | (а, х) <== epi f}.
Поэтому, если множество epi f замкнуто, то и все множества 3?af тоже замкнуты. Пусть, наоборот, все множества S?af замкнуты. Имеем
n
Р > a
Пусть (ao, Xo)^epif. Для доказательства замкнутости множества epi f нам достаточно проверить, что некоторая окрестность V точки (ао, Хо) не пересекается с epi/. Коль скоро (ао, %о) Ф epi f, то и хо ф . Это означает, что Xo^«2?pf при некотором 0>ао. Отсюда, в свою очередь, следует, что некоторая окрестность U cz X точки %о не пересекается с Пусть
V = {(a, x)eRXX|a<₽, хе U}.
Тогда V есть окрестность точки (ао, х0) в RXX. С другой стороны, если (a, x)eV, то	и, так как a < 0,
то x^3?af. Поэтому a<f(x) и, значит, (epi f) А V = 0.
3.2.2.	Операции с выпуклыми функциями. Перечислим наиболее употребительные из операций с выпуклыми функциями.
Пусть fi, ..., fn — собственные функции. Функция / п \	п
(А+ ... + fn)W = 2b W = Sh(x)
\i=l J	i=l
называется суммой функций /ь ..., fn. Инфимальной конволюцией fi, ..., fn называется функция Дф ... п
• • • Ф/п = ® f>> определенная равенством
©fi')(x) = inf|2A(x1)
7=1 /	I /=1
п
2 Xt- = X
i=l
Ясно, что сумма и инфимальная конволюция собственных выпуклых функций— выпуклые функции, однако они могут и не быть собственными. Например, если f\ и f2 — индикаторные функции непересекающихся выпуклых множеств, то их сумма тождественно равна
180
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
4-оо. Если же fi и f2 — линейные функции, не равные друг другу, то их инфимальная конволюция тождественно равна —оо.
Пусть {fv} (v е N) — произвольное семейство . функций. Функция
(V M(x) = SUp{fv(x) |V€=M
\v е= N )
называется верхней гранью функций fv, а функция
(conv ( Д fv\\ (х) = inf J а е R | (а, х) е conv ( II epi f JI
\ \ve^ J)	(	Ц
— выпуклой оболочкой нижней грани функций fv. Верхняя грань любого семейства выпуклых функций всегда выпукла, так как ее надграфик равен пересечению надграфиков исходных функций. Выпуклая оболочка нижней грани любого семейства функций выпукла по определению. И в этих случаях результирующие функции могут быть несобственными, даже если исходные функции — собственные.
Пусть Л: X —>У— линейный оператор, g— функция на У и f — функция на X. Функции gA и Af, определенные равенствами
(gA)(x) = g(Ax),
(Af) (у) = inf {f (х) | х е X, Ах = у},
называются соответственно прообразом функции g и образом функции f при отображении Л. Как и выше, при этих операциях выпуклые функции переходят в выпуклые, но вообще говоря, собственные функции могут переходить в несобственные.
Функция f, определенная условием
epif = epTf,
называется замыканием функции f, а функция convf: epi (conv f) = conv (epi f)
— выпуклым замыканием функции f. Разумеется, замыкание выпуклой функции выпукло, но замыкание собственной функции может быть и несобственной функцией. Отметим еще, что сумма конечного числа и верх
§ 3.2. ВЫПУКЛЫЕ ФУНКЦИИ
181
няя грань произвольного семейства замкнутых функций— замкнутые функции, а операции инфимальной конволюции и выпуклой оболочки могут переводить замкнутые функции в незамкнутые. Например, инфималь-ная конволюция индикаторных функций множеств
A = {xeR2|x'x2> 1, х1 > 0, х2 > 0},
В = {х eR2 |х2 = 0},
замкнутых, поскольку множества А и В замкнуты, равна индикаторной функции открытой полуплоскости
{х €= R2 |х2 > 0).
Посмотрим что получается при применении перечисленных операций с индикаторными функциями. Доказательства всех последующих формул мы опускаем, поскольку они не представляют труда:
б(.| Л,) + б(-| Л2) = б(-| Д) V6(.| Л2) = б(-| л,пл2),
б(-| Л1)®6(-|Л2) = 6(.|Л1 + Л2),
conv (6 (• | Л0 А 6 (• I Л2)) = б (• | conv (Л] U Л2)), б( .| Л)А = б( -| ЛА), Аб(-| Л) = б(-|АЛ),
б ( | Л) = б (• | Л), conv (б (• | Л)) = б (• | conv Л).
3.2.3.	Непрерывность выпуклых функций *).
Теорема 1. Пусть f — собственная выпуклая функция на X. Тогда следующие утверждения эквивалентны:
a)	f ограничена сверху в окрестности некоторой точки х;
б)	f непрерывна в некоторой точке х;
в)	int(epif) =/= 0;
г)	int(domf)y=0 и f непрерывна на int(domf).
При этом
int (epi f) = {(а, х) <= R X X | х е int (dom f), а > f (х)).
Доказательство. Докажем сначала эквивалентность утверждений а) и б). Если f непрерывна в точке х, то она, конечно, ограничена в некоторой
*) Все утверждения и доказательства, содержащиеся в этом пункте, сохраняют силу, если X — произвольное линейное топологическое пространство.
182
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
окрестности этой точки, т. е. из б) следует а). Пусть f ограничена сверху в окрестности U точки х0, т. е. для всех x^U f(x)^z с < оо, с > 0. Заменяя, если нужно, V на U — хо и f(x) на f (х + х0) — f (х0), можем считать, что Хо = 0 и /(0) = 0. Выберем 0< и положим
Тогда Ve есть окрестность нуля. Покажем, что из x^V9 следует |/(х)|<8, а это в силу произвольности 8 и означает непрерывность функции f в нуле. Действие тельно, пусть xeV£. Тогда хе(е/с)У, т. е. (c/e,)x^U и из-за выпуклости функции f
x) + (i-f)f(0)<8
С/ \ о /	\	и /
по неравенству Йенсена. С другой стороны, хе—(e/c)Ut т. е. —(с/е)х е U и из
п	1	. е/с (	с \
0 — 1 + е/с Х + 1 + е/с \	е Х/
следует, что
е/с
1 + е/с
т. е. /(х)^—8. Таким образом, из а) следует б). Во* лее точно, f непрерывна в каждой точке, в окрестности которой она ограничена сверху.
Импликация г)=>б) тривиальна; из а) следует в), поскольку если а0^/(х) для всех	то
{(а, х) е R X X | а > а0, х е U] cz epi /.
Итак, осталось доказать, что из в) следует г).
Пусть int(epi/) У= 0. Если (а, х)е int(epi /), то f, очевидно, ограничена в окрестности точки х и, значит, непрерывна в этой точке. Поэтому нам достаточно про* верить, что int (dom f) = {х е Х| За: (а, х) е int (epi /)}. Однако это сразу следует из предложения 4 § 3.1.
Наконец, заключительное утверждение теоремы тоже очевидно: если (а, х) е int (epi /), то необходимо х& int(dom/) и а>/(х). Наоборот, если функция f непрерывна на int(dom/), хе int(dom/) и а>/(х), то (а, х)е int(epi/). Теорема доказана.
§ 3.3. СОПРЯЖЕННЫЕ ФУНКЦИИ
183
§ 3.3. Сопряженные функции. Теорема Фенхеля — Моро
3.3.1. Преобразование Юнга — Фенхеля. Пусть f — функция на X. Преобразованием Юнга — Фенхеля функции Д или функцией, сопряженной с Д называется функция на X*, определенная равенством *)
f (х*) = sup «х‘, х) — f (х)). (1) X
Это означает, что гиперплоскость а —(х*, х)+ f* (х*) = О является опорной к epi f (рис. 11).
Следует иметь в виду, что верхнюю грань в (1) можно брать лишь по хе dom Д
Точно так же, по функции g на X* равенством
g-* (х) = sup «X*, х) — g (X*)) X*
определяется сопряженная функция на X. В частности, функция /*♦=(/*)* называется второй сопряженной функции f. Из определения сопряженной функции следует неравенство
f (х) + Г (х') > <х‘, х>,
справедливое для всех хеХ, х* е X*. Это неравенство называется неравенством Юнга — Фенхеля.
Примеры сопряженных функций. 1. Сопряженной с аффинной функцией f(x)={xQ, х} + а будет функция
f* (х*) = sup (х* — xj, х) — а =
— а, если х* =« xj, оо, если x*=/=xj.
*) В случае, если f(x)—выпуклая гладкая функция в Rn, растущая на бесконечности быстрее линейной функции, преобразование Юнга — Фенхеля превращается в преобразование Лежандра'.
Г (х*) = (х*|хо)-/(хэ).
где Хо определяется равенством х* = /'(х0). •
184
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
2. Пусть A cz X и f (х) == д (х | Д). Тогда Г (х*) = sup {(х*. х) | х €= Д) = s (х* | Д),
т. е. сопряженной с индикаторной функцией множества А будет опорная функция этого множества. Множество
Д° ==	(• | Д) = {х* е= X* | $ (х* |Д) < 1}
называется полярой множества Д. Если К — конус, то и № — конус:
№ = {х*еГ|(Лх)<0, ух<=К}.
Конус К* = —К° называют сопряженным с конусом К. Если L — подпространство, то
L° = {х* е X* | (х*. х)=0,
— аннулятор подпространства L. Проверка этого не представляет труда.
3. Пусть А с X. Функция
(О,	если х = О,
Ш |1 >0 I = А), если ^0.
называется функцией Минковского множества Д. Найдем с ней сопряженную:
Г (х*) = sup {(х*, х) — f (х) | х €= X} «
в sup {(х*, х) — inf {Л >0 | Х~1х еД) |х е Х} =
= sup {(х*, х> — X | Л > 0, Х“!х еД] =
= sup {sup {(X*, х) | х е ЛД} — А | Л >0} =
= sup (X ( sup (х*, х) — 1)) = 6 (х* I Д°). Ь>0 хееА
3.3.2. Элементарные свойства сопряженных функций.
Условимся писать fi f2> если fi(x)^f2(x) при всех х. Тогда из fi > f2 следует, что
Предложение 1. Для всякой функции f справедливо неравенство
f>r.
Доказательство. По неравенству Юнга— Фенхеля
Г (X) - sup «х‘, х) - Г (X*)) < f (х). X*
§ 3.3. СОПРЯЖЕННЫЕ функции
185
Предложение 2. Пусть f — функция на X. Тогда сопряженная функция f* замкнута в слабой * топологии пространства X* и выпукла*).
Доказательство. По определению f* есть верхняя грань семейства аффинных (и, значит, выпуклых) и непрерывных в слабой * топологии функций х* —► х}— f (х) (xedomf). Поэтому /* выпукла и слабо * замкнута.
Точно так же, если g— функция на X*, то ее сопряженная g* выпукла и слабо замкнута и, значит, замкнута на X. Для выпуклых функций на X в силу следствия 2 из второй теоремы отделимости (теорема 2 из § 3.1) замкнутость эквивалентна слабой замкнутости. С другой стороны, мы нигде в книге не будем рассматривать X* с топологиями, отличными от слабой *. По-поэтому в дальнейшем мы вместо слабо * замкнутая выпуклая функция будем говорить просто замкнутая выпуклая функция.
Предложение 3. Пусть f — собственная выпуклая замкнутая функция на X. Тогда f* — собственная функция.
Доказательство. Если %о dom f, то
Г (х‘) > <Х*, Хо) — f (х0) > — ОО
для всех х*. С другой стороны, точка (f(x0)—1,х0)<£ epi f. По второй теореме отделимости существует пара
(Ро. г/’) такая, что
sup (₽оа + (у'о, х» < р0 (f (х0) - 1) + (у'о, Хо).
(а, х) е epi f
Ясно, что Ре =/= 0. С другой стороны, Ро не может быть положительным числом, ибо иначе верхняя грань слева равнялась бы 4-оо. Поделив на | Ро|, получаем:
х €= dom т
< 1— / (хо) + <^о | Ро I-1 ’ Хо)<
*) Напомним, что базу окрестностей нуля в слабой * топологии пространства X* образуют всевозможные множества вида {х* е X* | | (х*, Xi) | < е, i = 1, ..., k}, где е > 0, Xi g X, ...,	,
еХД < оо; пространство линейных непрерывных функционалов в слабой * топологии X* совпадает с X.
186
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Из доказанного следует, в частности, что собственная выпуклая замкнутая функция f(x) ограничена снизу на всяком ограниченном подмножестве пространства X, поскольку она мажорирует хотя бы одну аффинную функцию.
Предложение 4. Пусть A: X-+Y— линейный гомеоморфизм X и У, a g — функция на У. Положим
f (*) = hg (Ax + у0) + (xj, х) + Yo,
где y0^Y, х‘еХ’, у0 <= R, А, > 0. Тогда
Г (Л=W (Va-1* (х‘ -х;)) - <х’ - х; A-ly0} - Ye.
Доказательство. Имеем
f * (Х*) -* sup (<х\ х) - Kg (Ах + Уо) — (X*, х) — у0) =
(полагая у = Лх 4- Уо)
= A,sup(A.-1(A-l*(x* — xj), у}- g(у)} —
- <х- - х”, Х~'у0) - у0 = Kg' (V’A-’- (х* - х0’)) -— (x’-xj, ЛЛо>-То-
Из этого предложения следует, в частности, что
f (х) = g (х + х0) г (х‘) = g' (х‘) — <х‘, х0>;
f (х) = g (х) + (х;, х) =Ф f (х-) = g' (х* — х’);
f(x) = Kg(x), К > 0=^>f*(х*) = Kg* (К~‘х');
f (х) = Kg(K~lx), К > 0 => Г (х*) = Kg' (х‘);
f (х) = g (Кх), K>Q=^f* (х‘) = g* (А,-1х‘).
3.3.3. Теорема Фенхеля — Моро.
Теорема 1 (Фенхель — Моро). Пусть f — функция на X, всюду большая —оо. Тогда f — f** в том и только том случае, когда f выпукла и замкнута.
Доказательство. Если / = /**, то f выпукла и замкнута (см. предложение 2). Далее, если f(x) = 4-оо, то равенство f = f** очевидно. Значит, в силу предложения 1 нам достаточно проверить, что для собственной выпуклой и замкнутой функции f справед-
§ 3.3. СОПРЯЖЕННЫЕ ФУНКЦИИ
187
лйво неравенство

Идею дальнейшего доказательства и его основные этапы иллюстрирует рис. 12. Допустим, что f*(x0)<
< f (х0) в некоторой точке x0G=domf**. Тогда epi f как непустое выпуклое и замкнутое множество можно сильно отделить от точки (f * (х0), х0) ненулевым линейным функционалом (р, у*) е R X X*, т. е.
РГ (*о) + {у', Хо) > sup {р<х +
+ (у‘, y)l(a.	(2)
Тогда р 0, так как иначе
Рис. 12.
в силу предложения 3),
верхняя грань справа равнялась бы + оо. Если р — 0, то, выбрав z/*edomf* (domf*^=0
получим для t > О
Г (У*1 + *У*) = sup {(^ 4- ty*, y') — f(y)\y^ dom f] <
< SUP {{y'v У) — f (У) ly e dom f} +
+1 sup \{y\ у} I у <= dom f} =
= fO/J) + *sup {<#*, y) ]y<== domf), и согласно (2)
(*o)> {У\ + ty\	- r (y\ + ty*)>{y\, x0) - f {y\) +
+ 4</> x0) — sup {</, z/) 11/e dom/}]-> 00
при t —♦ 00, т. e. Хо ф dom f**, вопреки предположению. Таким образом, случай р = 0 тоже исключается.
Остается случай р <; 0. Поделив обе части неравенства (2) на |р| и полагая х* = |р|-1«/*, получим
<х‘, х0) — Г * (х0) > sup {<х‘, у} — а | (а, у) е epi f} = f * (х’), т. е. гиперплоскость а = (х‘, х)—/* (х*) проходит выше точки х0):
<<х0)>Г(х0) + Г(х’)
188
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
в противоречии с неравенством Юнга — Фенхеля. Теорема доказана.
Из теоремы сразу следует «двойственное» описание собственных замкнутых выпуклых функций.
Следствие 1. Всякая собственная выпуклая замкнутая функция на X совпадает с верхней гранью семейства всех не превосходящих ее непрерывных аффинных функций.
Доказательство. По теореме Фенхеля — Моро f(x) есть верхняя грань семейства аффинных функций вида
х -> (х\ х) — Г (х*)	(х* с= dom П
и, тем более, всех не превосходящих ее непрерывных аффинных функций.	____
Следствие 2. Если convf — собственная функция, то	___
f** = convf.
Доказательство. Надграфик epif** — выпуклое замкнутое множество, содержащее epif (поскольку Поэтому epi f cz conv (epi f) cz epi f**. Это значит, что f convf f**. Из левого неравенства следует, что f* <c(convf)* и, следовательно, f** (convf)** = = conv f, поскольку	conv f — выпуклая	замкнутая
функция.
§ 3.4. Теоремы двойственности
Теоремы двойственности показывают, как связаны преобразования Юнга — Фенхеля функций, получающихся в результате тех или иных операций, с преобразованиями Юнга — Фенхеля исходных функций. Оказывается, что операции, описанные в п; 3.2.2, распадаются на пары двойственных операций.
Приведем сначала формулировки всех теорем двойственности, а затём перейдем к доказательствам.
Теорема 1. Пусть ..., fn — функции на X. Тогда
§ 3.4. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ
189
Если же fi, ...» fn — выпуклые собственные функции и их эффективные множества содержат общую точку, в которой все эти функции, за исключением, может быть, одной, непрерывны, то
(А+/2+...
Более того, в этом случае для всякого х* edotn (fi+.. • +/«)’ найдутся такие точки x’edomf’, i=l..п, что
х*=х;+ ... +х‘,
(Z.+ ••• +ц-(х-)=/;«)+ ... +£(<).
Теорема 2. Пусть fb fn — функции на X. Тогда
(conv (А Л f2 л... л /„))• = П V f; V ... V Гп,
(Л V f2 V ... V Q’Cconv^ Л г2 Л ... Л Q.
Если же fi, fn — выпуклые функции, конечные на всем пространстве X, и все они, за исключением, может быть, одной, непрерывны, то
(f, V f2 V.. • V f„)‘ = conv(f; л Г2 л ... л Q.
Более того, в этом случае для всякого x‘edom (Л V • • • V/«)* найдутся такие векторы х*{ е dom f*., i = 1, ..., п, и такие неотрицательные числа a,-, i— п, сумма которых равна единице, что
х’ = а,х;+	+м;,
(f, v... V f J (V)=«,?;«)+...+ а л К).
Теорема 3. Пусть Л: X->Y — линейный непрерывный оператор. Если g — функция на X и f — функция на Y, то
(A^)’ = g‘A\ (fA)‘<A*f.
Если же f — выпуклая функция, непрерывная в некоторой точке множества 1mA, то
(fX)' = AT.
190
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Более того, в этом случае для всякого x*edom(/A)* найдется такой вектор у* е У*, что
x* = AV, (/ЛГ(г*) = Г(/).
Отметим, что в каждой из сформулированных теорем первое утверждение носит безусловный характер, в то время как второе справедливо лишь при дополнительных предположениях. Причина этого кроется в различной природе двойственных операций в каждой паре. Одна из них локальна (значение результирующей функции в каждой точке определяется только значениями исходных в соответствующей точке) и преобразует замкнутые функции в замкнутые. Таковы сумма, верхняя грань и прообраз при линейном непрерывном отображении. Вторая операция нелокальна (значение результирующей функции в каждой точке зависит от всей совокупности значений исходных) и, вообще говоря, не сохраняет замкнутость.
Приведем примеры, показывающие, что условия, фигурирующие в заключительных частях теорем, существенны.
Пусть fi и fz — функции на прямой, заданные равенствами
Тогда
A W = 11ЖI - 11, fi (X) = I X |.
/;(</)=(|г/Ь I °°»
(А + АГ(«/) = [
I °°>
С другой стороны,
если | у | < I,
если если если
если если если если
1</1> 1: 1</|< I.
|»1> к I Х|< 1, |х|> I; I у I <2. \У I > 2.
о; ® $ (У) = inf {?; (У - Z) 11 21 с 1} =
0, если
| у | — 1, если
оо, если
1</К 1.
1 <1 </|'<2.
I У 1>2.
Таким образом, преобразование Юнга — Фенхеля суммы невыпуклых функций (функция fi не выпукла) может не совпадать с инфималь-ной конволюцией сопряженных функций, даже если исходные функции всюду непрерывны. Рассмотрим еще один пример, показываю-
§ 3.4. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ
191
ший, что требование непрерывности, присутствующее в формулировке теоремы 1, существенно. Пусть
f (х)—( — К2х’х2, если х1 >0, х2>0, 1 I оо»	если х*<0 или х2<0;
р , .	(0, если х1 <0, х2 > 0,
/2 W = 1
I оо, если х1 > 0 или х2 < 0,
где х = (х1, х2) s R2. Обе функции выпуклы, а их эффективные множества пересекаются по полуоси х1 == 0, х2 > 0, в каждой точке которой обе функции терпят разрыв. В частности,
. «ч/ч Г °’ если *1=0, х2>0, (/1 + L) (*) == {	1 / л 9 л
I со, если х1 =/= 0 или х2 < 0.
Имеем для у = (у*. у2) е= R2
* ГО, если у'у2>\,	<0, ^2<0.
/1 \У) — 1
I оо в остальных точках;
♦ ГО, если	,2<0,
2	[ оо, если у1 <0 или у2>0;
। * ч* / ч ( °’ если У2«>> (tl + /2) (У) - ]	2 л
V оо, если у2 > 0.
С другой стороны, функция	как инфимальная конволюция
индикаторных функций равна индикаторной функции суммы эффективных множеств функций f1 и f2. Сумма этих множеств состоит из всех точек полуплоскости у2 0, за исключением точек прямой i/2 = 0, т. е. она не совпадает с эффективным множеством функции (А + М*. Аналогичные примеры можно привести в подтверждение существенности условий остальных теорем.
Переходя к доказательствам, заметим сразу, что первые две теоремы достаточно' доказать для случая двух функций, так как общий случай легко получается по индукции.
Доказательство теоремы 1. Первое равенство устанавливается прямой выкладкой:
(А ©/2)* (X*) = sup {(х*. х) — inf (ft (х — z) + f2 (z))} =
X	z
= sup {<x\ y} - («/) + (x‘, z> — f2 (z)} = fl (x‘) + f2 (x‘).
y.z
Далее, по неравенству Юнга — Фенхеля f; (*э+п (*;) > <*;+x> - f, w -
192
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
ДЛЯ любых X* G X*, Х*2 е Г, х е X. Поэтому да)+од>№. + ш<+'‘Э-
Это неравенство, в частности, верно для всех х* и хг таких, что х* + Х2 = х*. Поэтому
Первая часть теоремы доказана.
Перейдем к доказательству второй части. Из последнего неравенства, в частности, следует, что третья из доказываемых формул верна, если
dom(fj + f2)*= 0.
Предположим теперь, что (fi + f2) *(х*) = ао < оо и функция непрерывна в некоторой точке из domf2. Тогда dom(fi + f2) #= 0 и, значит, (fi + f2)* всюду больше —оо; в частности, —оо < ао < оо. Рассмотрим множество
А = {(а, х) е R X X | а < (х*, х) — f2 (х) — аэ}.
Очевидно, это множество выпукло. Покажем, что A A int(epifi) = 0. (Множество int(epifi) не пусто в силу теоремы 1 из § 3.2.) Действительно, если (а, х)<= еДП int(epifi), то
f 1 (х) < а < <х*, х) — f2 (х) — аэ, т. е.
«о < <х*, х) — f j (х) — f2 (х) С + f2)* (х*) = аэ.
По первой теореме отделимости (теорема 1 из §3.1) существует ненулевой линейный непрерывный функционал (₽,f/*)GRXA4, разделяющий А и int(epifi), г. е. такой, что
sup [ра + (/, х) |(а, х) g= epi fj <
<inf {ра + <£/*, х> |(а, х)еЛ]. (1)
Ясно, что р 0. Если р = 0, то из (1) следует, что //* разделяет множества domfi и domf2 (у* У= 0, коль скоро Р = 0). Последнее в силу первой теоремы отделимости невозможно, поскольку по условию (см. также теорему 1 из § 3.2) множества int(domfi) и domf2 пересекаются.
§ 3.4. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ
193
Итак, р < 0. Разделив обе части неравенства (1) на | р | и положив x*i = | р |-1 у*, получим
fi(ХЭ = sup {<xi’ х> —Мх) Iх е *} =
= sup {(х*, х) — а | (а, х) е epi f,J inf {(Хр х} — а | (а, х) е Л} =
— inf {(х* — х*, х) + f2 (х) |х s dom f2] + а0 =
Из этого соотношения следует неравенство
(f; ® (**) = П (<) + r2 (X’ - xj) < а0 = + Г2)‘ (х'),
доказывающее теорему.
Доказательства теоремы 2 мы не приводим; оно нам не понадобится.
Доказательство теоремы 3. Как и в предшествующем случае, первое соотношение тривиально следует из определений, второе вытекает из неравенства Юнга — Фенхеля, и нам остается доказать неравенство
(ЛТ)(х*Х(/Л)*(х-)
в предположении, что функция f непрерывна в некоторой точке, принадлежащей множеству Im Л, и что fe е dom (fA)*.
Положим ао = (/А)* (х*). Поскольку (domf)A П(1тА)У=0, функция /Л принимает конечные значения и, значит, (fA)* всюду больше —оо; в частности, а0— конечное число. Рассмотрим в RX линейное многообразие
М = {(а, у) е R X Y |3х е X: а = (х*, х) ~аэ, у = Лх}.
Оно не пересекается с внутренностью множества epi f, так как иначе для некоторого х е X было бы
f (Ах) < <х*, х) — аэ,
а0<(х\ х>-/(Лх)<(/Л)‘(х-) = ао.
7 А. Д. Иоффе, В. М. Тихомиров
194
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
По первой теореме отделимости множества М и epi f можно разделить ненулевым линейным функционалом (Р, у') е R X Y*, т. е.
sup {ра + («/*, у) | (а, у) е epi f} <
< inf {ра + (у”, у} | (а, у) 6= М}.
Как обычно, убеждаемся, что р^О. Если Р = 0, то у* не равен нулю и разделяет множества dom f и Im Л вопреки предположению о том, что int (domf) f| (1тЛ)^=0. Итак, р < 0. Разделив обе части последнего неравенства на | р | и положив г/о = 1РГ1У*> получим
Г (Уo') < inf {{Уу У} — а | (а, у) G= М) =
= inf ((z/*, Лх) — <х‘, х> + а0 [ х (=Х}.
Так как (у*) > — оо для всех у*, отсюда следует, что %* = Д*у*. Иначе
inf ((г/*, Ах) — (х*, х)) = inf (Л*у* — х*, х) = — оо.
Таким образом, х*е!шЛ*, x* = A*yJ и (Л*/*)(х*)^ </*(у*)^а0 = (/Л)*(х*). Теорема доказана.
§ 3.5. Выпуклый анализ в конечномерных пространствах
3.5.1. Теорема Каратеодори. В конечномерных пространствах многие общие теоремы выпуклого анализа могут быть значительно усилены. В § 3.1 мы показали, что выпуклая оболочка множества совпадает с совокупностью всех выпуклых комбинаций точек этого множества (предложение 1 из § 3.1). Аналогичным образом были описаны выпуклые конусы, порождаемые множествами (предложение 3 из § 3.1). В конечномерных пространствах справедливы более сильные утверждения.
Теорема 1. Пусть А — непустое подмножество пространства Rn. Тогда каждая отличная от нуля точка х, принадлежащая выпуклому конусу КА, порожденному множеством А, может быть представлена в виде
х = Л|Х| 4" • • • И- КГхп
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
195
где Xi > 0, ...,	> 0, а точки е Л, ..., хг (= А ли-
нейно независимы. В частности, г п.
Доказательство. Пусть х е Ка и х #= 0. Тогда в силу предложений 1 и 3 из § 3.1
х —	+ ... +
где pi > 0, ..., рь > 0, а точки хь ..., xfe принадлежат множеству А. Предположим, что векторы хь Хь линейно зависимы, т. е. существуют не равные одновременно нулю числа у1, ..., уь такие, что
ул+ ... +ул = о.
Без ограничения общности можно считать, что среди чисел Yi, •. •, \k есть положительные (в противном случае мы заменим их на противоположные). Обозначим через У множество тех индексов 1, 1 i k, при которых у« > 0, и положим
П ~ m i t-i р = min —.
Пусть, далее, =	— ₽Yr
Тогда , все числа неотрицательны и по крайней мере одно из них равно нулю. С другой стороны,
2	= 2 нл- — Р 2 УЛ = 2 НЛ = х.
Таким образом, мы представили х в виде суммы не более k— 1 ненулевых слагаемых.
Повторив проделанную процедуру необходимое (но всегда конечное!) число раз, получим в конце концов требуемый результат. Теорема доказана.
Следствие 1 (теорема Каратеодори). Пусть A ci Rn. Тогда каждая точка множества conv Л есть выпуклая комбинация не более п 4; 1 различных точек множества А.
Доказательство. Рассмотрим в пространстве R X Rn множество В = {1} X Л, т. е. совокупность точек вида (1, х), где хеЛ. Очевидно, conv В = {1}Х(сопуЛ)<
7*
196
ГЛ. 3 ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Пусть Кв— выпуклый конус, порожденный множеством В. Тогда conv В с: Кв- Если (l,x)econvB, то по теореме существует г^п-f-l точек	(1,хг) из
В и г чисел он > 0, ..., аг > 0 таких, что
(1, x) = cti(l, х0+ ... 4-аг(1, Хг).
Но это равенство означает, что
«1 + • • • + аг = 1, «1^1 + • • • + ^гхг =
Теорема Каратеодори доказана.
Следствие 2. Пусть А — замкнутое ограниченное подмножество пространства Rn. Тогда выпуклая оболочка множества А замкнута, т. е. conv 4 = conv А
Доказательство. Рассмотрим множество
S={a = (ai, а„+1) |az>0, i=l, .... «4-1, 2az = 1) cRn+l
и отображение <p: Rn+IXR’tX ••• XRn~*R,l> которое n 4-1 раз
каждому набору a = (ab ..., a„+1) e Rrt+1, Xi <= Rn, ...
..., x„+1e R” ставит в соответствие вектор
п + 1
<p(a, xb .... х„+1)= 3 azx'. t=i
Отображение <p непрерывно, а множества ЗиЛ компактны. Поэтому и множество S X А X • • • X А ком-п+1 раз
пактно. Отсюда следует, что и qp(S, А, .Л)—компактное и, значит, замкнутое множество. Но по теореме Каратеодори
<p(S, Л, Л) = convЛ.
3.5.2. Аффинная оболочка и относительная внутренность. Говорят, что точка х е R" есть аффинная комбинация точек х19 ..., хг, если
Г	г
х — s Z,xb где е R, Е = 1. i=i	i=i
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
197
Совокупность всех аффинных комбинаций точек множества А называется аффинной оболочкой множества А и обозначается aft А. Легко понять, что aff А есть линейное многообразие, параллельное линейной оболочке множества А — х0, где ха — произвольная точка множества А. Действительно, если x = 2Vi> х( е А, 2^ = 1 и то точка х — x0 = 2zz(.rz—*о) принадлежит линейной оболочке множества А—х0. Наоборот, если x =	— хо), где х^А, то х + хо = 2м,+
+ (1 — S Л,) xQ е aff А. Если А—выпуклое множество, то размерность его аффинной оболочки называется размерностью множества А и обозначается dim4.
Точки Хь ..., хг из Rn называются аффинно независимыми, если из
Л^х* = 0,	= О
t=i	/=1
следует, что Zi = ... = Лг — 0. Приведенное выше рассуждение показывает, что точки хь ..., хг аффинно независимы тогда и только тогда, когда векторы Хь — xi9 k=l, ..., г, k=^=i, линейно независимы для всякого фиксированного номера i, 1 i г. Поэтому, если хь ..., хг аффинно независимы, то всякий вектор х е aff {хь ..., хг} единственным образом представляется как аффинная комбинация точек хь ..., хг, т. е. существует единственный набор чисел Ль ..., Лг, равных в сумме единице и таких, что х = ZjXi	Лгхг.
Эти числа называются барицентрическими координатами точки х.
Выпуклая оболочка k + 1 аффинно независимых точек хь xfe+1 называется k-мерным симплексом, а сами точки Xi, ..., Х&+1 — его вершинами.
Предложение 1. Пусть S есть п-мерный симплекс в Rn. Тогда int S =# 0.
Доказательство. Без ограничения общности можно считать, что Xi + ... + xn+i = 0 (где хь ..., хп— вершины симплекса S). Пусть xeRn, х#=0, и М, ... ..., Лп+1 — барицентрические координаты точки х. Положим Л = гпах{|Л1|, ..., |Лп+1|}. Предположим, что
198
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
1/е > (п +	1. Тогда 1 > е > 0 и
п+1	п+1
ех = (1 — е) •0 + ех=^(-^=-у + еХ<)х/ = 2аЛ^5, i=l 4	1=1
так как а1 + ... + ап+] =1 и а( > 0 в силу выбора е. Отсюда следует, что, если {вь ..., еп} — стандартный базис в Rn, то найдется такое е>0, что ±ее; еЗ для всех / = 1, .... п. Поэтому и
conv {± еву |/ = 1.п] с: S.
Но множество conv{±ее,|/ == 1, .... п} содержит шар п ___________
радиуса 8/]/п. Предложение доказано.
Пусть А cz Rn. Внутренность множества А относительно affX называется относительной внутренностью множества А и обозначается ri А. Точки множества ri А называются относительно внутренними точками множества А,
Теорема 2. Пусть A cz Rn — выпуклое множество. Тогда ri4 =# 0 и aff (ri Д) = aff А,
Доказательство. Предположим сначала, что dim4 = n, т. е. что aff4 = Rn. Пусть	хт—не-
которая максимальная система аффинно независимых точек множества А. Очевидно, т п+ 1. С другой стороны, множество А не лежит ни в каком собственном линейном многообразии. Поэтому если т<п+1, то в А найдется вектор, не принадлежащий аффинной оболочке точек %1, ..., хт, т. е. эти точки не образуют максимальной аффинно независимой системы, в противоречии с предположением. Итак, /п = п+1, и в силу предложения 1 симплекс S с вершинами хь ..., xn+i имеет внутренние точки. Из предложения 4 из § 3.1 следует теперь справедливость утверждения теоремы в случае, когда dim А — п.
Пусть dinM<n. Тогда без ограничения общности можно считать, что ОеЯ, т. е. aff А есть подпространство размерности г, которое мы можем отождествить с Rr и, таким образом, снова прийти к рассмотренной выше ситуации. Теорема доказана.
Отметим в качестве непосредственного следствия доказанной теоремы, что размерность выпуклого множе
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
199
ства равна максимальной размерности содержащихся в нем симплексов. Заметим еще, что из определений и из предложения 4 § 3.1 следует, что д = пЛ, riA== .= ri А.
3.5.3. Выпуклые функции на Rrt.
Теорема 3. Пусть f — выпуклая собственная функция на Rn. Тогда f непрерывна относительно aff(dom/’) во всякой точке xeri(domf) и f*— собственная функция.
Доказательство. Пусть dim (dom f) = k. Выберем в ri(dom/) некоторый ^-мерный симплекс S с вершинами X], ..., Xfe+], Тогда в силу выпуклости функции f для всякой точки xeS справедливо неравенство /(xXmaxfHx!)................f(xft+I)}.
Из предложения 1 следует, что внутренность симплекса S относительно множества aff(domf) не пуста. Поэтому в силу теоремы 1 из § 3.2 функция f непрерывна относительно aff(domf) во всякой относительно внутренней точке множества dom f. Первое утверждение теоремы доказано. Из него следует, в частности, что функция f совпадает со своим замыканием на множестве ri(domf)« Если f(xQ)=—оо в некоторой точке х0 и Xi е ri(dom f), то при некотором е > 0 точка Х2 = Xi + e(xi — х0) содержится в domf (так как х0 е domf cz aff (domf))« Тогда для всякого аЕ R точка
(?, «Нтт^ + ттг-. *0
принадлежит epi т. е. f(xi) = —°© вопреки выбору х{. Таким образом, f = f**—собственная функция и, следовательно, f* — тоже собственная функция. Теорема доказана.
Отметим еще один полезный результат о выпуклых оболочках функций на Rn, следующий из теоремы Кара-
теодори.
Предложение 2. Пусть f — собственная функция на Rn. Тогда
( П + 1
(conv f) (х) = inf j 2 «if (xi) I t=l
X, s R",
n + 1
и/ o, 2 — i,
n+1
5 «Л = x i=l
200
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
В частности, если f — замкнутая функция и dom f** — ограниченное множество, то
f** = convf.
I Доказательство. По теореме Каратеодори
( п+2
(conv f) (х) — inf \ 2 atf (xt) l i=l
Xi e R",
az>0,
n+2
S a;= 1, /=!
n+2
S a;x; = x i=l
Зафиксируем xt e R" (i = 1..n + 2) и x e R" и рас-
смотрим такую задачу:
n+2
aj (xf) —> inf;
1=1
n+2	n+2
af o, 2^ = 1» 2 aixi = x-i=l	i=l
Для доказательства первой части предложения достаточно проверить, что в том случае, когда значение задачи конечно, среди ее решений найдется хотя бы один набор чисел (ои, ..., ап+2), У которого хотя бы одна компонента равна нулю. (Решение задачи заведомо существует, если ее значение конечно, поскольку множество допустимых элементов в задаче компактно, а минимизируемая функция линейна.)
Пусть (аь ..., (Zn+2)—решение задачи. Если хотя бы одно из чисел щ равно нулю, то доказывать нечего. Пусть аг > 0, i = 1, ..., п + 2. По теореме Каратеодори можно выбрать числа а{^0,	а„+2^0, среди
которых не более п + 1 отличны от нуля и такие, что
П+2	п+2
2 а/ = 1,	5 n'iXt — х.
/=1	i=i
Если Sa/f (xzXUaJfo),
то все очевидно. Допустим,
что S а</ (х.) > 2 aif Тогда, если 0, = ^— а<, то
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
201
2 = 0,2 Рл = 0 и при достаточно малом Л > 0
^ + ^>0, /=1, .... П + 2; 2(а/ + Л₽/) = 1;
п+2
2 (аг + Лр.) Xi = х;
1=1
п + 2	п+2
5 (аг + Я,р.) f (х^ < 2 aj (хг),
вопреки выбору (аь ап+2). Первая часть предложения доказана.
Пусть теперь f — замкнутая функция и domf— ограниченное множество. Если х е dom f**, то из следствия 2 теоремы Фенхеля — Моро вытекает существование последовательности наборов {(aim, .... an+i,т, xim, ..., xn+i,m)} таких, что axm>0, ^а1т=1, xim<= i
dom f и n+1 2 i=l
n+1 2 ®чтх1т x i=l
при in—> оо. Поскольку последовательности {aZw} и ограничены, мы можем считать, что azw->az, xim — при т —> оо для всех /. Тогда az ^0, Sat-= 1, S aiXi = x. Наконец, если f (xim) -+ co для некоторого номера i, то, поскольку f ограничена снизу, >0 и almf (xim) -> 0. Если же limf (Xjm) < оо, то, из-за замкнутости функции f, f(X{) < оо. Поэтому
п+1	п+1
Г (х) < (conv f) (х) < 2 aj (Х{) < lim 2 aimf (xim) = f" (x). i=l	---i=l
Предложение 2 доказано.
Глава 4
ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Эта глава посвящена систематическому изучению субдифференциалов. Субдифференциалы характеризуют локальное поведение выпуклых функций и функций, локально устроенных как выпуклые, подобно тому, как производные определяют локальное поведение гладких функций. И на самом деле, между «субдифференциальным исчислением», с одной стороны, и дифференциальным исчислением гладких функций, с другой, существует глубокая связь, хотя некоторые результаты о субдифференциалах и не имеют аналогов в дифференциальном исчислении. Практически все результаты этой главы существенно используются в дальнейшем; отметим важнейшие из них — теорему Моро — Рокафеллара и теорему об очистке (§ 4.2), Всюду в этой главе, как и в предыдущей, предполагается, что X, Y, ... — отделимые локально выпуклые линейные топологические пространства.
§4.1. Однородные функции и производные по направлениям
4.1.1. Однородные функции. Функция f, определенная на пространстве X, называется положительно однородной степени а > О, если /(0) = 0 и
f (U) =	(х)
для всех х е X, Л > 0. У нас в книге будут встречаться, главным образом, положительно однородные функции степени единица, для краткости будем называть их просто однородными. Очевидно, надграфик однородной функции — конус. Поэтому однородная функция вполне определяется своими значениями в сколь угодно малой окрестности нуля. Вспоминая условие выпуклости конуса (§ 0.3), немедленно получаем, что однородная собственная функция f выпукла тогда и только тогда, когда
f (х) + f(,y)>f(x + y}
для всех х, у g= X. z
$ 4.1. ОДНОРОДНЫЕ ФУНКЦИИ
203
Наиболее важные примеры однородных функций — опорная функция и функция Минковского. Их однородность проверяется непосредственно. Более существенно то обстоятельство, что всякая собственная замкнутая выпуклая однородная функция есть опорная функция некоторого непустого множества.
Предложение 1. Пусть f — собственная замкнутая выпуклая однородная функция на X. Тогда f есть опорная функция некоторого непустого множества. Доказательство. Рассмотрим множество
Л = {х*еГ |/(х)>(х*, х}, Vxg=X} и покажем, что
f (х) = sup {х', х} = s (х | Л).
Если х’еЛ, то (х*, х) — f(x)^O для всех х и f*(x*) = — — f (0) = 0- Если же х* 0 А, то (х*, х) — f (х) >0 для некоторого х е X и
Г (х‘) > Нт (« tx} — f (tx)) = оо.
Наконец, согласно предложению 3 из § 3.3 f*— собственная функция. Поэтому Л #= 0 и /* — б(«|Л). В силу теоремы Фенхеля — Моро отсюда следует, что / = /** = 6*(. |Л) = $(• |Л), т. е. / — опорная функция множества А.
Отмеченное обстоятельство порождает двойственность между собственными замкнутыми выпуклыми однородными функциями на X и непустыми замкнутыми выпуклыми подмножествами пространства X*. Именно, это соответствие относит каждому непустому замкнутому выпуклому множеству A cz X* его опорную функцию, а каждой собственной замкнутой выпуклой однородной функции — эффективное множество функции, сопряженной с ней.
Отметим еще одно полезное свойство однородных функций.
Предложение 2. Пусть f — однородная функция на X. Если f непрерывна во всех точках множества U cz X, то она непрерывна и во всех точках конуса Ки,
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
2Э4
порожденного множеством U, за исключением, возможно, нуля. В частности, если f непрерывна в некоторой окрестности нуля, то f непрерывна на X.
Доказательство. Пусть Хо е Ки, Xq ¥= 0- Тогда Хх0 е U при некотором X > 0. Пусть V — окрестность точки Хх0, во всех точках которой выполнено неравенство |f(x)— f(Xx0) | < Хе. Тогда (1/X) V — окрестность точки Хо и при xe(l/X)V
I f (*) - f W I = V11 f (Xx) - f (Xx0) | < e.
Отсюда следует, что f непрерывна в точке %о- Если же f непрерывна в окрестности начала, то по доказанному f непрерывна всюду, за исключением, возможно, нуля. Но в нуле f непрерывна по условию. Предложение доказано.
4.1.2. Производные по направлениям. Пусть f — функция на X и \f(x) |< оо. Если существует конечный или бесконечный предел
МО	л
то он называется производной функции f по направлению у в точке х. Если в точке х функция f имеет произ* водные по каждому направлению, то простая выкладка
Г(х; Xt/) = lim +	=Mim .Нх + 8У)-Нх)
е|0	8	е^О	8
показывает, что f'(x\ •) — однородная функция. Эта функция называется производной функции f по направлениям.
Отличительной особенностью выпуклых функций является существование производных по направлениям во всех точках их эффективных множеств. Мы покажем сначала это для выпуклых функций на прямой, а затем в общем случае.
Пусть <р(/) — собственная выпуклая функция на R, tx < t2 < /3, причем точки t\ и /2 содержатся в dom ф. Тогда по неравенству Йенсена
фМ^Т^фИ + ^фМ-
§ 4.1. ОДНОРОДНЫЕ ФУНКЦИИ
205
Отсюда следуют два соотношения:
Ф (4) — Ф (^1) < у ~ \\ [ф (*з) — Ф (Л)].
*3	11
Ф &) - Ф &) > [ф (/3) - Ф (/J]
или
<Р«г) — <Р(Л) < ф(/з)~ <Р(<1) <- <Р (<з) — <Р (G)	,*ь
ti — t\ '	/3 — ti	' ti — ti
Пусть iedomif'. Из (1) следует, что разностное отношение
Ф (< + X) - <р (/) Л
при убывании Л к нулю не возрастает (если /—крайняя правая точка богпф, то это отношение тождественно по Z > 0 равно + со). Поэтому во всех точках множества богпф функция ф имеет правую производную
ф' (/) = ф' (/; 1) = Ит Ф(< + Х)~У(О-. +	Л40	Л
Далее, если и t2 принадлежат domq) и 0<б</2—
то снова в силу (1)
, Ф (^ + д) — Ф (М ф(*2)-ф(6)	Ф^г + М—ф(^)
Отсюда следует, что ф^_ (Q ф* (Q, т. е. правая производная не убывает по t и |ф^_(0 | < оо, если /e=int (богпф).
Обратимся к общему случаю.
Предложение 3. Пусть f—собственная выпуклая функция на X. Тогда функция f имеет производную по направлениям в любой точке множества domf. При этом
Г{х. y)=\nt
Л>0	А
Доказательство. Пусть х е dom f, у^Х. Положим ф(/) — f(х + ty). Тогда ф есть выпуклая собственная функция на R и нуль принадлежит ее эффективному множеству. Поэтому правая производная ф^.(0) существует. Однако по определению ф^ (0)= f'(x; у). Предложение доказано.
206
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Мы уже отмечали, что производная по направлениям— однородная функция. Если f выпукла, то простая выкладка
г (х; у + г) = lim У <* + U/2) (у + *)>-f W <
НО	А/2
<lim .H<+^)-fW + f(x + M-f,(x) = f, (х. у} + fr(х. z} МО	А
показывает, что ее производная по направлениям тоже выпукла.
Предложение 4. Пусть f — собственная выпуклая функция на X, непрерывная в точках множества UczX. Тогда, если для некоторого х^Х такого, что x-f-xet/, производная f'(x-,x) конечна, то функция f'(x-, •) непрерывна во всех точках конуса Ки-х, порожденного множеством U — х, за исключением, возможно, начала координат. Если же f непрерывна в точке х, то производная по направлениям f'(x\ •) конечна и непрерывна на X.
Доказательство. В силу предложения 2 нам нужно проверить, что функция f'(x\ •) непрерывна во всех точках множества U — х. Покажем сначала, что fz(x; •)— собственная функция. Так как |fz(x; х) | < оо, то xedomf. Поэтому fz(x; у) f (х + у) — f(x) для всех у (предложение 3). Предположим, что f'(x;xi) = = —оо в некоторой точке Xi е X. Поскольку х + х g 'е int(dom f) (теорема 1 из § 3.2), для достаточно малого 8 > 0 точка х + (х + е(х — Xj)) = х + х2 принадлежит множеству domf. По неравенству Йенсена для всякого Л > 0
f(x + U)< (х + Лх2) + (х + Лх,).
откуда следует, что
f(x; xXq-^-Hx; х2)
щП*; xj = —оо
в противоречии с условием. (Заметим, что fz(x;x2)< оо, поскольку x + x2edomf.) Таким образом, наше предположение было ошибочным и fz(x; •) — собственная функция.
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
207
Если Xi е U — х, то f ограничена сверху некоторым числом с в достаточно малой окрестности V точки x-|-xi. Поэтому для всякого y^V— х выполнено неравенство
f'(x; yXf(x + y) — f(x)^C — f (x),
т. e. Л(х; •) конечна и ограничена на V — хи, следовательно, по теореме 1 из § 3.2 непрерывна в точке хь Этим завершается доказательство первой части предложения.
Для доказательства второй части достаточно заметить, что, если f непрерывна в нуле, то (из-за выпуклости) она непрерывна в некоторой окрестности нуля, и применить снова предложение 2.
§ 4.2.	Субдифференциал. Основные теоремы
4.2.1.	Определения и элементарные свойства. В § 0.3 субдифференциал выпуклой функции f в точке х определялся следующим образом:
^{х) = (х*еГ|/(г)-/(х)>(х*, z-x), УгеХ}.
Этот параграф мы начнем с другого определения, пригодного не только для выпуклых функций, но совпадающего с первоначальным в случае, когда функция выпукла.
Пусть f — однородная функция на X. Субдифференциалом функции f в нуле называется эффективное множество сопряженной функции f*. Оно обозначается df(O). В силу предложения 1 из § 4.1
df (0) = {х* <== Г \f (х) > (х*, х>, Vxe/).
Замечание. Функционал х* е X* такой, что
f (х)	(х*, х), Vx е X,
называют иногда опорным функционалом однородной функции f(x). Таким образом, df($)—множество всех функционалов х*, опорных к однородной функции f(x). Точно так же, если g — однородная функция на X*, то множество
dg (°) = d°m g* = [х X | g (х*)	<х*, х), Vx* е X*}
208
ГЛ., 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
называется субдифференциалом функции g в нуле. Пусть теперь f — функция на X, имеющая производную по направлениям в точке х. Множество
df(x) = df'(x; 0)
называется субдифференциалом функции f в точке х. Элементы этого множества называются субградиентами функции f в точке х. Говорят, что функция f субдифференцируема в точке х, если df (х) =И= 0.
Как следует из доказываемого ниже утверждения, для выпуклых функций это определение субдифференциала совпадает с тем, которое было приведено в § 0.3.
Предложение 1. Пусть f — выпуклая функция на X. Тогда следующие условия эквивалентны:
а)	х* е df (х);
б)	f(z)—	z— х) для всех z е Х\
В) f(x) + f(x‘) = (x‘,x).
Доказательство. Если х*edf(x), то в силу предложения 3 из § 4.1
<х‘, z — х)< f' (х; г — х)< f (х + z—х) — f (х) = f (z)—f (х). Если <х‘, z — x)^f(z) — f (х) для всех z е X, то (х*, z) — .— f (z)	<х‘, х) — f (х) для всех z е X, откуда, принимая
во внимание неравенство Юнга — Фенхеля, получаем f(x*) + fW = <x‘, х>.
Если, наконец, (х‘, х) = f (х) 4* Г (х*)> то поскольку f (х + ez) <х‘, х + ez) — f* (х‘), для всякого е > 0
и? следовательно,
f (х; z)>« z).
Предложение доказано.
Примеры функций и их субдифференциалов.
1.	Аффинная функция f (х) = (х*, х)'+ а субдифференцируема в любой точке х и df(x)={x*}. Вообще, субдифференциал функции, дифференцируемой по Гато в данной точке, содержит единственный элемент — производную Гато в этой точке.
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
209.
Верно и обратное: если f — выпуклая функция, непрерывная в /точке х и субдифференциал df(x) содержит единственный элемент х*, то f дифференцируема по Гато в точке х и f'r (х) = х*. В самом деле, в силу предложения 4 из § 4.1 функция f'(x; •) непрерывна и, следовательно, замкнута. Поэтому
f'(х; г) = (Г (х; •))“ (г) = sup {<г\ г} |г* <= df (х)] = (х‘, z), что по определению означает, что f'r (х) = х\
2.	Субдифференциал индикаторной функции б(-|Л) в точке х мы вычислили в § 0.3, он оказался равным конусу опорных функционалов множества А в этой точке:
56(x|A)==Af(x|A)={x*er |<х*, z—х><0, Vze= Л}.
Если К — конус, то N (01 К) = К° — полярный конус; если М — линейное многообразие, параллельное подпространству L, то N(x\M) — L1 — аннулятор L для всякой точки х^М (ср. с п. 3.3.1, пример 2).
3.	Пусть f — однородная выпуклая функция и х =И= 0. Тогда df (х) = {х* е df (0) | f (х) = (х*, х)}. Это сразу следует из предложения 1 § 4.1 и утверждения в) предложения 1.
4.	Субдифференциал нормы в банаховом пространстве мы вычислили в § 0.3:
Г {х’е Л”|||х’||= 1, <х‘, х) = ||х|Ц, если х#=0, I В‘(0, 1)=={х’<=Г |||х‘||< 1}, если х = 0.
В § 4.5 мы вычислим субдифференциалы и других функций.
В этом параграфе мы основное внимание уделяем субдифференциалам выпуклых функций. Аналогичные результаты для невыпуклых, но субдифференцируемых функций будут получены в § 4.4.
Из определения прямо следует, что функция f может быть субдифференцируема только в точках множества dom f. При этом, если f выпукла и субдифференцируема в некоторой точке х, то f — собственная функция, f* — тоже собственная функция и df(x)cz dom f*. Далее, поскольку индикаторная функция субдифференциала сопряжена с производной по направлениям, субдиффе
210
ГЛ._ 4. локальный выпуклый анализ
ренциал — выпуклое и слабо* замкнутое множество в силу предложения 2 из § 3.3. Заметим еще, что в силу теоремы Фенхеля — Моро выпуклая однородная функция субдифференцируейа в нуле тогда и только тогда, когда она полунепрерывна снизу в нуле. Действительно, в этом случае замыкание функции f в нуле равно нулю. Поэтому f (из-за однородности) не может принимать значения —оо ни в одной точке, а это, в свою очередь, означает, что f*(x*)— собственная функция и dom/*=/=.
0. Отсюда следует
Предложение 2. Выпуклая собственная функция f субдифференцируема в точке х <= dom f тогда и только тогда, когда ее производная по направлениям в этой точке полунепрерывна снизу в нуле.
Пр едложение 3. Пусть f(x)—выпуклая собственная функция, непрерывная в точке Хо. Тогда ее субдифференциал df(x0) не пуст и ограничен в слабой* топологии.
Доказательство. Согласно предложению 4 из §4.1. функция f(xo; •) непрерывна на X. Из предыдущего предложения следует, что df(xo)#=0. Далее для всякого х е X
sup «х*, х) |х* е df (х0)} = f (х0, х) < оо, что по определению означает ограниченность множества df(xo) в слабой* топологии пространства X*.
Замечание. На самом деле, в условиях предложения 3 множество df(x0) слабо* компактно, но мы не будем этим пользоваться.
Отметим в заключение три очевидных формулы, ко-, торые полезно иметь в виду:
если ф (х) = f (х + х0), то
д<р (х) = df (х + хй)-,
если ф(х) —Af(x), где А > 0, то
d<f(x) = hdf (х);
если ф (х) = f (Ах), где % > 0, то
5ф (х) == A df (Ах).
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
211
4.2.2. Основные теоремы о субдифференциалах. Эти теоремы позволяют вычислять субдифференциалы функций, получающихся в результате некоторых операций, через субдифференциалы исходных функций. Поскольку субдифференциал связан с локальным поведением функции, такие теоремы, конечно, могут существовать только для локальных операций.
Теорема 1. Пусть flf ..., fn — выпуклые собственные функции на X. Тогда для всякого х<=Х
dfj(x)+ ... + dfn (х) с д (f! 4- ... +f„)(x).
Если же в некоторой точке х е (dom /ч) А ... П (domfn) все функции ..., fn, за исключением, возможно, одной, непрерывны, то
ал(х)+ ... +^„(х) = <9(Л+ ... +м(х)	(1)
для всех х е X.
Это теорема Моро — Рокафеллара, доказанная нами в § 0.3. Мы сейчас приведем другое доказательство этой теоремы, связанное с тем определением субдифференциала, которое было дано в начале параграфа.
Доказательство. Проверка первого утверждения теоремы не представляет труда, и мы не будем делать это заново. Второе утверждение, как и в § 0.3, достаточно доказать лишь для случая п = 2.
Итак, пусть f 1 и f2 — выпуклые собственные функции на X и одна из них, скажем, ft, непрерывна в некоторой точке х, в которой ft конечна. Если д (fi + f2) (х) = 0, то равенство (1) следует из первой части теоремы. Пусть d(fi + f2)(x)=/= 0 и x*(=d(fi + f2)(x). Тогда хе е dom (fi + f2) — (dom f^ A (dom f2). В силу предложения 4 из § 4.1 функция ft(x; •) непрерывна в точке х — х. С другой стороны, f2(x; х—x)^f2(x) — f2(x) < оо, т. е. х—х е domft(x; •). Таким образом, нам достаточно проверить, что f'2(x; •)—собственная функция, ибо в этом случае теорема 1 из § 3.4, примененная к функциям f[(x; •) и f2(x\ •), дает
df, (х)df2 (х) = dom (х; • ))* + dom (% (х; •))* =
= dom (ft + f2y (х; •))* = <? ft + /2) (*)•
212
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Предположим, что f'2(x; z—х) —— оо для некоторой точки zeX. Тогда при достаточно малом А > 0 точка у = х + A (z—х) принадлежит dom f2 и f2 (х, у — х) = — оо (из-за однородности f2 (х; •)). Для всякого 0 а 1 положим х(а) = ах-{-(1—а) у. Тогда x(a)edom/2 и при а, достаточно близких к единице, х (а) е dom flt поскольку х s int (dom /,). Но тогда
— оо < <х‘, х(а) —	+ /2)'(х; х(а) —х) =
= f{ (х> х (а) — х) + f2 (х; х (а) — х)
^/{(х;х(а) — х)-|-а/£(х; х—х) + (1 —a)f'2(x; у—х) — — оо.
Противоречие доказывает теорему.
Теорема 2. Пусть Л: X —»• Y — непрерывный линейный оператор. Тогда, если f — функция на Y, то для всякой точки х е X
Л* df (Лх) <= д (/Л) (х).
Если же функция f выпукла и непрерывна в некоторой точке, принадлежащей множеству 1mA, го для всех хеХ
Л‘ df (Ax) = d(fA)(x).
Доказательство. Включение
Л* df (Ах) cz д (fA) (х)
сразу следует из определений. Поэтому теорема справедлива, если d(fA)(x)—0. Предложим теперь, что f выпукла и непрерывна в точке Лх, хе А', и что д(/Л)(х)=#0. Очевидно, (/Л)'(х; z) =f'(Ax\ Az). В силу предложения 4 из § 4.1 функция /'(Лх; •) непрерывна в точке Л(х- х), принадлежащей множеству 1mA. Применяя к функции /'(Лх; •) теорему 3 из § 3.4, получаем
<? (/Л) (х) = <?(/'(Лх; -)Л)(0) =
= Л* df' (Ах-, 0) = Л* df (Лх)
Теорема доказана.
Теорема 3. Пусть S — компактное топологическое пространство и f(s,x) — функция на S\X, выпуклая по х при каждом s е S и полунепрерывная сверху по s
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
213
при каждом х X. Положим
f (X) = sup f (s, х); So (х) = {s <= S | f (s, x) = f (x)}.
Тогда, каково бы ни было х е X, conv/ (J dfs(x)\a:df(x). \s G= So (x)	/
Если же при всяком seS функция x->f(s,x) непрерывна в точке л'о, то
conv/ (J dfs(x0)] = df(x0) \s е So (Хо)	/
(где через fs(-) обозначены функции на X, определенные равенствами fs(x)= f(s,x), а замыкание берется в слабой* топологии пространства X*).
Из этой теоремы, конечно, следует соответствующий результат о субдифференциале максимума двух функций.
Доказательство. Функция f(x) выпукла как верхняя грань семейства! выпуклых функций. Если sgSq(x) к х* ^.dfs(x), то
(х‘, z — x)<f(s, z) — f(s, х)</(г) —f(x),
т. е. x*^df(x). Таким образом, объединение множеств dfs(x) по всем s^Sq(x) принадлежит df(x), а поскольку последнее множество выпукло и слабо * замкнуто, то и
Q = conv / (J dfs(хЙ cz df (х). \sf=S0(x)	/
Предположим теперь, что функция f(s, х) непрерывна по х в точке Хо при всех s. Тогда д/(хо)=И= 0, поскольку функция s—>f(s, хо) конечна и полунепрерывна сверху, т. е. So(xo)=# 0, и все множества dfs(xo) тоже не пусты в силу предложения 3. Предположим, что Q^df(xo), т. е. существует x*^df(xQ), не принадлежащий множеству Q. Пространство, сопряженное с пространством X*, наделенным слабой* топологией, есть X. Так как множество Q выпукло и слабо * замкнуто, то из второй теоремы отделимости (теорема 2 из § 3.1) следует существование такого х е X, х У= 0, что
<х*, х) sup {(г*, х) | z* ее Q) + е, 8 > 0.	(2)
214
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Без г ограничения общности можно считать, что f(xo4-x)<oo. Действительно, поскольку функции fs(x) непрерывны в точке х0, при всяком se S можно указать такое Z(s)>0, что fs(xo + Z(s)x)^ fs(x0) + 1. Из-за полунепрерывности функции f по s множества
U(s) = {1^S\f& xo + %(s)x)<f(Xo) + 2} открыты в S и (J U (s) = S. Поскольку S — компакт, s
мы можем выбрать точки $]........sn так, чтобы мно-
жества £/(«]), ..., U(sn) по-прежнему покрывали S. Тогда X = min [%(sO, ...,%(«„)}> О и f(s, х0 + Ах) < <f(xo) + 2. Заменяя, если нужно, х на Ах, получим требуемое.
Пусть 0<Z< 1. Тогда x0 + /xedomf. Выберем точку s(e S таким образом, чтобы f (st, х0 + tx) = = /(х0 + /х). В силу (2)
у (х0 + fx) - f (х0) sup ху |2. е q) + 8
и по неравенству Йенсена
(1 — 0 f (st, х0) + tf (sit х0 4- х) > f (St, Х0 + tx) = f (х0 + tx), откуда
(1 — t) f (st, Xo) > f (x0 + tx) — tf (St, XQ + x) >
> f (Xo + tx) — tf (x0 + x).
Из этого неравенства при /->0 следует, что
f (х0) > lim f (st, Xo) > f (*o).	(3)
/->0
Пусть s0 — предельная точка множества {sj. Тогда из (3) в силу полунепрерывности сверху функции f по s можно извлечь, что f(s0, x0) — f(xQ). Имеем
f (st> хо + ^х) f (sr *о)	f (*о)
t	t
f' (ХО; X) >
><х’, х> > sup {<z\ х) |z* е= dfSo(x0)} +е=/Цх0; x)-f-e. (4) Выберем tf столь малым, чтобы
f (Sq, Хо + /1Х) f (So, Хо) — t, /„ . „\ । ®
_	^„(5). Х)-Г~2- W
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
215
Тогда при 0 < t < получаем, используя (4) и (5),
Xf (st, х0 + М + (1 - -£) f (st, х0) >
> f (Sp Хо + tx^f (st, Xo) + t (Xfl, X) + 8] >
£ /с v \ I / Г *o + ^jX) — f ($q, Xp) i _8_1
I \st> xo) i 1 L	‘ 2 J
ИЛИ
f(St, Xo + ^lx)^ f (Sq, Xq + t{x) + f (sif Xq)—f(SQ9 Xq)
Так как по доказанному lim f (sti xQ) = f(sQi x0), to t-»o
lim f (st, x0 + ^x) > f (s0, x0 + tix) + M/2. /->0
Полученное неравенство показывает, что функция 5 —► f (s, Хо + /ix) не является полунепрерывной сверху по s в точке So, в противоречии с условиями теоремы. Таким образом, предположение о том, что Q#=df(xo), оказалось ошибочным. Теорема доказана.
4.2.3. Субдифференциалы выпуклых функций в R".
Предложение 4. Пусть f — выпуклая собственная функция на Rn. Тогда f субдифференцируема во всякой относительно внутренней точке множества dom f.
Доказательство. Из теоремы 3 § 3.5 и из предложения 4 §4.1 следует, что при xeri(domf) функция f'(x\ •) конечна на подпространстве aff(domf)—х. Поэтому в силу той же теоремы 3 из § 3.5 (f'(x\ •))* — собственная функция, т. е. д/(х)#=0. Предложение доказано.
С помощью теоремы Каратеодори можно доказать усиленный вариант теоремы 3.
Теорема 4 (теорема об очистке). Если в условиях второй части теоремы 3 X = Rn, то каждый элемент У^д[(хо) может быть представлен в виде
У = ЩУ\ + ... + агУ„
где г < п + 1 и г
2 а. = 1; а, > 0, yt е dfs. (х0), st <= So (х0), i = 1,'..., г.
216
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Доказательство. Нам достаточно проверить, что множество Р= (J dfs(xQ) ограничено и замкнуто.
sgS0(x0)	____
Тогда в силу следствия 2 теоремы 1 из § 3.5 convP = — conv Р.
Из доказательства теоремы 3 следует, что Vx найдется X > 0 такое, что Xq + \х е dom f. Поэтому domf'(xo; •)= Rn и, так как f'(xQ\ •)—собственная выпуклая функция, она непрерывна согласно теореме 3 из § 3.5. Из предложения 3 следует теперь, что субдифференциал д/(хо) ограничен, а значит, и множество Р, содержащееся в df(xo), ограничено. Осталось проверить замкнутость множества Р. Пусть последовательность 2i, z2, ... элементов множества Р сходится к некоторому z:
Zk е Sk (Хо)’ Sk е 50 (хо).
Посколку множество So(xo) компактно, последовательность 5i, s2, ... имеет предельную точку so^5(xo). Так как функция f полунепрерывна сверху по s, для любого X Е Rn
f (s0> х) — f ($0, х0) = f (s0, x) — f (x0) >
>lim f (sk, x)—f(x0) = lim [f (sk, x) — f (sk, x0)]> A-»OO	&->oo
lim (zk |x — x0) = (z\x — x0), k-><x>
т. e. 2Е(?Цх0)сР. Теорема доказана.
§ 4.3. Конусы опорных функционалов
Напомним (см. § 0.3), что конусом опорных функционалов, или нормальным конусом выпуклого множества А в точке х е Л называется множество
N(x\A) = {х* е X* |<х*, z — х)< 0, Уг е Л),
совпадающее с субдифференциалом индикаторной функции б(-|Л) в точке х. Конусы опорных функционалов — один из важнейших классов субдифференциалов. В частности, в их терминах естественно формулируются условия непересечения выпуклых множеств,
§ 4.3. КОНУСЫ ОПОРНЫХ ФУНКЦИОНАЛОВ
217
лежащие в основе большинства необходимых условий экстремума.
Предложение 1. Пусть До, Дь ..., Ап— выпуклые множества в X, До A (int ДО А ... A (int Ап) =^= 0 и д = До А ... П Ап, Тогда для всякой точки хе Л
N(x\A) = N(x\A^ + ... +П(х\Ап).
Другими словами, нормальный конус пересечения множеств равен сумме нормальных конусов этих множеств. Доказательство. По условию 6(.|Д) =
= 6(- |Д0) + ... + б(- |Дп) и функции 6(-|Д1) непрерывны в точках множеств intДг-, i= 1, ...» п. Требуемый результат следует теперь из теоремы 1 предыдущего параграфа.
Предложение 2. Пусть f — выпуклая собственная функция на X, непрерывная в точке х0. Предположим, что для некоторого х^ справедливо неравенство f(xi)< f(xo)= ао. Тогда конус опорных функционалов множества в точке xQ совпадает с конусом Kdfix^ порожденным субдифференциалом функции f в точке xQ:
N (Xq\2> aof) = Kof (x0).
Доказательство. Обозначим для краткости
Д = ад={хеХ|Нх)<а0}.
Если x*ed/(x0), то {х\ х — х^^Цх)—f(xo)^O для всякого хе Л, т. е.
^f(Xo)c=jV(xoM).
Пусть теперь х*е#(х0|Д), х* =# 0. Из определении отсюда сразу следует, что линейное многообразие
Ж={(а, x)eRX^I« = f(4 « х —хо) = О}
не пересекается с int epi f. По первой теореме отделимости существует гиперплоскость, содержащая Ж и не пересекающая int epi f. Эта гиперплоскость не может быть вертикальна (т. е. задаваться уравнением (z*,x) = c) в силу того, что f непрерывна в точке х0. Значит, она задается уравнением а={у*,х — х0)+ + f(xo). Из того, что эта гиперплоскость содержит 5^, следует, что у* = ух*, а из того, что она опорна к epiвытекает, что z/*e^(x0). Предложение доказано.
218
ГЛ, 4. локальный выпуклый анализ
Предложение 3. Пусть Ао, ..., Ап — выпуклые множества, int Ар^ф при /=1, ..., п и А—Ло Л ... f| Ап, х0^А. Тогда следующие утверждения эквивалентны'.
а)	Ло П (int ЛОЛ ... Л (int Л„) = 0;.
б)	существуют функционалы x'^.N (х01 Лг), I =• = О, .... п, не равные одновременно нулю и такие, что
хоxi 4* ... -|-хл = 0.
Доказательство. Пусть выполнено а). Тогда существует такой набор индексов q...ir (l^r^n), что
(int Л^Л ••• Л (int Л<г)^0,
ЛоЛ(intЛ,,)Л ... Л(intЛ/г)=0.
Положим В = Л^ Л ••• Л Air. Тогда int В = (int Л/J П • • • ... Л (int Л/г) и, следовательно, Ло Л (int В) = 0. По первой теореме отделимости (теорема 1 из § 3.1) множества Ло и В можно разделить ненулевым линейным функционалом Хо е X*, т. е.
<xS, х)<<хг, у}	(О
для всех х е Ло, у е В. Поскольку х0 е Ло Л В, отсюда следует, что Xq&V (х01 Ло), — xo^N (х0 |В). В силу предложения 1 N (х0 |В) = N(x01 Л/() 4- ... -j- N (х01 Л<г). Поэтому существуют такие x’ft еУ(ха| Л^), k — 1, .... г, что —хо = х*(4- ... 4-*1г. Полагая xJ = O при i ф ik, приходим к б).
Наоборот, пусть выполнено б). По условию хотя бы один из функционалов х$.....х„, например х<, отличен
от нуля. Положим С — Ло П Л1Л • • • П Ai-[ Л Л/+1Л ... Л Лга. Если i = 0 и intC=0, то условие а), очевидно, выполнено. В ицом случае либо пДЛ/^ 0, либо intC=/=0. Имеем:
— Х/ = Хо4" ... 4“ x*i-l + x*i+l 4" ... Атхп^
е N (х01 Ло) + ... 4- N (х01 Лг_[) + N (х01Л/+1) 4- ...
... 4* N (х01 Лп) cz AZ (х01 С).
Отсюда следует, что функционал х/ разделяет Л; и С, и значит, внутренность одного из этих множеств не мо
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
219
жет пересекаться с другим, т. е. справедливо утвержде-ние а).
Доказанным результат можно обобщить следующим образом.
Предложение 4. Пусть До........Ап— непустые
выпуклые подмножества пространства X и int Д,- #= 0 при i=l, п. Тогда До Л (int Д1) П ... П (int Ап) — 0 в том и только том случае, когда существуют линейные функционалы хо, ..х*п, не равные одновременно нулю и такие, что
Хо + ... + х*п = 0,	(2)
5(4|До)+ ... +*(4|Д„)<0	(3)
(где $(• |Д) — опорная функция множества Д).
Доказательство. Простой подсчет показывает, что из (2) и (3) следует, что До Г) (int Д1) Л ... ... Л (int Дп) = 0. Наоборот, если выполнено последнее соотношение, мы, рассуждая, как при доказательстве предыдущего предложения, придем к неравенству (1), из которого следует, что
$ (хо | До) + s (— Хо | В)< 0.
Но
s(-x5|B) = S‘(- |B)(-x5)=[id(. |Д/Й)') (-хо). \£=1 /
Теорема 1 из § 3.4 влечет теперь существование таких функционалов х|р х}г из X*, что
X/j + ... + x*ir = — Xq,
s (-Л I В) = 2 б- (	(«У = 2 S № I лу.
Полагая снова xj = О при ik, k = 1, ..., г, получаем требуемое.
§ 4.4. Локально выпуклые функции
4.4.1. Определения и примеры. Если выпуклая функция непрерывна в некоторой точке, то ее производная по направлениям непрерывна в этой точке (предложение 4, § 4.1) и, следовательно, полностью определяется суб-Дифференциалом функции,в этой точке (предложение 1,
220
ГЛ., 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
§ 4.1). С другой стороны, как следует из определения, субдифференциалом могут, вообще говоря, обладать не только выпуклые функции. Естественно попытаться описать тот класс функций, локальное поведение которых полностью характеризуется их субдифференциалом.
Пусть, как обычно, X — отделимое локально выпуклое линейное топологическое пространство. Скажем, что функция f, определенная на X, локально выпукла в точке х, если ее производная по направлениям в этой точке существует и выпукла. Пусть У— другое отделимое локально выпуклое линейное топологическое пространство и G: X -> У. Скажем, что отображение G дифференцируемо по направлению х в точке х0, если существует предел
G'(х0; х) = lim ° (x° + Xx).~G(х°> .
JLJzft	А
Мы будем говорить, что отображение G равномерно дифференцируемо по направлению х в точке х0, если для всякой окрестности нуля V cz У найдется окрестность U cz X точки х и число Zo > 0 такие, что
9	_ G' (Xoi х) е V,	(1)
А
лишь только 2G У и 0 < Z < Ао- (Заметим, кстати, что отображение G: X —► У, имеющее в точке Хо первую вариацию 6G(x0; х), дифференцируемо в этой точке по всем направлениям и Gz(x0; х) = 6G(xo; х).)
Если отображение G равномерно дифференцируемо по каждому направлению в точке Хо, то, какова бы ни была фиксированная точка х, для всякой окрестности нуля V cz У найдется такая окрестность U cz X точки х, что
G' (хо; z) — G' (х0; х) 6= V
для всех z е U.
Таким образом, если дифференцируемо по всем производная отображения прерывное отображение X
отображение G равномерно направлениям в точке х0, то G по направлениям есть не-
J У. Z
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
221
функцию f, определенную на X, мы будем называть регулярно локально выпуклой в точке х, если она локально выпукла и равномерно дифференцируема по всем направлениям в этой точке. Таким образом, производная по направлениям в точке х функции, регулярно локально выпуклой в этой точке, — непрерывная выпуклая функция.
Мы покажем сейчас, что класс регулярно локально выпуклых функций достаточно широк. Он включает, в частности, непрерывные выпуклые функции и функции, дифференцируемые по Фреше.
Предложение 1. Выпуклая функция f регулярно локально выпукла в точке Хо тогда и только тогда, когда она непрерывна в этой точке.
Доказательство. Если функция f регулярно локально выпукла в точке х0, то, полагая в определении равномерной дифференцируемости х = О, получаем, что f непрерывна в точке х0. Пусть, наоборот, f непрерывна в точке Хо. Поскольку f — выпуклая функция, нам достаточно проверить, что она равномерно дифференцируема по любому направлению. Другими словами, нам нужно проверить, что каков бы ни был вектор х е X, для всякого 8 > 0 найдутся окрестность U cz X точки х и число Ао > 0 такие, что
| f(x0 + kz)-f(x0)  (Хо. | < 8
для всех ге1/и всех 0 < X < Хо. Так как функция f непрерывна в точке х0, то она непрерывна и в некоторой ее окрестности t/0 (теорема 1, § 3.2). Выберем число Хо так, чтобы, во-первых, Хо + ХоХ cz Uo и, во-вторых,
f (хр + Хох) — f (х0) _ г, ,	х)< —
Хр	’	2
Так как х0 + Хох е Uo, функция f непрерывна в точке Хо 4- Хох. Поэтому можно указать такую окрестность U точки X, что
f (х0 + Xoz) — f (х0 + Хрх) . е Хр	^2
Для всех г е U. Без ограничения общности можно считать, что множество U симметрично относительно точки
222
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
х, т. е. что вместе с каждой точкой z оно содержит и точку у = 2х — z, так что х = Vo (*/ + z), иначе можно вместо (7 взять (U — х)П(—t/ + x)+x- Если z е U, О <С К <. Хо, то
f (х0 + kz) — f (х0) f(x0 + Xoz) — f (х0)
X	Xp
(см. формулу (1) из § 4.1). Поэтому при z е U, 0 f (x0	&Z) f (x0) С/ / ,	\
'0
X
f (xp ~F" Xpz) f (xp) (Xq* x)
Xp
f(Xo + M)-f(Xo)  f, (Xo. x) + | < 8,
Хэ
Далее, если z^U9 то y = 2x— z<=U и 2f Vo + f (x0 + Xz) + f (xq + Xr/), откуда (так как Xf' (x0, x) f (x0 + Xx) — f (x0)) у / v f (x0 + Xz) — f (x0) f (x0 + Xx) — f (x0 + Xz) I Ho, X)	£
f (Xq + X#) — f (x0 + Xx) f (x0 + ky) — f (x0) e, , X
X
X
Таким образом, при zet/ и 0<Л<Л0
+ w	x)]<s.
Предложение доказано.
Предложение 2. Пусть Хи Y — банаховы пространства и отображение G: X дифференцируемо по Фреше в точке х. Тогда оно равномерно дифференцируемо по каждому направлению в этой точке. В частности, если f — функция, определенная на банаховом пространстве X и дифференцируемая по Фреше в точке х, то она регулярно локально выпукла в этой точке.
Доказательство следует сразу из определений.
4.4.2. Основные теоремы о локально выпуклых функциях. Мы покажем сейчас, что класс локально выпуклых функций устойчив относительно тех же локальных операций, что и класс выпуклых функций. Поэтому
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ функции
223
0 всех теоремах о субдифференциалах непрерывные выпуклые функции можно заменять на регулярно локально выпуклые.
Теорема 1. Пусть функции fi и f2 регулярно локально выпуклы в точке х. Тогда и их сумма fi + f2 регулярно локально выпукла в этой точке, +	-) — fi(x; -) + f'2(x; •)
и, следовательно, d(fl + f2)(x) = dfl(x) + df2(x).
Доказательство теоремы сразу следует из определений и из теоремы 1 § 4.2.
Теорема 2. Пусть отображение G: X-> У равномерно дифференцируемо по направлению Xi в точке xQ. Пусть, далее, g — функция на Y, равномерно дифференцируемая по направлению = G'(xo; Xi) в точке уо= G (хо). Положим
f(x) = g(G(x)).
Тогда функция f равномерно дифференцируема по направлению Xi в точке Хо и
ff(xQ: x1) = g'(f/o; #i) = g'(G(*o),	(х0; xj).
В частности, если в точке х0 отображение G дифференцируемо по Фреше, а функция g регулярно локально выпукла в точке у о — G(xo), то функция f регулярно локально выпукла в точке х0,
/' (х0; X]) = g' (у0; G' (х0) х) и
df (x0) = G'* (х0) dg(G(x0)).
Доказательство. Вторая часть теоремы, очевидно, является следствием первой и теоремы 2 из § 4.2. Пусть выполнены условия первой части теоремы. Тогда Для заданного е > 0 можно указать такие окрестность Ус У точки z/i и число 2ц > 0, что
I g(^+xg)-g fe), _ , I
224
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
если у е V, 0 < А < Ai. Далее, в силу определения равномерной дифференцируемости, существует такая окрестность U с X точки Xi и такое число Аг > 0, что
G (х0 + Ах) — G (х0) у
лишь только хе {7, 0 < А < А2. Тогда при хе U и
О < А < Ао = min {A,b А2}
I f(xp + Xx)-f(x0) _ ,	11
| X------------------g \Уо> Ун —
_ I 8 (G (*o + Ax)) - g (y0)	, , J _
—	-------------g 4/o> Уд\ —
t/ 4- A &	"I" ^x^	&	0 (u }
g I У о • A--------------т--------------I — g \Уо)
—------------------------л-----------------------------g' У1)
поскольку V1 (G (x0 + Xx) — G (x0)) s V в силу выбора Xo и U. Отсюда следуют и равномерная дифференцируемость функции f, и утверждение теоремы относительно равенства для производных по направлениям. Теорема доказана.
Теорема 3. Пусть S — компактное топологическое пространство и f(s,x)— функция на SX%, непрерывная по s для всех х из некоторой окрестности точки Хо, а при каждом s g S равномерно дифференцируемая по всем направлениям в точке х0. Предположим, более того, что для всяких zeXu е>0 можно указать такие окрестность U точки z и число Хо > 0, что неравенство
|	+	Хр) 	| < е	(2)
выполняется при всех seS, у U, 0 < А < Ао (где, как и раньше, fs (х) — функция на X, определенная равенством fs(x) = f(s, х). Положим
f (х) — max f (s, х),
seS
S0=(seS|f(s, x0) = f(x0)}.
Тогда функция f равномерно дифференцируема по каждому направлению в точке х0 и
f'(.x0’ z) = max£(x0; z).
s £= So
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
225
Если же, в дополнение к сформулированным усло-биям, функции fs(-) локально выпуклы в точке х0 (и, значит, регулярно локально выпуклы), то и f регулярно локально выпукла и
df(x0) — convl (J dfs(x0)\.
\s е= S«	/
Доказательство. По условию, если z е X фиксировано, то f's(xoi г) есть предел равномерно сходящейся последовательности непрерывных на S функций (s) = п [f (s, х0 + г) — f (s, х0)).
Поэтому функция	z) непрерывна при вся-
ком 2G X. Отсюда следует, в частности, что вторая часть теоремы вытекает из первой и из теоремы 3 § 4.2.
С другой стороны, коль скоро функция	z)
непрерывна, она достигает максимума на всяком непустом замкнутом подмножестве пространства S, в частности, на множестве 50, которое не пусто и замкнуто из-за непрерывности функции f(s,x) по s и компактности пространства S.
Для доказательства теоремы нам нужно убедиться в том, что всякому z е X и всякому 8 > 0 можно поставить в соответствие окрестность U cz X точки z и число А,о > 0 таким образом, чтобы при всех у е U и О < Л < Ло выполнялось неравенство
I	 тах (Хо. 2) | < 8.
Итак, пусть 2Е X и е > 0 заданы. Тогда найдется окрестность W cz S множества So такая, что
sup £(х0; z)<max£(x0; z) + y.
SG W 4	' SG=S0 4	' Z
(Это сразу следует из непрерывности функции s~>^(xo; 2)-) С ДРУг°й стороны, точку Хо можно окружить такой окрестностью UQ, чтобы максимум функции f(s, х) по s при всяком х из этой окрестности достигался на множестве W. В самом деле,
max f (s, х0) = f (xQ) — а,
8 А. Д. Иоффе, В. М. Тихомиров<
226
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
где а > 0. Полагая в (2) г = 0, убеждаемся в существовании такой окрестности Uq точки х0, для всех точек которой неравенство
| f (s, х) — f (s, х0) I < «/2
выполняется при всяком se S. Эта окрестность — искомая, так как при х е UQ и s ф W
f (s> х) < f (s, х0) + а/2 < f (х0) — а/2 < f (х),
т. е. максимум функции	х) достигается на W.
Выберем теперь в соответствии с (2) число А( > 0 и окрестность J71 точки z так, чтобы
|f(s, x0 + Ky)—f(s, х0) —А£(х0; z)|<A-|-
при у е Uх, 0 < А < Аь Пусть, наконец, А2 > 0 таково, что х0 + A2z е ий. Положим
Ao = min{Aq, А2), U — АГ1 [A2t/t П (Uo—х©)]-
Тогда U — непустая (поскольку zeU) окрестность точки z. Кроме того, если 0 < А < Ао и у ^U, то х0 + Ay е Uo. Поэтому для таких А и у
f (х0 + At/) = max f (s, x0 + ty) < ssW
< maxf(s, x0) + A sup f's(x0-, z) + A-|-<
< f (*0) + z К (xo’> 2) + Я-е, с одной стороны, и f (Xo + ^y) > ma* f (s, XO 4- Al/) > SESo
>max(f(s, x0) + Af'(x0; z) — A^) = <S Ez So '	'
= f (*o) + max f's (x0; z) — A-| — с другой. Следовательно,
I f (x0 + Ai/) — f (x0) — A max f's (x0; z) | < Ae,
лишь только у e U и ОСАСАо. Теорема доказана.
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
227
Замечание. Условия теоремы 3 заведомо выполняются, если, например, функция f'(s, х; y) — f's(x; у) непрерывна пб совокупности переменных при всех s g S, у X и х из некоторой окрестности точки х0. Действительно, пусть г е X и е > 0 заданы. Тогда функция ($, Л, У} f'(s>xo + Uh У) непрерывна в каждой точке вида (s, 0, г), и, используя компактность множества S, мы можем выбрать Zo > 0 и окрестность U точки z таким образом, чтобы неравенство
I f' (S, х0 + At/; z/) — f' (s, x0; z) | < e
выполнялось при всех s e S, 0	у e U. Без
ограничения общности можно считать, что все точки Хо + ty при 0 < Л < Ао, у е U принадлежат той окрестности точки Хо, в которой функция f'(s,x,y) непрерывна. Поэтому по формуле Ньютона — Лейбница
к
f (s, х0 + At/) = J f' (s, x0 + pt/, y) dy 4- f (s, x0) 0
и, следовательно,
f(s. xo + Ay)-f(s. x0)	Xo. 2)
*о4-1Ч/; y) — f' (s, XO; z)[dy.<e 0
для всех seS, 0 < К < Ло, y^U.
4.4.3.	Субдифференциалы и производные. В заключение параграфа мы кратко обсудим связь субдифференциалов и производных. Мы уже отмечали (см. пример 1 в § 4.2), что выпуклая (и, очевидно, регулярно локально выпуклая) функция дифференцируема по Гато в некоторой точке тогда и только тогда, когда ее субдифференциал в этой точке содержит ровно один элемент.
Таким образом, понятие субдифференциала обобщает понятие производной по Гато. В этой связи полезно отметить, что теоремы 1 и 2 являются обобщениями соответствующих теорем дифференциального исчисления. Именно, теорема 1 обобщает теорему о том,
8*
228
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
что производная суммы функций равна сумме производи ных, а теорема 2 обобщает теорему о суперпозиции дифференцируемых отображений. Теорема о среднем тоже имеет «субдифференциальный» аналог, однако он нам нигде в дальнейшем не понадобится. С другой стороны, теорема 3 не имеет эквивалента в дифференциальном исчислении.
§ 4.5. Субдифференциалы некоторых функций
4.	5.1. Субдифференциалы норм. Субдифференциал нормы в абстрактном банаховом пространстве был вычислен в § 0.3:
Г {-V* е X' | II х* ||< 1},	если х = 0,
Iх II I {х*еГ III Г ||=1, <х‘, х) — ||х||}, если х=/=0.
Таким образом, в конкретных случаях сложности могут встретиться лишь при вычислении субдифференциалов в ненулевых точках. Для этого нужно описать множества всех функционалов х*, удовлетворяющих равенствам
IIX-11=1, <х\ х> = ||х||.	(1)
Мы не будем рассматривать здесь пространств, в которых норма дифференцируема в отличных от нуля точках, таких, как Lp (1 < р < оо) или гильбертово пространство. В этих случаях для вычисления субдифференциала нормы достаточно ее продифференцировать (см. п. 4.4.3).
1.	Субдифференциал нормы в L" ([/о, 6]). Напомним, что (£" ([/о, Л]))* = ^([^о, 6]), так что, если г/(-)еА", х( •)<=/.? и у( •) е д|| х( •) Ih, то равенства (1) означают следующее:
IIZ/(-)lloo = sup|z/(Z)l=I,
Л
<£/(•), х(-))=J(z/(o\x(t))dt= Ji
ffl	fo
Эти равенства могут выполняться тогда и только тогда, когда (за исключением некоторого множества меры нуль) y(t) = |х(/) |-1х(/) при х(/)#=0, y(t) произвола
§ 4.5. СУБДИФФЕРЕНЦИАЛЫ ФУНКЦИЙ
229
но, но не превосходит по модулю единицы при х (•) = 0. Таким образом, если х( •) =/= 0, то
£||х(-)И1 =	• )L= 1,
у (t) = I X (0 Г* X (t) при X (t) =£ о) .
В частности, норма в L\ дифференцируема по Гато в тех и только тех точках х(-), у которых мера множества {/eKo, ^]|х(0 — 0) равна нулю.
2.	Субдифференциал нормы в С (Т). Напомним (см. § 0.1), что пространство, сопряженное с С (Т), образовано всеми регулярными борелевскими мерами на Г и норма в этом пространстве задается равенством
Ии11=р||*|.
т
Таким образом, если х(-)еС(Г) и х(-)т^0, то субдифференциал <?||х(-) ||с образован теми и только теми мерами, которые удовлетворяют соотношениям
(2)
т
j х(0^ = ||х(-)1|.	(3)
т
Положим
T.t = {f€=T|x(O = K(-)ll),
Т* ={t <= Т |х(/) = -||х( •) ||}.
Множества Тх и Тх, очевидно, замкнуты.
Говорят, что борелевская мера ц сосредоточена на замкнутом множестве Л, если | р, | (В) = 0 для всякого борелевского множества В, не пересекающегося с Л.
Мы покажем сейчас, что мера ц удовлетворяет усло-вияхМ (2) и (3) тогда и только тогда, когда
J <^ + + J фГ = 1, т	т
мера рЛ сосредоточена на Т%, а мера р.” — на Г7.
230
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Написанное выше соотношение равносильно равенству (2). Поэтому нужно проверить лишь последнее утверждение. Имеем
II х (•) II — J X (0 dll = J х (t) d[i+ — | x (t) dll- < T	T	T
<l|x(-)llpn+ + llx(-)ll/^-=||x(.)l|. T	T
Таким образом, при выполнении условий (2) и (3)
Цх( •) II / dp+ = / Х(О dix+,	(4)
т т
— 1|х(-)|| J dii-= J x(t)dy~. т г
Если существует борелевское множество В, не имеющее общих точек с Тх и такое, что |	1 (В) = рЛ (В) > 0, то
/ x(0dp+<t[ |х(0 |#+ < J ||х( • )||ф+ + т	т	т+
х
+	/ Цх(-)|Мц+=||х(.)||/ dy+.
г\т+	т
Но это противоречит равенству в (4). Так же проверяется и соотношение (5).
3.	Субдифференциал нормы в А«([/о, 6]). Пространство Z-Хфо, 6]) сопряжено с L"([/o, 6]). С другой стороны, пространство, сопряженное с £« ([/о, А])» не совпадает с L} ф0, ZJ), однако последнее изометрически вкладывается в (l£([/01 6]))*. Нас будет интересовать следующий вопрос. Пусть х (•) <= В каком случае субдифференциал д||х( •) ||то содержит элементы из L" и как описать эти элементы? Если у (•) е ^<5||х(-)||ооП-^1\ то в соответствии с (1)
/, 1
J 10(01^=1, f (y(i) |х(0)Л = ||х( • )IL = sup|x(f) |.
t,	о	*
§ 4.5. СУБДИФФЕРЕНЦИАЛЫ ФУНКЦИЙ
231
Легко понять, что эти соотношения справедливы тогда и только тогда, когда выполняются следующие условия•
а)	множество Тх = {t (= Т| |x(f) | = Цх(-) ||«,} имеет положительную меру;
б)	sign z/(/) = sign х(/) почти всюду на Тх и y(t) — = 0 почти всюду вне Тх;
в)	Jiy(t)i^=i. to
4.5.2.	Субдифференциал функции f (х( • )) = maxx(/)» t
Пусть Т — компактное хаусдорфово пространство. Рассмотрим в пространстве С (Т) функцию
/(*(•)) = maxx(Z). teT
Эта функция, как легко видеть, выпукла и однородна. Субдифференциал df(O) образован теми регулярными мерами на Г, которые удовлетворяют условию
maxx(Z) Г x(t)dp для всех х(-)еС(Г).	(6)
Отсюда следует, что
J dp = 1 т
и что мера ц. неотрицательна. Действительно, в силу (6)
I х (0 dp	— шах (— х (0) = min х (t).
J	tesT	t<=T
Поэтому, если х (/) ^ О для всех t е Т, то и J х (t) dp	0.
т
Очевидно, что и наоборот, при выполнении этих условий соотношение (6) справедливо. Итак, субдифферен-Циал функции f в нуле мы вычислили. Если теперь х (•):/= 0, то (см. пример 3 из § 4.2)
df (х (•)) = f ц <= df (0) I f х (/) dp = max x (/) 1.
I	U	I
232
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Дословное повторение рассуждений, использованных нами при вычислении субдифференциала нормы в пространстве С (Г), позволяет сделать следующий вывод: субдифференциал функции f в точке х(-), отличной от нуля, образован неотрицательными борелевскими мерами на Г, имеющими единичную норму и сосредоточенными на множестве
Tx = {t<=T\x(t) = f(x (•))}.
4.5.3.	Субдифференциал функции g (*(.))== = max (t, х (t)). Пусть, как и выше, Т — компактное t
хаусдорфово пространство и ф(/,х): TXRn~*R— функция на Г X R”, непрерывная по совокупности переменных и непрерывно дифференцируемая по х при всяком /еГ Рассмотрим на СП(Т) функцию
g(x( • )) = тахф(/, х(0). t&T
Мы покажем сейчас, что субдифференциал функции g в точке х(-) содержит те и только те линейные функционалы х*, которые допускают представление
(х*, г (.)>== J (фх (/, X (0) IZ (0) du, т
где р — регулярная неотрицательная борелевская мера на Г, имеющая единичную норму и сосредоточенная на множестве Тх — {t Т| ф(/, х(/)) = g (х (•))}.
Рассмотрим отображение G: Сп(Т)-> С(Г), определенное соотношением
[G (х( •))](/) = ф (t, х(0), и функцию f на С(Т’), заданную формулой /(«/(•)) = max i/(0.
1еТ
Отображение G дифференцируемо по Фреше и >'
[G'(X( • ))Z( • )](0 = (фх(Л X (0)1 2(0)
(см. пример 5 в § 0.2). С другой стороны, f — выпуклая функция на С(Т) и f(z(-))^ 11г(-)||, т. е. f непрерывна. Таким образом, для вычисления субдифференциала
§ 4.5. СУБДИФФЕРЕНЦИАЛЫ ФУНКЦИЙ
233
функции g мы можем применить теорему 2 из § 4.4. Имеем
5g(x(.)) = G'’(x(.))^(G(x(-))).
Субдифференциал функции f мы вычислили в предыдущем пункте. Он образован всеми регулярными неотрицательными мерами на Т, имеющими единичную норму и сосредоточенными на множестве Тх. Осталось вычислить оператор, сопряженный с G'. По определению для всяких г(.)еО(Т),це(С(Г))‘
(?(•), G'‘(x(-))g> = <G'(x(-))2(.), ц) =
= f (gx(t, X(O)I z(i))dn, т
откуда и следует требуемый результат.
Комментарии к гл. 3 и 4. Теория выпуклых множеств ведет свое начало с работ Минковского [1], [2]. Эта теория изложена в монографиях Боннезена и Фенхеля [1], Валентайна (1], Рокафеллара [14] (гл. 1 и 2), Эгглстона [1].
Теория сопряженных функций началась с работ Фенхеля [1], [2], хотя преобразование Лежандра было определено еще в XVIII веке. Окончательное оформление выпуклого анализа произошло в 60-е годы после работ Бронстеда [1], Моро [1]—[5], Рокафеллара [1] и др. Наиболее полное изложение конечномерной теории содержится в монографии Рокафеллара [14], где имеются богатая библиография и подробные сведения исторического характера. Обзоры бесконечномерных результатов содержатся в лекциях Моро [9], Асплунда [1] и статье Иоффе и Тихомирова [3].
За пределами перечисленных работ находится теорема об очистке из § 4.2. Такого рода теоремы возникли в теории приближений, причем первый намек на подобный результат содержимся в статье Чебышева [1]. Варианты теоремы об очистке, близкие по форме к нашей, содержатся в работах Гольштейна [2], [4] и Пшеничного [4]. О дальнейших обобщениях см. работу Иоффе и Левина И], где имеются дополнительные ссылки на литературу.
Глава 5
ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
И ПРИНЦИП МАКСИМУМА
ДЛЯ ЗАДАЧ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ
В этой главе мы продолжаем изучение необходимых условий экстремума, начатое в первой и второй главах. Задачи, рассмотренные в § 5.1, удовлетворяют более слабым условиям гладкости и выпуклости по сравнению с гладко-выпуклыми задачами из § 1.1. Теорема, доказанная в § 5.1, распространяет на эти задачи экстремальный принцип для гладко-выпуклых задач. С помощью этой теоремы в §§ 5.2, 5.3 доказывается принцип максимума Понтрягина для задач оптимального управления с фазовыми ограничениями. При первом чтении эту главу можно пропустить.
§ 5.1. Локально выпуклые задачи
5.1.1. Постановка задачи и формулировка основной теоремы. Пусть X и У — банаховы пространства, U — произвольное множество, fo, .... fn — функции на X\U и F: X \ U -»Y — отображение произведения X X U в У. В этом параграфе мы будем рассматривать задачи, по форме совпадающие с гладко-выпуклой задачей из § 1.1:
f0(x, u)->inf;	(1)
F(x, и) = 0,	(2)
ft (х, ц) < 0, i = 1, ..., п,	(3)
и е U.	(4)
В гл. 1 предполагалось, что участвующие в формулировке задачи функции и отображения удовлетворяют в окрестности экстремальной точки определенным условиям гладкости и выпуклости. Однако, сопоставляя доказательство экстремального принципа для гладковыпуклых задач с результатами, полученными в § 4.4, нетрудно заметить, что это доказательство останется без изменений и в случае, когда функции x-*fi(x,u) предполагаются не гладкими, а только регулярно локально выпуклыми. Более внимательный анализ дока-
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
235
зательства, данного в § 1.4, позволяет сделать вывод, что и условие выпуклости в формулировке экстремального принципа тоже может быть ослаблено. В этом параграфе доказывается теорема, обобщающая экстремальный принцип для гладко-выпуклых задач в указанных направлениях, а в §§ 5.2—5.3 извлекаются следствия из этой теоремы, относящиеся к задачам оптимального управления. Оказывается, что замена условия гладкости функций х —и) условием их регулярной локальной выпуклости позволяет распространить принцип максимума Понтрягина на задачи оптимального управления с ограничениями на фазовые координаты, а ослабление условия выпуклости позволяет дать доказательство принципа максимума, не использующее искусственных приемов типа замены времени.
Как обычно, нас будут интересовать необходимые условия локального минимума в задаче (1) — (4). Термин «локальный минимум» понимается здесь в том же смысле, что и в гл. 1: точка (х*, н*), удовлетворяющая условиям (2) — (4), называется точкой локального минимума в задаче (1) — (4), если для всякого х из некоторой окрестности точки х* и всякого u^U, удовлетворяющих тем же ограничениям (2) — (4), выполняется неравенство
/о К»	и).
Как и в гл. 1, рассмотрим функцию Лагранжа задачи (1) — (4)
S (х, и, Ао, ..., А„, у*) = 2 Wi (X, и) + {у', F (х, «)). 1=0
Если функции x-+fi(x, и) локально выпуклы, а отображение х —► F (х, и) дифференцируемо, то и функция Лагранжа локально выпукла по х. Через dxft и дх3? обозначаются, как обычно, субдифференциалы функций и Z как функций от х, а через f<(x, и\ z) и S?'(x, иДо, Хп, —их производные по направлению г в точке х. Символом в этом параграфе обозначается такой m-мерный симплекс в Rm:
Sm=|a = (ab ..., ат)еГ|а/>0,
236
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
Теорема 1. Пусть (х*, и*) — допустимый элемент в задаче (1) — (4). Предположим, что точка х* обладает такой окрестностью V, что
а)	при всяком u^U отображение x-+F(x,u) принадлежит классу Ci в точке х*;
а') при всяком и U функции х fi(x,u), i = 0, ... ..., п, непрерывны в окрестности V и регулярно локально выпуклы в точке х*;
б)	для всякого конечного набора точек и{, ит из U и всякого д > 0 существуют окрестность V' cz V (х* е У')» число е>0 п отображение v: V' X С/, обладающие следующими свойствами:
6j) v (х, 0) = и* для всех х е И',
б2	) для всяких х, х' из V' и а, а' из выполнены неравенства
||F(x, v (х, a)) — F(x', t)(x', а'))—Fx(x*, z/J(x—-х')— rn
- 2 («/ - «9 (F (*.> «9 - F K. «.))II <
x' 11+ S|a/ —«J |j, tn
fi (x, V (x, a)) — fi (x, ut) — 3 О/ (fi (x, Uf)—ft (x, u,)) <
— x.ll+SaJ, i = 0, 1.........n.
\	/=i	/
г Предположим, наконец, что
в) множество значений линейного оператора х->Fx(x*, и*)х имеет конечную коразмерность в Y.
Тогда, если (х#, и*) — точка локального минимума в задаче (1) — (4), то для задачи (1) — (4) выполнен принцип Лагранжа, т, е. найдутся не равные одновременно нулю множители Лагранжа %о 0, ..., Хп 0, у* е у* такие, что
0еа,2"(х., и,. I,....y) = F-^„ u,yj- +
i==0
• • •, У ) — min	A/q, .. •, у ),
ые U
^ifi(x„ «.) = 0,	1=1,
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
237
(Проверим, что эта теорема действительно обобщает теорему 3 из § 1.1. Условия в) в обеих теоремах одинаковы. При выполнении условия а) теоремы 3 из § 1.1 условия а) и а'), очевидно, выполняются. Наконец, условие б) теоремы 3 из § 1.1 влечет условие б): чтобы удостовериться в этом, достаточно выбрать v(x, а) так, чтобы выполнялись соотношения
т
F (х, v (х, а)) = F (х, w,) + 5 «/ (F (х, uj) — F (х, и,)),
т
fi (х, v (х, а)) < fi (х, и.) + 2 <*/ (fi (х, u^—fi (х, и,)),
и воспользоваться условием а).)
Доказательство теоремы строится по той же схеме, что и доказательство экстремального принципа для гладко-выпуклых задач (см. § 1.4). Положим, как и в § 1.4,
La= ImFx(x,, ut), В = Lo + convF(x„ U),
L = linB — линейная оболочка множества В.
Рассмотрим отдельно вырожденные и невырожденный случаи.
5.1.2. Вырожденные случаи. Вырожденные случаи исследуются дословно так же, как и в § 1.4. Если L =/= Y и у* — отличный от нуля элемент аннулятора подпространства L, то Ао = ... = Ап = 0, у* — искомые множители Лагранжа.
Если L = У, то из конечности codim Ц следует, что int В =7^0.
Этот факт был доказан в § 1.4. Если при этом О ф int В (очевидно, 0 е В) и у* — ненулевой элемент конуса N(Q\B), то снова Ао = ... = Ап = О, у* — искомые множители Лагранжа.
5.1.3. Невырожденный случай. Предположим теперь, что L = У и 0 е int В. Примем для определенности, что Л(х„н,) = 0 при 1 = 1, .... A, fi(x#, ы«)<0 при 1 = = k 4-1, ..., п, и рассмотрим множество С наборов (go, ...» уь, у) е Rft+1 X Для каждого из которых
238
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
найдутся такие х е X, me U, что
Fx(xt, m.)x + F(x., «)—F(x„ uj = y, f'i (*., x) + ft (*.> «) — ft «.) < P/» 1 = °> • • • > k-Так же, как и в § 1.4 показывается, что внутренность множества conv С не пуста и что для доказательства достаточно проверить, что 0 conv С.
Допустим, наоборот, что 0 е conv С. Покажем, что в этом случае точка (х*, и*) не может быть точкой локального минимума в задаче (1) — (4). Для доказательства последнего утверждения достаточно проверить, что если 0 е conv С, то найдутся векторы х е X, а = (аь ..., dm), dj > 0 и точки щ, ..., йт из U такие, что
рх (х„ и„) х + 5 ay (F (х., йу) — F (х„ и,)) = 0,	(5)
/=1
(/ т	\ \
тои й/)> = г> ® \/=1	//
т
f'i (х., и,} х) + s ay (fy (х,, йу) — fi (х„ и$ < 0,	(7)
I = 0, ..., k.
В самом деле, предположим, что соотношения (5) — (7) выполняются. Зафиксируем некоторое б > 0. Тогда по йь ..., йт и 6 можно выбрать окрестность V' точки х*, число е > 0 и отображение v. V' X (е2т) —» -* U, удовлетворяющие условию б). Обозначим для всякого a G R
а+ = max (а, 0), а~ = а — а+ = min (а, 0)
и для всякого а = (а[, affl)sR"
a+ = (ai+...ат)> а“ = а-а+=(ар..........а").
Тогда в окрестности точки (х*, 0) е X X Rm определено отображение в У, заданное формулой
т
ф (х, а) = F (х, V (х, а+)) + S af (F (х„ йу) — F (хф, и$.
Очевидно, Ф(х«, 0) = F(x*, и») — 0 (из-за условия 6i)) t
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
239
Обозначим, наконец, через Л линейный оператор из X X Rm в определенный следующим образом:
Л (х, а) = Fx (х,, и.) х + 2 «/ (F (х,, Uj) — F (х., и.)).
В силу условия б) для всяких (х, а) и (х', а') из области определения отображения Ф справедливо неравенство
|| ф (х, а) — Ф (х', а') — Л (х, а) + Л (х', а') || =
=|| F (х, v (х, а+)) — F (х', v (х', а/+)) — Fx (х„, и,) (х — х')—
т
VII+s।у (st
Положим
(Г	т
IIГ/1Г1 inf{||x|| + 21 а/1 Л(х, а) = у
I	/=1
Из определения оператора Л и из условия (6) следует, что 1тЛ= У. Кроме того, оператор Л, очевидно, непрерывен. Поэтому в силу леммы 3 из § 0.2 С (Л) < оо. Тогда, если б-С(Л)< V2, то согласно (8), отображение Ф и оператор Л удовлетворяют условиям обобщенной теоремы Люстерника из § 0.2.
Заметим теперь, что в силу (5) вектор (х, а), где а = (си, ..., ат), принадлежит ядру оператора Л. Поэтому при б-С(А)< V2 по обобщенной теореме Люстерника (см. § 0.2) существуют числа t > 0, К > 0 и отображения	—
f->(x(O, a{t))
отрезка [0, ?] в X X Rm такие, что
Ф (х, 4* tx + х it), ta-}- а (/)) = 0	(9)
240
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
при всех t е [0, /] и
IIX (01| + s | а, (0 |< АН Ф(х. + «, ta) ||. /=1
Из последнего неравенства в силу (5) и (8) следует, что
цх(он+ Si м) к
i=i
< КН ф(*. + tx, ta) — Ф (х„ 0) - /А (х, а) || <
<^Ц||х|| + 2 а/)- (Ю)
Поэтому, в частности, х(/)->0 и a(t)-+O при #->0.
Далее, в силу (7) существует такое число с > 0, что
при всех Z = 0, ..., k выполняются неравенства
т
fi (xt, ut\ х) + 2 й/ (fi (х., й{) — fi (x„ «,)) < — 4c.	(11)
Из-за регулярной локальной выпуклости функций x-*fi (х, и,) можно указать такое число а > 0, что при всех 0ст, ||х — х||^ст и 1 = 0, ..., п справедливы неравенства
fI (\ + tx> u.) < fi (х,> “,) +1 (f'i (\> х) + с).	(12)
Предположим теперь, что 6 > 0 было выбрано таким образом, чтобы, кроме неравенства б • С (А) < 1/2, оно удовлетворяло трем следующим условиям:
/<б(||х||+Sarmin(Й!......ат, ст), (13)
(б + /(б2)(||х|Ц-laz)<c,	(14)
Аб(||х|1+2 aj max | fi (х., us) — ft (х„ a,) | < с. (15) \ /=1 /
1 < / < /и
Такое 6 заведомо существует, так как по условию az > 0, I = 1, ..., т.
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
241
Из (10) и (13) сразу следует, что taj + at(t) >0 при вСех t е (0, /], так что
Ф (х, ta 4- а (/)) = F (х, v (х, ta-\- а (/)))>
откуда, полагая
х (0 = X, + tx + х (0, й (/) = v (X (0, ta + а (/)), получаем в силу (9)
Г(х(0, й(0) = 0.	(16)
С другой стороны, из второго неравенства в условии 6J следует, что при t е (0, /] и всех i = 0..........п
fi (х (/), й (0) < ft (х (0, «J +
+ 2 (ta} + а/ (0) (fi (х (0, mJ — fi (х (/), и,)) +
+ d(||/x + x(/)|| + 2(/az + a/(0)).	(17)
Согласно (10) и (13) /~’||х(0 ||«Са. Поэтому в силу (12) при 0 < t < min (F, ст)
fi (х (0, «J < fi (х., «J +1 (f'{ (x*, uj x) + c).	(18)
Сопоставляя далее соотношения (10), (13) и (15) и учитывая, что x(f)->-xt при t->0, получаем
2 (taj 4- at (0) (fz (х (t), Uj) — ft (x (0, «.)) =
= t 2 Й/ (fi (x., Uj) — fi (x„ mJ) 4-
4- 2 8/ (0 (fi (X., My) — fi (x„ ut)) 4-7=i
4-	2 (faj 4- ay (/)) [fi (x (0, йу) — f{ (x., mJ —
— fi(x(O, M.)4-fi(x„ m.)]<
“J-fi(x.’ м.))4-^4-о(0- (19)
242
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ ,
Наконец, согласно (10) ц (14)
б(|| /х + х (I) || + 2 (fa} + а,- (/))] <
</(6 + Я62)( ||х||+ 2 a,]<tc.	(20)
\ /=1 /
Из (17)—(20) следуют неравенства
fi(x(t),	«,) + ф'Дхш, «; х) +
+ 3 й/ (fi (х,, й/) -— fi (х„ и,)) + Зс] + о (/),
справедливые при всех i — Q, 1..п, t е [0, min(?, а)].
Если k, то согласно (11),
fi (х (t), й (/)) < fi (х„ и,) —tc + o(t) (21)
при достаточно малых t. Если же k 4- 1 i п, то
lim fi (x(f), й (/)) < fi (xt, и.) < 0. t->Q
(22)
Соотношения (16), (21) и (22) показывают, что при достаточно малых />0 пара (x(t), il(t)) допустима в задаче (1)—(4) и fa(x(t), й(О)</о(х*, и*). Поскольку х(0~>х, при /->0, это значит, что точка (х„ и„'} не может быть точкой локального экстремума, в Противоречии с условием теоремы.
Таким образом, осталось проверить, что при OeconvC найдутся хеХ, ..., йт<= U и ai > 0, ..., ат > 0, удовлетворяющие соотношениям (5)—(7). Если OeconvC, то по определению существуют х0еX, uOi^U, ...
е I/ и числа уП| > 0, ...,	>0 такие, что
7 U По	1UI	7	1 *	7
m0
(х., «,) х0 + 2 Vo; (Р (х„ «0/) — Р (х., «.)) = о, (23)
то
f'i (х.> хо) + 2 Vo/ (fi (*., «о/) — fi (х., «.)) < о, (24)
1 = 0, ..., k.
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
243
Далее, коль скоро 0 е int В, как и в § 1.4, можно выбрать векторы %] е X и у}............ из convf(x>, U)
таким образом, чтобы линейная оболочка множества Lo и {У!...уд совпадала с У и
Fx (х., mJ х, + yt + ... + yi = 0.
Тогда для каждого номера s— 1.........I найдутся числа
у51 > 0....ysms > 0, в сумме равные единице, и точки
Mib ...» usms из U такие, что
ms
VsjF(x., usj). i=i
Поэтому линейная оболочка множества
W(x„ Usi) |s = 0, .... I; /=1, ..., ms} совпадает c Y и l ms
Fx (xt, u,) Xt + 5 S ysjF (x„ usl) = 0.	(25)
Наконец, воспользовавшись соотношением (24) и непрерывностью функций x—>f'.(x , и ; х), можно выбрать такое число 8>0, что при всех z = 0, 1, ..., k
f'i (* > u.‘> xo + exi) + 2 Yo/ (fi (x„ u0J) — ft (x„ mJ) + i—i
l ms
+ e 2 5 ysl (ft (x., us)) — fi (x., mJ) < 0.
S=1 /=1
При этом в силу (23) и (25)
Fx (х„ ut) (x0 4- ex J 4- 3 Vo/ (F (x„ m0 J — F (x,, mJ) 4-l ms
+ eS Sv5/(^(^> usj)—F(xt, mJ) = O.
S=1 /=1
Таким образом, набор, образованный вектором x04-exi, точками моь ..., щт1 из J7 и числами у01, ... •••’ YOmo» -еуц, •••» еугот^, обладает требуемыми свойствами (5) — (7). Теорема полностью доказана.
244
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
§ 5.2. Задачи оптимального управления
с фазовыми ограничениями
Этот параграф содержит формулировку и обсуждение принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями. Доказательство приводится в следующем параграфе.
5.2.1. Формулировка принципа максимума. Рассмотрим сначала задачу оптимального управления с закрепленным временем:
Л
3 (%(•), «(•))= х, M)d/->inf; (1)
tl
х — ф (t, х, и),	(2)
и U,	(3)
Ло (х (/0)) = h{ (х (/,)) = 0,	(4)
gi(t, х(/))<0, t(=[t0, /J, i=l, k. (5)
На протяжении этого и следующего параграфов, за исключением специально оговариваемых случаев, предполагается, что функции
f: RXR"XRr->R, gi- RXR"->R
и отображения
Ф: RXR"XRr-*R", Az: Rrt->RS/ (Z=l, 2)
непрерывны и непрерывно дифференцируемы по х. (Как обычно, U cz Rr.) Подчеркнем, что, в отличие от § 2.4, дифференцируемости функций и отображений по t не требуется. В качестве допустимых управлений, как и в § 2.4, рассматриваются произвольные измеримые ограниченные вектор-функции, принимающие значения из множества U.
Как и в гл. 2, сформулируем принцип максимума Понтрягина в двух эквивалентных формах — гамильтоновой и лагранжевой. Введем снова функцию Понтрягина
Н (t, х, и, р, Ло) = (р |ф(/, х, u))—A,of(/, х, и)
и гамильтониан
х, р, Ло) = sup Я(/, х, w, р, Ло). не и
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
245
Теорема 1 (принцип максимума в гамильтоновой форме). Пусть (х*(-),	—оптимальный управляе-
мый процесс в задаче (1)#— (5). Тогда существуют не равные одновременно нулю число Хо 0, векторы /0f= Rs°, /1 е RS1, вектор-функция р(-): [/0, Л]-* Rn и неотрицательные регулярные меры цг-, i = 1, ..., k, на [/о, /1], сосредоточенные соответственно на множествах
Л={/е=[/0,	*Л)) = 0},
такие, что
а)	вектор-функция р(-) является решением интегрального уравнения
p(t) = — h{ (хж(Л))/1 +
h	k tx
+ J" ^*(т,х,(т),а,(т),р(т), Л0)йт—2 j gix (т, x, (t)) dfii (6) t	i=l t
р(/о) = Ло*(х# (/o))Zo,
(7)
б)	почти при всех t из [70, ^i] выполняется равенство
Н (t, х, (0, щ (t), р (t), Хо) = (t, х* (/), р (О, М- (8)
Уравнение (6), как и в задаче без фазовых ограничений, называется сопряженным. Нетрудно видеть, что в случае, когда все меры цг- — нулевые, т. е., в частности, при отсутствии ограничений на фазовые координаты, это уравнение сводится к дифференциальному уравнению, полученному в гл. 2. В задачах без фазовых ограничений функция р(-)—абсолютно непрерывная функция. При наличии фазовых ограничений из-за присутствия в уравнении (6) интегралов по мерам рг функция р(-) может иметь разрывы. Однако она всегда является функцией ограниченной вариации, непрерывной слева (из-за регулярности мер цг).
В формулировке теоремы не исключается случай, когда одна или обе концевые точки оптимальной траектории лежат на фазовых ограничениях. Поэтому меры Pi могут содержать ненулевые массы, сосредоточенные
246
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
в точках to и ti. В этом случае, как следует из соотношений (6) и (7),
lim р (/) = — h{* (х, (6)) /1 + 1] gix (th х, (/,)) ((/J); (9) t->ti	i=l
t<ti
.	b
lim p (/) = h’o (x. (/«)) /о + 2 Six (to, x, О И<({/0})>	(10)
t->h	i=[
t>t0
t. e. p(t) может иметь разрыв в точке /0. Если же £;(/1..*.(О) < 0 и Si (to, х, (t0)) < 0, то точки /0 и /t не принадлежат ни одному из множеств Ть |л<({/о}) = = рг ((/,)) — 0, p(f) непрерывна в точках /0> ti и выполнено условие трансверсальности р (to) — ho (х, (to)) to» p(tl) = -h'lt (X. (/,))/!.
Сформулированная теорема представляет собой еще одну реализацию принципа Лагранжа. Если записать функцию Лагранжа задачи (1) — (5) в виде
S’ = (/olAo(x(/o))) + (/1|Ai(x(/I))) +
Л
+ ] [(р (/) IX (/) - ф (/, X (/), и (/))) + W (/, X (/), и (/))] dt +
k ti
+ J] J Si (i, x (/)) dph t = l f0
то окажется, что соотношения (6), (7) эквивалентны условию стационарности функции Лагранжа как функции переменного х(-) в точке х*(*), а равенство (8) есть, очевидно, необходимое и достаточное условие того, чтобы функция Лагранжа достигала минимума по и(-) в точке Читатель сможет убедиться в этом, анализируя доказательство теоремы 1 в следующем параграфе. Поэтому теорема 1 допускает такую эквивалентную формулировку.
Теорема Г (принцип максимума в лагранжевой форме). Пусть (х*( •),**♦(•))— оптимальный управляемый процесс в задаче (1) — (5). Тогда существуют та" кие не равные одновременно нулю число Хо 0, векторы lQ Rso, li е Rs‘, вектор-функция ограниченной в а-
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
247
риации p(t) и неотрицательные регулярные меры цг-, f==: 1, .k, сосредоточенные на множествах 1\ соответственно, что
а)	при и(-)=«*(•) вектор-функция %*(•) является стационарной точкой функции Лагранжа как функции переменного х (•);
б)	при х (•) — х* (•) функция Лагранжа достигает абсолютного минимума по и(*) в точке и*(*).
5.2.2. Задачи с незакрепленным временем. Мы уже обращали внимание читателя на то обстоятельство, что теорема 1 (в отличие от результатов гл. 2) справедлива без предположения о дифференцируемости по времени функций и отображений, участвующих в формулировке задачи. В определенной степени это связано с тем, что предлагаемое в следующем параграфе доказательство использует иную технику. Существует, однако, и причина принципиального характера. Дело в том, что задачи с закрепленным временем естественно формулируются как задачи в некотором банаховом пространстве, именно, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по-видимому, нельзя сформулировать подобным образом без какого-либо ее преобразования, связанного, в частности, с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным.
В гл. 2 для этой цели использовалась замена времени. Однако там она несла значительно большую нагрузку и с этим были связаны многие технические сложности в доказательстве. Если же принцип максимума для задач с закрепленным временем доказан, то замену времени можно использовать только для сведения общей задачи к задаче с закрепленным временем. Тогда она оказывается совершенно естественным приемом, применение которого не связано с какими-либо трудностями.
Покажем, как с помощью теоремы 1 можно (используя замену времени) получить принцип максимума для общей задачи оптимального управления;
л
| f(t, х, и) dt-> inf;	(Г)
f о
i = <p(f, х, и),	(2')
и е= U,	(3')
Ло (to, х (t0)) = hi (ib x (t^) = 0,	(4')
gi(t, x(t))^0, t e [/о, Л],	(5')
В отличие от задачи (1) — (5) моменты времени to и здесь уже не предполагаются фиксированными, w все
248
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
функции и отображения считаются непрерывно дифференцируемыми по времени.
Пусть управляемый процесс (**(•), м*(-)) определен на отрезке [/0*, 6*] и оптимален в задаче (!') — (5'). Введем новую независимую переменную т, меняющуюся на отрезке [0, 1], и рассмотрим такую систему уравнений:
W=v’ = У’	(И)
Если (/(т), у(х))—некоторое решение этой системы, соответствующее управлению (у(т), о>(т)), и при этом ^(т)>0, то t(x)—строго возрастающая непрерывная функция. Обратная ей функция, обозначим ее т(0, тоже непрерывна и возрастает. В этом случае x(t) = = y(x(t))—решение уравнения (2Z), соответствующее управлению u(t) = w(x{t)), и при этом
* (1) 1
I f (t, х (/), и (0) dt = J v (т) f (t (т), у (т), w (т)) dx. (12) <(0)	о
Так как у(т) всюду больше нуля, эти утверждения тривиальны. Наоборот, если x(f)—определенное на отрезке [Mi] решение уравнения (2Z), соответствующее управлению a(f), то
t{x) = tQ-{-(ti—tQ)x, y(x) = x(t(x))
— решение системы (11), соответствующее управлениям и(т)=/1 — /0, w(x) = u(t(x)), и при этом справедливо равенство (12).
Поэтому
СО =А>»+ (*!» — /о*)т, у, (т) = X, (t, (т)), у. (т) s V. = Л. — *о», W, (т) = и, (/, (т)) — оптимальный управляемый процесс в задаче
J vf(t, у, w)dT->inf;	(1")
о
= у> <2")
v > 0, w е U,	(3")
А» (/ (0), у (0)) = hx (t (1), у (1)) = 0,	(4")
^(т))<0, те[0, 1], i=l............k. (5")
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
249
Это уже задача с закрепленным временем, и к ней применима теорема 1. Обозначим через Н функцию Понтрягина в задаче (1") —(5"):
Н (t, х, и, v, р, q, %0) =
= (р | П<р (t, х, и)) + qv —	(Z, х, и) —
= v(H(t, х, и, р, Ло) + <7), (13)
где Н — функция Понтрягина в задаче (Г) — (5'). Положим далее
Az={t<=[0, l]|g£(m Z/.(t)) = O}, Z=l, k.
Тогда, в соответствии с теоремой 1, существуют не равные одновременно нулю число Ао^О, векторы /0 е RS|1, Ц е RS|, вектор-функция р (х), функция ^(т) и неотрицательные регулярные меры Цг, I = 1, ..., k, сосредоточенные на множествах Дг соответственно и такие, что
p(T) = -Mx(Z.(l), У, (1))/i + 1
+ J НХ(Ш> УЛ), ™Л),	q®,
% k I
“SI уЛ))^,
i=\ %
<Л) = -МЛ)> MD)IA) +
+ / УЛ), ....
T
k 1
УЛ)) dHi, f=l T
P (0) = h*Ox (t, (0), y. (0)) Zo, q (0) = (h0l (Z. (0), y, (0)) | Zo), H(Z.(t), y,(x), wt(x), vt, p(x), q(x), Ao) =
= max H (Z, (r), yt (x), u, v, p (x), q (x), Ao).
и e U v> 0
250
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
Пусть (0 — функция, обратная (т), т. е.
Тогда, если обозначить
р (0 = р (т. (0)» q (0 = q (*. Ю) >
*Л0) = 0)=ч(Аг), = k, и определить меры рг формулами ti*	1
/ Ф (t) d[it= J ф (/. (т)) dfif, Уф (•) s С ([U fь])
<о»	0
(pz, очевидно, сосредоточены на Tt), то с учетом (13) написанные выше соотношения преобразуются к следующему виду:
^1*
Р (t) = - h*lx	xt (tu)) h+ J Hx (g, x, G), u. (0, P (g), Ao) d$-
t k *1*
-SJ SiAl, *.(В)Ш: (14) i=l f
q (!) = — (hlt (tit, Xt (tit)) | /i) + ^1*	k ^1*
+ / Ht(t, x,(t), .... AoX-JJ gtt&Xt^din, (15) t	i=l t
p (to*) — hox (to*, x* (Ah)) to,	(15)
q (to*) = (hot (to*, x* (t0*)) | Го),	(17)
о. (H (t, x, (t), u, (t), p (t), Ao) + q (t)) =
= max v (H (t, x, (/), u, p (t), Xo) + q (t)). (18) u^U о >0
Из (18) следует, что
Н (t, х, (t), и, (f), р (t), Ао) = max Н (t, xt (t), и, p(t), Ao), (19) ue U
и поскольку vt > 0 также следует, что W(t, Xt(t), p(t), h) = -q(t).
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
251
Сравнивая последнее соотношение с (15) и (17), полу-чаем
^(;, х*(0> p(t), м = (hit (Л*, Х*(Л*)) |/1) —
^1*
-J Htd, хл), ню, лот+ t
k}
+ £/	*.(|))^; (20)
i=l t
(to*, p (to*), Zo) =— (Ao/(Ah, X* (A)*)) I A))» (21)
Таким образом, если (**(•), ^*(*)) — оптимальный управляемый процесс в задаче (1) — (5), то найдутся не равные одновременно нулю число Zo 0, векторы Z;eRS/, /=1, 2, вектор-функция p(t) и неотрицательные регулярные меры цг-, сосредоточенные на множествах 1\ соответственно, такие, что выполняются соотношения (14), (15) и (19) — (21). При этом гамильтониан <Ж(/, х* (/),/?(/), Zo) есть функция ограниченной вариации, непрерывная слева.
Так выглядит принцип максимума Понтрягина для задач с фазовыми ограничениями и незакрепленным временем.
§ 5.3.	Доказательство принципа максимума для задач с фазовыми ограничениями
Напомним, что рассматривается задача оптималь
ного управления
^(х(.),и(.))= J/(f, X, и)Л->тГ;	(1)
^0
x = q(t, х, и),	(2)
u^U,	(3)
Ao(x(/o)) = Ai(x(/1)) = O,	(4)
gi(t, МОХ °, М. *=1.......................(5)
в которой начальный и конечный моменты времени предполагаются фиксированными.
252
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
5.3.1.	Редукция задачи. Обозначим через 'U совокупность допустимых управлений в задаче (1) — (5):
<2/= {«(•)(=	([f0, Л])|«(0е U почти всюду).
Рассмотрим далее отображение F из Сп([/0, /1])Х^ в Cn([/0> M)XRS’XRS':
F(x( •), Ы(.)) = (у(.), а0, ai)^Cn([t0, M)XRSOXRS'.
где t
y(t) = x (0 — х (t0) — J <p (т, x (т), u (t)) dx, to
aa = h0(x(t0)), at = h[(x
Определим, наконец, функции Gt на	/J) еле-
дующим образом:
Gt-(*(•)) = max gift, t 1*0» *l]
Используя эти обозначения, можно придать задаче (1) — (5) такой вид:
^(х(-), «(•))—> inf;
F(x(-), «(.)) = 0,
G,(x(-))<0, i=l........k,
Таким образом, по крайней мере по форме, задача (1)—• (5) является частным случаем общей задачи, рассмотренной в § 5.1. Для того чтобы применить теорему 1 из § 5.1, необходимо проверить, что функционал У, отображение F и функции Gt обладают перечисленными в ее формулировке свойствами.
Некоторые из этих свойств, именно, дифференцируемость функционала У и отображения F по х(-), непрерывность и регулярная локальная выпуклость функций G,, проверяются без труда.
В самом деле, дословно так же, как и в п. 2.5.2 (с той лишь разницей, что ссылку на следствие из теоремы 1 из § 0.4 следует заменить ссылкой на лемму 1 из того же параграфа), показывается, что отображение (%(•),«(•)) непрерывно дифференцируемо по
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
253
фреше и что его производная в точке (х,(-), «,(•)) имеет вид
Fx<-AxA-), «.(•))*( •) = (!/(•), а0, at), (6) где	t
У (f) = x (0 — х (/0) — J <рх (т, х, (т), и, (т)) х (т) dx, t<b
ао = ho (х, (to)) х (t0), ai = h( (x, (t\)) x (tt).
Точно так же функционал £7 как функция от х(-) непрерывно дифференцируем по Фреше и его производная в точке (хД-), «,(•)) вычисляется по формуле
<^(.)(х.(-), «.(•)), х(-)) =
= $ (fx(t, xjt), u,(t))\x(t))dt.	(7)
*0
Наконец, функции Gi регулярно локально выпуклы в Сп([^о,Л]) в силу теоремы 3 из § 4.4, а в п. 4.5.3 было показано, что субдифференциал функции Gi в точке х*(-) содержит те и только те линейные непрерывные функционалы %* на Cn([/0, 6]), которые можно представить в виде
<х\ х (• )> = J (gix (t, х, (t)) |х (t)) dfii,	(8)
h
где jlz — неотрицательная регулярная мера на [f0, Л], сосредоточенная на множестве
Ti = [t е Ко. 1 gi (i, X. (f)) = Gi (x. (•))}
и имеющая полное изменение, равное единице.
Таким образом, осталось проверить, что условие б) теоремы 1 из § 5.1 также справедливо для задачи (1) — (5). Это будет сделано в п. 5.3.3 при помощи подготовительных лемм, которые доказываются в следующем пункте.
5.3.2. Подготовительные леммы. Условие б) теоремы 1 из § 5.1 предполагает существование специального отображения v. Построение такого отображения
254
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
для задач оптимального управления основано на одной конструкции, относящейся к теории функций действительного переменного. Мы рассмотрим сначала простейший вариант.
Пусть у(-)— измеримое ограниченное отображение отрезка [f0, fi] в конечномерное пространство, А1 —измеримое подмножество этого отрезка и хм(-)— характеристическая функция множества М, т. е.
1, если
О, если t ф М.
Хм (0 = I
Наконец, через Y(t) и YM(t) обозначим первообразные вектор-функций y(t) и х,м(()у(0, равные нулю в точке t0: t	t
Y (0= J y(i)dx,	J хм(т)г/(т)</т.
Лемма 1. Для любой ограниченной измеримой век-тор-функции y(t), определенной на [f0, fi], и любого б>0 можно построить однопараметрическое семейство {М(а)} = {А1(а; у( •), б)} (O^a^l) измеримых под-множеств отрезка [fo, fi] такое, что
mes (a) = a (/!—tQ), М (az) cz М (а), если а'^а, (9) шах | Ум(а)(0 — УмшУ)— (a — a')Y(I) |<б| а —а'|. (10)
Замысел описываемого ниже построения проще всего понять в том случае, когда вектор-функция y(t) является константой: y(f)sC. Тогда, если разбить отрезок [fo, fi] на равные отрезки Дг-, i — 1, ..., г, длины, меньшей б/С, то в качестве М(а) можно взять объединение отрезков ДДа), f = 1, ..., г, у которых левый конец совпадает с левым концом отрезка Дг-, а длина составляет a-ю долю длины этих отрезков.
Доказательство. Всякая ограниченная измеримая вектор-функция есть равномерный предел «простых» вектор-функций, каждая из которых принимает лишь конечное множество значений. Очевидно, лемму
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
2Б5
достаточно доказать лишь для таких простых вектор-функций. В самом деле, для заданной ограниченной измеримой вектор-функции y(t) можно подобрать такую простую вектор-функцию //(/), что
sup I у (О — у (?) К 7~~Т‘	(11)
fe[fe, h]	‘1	г<>
Если для простых вектор-функций лемма верна, то можно построить семейство Л1(а) = Af(a; £(•), 6) измеримых подмножеств отрезка [t0, Л]. Тогда, если, скажем, а а', то
| Ym (a) (0 — Тм (а) (О — Ym (а') (0 + fМ (а') (О I =
= I Yм. (а)\М (а') (0 — Ym (а)\М (а') (0 |	61 а — а' |
в силу (9) и (11) и
| (а - a') (Y (0 — Y (/)) |<6| а - а' |
в силу (11). Сравнивая эти неравенства с (10), получаем
I YM (a) (0 - YM М (0 — (a — o') К (0 К 361 a — a' |,
т. е. M(a) = M(a; у(-), 36).
Итак, пусть у(-)— простая вектор-функция. Для описания конструкции множеств Л4(а) нам удобно ввести одно обозначение. Пусть А — измеримое подмножество отрезка [/о, Л], имеющее положительную меру. Тогда
t
J%A(T)dr h
непрерывная неубывающая функция, изменяющаяся от нуля до гпезЛ. Пусть /(а) — ближайшая к to точка отрезка [/о, Л], в которой XA (t) = amesA Тогда через (Л)а обозначим пересечение множества А с отрезком [М(а)1
Пусть ’’	/
У (0 = S (0
256
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
и шах|у7| = С. Разобьем отрезок (70, 6] на равные отрезки Ль Дг длины, не превосходящей 6/(2С). Тогда множества
M(a) = U(MMx
i,i
— искомые. В самом деле,
mes М (а) = 5 mes (Ay |"| AJa = а 5 mes (Ay f| A J =
= а(Л —10).
Если а^а', то (АуПАг)а/С (АуП &i)a и, следовательно, М (а') с: М (а). Наконец,
J y(t)dt = a J г/(О<й = ш/утез(А/ПА;), (л/пл/)а	л/п лг
поскольку на множествах А} вектор-функция y(t) постоянна и равна г/у. Отсюда следует, что на концах отрезков Аг значения вектор-функций (а — a')Y (t) и Ум (а) (О — Ум (а') (0 совпадают. Если же А< = [т/, т<+1], т, < t < Tf+1, то
I Км (a) (О - Км (a') (0 - (a - а') к (О К
J (Хм (а) (т) — Хм (<и СО) У (т) dr xi
^2С| а — а' 11/ — ti
Лемма доказана.
Теперь можно доказать общий результат.
Лемма 2. Пусть yt( •): [/0, Zj] —>i — 1, ..., zn, — ограниченные измеримые вектор-функции. Тогда для всякого S > 0 существуют однопараметрические семейства All (а), ...» А4т(а) измеримых подмножеств отрезка
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА 257
ZJ, где параметр а пробегает значения от 0 доЛ/т, такие, что
mes Mi (а) = а (t j — tQ) для всяких /=1, tn*
1/т;
М( (а) П Mk (а') = 0, Mt (а') с М,- (а), если O^a'^a^l/zn, i =Y= k;
max I Кш, (а)(0 — ^ш.<ао(О —(a—a') Yt (/) |<6[ а — а' |
«еКо.М1 ‘	1
для всех i=l, m, О^а, a'^l/m.
Доказательство. Пусть п = п1-]- ... + пт. Т огда
Z->z(O = (z/i (О.ym(t))
есть измеримое ограниченное отображение отрезка [Zo, ZJ в Rn. Выберем семейство {M(a)} (O^a^l) измеримых подмножеств отрезка [Zo, Л], удовлетворяющее соотношениям леммы 1 вместе с г(-) и 6. Пусть, наконец, О а 1/т. Положим
МДа) = М((/~ 1)/т + а)\М((/~1)/т), Z=l, ..., т
Семейства {МДа)}, /=1, т,— искомые. В самом деле, множества МДа) и M/Да') при любых i =/= k, O^a, a' 1/m, очевидно, не пересекаются, тезЛ1Да) = = аД1 —Zo) и (при 0 a'sC а 1/т) Л4Да')<= МД а).
Наконец, последнее соотношение в формулировке леммы также следует из леммы 1 и того очевидного факта, что для всякого вектора z = (y{, ..., ут) е Rn, f=l, m, справедливы неравенства |уг|^
|г|, i = 1, ..., т. Лемма доказана.
5.3.3. Конструкция отображения v. Вернемся к задаче (1) — (5). Нужно проверить, что эта задача обладает свойствами, указанными в условии б) теоремы 1 из § 5.1. Для этого достаточно доказать следующее. Пусть иД-), ..., ит(-) — некоторый набор допустимых управлений (т. е. иД-)е<2/) и 6 > 0. Тогда найдутся окрестность VczCn([Z0, ZJ) точки %*(•), число е>0 и отображение а —> v (а) (•) множества eL"1 в °1£ (напомним, что
2m = |a = (aI, am)G=R'n|a/>0, SayCl},
9 А. Д. Иоффе, В. М. Тихомиров
258
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
так что
eSm = 1 а = (аь
такие, что
и (0) (0 = и* (t) почти для всех t
И для всех х(-),	a, a' eeS"1 справедливы
неравенства
t
max
[to, М
ф(т, х(т), v(a)(r))—<р(т, х'(х), v(a')(x)) —
— Фх (b X, (т), U, (?)) (х (?) — х' (т)) —
т
— 2 (а/ — «/) (Ф (т- х, (т)> «/ (*)) — Ф (т> х, (т), и, (т))) /=1
(т	\
IIX (•) — х' (•) ||с +	| а/ — а/11,
/=1	/
dx
(12)
У (*(•), 0(а)(.))-5<(х(.), «.(•))-
- 1 а/ V (х (•), «/ (•)) - 3 (х (•), и, (•))) < 6 1 а/. (13)
(В этом случае отображение v даже не зависит от %(•).) Формула (12) получается из соответствующего неравенства в условии б) теоремы 1 из § 5.1 после подстановки в него явных выражений для отображения Ft и его производной, данных в п. 5.3.1.
Итак, пусть набор щ(-),	ит(-) допустимых уп-
равлений и число б>0 заданы. Рассмотрим (n^-l)-мерные вектор-функции
г//(О = (ф(<. Х.(0, «/(0) —
— ф(Л xjt}, f(t, x,(t),	—	x,(0. «.(0)).
Они измеримы и ограничены, поскольку измеримы и ограничены управления w*(/), tZi(Z), ..., а отображения ф и f непрерывны. Поэтому с помощью леммы 2 можно построить однопараметрические семейства
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА ’-У" 259
ШДа)} (Oc^a^l/m), / = 1, т, измеримых подмножеств отрезка [/0, Л] такие, что
М} (a) fl Mk (а') = 0 при j =£ k, Mj (а') с Мj (а) при а'^а, mes Mj (а) = a (it — /0) и
IYiMj (а) (0 — YjMj (а') (0 — (а — а') К/ (f) | < | а — а' |
(14) при всех /е[/0, /J, О^а, а'<Л/т.
Положим теперь
Qm — {а = (аь aj е= Rm |0<ау< Мт] и для всякого а е Qm определим вектор-функцию
v (a) (f) = и, (0 ч- 2 Хм. (а(/) (tij (t) — ut (i)).
Отображение	— искомое. Прежде чем дока-
зывать это утверждение, обратим внимание на то, как устроены вектор-функции v(a)(t). Поскольку множества Mj(aj), j= 1, ..., m, попарно не пересекаются, v(a)(t) при всяком t принимает одно из значений и*(1), ^1(0, •	ит(/). При этом, если отрезок А достаточно
велик, то доля той его части, на которой v (а) (/) = мД/), близка к aj. Таким образом, вектор-функция v (a)(1) получается как бы в результате «перемешивания» управлений u*(t), ux(t), ..., um(t) в пропорциях, определяемых вектором a = (ai, am). Отметим еще, что поскольку множества Л4Да?), j — 1, m, не пересекаются, имеет место очевидная формула g(t> v (a) (t)) = g (t, «„(/)) +
т
+ 2 XAf/ (ay) (0(Я	«/ (0) — g И. (0)).	(15)
справедливая для всякой вектор-функции g, заданной на [Zo, М X Rr-
Из определения следует, что при всяком ae Q™ вектор-функции	измеримы, ограничены и
9*
260	. Гл- 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
принимают значения из множества U. Кроме того, очевидно, о(0) (/) = «*(/).
Далее, поскольку все управления «»(•), «](•), ... ..., ит(-) ограничены, их значения содержатся в компактном множестве U\ a Rr. Поэтому, используя непрерывность <р и f, можно выбрать такое о >0, что неравенства
|<р(/, х, и) — q>(t, x,(t), и) |<,	(16)
|f(Z, х,	x,(fl, u)|< g7 -б ,	(17)
| Ф (t, X, и)—ср (t, х', и)—срх (t, X, (/), и) (х—х')	Г (18)
2 (ti —
выполняются для всех /, х, х', и, удовлетворяющих соотношениям |х — хД/) |< о, | х'— х# (/) | < a, uet/j. Положим
У={х(.)еСл([/о, M) HIM • )-*,(•) Ис < о)
и выберем число е>0 таким образом, чтобы 8^1/т и е(^—/0) max | фх (t, xt (t), и) |< 4.	(19)
ue и,
Здесь | фх | есть норма фх как линейного оператора из R" в R".
Пусть теперь х (•), х' (•) s V, а, а' е (тогда a, a'^Qm, поскольку е^1/т). Имеем
Ф(т, х(т), v (а) (т)) — ф (г, х'(т), »(а')(т)) —
— Фх (т, х. (т), и. (т)) (х(т) — х'(т)) —
т
—	(а/ — а?) (Ф <т>х. (т)> и/ (т)) — ф (т, X, (т), ы. (т)))
/=1
t
< J [ф (т, х (т), V (а) (т)) — ф (т, х' (т), v (а) (т)) —
— Фх (х> х. (т), v (а) (т)) (х (т) — х' (т))] dx 4-
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
261
-I- J [(фх(т> *.(т)> С*(л)(т)> —
^0
— Фх (т, X, (т), и, (т))) (х (т) — х' (т))] dr | +
t
4- f [ф (т> х' (х)> V (а) (т)) — Ф (т> х' (т)» v (<*') (т)) — t*
— ф (т, х, (т), V (а) (т)) + <р (т, х. (т), V (а') (т))] dr | +
f г
+ | ф (т, х, (т), v (а) (т)) — ф (т, х, (т), V (а') (т)) —
*0
т
“ 2?а/ “ (т> х* Ы/ W ~~
/=1
— Ф (т, X, (т), ы, (т)))] dr|. (20)
Оценим каждое из четырех слагаемых в правой части
(20). Согласно (18) первое слагаемое не превосходит
у||х(-)-х'(-)Нс.	(2D
Второе слагаемое, согласно (15), равно t / т	\
h '/^1	'
— Фх (х, X, (т), W, (т))) (х (т) — х' (т)) dr | и в силу (19) оценивается следующим образом: 2||х(.)-х'(.)||сХ
г / m	\
Х( max |фх(^, хД/)> zz)|) | I ( Л/)и/ = '?^11	Мм Н/) /
(т \
У ) = /-1	7
= 4l|x(-)-x'-(.)||c. (22)
262
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
Третье слагаемое, снова используя формулу (15), можно переписать в виде t т
J X («/)—Хм/(а;)(т)) х'и>(т)) “ *0 /=1
— ф(г, х, (т), u,
В силу (18) оно не превосходит т *1	т
2 (/i - /0) X J I Хл1; (°.) — Х'м; (<•) I dt = 7 X I а1 ~ a'i I • /=1 /0 1 J J " 1 /=1
(23)
Наконец, четвертое слагаемое, опять же с помощью формулы (15), переписывается так: т t
X / [(*М/ (a,.) W (aj) W) (ф (ь х. (т)> «/ <*)) -
— Ф (*> X, (т), и, (т))) — (а/ — а/) (ф (т, х, (т), «/ (т)) —
— Ф (т> х, (т), м. (x)))j dx |. Разность ф(т, хДт), иДт))—ф(т, х*(х), и*(х)) содержит первые п компонент вектор-функции уj (т). Поэтому написанное выше выражение не превосходит (см. (14)) т г
5 J [(Хм/(“/)(т) ”Хл,/(“/)(т)) у> У, W] /—1 ^0
т
< 21 у.«, е,)» - у«, («;.)» - (“) - “Э у!»| <
т
»;i- <24>
/=1
Из (21)—(24) следует, что левая часть в (20) при всех t не превосходит б (|| х (•) — х'( •) ||с -f- S | а;. — а< |Соотношение (12) доказано.
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА gj 263
Наконец, в силу (14), (15), (17)
J f (t, х (/), v (а) (0) — f(t,x (t), и, (0) —
<0	т
—	x(t), Uj (0) — f(t,x (0, и, (0) dt =
/=1
== S J [Z"/ (ay) ® (f x ui —f^X U*
т


т
+ Е / X» (а.) (О(I/ Ц, X (0) - f (/, X, (0, Ut (0) I + у—j	*
+ I f {t, X (t), U, (0) - f (t, X, (t), U. (t)) I) dt +
+ a, J (| f (t, x (/), ut (0) - f (t, xt (t), и, (0) I +
*0 m
+1 f (t, x(/), a,(0) — f (t, x, (0, (0) I) dt <62а/, J /=i т. e. неравенство (13) тоже верно.
Таким образом, задача (1)—(5) обладает всеми свойствами, перечисленными в формулировке теоремы 1 из § 5.1.
5.3.4. Завершение доказательства принципа максимума. Функция Лагранжа задачи (1) — (5) имеет вид
x(t), u(t))dt +
h
и /	*	X
+ f I x (0 —x (/о) — f Ф (т, x (т), и (т)) dx |dv I 4-
и
+ (/о 1*0 (X О + (/! |Л1 (X Ш + 2 ^Gi(x( . )), i=l
26(4	гл. ix ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
где v — регулярная векторная мера на [/0,	(т. е. v =
= (vb vn), где Vi — регулярные меры на [^0, М), Zo <=	/, е Rs‘. В силу теоремы 1 из § 5.1 найдутся
не равные одновременно нулю множители Лагранжа Ло^О, ...,	/0 е Rs', li s Rs‘ и векторная мера v
такие, что
О	(25)
(х.(•),«.(•), ...) = min 2Дх,(•),«(•), ...),	(26)
«(•)
Ш(х,(-)) = 0, i=\,	(27)
Рассмотрим подробнее каждую из написанных формул. Обозначим для краткости L (^, х* (О,	^о =
= Aq(^(/0)) и т- Д- Используя выражение (8) для субдифференциалов функций /=1, k, получаем из (25), (6), (7), что для всех x(-)eCn([f0, /J) должно выполняться равенство
^0 J (fx IX (/)) di + j ( x (0 — x (t0) — J <pxx (x) dx | dv I 4-to '	t0	'
k ti
+ (/о Ih'ox (f0)) + (/1 |й[х (ti)) + 2 / (gix |x(/)) djli = 0, i=l 4
где i— 1, ...,&, —регулярные неотрицательные меры с полным изменением, равным единице, сосредоточенные на множествах Tt = [t е [f0, /J | gt (/, х, (/)) = Gt (х* (•))} соответственно. Изменяя порядок интегрирования во втором слагаемом и полагая	приведем напи-
санное выше соотношение к виду
tx / /	/Л \ \	k	\
J ( (Ух — <Рх I I dt + dv + S gixdVi I* (0 I +
to W	^t II	t = l	/
/	tx	\
+ (ЛД- J dv\x(t0) +(Af/1|x(/l))=O. t
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
265
Это равенство должно выполняться для всех х(-)е
Сп\[Zo, ). Применяя теорему Рисса о единственности представления линейного функционала в пространстве
Сп фо» ^11) и обозначая p(t) = J dv, получаем t
л
Тем самым доказаны соотношения (6), (7) из § 5.2.
Далее, соотношение (26) эквивалентно следующему / \ -
J	МО) dt~ I J ф(*, и* (т))г/т | tZv I ==
= min I %of(/, x* (t), и (t)) dt —
ro
/ t	Y
— I J <p (т, х.(т), м (т))с?т |dv I .
Но
t, / t
Щ Ф (г, x, (т), u (t)) dx \dv
tt (
= / (<P0> x,(t), u(t))
tl
= / (p(0 I<P (C x*(0> u(t)))dt.
to
Из этих двух равенств следует соотношение (8) из § 5.2.
Заметим, наконец, что если Gi(x»(-))<0, то в силу (27) Aj = 0. Поэтому среди мер ц, отличными от нуля
266
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
могут быть лишь те, которые соответствуют номерам I с Gi(x*( •)) = 0. В этом случае
= =	|^. (/, хД/)) = 0}.
Поэтому без ограничения общности можно считать, что все меры цг- сосредоточены на множествах Tit Принцип максимума полностью доказан.
Комментарий к гл. 5. Различные аксиоматические схемы для экстремальных задач, близких в том или ином отношении к выпуклым, разрабатывались Гамкрелидзе [5], [7], [8], Гамкрелидзе и Хара-тишвили [1]—[3], Нойштадтом [2], Халкиным [4] и др. Теорема 1 из § 5.1 написана под влиянием результатов Халкина. Думается, что эта теорема может оказаться полезной при доказательстве принципа максимума и для более широкого круга задач.
Первый вариант принципа максимума для задач с фазовыми ограничениями был доказан Гамкрелидзе [3]. Теорема 1 § 5.2 была доказана Дубовицким и Милютиным с помощью замены времени. Интересные проблемы возникают в задачах со смешанными ограничениями вида g(x(t), u(t)) =0 или g(x(t), u(t))	0. Первые ре-
зультаты для таких задач получены Дубовицким и Милютиным [3], [5].
Глава 6
СПЕЦИАЛЬНЫЕ ЗАДАЧИ
§ 6.1.	Линейное программирование
Здесь доказываются теорема существования и теорема двойственности для задач линейного программирования.
6.1.1.	Существование решений. Рассмотрим задачу линейного программирования:
(f|x)->inf; Ax^b, х^О.	(1)
Здесь Л: Rn->RW— линейный оператор, ceRn, fteR^. Символ х у означает, что координаты вектора у не превосходят соответствующих координат вектора х. Мы будем рассматривать пространства Rn и Rw только со стандартными базисами. Это позволяет нам отождествить оператор А с его матрицей в этих базисах. Обозначим через ai, ..., ап векторы, стоящие в столбцах матрицы А. Тогда
Ах — а{х1 + ... + апхп,
где х1, ..., хп — координаты вектора х.
Следующая лемма играет центральную роль в дальнейшем изложении.
Лемма 1. Всякий выпуклый конус в конечномерном пространстве, порожденный конечным множеством точек, замкнут.
Доказательство. Пусть конус К cz RA порожден точками Zi, ..., zh. Это означает, что
{k ^sRjV|z=SMb ^г>0, z=l, i=l	)
Доказательство его замкнутости проведем индукцией по числу k. При k= 1 лемма очевидна, ибо тогда К—полупрямая. Допустим, что лемма верна для k — s—1, и предположим, что k = s. Рассмотрим два случая.
268
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
1)	Конус К содержит векторы —zb	—zs. Тогда
К — подпространство размерности, не большей s, и следовательно, К замкнуто.
2)	Хотя бы один из векторов —zb i= 1, ..., s, например, —zs, не принадлежит конусу К. Обозначим через К\ конус, порожденный векторами zb ..., zs-\, По индуктивному предположению конус замкнут. С другой стороны, всякий вектор 2Е К можно представить в виде
z = zf + KzS9
где /Сь X > 0.
Пусть	£п, ... — последовательность элемен-
тов конуса К, сходящаяся к вектору z. Имеем
£ = zf 4“ Az.
п 1 ns
Имеются две возможности: а) — неограниченная и б) — ограниченная последовательность. В случае а) существует подпоследовательность	—>оо и тогда
поскольку Отсюда следует, что последовательность векторов knlkz'nk сходится к вектору z' = —zs. Но z'e/Ci, так как Kt—замкнутый конус, следовательно, —zs е вопреки предположению. Остается допустить, что имеет место случай б). Тогда можно выбрать последовательность чисел Xnfe, сходящуюся к некоторому числу Хо 0. В этом случае гп.г~^пк — ^nkzs~>z~Kzs==z'- В СИЛУ замкнутости конуса Kt точка z' <= Kt и, значит, z = z' + kozs е К. Лемма доказана.
Теорема 1 (теорема существования). Если множество допустимых элементов задачи (1) не пусто и ее значение конечно, то задача имеет решение.
Доказательство. Рассмотрим в пространстве Rm+1 множество К, образованное такими векторами (а, г), aeR, ze R”», для каждого из которых найдется хотя бы один вектор xeR", х 0, удовлетворяющий неравенствам
(с|х)=Са, Ax^z.
Множество К есть конус, ибо если (а0, z0)^K и (с|х0)^а0, Ах0 zt), то для любого t > 0, (c,txo)^
§ 6.1. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
269
/ао, Л/х0^/г0, т. е. (/а0, /z0) К. Покажем, что конус К порожден конечным множеством векторов. В самом деле, если aiy ..., ап суть (m + 1)-мерные векторы вида (сг, #г), где Ci — /-я компонента вектора с, сц— вектор, координаты которого суть элементы f-го столбца матрицы Л, а е0= (1,0, ..., 0), ..., ет= (0, ..., 0, 1) — стандартный базис в Rw+I, то, как легко видеть, конус, порожденный векторами аь ..., а„у еОу —е1у ..., —ет, совпадает с К.
По лемме 1 конус К замкнут. Если х— допустимый элемент задачи (1) и а = (с|х), то (а,	С другой
стороны, если ао — значение задачи (1) и (а, Ь)^КУ то а^(с|х) для некоторого допустимого элемента задачи (1) и, значит, а^(с|х)^ао. Таким образом, множество
{aeR|(a, b) <= К}
не пусто и
аа = inf (aeR |(a,
(2)
Так как по условию ао >—сю и конус К замкнут, то (ао, Ь)^КУ т. е. существует такой элемент ^gR?1, х* 0, что Лх* Ьу (с|х#) ао. Но это значит, что х* — решение задачи (1). Теорема доказана.
6.1.2.	Теорема двойственности. Конус К, рассмотренный при доказательстве предыдущей теоремы, — выпуклый, замкнутый и обладает следующим свойством: если (a, z)^K и р а, то (р, г)еК. Поэтому конус Л является надграфиком выпуклой замкнутой функции
S (г) = inf {aeR |(a, г) е К}.
Из доказательства предыдущей теоремы следует, что S(z) есть значение задачи линейного программирования:
(с|х) —>inf; Лх^г, х^О,	(3)
отличающейся от задачи (1) тем, что вектор b заменен некоторым вектором z. Задачу (3) мы называем возмущением задачи (1). Найдем функцию, сопряженную с S(z). (Дальнейшие выкладки в более общей ситуации
270
ГЛ. 6. специальные задачи
встретятся в § 7.3.) Имеем
S* (у) = sup ((у \z)—S (z)) =
z
= sup((z/|z)— inf {(c |x) |x e R", x^O, Ax^z}) = z
= sup{(z/|z)— (c|x)|.r£R'1, zgR", x^O, Ax^z}.
Очевидно, rsup {(у |г) \z e R"1, z^ Ax} =(Ax\y) < oo в том и только том случае, когда т. е.
s*(y} =
sup (А*у — с |х), если у <= R™, оо, если у ф
или
s*(y) =
о, оо
если А*у с, у^О,
Поэтому
в остальных случаях.
S**(z) = sup {(// |г) |Л*у
В частности,	совпадает со значением такой
задачи линейного программирования:
(у \b) -> sup; А*у^с, у^О.	(4)
Задача (4) называется двойственной с задачей (1). Нетрудно видеть, что она имеет, по существу, ту же форму, что и задача (1). Поэтому двойственной с задачей (4) будет снова задача (1), и имеет смысл говорить о паре двойственных задач линейного программирования, Читатель без труда обнаружит те формальные правила, с помощью которых строится двойственная задача.
Теорема 2 (теорема двойственности). Для пары двойственных задач линейного программирования справедлива следующая альтернатива', либо значения задач конечны и равны и в обеих задачах существует решение, либо в одной из задач множество допустимых элементов пусто, а в другой или множество допустимых элементов пусто, или значение задачи бесконечно.
§ 6.1. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
271
В первом случае векторы g Rn и y*^Rm в том и только том случае будут решениями задач (1) и (4) соответственно, когда они допустимы в этих задачах и удовлетворяют одному из двух эквивалентных соотношений:
(dx.) = (</.!*).	(5)
(У, I Лх. - b) = (A*yt - с I х.) = 0.	(6)
Доказательство. В силу замкнутости S(z) получаем, что если S(z)— собственная функция, то по теореме Фенхеля — Моро S(b) =	Если при этом
b g= dom S, то значения обеих задач конечны и, в силу теоремы 1, обе они разрешимы. Если же ft^domS, то S(b) = S**(b) = оо. Это значит, в частности, что в первой задаче множество допустимых элементов пусто. (Напомним, что inf f(x)—-\- оо.) Рассмотрим случай, ког-да S(z)— несобственная функция. Если S(z)= со, то и 5**(г)= оо, и мы приходим к уже рассмотренному случаю. Если S — несобственная функция и dom 5=^0 (в этом случае S(z) =—оо на domS), то S**(z) = —оо. Это значит, что £**(&)==—оо, т. е. во второй задаче множество допустимых элементов пусто, а в первой либо это множество пусто (когда £(/>)= оо), либо минимизируемая функция неограничена снизу на допустимом множестве (когда S(b) = —оо). Первая часть теоремы доказана.
Если х* и у* — решения задач (1) и (4), то по доказанному (с|х*) = (#*|6). Наоборот, для всяких допустимых элементов х и у
(с\х)^(^у\х) = (у\Ах)^(у\Ь).	(7)
Поэтому, если выполнено равенство (5), то х* и у* — решения задач. Далее, если выполнено (6), то
(с I х.) = (Л*#„ | х.) = (у, | Лх.) = (Ь | Z/.).	(8)
С другой стороны, если х и у — допустимые элементы в задачах (1) и (4) и выполнено равенство (5), то в силу (7) выполнены равенства (8), эквивалентные условию (6). Итак, условия (5) и (6), действительно, равносильны. Теорема доказана.
272	ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
§ 6.2.	Теория квадратичных форм в гильбертовом пространстве
В этом параграфе излагается фрагмент вариационной теории квадратичных форм.
6.2.1.	Определения. Для полноты изложения приведем все необходимые для дальнейшего определения. Часть из них уже приводилась нами ранее.
Функция Q(x), заданная в линейном пространстве X, называется квадратичной формой, если существует такая билинейная симметричная функция В(х, у), что
Q(x) = B(x, х).	(1)
Отметим, что билинейная форма В определяется по Q однозначно: В(х, у) = х/4(Q (х + у) — Q(x — y)).
Квадратичная форма Q называется положительной (неотрицательной), если Q(x)>0 при х =# О (соответственно Q(x)^0 при всех хеХ). Аналогично определяются отрицательная и неположительная формы.
Функция k(x) называется квадратичной, если k{x) = Q(x) + l(x) + a,
где Q — квадратичная форма, I — линейный функционал и а — константа.
Далее X — это сепарабельное гильбертово пространство. Квадратичную форму Q называют слабо непрерывной, если она непрерывна относительно слабой топологии X; слабо полунепрерывной снизу, если она полунепрерывна снизу относительно слабой топологии пространства X. Наконец, квадратичную форму Q называют лежандровой, если она слабо полунепрерывна снизу и если из слабой сходимости хп к х и сходимости Q(xn) к Q(x) следует сильная сходимость хп к х. Максимальная размерность тех подпространств, на которых квадратичная форма Q неположительно определена, называется ее индексом *) и обозначается ind Q.
Пусть В(х,у) — непрерывная в сильной топологии билинейная симметричная функция. Тогда отображение _______________ х -> В (х, у)
*) Иногда индексом квадратичной формы называют максимальную размерность подпространства, на котором форма отрицательно определена.
§ 6.2. ТЕОРИЯ .КВАДРАТИЧНЫХ ФОРМ
273
есть при фиксированном. у^Х лицевдая непрерывная функция на X. Следовательно, по теореме об .общем виде линейного функционала в гильбертовом пространстве найдется такой элемент т] = Лу, что
в (х, У) = (х 1л).
Легко понять, что оператор	X), т. е. является
линейным и непрерывным оператором, а в силу симметрии функции В он является самосопряженным. Отсюда и из формулы (1) получается, что непрерывная квадратичная форма допускает следующее представление:
Q(x) = V2 (Лх |х),
где Л — непрерывный линейный самосопряженный оператор. Коэффициент */2 мы выбрали ради удобства. (Отметим, что ранее в п. 0.2.5 мы последнее соотношение принимали за определение квадратичной формы.)
Если Л — самосопряженный оператор, то символ Л 0 (соответственно Л > 0) означает, что квадратичная форма Q(x) = V2(Ax, х) неотрицательно (соответственно положительно) определена.
Пусть Л: Х—*Х— линейный непрерывный оператор. Число X называется собственным значением оператора Л, если существует вектор х =# 0 такой, что
Ах = Лх.
Сам вектор х называется при этом собственным вектором. Оператор Aej?(X,X) называется компактным. если он всякое ограниченное множество переводит в относительно компактное или, что равносильно, всякую слабо сходящуюся последовательность — в сильно сходящуюся.
6.2.2.	Гладкие экстремальные задачи с квадратичными функциями. Рассмотрим задачу с ограничениями типа равенств:
&0(x)->inf (sup); ^(х) = 0, i—	(2)
где
^W = 1/2(Afx|x)-f-(aJx) + az, Z = 0, ..., и,
— квадратичные функции. В п. 0.2.5 было показано, что квадратичные функции являются дифференцируемыми
274
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
по Фреше. Следовательно, задача (2) относится к числу гладких задач, к которым применимо следствие 1 из теоремы 1 § 1.1. Из этого следствия сразу вытекает такое утверждение.
Предложение 1. Для того чтобы элемент х* доставлял экстремум в задаче (2), необходимо, чтобы нашлись числа Zo, ..., Zn, не все равные нулю и такие, что выполнено следующее соотношение*.
1мАл + аг)-0.	(3)
х—О
Следствие 1. В задаче без ограничений kQ (х) -> inf (sup)
решение х* удовлетворяет соотношению
ЛоХ# + ао = О.	(4)
Следствие 2. Решение х* экстремальной задачи (Лх |x)->inf (sup); (х|х) = 1	(5)
является собственным вектором оператора Л, и при этом собственное число является значением задачи (5).
Действительно, уравнение (3) дает
АчЛх* + ZjX* = 0.
При этом Zo =/= 0, ибо иначе и второй множитель Лагранжа равнялся бы нулю, чего не может быть. Следовательно,
Лх* — Кх*.
Домножая это равенство на х*, мы получаем, что Z = (ЛхДхД, что и требовалось.
6.2.3.	Слабо непрерывные формы. Теорема Гильберта.
Теорема 1 (Гильберт). Для того чтобы квадратичная форма Q(x) = 72(Лх|х), где Л — линейный непрерывный самосопряженный оператор, была слабо непрерывной, необходимо и достаточно, чтобы оператор Л был компактным. При этом существует ортонормирован-ный базис	еп, ... в пространстве X, состоящий
§ 6 2. ТЕОРИЯ КВАДРАТИЧНЫХ ФОРМ
275
из собственных векторов оператора Л, в котором форма Q принимает вид
оо
Q(x) = ’/2 2 Ы*Ы2,	(6)
/г=1
Лв£ —	(&i I £/) — I Aq I I I •••>	0*
Доказательство. Докажем сначала достаточность. Пусть Л — компактный оператор. По определению это означает, что всякую слабо сходящуюся последовательность он переводит в сильно сходящуюся. Покажем, что форма Q — слабо непрерывна. Пусть хп слабо сходится к х. Тогда по теореме Банаха — Штейн-гауза эта последовательность является сильно ограниченной, т. е. существует такое число С, что ||хп|| С и, следовательно, ||х|| С. В итоге получается:
2 I Q (хп) — Q (х) | = | (ЛхЛ |хп) — (Лх |х) |<
| (Ахп | xrt) (Лх | хп) | | (Лх„ | х)	(Лх | х) |
< || Лхп—Лх || || хп (I +1| Лхге—Лх || || х || < 2С || Лх» - Лх || -> 0
Достаточность доказана.
Необходимость докажем, выведя предварительно соотношение (6). Базис eit ..., еп, ... будем строить индуктивно. Для определения ei рассмотрим экстремальную задачу:
>/21 (Лх |х) | = | Q(x) |->sup; (х|х)<1.	(7)
Значение этой задачи обозначим В силу того, что единичный шар В(0, 1) = {х| (х|х)	1} является слабо
компактным, а форма Q слабо непрерывна по условию, решение задачи (7) существует. Допустим сначала, что ai = 0. Тогда (Лх|х)е=0 на X и, значит, любой вектор х является экстремумом в задаче без ограничений (Ax|x)->inf. По следствию 1 из предложения 1 получаем, что тогда Лх = 0, т. е. любой вектор является собственным с собственным значением нуль. В этом случае теорема Гильберта доказана. Если же «1 У= 0, то решение е^ принадлежит единичной сфере {х| (х|х) = 1} и является экстремумом такой задачи:
V2 (Ax|x) = Q(x)->inf (sup); (х(х) = Ь
276
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
В силу следствия 2 из предложения 1 вектор ei является собственным вектором оператора Л:
| j = •
Пусть теперь п ортонормированных векторов , еп, являющихся собственными векторами оператора Л с собственными значениями М, ..., Zn, уже построены. Рассмотрим экстремальную задачу:
|Q(x)|->sup; (х|х)^1, (x|ez) = 0,	и.
Значение этой задачи обозначим an+i. Существование решения в этой задаче сразу вытекает из слабой компактности единичного шара в X. Ясно и то, что если an+i 0, то решение en+i принадлежит единичной сфере и, следовательно, является решением задачи:
Q(x)-> inf (sup); (х|х)=1, (x|ez) = 0,	n.
В силу предложения 1 найдутся числа Zo, Цо, •••, И» такие, что
^оАе„+1 + иое„+1 + 2	= 0.
1=1
Домножив это равенство последовательно на	еп
и использовав ортонормированность системы ... ..., en+i, получаем:
Ло (Л^л+1 | ek)	(Лв£ | вп+1) “F Н& = Н& = 0»
т. е. цл = 0, k = 1, ..., и, а значит, Хо =И= 0 (ибо иначе все множители Лагранжа были бы нулями) и Aen+i = = (—go/Xo)en+i. Таким образом,
+ l === hn+l&n + 19 I ^« + 1 | ==: Оп+1»
Итак, en+i — собственный вектор, и мы можем продолжать наше индуктивное построение. Если же an+i = 0, то получается, что на подпространстве L£9 ортогональном к elt ..., еп, оператор Л является нулевым и,
5 6.2. ТЕОРИЯ КВАДРАТИЧНЫХ ФОРМ
277
значит, х = 2 xkek + g, g е ZA и
(/ п	\ п	\
л 2 хЧ + d X xkek + l =
\fc=I	/ k=l	/
п	п
= ’/2 2 М**)2='/2 S Ьк(х\еку. /2=1	/2=1
В этом случае теорема Гильберта уже доказана.
Подведем итоги. Либо наше индуктивное построение приводит к тому, что оператор А оказывается конечномерным, либо оно продолжается неограниченно. Неравенства |Xi|^|Z2|^ ... следуют сразу из наших построений. Далее, последовательность единичных векторов еп слабо стремится к нулю, откуда
1^ | = 1 (Аеп\еп) | = 2|
Рассмотрим, наконец, ортогональное дополнение к подпространству L, натянутому на все векторы elf ... ..., еп, ..., и следующую задачу:
| Q(х) | —>sup; (х|х)<1, хе/А
Ее значение есть нуль, ибо оно не может превосходить никакого ап+1, a an+i-> 0. Значит, на подпространстве Z.1 квадратичная форма Q(x)=0. Взяв базис fi, ..., fs, ... в подпространстве L1 и дополнив его векторами eif ..., еп, ...» получим базис в пространстве X, состоящий из собственных векторов оператора А. При этом имеет место равенство
Q W = '/2 (A (х |eft)ек + 2 (х f) 2 (х |eft) ек + \	\/г=1	/	/ /г=1
+ 2(x|fz)f/)-2 Mxk*)2.
i	fe=i
Образ AB(0, 1) — {y\y = Ax, (x|x)^l) единичного шара B(0, 1) при отображении А есть эллипсоид 2(У	1 с осями	|Х„|е„, ... Этот
эллипсоид в силу условия | Хп | —► 0 является компактным. Итак, оператор А является компактным. Теорема Гильберта полностью доказана.
278
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
6.2.4.	Минимаксное свойство собственных значений. Допустим, что Q(x) = V2(Ax|x) — неотрицательная слабо непрерывная квадратичная форма. Тогда в силу теоремы Гильберта Л—компактный оператор и существует базис в X, состоящий из собственных векторов
..., еп, ... оператора Л. Собственные значения Х2 ^ ... являются неотрицательными в силу неотрицательности Q. Покажем, что если Xn+i ¥= 0, то
Лп+1 = inf sup {Q(x) |(х |х) = 1, хеАп1}, (8) где нижняя грань берется по всем подпространствам Ln размерности п. Действительно, по доказанному в теореме Гильберта
^п + 1 = sup [Q (х) | (х |х) = 1, х 6= (^п) } >
где Ln есть линейная оболочка eh ..., еп- Значит,
inf sup {Q(x) |(х |х)= 1, хе£„].
Ln
Пусть теперь Ln — любое n-мерное подпространство. Рассмотрим единичный вектор х0, лежащий в подпространстве Лп+ь натянутом на векторы ..., en+i, и ортогональный к Ln (такой, очевидно, всегда найдется). Имеем:
п+1	п+1
XQ ~ (Хо I	2(Xo)2 = W2=
«=1	к~{
Следовательно:
sup {Q(x) |(х|х) = 1, xgeZ^}>Q(x0) = n+1	n+1
- 2 \ (X, I > ( mln I,) 2 «)’ = /2— 1	I <S Tt Ч" 1	R~ 1
Итак, минимаксное соотношение (8) доказано.
6.2.5.	Лежандровы формы. Теорема Хестенса.
Теорема 2 (Хестенс). Лежандрова квадратичная форма имеет конечный индекс.
Доказательство. Снова, подобно тому, как это было в теореме 1, рассмотрим экстремальную
§ 6.2. ТЕОРИЯ КВАДРАТИЧНЫХ ФОРМ
279
задачу:
i/2 (Дх |х) = Q(х)->inf; (х |х)< 1.	(9)
Существование решения в задаче (9) обеспечивает теорема о существовании минимума полунепрерывного снизу функционала на компакте. Следовательно, по следствию 2 из предложения 1 всякое отличное от нуля решение задачи (9) есть собственный вектор оператора Л. Пусть
Лв| =	(#1 1^1) === i, 0.
Будем опять индуктивно строить ортонормированную систему , еп, ..., последовательно решая экстремальные задачи:
V2 (Лх |х) = Q (х) —> inf; (x|x)^I, (x|ez) = 0, (10) i = 1, ..., п.
Покажем, что наше построение оборвется через конечное число шагов. (Это выразится в том, что экстремальная задача (10) не будет иметь ненулевого решения.) Действительно, допустим, что мы построили счетную систему векторов
#1» •••» &П9 •••>	|вге|=1,
Л2	0.
Последовательность единичных векторов {еп} слабо сходится к нулю. Значит, в силу полунепрерывности формы Q снизу в точке нуль, мы получаем (использовав монотонность последовательности Хп)
lim кп = lim кп = lim (Леп \ еп) = п“>°°	п-»оо	П->оо
= lim 2Q(e„)>2Q(0) = 0.
П->оо
Итак, lim Xn = 0. Следовательно, {еп} слабо сходится к нулю и Q(en)X„/2—*0. По условию форма Q — лежанд-рова, отсюда должно следовать, что ||еп||->0, но это не так. Значит, через конечное число шагов наше построение закончится. Пусть построение оборвется через N шагов. Тогда на ортогональном дополнении L±,
280
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
£jV = lin{e1,	форма обязана быть положитель-
ной. Любое подпространство L размерности большей, чем Л7, имеет непустое пересечение с и, значит, на этом подпространстве форма Q не может быть неположительной. Отсюда следует, по определению индекса, что ind Q N. С другой стороны, на самом пространстве Ln форма Q, очевидно, неположительна, т. е. indQ^A. Итак, indQ = M Теорема Хестенса доказана.
В заключение приведем формулировку теоремы, характеризующей слабо полунепрерывные снизу формы.
Теорема 3. Для того чтобы квадратичная форма Q(x) = 1/г(Ах|х) была слабо полунепрерывна снизу, необходимо и достаточно, чтобы пространство X можно было бы разложить на два подпространства и L_, причем на L+ форма Q неотрицательна, а на L- — отрицательна и слабо непрерывна.
Доказательство ее основано на тех же идеях, что и доказательство теорем 1 и 2.
§ 6.3. Квадратичные функционалы в классическом вариационном исчислении
6.3.1.	Определения и простейшие свойства. Мы будем изучать квадратичные формы одномерного вариационного исчисления следующего вида:
<Х
Ж (х (•)) = J к (f, X, х) dt =
to
tx
= J ((Дх|х) + 2(Сх|х) + (Вх|х))^,	(1)
t.
матрицы А = Л(/), В — B(t) и С — C(t) имеют размеры п X п и непрерывно зависят от t. Матрицы A(i) и B(t) можно считать симметричными. Роль квадратичных форм такого вида в классическом вариационном исчислении весьма велика, ибо вторая вариация простейших функционалов классического вариационного исчисления, как это следует из § 2.2, является квадратичной формой вида (1).
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
281
Квадратичную форму (1) будем рассматривать в гильбертовом пространстве №2. i Фо, Л]). Напомним, что пространство №2,1 фо, 6]) состоит из абсолютно непрерыв* них вектор-функций x(t) = (x' (/), .... xn(t)), у которых квадрат нормы производной является суммируемой функцией:
п
J|X(OM= / 2 (xk(t)fdt<0O. t„	fe=l
Скалярное произведение в пространстве W", 1Ф0Ф1]) задается формулой
Л
(X (•) IУ (• )) = (X (/о) I у О + / (X (Г) I у (0) dt.
^0
Через №2,1 ([/о, Л]) обозначается далее подпространство пространства И?", 1 ([Ль 6]), состоящее из вектор-функций х(/), обращающихся в нуль на концах отрезка: X (/0) = X (/,) = 0.
Докажем два важных утверждения о пространствах НИ? i; на них опираются теоремы следующего пункта.
Предложение 1. Для всякого вектора
£ =/= 0, и числа т е [/0, существует последовательность xm(t\ I, т), слабо, но не сильно сходящаяся к нулю в пространстве W2, i ([Лъ Л]) и при этом такая, что
lim X(x/n(.)) = (4(T)g|g). m~>oo
(2)
%тkt\ т) —
Доказательство основано на построении, подобном конструкции вариации Лежандра, см. рис. 5 на стр. 130. Проведем его для внутренней точки т отрезка [/о, ^]. Обозначим Д7П = р | \t —	Рассмотрим после-
довательность
((g/2/m) ——т|) при ts=!xm, 0	при' t&.\m.
(При этом m /по, где т0 должно быть настолько велико, чтобы отрезок Дт целиком принадлежал [/о, Л])
282
ГЛ. в. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Покажем, что она — искомая. Непосредственный под» счет показывает, что норма функции хт(-; g, т) в пространстве W", 1 ([4ь М) равна |g| и, значит, последовательность хт (•; т) не сходится к нулю сильно. Покажем, что она слабо сходится к нулю. Пусть у (t) е s W", 1 (М). Тогда в силу неравенства Коши — Бу-няковского:
I (xm(-; т) !*/(•)) |=
g, т) \y(t))dt <
tn
<l|xm(-;g, т)||( / (ЯО(*)Ц,/г->0. 'Azn	'
Стремление к нулю происходит в силу абсолютной непрерывности интеграла. Остается получить формулу (2). Вектор-функции xm(/;g, т) равномерно стремятся к нулю при т -* оо и, следовательно, последнее слагаемое в (1) в силу неравенства
\(B(f)xm(t',l,x)\xm(t-,l,x))dt^^- max || В (f) || = О (1/т) S	т 1<= [/„, tJ
atn
стремится к нулю при т -* оо. Далее непосредственно легко увидеть, что скалярное произведение
g, T)|xm(f; g, т))
равномерно ограничено и, значит, среднее слагаемое в (1)
J (C(t)xm(t- g, т) \xm(t-, g, x))dt
Am
также стремится к нулю. Наконец, в силу теоремы о среднем, мы получаем, что
J (Л (t) хт (С g, т) |хт (/; g, т)) dt-> (Л (т) g |g).
Л7П
Доказательство предложения 1 для граничной точки аналогично.
Предложение 2. Если последовательность век-тор-функций xm(t) слабо сходится к вектор-функции
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
283
х(0 в пространстве W2.i ([Аь ), то она сильно сходится к x(t) в пространстве L2([tQ, /1]).
Доказательство. В силу теоремы Банаха — Штейнгауза из слабой сходимости последовательности хт(-) к х(-) следует, что последовательность хт(-) сильно ограничена в №2,1 ([Лз, Л]), т. е. существует такая константа С', что
«I
lxm (t0) | хт (f0)) + j (хт (/) \хт (0) dt < (С')2.
*9
Кроме того*), хЦ^ = (х„(О|/Д-))->(x(-)lj*(-))== = xft(/0).
Рассмотрим вектор-функции
ek(t, т) = (0, О, e(t, т), 0,	0),
где на &-м месте стоит функция
е(/, т) =
t-t, т
при при
Имеем в силу слабой сходимости:
(М •) I М •’*))= J (t) dt = xkm (т) - xkm (Q ->
->(х(-)|еН-,т)) = хЧт)-х6(/о)-
Из последнего соотношения и того, что xkm (Q -> х* (/0), получается, что xm(t) поточечно стремится к x(f). Но, с другой стороны, эта последовательность является равномерно ограниченной в метрике Cn (|7о,/J). Действительно, в силу неравенства Коши — Буняковского:
I хт (t) - хт (t0) | < Vt - /0II хт (•) IlS • w2, 1
*) Через /а(-) обозначен далее элемент ^2,1 ([^0» ^1])» У которого все компоненты, кроме А?-ой, тождественно равны нулю, а k-я тождественно равна единице.
284
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Следовательно, можно применить теорему Лебега об ограниченной сходимости:
tx
/ (хт (О — X (О | Хт (0 — X (0) dt -> 0,
что и требовалось.
Следующие два утверждения относятся к квадратичным формам в произвольных гильбертовых пространствах.
Предложение 3. Неотрицательная непрерывная квадратичная форма в гильбертовом пространстве слабо полунепрерывна снизу.
Доказательство. Пусть {хп} слабо стремится к х. Тогда
lim 2 (Q(xn) — Q (х)) = lim ((Ахп |хп) — (Лх |х)) —
П-><х>	П->оа
= lim (Л (хп — х) \хп — х) + 2 (Лх | хп) — 2 (Лх | х) п ->оо
2 lim ((Лх |х„) — (Лх |х)) = 0.
гг->оо
Предложение 4. Если хп слабо сходится к х, а уп сильно сходится к у, то
(хп\уп)->(х\у).
Доказательство (в силу теоремы Банаха — Штейн-гауза) следует из элементарной выкладки:
I (хп\Уп)—(х \у) 1 = 1 (хп\уп— у) + (у \хп — х) К
НИ Уп — У\\ + \(У\хп — х)\^
<С\\уп-у\\ + \(у\хп-х)\^0.
6.3.2. Слабая непрерывность, слабая полунепрерывность снизу и лежандровость форм о7С (*(•))•
Теорема I. Для того чтобы квадратичная форма J$f(x(-)) вида (1) была слабо непрерывна в пространстве W” j ([/о, Л])> необходимо и достаточно, чтобы А (t) = 6’
Доказательство. Необходимость. Допустим, что форма Ж(х(-)) слабо непрерывна, но, вмерте с тем, Л(/)Й0. В силу непрерывности A(t) найдется
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
285
внутренняя точка т^(/0, Л), где Л(т) =Н= 0. Это означает, что для некоторого вектора g имеем (Л (т)£|£) =/= 0. Взяв последовательность xm(t;%, т), которая была построена в предложении 1, получаем, что т) слабо сходится к нулю в то время, как
Ж(хт( •; £, т) )-> (А У= 0. Но это противоречит слабой непрерывности формы Ж.
Достаточность. В силу предложения 2, если хт(0—последовательность, слабо сходящаяся к х(/) в пространстве tT", i ([/о, ^]), то xm(f) сильно сходится к х(0 в пространстве L2([tQ, ZJ). Из определения слабой сходимости в пространстве IT", i([ta Л]) сразу же вьп екает, что последовательность хт( • ) слабо сходится к х(-) в пространстве L2([^о, ^11)- В силу сказанного оба слагаемых в (1)
/	\хт (t))dt и J (B(t)xm(t)\xm(t))dt
t,	t,
ti
стремятся к J (C (t) x (t) |x(/)) dt и J (B (f) x (t) | x (/)) dt соответственно (в силу предложения 4) и, следовательно, форма Ж (%(•)) (при условии, что A(t) = Q) является слабо непрерывной.
Теорема 2. Для того чтобы форма Ж(%(•)) была слабо полунепрерывна снизу в пространстве1^^ i([/o, М), необходимо и достаточно, чтобы было выполнено условие Лежандра, т. е, чтобы матрица A(t) была неотрицательно определенной для любого t е [/о, /1].
Доказательство. Необходимость. Если в предположении слабой полунепрерывности снизу формы Ж(х(-)) допустить, что в некоторой точке те[/0Д1] для некоторого £ е Rn выполнено неравенство (Л (т)g|£) < 0, то снова, взяв последовательность xm(t',^, т) из предложения 1, получим, что она слабо стремится к нулю в то время, как
Х’(хт(-а. т))->(Д(тП|Ю<0 = Ж(0), чего не может быть.
286
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Достаточность. Пусть	для всех
/J. Имеем:
^(х(.)) = ^(х(.)) + ^2(х(.)), где
Л
^ (*(•)) = J (A(t)x(t)\x(t))dt,
Х2(х(.)) = Ж(х(-))~Х1(х(.)).
В силу теоремы 1 форма Жъ слабо непрерывна и тем более слабо полунепрерывна снизу. Форма Ж\ очевидным образом неотрицательна, значит, по предложению 3 она полунепрерывна снизу, а тогда и форма Ж является таковой же.
Теорема 3. Для того чтобы квадратичная форма Ж была лежандровой, необходимо и достаточно, чтобы для всех t е [/о, ^i] матрица A(t) была положительно определенной.
Доказательство. Необходимость условия Л(/)^0 следует из теоремы 2. Допустим, что (Л(т)£|£)=0, £ =# 0. Снова возьмем последовательность xm(/;g, т) из предложения 1. Она слабо сходится к нулю. Далее,
Ж(х7П(.-Л, т))->(Д(т)Ш = 0.
Значит, по определению лежандровости последовательность (•;£»**) должна сходиться к нулю сильно, но это не так. Необходимость доказана.
Достаточность. Пусть Л(/)>0, t^[to,ti], последовательность xm(t) слабо стремится к x(t) в пространстве №2,1 ([/о, Л]) и при этом Ж (хт{ •)) ->Ж (х( •)). Снова, разбив форму Х(х(-)) на две, как мы это сделали при доказательстве теоремы 2, получим сразу, что
^(^(•))->^1(х(-)).	(3)
В силу строгой положительности матрицы A(t) найдется такое число у > 0, что для любого вектора g е Rn и / е [Zo, /1] выполнено неравенство

§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
287
Воспользовавшись им, получим:
о
tt
< Y J (Л (0 (хт (0 - X (/)) | хп (0 - х (0) dt =
*0
= У	• )) + ^! (^( •») —
ц
— 2у J (A(t)x(t)\xm(t))dt->0.
^0
Предельное стремление к нулю происходит в силу (3) и слабой сходимости xm(t) к x(t). Кроме того, в силу слабой сходимости хт(-)-+х(-) получаем, что xm(tQ)-+ *>х(/о)« Суммируя, видим, что в норме W2, i ([^о, М) последовательность xm(t) стремится к x(t). Теорема 3 полностью доказана.
6.3.3. Необходимые и достаточные условия неотрицательности и строгой положительности квадратичных функционалов.
Теорема 4. Для того чтобы квадратичный функционал	был неотрицательным в W%, i ([^0, 61),
необходимо, чтобы было выполнено условие Лежандра'.
о
То же утверждение верно и для пространств W*. 1 ([^о, 6]). Доказательство сразу следует из предложения 1.
Отметим кстати, что теорема 4 является следствием из принципа максимума, точнее — из условия Вейерштрасса. (В частном случае, когда п=\, мы установили это в п. 2.2.4.)
Далее предполагается, что матрицы Л(/) и C(t) непрерывно дифференцируемы по t.
Допустим, что на отрезке [/0, Л] выполняется усиленное условие Лежандра
te= [/0,
288
ГЛ. 6: СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Рассмотрим уравнение Эйлера функционала «У. Оно., имеет вид*)
-4^+^=-4^+c’x)+c*+fix=0- и)
Для всяких go Rn и gi е Rn существует единственное решение этого уравнения, удовлетворяющее начальным условиям х(/0)= g0, х(/0) = gb
В самом деле, усиленное условие Лежандра дает возможность уравнению (4) придать вид линейной системы:
i = y, y = P(t)y + Q(t)x,	(4')
где
р (0 = - А~' (0 (я (0 + с' (0 - с (0), Q(t)=—A~l (/) (С* (f) —-В (/)).
Для таких систем выполнена теорема существования и единственности решения задачи Коши (см. теорему 1 § 0.4).
Обозначим через Ф(/, /0) фундаментальное (матричное) решение уравнения (4), т. е. решение, удовлетворяющее начальным данным
Ф(/о,/о) = О, Ф(/0Л0)=Д	(5)
Точку т назовем точкой, сопряженной с точкой tQ, если матрица Ф(т,/0) является вырожденной. (Отметим, что при п = 1 определение сопряженной точки было дано в § 2.2.)
Очевидно, что это определение равносильно тому, что существует нетривиальное решение х0(0 уравнения (4), удовлетворяющее нулевым краевым условиям
Хо (to) = ХО (т) = О, х0 (0 Ф 0.	(6)
Теорема 5. Пусть для квадратичной формы JJf(x(-)) выполнено усиленное условие Лежандра. Тогда для того, чтобы она была неотрицательно определена
*) Уравнение (4) для функционала ^"(х»(-)) (х(•), х(-)) называют уравнением Якоби функционала Z7(x(-)) простейшей задачи вариационного исчисления (см. п. 2.2.5). В силу сказанного уравнение (4) мы называем далее уравнением Эйлера — Якоби.
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
289
xt (0 =
(7)
в пространстве W", i ([Ль М)> необходимо, чтобы в интервале (£о, 6) не было точек, сопряженных с точкой t$.
Доказательство. Допустим, что в интервале (/0, t\) есть точка т, сопряженная с точкой /0, и придем к противоречию с неотрицательностью JSf(x(-)). Возьмем нетривиальное решение x0(i) уравнения Эйлера — Якоби (4), удовлетворяющее краевым условиям (6). Положим
х0(/), если t е [/о, т],
О,	если t е [т,
Интегрируя по частям, получаем т
^(Х,( •)) = //<(/, х0, x0)dt =
т
= J ((Ах01 х0) + 2 (Сх01 х0) + (Вх01 х0)) dt = f()
—ST	“Ь £*хо) 4“ “F Вх0 | х0) dt = 0.
fo
По предположению форма УС неотрицательно определена. Следовательно, х*(/) доставляет минимум в такой задаче оптимального управления:
f»
УС (х (•)) = J К (Л х, и) dt -> inf; х = и, f«
X (/0) = X (ti) = 0.
Применим к задаче (7) принцип максимума Понтрягина (теорема 1 из § 2.4). В соответствии с этой теоремой гамильтониан <?$?(/, х«(0, p(t), 1) является непрерывной функцией на отрезке Цо, Л]. Напомним выражение для Ж
W(t, х.(/), Р(0. 1) = Я(/, х.(0, «ДО, Р(0, 1). где
И (t, х, и, р, 1) = (р | и) — К (t, х, и) =
=(/?!«) — (Аи[и)— 2 (Си \х) — (Вх lx), ut(t) = x,(t), р(0=-= 2Д(0«.(0 + 2С(/)х,(/)
Ю А- д. Иоффе, В. М. Тихомиров
290
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Из этих формул вытекает, что на отрезке [т, гамильтониан тождественно равен нулю, ибо на этом отрезке %*(/) = u*(t) = 0. В силу того, что х*(т) = %о(т) = 0, получаем:
<^(т— 0, х* (т — 0), р(х— 0), 1) =
= (Л(т)Хо(т) |х0(т)) = у.
Если допустить, что у = 0, то вследствие усиленного условия Лежандра получится равенство нулю производной хо(О в точке т. Тогда нетривиальное (из-за нашего выбора) решение уравнения Эйлера — Якоби (4) х0(/) удовлетворяет начальным данным: х0(т) = Хо(т) = = 0. В силу теоремы единственности решения задачи Коши для линейной системы этого не может быть. Противоречие, к которому мы пришли, означает, что функция х*(/) не удовлетворяет принципу максимума, ибо Ж имеет разрыв в точке т. Следовательно, найдется допустимая функция х(/), у которой х(/) ограничена и измерима (и значит, x(t) е №2> i ([^о, причем Jf(x(-))<0. Противоречие с неотрицательностью Ж получено. Теорема доказана.
Замечание. Теорему 5 можно было бы доказать, сославшись на то, что на ломаной экстремали х#(/) не выполнены условия Вейерштрасса — Эрдмана (см. п. 2.4.3).
Теорема 6. Для того чтобы квадратичная форма J4f(x(-)) была неотрицательно определена в пространстве 1^2, i( [/о, Л]), достаточно, чтобы выполнялись усиленные условия Лежандра и Якоби, т. е. чтобы, во-первых, матрица A(t) была положительно определена для всех t из отрезка [/о, Л] и, во-вторых, чтобы на полуинтервале не было точек, сопряженных с точкой tQ.
Доказательство. Вследствие усиленного условия Якоби фундаментальная матрица Ф(/До) уравнения Эйлера — Якоби (4) невырождена на полуинтервале (/о, ^1]. В силу теоремы о непрерывной зависимости решений дифференциального уравнения от начальных данных, примененной к уравнению (4), можно найти такое 6 > 0, что матрица Ф(Мо~ 6) будет невырожденной на всем отрезке [/о, ^i]- Положим
x(t, Л) = Ф(/, t0 — б)Л, XeR".
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
291
Из определения матрицы Ф вытекает, что для всякого ZeRn вектор-функция t —*x(t, X) является экстремалью функционала ^(х(-)). Далее, для любых т е [/0Д1] и g е Rn существует единственная кривая семейства {x(t, 2v)}, проходящая через точку (т, g). Действительно, для того чтобы было верно равенство х(т, X) = g, необходимо и достаточно, чтобы Z=Z(t, g) = Ф~! (т, /0— d)g. Вектор-функцию х(/, Х(т, g)) обозначим х(/;т, g). Получилось, что семейство экстремалей {х(/Д)} однократно покрывает полосу [/0, X Rn. (Отметим, что все эти экстремали обращаются в нуль в точке /0 — б.) Такое семейство называют центральным полем экстремалей функционала J$f(x(-)) с центром в точке (f0 — 6,0). Обозначим через U (%, g) вектор х(т;т, g). Вектор-функцию U(x, g) называют функцией наклона поля x(t, Z). Отметим явное выражение для U:
и (т, £) = Ф (т, t0 - 6) Ф~‘ (т, t0 - б) t
Согласно основной формуле Вейерштрасса имеет место следующее тождество в пространстве W%,1:
*1
X (х (•)) = J (t, х (0, и (t, х (0), X (/)) dt, (8) /о
где <?(/, х, х, g) есть ^-функция Вейерштрасса функционала а £/(/, х)— введенная выше функция наклона поля.
Основная формула Вейерштрасса составляет фундамент вейерштрассовской теории в вариационном исчислении. Ее доказательство содержится в большинстве учебников по этому предмету. В гл. 7 будет приведен независимый от излагаемой здесь теории квадратичных форм вывод основной формулы Вейерштрасса (см. теорему 3 из § 7.4).
Приведем выражение ^-функции функционала
#(/, х, х, £) = (Д(0(£-хШ-х).
10;
292
ГЛ. 6 СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если воспользоваться этим выражением, то из (8) получается тождество (его можно проверить и непосред* ственно)
X (%(•)) =
6	о
= / (Л (/) (U (I, x(f))-x(t)) I U(t,	х(.) е W", i,
из которого сразу следует искомая неотрицательная определенность формы Ж. Теорема доказана.
Следствие. В условиях теоремы 6 квадратичная форма Ж(х(-)) является строго положительной в пространстве W",1 ([/о, 6]), т. е. для некоторого а>0 имеет место неравенство
Ж (х (•)) >а||х( •) ||^„	x{-)^Wn2A{[t0, /(]).
Действительно, выберем а столь малым, что, во-первых, Л(/) — а/> 0 (для всех Л]), а во-вторых, чтобы на полуинтервале (/о, Л] не было точек, сопряженных с точкой /о, У функционала J^(x(-)), получающегося из Ж(х(-)) заменой A(t) на A(t)— al. Применив’теорему 6 к функционалу Ж, получаем требуемое.
§ 6.4. Дискретные задачи оптимального управления
6.4.1. Формулировка задачи. Дискретные задачи оптимального управления (или задачи оптимального управления с дискретным временем) возникают при исследовании таких управляемых объектов, в которых изменение управляющего воздействия и изменение текущего состояния может производиться лишь в строго определенные изолированные моменты времени. Такого рода задачи часто возникают в приложениях. Например, многие задачи управления так называемыми импульсными автоматическими системами, многие задачи управления, возникающие в экономике и т. д., естественно формулируются как дискретные задачи оптимального управления»
§ 6.4. ДИСКРЕТНЫЕ ЗАДАЧИ
293.
Задача, которая будет рассматриваться в этом пара-графе, ставится следующим образом*):
N—\
3 (х, и) = s fi щ) -> inf;	(1)
i=0
xZ + l=<Pi(*i, ui)> Z = 0, 1, ..., N — 1,	(2)
^GE^czR', / = 0, 1, N — 1,	(3)
h0 (x0) = 0, hN (xN) = 0,	(4)
&(х()<0, Z=1.........N-l.	(5)
Допустимые элементы в задаче (1) — (5) суть пары конечных последовательностей х = (х0,	...» xN), и =
= (и0,..., uN-\), Xi е Rn, щ e Rr, удовлетворяющие условиям (2)-— (5).
Мы получим в этом параграфе необходимое условие экстремума в задаче (1) — (5), известное под названием дискретного принципа максимума, и опишем метод динамического программирования, дающий удобный вычислительный формализм решения таких задач, с одной стороны, и содержащий возможный подход к получению достаточных условий в теории оптимального управления, с другой.
На протяжении всего параграфа мы предполагаем, что
а)	выполнены следующие требования гладкости: функции fu / = 0, 1, ..N— 1, и git i = 1, ... , N— 1, и отображения ф,: Rn X Ui~>HN, h0: Ra-~>R5°, hx: Ra->Ry’ непрерывны по совокупности переменных и непрерывно дифференцируемы по х;
б)	при всех f = 0, 1, ..., N — 1, xeRn функция и—>^-(х, и) и отображение 1/->фг(х, и) удовлетворяют следующему условию выпуклости: если и е Uv^Ui и O^a^l, то найдется такое w^Ui, что
fi (х, ш) < afi (х, и) + (1 — a) ft (х, у),
ф,- (х, ш) = афг (х,. и) + (I — а) фг- (х, и).
*) Подчеркнём аналогию этой задачи с задачей оптимального управления с фазовыми ограничениями (см. задачу (1) — (5) в § 5.2).
294
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если условия гладкости не содержат в себе ничего неестественного, то второе условие — условие выпуклости — по крайней мере с первого взгляда кажется, наоборот, искусственным. Однако в приложениях оно нередко выполняется. Во-первых, оно автоматически выполняется в тех случаях, когда задача (1) — (5) получается в результате «дискретизации» обычной непрерывной задачи (этот факт следует из теоремы Ляпунова, которую мы докажем в гл. 8). С другой стороны, и во многих типично дискретных задачах, например возникающих в экономике, условие выпуклости также оказывается выполненным.
6.4.2. Дискретный принцип максимума. Нетрудно видеть, что благодаря условиям а) и б) задача (1) — (5) удовлетворяет всем требованиям, которые мы предъявляли к гладко-выпуклым задачам в теореме 3 из § 1.1. Последнее из отмеченных в этой теореме требований, связанное с конечной коразмерностью, в нашем случае выполняется автоматически, поскольку все пространства— конечномерные. Поэтому для вывода необходимых условий экстремума в задаче (1) — (5) можно использовать экстремальный принцип в гладко-выпуклых задачах.
Итак, пусть =(%*!, . ..,x*N),	(w*o, •. •,	—
точка локального экстремума в задаче (1) — (5). (В понятие локального экстремума вкладывается тот же смысл, что и в п. 1.1.3.) Напишем функцию Лагранжа задачи (1) —(5):
w-i	w-i
Z = ло 2 A Ut) + 2 (pi+1 l*i+i — Ф/ (Xh Ui)) 4-i=Q	i=0
N-l
+ (lo I Ao (*o)) + Un \^n (xn)) + 2 M'/g’z (*/). i=l
В соответствии с экстремальным принципом в гладковыпуклых задачах (теорема 3 § 1.1) существуют множители Лагранжа ^>0,	i = 1, ..., N, /0^ Rs°,
lx е RSl,	..., Рдг-i^O, не все равные нулю и
такие, что выполняются следующие соотношения:
§ 6.4. ДИСКРЕТНЫЕ ЗАДАЧИ
295
во-первых, условия локального минимума функции Лагранжа по х: дЗ?
дхо Х—Х,
WОх (Х*0’	^Ох (Х*0» и*о) Р\
“Ь ^0 (**) ^0 — О’
g7"| _ = Wix(**i’ u*i) “ Фи (x*i> u*i)p2 +
* 'X—X*
и—и*
+ Р1 + И1£Ж1) = О>
и	л с/	/	\
Д?	= Л0< N— 1, X (А1 ’ U»\)
OXN-l х=х, и—и*
^N-l, х (Х* ЛГ— 1» N-l) Pn “Ь
+ PjV-1	(Х* 2V—1) = О,
== Pyv 4“ hN = 0;
х=х* w=«*
dxN
во-вторых, условия минимума функции Лагранжа по и:
«н)-(РгЫх*Р «*/)) =
= mi« М (х»> и) ~(Pi | <Рг (x*p «)),	(7)
uie
/ = 0, 1, N — 1,
и, в-третьих, условия дополняющей нежесткости
=	.... ^-1.	(8)
Положим
Hi (x, и, p, Ao) = (Pi IФ; (xb u{)) — hofi (xh u{).
Тогда из (6) следует, что векторы pit ..., рм удовлет. воряют следующей рекуррентной системе соотношений:
_______(xti> u*l< Pi + l’ Ао) ____________ дх
Pig'iM
(9)
которая называется сопряженной системой. Положим, далее, p0 = H'Ox(xiQ, uiQ, plt^0). Тогда в силу первого
296
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
равенства в (6)
Po = /zo*(xJZo’	(10)
а согласно последнему равенству в (6)
Pn =	(11)
Наконец, равенство (7) можно переписать следующим образом:
U*i> Pi + v М=	и’ Pi + v Ао)- (12)
Итак, мы доказали следующий результат.
Теорема 1 (дискретный принцип максимума). Пусть пара х* = (х*0, ...» x*n), u* = (u*q,..., u*n-\) является точкой локального минимума в задаче (1) — (5). Тогда существуют числа Ло^О, Hi^O, ..., |xyv_I^0 и векторы pQ е R", ..., е R", Zo Rs°, l{ е Rs*, не равные одновременно нулю и такие, что
а)	последовательность (pN, Pn-ъ •••, Ро) является решением сопряженной системы (9), удовлетворяющим конечным условиям (10), (11);
б)	при всех i = 0, 1, ..., N—I выполнено условие максимума (12);
в)	числа |д.ь ..., p/v-i удовлетворяют условию дополняющей нежесткости (8).
Подчеркнем аналогию приведенной теоремы 1 и теоремы 1 из § 5.2, где был получен принцип максимума для задач с фазовыми ограничениями.
Дискретный принцип максимума вместе с условиями (2), (4), (5) содержит полную систему соотношений для определения искомых переменных Хо, ...» xNt и0, ... ..., tzjv_i и множителей Лагранжа pi, ..., pN_b ро, •••, Pn> lo, In- В самом деле, хг и Pi суть д-мерные векторы, Zo есть So-мерный и lN есть Sjv-мерный векторы, т. е. полный набор искомых величин содержит 2 (N + 1) п + Nr + п + So + sN параметров. С другой стороны, каждое из равенств (2) содержит п соотношений, условия (4)—So + sN соотношений, условия (5) — п соотношений; каждое уравнение сопряженной системы (9) содержит п соотношений, условия (10), (11) и (8) содержат тоже по п соотношений каждое и, наконец, каж
§ 6.4. ДИСКРЕТНЫЕ ЗАДАЧИ
297
дое из равенств (12) определяет, по существу, г соотношений, характеризующих точку, в которой функция Нг достигает максимума по и. б итоге получается 2(N + 1)и + Nr + п -|- So + sN соотношений, столько же, сколько и неизвестных.
6.4.3.	Метод динамического программирования. Для иллюстрации основной идеи этого метода рассмотрим упрощенный вариант задачи (1) — (5):
ЛГ-1
2 fi (xt, Ui)-^ inf;
(13)
*/+i =Ф/ (Xt, Щ], Z = 0, 1,	— 1,	(14)
щ «= Ut <= Rr, Z = 0, 1, .... N — 1,	(15)
Xo — заданная точка из Rn,	(16)
т. e. задачу без фазовых ограничений с закрепленным левым и свободным правым концом.
Наряду с задачей (13) — (16) рассмотрим семейство «возмущенных» задач, каждая из которых определяется номером & = О, 1, ..., N—1 и вектором xeRn:
N-1
2 fi (Xi, Ui) -> inf;	(13')
i=k
Xi+\ = 4>i(Xi, u{),	l = k, &4-1, ...» N — 1,	(14')
u(eI/(cR',	i = k, k+ 1, .... N — 1,	(15')
xk = x.	(16')
Нетрудно видеть, что задача (13) — (16) получается из задачи (13') — (16z), если положить k = 0, х = х0.
Обозначим через F^(x) значение задачи (13') — (16х), Тогда Fo(*o) — значение задачи (13) —(16).
Теорема 2. Функции Fk(x) являются решениями системы функциональных уравнений Веллмана
Fi(x)= inf (Ш«)^(фИм))), / = Af, ...,	(17)
и €= Ui
с конечными условиями
(18)
298
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если последовательности х = (х0, .. •, xN) и и = = (и0, ..., uN_i) допустимы в задаче (13) — (16) и
Pi (xi) — fi (Xi, Ui) + Pi + l (*i + l)	(19)
для всех i = 0, 1, ..., N— 1, то пара (x, и) является решением этой задачи.
Доказательство теоремы очень просто. Соотношения (17), (18) следуют прямо из определения функций Fk' p-i	1
Fk (^) ===	। .2 fi (.Xi, Ui) } X/1==ф/ (Xf, Ui)t Ui^Uiy Xk X
I i—k	J
f	f N-l
= inf \fk (x, uk) + inf j 5 fi (xi, иг)\ X/+t = I	I fe+i
= <fi(Xi,Ui), Ui^Ui, xft+1 = qp(x,	=
= inf (x, u) + Fk+t (qpft (x, u))\ut=Uk}. Второе утверждение тоже проверяется непосредственно: То (*о) = fo (хо, «о) + Fi (xt) = fQ (x0, «0) + fi (xb «0 + + F2(x2)== ... =fo(xo, Mo) + ••• + ftf-l (Xjv-1, Ujv-1) + A-l
+ Fn (xn) = 2 ft (xh Ut), i=0
откуда следует, что x= (хо, ..., x^), «=(«o, .... uN-i) — решение задачи (13) — (16). Теорема доказана.
Комментарий к гл. 6. К § 6.1. Более подробно о линейном программировании см. Гасс [1], Рокафеллар [14], Юдин и Гольштейн [1].
К §§ 6.2 и 6.3. В этих параграфах мы во многом следовали работе Хестенса [3]. К этой тематике естественно примыкает известная теорема Морса: индекс квадратичной формы классического вариационного исчисления равен числу сопряженных точек на отрезке [Ль ^11-
к § 6.4. Доказательство теоремы 1, близкое к приведенному, содержится в книге Пшеничного [4]. Подробное изложение теории оптимального управления дискретными объектами можно найти в книгах Болтянского [5] и Пропоя [2]. О методе динамического программирования см. книги Ариса [1], Беллмана [1], Беллмана и Калабы [1].
Глава 7
ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Эта глава занимает несколько особое положение в книге и по содержанию, и по стилю изложения. Это связано с причинами, о которых говорилось во введении, а именно с тем, что теория достаточных условий еще далеко не завершена. Поэтому главное внимание уделено здесь не доказательству теорем общего характера, а обсуждению на отдельных примерах основных понятий и способов получения достаточных условий. Эта программа проведена (правда, несколько фрагментарно) для гладких и выпуклых задач и частично для простейшей задачи классического вариационного исчисления. В этом последнем случае известные достаточные условия получаются в основном традиционными методами.
§ 7.1.	Метод возмущений
7.1.1.	Возмущения экстремальных задач. Пусть X и Z— некоторые множества, f0’ X —>R — функция на X, Cq — подмножество X. Рассмотрим экстремальную задачу:
fo(x) —> inf; xeeCq.	(1)
Включим задачу (1) в семейство экстремальных задач z)->inf;	хеС(г),	(2)
где f: XXX—>R, С (г)—многозначное отображение из Z в X. Предполагается, что для некоторого 20 выполнены равенства
f (х, zQ) = fo (х), С (z0) = Со.
При выполнении этих равенств задача (2) называется возмущением задачи (1), а множество Z, фигурирующее в постановке задачи (2), называется классом возмущений.
Нижняя грань в задаче (2) является функцией от г. Она обозначается далее 5(г) и называется S-функцией
300
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
возмущения задачи (1). В случае, если X — топологическое пространство, будут рассматриваться также и локальные S-функции, определенные в окрестности решения х* задачи (1):
8и(г) = inf f(x,z).
х с= С (г)П 17
Здесь U— некоторая окрестность точки х* в пространстве X. Такие функции будем называть S-функциями в точке х*.
Функцию ф(х), определенную на пространстве X, назовем К-функцией задачи (1) в точке х*, если она удовлетворяет таким условиям:
а)	В точке х* функции qp и f принимают одинаковые значения:
Дх,)==Ф(х.).
б)	Функция ф достигает своего минимума на множестве Со в точке х*:
ф(х)>ф(х„), хеСв.
в)	Разность f(x) н ф(х) неотрицательна на X:
f (х) — ф (х) >0, х е X,
или, что то же, она достигает на X своего абсолютного минимума в точке х*.
Наряду с глобальными /(-функциями, определенными выше, будут рассматриваться локальные К-функции, когда условие б) выполнено лишь для точек х из пересечения Со с некоторой окрестностью U точки х#, а условие в)—лишь для x<=U.
Предложение 1. Пусть для задачи (1) в точке х* построена некоторая К-функция (локальная К-функ-ция). Тогда точка х* является решением задачи (1.) (доставляет локальный минимум в задаче (!)).
Действительно,, в силу свойств а)—в) получаем, что если х е Со (х е Со A U), то
f (х) — f (xj > ф (х) — ф (xj > 0.
Легко понять, что если ф(х) есть /(-функция задачи (1) в точке х*, то она будет Л-функцией любого другого решения задачи (1). Поэтому ее естественно называть К-функцией задачи (1).
§7.1. МЕТОД ВОЗМУЩЕНИЙ
301.
Замечание. Мы получили, что наличие K-функции является достаточным условием минимума. Проблема состоит в том, чтобы доказать ее существование и указать способ ее построения. Некоторые общие приемы построения К-функций обсуждаются в дальнейших параграфах. В возможности построения К-функции находит свое отражение принцип снятия ограничений, о котором говорилось во введении.
7.1.2.	Стандартные возмущения и стандартные К-функции. Возмущение отдельной экстремальной задачи может быть осуществлено разными способами. Однако для задач, где ограничения задаются функционально, существует стандартная процедура возмущения. Пусть А — некоторое множество (обычно это подмножество линейного пространства X), Y — линейное пространство. Рассмотрим задачу
/0(x)->inf; F(x) — 0, fj(x)^O, 1^/^п, хеЛ. (Г)
Здесь 4->R,	Р- A-+Y.
Стандартным возмущением задачи (!') будем называть такой класс задач:
fo (х) -> inf; F (х) — у = 0,	(х) — щ < 0,
i = 1, ..., п, ХЕ А.	(2')
Стандартное возмущение не затрагивает функционал /о(х); класс возмущений Z есть прямое произведение УХИ”.
Перейдем к конкретным классам экстремальных задач.
Гладкие задачи с ограничениями типа равенств. Так в п. 1.1.1 были названы задачи вида
f(x)->inf; F(x) = 0,	(3)
где X и Y — банаховы пространства, F: X —► У, f и F принадлежат классу в некоторой области U cz X.
Стандартное возмущение задачи (3) имеет вид .
f (х) —> inf;	F(x) — y = 0.	(3')
Значит, S-функция этого возмущения определяется так: S(y) = inf {f (х)| F(x) = у}.
Стандартной К-функцией задачи (3) будем называть /(-функцию, вида
Ф (х) = (ф ° F) (х), ф: Y -> R.	(4)
302
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Из (4) следует, что на ограничении Со = {xeX|F(x) = = 0} функция ф(х) постоянна, и значит, требование б) в определении K-функции выполнено всегда. Следовательно, для того чтобы функция вида (4) была /(-функцией (локальной К-функцией) задачи (3), необходимо и достаточно, чтобы выполнялись соотношения: ф(0) = = f(x) — ф(*)> 0, хеДхе t/).
Выпуклые задачи. Пусть X и Y — локально выпуклые пространства. Задачу (Г) будем называть выпуклой, если все функции 0 i п, и множество ЛсгХ являются выпуклыми, а ограничение типа равенств задается аффинным соотношением F(x) —Хх + у0, Ае2’(Х, У). (В гл. 1 при рассмотрении выпуклых задач соотношения типа равенств отсутствовали.)
Стандартной К-функцией выпуклой задачи назовем К-функцию вида п
Ф (х) = — {у', F (х)> — s Ufi W + fo (х,),	(5)
i=l
где
Az>0, W/(x,) = 0,	(5')
Из соотношений (5) и (5Z) следует, что на ограничении Со = {х е A |F(x) = 0, A(x)^0, функция ф(х)— — /о(х*) является неотрицательной, а вследствие (5') получаем, что ф(х*) = fo(x*). Таким образом, для функции ф(х), определенной соотношениями (5) и (5Z), требования а) и б) в определении К-функций всегда выполнены. Значит, для того чтобы функция ф(х) вида (5), (5Z) была К-функцией выпуклой задачи, необходимо и достаточно, чтобы было выполнено неравенство:
f (х) — ф(х) ^о,	хе Л.
Задачи вариационного исчисления и оптимального управления. Пусть
У (х( • )> и (•)) = J f (/, х, и)
to
X = ф (t, X, и), X (/0) = Xq, X (tl) = Xj,
U^U
(6)
§ 7.1. МЕТОД ВОЗМУЩЕНИЙ
303
— задача оптимального управления с закрепленными граничными условиями. Рассмотрим отрезок [/о, /[], со-держащий отрезок [/0, /1] внутри себя. Включим задачу (6) в семейство таких задач:
3 (х (•), и (•), т) = j f (/, х, и) dt-> inf; х = ф(/, х, и), х(/0) = х0, х(т) = £,
(7)
При этом вектор-функции х(/) и u(t) считаем определенными на [/6, ^1]. Возмущение (7) назовем стандартным возмущением задачи (6). Нижняя грань в последней задаче является функцией (т, £). В вариационном исчислении ее чаще всего называют функцией действия или эйконалом, в оптимальном управлении ее называют функцией Беллмана.
Стандартной К-функцией задачи (6) в точке (х*(-), и*(-)) будем называть Л-функцию следующего вида:
O(x(.),u(-)) = J(x.(.), «.(•)) +
+ g(fo, х0)— g(tu Х1).	(8)
Без ограничения общности можно всегда полагать
*i) = g(to, Хо) = 0. Если (х( •), и( •)) — допустимая пара в задаче (6), то легко видеть, что
т. е. свойства а) и б) в определении /(-функции выполняются. Для того чтобы функция Ф(х( •),«(•)) вида (8) была /(-функцией, достаточно, чтобы неравенство
Г //	\	dg (/, х) ( dg (t, х) I ,, Л
f (/, X, и)----------—Q-x— | ф (/, X, и)) —
(/),«.(/))> О (9)
было верно для всех (/, х) и и е U и чтобы оно обращалось в равенство, если х = х^(/), u = u*(t).
304
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Аналогично можно написать условие для локальной /(-функции. Это условие состоит в том, чтобы неравенство (9) имело место для (/, х) из некоторой окрестности V cz R X Rn, в которой лежат точки (/, х*(/)).
Предложение 1, несмотря на всю свою простоту, открывает возможность для разного рода эвристических способов построения /(-функций и тем самым для получения достаточных условий. Покажем это на примере. Рассмотрим простейший квадратичный функционал вариационного исчисления
ЛГ(х(-)) = j (4 (Z) х2 + В (О X2) dt
*0
и задачу о его минимизации при нулевых граничных условиях. Будем искать /(-функцию в точке х*(/)^ 0 в виде (8), где функция g квадратична по х:
g(t,x) = — D (t) х*.
Тогда для того чтобы было выполнено неравенство (9), надо, чтобы для всех х, х и t е [Zo, ZJ выполнялось соотношение
A (t) х2 + 2D (0 хх + Ф (0 + В (0) х2 0.
При фиксированном t — это квадратичная форма по х и х. Для того чтобы она была неотрицательна, необходимо и достаточно, чтобы были выполнены неравенства
Л(0>0, Л (/) (D (/) + В (/)) -D2(/)>0.	(10)
Предположим, что выполнены усиленные условия Лежандра и Якоби (см. §§ 2.2 и 6.3). Это означает, во-первых, что Л (/) > 0, /е[^о, Ч и, во-вторых, что существует решение u0(t) уравнения Эйлера — Якоби
--^-(4(0й) + В(0« = 0.	(11)
не обращающееся в нуль на всем отрезке [Zo, Л]. Удовлетворим соотношениям (10), обратив второе неравенство в равенство, т. е. решив дифференциальное уравнение Риккатти:
Р + В-В2/Л = 0.	(12)
Уравнению (12) удовлетворяет, как это легко проверить непосредственной подстановкой с использованием (11), функция DQ(t) — —A(t)uo(t)luo(t). Итак, снова доказан результат, полученный в более общей ситуации (в теореме 6 из § 6.3): для неотрицательности квадратичной формы 3?(х(-)) в пространстве W2 j ([ZQ,/J) достаточно, чтобы были выполнены усиленные условия Лежандра и Якоби.
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
305
§ 7.2. Гладкие задачи
Этот параграф тематически примыкает к § 1.2. Гладкие задачи здесь рассматриваются лишь при условии регулярности отображения F. Оказывается, что в этом случае для решения х* можно найти локальную /(-функцию, удовлетворяющую условию Липшица и сколь угодно близкую к дифференцируемой. Если же наложить еще более жесткие требования на отображение Г, то окажется, что сама S-функция в точке х* является дифференцируемой.
7.2.1. Необходимое и достаточное условие минимума.
Теорема 1. Пусть точка х* допустима в задаче
f (х) ->inf;	f(x) = 0,	(1)
и при этом функция f и отображение F: X-+Y принадлежат классу Сх в точке х*. Предположим также, что выполнено условие регулярности отображения F в точке х*. Тогда для того чтобы в точке х* достигался локальный минимум в задаче (1), необходимо и достаточно, чтобы нашелся такой элемент у* е У*, что для всякого у > 0 функция
Ф¥(х) = (Ф¥°Я(х) = -(Г. Р(х)>-УИ(х)|| + Цх.) (2)
была бы локальной К-функцией задачи (1).
Поясним сказанное. В теореме 1 утверждается: для того, чтобы в точке х* достигался локальный минимум, необходимо и достаточно существование такого элемента £/*еУ*, что для любого у>0 можно подобрать 6 = б (у) > 0, при котором функция
Фу W = f W — Фу (х) = f(x)— f (Х,) + (у*, F (х)> +
+ уИ(х)||=<?(х, у\ 1) + YII F (х) || - f (х.)	(3)
достигает в шаре	минимума в точке х,:
Ф7 (х) > Фу (х.) = 0,	|| х— xj|<6.	(4)
Доказательство. Достаточность следует из предложения 1 § 7.1. Докажем необходимость. По условию х* — точка локального минимума в задаче (1). В силу правила множителей Лагранжа (теорема 1 § 1.1)
306
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
найдется множитель Лагранжа у* е Y такой, что
Г(х.) + Г*(х.)^ = 0.	(5)
Положим g(x) — f(x)— f(x*)+(y*, F(x)). В силу (5) получаем g(x«) — g'(x*) = 0. Применим к отображению f(x) теорему Люстерника из § 0.2. В соответствии с ней найдется окрестность V точки х», константа & > 0 и отображение х—>£(х) окрестности V в X такие, что
F(x + z(x)) = F(xJ = 0,	|| z (х) || < k || F (х) ||.	(6)
Найдем е > 0 так, чтобы при выполнении неравенства ||х— х*|| < е имели бы место соотношения:
а) х е V, б) f (х) — f (xj > 0, если F (х) = 0,1
в) II g'WII <	(
Соотношению (76) можно удовлетворить потому, что х*— это точка локального минимума, соотношению (7в) — в силу непрерывности g'(х) в точке х*. Наконец, найдем 0 < б < е/2 так, чтобы при ||х— х*|||< б было выполнено неравенство ||F(x) || <	Тогда из-за
(6) при ||х — xj| < б получим:
||г(х)||<^И(х)||<е/2,	1
l|x + z(x)-xj|<||x-xj| + ||z(x)||<8. /	(8)
Используя (76), (8) и (6), получаем неравенство
g (х + z (х)) = f (х + z (х)) — f (х.) 4-	F(x-\-z (х))> > 0.
Из него в силу (6), теоремы о среднем и (7в) будем иметь:
g (х) > g (х) — g (х + z (х))>
> —sup {II g'(£) |||£<=[х, x + z(x)]} II z (х) ||>
^ — yk~l-k\\F(x) || = - у || F (х) ||.
Остается положить Фу(х) = g(x) + yll^W II, и нужные соотношения (3) и (4) будут выполнены. Теорема доказана.
Следствие (необходимое условие минимума в терминах второй производной). Пусть в дополнение к требованиям теоремы 1 функция f и отображение F
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
307
принадлежат классу С2 в точке х*. Тогда для того чтобы точка х* была точкой локального минимума в задаче (1), необходимо, чтобы для любого вектора g из ядра отображения F'(x*) было выполнено неравенство
&хх(х.,у*, l)(U)>0.	(9)
Функция 3? в (9)—это функция Лагранжа задачи (1) = f (х) + {у*, F (х)), а у*— множитель Лагранжа из теоремы 1.
Действительно, пусть je KerF'fxJ, |||||= 1, но при этом 3? хх (л,, у*, !)(£,£) =— а < 0. Выберем у>0 так, чтобы у11^"(х.) Q, Ю 11<а/6, и найдем 6>0 так, чтобы из неравенства ||х||<6 следовали соотношения | F (х. + х) - F (х,) - F' (х.) х - ± F" (х.) (х, х) || <	,
||^К + х, .)-^(х., -)-{3?х{х*, .),х)~
-	.)(Х,Х)|<^-.
Тогда для функции Фу(х), определенной в (3), получим: фУ(х.+®	(х„ •)а.ю+4- +
+ Nt2 IIF" (х.) (g, g) || 4- 4- < ~	= 0,
что противоречит теореме 1.
7.2.2.	Достаточное условие минимума в терминах второй производной.
Предложение I. Пусть выполнены условия следствия из теоремы 1. Предположим далее, что для некоторого множителя Лагранжа у* е У* верны соотношения'.
3?х(х*,у*, 1) = 0,	1
3?хх (*., у, 1) & в) > аП II2, & G= Ker F' (х.) (а > 0)./ (10)
Тогда точка х# доставляет локальный минимум в задаче (1).
Замечание. Условие (10) означает, что подпространство Li = Кег/7'(х*) гомеоморфно гильбертову пространству* Действительно, для 11, ^2 е положим:
(11\Ы=Яхх(х„ у*, 1) (lb h).
308
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Билинейность и симметрия выражения (£i | сразу следуют из определения второй производной. В силу же строгой положительности этой формы получается невырожденность скалярного произве-
дения:
Из неравенств
(& I &)>0,	^0.
Ш12
следует, что подпространство гомеоморфно гильбертову.
Доказательство предложения 1. Снова, как и при доказательстве теоремы 1, применим к отображению F(x) теорему Люстерника из § 0.2. Пусть z (%) — отображение из этой теоремы, удовлетворяющее соотношениям (6). Из этих соотношений ясно, что если В(х) = 0, то г(х) — 0. Для доказательства нашего предложения достаточно проверить, что функция
ф (х) = f (х.) — {y',F (х)> — II z (х) II
является локальной /(-функцией задачи. В силу сказанного выше видно, что ф(х*) = /(х*) и на ограничении задачи функция ср(х) является константой. Значит, требования а) и б) в определении /(-функции выполнены. Осталось показать, что существует 6 > 0 такое, что при ||х— xj|<6 выполнено неравенство f(x) — qp(x):>>0. Положим, как и в теореме 1, g(x) = j?(x,//*, 1) —f(x*). Тогда ясно, что g (хД = 0, g' (хД = 0, g" (хД = = 2MW, О, И*)—=	+ Их)11.
Лемма. Для всякого s > 0 можно указать такое 61 > 0, что если ||£ —xj|<6i, F(£) = 0, то найдется вектор ц е X, по норме не больший е||£— х*|| и такой, что £ — х* — п е Ker F' (хД.
Действительно, по теореме Банаха об открытом отображении найдется константа г > 0 такая, что
F'(xJBx(0, 1)=эВг(0, г),	(И)
где Вх(0,1) и Ву(0, г) — замкнутые шары в X и Y с центром в нуле и радиусами 1 и г соответственно. Возьмем 61 > 0 так, чтобы при ||£ — xj| < 61 выполнялось соотношение:
IIF (С) - F (хД - F' (хД (£ - хД II < er || £ - х* ||.
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
309
Тогда, если F(£) = 0, то
к' (X.) ((С - X.) II с - Х.1Г’ 8"1) | < Г.
В силу (11) найдется вектор f] такой, что	и
F' (х) fi = F' (х.) (g - х.) (|| g - х. || е)"1.	(12)
Положим n = eIIC —xjlfj. Тогда из (12) следует, что F'(x,)i\ = F' (x,)fc — xt), т. е. ? — х, — t]e KerF'(xJ, и с другой стороны, HnlKellg — х,||. Лемма доказана.
Возвратимся к доказательству предложения 1. Выберем е > 0 так, чтобы выполнялось неравенство
а(1 — е)2 —2Се(1 4-е)—Се2 —е>0.	(13)
Здесь а — константа, фигурирующая в формулировке предложения, а С = || g" (х„) ||. По данному в>0 найдем б] > 0 так, чтобы при этом dt было выполнено утверждение леммы, а кроме того, оказались верными неравенства
н/а)и<1,
| g (?)—g ю—<g' w. (? - xj)—
- 4 g" (x.) (I - X,, g - X.) | < 4 H - x, II2
при £eB(xt, Всего этого можно добиться при наших предположениях относительно гладкости f (х) и F (х). Наконец, по 6j найдем 6 > 0 так, чтобы из того, что хеВ(х06), следовало бы неравенство
IIX 4- z (х) II < б,.
Обозначив х 4-z (х) = £ и используя теорему о среднем и соотношения (10) и (13), получим:
f (х) — <р (х) = g (х) 4- II z (х) II = g (х) — g (х 4- z (х)) 4-
+ g (?) + II z (х) II > - sup (II g’ (g) III g e В (x„ 6,)} II z (x) II4-
+ II z (X) II4- g (X.) 4- <g' (X.), ? - X.) 4-
+4 S" (x.) (? - x., $ - x.)	1| $ - x. II2 >
>4 g" W (C -x., ? - x.) -|||? -хжII2.
310
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Возьмем теперь вектор ц из леммы:
IIп 11=0IIЛ с— X, — ne KerF'(xJ.
Тогда
(l-e)||S-xJ|<||C-x.-nll<(l+e)||C-x.||.
Воспользуемся тождеством
В (х, + х2, Xi + х2) = В (хь х^ + 2В (хн х2) + В (х2, х2) для квадратичной формы В (х1; х2) = g" (xj (х,, х2). Мы получим:
у g" (х,) (; - X., С - X.) - | II g - X. II2 =
= yg"W (? — х,— n + n, z— X, — n + il)-ylR-*, IF> >y (a(l - e)2 - 2C (1 + 8) e - Се2 —e)|| g - x. ||2 > 0.
Предложение 1 доказано.
7.2.3.	Построение S-функции для гладких задач. Рас-смотрим гладкую задачу (1) и ее стандартное возмущение
f (х) -> inf; F (х) — у = 0.
Через S(y) обозначим S-функцию этого возмущения в точке х*, т. е. локальную 5-функцию.
Теорема 2. Пусть функция f(х) и отображение F(x) принадлежат классу С2 в некоторой окрестности V точки х* и F(x*) = 0. Пусть далее:
а)	отображение F(x) регулярно в точке х«,
б)	существует множитель Лагранжа y*^Y* такой, что
^(хл’,1) = 0,	(14)
в)	вторая производная функции Лагранжа строго положительна на ядре оператора F'(x*):
3?хх(х,,у*, 1)О><Ж geKerF(x.) (a > 0). (15)
Тогда существует окрестность U начала координат в пространстве У, отображение у-*(х(у),у*(у)) этой
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
311
области в X\Y* класса С\ в U такие, что
X (0) = xt,	у* (0) = у,
3?х(х(у),у'(у), 1) = о, ^у(х(у), у'(у), 1)=у. .
(16)
При этом S(y) = f(x(y)) и функция S(y) принадлежит классу Сх в U.
Доказательство. Обозначим произведение X X через Z, а произведение X* X ¥— через W. Элементы Z суть пары z = (%,#*), элементы W— пары w = (х*,г/). Определим отображение W: ZXW-+W формулой
Т (z, w) — Т ((х, у*), (х‘, у)) =
= (&х (X, у‘, 1) — х‘, З’у. (х, у", 1) — у) =
= (f (*) + Р(х) у* — х', F (х) — у\
В силу требований относительно гладкости, приведенных в теореме, функция Т является непрерывно дифференцируемой в окрестности точки (г, 0), где z = = (х*, у*). Покажем, что отображение Т удовлетворяет требованиям теоремы о неявной функции (см. п. 0.2.3). Действительно, согласно (14) имеем:
Т (z, 0) = (<?х (х., у, 1), F (х.)) = (0, 0).	(17)
Применив теорему Шварца (см. п. 0.2.3), получим:
Wz ((z, и>)) (х, /) = Тх ((г, да)) х +	((г, да)) у'.
Продифференцируем отображение Т по х и у* в точке (г, 0):
Тх ((г, 0)) х = (9?хх (х„ у, 1) х, (х„, у’, 1) х), 1
'Ру- ((г, 0)) у* = (^Ху. (х„ у\ 1) у\ 0).	J (18)
Нам надлежит показать, что отображение
(х, у') Тх ((z, 0)) х + Ту. ((z, 0)) у'
является гомеоморфизмом пространств Z и W. Вследствие теоремы Банаха об обратном операторе (п. 0.1.4)
312
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
достаточно проверить, что это отображение регулярно и взаимно однозначно. Сначала проверим взаимную однозначность. Пусть
'Гг((г, 0))г] = ^((2, О))^, zi = (xi,y*^, i=l, 2.
Тогда в силу (18) получится, что
(*., у, 1) (Х| — х2) = F' (х.) (Х| — х2) = О,
т. е. х,—x2eKerF'(x,) и, кроме того,
1)(х,-х2) + ^хг/, (х., у\ 1)(^ —^) = 0.
Выражение в левой части последнего равенства — это линейный функционал на X. Подействуем цм на элемент х{—х2 и воспользуемся условием в) теоремы. Получим:
О = S3хх (х*, у , 1) (Xj х2, х1 х2) -|-хх-х2}=
= 2\Лх*,У*, О (Хц — х2, Xiх2)>а||х1— х2||2.
Из последнего неравенства следует, что х{ =х2 и, кроме того, у\ — у I е Ker F'* (xj. Следовательно, для любого х е X выполнено равенство
<£'• (х.)	- у2), х) =	- у2, F' (х.) х) = 0.
Из регулярности F' (xj (требование а) теоремы) отсюда вытекает, что у*1 = у*г Взаимная однозначность доказана. Покажем теперь, что отображение Ф2((г, 0)) регулярно. Для этого надо решить систему уравнений
ЗТххК, у, 1)х + ^х^(х„ у*, 1)/ = х‘,
у*X (х„ у , 1) X = F' (X.) X = у.
Вследствие регулярности отображения F в точке х*, существует элемент х такой, что F'(x*)x = y. Остается подобрать элементы g^Ker F' (х#) и rj* s Y* так, чтобы
&хх (X., У*. 1) I + S?xy* у', 1) Tf - Г, (19)
где £* = х* — SFxx(xt, у*, 1)х. Выражение х), хе eKerF'(x.) представляет собой линейный функционал
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
313
на подпространстве Ker F' (х*). Подпространство Кег/7'(х*) гомеоморфно гильбертову пространству (см. замечание к предложению 1), где в качестве скалярного произведения (х|у) взято выражение
&хх (*., у, 1) (х, у), X, у g= Ker F' (х,).
По теореме об общем виде линейного функционала в гильбертовом пространстве, найдется элемент £ такой, что
у. па,%)=<г,х).
Но это означает, что линейный функционал S?xx(x*, У*, 1)£ — Г принадлежит (Ker F(x*))-1-. В силу леммы об аннуляторе (п. 0.1.4) существует такой элемент Г)*, что
3?xx(x.,y', l)g-r = F'-(x.)<
Мы получили, что элементы £ и —т]* удовлетворяют нужному соотношению (19). Регулярность отображения доказана.
Итак, доказано, что отображение ^(z, w) удовлетворяет всем требованиям теоремы о неявной функции. Применив эту теорему, получим, что существует отображение w->a(w), а(0) = z такое, что ^(а^),	=0.
В частности, положим (х(у), у* (у)) — а(0, у). Тогда мы приходим к соотношениям (16). При этом в силу теоремы о неявной функции отображения х(у) и у* (у) принадлежат классу С\ в окрестности точки х*. Соотношения (16) означают, что в точке х(у) выполнено правило множителей Лагранжа для задачи
f(x)—>inf; F(x)-# = 0.	(20)
Ввиду того, что в малой окрестности точки х* строгая положительность квадратичной формы ^хх(х(у),у* (у), 1) на ядре оператора F'(x(y)) сохраняется в силу предложения 1, в точке х(у) выполнено достаточное условие минимума для задачи (20). Следовательно, f(x(y)) = S(y). Теорема доказана.
Построенное отображение у->х(у) естественно назвать полем экстремалей. Мы получили, что задача (1)
314
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
равносильна безусловной минимизации функции f(x)-f-+ (£*. F(x)) 4-(i|>oF) (х), где у* = —S'(F(x*)), а
(У) = - (S (у) - S (0) - (S' (0) ,уУ).
Именно этот результат обсуждался во введении, когда речь шла о достаточных условиях.
§ 7.3. Выпуклые задачи
Пусть задана экстремальная задача
f(x)->inf; хеС.	(1)
Предположим, что возмущенную задачу
f (х, z) -> inf; х е С (г)	(2)
удалось построить таким образом, что
а)	класс возмущений Z — отделимое локально выпуклое пространство;
б)	f(x, O) = f(x), С(0) = С;
в)	S-функция S(z) выпукла.
Обозначим через С~х(х) многозначное отображение, обратное С, т. е.
С”"1 (х) = {z е Z | х е С (г)}.
Теорема 1. Пусть выполнены условия а) — в). Если dS(O)#=0 и г* е<3S(0), то точка х*еСе том и только том случае является решением задачи (1), когда функция
ф W = f (х) + f(xt) + sup (<z‘, г) — f (x, z)) геС"1 (x)
есть К-функция задачи (1) в точке х*.
Доказательство. Если <р(х) есть /(-функция задачи (1) в точке х#, то х* — ее решение в силу предложения 1 из § 7.1. Пусть теперь х* — решение задачи (1), т. е. f (xj = S(0). Обозначим для краткости
ф (х) = sup «г’, z> — f (x, z)).
zeC-1 W
Тогда
S* (z‘) — sup ((z‘, z) — inf f (x, z)) =
Z	XG=C(z)
— sup sup (<z\ z) — f (x, z)) = sup ф (x).
x z^C~l(x)	x
§ 7.3. ВЫПУКЛЫЕ ЗАДАЧИ
315
Поскольку z* е dS (0),
S (0) = — S‘ (z.) — — sup ф (x). X Поэтому
- 5 (0) = - f (x.) = (z*. 0) - f (x„ 0)< t (x.) < - S (0),
t. e. ф (x*) = — 5 (0) и, значит,
<P(x.) = f(x.) + S(0)-S(0) = f(x.),
Далее, f (x) f (xj для всякого хеС. Поэтому
Ф (*) > f (х,) + f (х) + <z\ 0) — f (х, 0) > f (х.) = ф (х,).
Наконец, для произвольного х
Ф (х) — f (х) = f (х.) + 4? (х) <5 (0) + sup ф (х) = 0. X
Теорема доказана.
Таким образом, при выполнении условий а) — в) проблема построения A-функции сводится, по существу, к отысканию субградиентов S-функции в нуле, т. е. к решению задачи
— S*(z*)-> sup.	(3)
Эта задача называется двойственной с задачей (I) (относительно выбранного класса возмущений), а исходная задача (I) часто называется прямой. В рассмотренном случае значения прямой и двойственной задач совпадают. Последний результат, очевидно, не связан с фактором существования решения в задаче (1) и (при выполнении условий а) — в)) справедлив, когда S-функция S(z) замкнута в нуле.
Все сказанное становится особенно наглядным в том случае, когда задача (1) имеет вид
fo(x)->inf; F(x) = 0, f/(x)^O, i=l, /I, хе Л, (4) и рассматривается вместе со стандартными возмущениями:
f0(x)->inf; F(x) = y, fi(x)^«i> /=1, л, х е А. (5)
При этом, разумеется, предполагается, что F есть отображение в отделимое локально выпуклое пространство У. В этом случае S-функция S(yf а) определена на произведении У X R” (a = («i, .««))•
316
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Предложение 1. Если вектор (у*, Ь) (у" е Y*,-b = (Pi, ..., рп)) принадлежит dom S*, то Р^О, i = 1, ..., п. Если же Pt ^0, i == 1, ..., п, то
(п	\
</, 74*))+	•
1=1	/
Доказательство. По определению имеем
S* (у', b) = sup ((/, у} 4- (ь | а) — S (у, а)) =
(У, а)
= sup((z/‘,y)+(b |a)—inf {f0(x) \xt=A,F(x)=y, ft (x)<aj)= (//. a)
= sup (sup{{y*, y') + (b\a)\y = F(x), az > ft (x)} — f0(x)) = x <= A
= sup [«//•, F (x)> — fo (x)) 4- sup {(b | a) | a,- > ft (x)}]. x <= A
Если (i/‘, b) e dom S*, то для любого x вторая верхняя грань меньше оо. Если же одна из компонент вектора Ь, скажем рь положительна, то, выбрав хеЛ и а так, чтобы aii^fi(x), и положив d = (l, 0........0), получим,
что аг + 7ctf ft (х) для всякого t > 0 и (b, а + ta) -> оо при t->oo. Но это означает, что S(y*, b) = oo, в противоречии с выбором (у*, Ь).
Допустим теперь, что Р,0, 1=1, .... п. Тогда, очевидно, п
sup {(6 | а) | Ui > fi (х)} = Ц Pifi (х), 1=1
откуда и следует нужное равенство.
Предположим теперь, что задача (5) удовлетворяет условиям а) —в). Тогда, если (у*, b) е д£(0,0), то в силу теоремы 1 функция п
Ф (X) = s (0, 0) + {у*, F (х)> + 2 Pifi (X) 1=1
будет /(-функцией задачи (1) в любой точке х*, являющейся ее решением. Это значит, в частности, что функция
п	’
fo (х) — {у\ F (х)) — 2! Pifi (х)
1=1
§ 7.3. ВЫПУКЛЫЕ ЗАДАЧИ
317
достигает минимума по х на множестве А во всякой точке х*, являющейся решением задачи (1). В итоге мы получаем следующий результат.
Теорема 1' (теорема двойственности). Предположим, что S-функция S(y,a) задачи (5) выпукла и замкнута в нуле. Тогда значения прямой и двойственной задач равны, множество решений двойственной задачи совпадает с dS(0, 0) и, если dS(Q, 0) =Н= 0, то значения обеих задач совпадают со значением задачи
fo(x) — S₽ifiW— </, р (х)>—>inf; хе Л, Z=1
где (у*,Ь) — произвольный элемент множества <55(0, 0).
Для выпуклых задач этот результат можно еще более конкретизировать, поскольку там существуют простые критерии для соотношения д£(0, 0) #= 0, именно, — условие Слейтера. Предположим, что в задаче (1) F— аффинный оператор, функции f0, ...» fn выпуклы и А — выпуклое множество.
Предложение 2. Пусть в задаче (1) F— непрерывное аффинное отображение в Rm, функции fQ, ..., непрерывны и выпуклы. Тогда, если значение задачи (1) конечно и выполнено условие Слейтера'. 0 g ri F(A) а fi(x)<ZO, *= 1, а, для некоторого х^А, для которого F (х) = 0, то S (у, а) — выпуклая функция и (55(0,0)=^ 0.
Доказательство. Выпуклость функции S очевидна. Докажем, чта д£(0, 0)^0. Для этого достаточно проверить, что (0, 0) е ri dom S, и воспользовавшись тем, что |S(0, 0) | < оо по условию, применить предложение 4 из § 4.2. В самом деле, пусть (у, а) е dom S. Тогда, поскольку 0eriF(4), найдется ц > 0 такое, что У1 = —[iy е F(A), т. е. yi = F(xi) для некоторого х^Л. Имеем при 0	1
fi + (1 - А) х) <	(х,) + (1 - A) h (х),
и так как Д- (х) < 0, найдется > 0 такое, что
fitful + (1 — Я,э)х)< — A'oP'Gz, Z=l,
Положим
x2=Z0x1 + (1 — Я.0)х, у2 = — Wy, а2 = — Аоца.
318
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Тогда /?(х2) = ^2,	т. е. (у2, a2)edomS. Это
значит, что начало координат есть внутренняя точка отрезка, содержащего точки (y2l а2) и (у, а) и целиком лежащего в domS. Поскольку (у, а)—произвольная точка множества dom S, отсюда следует, что (0,0) е е ri dom S. Предложение доказано.
Комбинируя этот результат с теоремой 1, легко можно получить теорему Куна — Таккера и ее обобщения, которые рассматривались в гл. 1.
§ 7.4. Достаточные условия экстремума в классическом вариационном исчислении
Достаточные условия будут обсуждаться на примере простейшей векторной задачи:
ti
3 (х (•)) = J L (t, х, х) dt inf;
x(t0) = XQi x(tl)=Xl.
7.4.1. Условия слабого экстремума.
Предложение 1. Если интегрант L в (1) есть функция класса С2 в области U cz R X R” X Rn, содержащей точки (/, хДО,	е С? (№), ^i])> то функ-
ционал (х (•)) является дважды дифференцируемым по Фреиле в пространстве Ci ([/о, М) 6 окрестности точки хД •) и его первая и вторая производные имеют вид
3' (х. (• ))х (•) = / ((р (0 |х (0) + (<7 (0 |х (0)) dt,
*9
/1
3"' (х. (•))(*(• ),*(•))= J ((Л (/) х (/) IX (/)) +
^0
+ 2 (С (0 X (0 IX (/)) + (В (0 X (0 | X (0)) dt, где
P (t) — Lx 1^ (Z),	q (t) — Lx
Д (t) == Lxx (/),	В (t) = LXx ix< (f),
2C (t) = (Lxx + LXx) (t) — 2Lxx |Xa (/) = 2LXx 1Лф (ty
(2)
(3)
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
319
При этом для всякого 8 > 0 можно найти б > О так, что если х (•) е £0» т. е. если х (/0) = х (/J = 0, и || х (•) ||j < 6, то остаточный член
г(х(‘)) = ^(хЛ.) + х(.))-^(х#(.))-
- 5"(х. (• ))х( •) -72^'fo (•)) (х( •), х( •))
допускает оценку
|r(x(-))Ke||x(-)||L w2,
Доказательство. Однократная дифференцируемость по Фреше функционала У (х( •)) была установлена нами в п. 0.2.5 (пример 8). Положив
Ф (*) = 3 (х. (•) + Ах (•)),
по теореме о среднем, получим:
Ф (1) = У (хД•) + х(•)) = Ф (0) + ф' (0) + 72ф" (0), О<0< 1, или
(А-Д •) + %(• )) = 5<(хД-)) +5<'к(-))х(.) +
+ у / (Иех I*) + 2 (.С^х |х) 4- (В0х |х)) dt; t,
здесь Ав, Вв и С6 имеют 'вид (3), где вектор-функция xt(t) заменена на х, (0 + 0х(0.
Следовательно, Э"'(х*(-)) имеет вид (2) и
it
r(x(.))=4 j (((Де-Д)х|х) + 2((Се-С)х|х) +
+ ((Be-B)x\x))dt. (4)
В силу непрерывности вторых производных инте-гранта L в области U можно, задавшись 81 > 0, найти такое б > 0, что при l|x(-)lli<6 получаются неравенства:
\\CQ(t)-C(t)W<Rl, v/e[Mi]
320
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
и, следовательно,
ti
\r(x(-))\^ |((х|х) + 2|(х|х)| + (х|х))Л.	(5)
to
Воспользуемся теперь тем, что если х(-)е£0, то !
t
х (/) = | х (т) dx
to
и, следовательно, в силу неравенства Коши — Буняков-ского
/	\’/2
|x(0|</0-J J (х(0|х(0)Л) , Vo	/
откуда вытекает, что
11
f (х (0 |х (0) dt < Ci ( max | х (0 |)2 < С|| х (•) ||2 .
*	*2,1
Го
Если к этому прибавить неравенство . |(x|x)K(x|x) + Ul^ ,
то сразу получается оценка (если положить (1 + Q 8t = е)
I г(х( )) |<е, J ((х(0|х(0) + (х(0|х(0))^<
<(1 4-С)е,||х(-)||^ = е||х(-)||2	,
w2, 1	*2, 1
которую и требовалось доказать.
Уравнение Эйлера для второй производной
•))(*(•), х(-)), т- е- Уравнение
- Л- (Ах 4- С*х) + Сх + Вх = 0,	(6)
где Л, В и С имеют вид (3), называется уравнением Якоби задачи (1).
Теорема 1. Для того чтобы допустимая экстремаль %*(•) задачи (1) доставляла слабый локальный минимум в этой задаче, необходимо (в предположениях о
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
32 i
гладкости интегранта L из предложения 1), чтобы было выполнено условие Лежандра:
Lxx = Д (0 0, t е [Zo, z 3.
Если же на экстремали х*(/) выполнено усиленное условие Лежандра, т. е. если
Л-к(/) = Л^>0’
то для того, чтобы х*(/) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы интервал (to, Zi) не содержал точек, сопряженных с точкой t0 (относительно уравнения Якоби (6)).
Напомним, что понятие сопряженной точки было введено в п. 6.3.3.
Доказательство. Для того чтобы вектор-функция %*(•) доставляла слабый минимум в задаче (1), необходимо, чтобы выполнялись соотношения: 5"(М-))*(-) = 0,	(•))(% (•),%(•))> 0,
Первое равенство имеет место в силу того, что %*(•) есть экстремаль. Второе неравенство означает, что квадратичный функционал
-ft
3" (х, (•)) (х( •), х( •)) = / ((4 (/) х |х) + 2 (С (0 х|х) +
+ (B(t)x\x))dt
является неотрицательным на пространстве £0- Условия неотрицательности квадратичных функционалов (в пространстве ь содержащем Lo) были получены в теоремах 4 и 5 из § 6.3. Применение этих результатов к нашему случаю сразу приводит к утверждениям теоремы.
Теорема 2. Для того чтобы допустимая экстремаль х*(-) задачи (1) доставляла слабый локальный минимум в этой задаче, достаточно, чтобы были выполнены усиленные условия Лежандра и Якоби, т. е. чтобы для всех t из отрезка [Zo, ZJ выполнялось бы неравенство
Lxx Ь* (0 = Д (0 > О
и полуинтервал (to, ZJ не содержал бы точек, сопряженных с точкой to относительно уравнения Якоби (6).
Ц А. Д. Иоффе, В. М. Тихомиров
322
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Доказательство. Применив следствие из теоремы 6 § 6.3, получаем, что при допущениях теоремы имеет место оценка
(*.(•))(*(•), х( • ))>а||х( •)||2 „ ,
w2, 1
если только х(-)е£о- Подберем б столь малым, чтобы при ||х(’)|11 б имело место неравенство (см. предложение 1)
|Г(Х(-)) |<|||х(-)||2Г„ .
*	w2, 1
Тогда получится, что если х(*) е В (0, б) в пространстве С? ([/о, 6]), то
5" («.(•)-»=4-Л'" «(•))« ),^(-))+
+ г(«( »>(!-т)м< • )4S1> о.
т. е. х*(.) доставляет слабый минимум в поставленной задаче.
7.4.2. Возмущения простейших задач. Пусть М. — некоторое подмножество в R X R”, содержащее точку (/о,хо). Рассмотрим следующее множество задач, включающее в себя задачу (1):
т
3 (х (•), ТО, т) = [ L (t, х, х) dt -> inf;
i	I (
(To, X (т0)) «= M, х (т) = g.
Возмущения вида (Г) укладываются в общую схему возмущений, описанную в п. 7.1.1. Как правило, будет рассматриваться тот случай, когда М состоит из одной точки (/о, Хо). Тогда, следуя терминологии п. 7.1.2, это возмущение будет называться стандартным. Для стандартного возмущения S-функцию будем обозначать S(t, g), а для общего возмущения (Г) — Sm(t, £).
Поясним введенные понятия примерами. Для задачи
х2 dt -> inf
(7)
Цо, Хо)
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
323
(о минимуме длины кривых, соединяющих данные точки (to,xQ) и (/ЬХ1) на плоскости R2) функция S(t, х) =yrt2 + х2 будет S-функцией стандартного возмущения, когда to = Xo=Q, а для М=Л1(ф)== = {(/, х) 11 cos ср + х sin ф = 0}
S^ (t х) = 11 cos ф + x sin ф |.
Наряду с возмущениями задачи рассматривают и возмущения экстремалей этих задач. Возмущения экстремалей находят свое выражение в концепции поля.
Говорят, что семейство вектор-функций x(t, Z), x(t, X): RXRn-*Rn образует поле экстремалей функционала ^(х(-)), покрывающее область GczRXRn, если
а)	вектор-функции x(t, X) принадлежат классу Ci по совокупности переменных (/, %) и х(-,%')-> х(-, X) при в пространстве С";
б)	для всякой точки (т, g)eG существует единственная точка Л = 7,(т, g) такая, что х(тД(т, g)) = g;
в)	при любом фиксированном % вектор-функция х(/, X) является экстремалью функционала <7(х(-)), т.е. она удовлетворяет уравнению Эйлера Lx— -~Lx=0.
Для каждой точки (т, g)e G обозначим через U(т, g) производную по t в точке х экстремали х(-Д(т, g)), проходящей через точку (т, g):
и(х,	Mb Ю) и.
Вектор-функцию U (т, g) называют функцией наклон на поля.
Говорят, что экстремаль **(•) окружена полем, если существуют числа е > 0, А > 0 и поле экстремалей x(f, Z), |%| < А, покрывающее область
G = {(/, х) |/ е= [/0, ZJ, | х — х# (0 | < е},
и, кроме того, x(t, 0) = x*(t).
Поле х(/Д) называется центральным, если существует точка (to, %о) такая, что х(/0, к) = х0 для всех %. Точка (t0, Хо) называется центром этого поля.
Для задачи (7) о минимуме длины
— совокупность прямых х(/Д)=М образует центральное поле с центром в начале координат, покрывающее область R2\{0},
11*
324
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
— совокупность прямых х(/,Х)=/ + Х образует параллельное поле, покрывающее всю плоскость R2.
Рассмотрим еще один важный пример, а именно квадратичный функционал из § 6.3:
ti
X (х (•)) = j ((Л (/) х I х) + 2 (С (/) х I х) + (В (/) XI х)) dt. (8) tt
Пусть Ф(/, tQ) как и в п. 6.3.3, обозначает фундаментальное решение уравнения Якоби (6) функционала (х(-)). Тогда, как легко видеть, формула
x(t, Х)^=Ф(/, to) X	(9)
задает центральное поле функционала $f(x(-)) с центром в точке (/о,0). Оно покрывает область (to, То)Х Rn, где через То обозначена первая сопряженная с t0 точка относительно уравнения Якоби (6).
В. конце § 7.2 был введен термин «поле экстремалей» в применении к общей гладкой задаче. В этом параграфе аналогичный термин встретился вновь. Покажем, как связаны друг с другом соответствующие понятия.
Пусть х*(/)—минималь в задаче (1). Рассмотрим такую проблему минимизации:
f (х (•)) = ЗГ (х, (•) + х (• ))-> inf, F(x(.)) = x(6) = 0.
Будем предполагать, что функционал f определен и дважды непрерывно дифференцируем в подпространстве L пространства ^2,1 ([^о* М)’ состоящего из функций x(t), обращающихся в нуль в точке t0. Если предположить, кроме того, что для функционала ЗГ выполнены усиленные условия Лежандра и Якоби, то окажется, что удовлетворены все требования теоремы 2 из § 7.2. Применение этой теоремы приведет к тому, что в малой окрестности точки нуль пространства Rn существует отображение Х-*х(-,Х) из Rn в L такое, что х(/, X) являются экстремалями функционала У и при этом x(/i,X) = X. Легко понять, что семейство {x(t, X)} и есть поле экстремалей, о котором идет речь в этом параграфе. Построение поля, проведенное только что, потребовало весьма сильных допущений относительно гладкости функционала У. Далее, для построения поля мы обойдемся много меньшими допущениями (см. ниже предложение 3), но существо дела остается тем же: строгая положительность второй вариации на ядре отображения F дает возможность произвести возмущение экстремали x*(f) и включить ее в семейство экстремалей x(t, X), как это в общем случае было проделано в упомянутой теореме 2 из § 7.2.
С каждым центральным полем (с центром в точке (/о,*о)) функционала <7(х(-)) свяжем функцию
т
о (т, £) = j L (t, х (t, Л), х(/, Л)) dt,
t.
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
325
где X = Х(т, £) (т. е. х(т, X) — £), которую будем называть 17-длиной поля x(t, X) от точки (to, х0) до точки (т, £).
Предложение 2. Пусть центральное поле с центром в (t0, %о) покрывает область G с R X Rn. Тогда для любой точки (t, х) имеет место формула
do (t, х) — — Н (t, х) dt + (р (t, х) | dx), где *)
p(t, x)=Li(t, х, U(t, х)),
Н (t, х) = (р (t, х) | U (t, х)) - L (t, х, U (t, х))
и U(t,x)—функция наклона поля x(t, X).
Доказательство. Экстремаль поля, проходящую через точку (t, х) е G, обозначим через x(t, Xj); аналогично, пусть x(Z, Х0 + ДХ) есть экстремаль поля, проходящая через (t + М, х + Дх). Положим
h (t) = х (t, Kg + ДХ) — х (t, Хо), [*о, t + Afl
и для определенности будем считать, что Д/ > О-
Тогда
ст (t + М, х + Дх) — ст (t, х) =
t + M
—	J L (т, х (т, Хо + АХ), х (т, Хо + ДХ)) dx —
t
—	j L (т, x (t, Xo), x (t, Xo)) dx = to
t
=	J (('-1. к. ч I * W) + (b I.MI* W)) +
+ ML (t9 x (/, Xo), x (/, Xo)) + о (max (|| h (•) |h, Af, | Ar |)).
Произведя интегрирование по частям и воспользовавшись тем, что х(/, Хо) является экстремалью, а также соотношением
х (t + А/, Хо) + h (t + АО = х (/ + Af, Хэ + АХ) =х + Ах,
*) Отметим, как выражается Н(/, х) через функцию Понтрягина задачи (1):
Н (t, x)=H(tt х, U (t, х\р (t. х), 1).
326
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
т. е. равенством
h (t) = кх — х (/, Ао) Д/ + о (max (IIЛ (•) Ik, Д/, I Дх |)), сразу получаем, что
a (t + Д/, х + Дх) — а (t, х) = t
+ (й (/) | Li (t, х (t, Ao), x (t, Ло))) + L (t, x (t, Ao), x (t, Ao)) At + + o(max(||A(-)||„ At, | Ax|)) = — H (/, x)Ai +
+ (p(t, x) | Ax) + о (max (|| h (•) ||b At, | Ax|)), откуда и следует требуемое.
7.4.3.	Интеграл Гильберта. Основная формула Вейерштрасса. Пусть V — некоторая односвязная область в пространстве R X Rn- Вектор-функцию Г(/,х): V-*Rn будем называть гильбертовым полем функционала &(х(-)) в V, если отображение Г принадлежит классу Ci в области V и при этом дифференциальная форма б = (L (t, х, Г (t, х)) - (Г (t, х) |La (t, х, Г (t, х)))) dt +
+ (Li(t, х, Г (t, x))\dx) является замкнутой (т. е. полным дифференциалом). Интеграл / (у) — J 6 от формы б называется интегра-v
лом Гильберта. Имеет место
Теорема 3 (основная формула Вейерштрасса). Пусть V — односвязная область в пространстве RXRn. охватывающая экстремаль у* = x*(t) задачи '(1). Пусть, далее, Г (t, х) — гильбертово поле функционала «7(х(-)) в V такое, что х*(/) = T(Z,х*(0).
Тогда для любой вектор-функции x(t), соединяющей точки (t0,xQ) и (Л, Xi), имеет место формула
ti
^(х(-)) —5<(х,(-))= J&(t, x(t), r(t, х(0), x(t))dt, to
где S — функция Вейерштрасса.
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
327
Напомним, что функция Вейерштрасса была введена в п. 2.2.3.
Доказательство. Вектор-функцию x(t) будем обозначать еще через у. В силу односвязности V и замкнутости формы б интеграл Гильберта 7(у) = j б не v зависит от пути у, если у соединяет точки (4, х0) и (ti, Xi). Следовательно, /(у)=/(у#). Интегрируя вдоль у и используя то, что х* — Г(/, х*), получаем:
t,
Z(yJ = J 6 = J (L (t, x, (t), Г (t, x, (/))) -
Y* t,
- (Li (t, x. (О, Г (f, xt (0)) IГ (/, x, (/))) +
+ (Li (t, x. (0, Г (t, x, (/))) | x. (0)) dt = tl
= J L(t, xt (/), x. (t)) dt — 3t(x^(-)). ^0
Следовательно,
J (x(-)) — J(x.( •)) = j L(t, x, x) dt — I (yj = t<3
= J L(t, x, x) — I (y) = J L(t, x, x)—L(t, x, Гр, x)) — Y	Y
ti
— (x — Г (t, x) I Li (t, x, Г (t, x)) = [ 8 (t, x, Г (t, x), x) dt, ^0
что и требовалось.
Следствие. Для того чтобы кривая x»(i) доставляла сильный минимум в задаче (1), достаточно, чтобы в некоторой односвязной области V, окружающей экстремаль х»(-), существовало гильбертово поле Г(£,х) функционала 5й (х (•)) в области V такое, что х* = = Г(/, х,), и при этом выполнялось неравенство
&(t, х, V(t, х), £)>0
для любой пары (t, х) е V и любого g е Rn.
Это условие называется усиленным условием Вейерштрасса,
328
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Подробнее оно .запишется так:
L (/, х, £) — L (/, х, Г (/, х))—(£—Г (t, х) | АД/, х, Г (/, х)))>0.
Теорема 3'. Пусть экстремаль х*(/) можно включить в центральное поле экстремалей, покрывающее область Vcz RX Rn. Пусть, далее, интегрант L(t,x,%) является регулярным по % (т. е, строго выпуклым по £ при (/, х)е V). Тогда кривая x*(J) доставляет сильный минимум в задаче (1).
Доказательство сразу получается из сопоставления предложения 2 (которое в новых терминах можно сформулировать так: функция U (t, х) наклона центрального поля экстремалей порождает гильбертово поле функционала ^(х(-))) и следствия из теоремы 3. Действительно, требование х* = U(t, х*) выполняется по определению функции наклона поля, а неравенство S О, выполнено в силу регулярности интегранта L. Теорема 3' тем самым доказана.
Теорема 3' является весьма полезной при получении достаточных условий в тех задачах, где удается найти общий интеграл уравнения Эйлера. Однако у нее есть существенный недостаток — ее основное условие (возможность включить экстремаль х*(/) в центральное поле экстремалей) выражено не в терминах поставленной задачи. Окончательное достаточное условие будет получено в следующем пункте.
В заключение вернемся к квадратичному функционалу (8),. Для поля
x(t, =	/0-д)Л,
построенного по типу (9) для точки tQ — 6, при достаточно малом б функция наклона поля равна
U6 (t, х) = Ф (t, ta - fi) Ф-1 (f, t0 - 6) x,
откуда в силу основной формулы Вейерштрасса получаем равенство Л
^ (*(•)) =J (л (/) (Ui (t, х) - х) I U(, (t,x)-x)dt, t9
x(»)eLOl
на которое опирались в п. 6.3.3 при доказательстве теоремы 6, где было получено достаточное условие Якоби для неотрицательности квадратичного функционала.
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
329
7.4.4.	Достаточное условие Вейерштрасса сильного минимума. Для того чтобы не отвлекаться на несущественные детали, будем предполагать, что интегрант L является функцией класса Соо по всем своим аргументам и %*(/) обладает такой же гладкостью. В этих допущениях докажем
Предложение 3. Для того чтобы экстремаль %*(/) задачи (1), вдоль которой выполнено усиленное условие Лежандра, можно было окружить полем экстремалей, достаточно, чтобы на %*(•) было выполнено усиленное условие Якоби.
Замечание 1. На самом деле усиленное условие Якоби является и необходимым условием того, что экстремаль можно включить в поле экстремалей. Но это обстоятельство далее используется лишь при решении задач, и мы не останавливаемся на его доказательстве.
Замечание 2. Будет построено центральное поле экстремалей, так что требование центральности может быть включено в формулировку предложения 3.
Доказательство. Уравнение Эйлера
L* Lx = L%x% + L%x% 4“ L%t Lx = 0
в окрестности экстремали x*(/) приведем (поделив на Lxx (Л х, х) > 0) к виду
х + Ч^, х, х) = 0.	(10)
Для последнего уравнения решим задачу Коши:
х(/0 — 6, Л) = хД/0-б), х(/0 —д, Л) = Л + хД^о —S). (Ю') (Считаем, что х* (t) продолжена на больший отрезок [/6, t\] => [/о, Л].)
Покажем теперь, что при малых 6 и X решения x(t, X) уравнений (10) с граничными условиями (10') образуют искомое поле.
Равенство x(t,O) = x*(t) имеет место в силу теоремы единственности. По своему определению, вектор-функции x(t, X) являются экстремалями функционала 5'(х(-)), и следовательно, по t и X выполнено тождество
- 4х х	+Lx &х	s °- 1
[
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
330
Дифференцируя это тождество по X (возможность провести такое дифференцирование гарантируется допущениями относительно гладкости интегранта L и экстремали	получим:
- 4 к (О Ф (/, /о - 6) + Ux U (О ф to - +
+ к (О ф А) - б) + Lxx |м<) ф (t, /о -6), (11)
где через Ф(/, /0 — б) обозначена матрица —.
В силу граничных условий (10') получаем:
ф(/о — б, t0 — б) = 0, Ф(/0-б, t0 — б) = /.	(12)
Сопоставляя (6) и (11), а также (12) с формулой (5) из § 6.3, приходим к выводу, что Ф(/, to — б) есть фундаментальное матричное решение уравнения Якоби задачи (1). Из условия предложения 3 и из непрерывной зависимости решений от начальных данных получится, что при малых б > 0 матрица Ф(/, to — б) является невырожденной на всем отрезке [f0, /J. Применив к отображению x(f, X) теорему о неявной функции, получим, что для достаточно малого е > 0 уравнение x(t, X) — х=0, где |х— х*(/) | <: е, имеет единственное решение. Итак, x(f, 1) есть центральное поле, покрывающее область
G = {(/, х) е[f0, М X R" II х -х. (/) | < в}
и включающее экстремаль x«(f). Предложение доказано.
Замечание. Анализ доказательства показывает, что для получения утверждения предложения 3 достаточна четырехкратная непрерывная дифференцируемость интегранта и экстремали.
Суммируя все сказанное, получим окончательный результат.
Теорема 4 (достаточное условие Вейерштрасса сильного минимума). Для того чтобы вектор-функция x*(f) доставляла сильный локальный минимум в задаче (1), достаточно, чтобы:
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
331
1)	вектор-функция хД-) была экстремалью функционала «7(х(-)), т. е. чтобы удовлетворялось уравнение Эйлера:
Lx к (О ~~dtLx к (0 = 0;
2)	интегрант L был регулярен по % для всех (/, х) из некоторой области V cz R X Rn, содержащей точки (/, хД/));
3)	вдоль x*(t) выполнялось усиленное условие Якоби, т. е. на полуинтервале (/о, 6] не было точек, сопряженных с точкой to.
Замечание. Мы сознательно не оговорили при формулировке теоремы требований гладкости интегран-та и экстремали. Эти требования должны быть такими, чтобы можно было применять предложение 3. Было отмечено, что достаточно четырехкратной дифференцируемости, но эти условия гладкости не выглядят естественными и скорее всего излишни для получения результата.
Укажем еще на одну форму последней теоремы и тем самым свяжем этот параграф с рассмотрениями § 7.1.
Теорема 4х. Пусть вектор-функция хД/J является экстремалью функционала .7(х(-)), задаваемого регулярным интегрантом. Пусть, далее, на экстремали хД/) выполнено усиленное условие Якоби. Тогда в точке хД«) существует стандартная локальная К-функция задачи (1).
Доказательство. В силу предложения 3 экстремаль хД/) можно окружить центральным полем экстремалей. По этому центральному полю построим функцию а(/, х), равную «7-длине от центра нашего поля до точки (/, х). Положим
Ф(х(.)) = Да = ^ (%.(•)) +
*0
+ /ртг1 +	!*))<" + ’ ('» *«)-’«., X,).
и
332
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
В силу предложения 2 получаем:
^-—L(t,x,U (t, х)) - (р (t, х) | U (/, х)), да- ^ = Р (t, х) =	(t, х, U (t, х)),
где U (t, х) — функция наклона поля. Отсюда следует (в силу равенства 5r(x„(-)) = o(Zi,Xi)—о (to, Хо)), что: Z7(x( •)) —Ф(х( •)) =
= J (л», х. х)| *)) di-tx
= J (L (t, x, x)-L (t, x, U (t, x)) + to
+ (x — U (t, x) I Li (t, x, U (t, x)))) dt == л
= x, U(t, x), x)dt^O.
to
Но это и означает, что Ф(х(«)) есть К-функция задачи (1). Теорема 4' доказана.
Теорема 4 следует из нее автоматически.
Следующий пример показывает, что усиленные условия Лежандра и Якоби вместе с условием Вейерштрасса, выполненным вдоль экстремали, все же не гарантируют, что экстремаль доставляет минимум.
Пример (Больца).
(1,0)
5<(х(-)) = J (х2 — 4xx3 + 2Zx4)d^->inf.
(0,0)
Функция %*(•)= 0 является экстремалью. Параллель-: вое поле x(t9 К) — К окружает ее, а интегрант на экстремали имеет вид х2 + 2/х4, т. е. является выпуклой функцией х. Из сказанного вытекает, что на экстремали хд-) выполнены достаточные условия слабого минимума. (Отметим, что для обоснования выполнимости условия Якоби надо воспользоваться необходимостью в предложении 3.) Кроме того, выполнено необходимое' условие Вейерштрасса. Сильного минимума, однако,
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
333
нет. Чтобы убедиться в этом, надо взять ломаную х(/, т, X), обращающуюся в нуль на конце отрезка [О, 1] и имеющую один излом в точке т на высоте X. Простой подсчет показывает, что при сколь угодно малом X можно взять т таким, что У (х (•, т, X)) < 0.
Существо дела здесь в том, что интегрант L регулярен здесь только вдоль экстремали, и эта регулярность нарушается в сколь угодно малой окрестности ее.
7.4.5. Уравнение Гамильтона — Якоби. Вернемся к рассмотрениям п. 7.4.2. Чтобы не заострять внимания на несущественном, будем предполагать интегрант задачи (1) бесконечно дифференцируемым, всюду регулярным и растущим на бесконечности по последнему аргументу быстрее первой степени |£|:
L(t. х,	|g|->oo.
При сделанных допущениях уравнение p = Lx{t> х, и)	(13)
имеет единственное решение: по р единственным образом находится и и по и однозначно находится р. Обозначим через	функцию (р|а)— £(/,х,и), где
и находится из (13). Написанное преобразование рассматривалось нами в гл. 3 (см. сноску на стр. 183) и было названо преобразованием Лежандра. При сделанных допущениях преобразование Лежандра совпадает с подробно изученным в главах 3, 4 преобразованием Юнга — Фенхеля:
Ж (/, х, р) = max ((р |g) — L (t, х, g)). £
Одним из самых интересных явлений в классическом вариационном исчислении является возможность двойного описания решений стоящих там задач. Оно связано с инфинитезимальным подходом, о котором много говорилось в этой книге. Основным аппаратом при этом подходе является аппарат обыкновенных дифференциальных уравнений. Но возможен и другой путь — глобальный, основанный на изучении семейств экстремалей. Аппаратом здесь служит теория уравнений с частными производными первого порядка — теория Гамильтона — Якоби. В вариационном исчислении оба подхода
334
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
сливаются в тесном единстве. Для того чтобы понять причину этого, вернемся к обсуждению понятия гильбертова поля.
Пусть Г(/, х)—некоторое гильбертово поля функционала <7(х(-)) в области V. Если обозначить p(t, х) = Lx (t, х, T(f, х)), то получится, что
Ж (/, х, р (/, х)) = (р (/, х) | Г (/, х)) — L (/, х, Г (/, х)).
Во вновь введенных обозначениях определение гильбертова поля будет звучать так: форма
б = — 2^ (t, х, p(t, x))dt + (р(/, х) \dx) (14)
является полным дифференциалом. Следовательно, с гильбертовым полем можно связать функцию
(/,х)
S(t, x) = fd = j (p(i,x)[dx)—^(t,x,p(f,x))dt, (15) Y Щ,х0)
где интеграл берется по любой кривой, соединяющей точку (/о, Хо) с точкой (/, х). Эту функцию, следуя традиции, идущей от классической механики, называют действием *).
Предложение 4. Функция S(t,x), определенная соотношением (15), удовлетворяет следующему уравнению в частных производных:
ds(£x)- + 3%(t,x, д8^хх}) = о. (16)
Наоборот, всякому решению S(t,x) последнего уравнения соответствует гильбертово поле Г(/, х), по которому с точностью до аддитивной постоянной функция S (/, х) восстанавливается по формуле (15).
Уравнение (16) называется уравнением Гамильтона — Якоби.
Доказательство первой части предложения получается сразу из определений. Что же касается второй
*) Из теоремы 4' можно вывести, что функция S(f,x), определенная соотношением (15), будет S-функцией в смысле § 7.1s
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
335
части, шения
то, зная S(t, х), определим —и из соотно-(13) найдем Г(/, х):
= x) = L*(t, х, Г(/, х)).
(р| Г) = L (t, х, Г) + ^(t, х, р) и
= L(t, х, Г(/,х))-(Г(/,х)|р(/,х)),
Тогда dS (/, х) _
‘ dt
т. е. форма ((L (/, х, Г (/, х)) — (Г (/, х) \р(/, х))) dt + (р (t, х) \dx) равна dS(t, х). Предложение 4 доказано.
Комментарий к гл. 7. Зародыш понятия S-функции содержится уже в принципе Гюйгенса (Гюйгенс [1]): волновой фронт есть линия уровня S-функции, построенной по заданному пучку траекторий. Теория Гамильтона — Якоби и метод динамического программирования Беллмана в теории оптимального управления дают описание S-функций, соответствующих стандартным возмущениям. Развивая идеи Гильберта [3], Каратеодори [1J (см. также Янг [2]) ввел, по существу, понятие локальной /(-функции для задач классического вариационного исчисления. Глобальные /(-функции рассматривал Кротов [3]. Исчерпывающее изложение теории для выпуклых функций содержится в монографии Рокафеллара [14]. Оттуда мы заимствовали термин «возмущение». Весьма подробное исследование достаточных условий проведено в последних работах Левитина, Милютина и Осмоловского [1]. Их концепции весьма близки к некоторым нашим конструкциям из § 7.2. Упомянем еще работы Янга [2] и Иоффе [4], [6], где для задач вариационного исчисления проводится совместное изучение возмущений и /(-функций.
Глава 8
ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ И ВЫПУКЛЫЙ АНАЛИЗ ИНТЕГРАЛЬНЫХ ФУНКЦИОНАЛОВ
Эта глава содержит фрагмент сравнительно новой ветви анализа, посвященной изучению многозначных отображений. Изложенные в этой главе факты группируются главным образом вокруг понятия измеримости. Особенно важны теорема измеримого выбора и различные условия, гарантирующие измеримость многозначных отображений (§8.1), теорема А. А. Ляпунова, теорема о выпуклости интеграла от многозначного отображения (§ 8.2) и теорема о конволюционном интеграле (§ 8.3). Всюду в этой главе, если нет специальных оговорок, через (Г, S, ц) обозначается произвольное пространство с конечной положительной мерой. Читатель, не знакомый с абстрактной теорией меры, может без ущерба считать, что Т — отрезок действительной оси, S — совокупность его измеримых (в смысле Лебега) подмножеств и р,- мера Лебега на Т.
§ 8.1.	Многозначные отображения и измеримость
8.1.1.	Определения. Пусть X и Y — некоторые множества, а 2У — совокупность всех подмножеств множества У. Многозначным отображением из X в У называется всякое отображение
F: Х->2Г.
С этим определением мы уже встречались в § 0.2. Множества
grF= {(х, г/)еХХУ| z/ef (х)}, dom F = {х е X | F (х) =/= 0} называются соответственно графиком и эффективным множеством многозначного отображения F.
Можно указать несколько естественных операций с многозначными отображениями. Если F и G — многозначные отображения из X в У, то многозначные отображения
x->(FUG) (x) = F(x)UG(x), x-*(Ff| G) (х) = f (х) f) G (х)
§ 8.1. МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
337
называются соответственно объединением и пересечением отображений F и G. Если G— многозначное отображение из X в У, a F — многозначное отображение из У в Z, то многозначное отображение
х-> (F ° G) (х) = (J F(y)
У e=G(x)
называется суперпозицией отображений G и F. Если У — линейное пространство, a F, Fit F2 — многозначные отображения из X в У, то многозначные отображения
+	= Л (x) + F2(x),
х -> (aF) (х) = aF (х), х -> (conv F) (х) = conv F(x) называются соответственно суммой отображений Fb F2, произведением отображения F на число а и выпуклой оболочкой отображения F.
Если У — линейное пространство, F — многозначное отображение из X в У и все множества F(x) выпуклы, то отображение F называется выпуклозначным или просто выпуклым. Пусть У — топологическое пространство. Если все множества F(x) замкнуты (открыты, компактны), то многозначное отображение F называется замкнутозначным (открытозначным, компактнозначным) или просто замкнутым (открытым, компактным*)). Наконец, если X и У — топологические пространства и график многозначного отображения F из X в У замкнут, то это отображение называется полунепрерывным сверху.
Пусть F — многозначное отображение из X в У и #(х) — (обычное) отображение множества X в У. Отображение у(х) называется сечением многозначного отображения F, если y(x)<=F(x) при всех xedomF.
В этой главе мы рассматриваем главным образом многозначные измеримые отображения в Rn. Пусть (Т, S, р)— пространство с конечной положительной мерой и пусть F — многозначное отображение из Т в Rn.
*) В литературе эти термины часто употребляют в другом смысле: отображение F называют замкнутым (открытым, компактным), если его график есть замкнутое (открытое, компактное) множество.
338
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Мы будем говорить, что семейство {xv(-)}	из-
меримых отображений из Т в Rn аппроксимирует многозначное отображение F, если для всякого v е N множество
измеримо и почти при всяком t^T множество F(/) принадлежит замыканию своего пересечения с множеством
U м».
v е= N
Многозначное отображение F из Т в Rn будем называть измеримым, если существует счетное семейство измеримых отображений из Г в Rn, аппроксимирующее отображение F. Многозначное отображение, одновременно измеримое и замкнутое, называется нормальным.
Естественным было бы следующее определение. Многозначное отображение F из Т в Rn естественно назвать измеримым, если для всякого открытого множества A cz Rn множество
{t^T\F(t)[\A^0}
измеримо. Это определение, однако, не совсем удобно для наших целей, так как получение с помощью этого определения нужных нам результатов сопряжено с рядом технических сложностей, да и проверка измеримости конкретных многозначных отображений требует подчас больших усилий.
Рассмотрим некоторые примеры.
1)	Постоянное отображение. Пусть A cz Rn. Тогда многозначное отображение F(t)==sA измеримо. Аппроксимирующее семейство образуют, например, вектор-функции xm(t) хт, где {xi, х2, ...} — счетное плотное подмножество множества А.
2)	Отображение Каратеодори. Пусть U cz Rft и g: Т X Rn — отображение, удовлетворяющее условиям Каратеодори (см. § 0.4), т. е. измеримое по t при всяком и е U и непрерывное по и почти при каждом t е Т. Положим F(t) = g(t, U). Тогда отображение F измеримо. Аппроксимирующее семейство может быть образовано, например, из вектор-функций xm(t) = g(t, um), где {и и и2, ...} — счетное плотное подмножество множества U.
3)	Измеримая трубка. Пусть х(-): Т -> Rn — измеримая вектор-функция, p(t) — измеримая почти всюду конечная неотрицательная действительная функция. Положим
F (0 = (xeR«||x-x(/)|<p(/)}.
§ 8.1. МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
339
Чтобы убедиться в измеримости многозначного отображения F, достаточно положить xm(t) = x(t) +p(/)xw, где {хь х2,	—счетное
плотное подмножество единичного шара в Rn.
8.1.2.	Элементарные свойства измеримых многозначных отображений. Из определения сразу следует
Предложение 1. Пусть F — измеримое многом значное отображение из Т в Rn. Тогда множество dom F измеримо.
Доказательство. С точностью до множества
оо
меры нуль dom F— |J {/ е Т| xm(t) е F (/)}.
Предложение 2. Справедливы следующие утверждения:
а)	объединение не более чем счетного семейства измеримых многозначных отображений измеримо;
б)	сумма измеримых многозначных отображений и произведение измеримого многозначного отображения на число измеримы;
в)	если Fi и F — многозначные отображения из Т в Rn, причем отображение Fi измеримо и почти при всяком t выполняется соотношение Fi(t)cz F(t)cz Fi(t), то отображение F тоже измеримо.
Доказательство следует прямо из определений.
Предложение 3. Выпуклая оболочка измеримого многозначного отображения — измеримое многозначное отображение.
Доказательство. Пусть F — измеримое многозначное отображение из Т в Rn. Положим
А = = (аь ..., ал+1)
п + 1	*)
eRn+1|a» неотрицательны, рациональны,
/=1	)
Для каждого а^А положим
п+1
Fa (t) = 2a.F(0
i=l
и пусть
Ф(0= U
а^А
340
ГЛ 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Отображение Fa измеримо согласно утверждению б), а отображение Ф — согласно утверждению а) предложения 2. Наконец, отображение Ф и conv F согласно теореме Каратеодори связаны условиями утверждения в) предложения 2. Предложение доказано.
Предложение 4. Пусть F — многозначное отображение из Т в Rn. Если для всякого х е Rn множества {t е Т|х F(/)} измеримы и отображение F открыто, то оно измеримо.
Доказательство. Пусть D = {хь х2, ...} — счетное плотное множество в Rn. Так как множества F(/) открыты, пересечения D Q F(t) плотны в F(t). Для доказательства осталось положить xm(t) = хт.
Предложение. 5. Пусть F{ и F2 — многозначные отображения из Т в Rn, причем первое измеримо, второе открыто и для всякой измеримой вектор-функции x(t) множество {t е T|x(/)eF2(/)} измеримо. Тогда пересечение отображений Т\ и F2 измеримо.
Доказательство. Пусть {хД/), x2(t), ...}—семейство отображений из Г в Rn, аппроксимирующее многозначное отображение /4. Мы покажем, что это же семейство аппроксимирует и Л П F2. По условию все множества
{/еТ’|хт(0еЛ(0П/72(0}==
= {t е Т\xm (t) е F, (/)} П Re Г| хт (0 е F2(/)} измеримы. С другой стороны, поскольку множества £г(/) открыты, пересечения
f2(on(u М))) '7П=1	/
плотны в F2(t), откуда и следует предложение 5.
Предложение 6. Пусть F — нормальное многозначное отображение из Т в Rn. Тогда для всякой измеримой вектор-функции х( •): Т -> Rn множество {/е T\x(t)^ F(t)} измеримо.
Доказательство. Положим
Fe(/)={xG=Rrt|xG=F(/), |х —х(01<е}, е > 0.
Отображение Fe измеримо в силу предложения 5. Поэтому множества domFe измеримы (предложение 1), а
§ 8.1. МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
341
так как множества F(t) замкнуты, то
{/ <= Т | х (0 <= F (/)} = П dom е >0
с точностью до множества меры нуль.
8.1.3.	Критерии измеримости.
Теорема 1 (теорема измеримого выбора). Многозначное отображение F из Т в Rn измеримо в том и только том случае, если существует счетное семейство измеримых сечений отображения F, аппроксимирующее это отображение.
Доказательство. Достаточность очевидна. Докажем необходимость. Пусть многозначное отображение F измеримо и {yi(t), УгЬ), • • •} — некоторое семейство измеримых отображений из Т в Rn, аппроксимирующее отображение F. Положим
Tm = ]/er|ym(0eF(/)}, m = \,2, ....
	У1 (0, У 2 (0,	если если	или t^Tlt t s Га \ Т\,
	у к (0.	если	й-1 teTft\ иЛ,
			£=1
xm (t) = •
*m-i (0, если
ym (/), если
Ут+i (0, если
Tn,
t m+1 \ Fm,
k-1
ym+k(t)f если tf==Tm+k \ Tm+ii i=Q
Легко видеть, что {%i(Z), *2(0> • • •} — искомое семейство измеримых сечений отображения F.
Замечание, Если многозначное отображение F содержит хотя бы одно суммируемое или ограниченное измеримое сечение, to
342
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Xrnk (0 =
можно указать аппроксимирующее его семейство, составленное из суммируемых или ограниченных измеримых сечений. Рассмотрим хотя бы случай, когда отображение содержит ограниченное измеримое сечение %о(О. Если семейство измеримых сечений {yi(t),yi(t), ...} аппроксимирует отображение F, то вектор-функции
ут (0, если | ут (/) | < k,
Хо (<), если I Ут (О | > k,
измеримы, ограничены и, как легко видеть, образуют семейство, также аппроксимирующее отображение F.
Теорема 2. Для того чтобы многозначное отображение F из Т в Rn было измеримым, необходимо, а в случае, когда оно замкнуто, и достаточно, чтобы для всякого х g Rn скалярная функция t р(х, F(t)) = = inf{| х — г 11 г e F(t)} была измеримой.
Доказательство. Если многозначное отображение F измеримо, то, выбрав, согласно теореме 1, аппроксимирующее семейство {хД/), x2(t), ...} измеримых сечений отображения F, получим, что
р(х, F(t))= inf |х —xm(/)|
1 < Щ < ОО
— измеримая функция.
Предположим теперь, что функции р(х,F(t)) измеримы при всяком xeRn и множества F(t) замкнуты. Заметим, что равенство р(х, F(/))=oo может выполняться лишь одновременно для всех х и только при тех t, при которых F(t)= 0. Таким образом, множество dom/7 измеримо, и без ограничения общности можно считать, что domF=T, т. е. что F(t)=£0 при всех t. Для всякого натурального m положим
fm(0 = {xeR’|p(x, F(t)) < 2~m}.
Множества Fm(t) открыты при всех t, а множества
{t <= Т\х е Fm (/)} = {t^T\p(x,F (0) < 2-m}
измеримы при всех х е Rn по условию. Поэтому (предложение 4) отображения Fm измеримы.
В силу теоремы 1 при каждом m можно выбрать се-' мейство {tzmi(/), um2(t), ...} измеримых сечений многозначного отображения Fm, аппроксимирующее это отображение. Для всякой пары номеров m, k = 1, 2, .
§ 8.1. МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
343
рассмотрим следующую последовательность измеримых вектор-функций, которая строится индуктивно:
И/п&О (0 == ^rnk (О*
Предположим, что мы уже выбрали Umki(t) так, что почти всюду. Тогда в качестве
Wmfe(i+i)(0 возьмем произвольную измеримую вектор-функцию такую, что
Umk (1 + 1} (0	Fm+i+1 (0>
Такая вектор-функция существует, поскольку многозначное отображение
t -> фт4 «+0 (0 = {х е Fm+t+l (О II х - umkl (t) I < 2(-m+i)}
измеримо в силу предложения 5 и почти все множества Фтй(г+1)(О непусты.
Из второго соотношения в (1) следует, что при 1->оо вектор-функции Umki(t) сходятся почти всюду к некоторой измеримой вектор-функции хтл(/) и
I xmk (0 — итк (О | < 2-(т'"1) почти везде. (2)
Из первого соотношения в (1) в свою очередь следует включение
xmk (0 е F (0 почти везде.	(3)
Осталось проверить, что семейство {xmk(t), т, k — — 1, 2, ...} аппроксимирует отображение F. Для этого отметим следующий простой факт: если Л с R" — замкнутое множество, множество {нт&|щ, k = 1,2,...} плотно в некоторой окрестности множества А, xmh при т, k = 1, 2, ... и |Хт.к — «тл|< 2-<’п'-1>, то множество {xm*l т, k = 1, 2, ...} плотно в А. Действительно, пусть х е А и в > 0. Выберем т0 так, что 2/e < 2"1»-1, и найдем umk из условия т > т0, |х— Umk\<.e,/2. Тогда |х — xm*|<8. Из этого факта в силу соотношений (2), (3) и из определения вектор-функций Umk(t) следует требуемое.
8.1.4.	Интегранты. Всякую функцию (со значениями из расширенной области вещественных чисел), определенную на Т X Rn, будем называть интегрантом.
344
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
С каждым многозначным отображением F из Т в R*»j можно связать интегрант на Т X Rn:
f (t, х) = Ъ(х] F(f)}.
Наоборот, каждому интегранту, определенному на Т X Rn, можно поставить в соответствие многозначное-отображение из Т в Rn+1:
F (/) = epi f(.
Поэтому каждому утверждению о многозначных отображениях должно соответствовать некоторое утверждение об интегрантах.
Мы назовем интегрант f (t, х), определенный на Т X Rn, измеримым (соответственно нормальным, вы*
пуклым и т. д.), если многозначное t —> epi ft измеримо (нормально, выпукло
отображение' и т. д.). На-





пример, если U с R* и отображения g: Т X U —► Rn и h: Т X U —* R удовлетворяют условиям Каратеодори, то
f (^» А = inf {h (/, и) | и е Ut g (/, и) = х}
— измеримый интегрант. В самом деле, если {щ, и2, . • } — счетное плотное подмножество множества 0, а {ой, а2, ...} — множество положительных рациональных чисел, то
xmi(t) = g(t, um), = um) + ar, m, /=1,2,
измеримы и образуют аппроксимирующее семейство измеримых сечений отображения
Предложение 7. Для того чтобы интегрант f(t,x) был измеримым, достаточно выполнения одного из следующих условий'.
a) f— выпуклый интегрант, функции t —► f (t, х) измеримы при всяком xeR71 и int (dom ft) #= 0 почти
при всех t;
б) f (t, х) = g*t* (х), где g (t, х) — измеримый интегрант',
в) f(t, х) = fi (/, х) + f2(t, х), где fi и f2 — измеримые интегранты и dom fit = Rn почти при всех t.
Доказательство. Утверждение а) следует из предложений 2 и 4, поскольку из int (dom ft) =И= 0 следует int (epi ft) #= 0 (теорема 3 из § 3.5) и для всяких aeR, xeRn множество {t s_Т\ (а, х)е int(epif»)} из
$ 8.1. МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
345
меримо. Утверждение б) есть прямое следствие предложений 2 и 3, поскольку в силу следствия 2 из теоремы Фенхеля — Моро epi §** = conv (epi gt). Наконец, утверждение в) очевидно.
Предложение 8. Пусть f — нормальный интегрант на Т X Rn. Тогда для всякого измеримого отображения x(t) из Т в Rn функция	измерима.
Доказательство немедленно следует из предложения 6.
В качестве следствия из этого предложения мы получаем следующий результат.
Следствие. Пусть U cz Rft и g: TXU-Kn-отображение, удовлетворяющее условиям Каратеодори. Тогда, если u(t) —измеримое отображение из Т в U, то вектор-функция g(t,u(t)) измерима.
Предложение 9. Пусть f — измеримый интегрант на TXRn, р(0 — измеримая конечная действительная функция на Т и почти при всех t
р (0 > inf f (t, х). X
Тогда найдется измеримая вектор-функция x(t) такая, что
почти везде.
Доказательство. Положим
Fi (О = epi Л;
F2(/)={(a,x)eRXRn|a<p(/)}
и применим предложение 5 и теорему 1.
Предложение 10. Пусть f — измеримый интегрант на Т X Rn- Тогда функция
а (0 = inf f (t, х) X
измерима.
Доказательство. Пусть	xm(t)\m =
= 1, 2, ...} — аппроксимирующее семейство измеримых сечений многозначного отображения t -* epi ft. Тогда
a(0= inf
1 C fn < co
346
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
8.1.5. Измеримость некоторых специальных много-j значных отображений и интегрантов.	1
Теорема 3. Пусть отображение g: Т X RM удовлетворяет условиям Каратеодори, a F и G — нормальные многозначные отображения из Т в Rn и Rfe со- ] ответственно. Тогда многозначное отображение	|
= {х е Rn|x е F(t)f g(t, х) ^G(t)}
нормально.	Д
Доказательство. Множества Ф(/), очевидно, д замкнуты. Поэтому в силу теоремы 2 достаточно про- д верить, что для всякого xgR71 функция р(х, Ф(/)) д измерима. Положим	д
Ge(t)= [у е= R*| р(у, G(t)) < е},	i
Фе(0 = {хеЯп|хе^(0, g(t,x)(=Ge(t)},	I
где е > 0. Отображение Ge измеримо в силу предложе- Я ния 4: все множества Ge(t) открыты и для всякого Я У *= Rft	Я
е Т\у<= Ge(t)] = {/ е= Г| р(у, G(t)) < в}. I
Далее, вектор-функция g(t, x(t)) измерима, если только I измерима x(t) (следствие из предложения 8). По- Я этому, если x(t)—измеримая вектор-функция, то и Я множество	Я
{Zer|g(f,x(0)eGe(0} = {^r|p(g(/,x(f)), G(O)<eJ I
измеримо (в силу предложения 8, ибо по теореме 2 ин- Я тегрант (/, */)-*р(у, G(t)) удовлетворяет условиям Ка-Я ратеодори).	Я
Заметим теперь, что из-за непрерывности g(t,x) по Я х все множества	Я
W8(0 = {х е R"|	g(t, х) е Ge(0}	I
открыты. Поэтому в силу предложения 5 многозначное > отображение Фе = F Q Те измеримо. По теореме 2 от- > сюда следует, что функция р(х, Фе(/)) измерима для 1 всякого xeR”. Но, как легко видеть, р(х,Фе(/))—» г->р(х, Ф(0) при ег+0.
§ 8.1. МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
347
Следствие 1. Пусть f — нормальный интегрант на Т X и F — многозначное нормальное отображение из Т в Rn. Положим
f(t, х), оо,
h (/, х) —
если x<=F (/), если xt£F (t).
Тогда h — нормальный интегрант.
Доказательство. Рассмотрим отображение g: rXRXlC->Rn, gtf,a,x) = x.
Тогда
epi/zf = {(a, x)gRXR"I («, х) е epi g(t, a, x) ^F(f)}.
Следствие 2. Пусть f — нормальный интегрант на T'XW1, F — нормальное многозначное отображение из Т в Rn, g\ Т X Rn —► Rfe — отображение, удовлетворяющее условиям Каратеодори, а вектор-функция у(-): Г —► Rfe и функция a(t) измеримы. Тогда многозначное отображение
/_>ф(/) = {x(==F(01 g(t, x) = y(t), f(t, x)<a(0}
нормально.
Доказательство. Пусть интегрант h определен по f и F, как в следствии 1. Рассмотрим отображение I: Т X R X Rn R X R”, определенное формулой l(t, а, х) = {a, g(t, х)). Оно, очевидно, удовлетворяет условиям Каратеодори. Наконец, отображение
t-+G (/) = {(а, у) е R X Rftl а < а (О, У = У (0)
тоже нормально. Осталось заметить, что
{(a, х) (= epiht \ a<a(0, gif, x) = y(f)\ =
= {(а, х) е epi ht \ I (t, a, x)^G (/)},
и применить теорему.
Пусть f — интегрант на Г X Rn- Положим /* (/, у) = = f*t(y). Очевидно, /*—тоже интегрант на TXRn- Мы будем называть его интегрантом, сопряженным с f. Заметим сразу, что если f — измеримый интегрант, то,
348
ГЛ 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
каково бы ни было измеримое отображение у(-) множества Т в пространство Rn, функция
Г У (0) = sup ((«/(01 X) — f (t, х))
X
измерима в силу предложений 7 и 10.
Теорема 4. Пусть f — измеримый интегрант на Т X Rn и почти при каждом t функции f*t — собственные. Тогда f* — нормальный выпуклый интегрант.
Доказательство. Поскольку функции f*t выпуклы и замкнуты, достаточно проверить, что /* — измеримый интегрант. Кроме того, поскольку f* = f*** (теорема Фенхеля — Моро) и /** — измеримый интегрант (предложение 7), без ограничения общности можно считать, что f — нормальный выпуклый интегрант. Пусть е > 0. Положим
fe(z> У) =inf {Г(#> У + z)[z е R", 1 z Ке).
Для доказательства теоремы достаточно убедиться в том, что все интегранты f* измеримы. В самом деле, все функции f*t выпуклы и замкнуты (выпуклость очевидна, а замкнутость следует из замкнутости Ц и компактности единичного шара в Rn), epi f* — Q ePifer e > 0
Докажем, что все fl измеримы. Для этого положим he (Л у) — f (t, у) 4- es («/] В), где В—-шар единичного радиуса с центром в нуле. Тогда /ге — нормальный интегрант (предложение 7, в)) и fl = hl (теорема 1 §3.4). Поэтому функция t—>fl(t,y) измерима. С другой стороны, int (dom fit) = dom ft + eB =/= 0 почти всюду. Теорема 4 следует теперь из первого утверждения в предложении 7. § * * * * *
§ 8.2. Интегрирование многозначных отображений
8.2.1. Определение и формулировка основной теоремы.
Пусть (Г, 2, р.) — пространство с положительной мерой
и F— многозначное отображение из Г в Rn. Интегра^,
лом многозначного отображения F по мере ц назы?
вается множество в R”, точки которого суть интегралы
§ 8.2. ИНТЕГРИРОВАНИЕ
349
суммируемых сечений отображения F. Это множество обозначается символом j F (/) с/р. Другими словами,
т
[ F(t)dn = т
== IX е R" ] X — J х (t) dyL, х (•) е х (t) е F (t), Vt 1.
I	T	J
Для формулировки основного результата этого параграфа нам понадобится одно понятие, относящееся к теории меры. Скажем, что мера р непрерывна, если всякое множество такое, что р(Л)> 0, содержит множество такое, что 0 < р(В) < р(Л). (В случае, когда мера р не является положительной, в этом определении надо вместо р писать |р|.)
Теорема 1. Пусть мера р непрерывна и F — многозначное отображение из Т в Rn. Тогда интеграл отображения F по мере р — выпуклое множество. Если же, кроме того, отображение F нормально и существует суммируемая действительная функция r(t) такая, что |х|^ г(0 для всех (t,x)e= grF, то
j* F (/) rfp — J (conv F (/)) dp. т	т
8.2.2.	Теорема А. А. Ляпунова. Теорема 1 вытекает из теоремы А. А. Ляпунова о векторных мерах и, по существу, эквивалентна этой теореме.
Пусть Т — некоторое множество. Предположим, что на Т задан конечный набор мер рь ..., рл, или «векторная мера» m = (pi, ..., рп), и при этом всякое множество, измеримое относительно некоторой меры рг-, измеримо и относительно остальных мер. Каждому такому множеству А векторная мера m ставит в соответствие я-мерный век гор
т(А) = (р1(Л), ..., рпИ)).
Множество векторов ш(А), соответствующих всем измеримым относительно мер pi, ...» рп подмножествам множества Т, называется множеством значений вектор
350
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
ной меры т. Наконец, векторная мера т называется непрерывной, если все меры pi, ..., рп непрерывны.
Теорема 2 (теорема А. А. Ляпунова). Пусть Рь . • •, Рп — конечные непрерывные меры, определенные на некоторой о-алгебре S подмножеств множества Т. Тогда множество значений векторной меры пг — (мъ • • •, Рп) выпукло и замкнуто.
Теорема А. А. Ляпунова в свою очередь опирается на теорему Крейна—Мильмана о представлении ком-пактных выпуклых множеств. Мы ограничимся здесь напоминанием формулировки этой теоремы.
Пусть А — выпуклое подмножество линейного пространства X. Точка х е Л называется крайней точкой множества А, если из равенства х = a*i + (1 — а)%2, 0 а 1, xlf х2 е А, следует, что Xi = х2 = х, или, другими словами, если точка х не может быть серединой отрезка, принадлежащего множеству А. Теорема Крейна — Мильмана утверждает, что компактное выпуклое множество в отделимом локально выпуклом линейном топологическом пространстве совпадает с замыканием выпуклой оболочки своих крайних точек.
Доказательство теоремы А. А. Ляпунова. Положим р = | pi | + ... +1 рп |, где, как обычно, | р/1 = = р+ + р~, а р+ и рг — положительная и отрицательная составляющие меры рг- (см. петит на стр. 28). Мера р конечна и положительна и все меры pi, ...» рп абсолютно непрерывны относительно меры р (так как для всякого А имеем (рг(А) |	|р| (А)). Обозначим
через ХДО плотность меры рг- относительно р. Рассмотрим в L^T, S, р) множество
1Г = (a(’)e£J0<a(f)<l, VtG=T}.
Множество W выпукло, ограничено и слабо * замкнуто (ведь Loo сопряжено с Li), а значит, слабо* компактно. Рассмотрим оператор Р из Loo в Rn, ставящий в соответствие каждой функции a(-)e Loo вектор
(•) = f f а (0	• • •, J a (t)	=
\т	т /
= f | a (0 (f) dp, ..., J a (t) hn (t) dpA.
\r	т	/
§ 8.2. ИНТЕГРИРОВАНИЕ
, 351
Этот оператор линеен и непрерывен в слабой * топологии Loo (поскольку все функции М’) принадлежат Ц). Поэтому множество PW выпукло и замкнуто. Мы покажем, что множество значений меры т совпадает с множеством PW. Поскольку множество значений меры т, очевидно, содержится в PW, в доказательстве нуждается лишь обратное включение.
Пусть х = (х1, ..., xn)e PW и
Wx = {a(-)e=W\Pa(-) = x}.
Имеем Wх = W Р~1 ({х}) и, так как множество p-i({x}) выпукло и слабо* замкнуто как прообраз выпуклого замкнутого множества при линейном и непрерывном отображении, множество Wx выпукло и слабо * компактно. По теореме Крейна — Мильмана множество Wx содержит крайнюю точку ао(’). Мы покажем, что ао(/) не может принимать значений, отличных от нуля и единицы на множестве положительной меры. Утверждение теоремы А. А. Ляпунова следует отсюда немедленно, так как, если = {/е 7’|ао(0== О» то
х1 = J	(Г) dp = р{ (Ао),
А
т. е. х принадлежит множеству значений векторной меры т и (поскольку элемент х произволен) последнее содержит множество PW. .
Итак, пусть а(-)—крайняя точка множества Wx. Предположим, что на множестве положительной меры a(f) принимает значения, отличные от нуля и единицы. Тогда для некоторого е > 0 мера множества
A=UeT|8<a(0<l—е}
положительна.
Рассмотрим пространство Li(A) и в нем подпространство М, порожденное ограничениями функций Хг(-), i = 1..п, на А. Подпространство М конечно-
мерно и, значит, замкнуто. В силу следствия 2 из теоремы Хана — Банаха аннулятор подпространства М
352
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
содержит ненулевой элемент, т. е. существует определенная на Д измеримая и ограниченная функция р(/) такая, что
НР(-)Ноо=1. J MW)dH = 0, д
Положим
( 0, если t ф Д, ₽(/)= -
I Р (/), если t <= Д.
Тогда, очевидно, 0 a (t) ± ер (/)	1 при / е Г и
Р(а(.)±еР(.)) =
= И (а (0± ер (0)^(0 dit, ...
\Г
.... J(a(0±ep(0)M0dp|== т	/
— ( J а (О М (0 dfi, ..., | а (О (0 я?мЛ = х. \т	т	/
Но, поскольку р(/)=0=О, это значит, что а(-) не может быть крайней точкой множества Wx, вопреки предположению. Теорема доказана.
8.2.3.	Доказательство теоремы 1. Первая часть теоремы следует из второй, так как, если хД/) и х2(/) — два суммируемых сечения отображения F, то, применяя вторую часть теоремы к отображению t —>{xi(Z)} U U {х2(/)}, мы сразу получаем утверждение первой.
В свою очередь вторая часть теоремы вытекает из следующих двух предложений*
Предложение 1. Пусть (Г, 2, ц)—пространство с положительной мерой (не обязательно непрерывной) и F — нормальное многозначное отображение из Т в Rn. Тогда всякое измеримое сечение x(t) отображения /—>convF(/) представимо в виде k
(1) *=1
где k^.n-^1, функции a-i(t) неотрицательны и из-k
меримы, 2 «ДО = 1 при всех t, a Xi(t) — измеримые i==l
сечения отображения F.
§ 8.2, ИНТЕГРИРОВАНИЕ
353
Предложение 2. Утверждение теоремы 1 верно, если
/7(/)={х1(0}и ... U Ы)},
где Xi(t), xm(t)—суммируемые вектор-функции.
Допустим, что предложения 1 и 2 уже доказаны.
Для доказательства теоремы нужно проверить, что
j (conv F (/)) dp с. j F (/) dp.,	(2)
т	т
поскольку обратное включение очевидно. Пусть х е е J (convF (/)) dp. Тогда существует суммируемое сечение x(t) отображения convF такое, что ^х(/)б/ц=х. т
В силу предложения 1
k
х (О = 5 (0 xt (О, Z=l
•	k
где функции аг (О измеримы, 2 а2 (/) = 1 на Т, а х( (!) — /=i
измеримые сечения отображения F. Рассмотрим многозначное отображение Ft (!) = {Х] (/)} U   • U {xk (/)}. Очевидно,
J Fi^dpcz j F(i)dp; x e J (conv Ft (/)) dp. (3) т	т	т
Поскольку ] x l<r (i), если (i, x)egrF, все х2(/) суммируемы. Поэтому в силу предложения 2
j Fi (!) dp — J (conv Ft (0) dp. т	т
Отсюда и из (3) следует, что x s j F(i)dp. Таким образом, осталось доказать предложения 1 и 2.
Доказательство предложения 1. Положим
{/г + 1
а = (си» • • •, ctrt+i) Rn+I | a, 0, at — 1 t=i
12 А. Д. Иоффе, В. М. Тихомиров
354
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
и рассмотрим отображение g произведения Rn+I X XR"X ••• XITbR", определенное следующим образом:
п + 1 раз п + 1
g(a, хь ...» х„+1) = 2 atXi.
i=l
Пусть Fn+1 (t) = F(ОX • • • X^(0- Тогда, очевидно,
п+1 раз
Fn+l — нормальное многозначное отображение из Т в (R")'l+1. Положим далее
Ф (0 = [а е= S, (хь .... х„+1) <=
eFn+1(OI g(a, Xt......x„+1) = x(0}.
Поскольку convF(Z) при всех /, множества Ф(/) непусты. С другой стороны, в силу теоремы 3 из § 8.1 многозначное отображение Ф нормально. По теореме 1 существует измеримое сечение отображения Ф, т. е. такие измеримые a(t)=	..., an+i (/)), МО,...
* .., Xn+i(t), что n+1
<х> (0 >0, 5 а{ (Н 1, Xt (0 е= F (/),
Z=1 n + 1 2 ai(t)x{(t) = x(t). i=l
До казательство предложения 2. Предложение очевидно, если m= 1. Допустим, что оно верно при m = k — 1. Докажем его при m = k, F(t) = = {x\(t)} U ... U {xft(/)}. Рассмотрим многозначное отображение /—><?(/)= {х2(/)} U ... U {xft(/)J. Поскольку convF(t) = conv((conv G(?))U {Xi(/)}), то, рассуждая, как при доказательстве предложения 1, можно показать, что всякое измеримое сечение x(t) отображения convf представимо в виде
х (0 = a (t) xt (t) + (1 — а (0) У (0,	(4)
где а (0 и у (t) измеримы, 0 а (0 и у (t) е conv G (/). Пусть хе (convF(t)) dp. Тогда х— j x(t)dy., где х(0 в силу (4) можно представить в виде
x(t) = y(t) + a(t)(Xl(t)-y(t)).
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
355
По теореме А. А. Ляпунова найдется такое измеримое множество A с Т, что
/ а (0 (*i (0 — У (0) dp = J (xi (О — У (0) dp, Т	А
откуда
х = J xi (0 dp + J у (/) dp.
А	Т\А
Но y(t) е conv G(f). По предположению индукции найдется такое измеримое сечение z(t) отображения G, что J y(t)dp = У z(t)dp.
7"\А	Т\А
Но в этом случае
| Xi (t), если t е А, и “ I z (0, если t е Т \ А, есть измеримое сечение отображения F и У u(t)dp=x. Предложение доказано.
§ 8.3.	Интегральные функционалы
8.3.1.	Определение и элементарные свойства. Пусть снова (Т, S, ц) — пространство с конечной положительной мерой и f — интегрант на TXRn- Пусть, далее, x(t)— произвольное отображение из Т в Rn. Положим
•?/(*(•)) = inf
а (0 dp |а (•) 6= £„ а (0 > f (t, х (0)
Другими словами, J/(x(-)) есть нижняя грань интегралов суммируемых действительных функций a(t) таких, что а(0 f (t, x(t)) почти везде. При этом, как обычно, предполагается, что inf0 = oo. Функционал 5</(х(-)), определенный на множестве всех отображений из Т в R", называется интегральным функционалом, порожденным интегрантом f. Разумеется, если при данном x(t) функция f x(t)) интегрируема, то
^(х(-))=У f(i, x(t))dp.
т
12*
356
ГЛ 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Через 2fftP мы будем обозначать ограничение функционала 3^f на пространство Lp = LP(T, 2, ц) (т. е. функцию на LPi совпадающую во всех точках пространства £р с ^f).
Предложение 1. Если dom^f*. Р¥=0, то3^1,р> > — со на Lp> (где, как обычно, 1/р 4-1/р'= 1).
Доказательство. По неравенству Юнга — Фен-хе ля
f(t, x) + f* (t, //)>(х|у),
откуда сразу следует требуемый результат.
Предложение 2. Пусть f — измеримый интегрант на Т X Rn и dom «7/, р #= 0. Положим
a(/) = inff(/, х).
Тогда
j a (0 dp. = inf (х( •)) |х( •) е Лр). т
Доказательство. Функция а(0 измерима в силу предложения 10 из § 8.1. С другой стороны, если х( •)е dom.7/, р, то f (/, х(/)) a(f) и, значит, a(t) интегрируема. Очевидно,
J a(0dp<inf №f (х (•)) |х (•) е= Lnp}. т
Докажем обратное неравенство. Коль скоро j a(/)dp,<°°> т
a(/)<oo почти всюду. Пусть
Тоо={/еТ|а(/) = -оо}.
Зададимся произвольными е > 0 и N < 0. В силу предложения 9 из § 8.1 существует измеримая вектор-функция Xo(t) такая, что
f(t, Хо(/))<<
N,
“W + Wr
если t е Г , оо7
если t ф Тх.
Пусть, с другой стороны, %, (•) е dom р, т. е. существует суммируемая действительная функция ai(/), та-
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
357
кая, что	почти везде. Выберем число
6 > 0 столь малым, что j (t) dp < е/2, лишь только д
р(Д)<6. Выберем, наконец, число М > 0 столь большим, что мера множества {/ е Т | |х0(/) | > Л4} меньше 6. Положим
_ ( х0 (t), если | х0 (0 | < М, Х I xi (0» если | х0 (t) | > М.
Тогда х( •) е Z," и
^(х(-))<| + АГц(Гте)+ J (а(0 + |ц(ф|х.
Если ц (Т") >0, то в силу произвольности N отсюда следует, что inf5'fiP =— оо. Если же ц(Тоо) = 0, то (уже из-за произвольности е)
inf ^1Р< | a(0rfg. т Предложение доказано.
Теорема 1. Пусть f — измеримый интегро нт на Если dom^j, р^=0, то St], P = &f*. Р'.
Доказательство. Пусть y(-)^Lp>. Положим Фр (А х) = — (у (0 |х) + f (t, х).
Тогда фу — измеримый интегрант в силу предложения 7 из § 8.1. Кроме того, dom5<(Pff,p = dom^.p?^ 0. Согласно предложению 2
Р'(У( •)) = —/ inf (/, x)dp = —
=Ы(-))
Отметим одно полезное следствие из этой теоремы. Следствие. Пусть F — нормальное выпуклое многозначное отображение из Т в Rn. Тогда всякое множество
Qp = [х (•) е Lp \ х (/) е F (t) почти всюду}
358
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
выпукло и слабо (в случае р = оо— слабо*} замкнуто в Lp.
Доказательство. Положим f(t, х) =6(x\F(t)). Тогда (теорема 4 из § 8.1) f*(t, у} = s(у |F(/)) — нормальный выпуклый интегрант. Поскольку s(0|F(/)) = 0, функция y(t} = 0 содержится в dom«3^*, р/. Поэтому
p.(x(.)) = 5<f,p(x(.)) = 6(x(.)|Qp).
Остается применить предложение 2 из § 3.3.
8.3.2.	Конволюционный интеграл и непрерывная сумма. Пусть f — интегрант на Т X Rn- Конволюционным интегралом интегранта f по мере ц, или конволюцион-ным интегралом функций ft, называется функция на Rn,
обозначаемая	и определенная равенством
т
I у ft d[i j (х) = inf J a e R | (a, x) e epi ft d\k I.	1
\r /	l	т	1
Если для всякой суммируемой вектор-функции x(t) Ц функция f(/, х(0) измерима и интеграл J f(t, x(t))dp> Я (конечный или бесконечный) имеет смысл, то, как еле- л дует из определения, при всяком хе Rn значение кон-волюционного интеграла функций ft совпадает со зна-чением задачи
j fit, x(0)rfp->inf; т
J х (/) d\k — х. т
Функция на Rn, определенная равенством
h (х) =
= inf J f a it) dp | a (•) e L
x) почти всюду
называется непрерывной суммой, или интегралом функций ft и обозначается j ftd\k, или J fit, •)d[i. Если для т	т
всякого xeR"1 функции t->f(t, х) измеримы и инте
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
359
гралы f (t, х) d\i имеют смысл, то очевидно
J ft Ф) (*) = J f (f, X) dp. ,T / T
Связь конволюционного интеграла и непрерывной суммы с интегральными функционалами совершенно прозрачна. Именно,
ft dpA (х) = inf |	(x (•)) | x (•) e J x (t) dp = x
.f / l	т
а непрерывная сумма j ftdp есть просто ограничение интегрального функционала 3rf(x(-)) на множество тождественно постоянных функций. Эти утверждения допускают следующую эквивалентную формулировку. Рассмотрим пару линейных операторов Р: L? -*R" и Q: Rrt-►££>, определенных формулами
Рх (•) = J х (0 dp; (Qx) (0 s= х.
т
Легко видеть, что операторы Р и Q непрерывны (во всех естественных топологиях пространств L\ и L»), а простая выкладка
{У |Р* (•)) = [у 1 / х (0	= j {у ]х (/)) du = {Qy, х (•))
\ Г	/Г
показывает, что эти операторы сопряжены. С помощью операторов Р и Q отмеченную выше связь между кон-волюционным интегралом и непрерывной суммой, с одной стороны, и интегральными функционалами, с другой, можно описать следующим образом.
Предложение 3. Пусть f — интегрант на Г X Rn-Тогда
jfidp = PJf.l> J ftdp. = 3ff,ae,Q. т	т
Другими словами, конволюционный интеграл 'функций ft — это образ функции при отображении Р,
360
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
а непрерывная сумма функций ft — прообраз функции Jj, оо при отображении Q.
Теорема 2. Пусть f — измеримый интегрант на
Т\^п. Тогда, если dom(% f/rfp) ¥= 0, то
IJ ft = [ ft dp.
\т	It
Если же, кроме того, мера ц непрерывна, то ftd^ — выпуклая функция и
^ftdp = ^fTdp. т т
Доказательство. Коль скоро dom	ft dpj ¥=
=# 0, то в силу предложения 3 и dom 5^/, i =/= 0. Тогда j в силу теоремы 3 из § 3.4 и теоремы 1	Я
(£ ft dpX = (PJf,,)’ = J г. ^P' = Jr. ooQ = J ft dp. fl
\T /	T	
Если же мера ц непрерывна, то по теореме 1 из § 8.2  множество J epi ft d\k выпукло, поэтому и jf/dp — вы- ж т	т	Ж
пуклая функция. Наконец, согласно следствию 2 из || теоремы Фенхеля — Моро
$ ft dp = f J- ft ф) = |7 Я=	|
T	\T J \T /	.	Ijr
= / J fr dpX = / у fr dp\" = У fr dp. I \r J \T j т	f-
ж
8.3,3.	Функционал &JtOO. В заключение мы более по- | дробно изучим интегральные функционалы на простран- | стве (Т, S, р). Мы рассмотрим условия, обеспечи- > вающие их непрерывность в сильной топологии про- 1 странства £^>, и вычислим их субдифференциалы. j
Предложение 4. Пусть f — нормальный выпук- ¥ лый интегрант на T\Rn, и в некоторой точке х0(-)^ I
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
361
функционал <7/>оо конечен. Тогда следующие условия эквивалентны:
а)	функционал 3^,п непрерывен в точке х0(-) относительно нормированной топологии пространства Ln;
б)	существует е > 0 такое, что при всяком х е R\ |х|< е, функция /(/, х0(/) + х) ’суммируема-,
в)	для некоторого е > 0 функция
г (/) = sup {f (t, х0 (/) + х) |х е R", | х | < е}
суммируема.
Доказательство. Из а), очевидно, следует б). Если выполнено в), то функция J},*» ограничена сверху в шаре радиуса 8 с центром в точке Хо(-) и конечна в этой точке. Поэтому функция <7/, оо непрерывна в этой точке (теорема 1 из § 3.2), т. е. в) влечет а). Таким образом, нам нужно проверить, что из б) следует в).
Пусть выполнено условие б). Если е\, ..., еп — некоторый базис в Rn, то выпуклая оболочка векторов ±?h, k=\, ..., п, содержит шар достаточно малого радуса 6 > 0. По условию для некоторого а > 0 все функции х0(0± суммируемы; поэтому суммируема и функция ф(/) = шах/ (t, х0(/) ± aek). Если 0 < е < аб, то, поскольку все функции ft выпуклы, /(/, хо(О + *)	ф(0 для всякого вектора xeRn, норма
которого не превосходит 8. Следовательно,
f (t, ХО (0) < sup [f (t, x0 (0 4- x) II X | < e}<Ф (t).
Предложение доказано.
Перейдем к вычислению субдифференциалов функций «7у>оо. Если х*—линейный непрерывный функционал на Ln, то через (х*,х(-)) мы, как обычно, обозначаем каноническую билинейную форму на	Гово-
рят, что функционал х е (£^) абсолютно непрерывен, если существует вектор-функция у (•) е L” такая, что
<х\ х( •))== J (y(t)\x(t))dn т
для всех х( •) Ln. Сама вектор-функция #(•) в этом случае называется, плотностью функционала х*.
362
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Теорема 3. Пусть f — нормальный выпуклый интегрант на	Предположим, что — собственная
функция, непрерывная в некоторой точке х( •) е Тогда, если х0 (•) е domyf то всякий функционал х* <= g=(L")’ , принадлежащий субдифференциалу d3^ftoe>(x0(*)), допускает представление
x3 = xt + x2,
где X2^N(xq( •) |с!от5^,то), а х* — абсолютно непрерывный функционал с плотностью у (•) такой, что у (/)е е dft (хо (0) почти при каждом t.
Доказательство теоремы опирается на две вспомогательные леммы.
Лемма 1. При выполнении условий теоремы множество
Л = (х5-^(Хо(-)|дот5</_))П^,00(Хо(-))
слабо* компактно в (ИГ-
Лемма 2. Пусть выполнены условия теоремы и А — множество, определенное в формулировке леммы 1. Тогда всякий функционал ?еД, на котором линейная функция 1(х*) = {х*, х( •) — х0(-)) достигает своего максимума на множестве А, абсолютно непрерывен.
Предположим, что обе леммы уже доказаны. Положим xi=x’, где х*— точка максимума функции /(х*) на множестве А. Такая точка обязательно существует, поскольку множество А слабо * компактно в силу леммы 1, а функция /(х*) слабо* непрерывна на (£»)*. Пусть, далее, Хг = хо—Хь Функционал xi абсолютно непрерывен в силу леммы 2, а х$ е N (х0( •) |dom.!7fi00) по определению множества А. Обозначим через y(t) плотность функционала х‘. Нам нужно проверить, что y(t)^dft(x0(l)) почти всюду.
Пусть x(-)s dom5й/,оо. Тогда для всякого измеримого множества Д с: Т функция
| х0 (/), если t Д, ( х (/), если t е Д
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
363
тоже принадлежит множеству с1от5^>оо. Поэтому
<%ь Х1 (•) — х0( •)) = j (у (t) |х(0 — х0(ф dp < д
<5<f(x1(-))-^(x0(-))= J x(t)) — f(t, х0(/))]й?ц д
для всякого измеримого множества A cz Т. Отсюда следует, что
x(t))-f(t, хо(0)
почти при всех t. Поскольку f — измеримый интегрант и — собственная функция, мы можем выбрать аппроксимирующее семейство {(am(/), xm(t))\m = 1, 2, ...} измеримых сечений многозначного отображения t—*epifj так, что все хт(-) принадлежат £», а все ат(-) суммируемы (см. замечание после теоремы 1 в § 8.1). Тогда по доказанному почти при каждом t
(У (О I хт (/) — х0 (0) < ат (0 — f (t, х0 (0)
для всех m=l, 2, ... Множества
{(a, x)eRXR't|3rn:a = am(0, x = xm(t)}
плотны в epi ft почти при всех t. Значит, на множестве полной меры в Т неравенство
(y(t) |х — х0(/))</(£ х) — f(t, х0(/)) выполняется для любого х е dom ft и, следовательно, для любого хе Rn, т. е. y(f)^ dft(x0(t)) почти при каждом t. Теорема доказана.
Доказательство леммы 1. Поскольку по условию функция ^/,00 непрерывна в некоторой точке х(-), найдутся такие е > 0, с > 0, что неравенство I<»(х(*)J^(•)) с выполняется, лишь только ||х( •) Поо е. Поэтому, если || х (•) ||да < е, х’ е А, то (X*. x(.))<^f(x(-) + x(.))-
— Jf (х0( •)) — <х’, X (•) — х0 (• )Х с — 3ff (х0 (•)) — — <х‘, х(-) —Х0(-)) = С1 < оо,
т. е. ||х*|| < С1/е. Таким образом, Л — ограниченное множество. Но оно и слабо * замкнуто, поскольку таковы
364
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Л7(х0(-) |dom<7/,оо) и д<7/|00(хо(-)) (см. п. 4.2.1). Следо-' вательно, множество А как ограниченное и слабо * замкнутое множество в сопряженном пространстве слабо * компактно. Лемма доказана.
Пусть х (•) е Для всякого измеримого множества Д GZ Т положим
Г х(Л, если /е Л, = { 01 сс.и(^д.
Если же х* е (££>)*, то через хд обозначим функционал, определенный формулой
<хд, х(-)) = <х‘,хд(-)).
Очевидно, || хд || || х* ||. Для доказательства леммы 2 нам понадобится следующий критерий абсолютной непрерывности функционалов на (Л«)*.
Предложение 5. Функционал х*е(Л^,) абсолютно непрерывен тогда и только тогда, когда || x\k || -> О для всякой последовательности {А*} измеримых подмножеств множества Т, такой,, что ц(А*)->0.
Доказательство. Необходимость, очевидно, следует из определения. Докажем достаточность. Для всякого ХЕ Rrt положим x(t)=x, Ф(А, х) = (Хд. х(-)), При фиксированном х функция Ф(Д, х) есть функция множеств, определенная на алгебре S измеримых подмножеств множества Т, аддитивная, так как, очевидно, если Ajf] Д2 = 0, to®(AiUA2, х) = Ф(Аь х)4-Ф(А2, х), и абсолютно непрерывная относительно меры ц, поскольку | Ф(А, х). |^|| хд || • | х | и || Хд ||->0 при ц. (А) —> О по условию. По теореме Радона — Никодима
Ф (А, х) = J qp (t, х) dp, д
где функция t—>ф(^,х) суммируема на Т при всяком х е Rn. С другой стороны, по определению
J ф (f, ах( + ₽х2) dp = J (аф (t, xj + ₽<p (t, x2)) dp
Д	Д
для всякого измеримого множества AczT. Поэтому для
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
365
каждых а, р, х2 равенство
ф (/, ах| + рх2) = аф (t, Xj) 4- Рф (/, х2)	(1)
выполняется почти при всех t. Если теперь вь ..., еп — некоторый базис в Rn, yk(t) = eh), то из (1) следует, что
ф(Л х)= 2 xkyk(t) k=A
почти при всех t для любого
Таким образом, для всякой вектор-функции х(-)е е ££, постоянной и равной х на некотором множестве Д и равной нулю вне Д,
<х’, х (• )> = (х*д, х (• )> = Ф (Д, х) = J (у (t) |х (0) dp. (2) д
Но линейная оболочка множества таких вектор-функций плотна в Li. (В самом деле, если x(-)eLi, т — натуральное число и хт( •) е Li такова, что х^(/)= — ilm, если i/tn ^.xk(t) (г + l)//n, t = 0, ±1..то
вектор-функция хт (/) принимает лишь конечное число значений, так как х (t) ограничена, и || хт (•) — х (•)
1/т.) Поэтому равенство (2) справедливо для всех x(-)eLi. Предложение доказано.
Доказательство леммы 2. Пусть линейная функция I (х’) = <х’, х (•) — х0 (•)) достигает максимума на множестве А в точке х*. Предположим, что функционал х* не является абсолютно непрерывным. Тогда для всякого натурального k найдется Aft cz Т такое, что	l/k и |хдА6 > 0 при всех k—l, 2, ...
Последовательность {хдй} ограничена в (Li)*, так как || x\k ||	|| х ||, и значит, имеет в (Li)* слабо предельную
точку х*. Поскольку по условию х	ft00 (х0 (•)), для
всякой х (•) е dom 3 те
(ХдА, X (•) — х0 (• )> = (х*. х0> Г\д4 (•)+хдй (• )-х0 (• )><
<^(хо,гчда(-) + хда(.))-^(хо(-)) =
= j[f(L	xo(O)]c/jx.
366
ГЛ. 8. ИЗМЕРИМЫЕ МНОГОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
Поэтому
<х‘, х(-) —х0(-)><Нт (Хдй, х(-) —х0(-);<0 (3)
для всех х( •) е йотЗ'У то, т. е.
х*<=ЛГ(х0( •) |dom^f> J.
С другой стороны,
<Х	*'(’) Хо ( • )) ==	\&k’ % (’)	*0 ( ' )>
< Vf (%0Aft ( • ) + Xr\Afe ( • )) - yf (Xo( • )) -
->^f(x(-))-Jf(x0(.)), t. e.
<x‘ — x*, x (•) — x0 (• )>< (x (•)) —	(x0 (•))
для всякого x (•) e dom^f. 00. Поэтому
Г —x’ed^f>oo(x0(.))
и, следовательно, x* — x‘ e A.
Наконец, поскольку функция Stнепрерывна по условию в некоторой точке х(-), мы можем выбрать е > 0 таким образом, чтобы функция
г (0 = sup {f (t, х (0 + х) | х е Rre, | х К е} была суммируемой (предложение 4). Тогда в силу (3) О > sup {(х‘, х (•) + х (•) — х0 (•)) | х (•) «= L£,
IIх(•) IL<4><х‘, х(-) —х0(-)) + еб, т. е.
<х‘, х(-) —х0(-))< —ед и, значит,
I (х* — х‘) = <х* — х*, х (•) — х0 (• )> > I (х‘) + ед > I (х‘), что противоречит выбору х*, поскольку х* — х*еЛ, Лемма доказана.
С помощью теоремы 3 можно получить описание субдифференциалов непрерывных сумм.
Теорема 4. Пусть f — нормальный выпуклый интегрант на Т\ Rn. Предположим, что функция J ftdp,— собственная и внутренность ее эффективного т
§ 8.3. ИНТЕГРАЛЬНЫЕ ФУНКЦИОНАЛЫ
367
множества непуста. Тогда для всякого хе Rn
д / J ft dp'j (х) = j dft (х) dp + N /х | dom J ft dp'j.
Доказательство. Если x e int (dom J ft dp j, to в силу предложения 4 функция ^>оо непрерывна в точке Qx, где Q: Rn->L» — оператор, введенный в предыдущем пункте. В этом случае теорема 2 из § 4.2 и предложение 3 позволяют утверждать, что
дН ft dp'j (х) = Q*d&f, (Qx). \г /
Пусть x*ed5<f oo(Qx). По теореме 3 х* = х* + *2, где X2ey(Qx|dom^fi00), a xj — абсолютно непрерывный функционал с плотностью у (•) s L? такой, что у (t) е е<ДДх) почти везде. Тогда
Q*xi = Pz/(.) = J y(t)dn. т
С другой стороны, для всякого z е dom J ft dp
О < <х5, Qx — Qz) — (Q*X21 x — z), t. e.
Q’xa e N (x I dom J ft dp j.
Таким образом,
д (j ft dp'j (x) cz J dft (x) dp + W fx | dom j ft dp\. \T / T	\	T /
Проверка противоположного включения не представляет труда. Теорема доказана.
Глава 9
СУЩЕСТВОВАНИЕ РЕШЕНИЙ
В ЗАДАЧАХ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
В этой главе собраны теоремы, группирующиеся, главным образом, вокруг проблемы существования решения, хотя в отдельных местах мы возвращаемся к необходимым или достаточным условиям экстремума. Изложение начинается с результатов, построенных по образцу классических теорем Тонелли и Нагумо, в которых существование решения следует прямо из того, что полунепрерывная снизу на компакте функция всегда достигает нижней грани (§§ 9.1, 9.2).
В последнем параграфе подробно рассматриваются задачи о вычислении конволюционных интегралов, эквивалентные линейным задачам оптимального управления. Этот параграф может читаться независимо от предыдущих. В этой главе рассматриваются только задачи с закрепленным временем. Обобщение всех результатов на задачи с более общими граничными условиями требует лишь незначительного усложнения доказательств и не связано с принципиальными затруднениями.
§ 9.1. Полунепрерывность функционалов вариационного исчисления и компактность их лебеговских множеств
9.1.1. Предварительные замечания. В этом параграфе рассматриваются функционалы вида
Л
ЗЧх(-))= J fit, x(t), x(t))dt,
*0
где f(t,x,y) — нормальный интегрант на [/0, Л]ХКПХ X Rn. Функционалы У по форме соответствуют функционалам классического вариационного исчисления. Однако, как мы увидим в следующем параграфе, проблема существования решения в задачах оптимального управления тоже сводится к изучению функционалов такого вида. Функционалы «7 мы будем рассматривать
§ 9.1. ПОЛУНЕПРЕРЫВНОСТЬ
369
в пространстве Wi, ь однако, как правило, относительно топологии равномерной сходимости функций из этого пространства.
Прежде чем формулировать и доказывать теоремы полунепрерывности и компактности, рассмотрим два примера, которые помогут уяснить условия этих теорем. Первый пример принадлежит Больца. Рассмотрим функционал
1
3 = J [(1 — х2)2 + х2] dt. о
Если
= (—1)* при (k —	< k/tn, k—\, tn,
xm (0) ~ 0,
то, как легко видеть, Sf (хто( •))-*() и xm(0~*0 равномерно. С другой стороны, 5^(0) = 1. Это значит, что функционал 3f не является полунепрерывным снизу в точке х(-)=0. Нетрудно понять, что отсутствие полунепрерывности в данном случае связано с невыпук-лостью функции «/->(1—у2)2.
Нормальный интегрант f(t,x,y) называется квазире-гулярным, если при всяких tе[/0, хе R" функция у -* f(t, х, у) выпукла. Оказывается, что при некоторых дополнительных предположениях функционал ЗГ с ква-зирегулярным интегрантом f полунепрерывен снизу на Wi, 1 относительно топологии равномерной сходимости.
Второй пример — это уже знакомый нам пример Вейерштрасса (см. пример 5 из § 2.2):
I
3 = / t2x2 dt. о
Мы видели, что на последовательности функций xn(t) = t'ln
значения функционала «7 ограничены (и даже сходятся к абсолютному минимуму этого функционала), а сама последовательность хт(-) «сходится» к разрывной функции. Другими словами, лебеговские множества функционала У не компактны относительно топологии
370
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
равномерной сходимости. Причина этого явления, как уже отмечалось, заключается в том, что по мере приближения t к нулю функция у t2y2 растет по у все более и более медленно, и таким образом, функциям, имеющим большие производные в малой окрестности точки /=0, могут соответствовать малые значения функционала Sf.
Говорят, что измеримый интегрант ф, определенный на произведении [/0, MXRn, удовлетворяет условию роста, если (tl \
J ф* dt j = Rn,
где | <р’ dt — интеграл функций <р? (см. § 8.3). Если интегрант <р удовлетворяет условию роста, то
lim -г—7——гл— — 00,
т. е. функция З'ф растет быстрее нормы при ||у (•) ||i->°o, Л
где (у (•)) = | <р (f, у (/)) dt. В самом деле, если функ-*0
ция /->ф*(/, р) суммируема для всякого р е Rn, то в силу предложения 4 из § 8.3 для всякого k > 0 функция
М0 = sup ф‘(/, р)
I р|<*
суммируема. Поэтому при у (•) е L"
Л	Л
^G/(-)) +J rk(t)dt>k$\y(t)\dt tfi	f0
для всякого k > 0, откуда и следует требуемый результат. Мы увидим, что лебеговские множества функционала «7 компактны, если интегранты (/, y)~*f(t, х,у) удовлетворяют условию роста в том или ином смысле равномерно по х,
9.1.2. Признаки компактности множеств в функциональных пространствах. Напомним сначала условия компактности множеств в некоторых функциональных пространствах. Пусть со (/)—функция, определенная на
[ § 9.1. ПОЛУНЕПРЕРЫВНОСТЬ
371
полуоси [0, оо) (принимающая, возможно, и бесконечные значения). Функция со(/) называется модулем, если она неотрицательна, не убывает, со(0) = 0 и со(/)~>0 при t->Q. Множество A cz Сп называется равностепенно непрерывным, если существует такой модуль со(/), что
|х(0 — х(т) |<й(П-т|)
для всех х(-)еД, t,	Модуль a(t) в этом слу-
чае назовем модулем непрерывности множества А. Множество AcLi называется равномерно суммируемым, если существует модуль ©(/) такой, что
J | х (/) | dt © (mes А) д
для всяких х(')е/1 и измеримых множеств Дс[/0, М (здесь mesA— лебегова мера множества А). Модуль ©(/) в этом случае называется модулем суммируемости множества А.
Предложение 1 (теорема Арцела). Множество А с Сп фо Л Л) относительно компактно в сильной топологии тогда и только тогда, когда оно ограничено и равностепенно непрерывно.
Доказательство см. Колмогоров и Фомин [1], стр. 103.
Предложение 2 (критерий слабой компактности в Li). Множество AczL"([t0, /J) относительно компактно в слабой топологии в том и только том случае, когда оно равномерно суммируемо.
Доказательство. Мы можем отождествить пространство Li с множеством абсолютно непрерывных функционалов на А». При этом слабая топология в L" равносильна топологии, индуцируемой на А" слабой* топологией пространства (££,)*. В пространстве (£«)*, как и во всяком сопряженном пространстве, ограниченные и слабо* замкнутые множества слабо* компактны. Поэтому множество А с £" слабо относительно компактно в L" тогда и только тогда, когда оно ограничено по норме и его замыкание в (£«) относительно слабой* топологии содержится в £".
372
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Если множество А равномерно суммируемо и |Я его модуль суммируемости, то, выбрав число е > 0 так, 'Я что со (0^1 при	и разбив отрезок [/0, точ- «
ками tQ = т0 <	. < xm = t{ на отрезки длины,
меньшей е, получим для всякого х(-)^А	д
т	т
||*(-)II1 = S J	—Ti-1 1)</и,	$
1 = 1 Tf_j	1=1
t. e. множество А ограничено по норме в L". С другой А стороны, если функционал х* принадлежит слабому* ? замыканию множества А в (l£>), то для любого '
1« #(•))!< sup <Х( • ), £/(•)>, х(-)еД
т. е., в частности (см. § 8.3),
|| Хд ||^ sup [ | х (/) со (mes А). х(-)еА
Отсюда в силу предложения 5 из § 8.3 следует, что х* — абсолютно непрерывный функционал, т. е. он принадлежит L". Таким образом, равномерная суммируемость множества А достаточна для того, чтобы оно было относительно слабо компактно в L\. Столь же просто доказывается и необходимость.
Следствие. Пусть множество Л cz L\ равномерно суммируемо и В—множество в Сп, образованное функциями
t
х (0 = xQ + | и (т) dr, h
где и(-)^А. Тогда множество В относительно компактно в Сп и всякий модуль суммируемости множества А является модулем непрерывности множества В.
9.1.3. Компактность лебеговских множеств. Мы начнем с доказательства двух вспомогательных лемм.
Лемма 1. Пусть ф— измеримый интегрант на [AUi]XR", удовлетворяющий условию роста. Тогда для
§ 9.1. ПОЛУНЕПРЕРЫВНОСТЬ
373
всякого с е R функция
inf
k>0
&c(t) = SWp
kl+ /1 rk (0 [dt
_____д_______
k
Ac[fOl /J, mesA^/
где rk(t)— sup ф*(/, у), является модулем.
I у
Доказательство. По условию функции t—► суммируемы для всякого у е Rn. Поэтому и все функции rk(t) суммируемы (доказательство этого факта дословно повторяет соответствующую часть доказательства предложения 4 из § 8.3). Отсюда следует, что сос(0<°° Для всех />0 и сос(О) = О. Неотрицательность и монотонность функции сос(0 очевидны. Осталось проверить, что coc(f)~*0 при /->0. Зафиксируем некоторое е>0 и выберем /?е так, что \c\/k&
е/2. Поскольку г&е(0 — суммируемая функция, мы можем указать такое 6 > 0, что
j,|rfee(O|^<y*e д
при mesA^S. Но в этом случае
А
fi>c(6)<sup
mes А б
8,
т. е. ©ДОС® ПРИ ^^б, что и требовалось.
Лемма 2. Пусть ifo и ф2— функции на [0, оо), удовлетворяющие следующим условиям:
а)	Ф1 неотрицательна и выпукла на [0, оо) и (0) = 0;
б)	ф2 неотрицательна, непрерывна и не убывает-,
в)	/“!ф1 (Z)-* 00 при
г)	существуют у > 0 и Ло > 0 такие, что (у*”1/) — — ф2(/+ Ло)-> °о при t->oo.
Тогда для всякого c^Q функция
<&с (0 =
__[ sup ф] (/-1Л) — ф2 (Л 4~ Лэ) /-1с}, если t > 0,
I	0,	если t = 0,
является модулем.
374
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
Доказательство. Функция &c(t) неотрицательна по определению. С другой стороны, так как выпукла и Ф1 (0) = 0, при 0 < t у
Ф1 (v-1^) < Y“‘^i G-'^) < (/“'Л).
Отсюда в силу б)
у hh (у-1Л) — ф2 (ь + м]'< t hl	— 11>2 (А- + ^)],
что согласно условию г) и определению соД/) дает
т. е. <ос(О конечна на [0, у]. Это же рассуждение показывает, что со не убывает по t. Наконец, если предположить, что lim сос (Zm) = 8 > 0 для некоторой последовательности /т->0, то
с > (Q'ac (Q) “ im^2 (®c (Q + 4) >
> <*c (*т)	(*m8) -	(®c (Q + Ao) =
= (M [(/й'е)-1<oc fe’e) - tm	-> 00
L	COc \lm) J
при tn—>oo в силу условия в). Полученное противоречие показывает, что <о(/)—>0 при t —>0. Лемма доказана.
Теорема 1. Пусть <р(/, х} — измеримый интегрант на [/0Д1] X Rn, удовлетворяющий условию роста. Тогда для всякого с е R множество
Ас={х(-)еЦ\^(х(-))^с}
либо пусто, либо относительно слабо компактно в L\..
Доказательство. Поскольку интегрант <р удовлетворяет условию роста, функция <р* (/, 0) = — inf qp (/, х) х
суммируема. Положим
tx
с, = с+ J I ф*(/, 0)|Л.
^0
Обозначим, далее, через <рд (/, х) ограничение интегран-та <р на Л X Rn и покажем, что для всяких измеримого
§ 9.1. ПОЛУНЕПРЕРЫВНОСТЬ
375
множества Дефо, Л] и х(-)еД0 справедливо неравенство
«Эф. (*(•))= f Ф(£ х(/))dt<Ci. Д	J
д
В самом деле,
с > J Ф (£, х (/)) dt — J ф* (t, 0) dt
Д	Ио, *11\Д
>5<фд(х(.))-]]<₽•(/, 0)|Л,
откуда требуемое неравенство следует непосредственно. Пусть, далее,
(0 (0 = sup
Лс[/0> Л1> mesA^f
В силу леммы 1 ©(/) есть модуль. Для доказательства теоремы достаточно проверить, что со(0 есть модуль суммируемости для Ас (если, конечно, это множество непусто). Пусть х(-)е4с. Для всякой вектор-функции р (•) е £« по неравенству Юнга — Фенхеля
[ (р(0|х(0)^<^ф (х(.))+^-	+	(/>(•)).
*	д	д	д
Поэтому для любого k
k J|x(0|tf = д
= sup И (p(t) \x(t))dt\p\-)еЦ, ||p(-l Д	)
<sup(q+/ф-(^ p(0)^|p(-)e£Sl, Ilp(-)IL<^1<
l Д	J
Д
376
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕН”
или, другими словами,
С| + [| rk (/) \ dt
I х (Z) | dt inf -----^—7-----------co (mes AV
ft>0	B
Теорема доказана.
Следствие. Пусть f(t, х, у) — нормальный инте-грачт на [fo, Z1]XR”XR"- Предположим, что для всех t, х, у
f(t,x,y)^q>(t,y),
где <р — измеримый интегрант на [/0, Л] X Rn, удовлетворяющий условию роста. Тогда для всякого ceR и для всякого ограниченного S cz Rn множество
Вс= {х(•	1 ([Zo, Z,])| x(Zo)<=S, J(x(•))<c)
либо пусто, либо относительно компактно в Cn({/0, /J).
Доказательство. Если	то
с. Требуемый результат следует из теоремы и следствия из предложения 2.
Для доказательства следующей теоремы нам понадобится одно неравенство, называемое интегральным неравенством Йенсена: если f — замкнутая собственная выпуклая функция на Rn, то для всякого измеримого множества A cz R конечной меры и для всякой вектор-функции %(-)е L]
j* f(x(Z))dZ>(mes	J x(t)dt
Д	'Д'
В самом деле, для всякого y^Rn
f f(x(t))dt^(y
д	\
J x(t)dt\- / Г (y)dt = д / д
= (у | J х (Z)	— (mes A) f' (у).
\ д /
§9.1. ПОЛУ НЕПРЕРЫВНОСТЬ
377
Поэтому
f f (x(0)<#>sup
J	У
д
у J х (t) dt\ — (mes A) f * (y) д /
— (mes A) f (—Ц- f x (/) dt ' "I mes A J v z
\	A
Теорема 2. Пусть функции ipi и i|)2, определенные на [0, оо), удовлетворяют условиям леммы. 2. Тогда для всякого с > 0 множество
[0, 2у]) I max (| х (0) |, ) х (2 у) |) < Хо, 2у
о
либо пусто, либо относительно компактно в С" ([0, 2у]). Доказательство. Пусть х(-)еВс. Положим V	2у
а, = J | х (0 | dt, а2 — J | х (t) | dt. о	v
Используя интегральное неравенство Йенсена и условие б) леммы 2, получаем
2у
J [ф1 (I X(О I)- 1MIx(t) |)]<й = о
V
= J [Ф1 (|х(0 I)-lf2(j x(t) \]dt + о
2у
+ jl^(R(OI)-^(|x(/)|)]d/> V
> УФ1 (Y_'ai) — ¥^2 P-o + O1) + Y4i (V-1«->) —	+ a>)‘
В силу условия г) леммы 2
inf (yip! (y-‘g) — уф2 + g)) = Cl > — 00 S>0
(очевидно, кроме того, что ct — Y'I’-’(M^O). Поэтому Y'4’1 (У-1«») — Y42 (Ло + a>) < c — Cj = c2, 1=1, 2,
378
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
и Отсюда в силу леммы 2 следует, что
Xq = max (ab a2) <of2 (y) < oo,
т. e. для всякого элемента x(-)eBc неравенство |х(/) | ЛоЧ~ М выполняется при всех /е[0, 2у] и, значит, множество Вс ограничено в Сп ([0, 2у]). Вместе с тем последнее неравенство совместно с условием б) леммы 2 дает
2у
/ ^1(1^(01)^<с + 2уф2(Л0 + Л1) о
для всех х(-)еВс. Нетрудно видеть, далее, что благодаря условию в) леммы 2 интегрант <p(f, у) — 4>i(|t/|) удовлетворяет условию роста (действительно, Л-1,ф1(%)—» —*оо при X—»оо; поэтому верхняя грань выражения '(p|f/)— '1’iUf/D по У конечна и достигается при всяком р). Согласно теореме 1 множество
{х(-) |х(- )€=Ве}сВ"
равномерно суммируемо; поэтому (следствие из предложения 2) множество Вс равностепенно непрерывно, а поскольку оно и ограничено, теорема Ариела влечет требуемый результат.
В заключение докажем одно условие компактности множества решений уравнения управляемого объекта.
Лемма 3 (лемма Гронуолла). Пусть a (/) — абсолютно непрерывная функция, определенная на отрезке Ro> М « удовлетворяющая почти при всех t неравенству
| а(0 |<са(0 + г(0,
где с>0, г(-)е£р Тогда при всяком t справедливо неравенство
(t	\
I a (U I + JI г (т) | е~с«-^ dx I ее
Доказательство. Положим
Л (t) = a (0 е~с (0 = — с (0 е~с
§ 9.1. ПОЛУНЕПРЕРЫВНОСТЬ
379
Тогда почти при всех t
| i (/)	+ ск (0 ес«~^ | < ск (0	+ г (/),
| — Д (/) ес — ср. (0 ес | ср (t) ес + г (/)>
или
k(t)
р. (0 ec(f_<o)^r (/).
Поскольку к (/о) = a (t0) = — р(/о)> отсюда следует, что t
к (/) a (t0) + j г (т) е~с dr,
t
р, (/)	«(Zo) + J г (т) dx.
10
Поэтому, с одной стороны, (/	\
I а (<о) I + J I г (т) dx I /о	/
а с другой —
(t	\
I а(#о) 1+ /1 r(T) |e~c(T~*o)dT j ес(/“Ч /о	'
Лемма доказана.
Предложение 3. Рассмотрим уравнение управляемого объекта
x — <j)(t, х, и), u^U.	(1)
Предположим, что вектор-функция <р удовлетворяет условиям Каратеодори и для всех t е [/о, Л], х е Rn, и е U справедливо неравенство
|(х|ф(/, х, и)) | <с| х р + г (О,
где с > 0, а г( -)е Ц ([/0> Л]). Тогда, каков бы ни был вектор Хо Rn, множество Q (х0) решений уравнения (1) с начальными условиями x(to) = Xo, определенных на [/о, Л] и соответствующих всевозможным измеримым
380
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
управлениям «(•), принимающим значения в U, относительно компактно в пространстве Сп ([/0, 6]) •.
Доказательство. Достаточно проверить лишь ограниченность множества Q(xo), так как, если ||х(-)|| k для всех х(-)е Q(x0), то для всякого х(-)<= е Q (х0) почти при каждом t справедливо неравенство |х(0 | ck? + r(t), откуда следует равностепенная непрерывность множества Q(xo). Для доказательства ограниченности множества Q(x0) достаточно заметить, что если x(-)eQ(x0) соответствует управлению «(•), то
2(х(0 |<р(/, х(0, u(-/))) ==-^-} х(/) I2,
и применить лемму Гронуолла для функции а(/) = = |х(0|2.
9.1.4.	Условия полу непрерывности.
Теорема 3. Пусть f — нормальный интегрант на [/о, М X Rn X Rn- Предположим, что х (•) е i и
—00• Тогда, если интегрант f квазирегуля-рен и существует измеримый и удовлетворяющий условию роста интегрант <р на [/0, Л] X Rn такой, что
f(t, X, у) у)
для всех t, х, удовлетворяющих неравенству |х — x(t) | < е, и всех у е Rn, то функционал & полунепрерывен снизу в точке х(-) относительно топологии равномерной сходимости на Wi, ь
Докажем сначала один вспомогательный результат.
Лемма 4. Пусть g (х, у) — замкнутая функция на RmXRrt- Предположим, что при заданном х0^Цгп функция gxj. y->-g(x0, у) — собственная и существует такая функция ty(y) на Rn, что domi|)* = R't и g (х, y)'^ty (у) для всех х из некоторой окрестности точки х0 и всех у^Цп. Пусть, наконец,
fe(y) = inf{g(x, у) |x€=Rm, |х —х0|<е}.
Тогда
Доказательство. Функции f* не возрастают по е и при достаточно малых е > 0 выполнено нера-
§ 9.1. ПОЛУНЕ ПРЕРЫВНОСТЬ
381
венство	Поэтому при таких е в силу предло-
жения 1 из § 3.3 dom/‘ = Rrt. Положим Г = inf Г и е>0
покажем, что f = g’,. Допустим, что f (z0) >	(z0)
для некоторого za<=Rm. Это значит, что для всякого е > 0 найдутся xes Rffl и уе е R" такие, что | х — хе | < е и (2о|&)~ g(xe, Z/6)>£o(2o) + s- Покажем, что |г/е| не может стремиться к оо при е—>0. Выберем е0 столь малым, что domf’ = Rrt. При е < е0 для всякого zeRrt справедливо неравенство fe0(2)^(^e|2)—g(xs> Уе)> откуда
SUP (С Ф | |2 - 2о | < 1) > | У г | + ё'х, (2о) + 6-
Если бы |г/8|->оо при е—>0, то функция % была бы неограничена сверху в единичном шаре с центром в точке г0, но это невозможно, так как в силу выбора 8о функция f* непрерывна на Rn (теорема 3 из § 3.5). Можно считать без ограничения общности, что уе—*У при 8 —> 0. Но тогда, поскольку функция g замкнута,
(У I z0) - g (х0, у) > (у | г0) - lim g (хе, г/е) >	(г0) + б,
вопреки неравенству Юнга — Фенхеля. Итак, f* — g*x^. Поэтому по теореме 2 из § 3.4
g«=r=SUpfr==iimr. е>0	е-»0
Лемма доказана.
Доказательство теоремы 3. Допустим, вопреки утверждению теоремы, что функционал 3 не является полунепрерывным снизу в точке х(-) относительно равномерной сходимости на W* ь Это значит, что существует последовательность	из W7?, i
равномерно сходящаяся к х(-) и такая, что
с= lim ^(хи(.))< J(x(-)).
Отсюда следует, в частности, существование такого числа k > 0, что при достаточно больших номерах т
382
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Последнее неравенство в силу теоремы 1 означает слабую относительную компактность последовательности {хт(-)} в Пусть #(•)— некоторая слабо предельная точка этой последовательности. Тогда, поскольку хш(-) сходятся равномерно к х(-), для всяких /, т, /о т < t th справедливо равенство
t
j у (s) ds = х (t) — x (т),
т. е.
t
x(t) = x (t0) + J y(r) dt. t.
Последнее соотношение в силу теоремы Радона — Никодима определяет у (/) однозначно; именно, y(t) — x(t). Таким образом, последовательность {хт( •)} имеет едий-ственную слабо предельную точку х(-), и значит, хт (•) сходятся слабо к х (•).
Применяя теорему Мазура (следствие 3 из второй теоремы отделимости), мы можем построить последовательность У\('), У2(-),... выпуклых комбинаций функций хт (•), сходящуюся к х (•) по норме пространства L". Имеем
s(i)	s(O
2/f (•) = S (•), Sa«/=1, аг/>0.
Положим
s(O
2"» ( ’ ) ==	jXmiу ( ‘ )•
Очевидно, что yt (•) = zt (•). Без ограничения общности можно считать, что min/n^-x» при Z-»oo. Поэтому мы можем выбрать сходящуюся к нулю последовательность чисел е/->0 так, чтобы для всех mtl
Положим
hf> (t, у) = inf {f (t, x, у) |x e R", | x — x (t) |< 6}.
§ 9.1. ПОЛУНЕПРЕРЫВНОСТЬ
383
Имеем для произвольного фиксированного А, > 0 и для достаточно больших номеров i
S (О
с А/ fl (Хт}I (*)) ~
/=1 S(i) Л
= Т <4/ J f(t, хтц (О, xmij (ty) dt >
/=i
s(i) Л	Л
> 2 az/ J Ц (/, xmij (0) dt J h~ (/, у. (fl) dt.
/=1 t9	to
С другой стороны, если < e, то
hl‘(t,	У)	0).
Поскольку интегрант ф удовлетворяет условию роста, функция ф*(/, 0) суммируема. Поэтому по теореме Фату
tx	tx
lim f h'; tt, y^dt^i lim h”(t, y^dt.
Ho yi(-) сильно сходятся к x (•) в L”, и мы без ограничения общности можем считать, что yi(t)~>x(t) почти везде. Однако при каждом /, при котором эта сходимость имеет место,
lirn h?{ (t, yt (t)) > lim йе~ (t, yt (0) > hTh (t, X (f)), i -> oo	i -> co
каков бы ни был фиксированный номер г0- Наконец, по лемме 4
limh^(t, x(t)) = f(t, x(t), x(t)).
i-»oo *
Таким образом, tx	t,
lim J h“(t, y.(t))dt^^ f(t, x(t), x(t))dt, ‘*°° t. 1	tx,
т. e. 3r(x(-))^.c, в противоречии с предположением. Теорема доказана.
384
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
§ 9.2.	Теоремы существования решений
9.2.1.	Общие теоремы. Начнем с исследования задач вида
.7(х(•))= Jf(f, х(/), х(/))<#->inf;	(1)
*0
х (t0) = Xq, х (f,) е А,	(2)
где f — нормальный интегрант на [fo, fi] X Rn X R”, XogR" и AcR” — замкнутое множество. Если Л = {Х1} и f — гладкая действительная функция, то задача (1), (2) — это простейшая задача классического вариационного исчисления. Однако в схему (1), (2) укладываются и другие задачи, например задачи вариационного исчисления с различными ограничениями на область изменения переменной х и ее производной х. Например, задача t,
J g(t, x(t), x(t)) dt-* inf;
<0
(x, X)<=U(f), tG=[to,
x (to) — XO, x (ti) g= A
приводится к виду (1), (2), если положить
...	.	/ g(t, х, у)
f(t,x,y) = {
при (х, у) е U (t), при (х, у) ф U (/).
(Если при этом интегрант g и многозначное отображение U нормальны, то и f — нормальный интегрант (следствие 1 из теоремы 3 § 8.1).) Далее мы увидим, что проблема существования решений в задачах оптимального управления тоже сводится к исследованию задач вида (1), (2).
Теорема 1. Пусть f — нормальный квазирегуляр-ный интегрант на [/о, М X Rn X R", допускающий оценку f(t, х, y)><p(t, у),
где <р — измеримый интегрант на [fo, fi], удовлетворяющий условию роста. Тогда, если значение задачи (1), (2) конечно, то существует вектор-функция х (•) е IF" ь
§9 2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЯ
385
удовлетворяющая условиям (2) и являющаяся решением задачи (1), (2).
Доказательство. Применим следствие из теоремы 1, теорему 3 из § 9.1 и следствие из теоремы Вейерштрасса (§ 0.1).
Теорема 2. Пусть f — нормальный квазирегуляр-ный интегрант на [tQ, / J X Rn X Rn, допускающий оценку
f(t, X, г/)>Ф1(1 у\) — "Фз (1 л: I) н- г (0,
где r(t) суммируема на [/0Л1], а, функции ifn и i|)2 удов-летворяют следующим условиям*.
а)	неотрицательна и выпукла на [0, оо) и г|?1 (0) =0;
б)	ф2 неотрицательна, непрерывна и не убывает на [0, оо);
в)	(Л)-> ОО При X—>оо;
г)	существуют числа у > 0 и Хо > 0 такие, что ф1(у~1Х) —ф2(Х + Хо)-* оо при X—>оо.
Предположим далее, что значение задачи (1), (2) конечно. Тогда, если — tQ 2у, |%о|^Хо и |xi|^X0 для всякого хх(=А, то существует вектор-функция х(‘)е!Г?, 1, удовлетворяющая условиям (2) и являющаяся решением задачи (1), (2).
Доказательство. Применим теоремы 2, 3 из § 9.1 и следствие из теоремы Вейерштрасса (§ 0.1).
Заметим, что области приложения теорем 1 и 2 различны. Например, в примере Гильберта (пример 3 из § 2.2) 1
J t,3x dt -> inf; х (0) = 0, х (1) — 1, о
решение существует в силу теоремы 1 (сопряженный интегрант р2/(4/2/з) суммируем при всяком р). С другой стороны, не существует функции вида ф(у) + r(t), удовлетворяющей условиям теоремы 2 и являющейся минорантой для f(t, y) = t‘3y\ Поэтому теорема 2 к данной задаче не приложима. Наоборот, теорема 1 не дает возможности высказать какое-либо суждение о существовании решения в задаче
т
J (| xf1 — | х Г) rf* —► inf; х(0) = 0, х(Т)==а. о
13 А. Д. Иоффе, В. М. Тихомиров
386
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Посмотрим, что можно сказать о существовании реше-* ния в этой задаче, пользуясь теоремой 2. Если п < т, то теорема не дает ответа на вопрос о существовании решения (не выполнено условие г)). Однако в этом случае значение задачи равно —оо. Достаточно рассмотреть последовательность
j kt,	если О^/^Т/2,
1 kT/2 — k(t — Т/2), если Г/2</<Г.
Следовательно, решения не существует. Если п > т, из теоремы следует существование решения при всяком Т. Наконец, если п = т, то по теореме 2 решение существует при всяком Т < 2. С другой стороны, при Т > 2 можно выбрать k настолько большим, чтобы при п =; j== m — k или ti = m = 1 l/k значение задачи равнялось бы —оо.
9.2.2.	Существование решений в задачах оптимального управления. Мы будем рассматривать здесь задачу оптимального управления в несколько более общей фор-*
ме, чем в гл. 2:
3<(х(. ),«(•))== p(f, x(t), и (0) dt -+ inf; (3) ^0
х<=Х, u^U, М»	(4)
х (/0) = х0, х (/,) <= А,	(5)
х = ф(/, х, и).	(6)
Как обычно, X с Rn, U с Rm, А с: Rn. Множества X, U, и А мы всегда будем предполагать замкнутыми, а к функции f и отображению <р предъявляем следующие требования:
I. f и ф удовлетворяют условиям Каратеодори, т. е. непрерывны по (х, и) при всяком t е [fo, М и измеримы по t при всяких (х, и).
II. Каково бы ни было ограниченное множество С а cz Rn X R”1, функция
sup (I f(t, X, и) 1 + 1 ФР, X, и) I)
(х, и)(=С
суммируема.
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
387
Допустимыми управлениями будем считать произвольные измеримые (а не обязательно ограниченные измеримые, как в гл. 2) вектор-функции и(-) со значениями в U. В следующем пункте мы обсудим причины, побуждающие нас таким образом расширять класс допустимых управлений.
Положим
h (t, х, У) = inf {f (t, x, u)\u^U, ф (t, x, u) = y} и рассмотрим задачу
ti
$h (x (•)) = J h x, x) dt -> inf;	(7)
*0
x(/o) = xo, x(t{)^A.	(8)
Это задача вида (1), (2).
Лемма 1. Функция h(t,x,y) есть измеримый интегрант. Если h — нормальный интегрант и для всяких t, х, у таких, что h(t, х, у) < оо, найдется 'для которого q(t,x,u) = y, f(t,x,u)=h(t,x,y), то для всякой x(-)^Witi, для которой 3д(*(•)) < оо, существует по крайней мере одно допустимое управление u(t) такое, что q(t,x(t), u(t)) = х(t) почти везде и 3(х(•), «(•)) = = Sfh (х (•)). В частности, в задаче (3) — (6) решение существует тогда и только тогда, когда задача (7), (8) имеет решение. Более того, управляемый процесс (х(-), и(-)) в том и только том случае является решением задачи (3) — (6), когда х(-) —решение задачи (7), (8).
Доказательство. Тот факт, что h — измеримый интегрант, по существу, доказан в начале п. 8.1.4. Пусть h — нормальный интегрант. Тогда h(t,x(t),x(t)) — измеримая функция для всякой х(-) elF?, 1 (предложение 8 из § 8.1). Рассмотрим многозначное отображение t -> F (f) = {и е Rm | и s U, ф (/, х (0, и) =
= %(/), f(t, x(t), u) = h(t, x(t), x(t))}.
По условию множества F(t) непусты почти при всех t. Для доказательства первой части леммы достаточно теперь проверить, что отображение F измеримо, и
13*
388
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
применить теорему измеримого выбора. Заметим, что в силу определения функции h
F(t) = {u<^U\<f(t. х(0, и) =
= x(t), f (t, x(t),	я (/), х (/))}.
Но в этом случае отображение F измеримо согласно следствию 2 теоремы 3 из § 8.1. Для доказательства второй части леммы достаточно заметить, что для всякого управляемого процесса, допустимого в задаче (3) — (6),
и применить уже доказанный результат. Лемма доказана.
Из этой леммы следует, в частности, что, предъявляя к элементам задачи (3) — (6) требования, обеспечивающие выполнение условий леммы 1 и гарантирующие существование решения в задаче (7), (8), мы всякий раз будем получать некоторую теорему существования в задаче (3) — (6).
Теорема 3. Если значение задачи (3) — (6) конечно и функция h(t,x,y) выпукла по у, то для существования решения в задаче (3) — (6) достаточно выполнения одного из следующих условий'.
а)	существует число & > О, суммируемая функция r(t) и интегрант ^(t,u) на [/о, Л] X Rm> удовлетворяющий условию роста, такие, что
f(t, х, и) (/, и),	(9)
I Ф(^ х, и) К & | и\ + г (t)	(10)
для всех tе[/0, fj, х^Х, u^U\
б)	для всякого ограниченного множества В cz X можно указать такие & > 0, r(-)eLi и интегрант ф на [/о, Л] X Rm, удовлетворяющий условию роста, при которых соотношения (9), (10) выполняются для всех t е [/о, /1], х е В, и U и, кроме того, существуют константы k\ > 0, с > 0 и суммируемая функция r\(t) такие, что
f(t, х, t/)>*1|(p(/, х, u)\ + rl(t) (11)
для всех t^[tQ, /J, х^Х, |х|> с и u^U\
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
389
в)	множество U ограничено и существуют число &>0 и суммируемая функция r(t) такие, что
|(х[ф(/, х, и)) К£| х|2 + r(t)
(12)
для всех t ej/o, Л], х е X, и е U;
г)	существуют определенные на [0, оо) функции и ф2, удовлетворяющие условиям а) — г) теоремы 2, и суммируемая функция r(t) такие, что
f(t, х, и) (| ф(/, х, w)|) —гр2([х|) + г(0	(13)
для всех t е [/о, Л], х е X, и е U и, кроме того, |ф(/, х, и) |~* оо при | и | —► оо равномерно в окрестности каждой точки х X при всяком t <= [/0, /1].
Доказательство. Прежде всего докажем, что во всех перечисленных случаях h — нормальный интегрант и нижняя грань в определении h достигается, если h < оо. В случае в) это очевидно, поскольку множество U компактно, а функции f и ф непрерывны по и. В случае г) всякое множество {и U\q>(t, х, и) = у} компактно, так как ф непрерывна по и и |ф(/, х, и) | —► оо при |п|-*оо. Поэтому и здесь нижняя грань в определении h достигается. Пусть, далее, xs-+x, ys->y и ПтЛ(/, xs, ys) < оо. По доказанному можно выбрать такие us(=U, что f(t, xs, us) = h(t9 xs, ys),q> (t,*xs, us) = ys. Так как | ф (t, х, и) [—> оо при | и | -> оо равномерно в окрестности каждой точки х при всяком t, последовательность {ws} ограничена. Если и — предельная точка этой последовательности, то из-за непрерывности f и ф по (х, и) выполнено равенство ф(/, х, и) =у и
h(t, х, y}^f{t, х, u) = limf (t, xs, us),
S->oo
t. e. h полунепрерывна снизу по (x, у) и, значит, h — нормальный интегрант. В случаях а) и б) для доказательства нужного утверждения достаточно проверить, что ф(/, м)->оо при | и | -> оо почти при всяком t, поскольку в этом случае всякое множество {и е U\f (t, х, и) с} компактно и из xs —► х, f(t, xs, us)
с следует, что последовательность {z/s} ограничена. По условию функции / —>ф*(/, р) суммируемы при всяком р е Rm. Отсюда сразу следует, что эффективные
390
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
множества функций ф*(^, •) почти при всех t совпадают с Rm. Но при таких t, очевидно, что
ф(/, «)|>|ц|—max ф‘ (t, р) —> оо при |«|->оо.
Ip I < 1
Итак, во всех случаях h — нормальный интегрант и нижняя грань в определении h достигается. В силу леммы 1 нам теперь достаточно доказать существование решения в задаче (7), (8).
Случай а). Положим
А (f, у} ~ inf {ф (/, и) | и s U, k | и | + г (t) | у |}.
Тогда согласно (9), (10)
h (t, х, у) — inf {/ (t, х, и) | и е U, ф (/, х, и) — у}^ inf {ф (/, и) | и е U, ф (t, х, и) = у}^
>inf [ф(t, u)\u(=U, | ф(f, х, и) | = | у |}>
inf {ф (/, и) | и е U, k | и | + г (/)	| у |} = А (7, £/)•
Покажем, что интегрант А удовлетворяет условию роста. Имеем
О, <7) = sup ((ф| у)— A (t, p))<sup(|<7||z/| — A(f, p)) =
У	У
= sup(fe|9||«l — ФК, и)) 4-1 q |r (/)) = u
=\q\r(t) + sup {sup ((/?| u)—ф (f, u)) |pg= Rm, | p |< k| q |) = u
= |<?|r (0 4-sup (ф‘(/, p)|p<=Rm, I p |< k\q I} = a (t, q).
Но поскольку ф удовлетворяет условию роста, функция a(t, q) суммируема. Таким образом, функции t-* h*(t,q) суммируемы при всех q е Rn и, значит, А удовлетворяет условию роста. Из теоремы 1 следует теперь существование решения в задаче (7), (8). Итак, в случае а) теорема верна.
Случай б). Пусть нижняя грань в задаче (3) — (6) равна а. Предположим, далее, что (%(•),«(•)) — допустимый управляемый процесс в задаче (3) — (6) и 3 (х (• ),?м (•))	4- 1. Выберем ki > 0, суммируемую
функцию Г1(0 и интегрант ф1 (/, и) на Ro, MXRm, удовлетворяющий условию роста, так, чтобы соотношения
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
391
(9), (10) выполнялись при всех t<=[t0,^], xt=X, |x|sgc, и e U. Тогда
inf {f (t, x, и) | x e X, | x К c, u<=U]^
inf -ф1 (t, a) inf ifi (t, u) = —	(f, 0)
we U	и
и ф* (t, 0) — суммируемая функция. Положим
Д0={/еф0» ЛИ I х (0 К с), Д1 = {f €= р0, /JI | х(t) | > с}.
Тогда для всякого	в силу (11)
I х (0 | <| х01 + с + / | <р(/, х(0, н(0)|Л< Д1
<1 ХО 1+с + ^Г.1 J f(t, х(0, u(t))dt+ /|Г1 (0 |d/<| Хо 1 + Ai	Aj
+ с + ^Г*(а+1)+ J | r, (t)\dt-krl J f(t,x(t),u(t))dt^ f'd	Aq
ti
<|Хо1+с + ^Г‘(а+ 1)+ JlH (t)\dt + k7l / tf(f,O)d/< /q	Ao
tl
<|х0|4-с4-^Г1(а4-1)4- J (I r^i) |4-l Ф* (t, O)|)d/ = co. to
Мы получили, что для всякого управляемого процесса (х (•),«(•)), допустимого в задаче (3) —(6) и такого, что 5'(x(-),«(-))<a4-1, при всех t^[to. Л] справедливо неравенство |x(f) |	с0. Пусть теперь Xi =
= {х е X | [ х |	с0}- Рассмотрим задачу
л
3 (х (•), и (•)) = J f (t, х (/), и (0) dt -> inf; (14) ^0
х = Ф (/, х, u)f	(15)
х е Xif t s [/0, M,	(16)
x(tQ) = x^ x(h)t=A.	(17)
По доказанному эта задача имеет то же значение и те же решения (если таковые существуют), что и задача
392
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
(3) — (6). Однако для последней задачи выполняются условия, сформулированные в а). Поэтому в задаче (14) — (17) и, следовательно, в задаче (3) — (6) решения существуют.
Случай в). Из условия (12) в силу предложения 3 из § 9.1 следует существование такой константы с > О, что | х (/) | с при t е [/0, 6] Для всех управляемых процессов (*(•), н(-)), допустимых в задаче (3) — (6). Пусть
Л (/) = inf [f(t, х, и)\х^ X, | х К с, u^U\\
( Л (t)» если и е (/, и) = \	, тт
I оо, если и фи.
Интегрант ф удовлетворяет условию роста, ибо ф*(/, p) = s(p\ U)— Л(О
и, значит, поскольку U ограничено и Z(/) суммируема (в силу условия II на стр. 386),
Л
J f (/, p)dt = s(p\ U) (ti —/0) — j Л(0 dt < оо if,
для всякого peRm. Положим, наконец, Хх — = {хеХ| |х| с} и рассмотрим задачу (14) — (17). Эта задача имеет то же значение и те же решения, что и задача (3) — (6). Но для всех М, u<=U справедливы неравенства
f (/, х,	и),
| ф(t, х, u)\^r(t) + kc2.
Поэтому и в данном случае задача (14) — (17) удовлетворяет условиям, сформулированным в а), и, следовательно, у нее существует решение.
Случай г). Согласно условию (13)
h(t, х, #)>ti(l */D— -Фг(1 а: |) 4- г (0-
Поэтому существование решения у задачи (7), (8) следует из теоремы 2. Теорема полностью доказана.
Самое «неудобное» условие в формулировке теоремы 3 — требование выпуклости интегранта h по у. Прямая проверка этого условия не всегда возможна и
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
393
зачастую удобнее пользоваться теми или иными косвенными критериями. Один из таких критериев мы сейчас докажем.
Пусть р е Rn. Положим
Н (t, х, р, и) = (р\ qp(f, х, и))—f(t, х, и).
Предложение 1. При выполнении любого из условий а)—г) теоремы 3 для выпуклости интегранта h по у достаточно, чтобы при всяких t е [/о, 6], х е Rn, р g Rn множество
Q(t, х, р)= \у eR" |Э и е U: Н (t, х, р, и) —
= maxH(t, х, р, о), ф(/, х, и) = у}
v<=U
было непустым и выпуклым.
Доказательство. Из определения функции h следует, что
/г* (t, х, р) = sup Н (/, х, р, и),
u^U
Кроме того, при доказательстве теоремы было показано, что h — нормальный интегрант, dom/i* (t, х, •) — R" и нижняя грань в определении h достигается почти при всех t. Поскольку h полунепрерывна снизу по у, нам достаточно проверить, что h(t, х, у) = Л** (t, х, у) при у е ri (dom х, • )). В этом случае dyh**(t, х, у) #= 0. Пусть р е dvh** (t, х, у). Тогда у е dph*(t, х, р). Так как р <= int(dom h*(t, х, •)) = Rn и функция y-+h(t,x,y) замкнута, найдутся такие числа ct i 0, .... an+i О, в сумме равные единице, и векторы pi е dh*p(t, х, р), ... ..., yn+l <= dh*p (t, х, р), что
У — ЩУ\ + • • • + a„+1z/n+1, h (t, х, уд = х, уд, i=l, ..., n + 1.
(Этот факт доказывается ниже, см. лемму 1 из § 9.3.) Тогда, с одной стороны, найдутся такие их е U, ... ..., «п+1 U, что
Ф (t, х, U[) = yh h (t, x, уд — f (t, x, ud, i=l, • • •, n. + 1, а, с другой,
h* (t, x, pd = (p| ф (i, x, ud) — f (t, x, ud, i — 1, ..., n + 1.
394
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
Отсюда	|
max Н (t, х, р, и) = max ((р | <p (t, х, и)) — f (t, х, и)) =*	1
и€= U	u^U
= (р|ф(/, X,	X, Ui), '
т. е. е Q (t, х, р) при всех i = 1, ..., п + 1. По уело- J вию множество Q(t, х, р) выпукло, т. е. r/eQ(£, х, р). Это значит, что найдется такое wet/, что	;
Ф (/, х, и) = у, (р| ф (/, х, и)) —f (/, х, и) = й* (/, х, р).
Последние соотношения дают
h (t, х, у) f (/, х, и) = (р | ф (t, х, и)) — h* (/, х, р) = = (p\y) — h* (/, х, р) < й** (/, х, у),
т. е. h(t, х, у) = Л**(/, х, у). Предложение доказано.
9.2.3. Теоремы существования и необходимые условия экстремума. В доказанных только что теоремах утверждается существование решения, принадлежащего более широкому классу по сравнению с классом допустимых элементов, для которого доказывались необходимые условия экстремума в гл. 2. Конечно, чем шире класс допустимых элементов, тем с большей вероятностью решение в этом классе существует. В теоремах 1—3 класс допустимых элементов был, по существу, максимально широким. Эти теоремы поэтому следует характеризовать как «грубые». Однако существуют и «тонкие» теоремы существования решений, принадлежащих более узким классам, в частности тем, для которых справедливы необходимые условия экстремума — уравнение Эйлера и принцип максимума Понтрягина.
Разумеется, если в задаче (3) — (6) множество U ограничено, то сама теорема 3 становится такой «тонкой» теоремой. Мы докажем сейчас один менее тривиальный результат, относящийся к задачам классического вариационного исчисления.
Теорема 4. Предположим, что интегрант f(t, х, у) дважды непрерывно дифференцируем на [tQ, ti]XRwXRn и вторая производная ftjy(t,x,y) положительна для всех t, х, у, т. е.
X, y)z\z)>Q,
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
395
каковы бы ни были t, х, у и Rn, z #= 0. Пусть, далее, f(t, х,	$2(1 X I)	(18)
при всех t, х, у и для всякого с > 0 найдутся константа k> 0 и суммируемая функция r(t) такие, что
(19)
lfy(^> х> У) KHi(l У 1) + г(0	(20)
для всех t <= [f0, fj, у е Rn и хе R", | х | с, где функции if! и гр2 удовлетворяют условиям а)—г) теоремы 2. Тогда, если X = Rn, t\— fo < 2у, то в задаче (1), (2) существует дважды непрерывно дифференцируемое решение, удовлетворяющее уравнению Эйлера.
Доказательство. Прежде всего покажем, что вектор-функция x(f) е Wf, i, удовлетворяющая почти при всех f уравнению Эйлера в форме Дюбуа-Раймона
t
fy (f, х, х) — J fx (r, x, x) dx = ds const, (21) ^0
дважды непрерывно дифференцируема и удовлетворяет уравнению Эйлера. Для этого рассмотрим функцию
(t	\
J fx (Т, X (т), х (?)) dx Iу I— (d\ у).
Эта функция дважды непрерывно дифференцируема по обоим аргументам, а при каждом t выпукла по у и удовлетворяет неравенству
г/)>ф1(|г/|)-ф2(|х(/)|) + (а(0|у) = Х(/, у). (22)
Поскольку х(-) ограничена, a a(t) непрерывна при всяком t, &ovng*(t, •)— Rn в силу условия в) теоремы 2 и предложения 1 из § 3.3. Это значит, в частности, что при всяком t функция р-*g*(t, р) непрерывна на Rn и <?£*(/, О)=/=0 (предложение 4, § 4.2). Поэтому для всякого t можно указать такой вектор y(t), что y(/)s edg*(/, 0). Поскольку g дифференцируема по у, отсюда получаем
(23)
ёуУ,
396
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Условие (23) означает, что функция g достигает мини* мума по у в точке y(t), С другой стороны, поскольку вторая производная gyy(t, у) = fyy(t, x(Z), у) положительна, функция g может достигать минимума не более, чем в одной точке. Итак, при всяком t уравнение (23) имеет ровно одно решение. По той же причине при каждом t линейное отображение z —*gy(t, y(t))z есть гомеоморфизм. Из теоремы о неявной функции следует те* перь, что y(t) непрерывно дифференцируема.
Соотношение (23) можно переписать так: t
fy (Л X (0, у (0) — / f х (t, х (t), X (0) dt =s d.
Сравнивая его с (21) и учитывая единственность решения уравнения (23), получаем, что x(t) — y(t) почти везде и, следовательно, поскольку y(t) непрерывна, x(t) = y(t) при всех t. Мы получили, что x(t) дважды дифференцируема и удовлетворяет условию (21) при всех t. Но в этом случае вектор-функция t —» —*fv(t, x(t), х(/)) непрерывно дифференцируема и
4/(^,х(0, x(t)) — fx{t, x(t), х(0) = 0.
Таким образом, для доказательства теоремы нам нужно убедиться в существовании решения класса Wti, почти всюду удовлетворяющего уравнению (21). В силу теоремы 2 наша задача имеет решение хД •) е W\, ь Покажем, что это решение — искомое. Положим
Лт== {^[^0. *1] II *t(t) |</n}, т = 1,2, ...»
и обозначим через М множество таких у (•) е £», которые обращаются в нуль на некотором множестве Дт и интеграл от которых равен нулю. Пусть х(-)е i и х(-)еЛ1 (в частности, x(t0) = х(Л) == 0). Покажем, что limV1[J(x,(.) + Ax(.))-5<(x. (•))] = Х->0
Л
= J [(/х (i, X. (/), X, (0) |Х (0) + (fy (t, х, (t), X, (/)) | X (0)] dt. (24) lo
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
397
Отсюда требуемый результат следует непосредственно. В самом деле, интегрируя второе слагаемое в (24) по частям и учитывая, что %*(•) — решение задачи, получим, что
J (М> *.(')> W-
— / fx (т, х, (т), х, (т)) dx I у (/)) dt = 0 (25)
для всех у(-)еЛ1. (Вектор-функции fx (t, х, (/)> xf(t)) и fy(t, (0> хф (/)) суммируемы в силу условий (18) — (20). Чтобы убедиться в этом, достаточно выбрдть k > 0 и r(-)eL] так, чтобы (19), (20) выполнялись при с = Цх(-)Пс-) Но множество М плотно в подпространстве

у (.) «= L" | J у (/) dt = 0
Поэтому равенство (25) выполняется для всех у (•) е L, а это значит, что
fy (f, х, (t), х. (/)) — J fx (т, x, (t), x, (t)) dr = const
почти везде.
Нам осталось доказать равенство (24). Положим для краткости
d (t, g) = (fx (t, x, (0 + gx (0, x, (0 + gx (/)) | x (0) +
+ (fy (t, X, (/) + gx (0, X. (0 4- gx (0) IX (/)).
Тогда при всяких t e [f0, /J, A > 0,
f If, x, (t) + Ax (0, x. (t) + Ax (0) —
~f(i, x.(0, W = / d(t, g)dg.
398
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ

Положим, далее, л
e(t, X) = V* J d(t, $d$. о
Поскольку d непрерывна по g, е (t, ?.)—> d (t, 0) при Л j 0.
С другой стороны, выбрав константу k > 0 и суммируем
мую функцию r(t) так, чтобы соотношения (19), (20) i выполнялись при с = ||х,(•) ||с + ||х(-) Па» получим для • всякого g е [0, 1]
d(t, |)<Н.(1А(01 + 1х(01)(|х(01 +
+ 1*(01) + 2г (0 = 9(0-
Функция q(t) суммируема, так йак х(-)еЛ4. Поэтому по теореме Лебега об ограниченной сходимости
б
lim f е (t, Л) dt = f d (/, 0) dt.
Л->0 •'	/
Но по определению
J e(t, A)^ = V1[^(x,(.) + Xx(.))-^(x,(-))], to
Л	tr
J d it, Q)dt=\ [(fx (t, Xt (0. Л (0) I x (0) +
+	x.(0, х.(0)Щ0)И0
откуда и следует равенство (24). Теорема доказана.
9.2.4. Теорема Боголюбова. В конце п. 2.2.3. было упомянуто о том, что с теоретической точки зрения необходимое условие Вейерштрасса можно считать всегда выполненным. Точный смысл этому утверждению придает следующий результат. Пусть L(t, х, |)— непрерывный интегрант,
л
У L, (х ( ’ )) = J £ х) dt
to
§ 9.2. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ РЕШЕНИЙ
399
функционал простейшей вариационной задачи классического вариационного исчисления и
Л
«7ь** (х (•)) — J L** (/, х, х) dt ^0 функционал, где в качестве интегранта взята функция £**(/, х,ц), являющаяся второй сопряженной по Юнгу — Фенхелю функции	х, £). Интегрант х, х)'
квазирегулярен (т. е. является выпуклой функцией последнего аргумента), кроме того имеет место такое неравенство: L** (/, х, х) L (t, х, х) (оба эти факта следуют из теоремы Фенхеля — Моро). Из последнего неравенства вытекает, что
(26)
Теорема 5 (Боголюбов). Для любой вектор-функции х( •) е Wx, 1 ([Ль ^11) найдется последовательность функций хт (•) е С"([/о, /J) такая, что xm(t0) = х (Q, =	xm(-) стремится к х(-) равномерно на
[г'о. Л] кроме того,
Пт ^(хт(.))<5<д«(х(.)).	(27)
7П->оо
Сопоставление неравенства (26) и теоремы 5 показывает, что задачи У£(х (•))-> inf; х(О —/ = 0, 1 и (х (•))-> inf; x(ti) = £f, i = 0, 1 эквивалентны: у них одни и те же значения и одни и те же минимизирующие последовательности. Результат, подобный теореме 5, верен и для общих задач оптимального управления. Из него следует, что требования выпуклости, накладывавшиеся выше в теоремах существования, можно всегда считать выполненными.
Доказательство. Ограничимся построением последовательности {хЛ( •)}, состоящей из функций пространства WZ, 1 (fa, Л])- Переход от этой последовательности к последовательности элементов из С1} совсем прост. По заданному числу m = 1, 2, ... найдем 8 = 8 (т) так, чтобы
max L (t, х (/) + х, х (/) + У)
IxICMw)
< L (Л х (0, х (0 + у) +	(28)
400
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
при всех у е Rn, | у | «С т. Это можно сделать из-за ограниченности x(t) и непрерывности L. Пусть б = б(/п) выбрано так, чтобы б/п^е(/п). Разобьем отрезок [t0, точками т0 = < Ti < • • • < ik = t\ на части длины, меньшей б. Положим
gm (t, У) =
L (t, х (/), х (t) + у), | у К пг,
оо,
I УI > т,
и рассмотрим конволюционный интеграл
k.
Из непрерывности L следует, что ботйг== — В(0, /п(тг —т/_1)) = {г/||г/|<т(т< —Tf-J}, и, значит, 0 е int (dom А/). Из теоремы 2 § 8.3 получается, что
Отсюда можно извлечь существование на каждом из отрезков [тг_ь т(] такой вектор-функции что
Ti
J цг(0^ = О, Tz-i
J gm (ft т(-1 тг
<й, (0) + i/ й(/,0)<г/ + ^. (29) xi-i
Положим #m(0 = W/(0. еслИ Т;_[^/<Тг, xm(t)=x(t) + + j Ут W di- Ясно, что хт yi) = x(ti). Из определения gm следует, что | ut (t) | т почти всюду и, значит, почти везде j ym(t) |^/п, т. е. хт(-)^1Гм. ь Далее, при всяком t справедливо неравенство | x(t)—хт (/) | Ьт < е.
§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
401
Следовательно, хт (•) -> х (•) равномерно. Наконец, в силу (28) и (29) получаем:
3Ltxm (. ))< / L(t, x(t), x{t) + ym(t))dt + -^<i
gm{t, to
Из определения функций gm следует, что при m->oo gm (t, у) mt, x(t), x(t)+y).
Отсюда нетрудно вывести, что
gm(t, y)\L^(t, X(t), X(t) + y).
Поэтому по теореме Б. Леви tl
f gm(t, G)dt\SfL»(x(-)). to
Сопоставив эту формулу с (29), приходим к выводу, что для последовательности {хт( •)} справедливо соотношение (27). Теорема доказана.
§ 9.3. Конволюционный интеграл и линейные задачи
9.3.1. Постановка и обсуждение задачи. Теорема двойственности. Здесь будут рассматриваться задачи следующего вида:
t,
^(x(-))=JW x(t))dt;	(1)
to
x (tQ) = 0, x (^) = x,	(2)
Обозначим через S(x) значение задачи (1), (2); S есть функция от переменного х, стоящего в правой части ограничения (2). Она является конволюционным интегралом:
402
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Для задач (1), (2) можно построить гораздо более со* ЯЯ вершенную теорию существования решения, практически ЯЦ смыкающуюся с теорией необходимых и достаточных S условий. Покажем, что всякая линейная по фазовым Ж координатам задача оптимального управления приво- Ж дится к виду (1), (2). В самом деле, рассмотрим за- В дачу оптимального управления системой, линейной по фазовым координатам:	: :
fi	‘
W-). «(•)) = [(а(01у) + ^, u)]^->inf;	(3)
у = Л (/) у + b (t, и), u^U,	(4)
y(t0) = y0, У^1) = Уь	(5) '
где, как обычно, Л(-): [/0, /I]->2’(R", R"), b: [f0, /JX XRm->Rn, g: fo, MXRm->R и a(-)eZ7(fo, 01). Пусть Р (/, т) — резольвента однородного уравнения у = Л (/) у. Положим для краткости
9 (0 = | R. (т, 0 а (т) dr,
a(t) = (a(t)\R(t, t0)y0).
Пусть, далее,
х = У! — R (ti, t0) Уо,
h (t, v) — a (t) +
4- inf {(9(/)| b (t, u)) + g(t, u)\us=U, R(tit t)b(t, «) = »}.
Рассмотрим задачу
(x (•)) = f (t, x (0) dt -> inf; (6)
X“ = °'	(7)
x (t{) — X.
§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
403
Предложение 1. Пусть (£/(•), и(-))—допустимый управляемый процесс в задаче (3)—(5). Тогда вектор-функция
x(t) = R(t{, t)(y(t)-R(t, tQ)yQ)
допустима в задаче (6), (7) и Sfh (х (•)) К (у (•), и (•)).
Наоборот, для всякого допустимого элемента х(-) задачи (6), (7), для которого 2fh{x( •)) < оо, и всякого 8 > 0 найдется допустимый в (3) — (5) управляемый процесс (г/( •), и (•)) такой, что у(-) и х( •) связаны предыдущим соотношением и

До казательство. Пусть (у (•), и (•)) — допустимый управляемый процесс в задаче (3) — (5) и х(-) определено, как в формулировке предложения 1. Тогда
х (t0) = R(tl, t0) (у (t0) — у0) = 0, x(tx)-=yi— Rtfi, t0)y0 = x.
Далее (см. теорему 2 из § 0.4),
t
y(t) — R (t, /0) у0 + J R (t, т) b (т, и (т)) dx, <0
т. е. в силу предложения 1 из § 0.4
t
х (f) = R (tlt t) J R (t, t) b (т, и (t)) dx —
to
t
= J R (tlt x) b (r, u (t)) dx,
404
ГЛ. 9« СУЩЕСТВОВАНИЕ РЕШЕНИИ
т. е.
x(0 = /?(/b t)b(t, u(t)).
Поэтому, согласно определению функции h, tt ~
*(*/(•),«(•))=/ (a(f)\R(t, t0)y0 + -t
+ J R (t, t) b (т, u (t)) dr) + g(t,u (0) dt = t*
= / (a(t)\R(t, /о)Уо) +
*0
+ I J R(r, t) a (t) dx | b (t, и (/)) j + g (t, и (0) dt =

= j [a (0 + (7 (01 b (t, и (0) + g (t, и (0))] dt lo
tl	tl
> J h(t, R (/b t) b (t, и (/))) dt = j h (t, x (/)) dt. tn	t0
Первая часть предложения доказана.
Далее, если «7/г(х( •)) < оо, то по определению функции h для каждого t множество
Ve(t) = {u^U\ R (/b t) b (t, u) = x (/),
(q (t) | b (/, и)) + g(t9 u)^h (/, x (/)) + 8}
непусто. Согласно второму следствию теоремы 3 из § 8.1, многозначное отображение	нормально.
Пусть ue(t) измеримое сечение этого отображения. Тогда, если
У (0 = Я ti) x(t) + R (t, tQ) yQt
то, очевидно, пара u8(*)) есть допустимый управляемый процесс в задаче (3) — (5). При этом
К(г/(•), ^(•))<^(х(-)) + е(/1-/0).
Поскольку е произвольно, предложение доказано.
§ ОД КОНВОЛЮЦИОННЫИ ИНТЕГРАЛ
405
В дальнейшем мы рассматриваем только задачи вида (1), (2). Все результаты без труда переносятся на задачи вида (3) — (5).
Пусть, как обычно,
ГУ, р) = г(р) = (гу, .))(р).
Тогда в силу теоремы 2 из § 8.3
t, 5* (р)= J Г (Л P)dt, *0
S — выпуклая функция и
Отсюда следует, в частности, что если х е ri (dom S), то
\
(p|x)— f f*{t, p)dtj.	(8)
t	J
to	7
Последнее утверждение есть не что иное, как теорема двойственности для задачи (1), (2). Оказывается, что существование решения и его характер зависят от взаимного расположения множества dom S* и точки р0, доставляющей максимум в (8).
9.3.2. Регулярный случай. Сначала рассмотрим случай, когда ро е int (dom S*). В этом случае решениями задачи будут обычные экстремали Эйлера и только они.
Теорема 1. Пусть f — нормальный интегрант на [/о,	Предположим, что максимум в . (8) дости-
гается в точке ро. Тогда вектор-функция %*(£) в том и только том случае будет решением задачи (1), (2), когда
f ** (0) + Г (Л Ро) = (Ро I х* (0) почти везде. (9)
Если же p0Gint(domS*), то в задаче существует решение.
406
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
Доказательство. Если *#(•), кроме условия» (9), удовлетворяет еще и равенствам (2), то	J
(М •)) = р (t, X, (0) dt = J [(Ро| x. (/)) - Г (t, Po)l dt = I
^0	*0	f
tx	I
= (Pol *) — / Г (f> Po) dt = S (x), I *0	I
t. e. x*(-)— решение задачи. Наоборот, если %*(•) — ре* f шение задачи, то, с одной стороны,	\
h	л
/ f {t, х, (t)) dt = S(x) = J [(Po| x, (/)) - Г (f, Po)] dt, ^0	tfi
а, с другой, по неравенству Юнга — Фенхеля
f{t, х.(/))>(ро|х.(О)-Г(^ Po)
почти всюду, откуда и следует (9). Первая часть тео*  ремы доказана.
Осталось доказать существование вектор-функции **(•), удовлетворяющей равенствам (2) и условию (9), или эквивалентному ему соотношению
х* (/) е df (f, ро) почти везде.	(10)
Допустим сначала, что f — нормальный выпуклый интегрант, В силу (8) рое<?5(х), т. е.
(Л	\
J t* (!, •) dt\ (po). ^0	'
Поскольку рое int (dom J f'(t, '^dt^, по теореме 4 из § 8.3
(ti	\	tt
')dt (Po)=/df(f,po)d/,

§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
407
е. существует вектор-функция у ДО такая, что у* (0 е df (/, ро) почти всюду, л j yt (t) dt = X.
t
Полагая xt (t) = j" у* (?) dx, получаем требуемое.
^0
Для доказательства теоремы в общем случае, т. е. без предположения о выпуклости интегранта нам понадобится следующее утверждение.
Лемма 1. Пусть ф— замкнутая собственная функция на Rn. Предположим, что pQ е int (dom ф*). Тогда
(Ро) == conv {х е= R" | ф (х) + ф* (р0) = (Ро I *)} •
Допустим, что лемма уже доказана, и рассмотрим такую задачу:
h
J Г (t, * (0)-> inf;	(11)
/о
x(fo) = O, x(tl) = x.	(12)
Пусть Si(x) — значение этой задачи. Тогда по теореме Фенхеля —Моро
t
= J f (t, -)dt = S*.
^0
Так как f*— нормальный выпуклый интегрант (предложение 2 из § 8.1), в задаче (11), (12) по доказанному выше существует решение x(f), т. е.
х(/0) = О, x(ti) = x, tl
J Г (Л x(t))dt = Si (х).
*0
Поскольку p0eint(dom J f* (t, -)dt^, из предложения 4 из § 8.3 следует, что ра е int (dom f' (t, •)) почти всюду.
408
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
По лемме 1 на множестве полной меры
df'(t, Po) = conv{z/e=R"|f(f, y) + f*(t, Ро) = (Ро\у)]-	*
Многозначное отображение	j
t^v(t) = {y^Rn\f(t, y) + r(t, Po) = (pQ\y)}=	:
= HR" \f(t, y) + f (t, p0) < (p01y)} t
нормально (следствие 2 теоремы 3 из § 8.1). В силу предложения 4 из § 8.3 для некоторого е > 0 функция ?
г (0 = sup {Г (/, р0 + р)\р 6= R”, | р Ке} суммируема. Поэтому для всяких (t, у) е gr V, р^ R", I Р К е
(Р 1р)< Г (f, Ро + р) — (Ро IP) + f (t У) = = Г V, Ро + Р) + Г (Л Ро) < г (/) + Г V, Ро),
|р|<е-'(г(0 + Г(Л Ро))-
Мы можем применить к отображению V теорему 1 § 8.2, из которой следует равенство fi	fi	t,
J V (t) di — j conv V (0 di = J df* (t, p0) dt. to	^0	^0
Поэтому существует такое измеримое сечение у* (/) отображения И, что
tx	tt
j У* (0 dt = j x (t) dt = x.
*0	t0
t
Но если x, (0=J У, (r)dx, to x(/o) = O, x(^) = x и to
f(t, x„ (/)) + Г (t, p0) = (Po |X. (/)) почти везде, т. e. x, (• )— решение задачи. Теорема доказана.
Доказательстволеммы1. Заменяя, если нужно, Ф (х) функцией ф (х) — (р0 |х) + ф‘ (р0), мы можем считать, что р0 = 0 и ф* (0) = 0. Тогда ф(х)^ф‘*(х)^>0 и ф’*(х)=0, если хедф‘(0). Коль скоро p0 = 0e int (dom ф*), функция ф’ непрерывна в нуле (теорема 3 из § 3.5), т. е.
§ 9.3. КОНВОЛЮЦИОННЫй ИНТЕГРАЛ
409
для некоторых 8 > 0, б > 0 неравенство ф* (р) б выполняется, лишь только | р |^е. Пусть
{б, если |р|^8, оо, если | р | > 8.
Тогда Ф*(р)</(р) и
Ф (х) > Ф** (х) > Г (х) = 8( х | — б.	(13)
Пусть теперь х <= dqp* (0) cz dom ф**. Тогда в силу предложения 2 из § 3.5 для всякого натурального т найдутся векторы хХт, xrt+1,m и числа а17П>0, a„+lfZn>0 такие, что

п + 1
^aZm<p(xim)<-^. (14)
/=1
Мы можем выбрать последовательность {/nJ натуральных чисел таким образом, чтобы для всякого номера i = 1, ..., п+1 либо Xjms сходились к некоторому xz, либо |xZ/nJ->оо. Если |x/7nJ—>оо, то из неравенства
| Xitns | 1М
сразу вытекающего из (13), (14), следует, что
и, значит,
^ims | Xitns | > 0-
(15)
(16)

Последнее соотношение означает, в частности, что |XfmJ->°° не для всех номеров i. Без ограничения общности МОЖНО считать, ЧТО Xims СХОДЯТСЯ К Xi при 1^/^£ и |xt-ms|->oo при k +	1. Тогда
из (15), (16) следует, что
n + 1	k
х = lim 2 aim.Xtm = 2 azxz,
S-> оо f=l	5	5 t = l
/1+1	k
1 = lim 2 aim = 2 az
S-»oo /=1 s
410
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
и из-за полунепрерывности функции ф снизу /г + 1
0= lim 2аЧф(х(т)>
S-»OO i=l S 4 s*
k	k
> lim 5 a»m <P (Xim.} > 5 a,<p (x,) > 0, 5->oo Z=1	s 4	J=1
k
t. e. 2 <MP (*i) = 0 = ф** (x). Последнее соотношение г=1
может иметь место лишь в том случае, когда ф(хг) = 0 при /=1, ..., k, т. е. когда ф(хг) + ф*(0) = 0 (так как Ф неотрицательна). Таким образом, х есть выпуклая комбинация точек хь ..., Х/г таких, что ф(хг) +ф*(Ро) == ~(ро\хд- Лемма доказана.
Теорема 1 носит «апостериорный» характер: для ее применения требуется сначала вычислить значение задачи, используя формулу (8). Однако с ее помощью можно получать и «априорные» теоремы, подобные тем, которые доказывались в § 9.2.
Теорема 2. Пусть f — нормальный интегрант на [/о, Л]Х Rn, удовлетворяющий условию роста. Тогда, если значение задачи (1), (2) конечно, то у нее существует решение.
Замечание. Мы хотим обратить внимание читателя на то обстоятельство, что в этой теореме, сходной с теоремой 1 из § 9.2, не требуется выпуклости интег-ранта f(t, у) по у.
Доказательство. По условию эффективное множество функции S*(p) = j f(t р) dt совпадает с Rn. Поэтому, если максимум в (8) достигается, то он достигается во внутренней точке множества domS*, и теорема 2 следует из теоремы 1.
Предположим теперь, что максимум в (8) не достигается. По условию существуют вектор-функции х(/), удовлетворяющие условию (2), на которых интеграл (1) конечен. Если множество таких вектор-функций конечно, то все очевидно. В противном случае в задаче существует минимизирующая последовательность, т. е. последовательность таких вектор-функций xw(Z), что
xm tfo) —	limZ7(xm( »)) = 5(х). (17)
§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
411
Пусть
Vp) = {i/e=Rn|B/n = l, 2, ... : y = xm(f)}-, t а ) =	если
1 ’	1 оо, если у ф V (f).
Тогда fi — очевидно, нормальный интегрант. Рассмотрим задачу (1), (2), но с функцией fi вместо f в подынтегральном выражении в (1). Пусть Si — значение этой задачи (как функция правой части ограничения (2)). Очевидно, Si S и Si(x) = S(x). Покажем, что хе е ri(dom Si).
Пусть р е W(x|dom Si), т. е. (р|х — г)^0 для всех zedomSi. Тогда в силу второго равенства в (17) из предложения 2 § 8.3 следует, что при каждом т = 1, 2, ... неравенство^ (р|хт(/) — z/)^0 выполняется для всякого у е V(/) fl domf (/, •) почти при всех t, т. е., в частности,
(p\xm(t)) = (p\xk(t))
почти везде при любых т, k = 1, 2, ... Отсюда сразу следует, что (p|x) = (p|z) для всякого ze domSi и всякого р е W(x|dom Si). Это может быть лишь в том случае, если xeri(domSi). Поэтому максимум в формуле (8), в которой вместо f стоит fi, достигается, и следовательно, существует вектор-функция х*(/) такая, что ц
х. Ро) = 0, х, Pl) = х; J fl р, х. Р)) dt = S1 (х) = S (х).
Теорема доказана.
9.3.3. Общий случай. Если максимум в (8) достигается в граничной точке множества dom S*, то задача (1), (2) может и не иметь абсолютно непрерывных решений, а минимизирующие последовательности могут сходиться к разрывным функциям. Однако, в этом случае можно построить эквивалентную «расширенную» задачу, где допустимыми элементами могут быть и разрывные функции. Допустимые элементы расширенной задачи можно рассматривать, как предельные точки последовательностей допустимых элементов задачи (1), (2). Оставшаяся часть параграфа посвящена построению
412
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИИ
расширенной задачи и доказательству для нее необходимых и достаточных условий экстремума.
Будем рассматривать на отрезке [/о, Л] кусочно-непрерывные функции x(t). Всякую такую вектор-функцию будем для определенности считать непрерывной справа во всякой точке разрыва, отличной от точки и непрерывной слева в точке tQ. Другими словами, такие вектор-функции можно представлять в виде
k
x(t)=z (0 + 2 wfi (t, Xi), i—l
где z(t) непрерывна,	и
/ т > /0
е(/- т)={ i:
если
если
или
или
^5 Т t try
t > Т /q,
Вектор-функцию такого вида мы назовем кусочно абсолютно непрерывной, если z(t) абсолютно непрерывна. Множество кусочно абсолютно непрерывных вектор-функций со значениями в Rn, имеющих не более п -f- 1 точек разрыва, будем обозначать через
Вернемся к задаче (1), (2). Пусть А — измеримое подмножество отрезка [/0, Л]. Положим
(х) = inf I J f (t, у (/)) dt у(-)(=Ь" (Д), J у (f) dt = x 1.
I д	д	J
Тогда
5д(р) = /Г(Л p)dt, A
если только 5д— собственная функция. Очевидно, domS^c: domSl2, если Д2с:Д1.	(18)
Пусть т <= [/о, 6]. Обозначим через Р% объединение множеств dom Sa, взятое по всем окрестностям Д точки т. Ясно, что множество Рт выпукло. Это сразу следует из (18) и выпуклости всех 5д. Наконец, для каждой кусочно абсолютно непрерывной вектор-функции положим
tt	k
(19)
*о	i==l
§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
413
(где $(• |.Р), как обычно, — опорная функция множества Р) и рассмотрим задачу
М(х( -))-»inf;	(20)
х(-)^Х’п, x(fo) = O, x(t,) = x.	(21)
Очевидно, если z(-)—допустимый элемент задачи (1), (2), то функция х (•) = z (•) допустима в задаче (20), (21) и
J7(z(.)) = M(x(.)).
Теорема 3. Пусть S — собственная функция. Тогда, если х(-)е.Жп и х(^о) = О, то найдется такая последовательность хт (•) абсолютно непрерывных функций, что
(fo) ~ 0, Хт (/) —> X (t)
при всех t е [£0, Л] и lim (хт (•)) М (х (•)). Если же,
т~>оа
кроме того, x(/1)eri(domS), то последовательность {хт(«)} можно выбрать так, чтобы х — xm (/J при m — 1, 2, ...
Доказательство. Если Л4(х(-))=оо или х(-) абсолютно непрерывна, то доказывать нечего. Поэтому в дальнейшем предполагается, что М (х (•)) < оо и Si wt О 0.
k
Итак, пусть x(t) = z(t) -f- У (/, tJ, где z(f) абсо-i=l
лютно непрерывна и	•••	Для вся-
кого е > 0 положим
_ ((Ti — е, tJ, ,е I 1^о> ^о+е), А/В = (Ъ — *Д vfe = J Z (t) dt,
Докажем, что
если Т! > tg, если ij = t0, i = 2, ..., k, i= 1......k.
lim S&le (Wi + vis) = s (Wi |PT/).
(22)
414
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Зададимся Числами б > О, N > 0 и выберем рг е Р (т() так, чтобы
{$ (wt |РТ;) — б, если s (®z1 Рт.) < оо, N, если s(wi |РТ.) == оо.
Тогда в силу определения PTf при достаточно малых е > 0 вектор pz е dom 5д(е и
lim (w{ + vie) = lim sup ((p | wt + uiB) — Sa (p)) > 8->0	8->0 P
> (Pi I + glim ((pz1 vZb) — SI ,e (pz)) == (pi | w{).
С другой стороны, по неравенству Юнга — Фенхеля f(t, z(t))^(p\z(t))-r(t, р), откуда
lim sup ((р | wi + у/в) — SI (р)) =
= Jim sup {(р | wi + vie) — 5д/е (р) | р е= Рх.} <
|PT) + limsup f ((р|г(/)) — f (t, p))dt^
1	£->0 p /
AZe
< s (ayz I PT.) + lim j f (/, z (t)) dt = s (Wi | PT.),
E"*°
поскольку ^(z(.))<oo по предположению. Соотношение (22) доказано, так как б и N произвольны.
Коль скоро S — собственная функция, все 5д — тоже собственные функции. Поэтому S” совпадают с замыканиями функций SA, и для всяких i=l, .... k, б > О можно указать такие е» > 0 и хге, что при 0 < е < ео
I Xiz — vie—Wi | < б, 15Д/е (xZe) — Sl*is (Wi + uZe) | < 6/2. (23)
Из (23), в свою очередь, следует существование на каждом AZg суммируемой функции pZe(0, удовлетво—
§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
415
ряющей соотношениям
J Уit (0 dt — Х(е,
J f (f, У it (0) dt < S?{g (Wi + Vie) + 6. ^lt
(24)
Поскольку все точки т(, различны, при достаточно малом е интервалы Д1Е, ...» ДЙЕ попарно це пересекаются. Положим
4(0 =
40»
. Уц i/m(0>
если
если
ь
U Д/. 1/т, £ = 1
&1, Цт' г*= 1» • ••» k.
Последовательность {х6т (•)} — искомая. Действительно, ^(4(-)) = ^(-» +
г=1 ^1,1/т
и согласно (20), (22) и (24)
^(4(-))-ми-))=
k
= S / [f^y^M-f^^dt-г=' д/, 1/m fe	fe
“Ss (wt IPo < S (s4 ~s ip^)+6)-i=l k
—• 2	J f (t, z (0) dt -» kb при m —> oo,
г=1 l/m
t. e. lim lim Si (x®, (•)) M (x (•)). Далее, для всякого 6->0 m->oo
t^to обозначим через i(t) такой номер i, что
416
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Т/ < т/+1. Тогда
но
4(0 = г(/) + 2 J (^, ./Л)-*('))<# =
^=1	If tn
i (О
= *(') +IX 1/r„-^, l!m) i=l
или в силу (23)
I xm (0 — x (Z) I <
t. e. lim lim x6 (t) = x(t) при всех t. Первая часть 6->0 m-»oo
теоремы доказана.
Предположим теперь, что x(^i)e ri(dom S). Коль скоро S — выпуклая собственная функция, она непрерывна относительно aff(domS) в точке x{t\) (теорема 3 из § 3.5). Поэтому найдутся числа до > 0 и с такие, что для любого z е aff (dom S) такого, что |х— x(fi) | до, существует абсолютно непрерывная функция £(•), удовлетворяющая условиям
z(/o) = O, z(ff) = z, j f(t, z(t))dt^c<<x>.	(25)
to
Пусть (xsm( •)} — последовательность, построенная выше. При достаточно больших номерах т и малых д будет выполняться соотношение Jx^^J—x(ffjj=am^A- Пусть zm(- ) удовлетворяет (25) и при этом
г = *„(',) = « (Q +	„) ftft) - < ft))-
Тогда
‘('’>=^<ft)+-ri?^<4.
Поэтому в силу теоремы 1 из § 8.2 для всякого достаточно большого т существует такая вектор-функция
§ 9.3. КОНВОЛЮЦИОННЫЙ ИНТЕГРАЛ
417
4(0, что 4(*о) = О. ад) = *С1) и
/ f (J. t »)л - -S7TS7 J ’ <' <'» л + to	*о
л
+ J №
^0 л
to
т. е.
lim lim ^(х» (• ))<lim lim SQx» (•)) <Л1 (х (•)). б~>0 m->oo	6->0 т->оо
Теорема доказана.
9.3.4. Описание решений и теорема существования.
Теорема 4. Пусть xsri(domS) и максимум в формуле (8) достигается в точке ро. Тогда, если кусочно абсолютно непрерывная вектор-функция
k
x(t) = z (t) 4- 2 wfi (t, тЛе Жп i=l
есть решение задачи (20), (21), то
fit, 2(0) + Г(0 Ро) = (Ро lz (0) почти всюду, (26)
.V (р01 РтJ, /=1.....k.	(27)
Наоборот, если х(-) удовлетворяет условиям (21), (26), '(27) при некотором р0, то х(-) — решение задачи (20), (21).
Доказательство. Значение задачи (20), (21) равно S(x) (это следует из теоремы 1). Если х(-) — рв’ шение задачи, то
б	fe
Af(x(-)) = / f(t, г(0)Л + 25(а;г|РТ()==5(х) = to	*=1
t{	k
= (p0 |x) - S’ (p0) = J [(Po | z (t, Po)] dt + 2 (Po
fo	f=«	(28)
14 А. Д. Иоффе, В. M. Тихомиров
418
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
С другой стороны, по неравенству Юнга — Фенхеля ' 1 f(t, z(t))^(p0\z(t))-f(t, р0)	(29) ’•
и
s(^d^xi)Xpola’>)>	(30) |
так как р0 е dom S* с РХ{. Сравнивая (28), (29) и I (30), получаем (26) и (27). Наоборот, из (21), (26), ! и (27) следует
^(x(.)) = (po|x)-S*(Po)<S(x),
т. е. х(-) —решение задачи (20), (21). Теорема до-казана.
Теорема 5. Пусть f — нормальный выпуклый интегрант. Если int(dom S*) #= 0 и максимум в формуле ^(8) достигается, то в задаче (20), (21) существует решение.
Доказательство. Пусть максимум в (8) достигается в точке ро- Тогда xedS*(p0). По теореме 4 из § 8.3 найдутся суммируемая вектор-функция y(t), принимающая почти при всех t значения из df*(t,pQ), и вектор w е N(po|dom S*) такие, что
Л
J У (0 dt + w = х.
*0
Мы докажем существование таких точек ть .... ть io<Ti < т2< •••	(Z>s^n4-1), и векторов
wt е N (р01 Рх ), что Wi + ... + wk = w. Тогда вектор-функция t	k
X (0 = j у (т) dr + 2 wfi (t, Xi) t.	i=i
принадлежит и в силу теоремы 4 является решением задачи.
Если ш = 0, все очевидно. Поэтому в дальнейшем считаем ^=^=0. Пусть р е int (dom S*)- Положим
I (р) = ц (р — р | dom S* — р), /(/, р) = ц(р— p\Pt — р).
§ 9.3. КОНВОЛЮЦИОННЫй ИНТЕГРАЛ
419
Напомним, что ц(-|Л)—функция Минковского множества А. Коль скоро р е int (dom S*) czint Pt и множества dom S* и Pt выпуклы, функции /(p) и l(t, p) выпуклы и конечны на R” и, значит, непрерывны. Покажем, что при всяком р функция l(t,p) полунепрерывна сверху по t и l(p)= max l(t, р).	(31)
Это очевидно, если р — р. Пусть р #= р. Тогда Z(p)>0 и l(t, р) > 0 при всех t. Имеем
l(t, p) = inf{A>o|-^=^- + pf=pJ.
Поскольку множества Pt выпуклы, для всякого е > О l(i,p) + e + Р^Р‘‘
Из определения Pt следует возможность выбрать окрестность Д(/) точки t таким образом, чтобы
7(Hrfc- + ^domSl.
Но это означает, что
Р-Р...4--пееР
l(t, р) + е + Р^**
для всякого теА(/), т. е. для таких т верно неравенство Z(t, р) 1(1, р)+ е и, следовательно, функция l(t,p) полунепрерывна сверху по t. Далее, мы можем покрыть отрезок [Zq, t J конечным числом окрестностей A(xi), ..., Д(ТТО). Пусть
Ао = max [I (тг, р) + е |г == 1, ..., т].
Тогда при всяком i = 1....т
-р~р- + р е dom /т ), Ло	' 1'
т. е. /поскольку (J А (т() — [/0, ЛЙ \	i	/
+ р е dom S‘ = Q dom Sa (Xi).
14*
420
ГЛ. 9. СУЩЕСТВОВАНИЕ РЕШЕНИЙ
Отсюда следует, что I (р) Л0 max I (t, р) -|- е, т. е» / (р) max / (/, р) из-за произвольности 8. С другой стороны, /(р)^/(/, р) для всякого t, поскольку domS*czPf. Итак, формула (31) тоже доказана.
Очевидно, ро ф int (dom S*), поскольку w У= 0. Поэтому Z(Ро) > 0. В силу предложения 2 из § 4.3 найдутся Х>0 и wed/(po) такие, что Xw = w. С другой стороны, в силу (31) и теоремы 4 из § 4.2 существуют точки Ti, ..., Т/j, векторы wh ..., wk 'и числа си 0, ... ..., а/г 0 (k п + 1) такие, что
/ (tp Ро) = I (Ро), «1 + ... + а* = 1, wt dl (rb Po), w = ajw! + ... + akwk.
Положим = Коль скоро I (xh pQ) > 0, снова в силу предложения 2 из §4.3 w. е N (pQ | Но в этом случае w —	+ ... +^. Теорема доказана.
Комментарий к гл. 8 и 9. Подробные изложения теории измеримых многозначных отображений можно найти у Ауманна [2], Аркина и Левина [1], Валадье [3], [4], Кастена [1]. Из более ранних работ укажем статьи Куратовского и Рылль-Нарджевского [1] и Рохлина [1]. По поводу теоремы Ляпунова (Ляпунов А. А. [1]) и интегралов от многозначных отображений см. Ауманн [1], Блэкуэлл [1], Валадье [3], Дебре [1], Кастен [2] и др. Приведенное здесь доказательство принадлежит Линденштрауссу [1]. Обобщения теоремы Ляпунова можно найти у Аркина и Левина [1], Олеха [2], Романовского и Судакова [1], Халкина [1], [2]. Выпуклые интегральные функционалы рассматриваются в обзорах Иоффе и Левина [1], Иоффе и Тихомирова [3]. Рокафеллара [12].
Литература по теории существования решений огромна. У ее истоков стоят работы Тонелли [1], Макшейна [1]—[3], [6], Нагумо [1], Филиппова [1], Чезари [1], [2]. Дальнейшие результаты можно найти у Берковица [1], [2], Олеха [3], Рокафеллара [13], Синквини [1]—[3], во многих работах Чезари и др. По поводу многомерных задач см. Лионе [I], Морри [1]. С проблематикой теоремы Боголюбова (Боголюбов [1]) связаны многие исследования скользящих режимов, релаксаций и расширений: Варга [1], [2], Гамкрелидзе [4], Иоффе и Тихомиров [2], Янг [1]; подробности см. в монографии Варги [4] и Экланда и Темама [1]. Для дальнейшего ознакомления с линейными и выпуклыми задачами мы отсылаем к работам Красовского [1], [3], Понтрягина, Болтянского, Гамкрелидзе и Мищенко [1], Рокафеллара [8], [9], Халкина [3], [4] и др.
Глава 10
ПРИЛОЖЕНИЕ ТЕОРИИ К РЕШЕНИЮ ЗАДАЧ
§ 10.1.	Задачи геометрической оптики
На примере задач геометрической оптики легко проследить те геометрические и физические идеи, которые лежат в основании формализма Гамильтона — Якоби — Беллмана в вариационном исчислении и теории оптимального управления, а также метода возмущений в теории экстремальных задач. Это связано прежде всего с тем, что математическая формулировка задач геометрической оптики необычайно проста и не заслоняет их физической природы. Поэтому каждый результат допускает физическое истолкование и, наоборот, из естественных физических соображений легко угадывается форма необходимых математических теорем. С другой стороны, многие интересные задачи можно интерпретировать как задачи геометрической оптики, — таковы, например,' задачи оптимального быстродействия для автономных объектов.
Большая часть рассуждений в начале параграфа не претендует на строгость. Их цель — показать, как, отталкиваясь от простых и интуитивно ясных соображений, можно прийти к содержательным математическим результатам.
10.1.1.	Принцип Ферма. Пусть имеются прозрачная неоднородная и, для простоты, изотропная среда и источник света, расположенный в точке х0 = (х^, х*, х^). Обозначим через v(x) скорость распространения света в точке х = (х1, х2, х3). Спрашивается, по какому пути будет идти световой луч из точки х0 до точки Xi? Отвечая на этот вопрос, Ферма выдвинул следующий вариационный принцип, который был первым принципом такого рода для физической проблемы. Согласно принципу Ферма, свет избирает такую траекторию, чтобы,
422
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
время его движения по ней
2'<"<-» = 1тй- ()
Хо
было не больше, чем время движения по любой кривой, соединяющей точки х0 и В дальнейшем этот принцип получил уточнение: траектория распространения света не обязательно доставляет минимум функционалу Т, но она обязана быть стационарной точкой этого функционала. В такой форме принцип оказывается верным и для неизотропных сред, где абсолютная величина скорости зависит от ее направления.
В общем случае неизотропной среды ее оптические свойства в точке х описываются множеством V(x), которое представляет собой совокупность всех возможных векторов скоростей света в точке х. Само множество V(х) при этом меняется от точки к точке (неоднородность среды). Это означает, иначе говоря, что задано многозначное отображение х—*V(x). При этом траектория движения светового луча от точки Хо до точки Xi в соответствии с принципом Ферма может рассматриваться как решение следующей задачи на оптимальное быстродействие:
T->inf; xeF(x), х(^0) = х0, х(^) = хь (2)
Нижнюю грань в задаче (2) обозначим Г(Х1,х0).
Приведем несколько примеров. Задача о брахистохроне, сформулированная во введении, сводится к минимизации функционала (Xi. Ух)
2
(Хо, у о)
Мы видим, что это задача плоской геометрической оптики, где скорость света задается равенством v (х, у) = К#-
Известно, что плоскость Лобачевского допускает реализацию в полуплоскости у > 0, если элемент длины задать формулой ds2 — y~2(dx2 + dy2). Полученное так риманово многообразие называется полуплоскостью Пуанкаре. Следовательно, задача о геодезических в полуплоскости Пуанкаре формулируется так:
(Xi, уд

У
dx -> inf.
(Хо, У о)
§ 10.1. ЗАДАЧИ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ
423
Снова получается задача плоской геометрической оптики с v(x, у) = у.
Задача о минимальной поверхности вращения может быть интерпретирована как задача плоской геометрической оптики с »(х,г/)= у~*.
Рассмотрим задачу оптимального управления автономным объектом:
Т -> inf;
х — qp (х, и), и (=U, х(О) = хо, x(T) = xi.
Ее можно редуцировать к задаче (2), если положить V(x) = == ф(х, U).
В задачах геометрической оптики удобно считать, что все множества V(x) выпуклы и содержат нуль. Первое предположение, хотя и кажется поначалу слишком сильным, на самом деле не является ограничительным. Подобно тому, как в теореме Боголюбова первоначальный интегрант можно заменять выпуклым по производной, так и в задачах на быстродействие можно, не изменяя значения задачи, «овыпуклять» множество возможных скоростей, заменяя его выпуклой оболочкой.
10.1.2.	Принцип Гюйгенса и уравнение Гамильтона — Якоби. Для задач геометрической оптики этот принцип можно записать в очень естественной и красивой форме. Пусть Д(х) и В(х)— многозначные отображения из Rn в Rn. Через А у В обозначим, как и в § 8.1, суперпозицию отображений А и В:
(ЛоВ)(х)= □ Л(Ю.
(х)
Рассмотрим однопараметрическое семейство множеств
^(x0) = {xeRn|r(x; х0)</}.
Тогда
t+s W == t ° s) W = (^~s ° /) (*о) •	(3)
Соотношение (3) и есть принцип Гюйгенса.
Действительно, вложение o (х0) cz^+s(x0) означает, что, если точки z свет может достичь из точки х за время $, а точки х из точки х0— за время t, то точка z достижима из точки х0 по крайней мере за время t + s. С другой стороны, вложение ^7~/+s (х0) cz cz(^s (хо) означает, что, если точки z можно достичь из Хо за время то на траектории можно
424
ГЛ. 10 ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
отметить точку х, в которую свет придет за время t. Но тогда из х в z можно дойти за время, не большее £ Физическое содержание принципа Гюйгенса состоит в том, что он позволяет описывать процесс распространения света при помощи волнового фронта — границы множества £rf(x0).
Пусть теперь
Т (х; х0) = inf [t > 0 | х е ?Гt (х0)}.
Функция Г (х, Хо), называемая обычно оптической дли-ной пути от точки Хо до х, является, очевидно, S-фупк-цией задачи (2), если в качестве возмущения рассматривать точки, в которые свет должен попадать в конце траектории. Покажем сейчас, как с помощью принципа Гюйгенса и простых (хотя и не абсолютно строгих) рас-суждений можно получить уравнение Гамильтона — Якоби для задачи (2).
Допустим, что оптическая длина Т(х;хо) является дифференцируемой функцией переменного х. (Разумеется, так хорошо дело обстоит далеко не всегда. Например, в задаче о наименьшей поверхности вращения функция Т не является всюду дифференцируемой.) Предположим далее, что любая точка х некоторой области U cz Rn соединяется с точкой х0 единственной траекторией светового луча (исходящего из х0), которую обозначим х(-,х0). Рассмотрим точку х*е(Л Ведущая в нее траектория светового луча есть х*(-,х0), а оптическая длина пути из Хо в х* есть Г(х#;хо)= Г*. За последующее время Д/ свет, двигаясь по траектории х*(-,Хо), пройдет путь х#(7\; х0) Д/= у* Д£ (если пренебречь малыми более высокого порядка). При этом получается равенство
Т (х# +	Д/; х0) = Т (х+; Хэ) + Д/ = 7\ + ДЛ
Но если бы в точке х* свет избрал другую скорость v9 то по принципу Гюйгенса и по определению оптической длины получилось бы, что
Т (х* + v Д/; х0) Т (х/, х0) + Д/.
В итоге получаем уравнение
Д/ = sup (Т (х* + Д/; х0) — Т (х/, х0)) =
= sup (7,'(xt; х0)|и))Д/
VG= V (Xj
§ 10.1, ЗАДАЧИ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ
425
или, если провести это рассуждение для произвольной точки х е I/,
sup (Г'(х; %о) I ^) = 1 •
v <= V (х)
Если вспомнить определение опорной функции множества А:
s (Т) | Л) = sup (n I £),
то станет ясно, что получилось следующее уравнение в частных производных для оптической длины:
s(F(x; x0)|V(x))=l.	(4)
Это и есть уравнение Гамильтона — Якоби для задач геометрической оптики.
Приведем пример. Если среда изотропна, т. е. если
V (х) = S (0, v (х)), где S (|, г) = {х 11 х — g | = г}, то
s (Т) | S (0, г)) = г I я |
и уравнение Гамильтона — Якрби приобретает вид
10.1.3.	Принцип максимума. Рассмотрим задачу оптимального быстродействия автономным объектом:
Т->inf; х = ф(х, u), u<=U, х(О) = хо, х(Т)=хь и обозначим, как и раньше, V(x) = <р(х, U). Пусть (%*(•), п*(-))— оптимальный управляемый процесс в этой задаче. Тогда в силу принципа максимума найдется такое нетривиальное решение p(t) сопряженного уравнения
р=—фЖ(о» «.	(6)
что
(р (0 IФ (х. (0, «. (0)) = max (р (0 | ф (х, (0, «))•	(6Э
ue U
Положим
а (р, х) = s (р | V (х)) = sup (р |ф (х, и)).
u^U
426
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ.
Если множество U компактно, то в силу теоремы 3 из | § 4.4 функция х->о(р, х) регулярно локально выпукла J и соотношения (6) и (6') можно переписать в виде i
— ре=дхо
X f=dpG(p(f), X, (/)).	|
Это естественная форма принципа максимума для задач | геометрической оптики, записанных в форме (2). f
10.1.4.	Задачи.	I
Задача 1. Геодезические на полуплоско- J с т и П у а н к а р е.
В соответствии со сказанным ранее, нужно решить такую задачу:
Г 1/------
.У —dx->inf; у > 0.
J У
(Хо, £/о)
Интегрант здесь не зависит от х, и следовательно, уравнение Эйлера допускает интеграл энергии (см. § 2.2)
у V1 + у'2 = С,
т. е. приводится к такому дифференциальному уравнению первого порядка:
Его интегрирование дает следующее выражение для экстремалей:
у2+(х+С1)2 = С2.
Таким образом, экстремалями являются полуокружности с центром, лежащим на оси у = 0. Через любую пару точек (х0, yQ) и (xb£/i), х0 #= *i, проходит единственная экстремаль, которую многими разными способами можно включить в поле экстремалей, покрывающее всю полуплоскость у > 0. Например, можно взять пучок полуокружностей, имеющих общую точку на оси у = 0. Интегрант в этой задаче, как и в любой изотропной задаче геометрической оптики, квазирегулярен. Поэтому из теоремы 3' § 7.4 следует, что найденная экстремаль является решением поставленной задачи.
§ ЮЛ. ЗАДАЧИ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ
427
Задача 2. Брахистохрона.
Не раз говорилось уже, что задача о брахистохроне допускает такую формализацию:
(Хь Уд ------
[ J/1 +j/—	| |	> о
J	V у	и
(х0,у0)	' *
Снова можно написать интеграл энергии
V а2~у
Это уравнение легче всего проинтегрировать с помощью подстановки
у = a2 sin2 (//2).
При этом решение находится в параметрической форме х =	(/ —sinO + c,
i/ = 4- — cos0.
Это — циклоиды. Как и в первой задаче, можно легко показать, что через любые две точки верхней полуплоскости можно провести единственную циклоиду такого вида и при этом включить ее в центральное поле, покрывающее всю верхнюю полуплоскость. (Это поле может быть, например, образовано всеми гомотетиями данной циклоиды с центром в одной из точек ее пересечения с осью у = 0.) Так что и в этой задаче в силу теоремы 3' § 7.4 экстремали являются решениями.
Задача 3. Минимальная поверхность вращения.
Эта задача записывается так:
(Х1. уд _____
J У УI + у'2 dx->inf; г/^0.
(Хо, У<д
Мы ее интерпретировали выше как задачу плоской геометрической оптики со скоростью, обратно пропорциональной у. Если в предыдущих двух задачах скорость
428
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
распространения света возрастала с высотой, то здесь она убывает. Поэтому в отличие от предыдущих двух задач траектории будут опускаться ниже низшей из двух заданных точек. Интеграл энергии уравнения Эйлера
у = с V1 + у'2
имеет решение
У = ссЬ(т + d\
Продолжим исследование в симметричном случае, когда Хо — —Х\, yQ = У1. Тогда решения уравнения Эйлера приобретают вид
У = ссЬ7-	(8)
Таким образом, экстремалями являются цепные линии. Легко понять, что их совокупность двукратно покрывает
внутренность угла, образованного прямыми, проходящими через начало координат и касательными к кривой у = ch к (рис. 13). Вне этого угла провести допустимую цепную линию не удается. Если точки (Хо, f/о) и (xi, г/i) лежат на сторонах угла, то через них проходит одна цепная линия, если внутри — то две, одна из которых ка-
сается сторон угла, а другая— нет. Вторую из этих экстремалей легко окружить полем, и следовательно, по теореме 3' § 7.4 она дает локальный минимум. На первой же экстремали не выполнено условие Якоби, ибо близкие к ней экстремали пересекаются с ней в точках, близких к тем, в которых
она касается сторон угла.
Вопрос об абсолютном экстремуме и о характере ре-
шения задачи в случае, когда граничные условия заданы вне угла, требует дополнительного исследования; Запи<
§ 10.1. ЗАДАЧИ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ
429
тем задачу 3 как вариационную задачу в параметрической форме
1
J У V*2 + //2^~>inf; о
х(О)=хо, y(O) = z/o, х(1) = хь г/(1) = г/ь
где т —некоторый параметр, ахи у — производные по т. Система уравнений Эйлера в этой задаче выглядит так:
4- ( г уу ) - Vx2 +у2 - 0, dx \ /х2 + у2 I	' *
d / ух \ _ 0 dr \ J^x2 + у2 /
Рассмотрим интеграл второго из этих уравнений
—
Vx^+y^
Если с #= 0, то у =# 0 и, значит, у > 0, х #= 0 и, следо* вательно, х имеет постоянный знак. Поэтому все сводится к рассмотренному уже случаю. Предположим теперь, что с = 0. Тогда на всякой экстремали в каждой точке либо у — 0, либо х = 0. Легко видеть, что такая экстремаль состоит из трех участков, на первом из которых х = 0, а у меняется от уо до нуля, на втором у = 0, а х меняется от х0 до хь и на третьем х = 0, а у меняется от нуля до yQ.
Таким образом, имеются экстремали двух видов: цепные линии и ломаные экстремали, состоящие из двух вертикальных кусков и участка х0 х хь у = 0. «Оптическая длина пути» по экстремалям первого вида, соединяющим точки (—х, у) и (х, у), равна, как нетрудно подсчитать, у2Ф(х!у) = Ар(х/с), где
ф (g) = 2 J ch2 х dx, у = с ch у, о
а по экстремалям второго вида у2. Эти функции принимают одинаковые значения на сторонах угла целиком лежащего внутри угла, образованного касательными к кривой y = chx, проходящими через начало координат.
430
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
Функция
S (х, у) = min (у2Ф (x/z/), у2)
оказывается S-функцией нашей задачи. Мы видим, что она является ломаной, т. е. не непрерывно дифференцируемой.
Задача 4. Обобщенная изопериметр и-ческая задача.
Рассмотрим такую задачу:
т
J/2 J (xv — уи) dt -> sup; х = и, y = v, о
х (0) = х (Т), у (0) = у (Г), Т — фиксировано, (и, v) е A cz R2.
Она несколько отличается от задач геометрической оптики, ибо в (9) — другой функционал, но вместе с тем имеет с ними много общего. Функционалом в (9) является площадь. Множество А можно интерпретировать как совокупность локальных скоростей материальной точки. Таким образом задача (9) состоит в отыскании такой замкнутой кривой, ограничивающей наибольшую площадь, которую материальная точка может обойти за заданное время. Если А—единичный круг, то получаем классическую изопериметрическую задачу. Если А — сдвиг единичного круга на постоянную величину, то получается задача Чаплыгина о самолете, который должен за заданное время облететь наибольшую площадь при наличии ветра и т. д.
Задача (9) есть задача оптимального управления и ее можно решать с помощью принципа максимума в гамильтоновой форме (теорема 1 § 2.4). Составим функцию Понтрягина
Н = ри + qv — (Z0/2) (xv — у и)
и сопряженную систему
р = Zou/2 = Х0у/2; —q == Х0и/2 == Хох/2. (10)
Если Zo = 0, то р и q постоянны и в силу принципа максимума скорости и и v были бы тоже постоянны, но
§ 10.2. НЕРАВЕНСТВО ЮНГА
431
тогда не получится замкнутая кривая. Поэтому можно считать, что Хо = 2. Если (%*(•), */*(•)) — оптимальная траектория, то ввиду автономности задачи функция Н постоянна на траектории и, значит, в силу (10) получается, что
Р (0 = У. (!) + 2а, — <7(0 = \(0 + 2&,
Н = 2и, (у* + а) — 2и, (х, + Ь) =
= 2 sup [и (у, 4- а) — о (х. + 6)1 = 2С0.
(и, v)<= А
Итак, s((y'-fa, ^х— 6)|Л)== Со, т. е. оптимальные траектории суть сдвиги линий уровня опорной функции множества Л, повернутого на л/2. В частности, в классической изопериметрической задаче решением будут окружности, в задаче Чаплыгина, где скорость летательного аппарата равна единице, а скорость ветра (0,у), v <Z 1, — эллипсы*.
Vx2 + y2 —yv = c.
§ 10.2. Неравенство Юнга и теорема Хелли
10.2.1. Неравенство Юнга.
Предложение 1. Для любого ограниченного зам* кнутого множества 3, расположенного в п-мерном евклидовом пространстве Rn, имеет место следующее неравенство между диаметром D(S) множества S и радиусом J^(S) описанного шара:
Д (£)>]/-2(\+-1-- ^(S).	(1)
Неравенство (1) переходит в равенство, если S — правильный симплекс.
Неравенство (1) называется неравенством Юнга. До* казательство его равносильно решению такой экстре* мальной проблемы:
7?(S)-* sup; D(S)<1,	(10
где
/?(S) = inf sup | х — y\, D(S)= sup |x — yf.
Перед нами «супинфмаксная» задача сложной природы. В задаче об определении радиуса R (S)
432
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
множества S требуется найти нижнюю грань выпуклой функции, которая является максимумом из выпуклых-® функций. Это обстоятельство дает возможность приме- Ж нить теорему об очистке. Выделим соответствующее ж утверждение в виде леммы.	®
Лемма 1. Для того чтобы шар В(х0, г) был описан- I ным шаром для множества S, состоящего более чем из Ж одной точки, необходимо и достаточно, чтобы он был I описанным шаром для некоторого симплекса с верши- Я нами, расположенными на S.	1
Из леммы сразу вытекает, что неравенство Юнга i достаточно установить лишь для симплексов в Rn. I
Доказательство леммы. Положим	I
f(x) — max| х — у |.	|
y^s
Ясно, что f — непрерывная, выпуклая функция, растущая на бесконечности. Следовательно, найдется такой вектор Хо, что f(х0) = inff(x) = R(S). В точке х0 выполняется соотношение
Оед/^хо),	(2) j
являющееся необходимым и достаточным условием ми- | нимума.	j
Воспользуемся теперь теоремой об очистке. В соот- | ветствии с этой теоремой и в силу (2) найдутся такие  векторы Zi е Rn, yt^S,	г^н+1 и положи-
тельные числа 1 i г, что
ее дх |х0—yt |, 1	< г, | х0—yt | = f (х0) = /?(5),
2^=1, 5^ = 0. i=l
В силу того, что S состоит более чем из одной точки, f = I *о — | #= 0 и, значит, дх | х0 — yi\ состоит из единственного элемента (х0 — yj/l х0 — yi |. Отсюда и из (3) получается, что
Векторы {у} являются вершинами симплекса в Rn. Если теперь начать снова решать задачу об описанном шаре,
§ 10.2. НЕРАВЕНСТВО ЮНГА
433
но для этого симплекса, то обнаружится, что та же точка Xq явится центром описанного шара для него, ибо уравнение (4) в сочетании с (3) дает достаточное условие минимума. Этим завершается доказательство леммы.
В итоге получилась новая вариационная задача, а именно задача (Г), где в качестве S выступают всевозможные симплексы в Rn. Эту последнюю задачу решим непосредственно, не применяя вариационных методов.
Пусть S — симплекс диаметра D(S) с вершинами в точках уъ ...» i/fe+i и Хо — центр описанного вокруг него шара так, что fc+i	fc+i
Xq — Jj ^1Уit M > 0> ZL 1 f=l	i=l
И
1*0 — yt |== /?(S), *=1, •••, k + I, Z)2(S) = max {| yi — y} I2, 1<Z, /<*+!}•
Далее,
I yt — У} \2 = (У1 — У1 \У1—У}) = \ yi—XQ |2 + l У j— Xq I2 — — 2 (lji — Xq \yf —X0) = 2R2 ^)—2(yi ~~~ Xq \ у I — Xq),
Поэтому
k+\	[k+\	\
2 \yi -y^ = 2R2 (S)-2 2 к(У1-х0 \y}-x0] = 27?2 (2), i=l	\i=l	/
и значит, fc+i	£+1
i, /=!	tV/=l
С другой стороны, /г + 1	/ fc+1 \2	£+1
2	2 M — 2 ^<i-i/(£ +!) = &/(&+1).
Таким образом,
2/?2(S)= 2 ^jlyi-y,^ l^/=l
< ( 2 ХД/) D2 (S) < (k/(k + 1)) D2 (2)
V¥4=l	/
434
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
k 4-1 п 4- 1	1
и, поскольку ——-— При k^tl, то
D(S)>2I«±JL £(2).
Это неравенство справедливо для любых симплексов, а значит, по доказанному ранее, — для любых множеств S. Неравенство переходит в равенство, если 2 — правильный симплекс. Предложение 1 доказано.
10.2.2. Теорема Хелли. Пусть {Xv}vSiv — некоторое семейство выпуклых замкнутых подмножеств Rn. Предположим, что среди множеств Ду есть хотя бы одно ограниченное. Тогда, если пересечение любых п + 1 множеств Av непусто, то и пересечение всех множеств Ду также непусто.
Доказательство теоремы Хелли проведем вариацион* ными методами. Положим
f (х) — sup р (х, Ду) = sup inf | х — у |.
Ясно, что f(xo) = 0 тогда и только тогда, когда хое fl Ау> следовательно, надо показать, что нижняя ve N
грань функции f достигается и равна нулю. Предположим сначала, что У состоит из конечного числа элементов: М=	Для определенности пусть ограни-
ченным будет множество Тогда f(x)— конечная функция, растущая на бесконечности, поскольку f(x)^' ^р(х, Л1)-*оо при |х|—»оо. Значит, нижняя грань функции f достигается в некоторой точке хо, где
O<=df(xo).	(5)
Снова применим теорему об очистке. В соответствии с ней и с (5) найдутся г^п^-1 индексов vi, ..., vr, г чисел Хг<>0,	и г векторов г/ь ..., ут та-
ких, что
а)	уге=<Эр(х0> AV(j,
б)	р (Xg, = f С^о)»
п
в)	2 = 1»
i=l
Г)	2	= о»
i=l
§ 10.3. ВОЗБУЖДЕНИЕ ОСЦИЛЛЯТОРА
435
Еще раз применим то же рассуждение, что провели в конце доказательства леммы 1. Рассмотрим функцию f1(x) = imax^p(x, Л¥.),
Из уравнений а) — г) вытекает, что 0 dfi(x0), и следовательно, в точке Хо функция fi имеет минимум. С другой стороны, из соотношения б) вытекает, что fi (х0) = = f(xQ). Но по условию теоремы любые	мно-
жеств пересекаются, значит, fi (х0) — 0. В итоге получилось, что /(хо) = О, а это означает, что все множества Лу, v = 1, ..., А/, пересекаются.
Пусть теперь N — любое бесконечное множество и Лу0 ограничено. По доказанному, пересечение Лу0 с любым конечным семейством множеств Лу непусто. Такие пересечения образуют, следовательно, центрированную систему. По известному свойству компактных множеств отсюда следует, что все множества Лу пересекаются. Теорема Хелли полностью доказана.
§ 10.3. Оптимальное возбуждение осциллятора
Здесь решается одна задача из теории управления. Изложение во многих местах — конспективное. Читателю надлежит восполнить пропущенные детали.
10.3.1. Задача об оптимальном параметрическом возбуждении осциллятора. Рассмотрим задачу!
—> inf;
х + (1 — ег/)х = 0,
х(О)=хо, л:(О) = г/о, x2(tl) + x2(tt) = l,
0<е<1.
Поясним ее физическое содержание. Уравнение х +	= 0 есть уравнение гармонического осцилля-
тора с переменной жесткостью s(t). В нашем случае жесткость s(t) может меняться в пределах 1 — 8^
В невозбужденном состоянии, когда и = 0, s=l и энергия осциллятора равна (х2 + х2)/2. Таким образом, задача состоит в отыскании такого закона возбуждения жесткости осциллятора, при котором (после
436
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
того как возбуждение будет снято) его энергия достигла Я| бы заданной величины за минимальное время. Сейчас w мы построим полный синтез задачи при любой величине ж I 0 < е < 1 и затем проведем сравнение точного решения  и приближенного решения (см. Евтушенко [1]).	Я
Положив х = у, приведем задачу к стандартному ж виду задачи оптимального управления:	Я
tx->inf;	1
х = у, у — — (1—ш)х (0 < 8 < 1),	|
х(О) = хо, х(О) = уо, х2(О + *2(Л)= 1, I
I
Применим принцип максимума Понтрягина в гамильто- ? новой форме (теорема 1 § 2.4). Функция Н имеет вид
Н = ру— q(\—ем) х
и, следовательно, сопряженная система такова: р = (1—е«)<7, q = — р.
Для р и q выполнены условия трансверсальности
Р (fi) = — И* (Л). <7(^1) = — ЦУ(^1)> или
q + (1 — ем) q — 0,	1
<7 (/1) = — цх (;,), q (/,) = |хх (ti). /
(1)
Видно, что функции x(t) и q(t) удовлетворяют одному и тому же уравнению.
Принцип максимума дает такое выражение для оптимального управления:
( 1, если qx > 0, “«“{о, сеян ,х<0.	®
или, короче, u(t)=Q(qx), где 0(Х) — функция Хевисайда.
Найдем единственное решение написанных соотношений. Ясно, что ц =# 0, ибо иначе из (1) мы получили бы, что q = 0, а значит, и р = q = 0, чего не может оыть в силу принципа максимума. Значит, можно считать, что р = L
§ 10.3. ВОЗБУЖДЕНИЕ ОСЦИЛЛЯТОРА
437
Далее, легко понять, что u(ti—0)= 1, ибо иначе энергия Е достигалась бы за время меньшее, чем ti (ибо, если и = 0, то энергия не меняется). Следовательно, из (1) и (2) получаем, что
о < q (tl) х (tl) = — х (tl) х (tl).
Таким образом, точка (x(/i),x(6)) лежит во второй или четвертой четвертях фазовой плоскости. Для определенности допустим, что вектор (x(/i), x(/i)) лежит в четвертой четверти:
х (/J = cos а, х (/J = sin а, — л/2 < а < 0.
Тогда, в силу (1) (напомним, что ц = 1)
q (/J =—х (t{) = cos (а + л/2), q (^i) = * (^i) = sin (а + л/2).
Получилось, что вектор (q(ti), q(t\)) повернут относительно вектора (х(Л), х(Л)) на угол л/2 против часовой стрелки.
Отметим теперь, что в невозбужденном состоянии '(когда и = 0) точки (х(/),х(/)) и (q(t),q(t)) совершают движение по кругам в фазовой плоскости, а в возбужденном состоянии — по эллипсам х2-\-х2! (1 — е) = = а, в обоих случаях движение совершается по часовой стрелке.
Будем решать нашу задачу «с конца», более того, оставим нашу систему в возбужденном состоянии еще на некоторое время (после момента Л) до тех пор, пока х не станет равным нулю. Обозначим этот момент через Т > /j. Точка (х(Г),х(Т)) расположена на вертикальной оси. Допустим, что в момент времени Т вектор (q(T), q(T)) занял такое положение:
q(T) = р cos со, q (Т) = р sin со, со = со (а).
(Впоследствии мы вычислим со (а), и окажется, что со (а) >0.) Теперь будем двигаться «в обратную сторону».
438
ГЛ. 10. ПРИЛОЖЕНИЕ ТЕОРИИ К ЗАДАЧАМ
Сначала (при Т — /<Р) наш осциллятор возбужден, а следовательно, и точка (х, х), и точка (#,</)’ совершают движение по эллипсам. Первым вертикальной оси достигнет вектор (q,q), а вектор (х, х) к этому моменту будет образовывать с осью х угол, равный (—1)о(а). В этот момент произошло последнее переключение, до которого жесткость равнялась единице и, следовательно, оба вектора совершали равномерное круговое движение. При этом вращении (но при движении в обратном направлении!) первым достигнет вертикальной оси вектор (х, х), и это будет момент предпоследнего переключения. В этот момент вектор (q, q) будет образовывать с горизонтальной осью угол со(а) + л и т. д.
Мы приходим к тому, что при своем движении жест-* кость переключается тогда и только тогда, когда фазовая траектория пересекает либо вертикальную ось (и тогда жесткость меняется с 1 — е на 1), либо прямую х=(—tgco(a))x (и тогда жесткость меняется с 1 на 1 — е).
Остается вычислить кривую со (а). Вблизи точки t — t\ функция х(/) имеет вид
х (0 = A cos (УТ^7 (t - tx) + y).	(3)
откуда, используя равенства x(f1) = cosa, x(^) = sina, сразу получается, что
Л К1 — 8 cos2 a .	sin a	cos a z,4
A = -—,-----—, siny =—." r——’» cosy = ——. (4)
/Г^в	A /1 - s	A ' '
Вблизи точки t = ti функция q (/) имеет вид q (t) = = В cos (У 1 — e (t — ty) + б). Учитывая равенства q (fj = = — sin a, (ZJ = cos a, будем иметь:
r,	/1 — e sin2 a	. .	cos a	. sin a
/1-8	В /1-8	В '
Момент времени t2, когда происходит последнее переключение, определяется из условия q (Z2)=0, q &) > 0, т. е.
§ ю.з. возбуждение осциллятора
439
Отсюда и из (3), (4), (5) находим, что
х (t2) = A Sin (у — б) =	*------ =	....1	.. ,
В У 1 — е У 1 — е sin2 а
х (/2) = А У1 — е cos (у — б) =
___е sin а cos а _____ 8 sin а cos а В У 1 — 8 У1 — 8 sin2 а
(6)
Формулы (6) определяют точку последнего переключения в зависимости от а, т. е. от положения фазовой точки в момент Л. При изменении а от 0 до —л/2 точка (х(/2), х(^2)) описывает на фазовой плоскости кривую /, концы которой лежат на оси абсцисс. Из формул (6) находим, что
±	/ \ х (t2)
tg (о (а) =-----77V = — 8 sin а cos а.
Проведем сравнение точного и приближенного решений. Обозначим х/х через tg#. Тогда оптимальное управление задается так:
и = 0 (— tg (о (а) —• tg у) = 0 (е sin а cos а — tg у).
В то же время, как это следует из работы Евтушенко [1], приближенная формула для оптимального управления такова: й = 0 (—tg #).
Комментарий к гл. 10. Вариационный принцип Ферма был выдвинут в 1669 г., принцип Гюйгенса — в 1690 г. (Гюйгенс [1]). Оптико-механическая аналогия привела И. Бернулли к решению задачи о брахистохроне. Серия задач, включающая задачи 1—3 § 10.1, подробно исследована в курсе анализа Гурса.
Задачи на быстродействие для объектов, описываемых дифференциальными включениями, изучались Болтянским [3] и Благодатских [1].
О теореме Хелли см. Данцер, Грюнбаум, Кли [1]. Доказательства теоремы, опирающиеся на теорему об очистке, содержатся в работах Карлина [1] и Пшеничного [4]. Решение задачи Юнга, сходное с нашим, содержится в работе Джона [1].
Задача из п. 10.3.1 рассматривалась Евтушенко [1]. Решение, изложенное у нас, получено Барыкиным.
ЗАДАЧИ
Раздел открывается циклом старинных задач. Далее следуют разнообразные задачи на экстремум из алгебры и геометрии. Часто их решают без применения теории. Однако применение теории почти во всех случаях дает решение не более сложное, чем то, которое получается с помощью искусственных приемов. В заключительной части раздела приведены стандартные задачи из вариационного исчисления и оптимального управления. Стандартные задачи конечномерного анализа и линейного программирования мы не приводим. Их можно почерпнуть из многих задачников, см., например, Демидович [1] и Заславский [1]. Упомянем еще два сборника экстремальных задач из геометрии: Зетель [1] и Шклярский, Ченцов, Яглом [1].
Задачи группируются по определенным темам. В каждой теме есть задачи, снабженные решением; в конце раздела есть краткие указания к решениям некоторых задач. Решение большинства задач этого раздела получается применением принципа Лагранжа.
1.	Классическая изопериметр и ческая задача. Среди кривых на плоскости, имеющих заданную длину, найти ту* которая ограничивает наибольшую площадь.
2.	На стороне ВС треугольника АВС найти точку Е так, чтобы параллелограмм ADEF, у которого точки D и F лежат соответственно на сторонах АВ и АС, имел наибольшую площадь (Евклид),
3.	Среди шаровых сегментов, имеющих заданную площадь поверхности, найти сегмент наибольшего объема (Архимед).
4.	Найти кратчайшее расстояние от заданной точки на плоскости до заданного конического сечения (Аполлоний).
5.	Среди всех n-угольников, имеющих заданный периметр, найти л-угольник наибольшей площади (Зенодор).
6.	На данной прямой найти точку С так, чтобы сумма расстояний от С до точек А и В была минимальной (Герои).
7.	Разделить число 8 на две части так, чтобы произведение их произведения на разность было минимальным (Тарталья).
8.	Найти наклонную прямую, двигаясь по которой без трения под воздействием силы тяжести, материальная точка достигнет заданной линии за кратчайшее время (Галилей).
9.	Среди цилиндров, вписанных в шар, найти цилиндр с максимальным объемом (Кеплер).
10.	Найти прямоугольный треугольник наибольшей площади, если сумма длин его катетов равна заданному числу (Ферма).
11.	Среди конусов, вписанных в шар, найти конус с максимальной боковой поверхностью (Лопиталъ).
ЗАДАЧИ
441
12.	Найти закон преломления света на границе двух сред, исходя из вариационного принципа Ферма (Ферма, Гюйгенс, Лопи-таль).
13.	Найти в плоскости точку D так, чтобы сумма расстояний от D до трех заданных точек А, В и С была наименьшей (Вивиани, Торричелли, Ферма, Штейнер).
Решение. Задача сводится к отысканию безусловного минимума функции
f W = I * — У11 + I * — У21 + I * — Уъ I -* inf; X <= R2.
Функция f растет на бесконечности, что обеспечивает существование решения задачи. Обозначим решение х*. Функция f является выпуклой (но не гладкой). Необходимым и достаточным условием минимума для выпуклой задачи без ограничений является соотношение
о е df (х,)	(*)
(предложение 1 § 1.3). Воспользовавшись теоремой Моро — Рокафеллара, соотношение (*) перепишем в виде
о <= дх IX, - yi 1 + дх I х. - у21 + дх I X, - у31.	(.*)
Субдифференциал нормы в евклидовом пространстве в ненулевой точке равен единичному вектору, направленному в эту точку, а в нулевой точке это круг радиуса единица. Значит, если х* У= «о, i = 1, 2, 3, то уравнение (**) означает, что сумма трех единичных векторов, направленных из х* в точки yi, равна нулю. Это означает, что все углы между отрезками [х*, уТ\, [х*, у2] и [х*. z/3] равны 120°. Точка, из которой стороны треугольника видны под углом 120°, называется точкой Торричелли. Если же точка х* совпадает с одной из точек yi, то уравнение (**) приобретает вид z + ei + £2 = 0, где |е<| =.1, |z| 1. Отсюда сразу следует, что угол при вершине треугольника, с которой совпадает х*, не меньше 120°. Получилось полное решение задачи: если один из углов треугольника не меньше 120°, то решение совпадает с соответствующей вершиной, в остальных случаях решение это — точка Торричелли.
14.	Задача Ньютона. Найти тело вращения, испытывающее при движении вдоль оси вращения в жидкости или газе наименьшее сопротивление в сравнении с любым телом той же длины и ширины.
Решение. При физической гипотезе, принятой Ньютоном (каждый элемент поверхности испытывает нормальное сопротивление среды, пропорциональное нормальной составляющей скорости), легко получить такую формализацию задачи (см. Лаврентьев и Люстерник [1]):
т
[	inf; х = и,	х(0) = 0, x(T) = Xi>0. .
0
Это-—‘стандартная задача оптимального управления.. Решим ее, применив принцип максимума в лагранжевой форме (теорема Г из § 2.3). Лагранжиан задачи имеет вид L ,== W/(l + w2) + р(х— и).
442
ЗАДАЧИ
Из уравнения Эйлера—L* + Lx~0 сразу следует, что p(t)=*
Pq = const Если допустить, что Хо = 0, то из условия минимума функции L по и следует, что № О, Этого, однако, не может быть, ибо х(Г)> 0. Положим Хо = 1. Из условия минимальности L по и следует, что до некоторого момента т оптимальное управление равно нулю, а затем оно задается неявным выражением
__ 2ut р°— (1 +и2)2 ’
получающимся из уравнения Lu = 0. Момент излома т определяется из равенств т/(1 + и2) = т + рои, —2нт/(1 + и2)2 = pQ, из которых следует, что т = —2р0 и что управление в точке излома равно единице. После излома оптимальное решение удовлетворяет интегралу импульса:
t ui	dt	pa
Положив dx = и dt, x'u = utu, можно записать общее решение полученного интеграла в виде (учтя, что при и — 1 х = 0): х=-^(1п1+“2+4“4)+4^ /=--t(4+2u+4
Получившееся в результате применения принципа максимума однопараметрическое семейство экстремалей однократно покрывает всю верхнюю полуплоскость. Следовательно, имеется единственная допустимая экстремаль, определяющая нужное тело вращения. Отметим, что полученное тело оказалось тупоносым!
15.	Задача о брахистохроне (И. Бернулли). Постановка этой задачи была дана во введении, там же приведено несколько ее формализаций.
16.	Задача о геодезических. Найти кратчайшую линию на поверхности, соединяющую две заданные точки (И. Бернулли).
17.	Найти форму тяжелой однородной нити, подвешенной в двух точках вертикальной плоскости (Лейбниц, Гюйгенс, И. Бернулли).
Решение. Для простоты будем считать, что нить подвешена в точках, расположенных на одной высоте. Центр тяжести нити должен, в силу известного вариационного принципа в статике, занимать наинизшее положение. В итоге получается такая изопери-метрическая задача:
Xq	Xq
J У Vi + у'2 dx-> inf; J Vi + y'2 dx = lt
— Xq	— Xq
У (*o) = У (— Xo) = h.
ЗАДАЧИ
443
Применим теорему 2 из § 2.3. Составим лагранжиан L==Xoz/V 1 +#'2-h + Л1У*1 + у'2. Интегрант L не зависит от х и, значит, уравнение Эйлера допускает интеграл энергии + Xj в С 1/1 + у'2 Если Xq = О, то у' s 0, что возможно лишь при I = 2х0. Если же I > 2х0, то можно считать, что Хо = 1, М = X. Интегрируя, получаем общее решение уравнения Эйлера:
y + A = Cch(-J- + £>).
В силу симметрии граничных условий D = 0. Длина кривой у = = С eh(x/C}, —Хо У Хо, равна 2С sh(x0/C). Уравнение (относительно С) С sh(x0/C) = 1/2 имеет единственное решение Со# В итоге получается единственная допустимая экстремаль у = Со ch(x/C0) + X, дающая решение задачи о нити. Эта кривая называется цепной линией.
18.	Вписать в круг треугольник с максимальной суммой квадратов сторон.
Решение. Задача записывается так:
I Xi — х212 + I X, — е I2 + I х2 — е |2 -> sup; | х, |2 = | х212 = 1, е = (1,0), x;eR2, j=l, 2.
Существование решения очевидно в силу компактности ограничения. Применим правило множителей Лагранжа (теорема 1 из § 1.1), Функция Лагранжа имеет вид
^ = Х0(|х! -xsp + lxj ~е|2 + |х2-е|2) +Xj |Х! |2 + Х21 х212.
Ясно, что Хо ф 0, ибо иначе в силу уравнений = 0 один из векторов Xi или х2 оказался бы нулевым. Положим Хо = 1 и напишем уравнения Эйлера — Лагранжа:
о = ^Xl 44 (2 + Aq) Xj = х2 + е,
0 = ^Хг 44 (2 + А2) x2=Xi + е.
Полученная система легко решается. Оказывается, что у нее шесть решений: l)xi=x2 = e, 2) xi—e, х2 == — е, 3) Xi = — е, х2 = е, / 1 , /з’А / 1 КП
4) xi = х2 = -е, 5) Xl = у, +-Ly-], х2 = 1-у,----------
вленной задаче доставляют последние два решения Итак, искомым треугольником является правильный треугольник.
19. Вписать в круг треугольник с наибольшей взвешенной суммой квадратов сторон.
20. Вписать в n-мерную сферу симплекс максимального объема,
444
ЗАДАЧИ
21.	Найти наибольший объем n-мерного параллелепипеда, у ко- 11 торого все ребра имеют единичную длину.
Решение. Задача записывается так:	%
°(*i.......х„)=	det (*')-> sup; |х(|2=1.	|
xz = (xj., ...» X;), z, j=I...n.	jl
Существование решения имеет место в силу компактности ограниче- * ния. Применим правило множителей Лагранжа (теорема 1 из § 1.1). Функция Лагранжа имеет вид
п
i=l
Ясно, что Хо О, ибо иначе из уравнений <2^== О получилось бы, что для некоторого io (а именно, для того, при котором множитель Лагранжа отличен от нуля) ^ — 0. Положив Хо = 1, получим уравнения Эйлера — Лагранжа:
= &х + s 0.	(*)
Л • I Ь	4 '
Производная определителя по некоторой строке есть вектор, составленный из алгебраических дополнений к элементахм этой строки: Dx. — AL = (л|, ..Л?). При этом (Ai\xi) = D. Умножая (*) скалярно на х<, получаем, что
Xz = — (рх. ~ D, i = 1.............п,
откуда и из (♦) получается, что Xi = AilD. Но матрица есть матрица, обратная транспонированной матрице (*{)*• Итак, если X = (*9 — решение задачи, то выполнено соотношение ХХ* = 1.
Следовательно, X — ортогональная матрица, т. е. искомый параллелепипед является кубом. Отсюда и из соображений однородности сразу следует известное неравенство Адамара:
п / п	\
(^(хО)2<П ZW)2-z=l v=l	/
22.	Решить задачу 21, предполагая, что ребра параллелепипеда — заданные, но не обязательно равные величины.
23.	3 а д а ч а Шварца. На каждой из сторон заданного треугольника найти по точке так, чтобы образовавшийся треугольник имел минимальный периметр.
24.	Задача Дидоны. Кривой у(х)> —х0 х х0, заданной длины соединить две точки на оси абсцисс так, чтобы отсечь от верхней полуплоскости наибольшую площадь.
ЗАДАЧИ
445
Решение. Задача записывается гак:
*0
— J у (х) dx -> inf;
Xq _________
J Vl + y'2 dx = l, />2x0. У (x0) = у (— Xo) = 0. -x.
Применим теорему 2 из § 2.3. Составим лагранжиан L = — Лог/ + + Ai ]/1 + у'2. Уравнение Эйлера имеет вид
Если Ао = 0, то у' s 0, что может быть, лишь если I = 2х0. Если I > 2х0, то Ао можно считать равным единице. Интегрируя уравнение Эйлера, получаем, что его общее решение составляют дуги окружностей (*/ + Q2 + (х 4- ^)2 = А2. Если 2хо < I лх0, то найдется единственная дуга, удовлетворяющая изопериметриче-скому и краевым условиям. Она и будет решением задачи. Если / > лхо, решение будет доставлять функция у (х) = h + У Хд — х2, к которой присоединены вертикальные отрезки х = ±х0, 0 У h, h =(1 — лхо)/2.
25.	Кривой заданной длины, имеющей концы на оси абсцисс, ограничить максимальную площадь в верхней полуплоскости.
26.	Среди замкнутых кривых, имеющих заданную длину и расположенных на двумерной сфере, найти кривую, ограничивающую наибольшую по площади часть сферы.
27.	Среди замкнутых кривых заданной длины, расположенных в некоторой полосе, найти кривую, ограничивающую наибольшую площадь.
28.	Среди замкнутых кривых заданной длины, расположенных внутри некоторого ограниченного выпуклого множества на плоскости, найти кривую, ограничивающую наибольшую площадь.
29.	Найти максимальное значение среднего геометрического п положительных чисел при заданном значении их среднего арифметического.
Решение. Задача записывается так: п	п
Ц х.-> sitp; х. — a, х. >0, i = х=1	z=i
Существование решения очевидно. Применим правило множителей Лагранжа (теорема 1 из § 1.1). Функция Лагранжа имеет вид
п	п
& % II xi + 2 хг i=l	i=l
446
ЗАДАЧИ
Ясно, что Хо Ф 0. Из уравнений Эйлера — Лагранжа S?x. =0 по-Ц лучается, что все Хг равны между собой. Следовательно, решение задачи таково: xi = хг = ... = хп = а/n. Из соображений однородности отсюда сразу получается неравенство между средним арифметическим и средним геометрическим-.
(п	\1/п п
11 ' • i=l	/	i=l	j
30.	Число a > 0 разбить на п частей xi, .... хп так, чтобы ai а9	ап	*
произведение XjX22 ... хп, где а»— заданные числа, было на и- ; большим.
31.	Найти п неотрицательных чисел, сумма q-x степеней которых равна единице, так, чтобы сумма р-х степеней этих чисел была максимальна, р > 1, q > 1.
Решение. Задача записывается так: п	п
2 | |р -> sup; 2lxd? = 1- Р>1- <7>1‘ «=1	i=l
Существование решения в силу компактности ограничений очевидно. Применим правило множителей Лагранжа (теорема 1 из § 1.1). Функция Лагранжа имеет вид
п	п
i=l	t=l
Из уравнений Эйлера — Лагранжа «£^==0 сразу следует, во-первых, что ни Хо, ни Xi не равны нулю и, во-вторых, что отличные от нуля Xi в решении задачи равны между собою по модулю. Это значит, что решения нужно искать среди векторов, у которых компоненты или равны нулю, или по модулю равны одному и тому же числу. При q < р решения будут доставлять векторы, у которых одна компонента равна единице, а остальные равны нулю, а при q > р решениями будут векторы	.....значение
задачи равно	Отсюда и из соображений однородности сразу
следуют неравенства для средних степенных:
(п	\1/р	/	п	\l/q
при q>p-
i=l	/	\	Z-l	'
32.	Найти в плоскости точку Е так, чтобы сумма расстояний от Е до четырех заданных точек Д, В, С и D была минимальна.
33.	Решить задачу 13 для взвешенной суммы расстояний.
34.	Решить задачу 13 при дополнительном условии, что точка D должна быть взята из некоторого выпуклого множества.
35.	Доказать, что «точкой Торричелли» правильного симплекса является его центр тяжести.
ЗАДАЧИ
447
36.	Найти кратчайшую линию, соединяющую две точки плоскости, при условии, что эта линия должна отстоять от начала коор* динат на расстояние не меньшее, чем заданное число а.
37.	Найти кратчайшие линии на поверхности конуса и цилиндра.
38.	Найти кратчайшие линии на поверхности сферы.
Решение. В полярных координатах (9, ф) элемент дуги на единичной сфере задается формулой ds2 = d& + sin2 0 t/ф2. Таким образом, наша задача имеет следующее аналитическое выражение:
(02 > Фг)
J + sin2 Оф2 dft -> inf.
(0i > Ф1)
Если заданные точки на сфере не являются диаметрально противоположными, можно выбрать полюс так, чтобы он не совпадал ни с одной из точек и обе они находились бы на одном меридиане: ф! = ф2 = ф, 0 < 01 < 02 < л. Интегрант задачи не зависит от ф, т. е. имеет интеграл импульса:
ф sin2 0	__
V1 + sin2 еД —
Из этого выражения видно, что ф сохраняет знак, т. е. ф(0) монотонна. В силу того, что ф(01) =ф(02) =ф. получается, что ф(0)==ф. Итак, существует единственное допустимое решение уравнения Эйлера, а именно, сам меридиан, соединяющий заданные точки. Совокупность всех меридианов образует поле, покрывающее сферический сегмент 01	0	02. Применив теорему 4 из § 7.4, получаем, что
найденный меридиан доставляет абсолютный минимум в поставленной задаче.
39.	Дан угол и точка внутри него. Через эту точку провести отрезок, имеющий концы на сторонах угла, так, чтобы полученный треугольник имел наименьшую площадь.
40.	В задаче 39 минимизировать периметр треугольника.
1
41.	J (х2 + х) dt -> inf; х(0)=0, х(1) = 1. 0
2
42.	| (tx2 - х) dt -> inf; х(1) = 0, х(2) = 1.
1
2
43.	J х (1 + f2x) Л-> inf; х(1)=3, х (2) = 1.
1
1
44.	j (х2 4- xx + 12fx) dt -> inf; х(0)=1, х(1) = 4. 0
448
ЗАДАЧИ
jt/4
45.	J (4x2 - x2 + 8x) dt -> sup; x(O) = -l, x(-j)=O. 0
T
46.	J (x2 4- x2) dt -> inf; T фиксировано, x(0) = 0, 0
Решение. Уравнение Эйлера (см. § 2.2) х — х = О этой простейшей задачи классического вариационного исчисления имеет общее решение х(/, Ci, Сг) = Cie* + Краевым условиям удовлетворяет единственная кривая х* (/; Т, g) = g sh f/sh Т. Непосредственное сравнение этого решения с любой другой допустимой кривой показывает, что х*(/, •) доставляет абсолютный минимум в поставленной задаче. т
47.	J (х2 — х2) dt -> inf; Т фиксировано, х(0)=0, x(T) = g. О
Решение. Уравнение Эйлера (см. § 2.2) х + х = 0 имеет общее решение х(/, Ci, Сг) = Ci sin t + С2 cos t. Уравнение Якоби (§§ 2.2 и 6.3) совпадает с уравнением Эйлера. Его фундаментальное решение (D(^,0)=sin/. Точка 6 — л— первая точка, сопряженная с точкой нуль. При Т > л экстремали не доставляют даже слабого минимума. Аналогично тому, как мы проделали это в примере 4 из § 2.2, можно показать, что в этом случае нижняя грань в задаче равна —оо. Если Т < л, то существует единственная допустимая экстремаль
/т, с.\ Sin t	. .
х*т' ®	shTF
и при этом можно построить поле экстремалей, включающее данную экстремаль и покрывающее всю полосу 0 х Л Для экстремали х* = О это поле можно задать так:
х (t, Я) — Л sin (t + d)
при малом б. Из теоремы 4 § 7.4 получается, что при Т < л экстремаль (*) доставляет абсолютный минимум в поставленной задаче. Случай Т = л требует дополнительного исследования. В примере 4 из § 2.2 было показано, что если Т = л и g = О, то значение задачи равно нулю и все решения описываются формулой х(/, С) — С sin t. Можно показать, что если Т = л, g =/= 0, то значение задачи равно —оо. Отметим, что исследовав случай Т = л, g = 0, мы доказали такое неравенство:
я	л
J х2 dt < [* х2 dt, х (0) = х (л) = 0.
0	о
Это неравенство называется неравенством Виртингера. т
48.	J х3 dt -> inf; Т фиксировано, х (0) =0, х (Г) = g. 0
ЗАДАЧИ
449
т
49.	| (х2 + х3) dt -> inf; Т фиксировано, х (0) = 0, х (Т) = о
т
50.	J (-у- + dt -> inf; Т фиксировано, х(0)=0, х (Т) = о
т
51.	J sin х dt-> inf; Т фиксировано, х(0)=0, x(7') = g. о
Г fit
52.	——>in^; t°* фиксированы, x(t0)=x0, x(t1)=xit
to
x.>Q, i = 0, 1.
т
53.	Пример Больца: J (1 — x2)2 dt -> inf; T фиксировано, о
x(0) = 0, x(T) = g.
1
54.	Пример Гильберта: J (t2x2 + 12x2) dt, x(0)=0, 0
x(l)==l.
55.	Пример Вейерштрасса —Гильберта (см. при-т
Г /а1х|&
меры 3 и 5 из § 2.2):	—r~ d/->inf; Т фиксировано, х (0) = О,
•/ р о
х(Г) = £, а>0, р>1.
Решение мы получим двумя способами, а) Исследуем уравнение Эйлера. Для простоты ограничимся случаем 0 = 2. Интегрант не зависит от х, и следовательно, уравнение Эйлера (см. § 2.2) допускает интеграл импульса:
t4 = С.
Интегрируя это уравнение при a < 1, получаем общее решение х (/, Сь Сг) «= Ci/1**01 + Сг. Граничным условиям удовлетворяет единственная экстремаль
?/1**а
x.(/;T.g)=-L-.	(•)
Непосредственным сравнением этой экстремали с любой другой допустимой кривой легко убедиться, что экстремаль (*) доставляет абсолютный минимум в задаче. При a 1, взяв минимизирующую последовательность хп (/) = %tilnIT4ni получим, что значение за-
15 А. Д. Иоффе, В. М. Тихомиров
450
ЗАДАЧИ
дачи равно нулю; при этом абсолютно непрерывного решения здесь нет. Причина описанного явления была вскрыта в гл. 9.
б) Решим этот же пример (при произвольных аир) методами ♦двойственности, развитыми в § 9.3. Сопряженная функция интегранта имеет вид (при Р > 1):
I п
Г(/, р) = /а/(1-р>^,	1/р+!/₽'=!.
Функции	р) суммируемы при р #= 0 тогда и только тогда,
когда Р=1 или Р > 1, а<Р—1. В этом случае применима теорема 1 из § 9.3, в соответствии с которой решение задачи существует и его следует искать из условий:
Ip |Р +	=	х(0) = 0, Х(Т) = 1
Отсюда получается уже известное нам в частном случае реше-ние х, (<; Т, g) = g (//г/Р-'-аМб-П
Пусть теперь Р > 1, а^Р—1. В этом случае функции /->/*(/, р) суммируемы, лишь если р = 0. Поэтому S*(p) (см. § 9.3) равна д(х|{0}). Эффективное множество S(x) совпадает со всей прямой, а сама функция S(x) = (S*(p))* тождественно равна нулю. Применив теорему 4 из § 9.3, получаем, что обобщенным решением задачи является кусочно абсолютно непрерывная функция [0, / = 0,
х (/) = <	Случай р — 1 требует отдельного рассмотрения.
L о» > 0.
т
56.	J VT+h Кннё5 dt -> inf; х (0) = 0, х (Г) = g. о
г
57.	J -----x^dt —> inf; Т фиксировано, х(0)=0, х(Т) — 1.
о
ft
58.	J xf^l + х2 dt -> inf; фиксированы, x (Q — x., f = 0, 1.
fi
59.	J xa + x2 dt -> inf; t. фиксированы, x (Л) == xf, z = 0 ,1.
1
60.	j x2d/->inf; x(0)=x(0)=0, x(l) = 0, x(l) = l. 0
1
61.	j (x2 - 24fx) dt -> inf; x (0) = x (0) = 0. x (1) = 1/5 x (1) = 1. 0
ЗАДАЧИ
451
f
62.	J (x2 + x2) dt -> inf; T фиксировано, x (0) = x (0) = 0, о
х(П = £1, x(T) = g2.
Решение. Приведем задачу к стандартной форме задачи Лагранжа:
т
J (*з + xtydt -> inf, о
Xj = х2, х2 =* х3,
Xi (0)=0, Z = 1, 2,
х (7) = g., /«1, 2; Т фиксировано.
Напишем уравнения Эйлера — Лагранжа этой задачи (теорема 1 из § 2.3). Лагранжиан задачи имеет вид
L = Т" (Х3 + *1) + Pl (*1 - *2) + Р2 (*2 - *з)-
Уравнения Эйлера — Лагранжа таковы:
0 = “ ~dF 4" ^х{ О Pj ~ ^oxi = 0;
0	57	^х2 4“ ^х2	P2“‘Pi==0; .	(*)
0 в 57	4"	^х3	О Р2 = %хз*
Если Хо «в 0, то р\ = р2 = 0, чего не может быть. Положив Ао = 1 и р2 = pt X] = х, из уравнений (*) получаем, что р = — х, х = х3 = р,
откуда
xlV + x = o.
Общее решение этого уравнения, удовлетворяющее краевым условиям на левом конце, имеет вид
х (/, С1, С2) == С1Ф1 (0 4- С’гФг (0» где
Ф1 (t) = sh sin —r=r, /2 К2
. t . t . t t
/2 K2 /I /Т
В задаче имеется единственная допустимая экстремаль, доставляющая абсолютный минимум, в чем легко убедиться непосредственным сравнением ее с любой другой допустимой кривой.
15*
452
ЗАДАЧИ
7	Я;
63.	J (х2 — х2) dt -> inf; Т фиксировано, х (0) = х (0) =* 0. <1В
°	Я
х(Т) =	и х(Л=Ч2.	Я
Решение. Аналогично тому, как это было проделано в пре-дыдущей задаче,	приходим к уравнению xIV — х = 0. Общее ре- Я
шение этого уравнения с учетом граничных условий на левом конце Я таково: x(t, Ci, С2) = Ct(sh t — sin /)+ C2(ch t — cos t). Дальше Я нужно поступать аналогично тому, как в § 6.3. Для этой задачи Я аналогом уравнения Якоби является уравнение	xIV —х = 0,	а	со-	Ж
пряженные	с точкой нуль точки определяются,	как нули	определи-	Ж
теля системы	*
Ci (sh Т — sin Г) + С2 (ch Т — cos Г) = gg, |	I
Сх (ch Т - cos Т) + С3 (sh Т + sin Г)	= J	1
Этот определитель равен 2 (cos Т ch Т—1). Первый нуль его обо- ж значим ti. Если > Т, то существует единственное решение си- в стемы (*), приводящее к экстремали, доставляющей абсолютный Ж минимум; если Л < Т, то значение задачи равно —оо. Случай Я ti == Т требует дополнительного исследования.	W
Т	1
64.	J х2 dt	—	ах2 (Г)	inf;	Т	фиксировано, х (0) = 0.	ж
0	ж
1	1
65.	j i2 Л+	4x2(0)-5Х2(1)-> inf.	I
0	I
1	1
66.	| (х2 + X2) dt - X2 (1) -> inf; X (0) = 1.
°г	<
67.	J u2d/->inf; Т фиксировано, х = —x+u, x(Z)(0) = Xq, о
x(i)(T) = Xp i = 0, 1.
т
сх2 (Т\	1 f
68.	—-------~2~ J “2 inf; х = — ах + х (0) = х0.
о	-
т
сх2 (Т\	1 Г
69.	—-------1- — J и2 dt -> inf; х=— ш2х + и, х (0)=х0.
о т
70.	J (х2 + с2и2) dt -> inf; Т фиксировано, х = ах + и, о	I
X (0) s= Xq.	I
ЗАДАЧИ
453
т
71.	J (х2 + с2и2) dt -> inf; Т фиксировано, х + ах + Ьх — и. о
X (0) = Xq.
Л	Л
72.	J х2 dt -> inf; J х cos t dt = 1, x (0) = x (л) = 0. о	о
Л	Л
73.	J x2 dt -> inf; J x2 dt == 1, x (0) = x (л) ==0. О	о
Решение. Применим теорему 2 из § 2.3. Составим лагранжиан L = Хох2 + Xix2. Уравнение Эйлера: —Хо* + Xix = 0. Ясно, что Ао #= 0, ибо иначе х zs 0. Положив Хо = —1, решаем уравнение Эйлера. Все решения этого уравнения, удовлетворяющие краевым условиям, описываются так: xn(t)= С sin nt, п = 1, 2, ... Наименьшее значение функционалу доставляет функция xi (t) = "|/^“ s*n
Т	т
74.	J х2 dt -> inf; J x2dt=\, T фиксировано, х(0)=0. о	о
1 1
75.	j х2 dt -> inf; j х dt = 1, х (0) = х (1) == 0. о	о
1 1
76.	j | х |а dt -> inf; j | х |р dt = 1, х (0) = х (1) = 0, а, Р>0. о	о
1
77.	j x2dt-+\ni\ x(tk) = lk> k=l,...,n; tk фиксированы, о
т	т
78.	J xcft->inf; j* x2t#=l, T фиксировано, x(l,(0) = 0, о	о
x{i}(T)=^i. / = 0, 1.
1 1
79.	| х2 dt -> inf; jx2dt = l, x (0) « x (0) = x (1) = x (.1) = 0. о	о
1	ill
80.	J x2df->sup; J x2 dt = 1, J x dt = 0, J fxrf/==O. 0	0	0	0
454
ЗАДАЧИ
1
81.	J (x2 + z/2)d/->inf; x# —z/x=l, x(0) = 0, fl(O)=l, о
x (1) == sin 1, у (1) = cos 1. т
82.	J x2 dt -> inf; x (0) == 0. Tx2 (Г) == 1. о
T
83.	j /Г+I* dt -> inf; x (0) = 0, T2x (Г) = 1. o
i _______
84.	J К.1ЛЛ2. inf; x(0) = 1. о
T _______
85.	f К1±Д dt inf. x (o) = o.
oJ
1
86.	J x2 dt -> inf; x(0)=0, x(l) = l. о
f ( x2 + x2 \
87.	I (-1-2—-+ x,x2ldf->inf; xi(0)«gi. x2 (0) = g2, xt (1)= о
= x2(l)=0.
f / x? + x2 \
88.	J	+ x,x2) dt -> inf; x, (0) = g1( x2 (0) = g2.
о
T
89.	Г-> inf; x = u, |u2df=l, x(0) = b. *(0) = £2, x (T) = 0
-i(T)-0.
90.	Простейшая задача на быстродействие. Т -> inf; х = и, |uKL х(0)==£ь х(0)^^2> х(Т)=* -х(П = 0.
91.	Т -> inf; х = — х + и, |н|<1, х (0) = х (0) = g2. х(Г) = х(Г)=0.
1
92.	J |x|-»inf; i>-A, А>0. х(0)=0, x(l) = g. О
1
93.	J х2 di sup; х = и, j и ] < 1. х(0) = 0. е-
ЗАДАЧИ
455
Решение. Применим принцип максимума Понтрягина в лагранжевой форме (теорема 1' из § 2.4). Лагранжиан задачи имеет вид
А == - -j- х2 + р (х — ц).
Уравнение Эйлера р = —Хох, условие трансверсальности р(1)=0. Значит, Хо =^= 0, ибо иначе все множители Лагранжа Хо и р были бы нулями. Положив Хо = 1, из усло
вия минимума функции L по и получаем и = sign р. В итоге приходим к уравнению:
р + sign р = 0, р (0) = - х (0) = 0, Р(1)=О.
Решениями этого уравнения являются кусочно-параболические функции, имеющие одинаковые по модулю экстремумы и разрыв первой производной в тех точках, где сами они обращаются в нуль. Граничные условия выделяют счетное множество таких функций. Первые две функции ро(О и pi(t) и соответствующие им экстремали хо(О, X\(t) изображены на рис. 14. Экстремали Xi(t) —
это ломаные с изломами в нулях соответствующих функций pi(t). Максимальное значение интеграл достигает на функции Хо(/).В силу того, что решение задачи существует (из компактности множества допустимых функций), х0(/) доставляет абсолютный максимум в поставленной задаче.
1
94.	j x2df->sup; | х | < 1, х (0) = х (0) = х (1) = х (1) =0. 0
1
95.	J (-*- U + | и | ) dt -> inf; х = и, х (1) = g. о
Решение. Применим принципа максимума Понтрягина в лагранжевой форме (теорема Г из § 2.4). Лагранжиан задачи имеет вид
. / х2 + и2 । । \ £ =	----------Ц и | J + р (х — и).
Если Хо = 0, то из условия минимальности по и получалось бы, что. р = 0, т. е. все множители Лагранжа были бы нулями. Значит, Хо =/= 0. Положим Хо = 1. Получаем уравнение Эйлера — р + х = 0, условие трансверсальности р(0)=0 и выражение для оптимального.
456
ЗАДАЧИ
управления
О
Р ~ 1
р+1
при при при
\р К1. р> 1. р<— 1,
которое следует из условия минимальности L по и. В силу того, что р(0) = 0, при малых t оптимальное управление равно нулю, значит, для этих t решение x(t) является константой, a p(t) — линейной функцией, т. е.
X (0 == X (/, я) = П' Р (О = Р (i. п) = Не-
когда р станет равным по модулю единице, из уравнений Эйлера получится, что х й = р — х, т. е.
х = я ch (< - 1/I я | )•
Из граничного условия определится единственная допустимая экс-тремаль, которая и даст абсолютный минимум в задаче.
1
96.	| х dt -> inf; | х |С 1, х(0) = х(1)=0.
О
т
97.	J (и2 + х2) dt -> inf; Т фиксировано, х — и, | и | С 1> х (0)=Ц.
О
т
98.	J (и2 — х2) dt -> inf; Т фиксировано, х == u , | и |	, х (0) = 0.
0
99.	T-Mnf; х==м, |и|<1, х (0) = U х(0)==Ь. x(0) = g3, 4 х(П = *(Л = *(П = 0.
100.	T->inf; х = х + и, | и | < 1, x(0) = |b x(0) = g2, х(Т) = -х(Т) = 0.
1
101.	J xtZ/->sup; |х|<1, х<Л, х(0) = х(1) == 0.
0
1
102.	У xd/->inf; [х | < 1, х> — А, х (0) = х (0)—х (1)=х (1)=0*
0
1
103.	У хdt ->inf; | х | С 1,х^ — Л,х(0) = х(1) =t=0. о
104.	Т ~>inf; x = w, |w|<l, х> - 1, x(0) = x(0) = 0, x(7’) = g1. x(T) = l2.
Решение. Применим принцип максимума Понтрягина для задач с фазовыми ограничениями (теорема 1 из § 5.2). Функция.
ЗАДАЧИ
457
Понтрягина здесь такова:
/У = pix1 + р2и — Хо (х1 = х, х = х2,х = и).
Фазовое ограничение после приведения его к стандартной форме имеет вид —(х2 4- 1)^0, поэтому сопряженное уравнение записывается следующим образом:
Pi (О = const = pi (Г), г	г
Р2 (О = р2 (Т) 4- J Pl (т) dr + | dp. t	t
Из условия максимума функции Н по и получается, что оптимальное управление имеет такой вид: и = sign р2. Обозначим через Д подмножество отрезка [О, Г], состоящее из тех точек t, где х2 (/) = = —I. Положим
Т m(t) = J dp,, t
Тогда tn(i) — неотрицательная и невозрастающая функция, постоянная на каждом интервале, где траектория не выходит на фазовое ограничение. При этом limm(t) = m(Q). Суммируя сказанное, полу-t о
чим выражение для р2:
р2 (0 = at + р + ш (О-
Если а < 0, то р2 строго убывает и может менять знак не более одного раза. Получается семейство экстремалей, зависящих от одного параметра т — точки переключения оптимального управления u(t). Разберем теперь случай, когда а > 0. Покажем, что тогда траектория x2(f) может выйти на фазовое ограничение лишь однажды. Действительно, пусть (ть т2) — интервал между двумя последовательными выходами на фазовую траекторию: x(ti)== = х(т2) =—1, х(0>—1, £e(Ti,т2). Функция m(t) постоянна на (ti, т2), значит, p2(t)—линейная возрастающая функция. Она не может иметь нуля в точке т между ti и т2, ибо иначе на (ti, х2) управление было бы равно —1, и нельзя было бы удовлетворить фазовому ограничению. Значит, на (п, т2) функция р2 > 0 и управление и = 1. Но тогда
т2
х2 (т2) = X2 (Tl) 4- J и dr = — 1 4- (Т2 — Т1) > — 1, т,
в противоречие с предположением. Итак, возможны два случая: а) когда на траектории имеется не более чем одно переключение, при этом траектория либо не выходит на фазовое ограничение, либо
458
ЗАДАЧИ
выходит на него лишь в один момент (рис. 15, а), и случай б) когда оптимальное управление и сначала равно —1, затем и = 0 и движение совершается по фазовому ограничению, и на последнем
Рис. 15.
участке и = +1 (рис. 15,6, направление движения указано стрелками). Без труда показывается, что существует единственная траектория, удовлетворяющая перечисленным условиям и соединяющая нужные точки (см. рис. 15, а, б),
1
105.	j (х2 + х2) dt -»inf; х(0) = 1, х> А.
о т
106.	J (х2 — х2) dt -> inf; Т фиксировано, | х | С А, х (0) = х (Т)=0. о
т
107.	J (?^)2 dt -> inf; Т фиксировано, х^(0)=0, о
т
408. j (1 + е | и |) dt -> inf; х = w, | и | < 1, х (0) == х (0) = |2, о
х(Т)-х(Г)=0.
1
109.	j xdt-> inf; I x{n} |< 1, x(i) (0) === x(0(1) = 0, 0<f<n-l. о
i
110.	J | и dt -> inf; x + «x = 0, x(0)=®x(l)=0, x(0) = l, о
Kp < OQ,
ЗАДАЧИ
459
I
Ш. J | и | dt -> inf; x + wx = O, | и | < A, x(O)=x(l)=O, 0 x(O) = l.
T _________
112.	J (]/xf + x* + /(*! - sin7)2 + (x2 + cos t)2)dt~> inf; 0
T фиксировано, %i (0) =» x2 (0) = 0, Xi (T) = x2 (T) = g2. т
113.	J | x — g | dt -> inf; T фиксировано, x (0) =» x0, x (0) = xQt 0
х(Г) = хь x(T) = xb x e Rn, g = const.
Комментарий к разделу «Задачи». В начале этого раздела приведено несколько старинных задач, поставленных и решенных до создания общих методов. Первые упоминания о классической изо-периметрической задаче (см. задачу 1) относятся к V в. до н. э. Задачи на максимум и минимум встречаются у трех величайших математиков древности — Евклида (задача 2), Архимеда (задача 3) и Аполлония (задача 4). Более подробно об экстремальных задачах у древних см. у Цейтена [1].
В дальнейшем ряд важных экстремальных задач был решен Галилеем, Кеплером, Ферма, Гюйгенсом. Основы дифференциального исчисления и вместе с ними первые принципы решения экстремальных задач были заложены Ферма, Лейбницем, Ньютоном. Основные факты о конечномерных экстремальных задачах и вариационном исчислении были установлены в 17—19 вв. И. Бернулли, Эйлером, Лагранжем, Лежандром, Гамильтоном, Якоби и Вейерштрассом. Подробнее об этом см. у Цейтена [1], [2] и Рыбникова [1].
Указания к задачам. Все задачи этого раздела могут быть решены при помощи принципа Лагранжа, подробно обсуждавшегося в книге. В общей форме он был сформулирован во введении (стр. 16), а затем доказан для ряда важных случаев. Перечислим их: а) гладкие задачи (стр. 74), б) выпуклые задачи (стр. 77), в) задача Лагранжа классического вариационного исчисления (стр. 135), г) изопериметри-ческая задача (стр. 142), д) задача оптимального управления без фазовых ограничений (стр. 145—147), е) задача оптимального управления с фазовыми ограничениями (стр. 245, 246). Далее, как правило, указывается, к какому случаю можно отнести рассматриваемую задачу.
Задача 1 решена в § 10.1. Задачи 2—12 решаются с помощью простейших средств анализа. Задача 15 решена в § 10.1. Уравнение для геодезических (задача 16) можно вывести из необходимого условия для задач с фазовыми ограничениями (стр. 143). Задача 25 — задача с подвижными концами, нужно использовать условия трансверсальности (случай д)). Задача 26 (сопоставьте ее с задачей 38) относится к случаю г). Задачи 27, 28 можно решить как задачи на быстродействие с фазовыми ограничениями (случай е)), при этом
460
ЗАДАЧИ
полезно учесть метод решения задачи 4 в § 10.1. Задачи 32—35 ре-Ж шаются подобно задаче 13 (случай б)). Задача 36 относится к слу-Jjf маю ё).
Задачи 41—59 — простейшие задачи вариационного исчисления. Ж Интегранты задач 48—53 не квазирегулярны. Нижние грани в зада-, Ж чах 48—52 при помощи теоремы Боголюбова находятся без Ж вычислений, ибо овыпукления интегрантов приводят к тривиальным Ж функционалам. В задаче 49 при £ =й= 0 вторая вариация на экстре- В мали строго положительна, но сильного минимума нет. Интересный ж пример Больца (задача 53) разбирается во многих книгах, например .ж у Ахиезера [1]. В задаче 54 не выполнено усиленное условие Ле- ш жандра, однако экстремаль доставляет абсолютный минимум в за- Ж даче. Задачи 60—67, 70, 71 относятся к случаю в). В задачах 68 и 69 Ж принцип Лагранжа верен, хотя для этого случая в книге он не - w обоснован. Задачи 82—89 — с подвижными концами (случай д)). За- Ж ! дачи 90—100 относятся к случаю д), задачи 101—106 — к случаю е). ж Решения последних семи задач первоначально были включены Ж в гл. 10. Решения задач 107, 109, 112 и 113 можно получить как ме- ж тодами двойственности, так и непосредственно при помощи прии- W ципа максимума. К задаче 112 сводится задача Улама о совмещении > ' отрезков. Задача НО решена Боргом [1], задача 111 —А. М. Ляпуно-вым [1]. Решение задачи ИЗ см. Розов [1].	•
ЛИТЕРАТУРА
Авербух В. И., СмоляновО. Г.
1. Теория дифференцирования в линейных топологических пространствах, УМН 22, 6 (1967), 201—260.
Адамар (Hadamard J.)
1. Calcul des variations, Hermann, Paris, 1910.
2. Principe de Huyghens et prolongement analitique, Bull. Soc. Math. Fr. 52 (1924), 241—278.
Арис P.
1. Дискретное динамическое программирование. Введение в оптимизацию многошаговых процессов, М., «Мир», 1969.
Аркин В. И.
1. О бесконечномерном аналоге задачи невыпуклого программирования, Кибернетика 2 (1967), 87—93.
Аркин В. И., Левин В. Л.
1. Выпуклость значений векторных интегралов, теоремы измеримого выбора и вариационные задачи, УМН 27, 3 (1972), 21—77. Асплунд (Asplund Е.)
1. Topics in the theory of convex functions in «Theory and Applications of Monotone Operators», Tipografia «Oderisi», Gubbio, Italy, 1969.
А у м а н н (Aumann R. J.)
1. Integrals of set valued functions, J. Math. Anal. AppL 12 (1965), 1—12.
2. Measurable utility and the measurable choise theorem, Hebrew Univ, Jerusalem, 1967.
Ахиезер H. И.
1. Лекции по вариационному исчислению, M., Гостехиздат, 1955. Ахиезер Н. И., Крейн М. Г.
1. О некоторых вопросах теории моментов, Харьков, ГОНТИ, 1938.
Беккенбах Е., Беллман Р.
1. Неравенства, М., «Мир», 1965.
Беллман Р.
1. Динамическое программирование, М., ИЛ, 1960.
Беллман Р., Гликсберг И., Гросс О.
1. Некоторые вопросы теории процессов управления, М., ИЛ, 1962.
Беллман Р., Дрейфус С.
1. Прикладные задачи динамического программирования, М., «Наука», 1965.
Беллман Р., Калаба Р.
1. Динамическое программирование и современная теория управления. М., «Наука», 1969.
462
ЛИТЕРАТУРА
Б е р ж (Berge С.)
1. Sur une propriete combinatoire des ensembles convexes, C. R. Acad. Sci. Paris 248 (1959), 2698—2701.
2. Espaces topologiques Fonctions multivoques, Dunod, Paris, 1959.
Берковиц (Berkovitz L. D.)
1. An existence theorem for optimal control, J. Opt. Theory Appl. 4 (1969), 77—86.
2. Existence theorems in problems of optimal control, Studia Math. XLIV (1972), 275—285.
Бернштейн С. H.
1. О наилучшем приближении непрерывных функций посредством многочленов данной степени, Собрание сочинений, т. 1, Йзд-во АН СССР, 1952, 11—105.
2. О теореме В. А. Маркова, Собрание сочинений, г, 2, Изд-во АН СССР, 1954, 281—287.
Биттнер (Bittner L.)
1.	New conditions for validity of the Lagrange multiplier rule 1, Mathematische Nachrichten 48 (1971), 353—370.
Благодатских В. И.
1.	Достаточное условие оптимальности в задаче нелинейного оптимального быстродействия, Автореферат кандидатской диссертации, 1973.
Блисс (Bliss G. А.)
1.	The problem of Lagrange in the calculus of variations, Amer. J. Math. 52 (1930), 673—744.
2.	The problem of Bolza in the calculus of variations, Ann. of Math. 33 (1932), 261—274.
3.	Лекции по вариационному исчислению, M., ИЛ, 1950.
Блэкуэлл (Blackwell D.)
1.	The range of certain convex integrals, Proc. Amer. Math. Soc. 2 (1951), 390-395.
Боголюбов H. H.
1.	Sur quelques methodes nouvelles in the calculus des variations, Ann. Math. Рига Appl., ser. 4, 7 (1930), 249—271.
Болтянский В. Г.
1.	Принцип максимума в теории оптимальных процессов, ДАН СССР 119, 6 (1958), 1070—1073.
2.	Достаточные условия оптимальности и обоснование метода динамического программирования, Изв. АН СССР, сер. матем. 28, 3 (1968), 481—514.
3.	Метод локальных сечений в теории оптимальных процессов, Дифференциальные уравнения 4, 12 (1968), 2166—2183.
4	Математические методы оптимального управления, М., «Наука», 1969.
5.	Оптимальное управление дискретными системами, М., «Наука», 1973.
Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л.С.
1. К теории оптимальных процессов, ДАН СССР ПО, 1 (1956), 7-10.
2. Теория оптимальных процессов. 1. Принцип максимума, Изв. АН СССР, сер. матем. 24, 1 (1960), 3—42.
ЛИТЕРАТУРА
463
Больца (Bolza О.)
1. Lectures on the Calculus of Variations. Dover, New York, 1964. Боннезен, Фенхель (Bonnesen T., Fenchel W.)
1. Teorie der konvexen Korper, Springer, Berlin, 1934.
Борг (Borg G.)
1.	Uber die Stabilitat gewisser Klassen von linearen Differential-gleichungen, Arch matem. astr. fysik, Bd 31 A, 41 (1944), 460—482. Брайсон A., Xo Ю-ши.
1.	Прикладная теория оптимального управления, М., «Мир», 1972. Брондстед (Brondsted А.)
1.	Conjugate convex functions in topological vector spaces, Mat Fys. Medd. Dansk. Vid. Selsk. 34, 2 (1964), 1—26.
Брондстед, Рокафеллар (Brondsted A., Rockafellar R. T.)
1.	On the subdifferentiability of convex functions, Proc. Amer. Math. Soc. 16 (1965), 605—611.
Бурбаки H.
1.	Топологические векторные пространства, M., ИЛ, 1959. Бутковский А. Г.
1.	Теория оптимального управления системами с распределенными параметрами., М., «Наука», 1965.
Важевский (Wazewski Т.)
1.	Systems de commande et equations au contingent, Bull. Ac. Po-lon. Sci., ser. math, astr., phys. 9 (1961), 151—155.
2.	Sur une condition d’existence fonctions implicites mesurables, Bull. Ac. Polon. Sci., ser. Math. Astr., Phys. 9 (1961), 861—863.
3.	Sur une generalization de la notion des solutions dune equation au contingent, Bull. As. Polon. Sci., ser. math., astr., phis. 10 (1962), 11—15.
4.	On an optimal control problem, Proc. Conf, on Differential Equations and their Applications, Prague, 1962, 229—247.
5.	Sur les systemes de commande non lineaires dont le contredo-maine de commande n’est pas forcement convexe, Bull. Ac. Polon. Sci., ser. math., astr., phys. 10 (1962), 17—21.
Валадье (Valadier M.)
1.	Sur 1’integration d’ensembles convexes compacts en dimension infinie, C. R. Acad. Sci. Paris 266 (1968), 14—16.
2.	Sous-differentiels d’une borne superieure et d’une somme continue de fonctions convexes. C. R. Acad. Sci. Paris 268 (1969), 39—42.
3.	Integration de convexes fermes. notamment d’epigraphes, Rev. F. Inf. Resh. Oper. 4 (1970), 57—73.
4.	Multi-applications mesurables a valeures de convexes compactes, J. Math. Pur. Appl. 50 (1971), 265—297.
5.	Complements sur les equations differentielles multivoques, Tra-vaux du Sem. d’An. Conv., Univ. Montpellier 1, 1971.
6.	Un theoreme d’inf-compacite, Travaux du Sem. d’Anal. Convexe, v. 1, Univ, du Languedoc, 1971.
Валентайн (Valentine F. A.)
1. Convex Sets. McGraw-Hill, New York, 1964.
Ван Слай к, Вете (Van Slyke R. M., Wets R. J. B.)
1. A duality theory for abstract mathematical programme with applications to optimal control theory, J. Math. Anal. Appl. 22 (1968), 679—706.
464
ЛИТЕРАТУРА
Вапнярский И. Б.
1.	Теорема существования оптимального управления в задаче Больца, некоторые ее приложения и необходимые условия оптимальности для скользящих и особых режимов, ЖВМ и МФ 7, 2 (1967), 259—289.
Варга (Warga J.)
1.	Relaxed variational problems, J. Math. Anal. Appl. 4 (1962), 111—127.
2.	Functions of relaxed controls, SIAM J. Control 5 (1967), 628— 641.
3.	Control problems with functional restrictions, SIAM J. Control 8 (1970), 360—371.
4.	Optimal Control of Differential and Functional Equations, Academic Press, New York — London, 1972.
Габасов P., Кириллова Ф. M.
1. Особые оптимальные управления., M., «Наука», 1973.
Г амильтон (Hamilton W. R.)
1. Second Essay on a General Method in Dynamics, Philosophical Transactions of the Royal Society of London, 1935.
Г амкрелидзе P. В.
1.	К теории оптимальных процессов в линейных системах, ДАН СССР 116, 1 (1957), 9—11.
2.	Теория оптимальных по быстродействию процессов в линейных системах, Изв. АН СССР, сер. матем. 22, 4 (1958), 449—474.
3.	Оптимальные процессы управления при ограниченных фазовых координатах, Изв. АН СССР, сер. матем. 24, 3 (1960), 315—356.
4.	Оптимальные скользящие режимы, ДАН СССР 143, 6 (1962), 1243—1245.
5.	К теории первой вариации, ДАН СССР 161, 1 (1965), 345— 348.
6.	On some extremal problems in the theory of differential equations with applications to the theory of optimal control, SIAM J. Control 3 (1965), 106—128.
7.	Extremal problems in finite-dimensional spaces, J. Opt. Theory Appl. 1 (1967), 173—193.
8.	Необходимые условия первого порядка и аксиоматика экстремальных задач, Тр. МИАН СССР 112 (1971), 152—180.
Гамкрелидзе Р. В., Харатишви ли Г. Л.
1.	Extremal problems in linear topological spaces 1, Math. Systems Th. 1 (1967), 229—256.
2.	Экстремальные задачи в линейных топологических пространствах, Изв. АН СССР, сер. матем. 33, 4 (1969), 781—839.
3.	Необходимые условия первого порядка в экстремальных задачах, в сб. «Международный конгресс математиков в Ницце», М., «Наука», 1972.
Гасс С.
1. Лицейное программирование, М., Физматгиз, 1961.
Гейл (Gale D.)
1. Теория линейных экономических моделей, М., ИЛ, 1963.
2. A geometric duality theorem with economic application, Rev. Econ. Studies 34 (1967), 19—24.
ЛИТЕРАТУРА
465
Гейл, Кун, Таккер (Gale D., Kuhn Н. W., Tucher A. W.)
1.	Linear programming and the theory of games, in «Activity Analysis of Production and Allocation», Wiley, New York, 1951, 298—316.
Г e л ь ф а н д И. M., Ф о м и н С. В.
1.	Вариационное исчисление, М., Физматгиз, 1961.
Гильберт (Hilbert D.)
1.	Uber das Dirichlet’sche Princip, Math. Ann. 59 (1904), 161—186.
2.	Zur Variationsrechnung. Math. Ann. 62 (1906).
3.	Математические проблемы. Проблемы Гильберта, М., «Наука», 1969.
Гирсанов И. В.
1.	Математическая теория экстремальных задач, Изд-во МГУ, 1970.
Г олдстайн (Goldstine Н.)
1.	Minimum problems in the functional calculus, Bull. Amer. Math. Soc. 46 (1940), 142—149.
Гольштейн E. Г.
1.	Двойственные задачи выпуклого программирования. Экон, и матем. методы 1, 3 (1965), 317—322.
2.	Задачи наилучшего приближения элементами выпуклых множеств и некоторые свойства опорных функционалов, ДАН СССР 173, 5 (1967), 995—998.
3.	Обобщенные соотношения двойственности в экстремальных задачах, Экон, и матем. методы 4, 6 (1968), 597—610.
4.	Теория двойственности в математическом программировании, М., «Наука», 1971.
Грейвс (Graves L. М.)
1.	On the problem of Lagrange, Amer. J. Math. 13 (1931), 547—554.
2.	On the Weierstrass condition for the problem of Bolza in the calculus of variations, Ann. of Math. 33 (1932), 747—752.
3.	The existence of an extremum in problems of Mayer, Trans. Amer. Math. Soc. 39 (1936), 456—471.
Гуйла-Ури (Ghouila-Houri A.)
1. Generalisation de la notion de commande d’une systeme guidable, Rev. Inf. Resh. Орег. 1 (1967), 7—32.
Г юйгенс X.
1. Трактат о свете, М. — Л., ОНТИ, 1935
Данфорд Н., Шварц Дж. Т.
1. Линейные операторы. Общая теория, М., ИЛ, 1964.
ДанцерЛ., Грюнбаум В., Кли В.
1. Теорема Хелли, М., «Мир», 1968.
Данциг Дж Б.
1. Линейное программирование, его приложения и обобщения, М., «Прогресс», 1966.
Дворецкий, Вальд, Вольфовиц (Dvoretzky A., Wald А., Wolfowitz J.)
1. Relations among certain ranges of vector measures, Ann. of Math. Stat. 22 (1951), 1—21.
Дебре (Debreu G.)
Integration of correspondences, in «Proceedings of Fifth Berkley Symposium on Mathematical Statistics and Probability», Univ of California Press, v. 2, part 1 (1966), 351—372.
466
ЛИТЕРАТУРА
Д е к а р т Р.
1. Геометрия, М., ОНТИ, 1938.
Демидович Б. П.
1. Сборник задач и упражнений по математическому анализу, М., «Наука», 1968.
Джекобс (Jacobs М. Q.)
1. Remarks on some recent extensions of Filippov’s implicit function lemma, SIAM J. Control 5 (1967), 622—627.
2. Measurable multivalued mappings and Lusin’s theorem, Trans. Amer. Math. Soc. 134 (1968), 471—481.
Джон (John F.)
1.	Extremum problems with inequalities as subsidary conditions, «Studies and Essays. Courant Anniversary volume», Interscience, New York, 1948, 187—204.
Дитер (Dieter U.)
1.	Dual extreumum problems in locally convex topological spaces, «Proceedings of the Colloqium on Convexity», Copenhagen, 1965, 185—201.
2.	Optimierungsaufgaben in topologischen vektorraumen I: Dualitats-theorie, Z. Wahrscheinlichkeitstheorie verw. Geb. 5 (1966), 89—117.
3.	Dual extremum problems in linear spaces with examples and applications in game theory and statistics, in «Theory and Applications of Monotone Operators», Tipografia «Oderisi», Gubbio Italy, 1969, 303—312.
Дубовицкий А. Я., МилютинА. A.
1.	Задачи на экстремум при наличии ограничений, ДАН СССР, 149, 4 (1963), 759—762.
2.	Задачи на экстремум при наличии ограничений, ЖВМ и МФ 5, 3 (1965), 395—453.
3.	Необходимые условия экстремума в задачах оптимального управления со смешанными ограничениями типа неравенств, ЖВМ и МФ 8, 4 (1968), 725—770.
4.	Трансляция уравнений Эйлера, ЖВМ и МФ 9, 6 (1969), 1263— 1284.
5.	Необходимые условия слабого экстремума в общей задаче оптимального управления. М., «Наука», 1971.
Дьедонне Ж.
1. Основы современного анализа, М., «Мир», 1964. Дюбуа-Раймон (Du Bois-Raymond)
1. Erlauterungen zu den Anflangs-grunden der Variations rechnung, Math. Ann. XV (1879).
Евтушенко Ю. Г.
1. Приближенный расчет задач оптимального управления, ПММ 34, 1 (1970), 95—104.
.Егоров Ю. В.
1. Необходимые условия оптмальности управления в банаховом пространстве, Матем. сб. 64, 1 (1964), 79—101.
Заславский Ю. Л.
1. Сборник задач по линейному программированию, М., «Наука», 1969.
3 е т е л ь С. И.
1. Задачи на максимум и минимум. М., Гостехиздат, 1948.
ЛИТЕРАТУРА
467
Зингер (Singer I.)
1. Cia mia buna approximare on spatii vectoriale normate prin ele-mente din subspatii vectoriale, Acad. RSR, Bucuresti, 1967.
Зуховицкий С. И.
1. О приближении действительных функций в смысле П. Л. Чебышева, УМН 11, 2 (1956), 125—159.
Зуховицкий С. И., Стечкин Б. С.
1. О приближении абстрактных функций со значениями в банаховом пространстве. ДАН СССР 106, 3 (1956), 385—388; 106, 5 (1956), 773—776.
Иордан, Полак (Jordan В. W., Polak Е.)
1. Theory of a class of discrete optimal control systems, J. Electronics and Control 17 (1964), 697—711.
И о ф ф e А. Д.
1	. Преобразование корректно поставленных вариационных задач, ДАН СССР 168, 2 (1966), 269—271.
2	. Банаховы пространства, порождаемые выпуклыми интегранта-ми, и многомерные вариационные задачи, ДАН СССР 195, 5 (1970), 1018—1021.
3	Субдифференциалы ограничений выпуклых функций, УМН 25, 4 (1970), 181—182.
4	Нелокальные методы в теории оптимального управления, V Всесоюзное совещание по проблемам управления, рефераты докладов, часть II, М., «Наука», 1971, 94—96.
5	Теорема существования для задач вариационного исчисления, ДАН СССР 205, 2 (1972), 277—280.
6	. Выпуклые функции, связанные с вариационными задачами, и проблема абсолютного минимума, Матем. сб. 88, 2 (1972), 194—210.
И о ф ф е А. Д., Л е в и н В. Л.
1.	Субдифференциалы выпуклых функций, Тр. ММО 26 (1972), 3—73.
Иоффе А. Д., Тихомиров В. М.
1.	Двойственность в задачах вариационного исчисления, ДАН СССР 180, 4 (1968), 789—792.
2.	Расширение вариационных задач, Тр. ММО 18 (1968), 187—246.
3.	Двойственность выпуклых функций и экстремальные задачи, УМН 23, 6 (1968), 51—116.
4.	О минимизации интегральных функционалов, Функц. анализ 3, 3 (1969), 61—70.
Канторович Л. В.
1. Об одном эффективном методе решения некоторых классов экстремальных задач, ДАН СССР 28, 3 (1940), 212—215.
2. О перемещении масс, ДАН СССР 37, 7—8 (1942), 227—229.
Канторович Л. В., Рубинштейн Г. Ш.	1
1. Об одном функциональном пространстве и некоторых экстремальных задачах, ДАН СССР 115, 6 (1957), 1058—1061.
Каратеодори (Caratheodory С.)
1. Die Methode der geodatischen Aequidistanten und das Problem von Lagrange, Acta Math. 47 (1926), 199—236.
2. Variationsrechnung und partielle Differentialgleichungen erster Ordnung, Teubner, Leipzig — Berlin, 1935.
468	Литература
Карлин С.
1. Математические методы в теории игр, программировании и экономике, М., ИЛ, 1964.
К а р т а н А.
1. Дифференциальное исчисление. Дифференциальные формы, М., «Мир», 1971.
Кастен (Castaing Ch.)
1.	Sur les multi-applications measurables, Rev. Francaise Inf. Rech. Oper. 1 (1967), 91—126.
2.	Sur une nouvelle extension du theoreme de Lyapunov, C. R. Acad. Sci. (Paris) 264 (1967), 333—336.
3.	Le theoreme de Dunford — Pettis generalise, Univ, de Montpellier, 1968—1969, publ. 43.
4.	Un theoreme de compacite faible dans LXE ..., Univ, de Montpellier, 1969, publ. 44.
5.	Quelques resultats de compacite liees a 1’integration, C. R. Acad. Sci. (Paris), 270 (1970), 1732—1735.
Кастен, Валадье (Castaing Ch., Valadier M.)
1. Equations differentielles multivoques dans les espaces vectoriels localement convexes, Rev. Francais Inf. Rech. Oper. 16 (1969), 3—16.
К л и (Klee V.)
1. Separation and support properties of convex sets, «Control Theory and the Calculus of Variations», Acad. Press, 1969, 235— 305.
Клотцлер (Klotzler B.)
1. Mehrdimensionale variationsrechnung, Berlin, VEB Deutscher Ver lag, 1971.
Коддингтон Э. А., Левинсон H.
1. Теория обыкновенных дифференциальных уравнений, М., ИЛ, 1952.
КолмогоровА. Н., Фомин С. В.
1. Элементы теории функций и функционального анализа, М., «Наука», 1972.
Красовский Н. Н.
1. К теории оптимального регулирования. Автоматика и телемеханика 18, 11 (1957), 960—970.
2. Об одной задаче оптимального управления, ПММ 21, 5 (1957), 670—677.
3. Теория управления движением, М., «Наука», 1968.
Крейн М. Г., Нудельман А. А.
1.	Проблема моментов Маркова и экстремальные задачи, М., «Наука», 1973.
Кротов В. Ф.
1.	Разрывные решения вариационных задач, Изв. вузов, Математика, 18, 5 (1960), 86—97.
2.	О разрывных решениях вариационных задач, Изв. вузов, Математика, 19, 2 (1961), 75—89.
3.	Методы решения вариационных задач на основе достаточных условий абсолютного минимума, Автоматика и телемеханика 23, 12 (1962), 1571—1583, 24, 5 (1963), 581—598, 25, 7 (1964), 1037-1046.
ЛИТЕРАТУРА
469
Кротов В. Ф., Букреев В. 3., Гурман В. И.
1. Новые методы вариационного исчисления в динамике полета, М., «Машиностроение», 1969.
Кротов В. Ф, Гурман В. И.
1. Методы и задачи оптимального управления, М., «Наука», 1973.
Кун, Таккер (Kuhn Н. W., Tucker A. W.)
1. Nonlinear programming, «Proceedings of the Second Berkley Symposium on Mathematical Statistics and Probability», Univ, of California Pr., Berkley, 1951, 481—482.
Курант P., Гильберт Д.
1. Методы математической физики, т. 1., М. — Л., ГИТТЛ, 1951. Куратовский и Рылль-Нарджевский (Kuratowski К., Ryll-Nardzewski С.)
1. A general theorem on selectors, Bull. Ac. Polon. Sci., ser. Math., Astr., Phys. 13 (1965), 397—403.
Кутателадзе С. С., Рубинов A. M.
1. Двойственность Минковского и ее применения, УМН 27, 3 (1972), 127—176.
Лаврентьев М. А., Л юстер н и к Л. А.
1. Основы вариационного исчисления, М. — Л., ОНТИ, 1935.
2. Курс вариационного исчисления, М. — Л., ГИТТЛ, 1950.
Лагранж (Lagrange J.)
1. Essai d’ne nouvelle methode pour determiner les maxima et les minima des formules integrates indefinies, Lagrange J., Ouevres, t. 1, 1892.
2. Аналитическая механика, M. — Л., ГИТТЛ, 1950.
Л е в и н А. Ю.
1. К вопросу о нулевой зоне устойчивости, ДАН СССР 145, 6 (1962), 1021—1023.
2. Об одном критерии устойчивости, УМН 17, 3 (1962), 211—212. Л е в и н В. Л.
1.	О некоторых свойствах опорных функционалов, Мат. заметки 4, 6 (1968), 685—696.
2.	Применение теоремы Хелли в выпуклом программировании, задачах наилучшего приближения и смежных вопросах, Матем. сб., 79, 2 (1969), 250—263.
3.	О субдифференциалах выпуклых функционалов, УМН 25, 4 (1970), 183—184.
4.	О субдифференциале составного функционала, ДАН СССР 194, 2 (1970), 268—269.
Левитин Е. С., Милютин А. А., Осмоловский Н. П.
1. О необходимых и достаточных условиях минимума, ДАН СССР, 210, 5 (1973), 1173—1176.
Лежандр (Legendre)
1. Memoire sur la maniere de distinguer les maxima des minima dans le calcul variations, Memoire de 1'Academie des Sciences, 1786.
Л e й т м а н Дж.
I. Методы оптимизации с приложениями к космическим летательным аппаратам, сб. статей под ред. Дж. Лейтмана, М., «Наука», 1965.
470
ЛИТЕРАТУРА
Л и Э. Б., М а р к у с Л.
1. Основы теории оптимального управления, М., «Наука», 1972.
Линденштраус (Lindenschtrauss J.)
1. A short proof of Lyapunov’s convexity theorem, J. Math. Meeh. 15 (1966), 971—972.
Лионе Ж.-Л.
1. Оптимальное управление системами, описываемыми уравнениями с частными производными, М., «Мир», 1972.
Лузин Н. Н.
1. Sur la probleme de J. Hadamard d’uniformisation des ensembles, Mathematica 4 (1930), 54—66.
Люстерник Л. A.
1. Об условных экстремумах функционалов, Матем. сб. 41, 3 (1934), 390—401.
Люстерник Л. А., СоболевВ. И.
1. Элементы функционального анализа, М.» «Наука», 1965.
Ляпунов А. А.
1. О вполне аддитивных вектор-функциях, Изв. АН СССР, сер. матем. 4, 6 (1940), 465—478.
Ляпунов А. М.
1. Общая задача об устойчивости движения, Харьков, 1892.
Майер (Mayer А.)
1. Zur Aufstellung der Kriterien des Maximus und Minimus der einfachen Integrate bei variabeln Greuzwerten, Leipziger Berichte 36 (1884), 99—128, 48 (1896), 436—465.
Майкл (Michel E.)
1.	Continuous selections, Ann. of Math., ser. 2, 63 (1956), 361—383. Макшейн (McShane E. J.)
1.	On the semicontinuity of integrals in the calculus of variations, Ann. of Math. 33 (1932), 460—486.
2.	Existence theorem for ordinary problems of the calculus of variations, Ann. Scuola Norm. Piza 3 (1934), 181—211.
3.	Some existence theorems for the problems of the calculus of variations, Duke Math. J. 4 (1938), 132—156.
4.	On multipliers for Lagrange problem, Amer. J. Math. 91 (1939), 809—819.
5.	Generalized curves, Duke Math. J. 6 (1940), 513—536.
6.	Existence theorems for Bolza problem in the calculus of variations, Duke Math. J. 7 (1940), 28—61.
7.	Relaxed control and variational problems, SIAM J. Control 5 (1967), 438—485.
Мандельбройт (Mandelbrojt S.)
1. Sur les fonctions convexes, C. R. Acad. Sci. (Paris) 209 (1939), 977-978.
Марков A. A.
1. Об одном вопросе Менделеева, Избранные труды, М., ОГИЗ, 1948.
Минковский (Minkowski Н.)
1. Geometrie der Zahlen, Teubner, Leipzig, 1910.
2. Theorie der Konvexen Korper, Insbesondere Begriindung ihres Oberflachenbegriffs, Gesammelte Abhandlungen, II, Leipzig, 1911.
ЛИТЕРАТУРА
471
Моисеев Н. Н.
1.	Численные методы в теории оптимальных систем, М., «Наука», 1971.
Моро (Moreau J. J.)
1.	Fonctions convexes en dualite. Fac. des Sciences de Montpellier, Sem. de Mathematiques (1962).
2.	Inf-convolution des fonctions numeriques sur un espace vecto-riel, C. R. Acad. Sci. (Paris) 256 (1963), 5047—5049.
3.	Fonctionelles sous-differentiables, C. R. Acad. Sci. (Paris) 257 (1963), 4117—4119.
4.	Sur la fonction polaire d’une fonctione semi-continue superieure-ment, C. R. Acad. Sci. (Paris) 258 (1964), 1128—1131.
5.	Proximate et dualite dans un espace hilbertien, Bull. Soc. Math. France 93 (1965), 273—299.
6.	Convexity and duality, «Functional Analysis and Optimisation», Acad. Press, New York, 1966, 145—169.
7.	Fonctionelles Convexes, College de France, 1966.
8.	Sous-differentiabilite, in «Proceedings of the Colloquium on Convexity», Copenhagen, 1965, Copenhagen, Mat. Inst. 1967, 185—201.
9.	Inf-convolution, sous-additive, convexit£ des fonctions numeriques, J. Math. Pures Appl. 49 (1970), 109—154.
10.	Weak and strong solutions of dual problems. «Contributions to Nonlinear Functional Analysis», Acad. Press, N. Y., 1971, 181— 214.
Морозов С. Ф., Плотников В. И.
1. О необходимых и достаточных условиях непрерывности и полунепрерывности функционалов вариационного исчисления, Матем. сб. 57, 3 (1962), 265—280.
Морри (Моггеу Ch.)
1. Multiple integrals in the calculus of variations, Springer, Berlin — Heidelberg—New York, 1967.
Mope (Morse M.)
1. Sufficient conditions in the problem of Lagrange with fixed end-points, Annals of Mathematics, XXXII (1931), 567—577.
2. Sufficient conditions in the problem of Lagrange with variable end conditions, American Journal of Mathematics, LIII (1931)* 517—546.
Моско (Mosco U.)
1. Convergence of convex sets and solutions of variational inequalities, Advances in Math., 3 (1969), 510—585.
2. On the continuity of the Young-Fenchel transform, J. Math. Anal. Appl. 33 (1971), 518—535.
H a г у м о (Nagumo M.)
1. Uber die gleichmassige Summierbarkeit und ihre Anwendung auf ein Variationsproblem, Japan J. Math. 6 (1929), 173—182.
Надлер (Nadler S. B.)
1. Multi-valued contraction mappings, Not. Amer. Math. Soc. 14, 7 (1967), 930—942.
Никольский С. M.
1. Приближение функций тригонометрическими полиномами в среднем, Изв. АН СССР, сер. матем. 10 (1946), 295—332.
472
ЛИТЕРАТУРА
Нойштадт (Neustadt L. W.)
1.	The existence of the optimal control in the absence of convexity conditions, J. Math. Anal. Appl. 7 (1963), 110—117.
2.	An abstract variational theory with applications to a broad class of optimisation problems I, II, SIAM J. Control 4 (1966), 505— 527, 5 (1967), 90—137.
3.	A general theory of extremals, J. Comp. System Sci. 3 (1969), 57—92.
4.	Sufficiency conditions and a duality theory for mathematical programming problems in arbitrary linear spaces, «Nonlinear Programming», Acad. Press, 1970, 323—348.
Ньютон И.
1. Математические начала натуральной философии, Русский перевод— в 7 томе собраний трудов А. Н. Крылова, М. — Л., ОНТИ, 1936.
О л е х (Olech Ch.)
1. A note concerning set-valued measurable functions, Bull. Acad. Polon. Sci., ser. Math., Astr., Phys. 13 (1963), 317—321.
2. Extremal solution of a control system, J. Diff. Eqs. 2 (1966), 74—101.
« 3. Existence theorems for optimal control problems involving multiple integrals, J. Diff. Eqs. 6 (1969), 512—526.
Поляк Б. T.
- 1. К теории нелинейных задач оптимального управления, Вестник МГУ, сер. мат., мех. 2 (1968), 30—40.
2. Полунепрерывность интегральных функционалов и теоремы существования. Матем. сб. 78 (1969), 65—84.
Понтрягин Л. С.
1. Оптимальные процессы регулирования, УМН 14, 1 (1959), 3— 20.
Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф.
1. Математическая теория оптимальных процессов, М., Физматгиз, 1961.
Пропой А. И.
1. О принципе максимума для дискретных систем управления, Автоматика и телемеханика 26, 7 (1965), 1177—1187.
2. Элементы теории оптимальных дискретных процессов, М., «Наука», 1973.
Пшеничный Б. Н.
1.	Двойственный метод в экстремальных задачах, Кибернетика 3 (1965), 89—95.
2.	Выпуклое программирование в нормированных пространствах, Кибернетика 5 (1965), 46—54.
3.	Необходимые условия экстремума в задачах частично-выпуклого программирования, Кибернетика 2 (1969), 90—93.
4.	Необходимые условия экстремума, М., «Наука», 1969. Пшеничный Б. Н., Данилин Ю. М.
1.	Численные методы в экстремальных задачах, М., «Наука», 1974. Пшеничный Б. Н., Н е н а х о в Э. И.
1. Необходимые условия экстремума в задачах с операторными ограничениями, Кибернетика 3 (1971), 35—46.
ЛИТЕРАТУРА
473
Ранд (Rund Н.)
1. The Hamilton—Jakobi Theory in the Calculus of Variations, van Nostrand Co., 1966.
Ремез E. Я.
1. Про методи найкращого в разумш! Чебышева наближенного представления функщй, Вид-во АН УРСР, 1935.
Р о з о в Н. X.
1. Математика на службе инженера, сб. статей под ред. Н. X. Розова М., «Знание», 1973.
Розоноэр Л. И.
1. Принцип максимума Л. С. Понтрягина в теории оптимальных процессов I, II, III, Автоматика и телемеханика, 20, 10 (1959), 1320—1334; 20, 11 (1959), 1441-1458; 20, 12 (1959), 1561 — 1578.
Рокафеллар (Rockafellar R. Т.)
1.	Duality theorems for convex functions, Bull. Amer. Math. Soc. 70 (1964), 189—192.
2.	Helly’s theorem and minima of convex functions, Duke Math. J. 32 (1965), 381—398.
3.	Duality and stability in extremal problems involving convex functions, Pacific J. Math. 21 (1967), 167—187.
4.	Integrals which are convex functionals I, II, Pacific. J. Math, 24 (1968), 867—873; 39 (1971), 439—469.
5.	Duality in nonlinear programming, in «Mathematics in the Decision Sciences», v. II, part I, American Math. Soc., 1968, 401—422.
6.	A general correspondence between dual minimax problem and convex programm, Pacific, J. Math. 25 (1968), 597—611.
7.	Measurable dependence of convex sets and functions on parameters, J. Math. Anal. Appl. 28 (1969), 4—25.
8.	Conjugate convex functions in optimal control and the calculus of variations, J. Math. Anal. Appl. 32 (1970), 174—222.
9.	Existence and diality theorem for convex problem of Bolza, Trans. Amer. Math. Soc. 159 (1971), 1—40.
10.	Ordinary convex programms without a duality gap, J. Opt. Theory Appl. 7 (1971), 143—148.
11.	Weak compactness of level sets of integral functionals, Troisie-me Colloque d’Analyse Fonctionelle, Vander, Louvain — Belgique, 1971.
12.	Convex-Integral functionals and duality, in «Contributions to Nonlinear Functional Analysis», Acad. Press, New York, 1971, 215—236.
13.	Optimal arcs and the miniipum value function in problems of Lagrange, Trans. Amer. Math. Soc. 180 (1973), 53—84.
14.	Выпуклый анализ, M., «Мир», 1973.
Р о к с и н (Roxin Е.)
. 1. The existence of optimal controls, Michigan Math. J. 9 (1962), 109—119.
Романовский И. В., Судаков В. Н.	;
1. О существовании независимых разбиений, Тр. МИАН СССР, 79 (1965), 5—10;
474
ЛИТЕРАТУРА
Рохлин В. А.
1. Избранные вопросы метрической теории динамических систем, У МН 4, 2 (1949), 57—128.
Рыбников К. А.
1. Первые этапы вариационного исчисления, в сб. «Историко-математические исследования», М. — Л., ГИТТЛ, 1949.
Сансоне Дж.
1. Обыкновенные дифференциальные уравнения, М., ИЛ, 1954. Се а Ж.
1. Оптимизация, М., «Мир», 1973.
Синквини (Cinquini S.)
1.	Sopra 1’esistenza della soluzione nei problemi di Calcolo delle variazioni di ordin n, Ann. Scuola Norm. Pisa 5 (1936), 169—190.
2.	Sopra 1’esistenza dell’estremo in campi illimitati, Rend. Accad. Naz. Lincei 4 (1948), 675—682.
3.	A proposito della esistenza dell’estremo assoluto in campi illimitati, Rend. 1st. Lombardo Sci. Lrtt. 107 (1973), 460—472.
Слейтер (Slater M.)
1. Lagrange multipliers revisited: a contribution to nonlinear programming, Cowles Commission Discussion Paper, Math. 403 (1950). Стечкин С. Б.
1. О приближении абстрактных функций, Rev. Math. Pures Appl.
1 (1956), 79—83.
Гемам (Temam R.)
1. Remarques sur la dualite en calcul des variations et applications, C. R. Acad. Sci. (Paris) 270 (1970), 754—757.
2. Solutions generalisees de certains problemes de calcul de variations, C. R. Acad. Sci. (Paris) 271 (1970), 1116—1119.
T он ел ли (Tonelli L.)
1. Fondamenti di calcolo delle variazioni, Zanichelli Bologna, 1921—1923.
2. Su gli integral! del Calcolo delle variazioni in forma ordinaria, Ann. Scuola Norm. Pisa 3 (1934), 401—450.
Фан, Гликсберг, Гоффман (Fan Ky, Glicksberg L, Hoffman A. J.)
1. Systems of inequalities involving convex functions, Proc. Amer. Math. Soc. 8 (1957), 617—622.
Фенхель (Fenchel W.)
1. On conjugate convexe functions Canad, J. Math. 1 (1949), 73—77.
2. Convex Cones, Sets and Functions, Princeton Univ., 1951. ФилипповА. Ф.
1. О некоторых вопросах теории оптимального регулирования, Вестник МГУ, сер. матем., мех., астроном., физ., хим. 2 (1959), 25—32.
2. Дифференциальные уравнения с разрывной правой частью, Матем. сб. 51, 2 (1966), 100—128.
Флеминг У. Г.
1.	Об одном классе игр над пространством функций и связанных с ним вариационных задачах, в сб. «Бесконечные антагонистические игры», М., Физматгиз, 1963, 98—122.
X а л к и н (Halkin Н.)
1.	Some further generalizations of a theorem of Lyapunov, Arch, Rat. Meeh. Anal. 17 (1964), 272—277.
ЛИТЕРАТУРА
475
2.	On a generalization of a theorem of Lyapunov, J. Math. Anal. Appl. 10 (1965), 199—202.
3.	A maximum principle of the Pontryagin type for systems described by nonlinear difference equations, SIAM J. Control 4 (1966), 90—112.
4.	Nonlinear nonconvex programming in an infinite dimensional space, «Mathematical Theory of Control», Acad. Press, New York, 1967, 10—25.
5.	A new existence theorem in the class of piecewise continuous control functions, Control Theory and the Calculus of Variations, Acad. Press, 1969.
6.	A satisfactory treatment of equality and operator constraints in Dubovitskii — Milyutin optimisation formalism, J. Opt. Theory Appl. 6 (1970), 138—149.
Халки н, Нойштадт (Halkin H. and Neustadt L. W.)
1. General necessary condition for optimisation problems, Proc. Nat. Acad. Sci. 56 (1966), 1066—1071.
Харди Г. Г., Л и т т л ь в у д Д. Е., Полна Г.
1. Неравенства, М., ИЛ, 1948.
X е р м с (Hermes Н.)
1.	A note on the range of a vector measure; application to the theory of optimal control, J. Math. Anal. Appl. 8 (1964), 78—83.
2.	Calculus of set-valued functions; applications to control, J. Math. Anal. Meeh. 18 (1968), 47—59.
3.	On continuous and measurable selections and the existence of solutions of generalized differential equations, Proc. Amer. Math. Soc. 29 (1971), 535—545.
X e с т e н c (Hestenes M.)
1.	Sufficient conditions for the problem of Bolza in the calculus of variations, Trans. Amer. Math. Soc. 36 (1934), 793—818.
2.	On sufficient conditions in the problems of Lagrange and Bolza, Ann. of Math. 37 (1936), 543—551.
3.	Calculus of Variations and the Optimal Control Theory, Wiley, 1966.
4.	Multiplier and gradient methods, J. Opt. Theory Appl. 4 (1969), 303—320.
Ц e й т e н Г. Г.
1. История математики в древности и в средние века, М. — Л.* ОНТИ, 1938.
2. История математики в 16 и 17 столетиях, М. — Л., ОНТИ, 1938. Чебышев П. Л.
1.	О некоторых механизмах, известных под названием параллелограммов, «Избранные труды», М., Изд-во АН СССР, 1955, 611—649.
Чезари (Cesari L.)
1.	Existence theorems for optimal solutions in Pontryagin and Lagrange problems, J. SIAM Contr. 3 (1965), 475—498.
2.	Existence theorems for weak and usual optimal solutions in Lagrange problems, with unilateral constrains I, II, Trans. Amer. Math. Soc. 124 (1966), 369—412, 413—430.
3.	Semi-normality and upper semi-continuity in optimal control, J. Opt. Theory Appl. 6 (1970), 114—137.
476
ЛИТЕРАТУРА
4.	Closure, lower closure and semi-continuity theorems for optimal control, SIAM J. Control 9 (1971), 287—315.
Чезари, Ла Пальм, Нишиура (Cesari L., La Palm J. R., Nishiura T.)
1. Remarks on some existence theorems for optimal control, J. Opt. Theory Appl. 3 (1969), 296—305.
Чезари, Ла Пальм, Санчес (Cesari L., La Palm J. R., Sanchez D. A.)
1. An existence theorem for Lagrange problem with unbounded controls and a slender set of exceptional points. SIAM J. Control 10 (1972), 590—605.
Шварц Л.
1. Анализ, M., «Мир», 1972.
Ш к л я р с к и й Д. О., Ченцов Н. Н., Я г л о м И. Н.
1. Геометрические неравенства и задачи на максимум и минимум, М., «Наука», 1970.
Шнирельман Л. Г.
1. О равномерных приближениях, Изв. АН СССР 2, 1 (1938), 53— 60.
Эгглстон (Eggleston Н. G.)
1. Convexity, Cambridge Univ., 1958.
Эйлер Л.
1. Метод нахождения кривых линий, обладающих свойством максимума либо минимума, или решение изопериметрической задачи, взятой в самом широком смысле, ГТТИ, М. — Л., 1934.
Экланд, Темам (Ekeland I., Temam R.)
1. Analyse Convexe et Problemes Variationelles, Hermann, Paris, 1974.
Эрроу К. Дж., Гурвиц Л., Удзава X.
1. Исследования по линейному и нелинейному программированию, М., ИЛ, 1962.
Ю д и н Д. Б., Гольштейн Е. Г.
1. Линейное программирование. Теория и конечные методы, М., «Наука», 1964.
Ю н г (Young W. Н.)
1. On classes of summable functions and their Fourier series, Proc. Royal Soc. (A), 87 (1912), 225—229.
Якоби (Jacobi K. F.)
1. Zur Theorie der Variationsrechnung und der Differentialglei-chungen, Journal ftir die angewandte Mathematik, XVII (1837). Янг (Young L. C.)
1. Generalized curves and the existence of an attained absolute minimum in the calculus of variations, C. R. Acad. Soc. Sci. et Lettr., Varsovie 3, 30 (1937), 212—234.
2. Лекции по вариационному исчислению и теории оптимального управления, М., «Мир», 1974.
Я н к о в В.
1. Об унификации А-множеств, ДАН СССР 30, 7 (1941), 591—592.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абсолютный экстремум 12
Аннулятор 24
Аффинная комбинация 196
— независимость 197
— оболочка 197
Вариация Вейерштрасса 123
—	игольчатая 18, 125
—	первая 33
—	по направлению 18, 86
—	п-я 36
Верхняя грань функций 180
Возмущение задачи 269, 299 ---стандартное 301, 303, 322 — экстремали 323
Вторая производная 37
Выпуклая комбинация 173 — оболочка 173 ---нижней грани функции 180
Выпуклое замыкание 173
---функции 180
— множество 56
Гамильтониан 144
Граничные условия 101, 103
--- закрепленные 103
---свободные 103
График многозначного отображения
336
Двойственная задача 270
Динамическое программирование 21,
297
Замыкание функции 180
Значение задачи 12
Импульс 105
Интеграл Гильберта 326
—	импульса 115
—	конволюционный 358
—	многозначного отображения 348
—	функций ff 358
—	энергии 115
Интегральный функционал 355
Интегрант 102, 343
—	выпуклый 344
—	измеримый 344
—	квазирегулярный 125, 369
—	нормальный 344
— сопряженный 347
Инфимальная конволюция 179
Каноническая система 157
Касательное пространство 41
Касательный вектор 40
Квадратичная форма 37, 272
---лежандрова 272
Класс возмущений 299
—	допустимых элементов 12
Конус 56
—	нормальный 58, 216
—	порожденный множеством 173
—	сопряженный 184
К-функция 300
—	в точке 300
—	локальная 300
—	стандартная 301, 303
Задача автономная 106
—	Больца 103
—	выпуклая 75, 302, 314
---с ограничениями типа равенств 89
— выпуклого программирования 76
—	гладкая с ограничениями типа равенств 73
—	гладко-выпуклая 78
—	изопериметрическая 141
---классическая 430, 444
—	Лагранжа 103, 105, 134
—	Майера 103
—	Ньютона 445
—	о брахистохроне 12, 422
—	о возбуждении осциллятора 435
—	простейшая 105
---векторная 105
—	с закрепленным временем 103
—	Чаплыгина 430
Лагранжиан 105, 135, 145
Лебеговское множество 23
Лемма Грон уолла 378
—	Дюбуа-Раймона 113
—	Лагранжа 112
—	о биортогональном базисе 25
—	о тройке» 26
—	об аннулляторе 26
Линейная оболочка 92, 173
Локальный минимум 12
Мера непрерывная 349
—	регулярная борелевская 28
Метод вариаций 17
—	возмущений 19
Многозначное отображение 42, 336
---выпуклое 337
--- измеримое 338
--- нормальное 338
—	— открытое 33Z
478
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Множители Лагранжа 16, 73 Модуль 371 — непрерывности 371 — суммируемости 371	Расширенная вещественная прямая 23 Резольвента 64 Решение задачи 12 — уравнения 62
Надграфик 57 Неотрицательный ортант 57 Неравенство Адамара 448 — Виртингера 453 — для средних 451 — Йенсена 178 	 интегральное 376 — Юнга 431 — Юнга — Фенхеля 183	Сечение многозначного отображения 337 Сильный минимум 107, 109 Симплекс 197 Скользящий режим 158 Слабый минимум 107 Сопряженная точка 121, 122, 132, 288 Сопряженное уравнение 64, 136, 144, 245, 296
Образ функции 180 Ограничение 12 —- в разрешенной форме 102 — существенное 16, 77 — типа неравенства 76 	 равенства 73 — фазовое 102 Оптимальный процесс 108 Оптическая длина пути 424 Относительная внутренность 198 Отображение аффинное 47 — билинейное 36 — дифференцируемое по Гато 33 	по направлению 220 	 равномерно 220 	Фреше 33 	дважды 37 —	класса Cj 34 	С2 37 —	локально липшицево 66 —	регулярное 34 Отрезок 38, 56	Стационарная точка 34, 86 Субградиент 57 Субдифференциал 58, 207 Сумма отображений 337 — функций 179 Суперпозиция многозначных отображений 337 S-функция 300 — в точке 300 — локальная 300 Теорема Банаха 26 — Боголюбова 121, 127, 398, 399 — Вейерштрасса 23 — двойственности 188—194 —	измеримого выбора 341 —	Каратеодори 195 —	• Крейна — Мильмана 350 —	Куна — Таккера 76 	 о седловой точке 85 —	Люстерника 41 	обобщенная 45 —	А. А. Ляпунова 350
Пара двойственных задач 270, 315 Поле гильбертово 326 — центральное 323 — экстремалей 313, 323 Полная вариация меры 28 Полуплоскость Пуанкаре 422 Полупространство 176 Поляра 184 Правило множителей Лагранжа 17, 73 Преобразование Лежандра 156, 333 — Юнга — Фенхеля 183 Пример Больца 332, 454 — Вейерштрасса 123, 454 — Гильберта 121, 454 Принцип Гюйгенса 423 — Лагранжа 16, 74, 77, 80 — максимума Понтрягина 143, 144, 145, 149, 153, 245, 426 — наименьшего действия 105 —	сжимающих отображений 24 	многозначных 42 —	снятия ограничений 20 —	Ферма 421 — экстремальный в гладко-выпуклых задачах 79 Производная Гато 33 —	по направлению 204 	отображения 220 —	Фреше 33 —	частная 36 Прообраз функции 180	— Мазура 177 — Моро — Рокафеллара 59, 211 — о виде линейного функционала 30, 32 — о дифференцируемости сложной функции 38 —	о неявной функции 40 —	о седловой точке 84 —	о среднем 38 —	об очистке 215 —	отделимости 25 	 вторая 175 	 первая 174 —	Рисса 28 —	Фенхеля — Моро 180 —	Ферма 15, 86 —	Хана — Банаха 24 —	Хелли 434 —	Шварца 40 Управление 101 Управляемый процесс 102 Уравнение Веллмана 21, 298 —	Гамильтона — Якоби 21 —	Эйлера 113 	в форме Дюбуа-Раймона 115 	Лагранжа 113 — Эйлера — Лагранжа 74, 78, 80, 136 —	Эйлера — Якоби 288 -	Якоби 132, 320
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
479
Условие Вейерштрасса 125, 154
--- усиленное 327
—	Вейерштрасса — Эрдмана 155
—	дополняющей нежесткости 16, 77, 80
—	Каратеодори 66
—	Куна — Таккера 77, 80
—	Лежандра 129, 154
--- усиленное 132
—	регулярности 81
—	роста 370
—	Слейтера 77
—	стационарности 86
—	трансверсальности 136, 144
—	Якоби 132
--- усиленное 290
Фазовая координата 101
—	траектория 102
Функционал абсолютно непрерывный 361
—	интегральный 101
—	опорный 207
—	смешанный 102
—	терминальный 102
Функциональные ограничения 14
Функция аффинная 57, 209
—	Беллмана 303
Функция Вейерштрасса 124
—	вторая сопряженная 183
—	выпуклая 57
—	действия 21, 303
—	дифференцируемая по Гато 33
------Фреше 33
—	замкнутая 57, 209
—	индикаторная 57, 209
—	квадратичная 48
—	Лагранжа 16, 73, 79, 135, 145
—	локально выпуклая 220
—	Минковского 184
—	наклона поля 323
—	несобственная 57
—	однородная 202
—	опорная 57
—	, полунепрерывная снизу 23
—	Понтрягина 144
—	регулярно локально выпуклая 221
— собственная 57
— сопряженная 183
Экстремаль 18, 115
Энергия 105
Эффективное множество 57
---многозначного отображения 336
Александр Давидович Иоффе Владимир Михайлович Тихомиров
ТЕОРИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ (Серия: «Нелинейный анализ и его приложения:*)
М., 1974 г.,	480 стр. с илл.
Редактор Н. П. Рябенькая Техн, редактор К. Ф. Брудно Корректор Л. И. Боровина
Сдано в набор 12/XII 1973 г.
Подписано к печати 30/V 1974 г.
Бумага 84ХЮ8/32, тип. № 1. Физ. печ. л. 15.
Условн. печ. л 25,2.	Уч.-изд. л. 25,02.
Тираж 13 600 экз. Т-09758. Щена книги 1 р. 79 к. Заказ № 918
Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15
Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой Союзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли
198052, Ленинград, Л-52, Измайловский проспект, 29
>р.79к.