Text
                    2 ПРИНЦИП
о МАКСИМУМА
2 ПОНТРЯГИНА
с
о
в
р
Е
м
ДОКАЗАТЕЛЬСТВО И
ПРИЛОЖЕНИЯ
! О
И
А
Т
Е
М
А
Т
И
К
ТА
И
(Выпуск^
1
А. В. Арутюнов
Г. Г. Магарил-Ильяев
В. М. Тихомиров
(jjalcnwpuau


МЕТОДЫ СОВРЕМЕННОЙ МАТЕМАТИКИ Выпуск 1. А. В. Арутюнов Г. Г. Магарил-Ильяев В. М. Тихомиров ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА ДОКАЗАТЕЛЬСТВО И ПРИЛОЖЕНИЯ Рекомендовано учебно-методическими советами по математике и механике, по прикладной математике и информатике Учебно-методического объединения по классическому университетскому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по специальностям «010101 Математика», «010200 Прикладная математика и информатика» и по направлению «510200 Прикладная математика и информатика». Москва ФАКТОРИАЛ ПРЕСС 2006
УДК 517 ББК 22.16 А 86 Арутюнов А. В. А 86 Принцип максимума Понтрягина. Доказательство и приложения / А. В. Арутюнов, Г. Г. Магарил-Ильяев, В. М. Тихомиров. — М.: Изд-во «Факториал Пресс», 2006. - 144 с. - ISBN 5-88688-082-8. Книга посвящена необходимым условиям экстремума для различных классов экстремальных задачах. Особое внимание уделено задачам оптимального управления и принципу максимума Понтрягина — необходимому условию минимума для таких задач. Отличительной чертой доказательств является их простота и прозрачность. Они опираются на вполне стандартные факты анализа и теории обыкновенных дифференциальных уравнений, которые собраны в приложениях. Принцип максимума иллюстрируется на большом числе примеров. Книга может служить учебным пособием по различным курсам оптимизации. Она рассчитана на студентов средних и старших курсов, аспирантов и преподавателей университетов и технических вузов с повышенной математической подготовкой, а также научных работников, занимающихся исследованием экстремальных задач. УДК 517 ББК 22.16 Научное издание Арам Владимирович Арутюнов Георгий Георгиевич Магарил-Ильяев Владимир Михайлович Тихомиров ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА. ДОКАЗАТЕЛЬСТВО И ПРИЛОЖЕНИЯ. Формат 60 х 90/16. Усл.печ.л.9. Бумага офсетная №1. Гарнитура литературная. Подписано к печати 09.03.2006. Тираж 1000 экз. Заказ № 3032. Издательство «Факториал Пресс», 117449, Москва, а/я 331; ЛР ИД № 00316 от 22.10.99. e-mail: factorialco@mail.ru Отпечатано с готовых диапозитивов издательства «Факториал Пресс» в ППП типографии «Наука» Академиздатцентра «Наука» РАН. 121099, Москва Г-99, Шубинский пер., 6. ISBN 5-88688-082-8 © Факториал Пресс, 2006. Все права защищены.
ОГЛАВЛЕНИЕ Предисловие 7 Введение 9 §1. Постановка задач и формулировка теорем 12 1.1. Упрощенная задача оптимального управления и ее частные случаи 12 1.2. Необходимые условия экстремума для простейшей задачи вариационного исчисления, задачи Лагран- жа и принцип максимума для упрощенной задачи оптимального управления 19 §2. Принцип Лагранжа 24 §3. Решения задач 30 §4. Доказательство теорем 61 §5. Доказательство принципа максимума для общей задачи оптимального управления 72 §6. Задачи с фазовыми ограничениями 87 Приложение I 96 Приложение II 107 Задачи 131 Список литературы 139 Дополнительная литература 141 Предметный указатель 143
ПРЕДИСЛОВИЕ Книга посвящена задачам классического вариационного исчисления и оптимального управления. В настоящее время теория оптимального управления представляется весьма важным и востребованным разделом математики, имеющим разнообразные приложения к задачам техники, экономики, управления, естествознания и к самой математике. Книга рассчитана на широкий круг читателей с различной математической подготовкой. Для тех, кто хочет ознакомиться лишь с «техникой» решения задач вариационного исчисления и оптимального управления, написаны первые два параграфа, а также третий параграф, где демонстрируется приложение этой техники (основанной на принципе Лагранжа) к самым различным задачам, которые были поставлены и сотни лет назад и к задачам, которые весьма актуальны в наши дни. После этого разумно порешать задачи, приведенные в конце книги (ко всем из них даны ответы, а к некоторым — указания к решению). Для тех, кто хочет освоить методологию доказательства необходимых условий экстремума в задачах вариационного исчисления и в сравнительно простой, но вполне содержательной задаче оптимального управления, написан §4. Для его понимания требуются знания несколько большие тех, которые дает технический вуз, но в Приложении I собраны все необходимые для этого сведения. Два последних параграфа посвящены более общим задачам оптимального управления. Здесь требуются знания, нередко выходящие за пределы и университетского образования. Для тех, кто хочет освоить материал этих параграфов, написано Приложение П.
ВВЕДЕНИЕ В книге обсуждаются необходимые условия экстремума в различных экстремальных задачах, но основное внимание уделено принципу максимума Понтрягина — необходимому условию минимума в задачах оптимального управления. Решение первой задачи, по сути своей относящейся к оптимальному управлению, было опубликовано И. Ньютоном в 1687 г. (ее постановку и обсуждение см. далее в этом параграфе). Затем, после того как И. Бернулли поставил свою знаменитую задачу о брахистохроне (1696 г.), стало развиваться направление в теории экстремума, которое получило название вариационного исчисления. Этот раздел математического анализа сыграл огромную роль в истории науки, ибо было обнаружено, что большинство законов природы могут быть сформулированы на языке вариационного исчисления, которое впоследствии активно развивалось Л.Эйлером, Ж.-Л. Лагранжем, А.Лежандром, К. Якоби, У. Гамильтоном, К. Вейерштрассом и многими другими выдающимися математиками на протяжении двух с половиной веков. К середине двадцатого века оно выглядело вполне завершённой теорией. Однако именно тогда, в середине двадцатого века, было замечено, что многие задачи техники (в частности, задача Ньютона), экономики, управления и других прикладных отраслей, использующих математические средства, не укладываются в рамки вариационного исчисления. И тогда эта теория была расширена, получив название теории оптимального правления. Начала теории были изложены в книге1 Л. С. Понтрягина, !М.: Физматлит, 1961.
10 Введение В. Г. Болтянского, Р. В. Гамкрелидзе и Е. Ф. Мищенко «Математическая теория оптимальных процессов». Основным аппаратом исследования задач оптимального управления стал принцип максимума Понтрягина, доказательству и обсуждению которого и посвящена настоящая книга. В начале книги формулируется задача оптимального управления в несколько облегчённой форме и её частные случаи — задача Лагранжа и простейшая задача вариационного исчисления. Далее приводятся формулировки необходимых условий экстремума в простейшей задаче, задаче Лагранжа и необходимое условие минимума — принцип максимума Понтрягина — для упрощённой задачи оптимального управления. И постановка упрощённой задачи, и формулировка принципа максимума для неё требуют для своего понимания владения лишь стандартными сведениями из математического анализа и теории обыкновенных дифференциальных уравнений и тем самым доступны весьма широкой аудитории не только математиков, но и инженеров, экономистов, других специалистов в области приложений математики. Одна лишь формулировка принципа максимума даёт возможность до конца исследовать самые разнообразные задачи из механики, физики, экономики, техники, теории управления, наконец, из самой математики. Это мы и хотим продемонстрировать в нашей книге: сразу после формулировки принципа максимума решаются разнообразные задачи, некоторые из которых сыграли важную роль во всей истории математики и были поставлены и решены Ньютоном, И. Бернулли, Эйлером и другими математиками в 17-19 веках. Также здесь решаются задачи теории управления, экономики, космической навигации, исследованные в двадцатом веке. Затем даётся детальное и замкнутое в себе доказательство необходимых условий экстремума сначала для простейшей задачи вариационного исчисления, затем для задачи Лагранжа и, наконец, для упрощенной задачи оптимального управления. Далее приводится формулировка общей задачи оптимального управления и доказывается для нее принцип максимума.
Введение 11 В книге имеется два Приложения. В Приложении I излагаются факты из конечномерного анализа (связанные, в основном, с дифференцируемостью функций и отображений) и теории обыкновенных дифференциальных уравнений, на которые опираются доказательства необходимых условий экстремума в простейшей задаче вариационного исчисления и задаче Лагранжа. Приложение II имеет самостоятельное значение. Здесь доказывается обобщенная версия теоремы о неявной функции и обсуждаются вопросы ее дифференцируемости и единственности. Затем на основании этой теоремы доказываются необходимые условия экстремума в конечномерных задачах с ограничениями типа равенств, неравенств и включений. Кроме того, в этом приложении приводится ряд утверждений, необходимых для понимания доказательства принципа максимума в упрощенной форме. Общая постановка задачи оптимального управления и доказательство принципа максимума для нее (необходимые для исследовательской работы) требуют большей подготовки. Но нам не хотелось бы ограничивать число тех, кто захочет освоить это доказательство лишь студентами математических факультетов университетов, и поэтому в Приложении II приводится минимальный свод сведений, необходимых для понимания доказательства принципа максимума в общем случае. Здесь также доказывается одна теорема существования, которая используется при решении ряда конкретных задач. В самом конце книги имеются задачи, к которым приведены ответы, а к некоторым даны указания к решению.
§ 1. Постановка задач и формулировка теорем Принцип максимума Понтрягина — необходимое условие минимума в задачах оптимального управления. Мы начинаем изложение с описания достаточно простого класса таких задач. 1.1. Упрощенная задача оптимального управления и ее частные случаи. Пусть —оо < to < t\ < +оо, U — непустое подмножество W} /:МхГх[/-ч1, р:МхМпх[/-^Г (точки R х W1 х U обозначаем (£,ж,г/), где t е R, х = (х\,.. ..., хп)т еШп, и= (щ,..., ur)T eU) и Xi Gln, г = О, I.2 Задача ti J(x('),u(-)) = f(t,x(t),u(t))dt —» min, x = </?(*, ж, гг), to x(to) = xo, x(ti) = xi, u(t) e U (P) называется задачей оптимального управления с закреплённым временем и закреплёнными концами, а если условие x(t\) = х\ отсутствует, то задачей со свободным (правым) концом. Обе задачи мы называем упрощёнными задачами оптимального управления, поскольку более общая ситуация (как уже говорилось) будет рассмотрена позже. Задача (Р) является незначительным упрощением задачи, рассмотренной в книге Понтрягина и др. (см. §6): там время t\ не предполагается фиксированным. Уточним постановку задачи, т.е. поясним, какие функции #(•), называемые фазовыми переменными (или переменными 1 О пространстве Ш.п и функциях на нем см. Приложение I. 2 Здесь х\ обозначает одновременно как первую координату вектора х е G Ш.п, так и вектор х\ GRn. Это не приведет к недоразумениям, так как из контекста всегда будет ясно, что имеется в виду.
§1. Постановка задач и формулировка теорем 13 состояния), и какие функции и(-) — называемые управлениями — рассматриваются здесь, и как понимается минимум в данной задаче. Совокупность всех непрерывных на отрезке [to, *i] вектор- функций х(-) со значениями в Rn обозначим C([to,ti],Rn) (если п = 1, то пишем просто C([£o>*i])). Это —банахово пространство с нормой М')\\с{[и>м]Дп) = max |х(£)|, c€[to,rij где x(t) = (xi(£),...,xn(£))T, a \x(t)\ = yjx\(t) + ... + xl(t). Введём ещё пространства РС([1оМ]Лш) и РС\[1ъМ\Лт)Х как совокупности соответственно всех кусочно-непрерывных вектор-функций со значениями в Rm и кусочно непрерывно дифференцируемых на отрезке [to>*i] вектор-функций со значениями в Rm. Задача (Р) рассматривается в пространстве г=.РС\%М]Лп) х PC([t0,ti],]Rr). Точнее говоря, пара функций (ж(-),гх(-)) называется допустимым управляемым процессом в задаче (Р) или просто допустимым процессом, если (x(.),«(-))ez и удовлетворяются все ограничения задачи, т. е. во всех точках * € [*o>*i] непрерывности и(-) выполняются равенство x(t) = = <p(t,x(t),u(t)) и включение u(t) Е U, и наконец, удовлетворяются граничные условия ж(^) = Х{, г = 0,1 (или только х(£о) = = хо, если задача со свободным концом). 1 Р — от слова piecewise — кусочный, состоящий из кусков.
14 §1. Постановка задач и формулировка теорем Допустимый процесс (я(-), ?/(•)) называется оптимальным процессом (или сильным минимумом) в задаче (Р), если величина J(x(-),u(-)) конечна и существует число е > 0 такое, что для любого допустимого процесса (ж(-),гх(-)), для которого выполняется неравенство J(s(-),«(.))> 7(2(-),6(-))-1 Если в (Р) ограничение u(t) Е U отсутствует (или, что тоже самое, если U = Мг), то задачу (Р) называют задачей Лагран- жа. Задачу Лагранжа будем сразу рассматривать и на минимум, и на максимум или, как говорят, на экстремум: ti J(x(-),u(-)) = f(t,x(t),u(t))dt —» extr, i = (p(t,x,u), to x(t0) = xq, x(ti) = xx. (Pi) Это задача с закрепленным временем и закрепленными концами. Если ограничение x(t\) = х\ отсутствует, то задача называется задачей со свободным правым концом, а если момент времени t\ заранее не фиксирован, то это — задача со свободным временем. Задачу Лагранжа традиционно рассматривают в банаховом пространстве W = ^(^0, ti],Rn)xC([t0,ti],Rr), где C1([to,ti],Rn) — банахово пространство всех непрерывно дифференцируемых на отрезке [io>*i] вектор-функций х(-) со значениями в Шп (если п = 1, то пишем C1([to,ti])) и нормой \\х(')\\с1([1оМ]Лп) = max(llx(0llc([to,*i№n)> ll*(-)llc7([to,ti],IR«))- 1 Если требуется максимизировать функционал J(x(-)fu(-)), то нужно рассмотреть задачу минимизации функционала — J(x(-),n(-)). Ясно, что решения этих задач совпадают, а их значения отличаются знаком.
§1. Постановка задач и формулировка теорем 15 Норма в W определяется так: 'A')iu('))\\w = = max(||x(Ollc([*o,*i],R")»-ll*(")lla([to,*i],R")» ll^COIIaato.ti]*^))- Пара (ж(-),гх(-)) называется допустимым процессом в (Pi), если (ж(-),гх(-)) G W, равенство i(t) = (p(t,x(t),u(t)) выполняется всюду на [*o»*i] и X(U) = Х{, г = 0,1 (или только x(to) = xq, если задача со свободным концом). Локальный экстремум в этом пространстве называют слабым экстремумом. Точнее говоря, допустимая пара (х(-),и(-)) е W называется слабым локальным минимумом (максимумом) в задаче Лагранжа, если величина J(x(-),u(-)) конечна и для некоторого е > 0 и любой допустимой пары (ж(-),гх(-)) такой, что ||(#(-),г/(-)) - (#(•)» ^('))llw < е, имеет место неравенство: J(x(.),u(-)) > J(x(-),fi(-)) №(•),«(•)) < J(^(-),S(-))). Задачу Лагранжа рассматривают не только на слабый, но и на сильный экстремум, когда близость производных фазовых переменных и близость управлений не учитывается: допустимая пара (¢(-),2(-)) Е W называется сильным минимумом (максимумом) в задаче Лагранжа, если для некоторого е>0и любой допустимой пары (ж(-),гх(-)) такой, что справедливо неравенство j(x(-)m-)) > т-)ж-)) ишм-)) < j(x(-),s(-)))- Частным случаем задачи Лагранжа (Pi) является простейшая задача вариационного исчисления: ti J(x(-)) = L(t,x(t),x{t))dt —» extr, x(*o) — #o> #(*i) — #ъ *o (ft)
16 §1. Постановка задач и формулировка теорем в которой интегрант L = L(t, ж, г/) — функция трёх переменных (если в задаче (Pi) положить f(t,x,u) = L(t,x,u) где t, х и и одномерны, ip(t,x,u) = и, то получаем задачу, равносильную Задача (Ро) рассматривается нами в пространстве C1([to,ti]). Локальный экстремум в этом пространстве называется слабым экстремумом, или подробнее: допустимая функция х(-) (т.е. функция х(-) G C1([to,ti]), которая удовлетворяет граничным условиям) является слабым (локальным) минимумом (максимумом) в задаче (Ро), если величина J(x(-)) конечна и для некоторого е > 0 и любой допустимой функции х(-) такой, что имеет место неравенство: «/(*(•)) ^ J(x(-)) №(•)) < J(x(-)))- При определении сильного минимума и максимума вместо ^(MiD берётся C([t0,*i]). Задача Лагранжа охватывает (помимо простейшей задачи) множество других, рассматриваемых в вариационном исчислении (изопериметрические задачи, задачи со старшими производными и др.). Первая задача вариационного исчисления (а именно задача о брахистохроне, обсуждаемая ниже) была поставлена в 1696 году Иоганном Бернулли (1667-1748), а затем Леонард Эйлер (1707-1783) и Жозеф-Луи Лагранж (1736-1813) построили теорию задач вида (Р) без ограничения на управления типа включения. Такие задачи описывают многие явления в механике, электродинамике, оптике, к ним сводятся разнообразные геометрические задачи и задачи из анализа. Благодаря всему этому вариационное исчисление стало одним из важнейших разделов математики. Однако многие проблемы управления технологическими процессами, инженерии и экономики таковы, что нельзя не учитывать ограниченность материальных, энергетических и других ресурсов, а также возможностей человека в проблемах управления или при его воздействии на силы природы.
§1. Постановка задач и формулировка теорем 17 Такая ограничительность выражается в математических постановках в виде ограничений типа неравенств (или включений) на управления. Это и привело к постановке задач вида (Р). Приведём два примера задач вариационного исчисления и оптимального управления, поставленных ещё в семнадцатом веке. Как было сказано, вариационное исчисление ведёт свою историю с задачи И. Бернулли о брахистохроне. В 1696 году в основном научном журнале того времени «Acta eruditorum» (основанном в 1682 г.) вышла заметка И. Бернулли, озаглавленная «Problema novum, ad cujus solutionem Mathematici invitatur» (Новая задача, к решению которой приглашаются математики), в которой был поставлен такой вопрос: «В вертикальной плоскости даны две точки А и В. Определить путь АМВ, спускаясь по которому под воздействием собственной тяжести, тело М, начав двигаться из точки А, дойдёт до точки В за кратчайшее время.» 1 Эта задача получила название задачи о брахистохроне — кривой наискорейшего спуска. Придадим этой задаче математическую формулировку. Для этого направим ось Ох, как обычно горизонтально, а ось Оу вертикально вниз. Поместим точку А в начало координат (0,0), а точка В пусть имеет координаты (xi,yi), х\ > 0, у\ > 0. Допустим, что у = у(х) — функция, график которой — путь, по которому движется тело М из точки А в точку В. Согласно закону Галилея его скорость в точке (х, у(х)) равна л/2ду{х), где д — ускорение силы тяжести. Значит, для прохождения пути ds от точки (х, у(х)) до точки (х + dx,y(x + dx)) потребуется время dt = / ds = v1+y (х).dx, у/2ду(х) у/2ду(х) и, следовательно, время, которое будет затрачено телом на преодоление всего х1 I 7Т> пути от А до В, равно j v1+y ^Х^х. Таким образом, мы приходим к задаче вида (Лэ) (множитель -4= можно, разумеется, отбросить): ^—-===—dx->mm, 2/(0) = 0, y(xi) = yi. (i) V2/W о Это простейшая задача вариационного исчисления. Она имеет тесные связи с механикой и оптикой. Необходимое условие экстремума для простейшей задачи вариационного исчисления было найдено Эйлером в 1732 году. (Итоги своих исследований по вариационному исчислению Эйлер подвел в монографии «Methodus inveniendi...», Geneva, 1744, переведенной на русский язык: «Метод нахождения кривых линий, обладающих свойствами максимума и минимума или решение изопериметрической задачи, взятой в самом широком смысле» М.Л.: 1 Цитируется по книге: И. Бернулли Избранные сочинения по механике. — М.-Л., Гл. ред. технико-теор. лит., 1937. с. 19-20.
18 §1. Постановка задач и формулировка теорем Гостехиздат, 1934). Оно получило название уравнения Эйлера. Простейшая задача вариационного исчисления охватывается, как мы видели, постановкой (Р), и уравнение Эйлера является частным случаем принципа максимума для этой задачи. Интересным парадоксом в истории математики является то, что первая задача, относящаяся собственно к оптимальному управлению и теоретическая база для которой (а именно — принцип максимума Понтрягина) была разработана без малого три века спустя после её постановки, обсуждалась в величайшем когда-либо из написанных научном труде — сочинении Исаака Ньютона (1643-1727) «Philosophiae Naturalis Principia Mathematika» (Математические начала натуральной философии или, как наиболее естественно было бы сейчас назвать это сочинение, «Математические основания физики»). Ньютон ставит вопрос: когда «тело, образующееся при вращении кривой вокруг оси при движении в упомянутой среде [...] будет испытывать меньшее сопротивление, нежели всякое иное тело вращения при той же высоте и наибольшей ширине.» 1 Формализация этой задачи зависит, естественно, от законов сопротивления среды. Ньютон представлял себе среду (он называл её редкой) состоящей из неподвижных частиц фиксированной массы га, являющихся абсолютно упругими шарами. Примем эту гипотезу и мы. Пусть тело вращения вокруг оси Оу движется в направлении обратном оси Оу (вниз) в описанной нами среде Ньютона со скоростью v. Элемент dx на оси Ох описывает в плоскости Oxz кольцо, элемент площади которого равен da = 2nxdx, и этому кольцу соответствует пояс dE на самом теле вращения. За время dt этот пояс вытеснит объём dV = 2-Kxdxvdt. Пусть р — плотность среды. Тогда число частиц, ударившихся о слой, равно N = -j^dV = p27T^xvdt. Подсчитаем силу dF, действующую на слой dE за время dt. Пусть участок ds наклонён к оси Ох. Отражаясь от dE, одна частица получает приращение импульса, равное ra(v2 — — vi) = — 2mvcos(p - п, где v = |vi| = |v2|, n —единичный вектор нормали к dE, а (р = arctg dy/dx — угол ds с горизонталью. В силу третьего закона Ньютона тело получает противоположное приращение импульса 2mv cos <р • п, а за время dt таких импульсов будет N, причём, в силу симметрии, компоненты импульса, ортогональные оси вращения, в сумме дают нуль, а осевая компонента суммарного приращения равна Nm2v cos2 <р = kxcos2 pdxdt, где к = 4pirv2. В силу второго закона Ньютона это выражение равно dFdt, отку- XI да dF = kxdx cos2 (/?, а общая сила равна F = к j i+u Jdx)* • ^аким образом, о заменив х на £, у на х и х\ на Т, приходим к следующей задаче оптимального 1 Цитируется по книге: Исаак Ньютон Математические начала натуральной философии. В собр. соч. акад. А. Н. Крылова, т. 5 — М.: Изд-во АН СССР, 1936.
§1. Постановка задач и формулировка теорем 19 управления: т А. ЗЛ. ■> min, х = и, х(0) = 0, х(Т) = xi, u(t) ^ 0. (ii) l + u2(£) о 1.2. Необходимые условия экстремума для простейшей задачи вариационного исчисления, задачи Лагранжа и принцип максимума для упрощенной задачи оптимального управления. Здесь мы формулируем необходимые условия минимума — принцип максимума Понтрягина — для упрощенной задачи оптимального управления, а также необходимые условия слабого экстремума в задаче Лагранжа и простейшей задаче вариационного исчисления. Пусть А0 G R и р(-): [t0,*i] -> (Мп)'. Функция С(х(-),и(-),\) = L(t,x(t),x(t),u(t),p(t),X0)dt, to где (интегрант) Ь(*,а;,а;,гх,р,Ло) = \of(t,x,u) + р- (х - </?(*,ж,гх)) и А = (Ао,р(-))» называется функцией Лагранжа задачи (Р). Число Ао и вектор-функция р(-): [*o>*i] ~* (^п)/ называются множителями Лагранжа, а А — набором множителей Лагранжа. Функцию H(t,x,u,p,\o) =p-<p(t,x,u) — \of(t,х,и) называют функцией Понтрягина задачи (Р). Далее, если фиксирована пара (ж(-), 2(-)), то для сокращения записи мы используем обозначения: Lx(t) = Lx(t,x(t),x(t),u(t),p(t),X0) и аналогично для частных производных L по х и и, fx(t) = fx(t, x(t), u(t)), (px(t) = (fix(t, x(t), u(t))
20 §1. Постановка задач и формулировка теорем и аналогично для частной производной (р по и. Теорема 1 (необходимые условия экстремума в простейшей задаче вариационного исчисления, задаче Лагранжа и упрощенной задаче оптимального управления). (a) Уравнение Эйлера для простейшей задачи. Пусть функция х(-) допустима в задаче (Pq), функции L, Lx и Lx непрерывны в окрестности кривой {(t,x(t),x(t))|tG[t0,*i]}. Тогда если х(-) — локальный экстремум в (Pq), то L±(') G Cl([to,ti\) и для. всех t е [*o>*i] выполнено уравнение Эйлера: --Lx(t) + Lx(t) = 0. (la) at В задаче со свободным правым концом выполняется еще и условие трансверсальности: Lx(h) = 0. (lb) (b) Уравнения Эйлера-Лагранжа для задачи Лагранжа. Пусть пара (х(-),и(-)) допустима в задаче (Pi), функции f, fx, fu, (р, (px и (pu непрерывны в окрестности кривой {(t,x(t),u(t)) 11 e [i(b*i]}. Тогда если пара (x(•), u( •)) —- локальный экстремум в (Pi), то существуют множители Лагранжа Ао Е R и р(-) Е C1([to,ti], (Мп)'), не равные одновременно нулю, такие, что Lx(-) Е tf^t^t^W1), для всех t Е [*o»*i] выполнено уравнение Эйлера по х: --Lx(t) + Lx(t) = 0 <* р =-p(px(t) + \ofx(t) (2а) at и уравнение Эйлера по и: Lu(t) = 0 & p(t)fiu(t) = \ofu(t). (2b)
§1. Постановка задач и формулировка теорем 21 В задаче со свободным правым концом Ло = 1 и выполняется еще условие трансверсальности: £±(*i) = 0 & p(*i) = 0. (2с) (с) Принцип максимума Понтрягина для упрощенной задачи оптимального управления. Пусть пара (х(-),и(-)) допустима в задаче (Р), функции Л Л, ц> и <рх непрерывны на множестве G xU, где G — окрестность кривой {(£,#(£)) | t Е [*o>*i]}- Тогда если (ж(-),?/(•)) — сильный минимум в задаче (Р), то существуют множители Лагранжа \о е Ш и р(-) е Е PC1([to)*i])(Kn)/), яе равные одновременно нулю, такие, что Ло ^ 0, для всех t Е [io>*i] выполнено уравнение Эйлера по х: --L±{t) + Lx(t) = 0 & р =-piflx(t) + Xofx(t) (За) и для всех точек t Е [*o>*iL в которых функция и(-) непрерывна, выполняется условие минимума по и: mmL(t,x(t),x(t),v,p(t),\0) = L(t,x(t),x(t),u(t),p(t),\0) vEU (36) или (что то же самое) условие максимума: maxH(t,x(t),v,p(t),Xo) = H(t,x(t),u(t),p(t),X0). (36') vEU В задаче со свободным правым концом Ло = 1 и выполняется еще условие трансверсальности: Lx(h) = 0 & p(ti) = 0. (Зс) Условие (ЗЬ;) в совокупности с (За) и называют, собственно, принципом максимума Понтрягина. Сделаем несколько замечаний, связанных с материалом этого параграфа.
22 § 1. Постановка задач и формулировка теорем 1) В классическом вариационном исчислении наряду с простейшей задачей важную роль играет задача Больца: ti L(t, x(t), x(t))dt + l(x(t0), x(ti)) -> extr, (P4) to где функция L определяется как и в простейшей задаче (Ро)> а / — функция двух переменных £о и £i. Данная задача рассматривается в том же пространстве функций, что и задача (Ро), и аналогично определяются понятия допустимой функции и слабого локального экстремума. Теорема 2 (необходимые условия экстремума в задаче Больца). Пусть функция х(-) допустима в задаче (Ра), функции L, Lx и Lx непрерывны в окрестности кривой {(t,x(t),x(t)) | t G [*o>*i]}> a функции I, l£0 и 1^ непрерывны в окрестности точки (x(to),x(ti)). Тогда если х(-) — локальный экстремум в (Ра), то Lx(-) G С1([*о»*i]) и для всех t Е [*o>*i] выполнено уравнение Эйлера: --Lx(t) + Lx(t) = 0 и условия трансверсальности: Li(U) = (-1)¾. « = 0,1, где 1^ = l^(x(t0),x(ti)), г = О,1. 2) Отметим два первых интеграла уравнения Эйлера (т. е. такие функции, которые постоянны на решениях данного уравнения) для простейшей задачи вариационного исчисления.
§1. Постановка задач и формулировка теорем 23 1. Если L не зависит от х, то имеется очевидный интеграл Lx(t,x(t)) = const, который называется интегралом импульса. 2. Если L не зависит от £, то уравнение Эйлера имеет интеграл Lx(x(t),x(t))x(t) — L(x(t),x(t)) = const, который называется интегралом энергии. Для доказательства (в предположении, что х(-) существует) надо продифференцировать по t левую часть равенства и убедиться, что эта производная есть тождественный нуль. 3) Традиция обозначать в экстремальных задачах независимую переменную через х идет от Эйлера, который много занимался геометрическими задачами. Лагранж обозначал независимую переменную через £, так как в основном изучал задачи механики, и независимая переменная — это время. В общих утверждениях мы будем придерживаться лагранжевых обозначений. Рассматривая конкретные примеры, используем (отдавая дань традиции) и те, и другие обозначения.
§ 2. Принцип Лагранжа Выписанные выше необходимые условия в простейшей задаче вариационного исчисления, в задаче Больца, в задаче Лагранжа и в задаче оптимального управления находятся в соответствии с общим принципом — принципом Лагранжа — получения необходимых условий экстремума в различных экстремальных задачах. Нам представляется полезным познакомить читателя с концепцией этого принципа. В 1797 году Лагранж высказал идею, касающуюся нахождения решений в гладких конечномерных задачах с ограничениями типа равенств: «Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно прибавить к функции, о которой говорилось, функции, задающие уравнения связи, умноженные на неопределённые множители, и искать затем максимум и минимум построенной суммы, как если бы переменные были независимы. Полученные уравнения, присоединённые к уравнениям связи, послужат для определения всех неизвестных.» Эта идея оказалась универсальной, она распространяется на широкий класс задач, и фактически все известные на сегодняшний день необходимые условия экстремума соответствуют принципу Лагранжа. Продемонстрируем это на следующей задаче оптимального управления достаточно общего вида: ti /o(t, x(t), u(t))dt + ^o(*o, я(*о), h,x(ti)) -> min, to J»(x(-),w(-),*o,*i) =
§2. Принцип Лагранжа 25 fi(t,x(t),u(t))dt + ipi(to,x(to),ti,x(ti)) ^ О, to 1 ^ г ^ га/, Jt(x(-)^(-),*o,*i)= (Р) /i(t, x(t), u(t))dt + ^(t0, я(*о), *1, z(*l)) = О, to га/ + 1 $J г $J га, i = <p(£, ж, г/), гг(£) ё С/1. Здесь С/ — произвольное подмножество Mr, /¾: R х W1 х [7 —» -> R, ^ : MxMnxMxMn -» R, г = 0,1,..., га, <р: RxRnxU -> W1 и U е int А, г = 0,1, где Д — отрезок числовой прямой. Задача (Р) рассматривается в пространстве Н = PC1 {A,Rn) х РС(Д,МГ) xRxK. Иначе говоря, элемент (управляемый процесс) f = (x(.),w(-)»*o,*i)GS называется допустимым в задаче (Р), если он удовлетворяет всем ограничениям задачи. Говорят, что управляемый процесс £ = (£(•), u(-)»*o,*i) доставляет сильный минимум в задаче (Р), если Jo (О конечно и существует такое е > 0, что для любого допустимого элемента £ = (a;(-),T/(-),£o>*i)> удовлетворяющего условию тах(||ж(.) - х(')\\с([гоМ]п\?оМ}у 1*о - *о|, 1*1 - *i|) < е, выполняется неравенство МО > Jo(0- !Эти соотношения должны выполняться во всех точках непрерывности управления и(-).
26 §2. Принцип Лагранжа Если U = Мг, то задачу (Р) называют задачей Лагранжа. Она рассматривается в пространстве Si = Сг(А,Жп) х C(A,Rr) хКхК. Локальный минимум в этом пространстве называют слабым локальным минимумом. Далее рассуждаем эвристически, руководствуясь указаниями Лагранжа, но трактуя их несколько шире. Составим функцию Лагранжа задачи (Р), считая, что это сумма минимизируемого функционала и всех функций, задающих уравнения связи, умноженных на неопределенные множители. При этом связь х — ip(t,x,u) = 0 воспринимаем как континуум равенств, индексированных параметром t, и тогда умножение каждого из этих равенств на множитель и последующее «суммирование» надо понимать как интегрирование. Таким образом, функция Лагранжа задачи (Р) имеет вид: £(&Р(0, A) = Y,*iMt) + J P(t) • (i(t) - <p(t,x(t),u(t)))dt - i=0 t0 ti L(t, x(t), i(t), u(t),p(t), \)dt + /(t0, x(t0), *i, z(*i), A), *0 где A — (Aq, ..., Am), m L(t, x, i, гх,р, A) = ]P Ai/i(t, ж, гх) + p • (i - </?(*, x, u)) i=0 и m /(t0, Ж (to), ti, x(ti), A) = ^ Хг'фг (t0, x(t0), *1, z(*l)) . г=0 Теперь ищем (в соответствии с указаниями Лагранжа) необходимые условия минимума этой функции «как если бы переменные были независимы». Наши переменные — это #(•), гх(-), to и t\. Таким образом, необходимо рассмотреть следующие задачи:
§2. Принцип Лагранжа 27 (а) С(х(-),Щ-),?оЛиР(-)А) -> min (по х(-))\ (/3) £(£(•), w(-),*o,*i,p(-)»л) ->min, u(t)eU\ (7) £(£(•),S(-),£0,£bp(-), A) ->min, t;GintA, г = 0,1. Запишем эти задачи более подробно. Задача (а) выглядит так: tl L(t, x(t), i(t), w(t), A)di + /(to, a;(to)»*i» x(ti), A) —» min (no x(-)) V to и представляет собой задачу Больца, рассмотренную выше. Необходимые условия минимума здесь состоят в том, что должно выполняться уравнение Эйлера --Lx(t)-Lx(t) = 0 для всех t G [to, ti] и условия трансверсальности Lx(U) = (-1)¾^ где lx(ti)y i — 0,1,— производные функции / соответственно по второму и четвертому аргументам в точке (*o>#(*o)>*i>#(*i)> А). Задача (/3) имеет вид tl L(t,£(t),ir(t),^(t),p(t), A)dt —» min, w(t) G [/ V to и представляет собой так называемую простейшую задачу оптимального управления. Необходимые условия (они же оказываются и достаточными) здесь также выводятся без труда и состоят в том, что min L(t, x(t), x(t), v,p(t), A) = L(t, x(t), x(t), u(t),p(t), A) в точках непрерывности u(-).
28 §2. Принцип Лагранжа Если U = W (т.е. рассматриваем задачу Лагранжа), то задача (/3) есть также задача Больца и необходимые условия мини- мума заключаются в том, что Lu(t) = 0. Необходимые условия минимума в задаче (7) — это просто равенство нулю производных функции Лагранжа по to и t\ со- ответственно в точках to и t\. Наконец, следует отметить, что так как исходная задача на минимум, то необходимо Ао ^ 0 и если в исходной задаче присутствуют ограничения типа неравенств (^ 0), то необходимо множители Лагранжа при них неотрицательны и выполнены условия дополняющей нежесткости. В нашем случае это означает, что \ ^ 0 и \iJi(£) = 0, 1 ^ г ^ га/. Задачи с ограничениями типа неравенств рассмотрены в Приложении П. Объединяя полученные соотношения и учитывая структуру L, приходим к тому, что если £ = (#(•), й(-), to, ti) доставляет сильный минимум в задаче (Р), то необходимо выполнены: (a) уравнение Эйлера по х: -—Lx(t) + Lx(t) = 0 <* р =-p(px(t) + \0fx(t); (b) условия трансверсальности: LA(U) = (-1)%{иь г = 0,1 & & P(*t) = (-1)Чг(*0> * = 0,1; (c) условие минимума по и: minL(t, x(t), x(t),v,p(t), A) = L(t, x(t), x(t), u(t),p(t), A) vEU в точках непрерывности гх(-); В задаче Лагранжа (с) заменяется на (с') условие минимума по и в дифференциальной форме: Lw(t,x(t),£(t)^(t),p(t),A) = 0;
§2. Принцип Лагранжа 29 (d) неотрицательность множителей Лагранжа и условия дополняющей нежесткости: А^ ^ 0, 0 ^ г ^ га/, и £ А,4(0 = 0; г=1 (e) условия стационарности по концевым значениям: Cti(l\) = 0, 4 = 0,1. Оказывается, что выписанные условия и есть основное содержание точного результата. Другими словами, справедлива следующая теорема, доказательство которой содержится в [АТФ]. Теорема (Принцип Лагранжа для задачи (Р)). 1) Пусть £ = (£(•), ?x(-),£o>*i) — допустимый элемент в задаче Лагранжа, функции fi, 0 ^ г ^ т, и <р и их частные производные по х и и непрерывны в окрестности кривой {(t,x(t),u(t)) | t G А}, а функции ф{, 0 ^ г ^ т, непрерывно дифференцируемы в окрестности точки (io>#(*o)>ti>#(*i))- Тогда, если £ = (ж(-),гх(-)>*o>*i) —локальный минимум в этой задаче, то существуют множители Лагранжа Ао G R и р(-) G C1([to,ti], (М71)'), яе равные одновременно нулю, такие, что выполнены условия (a), (b), (с'), (d) и (е). 2) Пусть £ = (£(•), w(-),£o>*i) — допустимый элемент в задаче оптимального управления, функции fi, 0 ^ г ^ га, и <р и их частные производные по х непрерывны на множестве GxU, где G окрестность кривой {(£,#(£)) 11 G А}, а функции 'Фи 0 ^ г ^ т, непрерывно дифференцируемы в окрестности точки (to,#(£())>*i>#(ti)). Тогда если £ = (х(-),и(-),to,ti) — оптимальный процесс в этой задаче, то существуют множители Лагранжа Ао G G R и р(-) G PC1([to,ti], (Мп)'), не равные одновременно нулю, такие, что выполнены условия (а), (Ь), (с), (d) и (е).
§ 3. Решения задач Здесь мы хотим продемонстрировать принцип Лагранжа как эффективный метод исследования задач на экстремум, решив некоторое количество задач, которые были поставлены в разные времена и часть из них сыграла важную роль в истории нашей науки. Все задачи решаются единообразно. Сначала выписывается формализованная постановка задачи. Затем применяется принцип Лагранжа, т. е. в соответствии с ним выписываются необходимые условия экстремума, и при этом мы действуем формально: не обращаем внимание на то, выполняются или нет те или иные требования сформулированных ранее теорем. Далее, анализируя полученные соотношения, находим функцию, которая им удовлетворяет. После этого проверяем, что найденная функция действительно является решением поставленной задачи. 1. Аэродинамическая задача Ньютона 1. Формализация (см. §1): ^тт —> min? х = и, х(0) = 0, x(ti) = х\, и^ О, 1 + гх2 (*) v } v } о где х\ > 0. Это то, что было названо выше упрощенной задачей оптимального управления. 2. Принцип Лагранжа. Функция Лагранжа имеет вид: ti С(х(-),и(-),\) = L{t,x{t),x(t),u{t),p(t), X0)dt, О где L(£,x,£, г/,р,А0) = А0£/(1 + и2) +р(х - и) и А = (Ао,р(-))- Принцип Лагранжа заключается в том, что должно выполняться уравнение Эйлера по х: -—LA(t) + Lx(t) = 0 & -р = 0 & р = const (i)
§3. Решения задач 31 и условие минимума по и: min ( = — ри ) = ^0/ ч — рй(£). (ii) 3. Анализ. Проверим,что Ло ф 0. Если Ло = 0, то необходимо р ф о, так как множители Лагранжа не могут быть все нулевые. Но если р ф 0, то из (ii) следует, что u(t) = 0 и тогда x(ii) = = J u(t) dt = 0 в противоречие с предположением, что #i > 0. о Итак, Ло ф 0, и мы можем считать, что Ло = I1. Отметим еще, что р < 0. Действительно, если р ^ 0, то при любом t ^ 0 функция г/ —» f(t,u) = £/(1 + г/2) - рг/ монотонно убывает и поэтому соотношение (ii) не может выполняться. Легко видеть, что (при фиксированном р < 0) для малых t функция /(£,•) достигает минимума в нуле, и что это происходит до того момента т, когда значение в нуле становится равным второму, положительному минимуму этой функции, который достигается в точке и(т) > 0 (под и(т) понимаем и(т + +0)). Таким образом, г определяется из условий: fu{r,u(r)) = 0 и /(т,й(т)) = /(т,0) = г, что приводит к уравнениям: (1 + гг(т))^ I + гг(т) Подставив одно из уравнений (iii) в другое, убеждаемся, что г£(т) = 1, г = —2р. После момента г (момента излома управления) управление определяется как единственный корень уравнения fu(t,u) = 0, из которого следует, что р(1 + и2)2 р /1 0 зА '-V- ;tb+4 <1V) 1 Множители Лагранжа определяются с точностью до ненулевого сомножителя, и поэтому один из них может быть тем или иным способом нормирован. Эти замечанием будем пользоваться и в дальнейшем.
32 §3. Решения задач При этом dx dx dt dt — — = и— du dt du du -? (-- + 2u + 3us 2 \ и Интегрируя это уравнение с учетом того, что х(т) = 0 (так как u(t) = 0 для t е [0, г) и х(0) = 0) и и{т) = 1, приходим к семейству решений в параметрической форме: t = ~ ( - + 2u + us 2 \и р<0. Константа р определяется из условия x(t\) = х\. Эту кривую называют кривой Ньютона. (Рис. 1). Убедимся, что эта кривая доставляет абсолютный минимум в задаче. Пусть х(-) — допустимая функция в исходной задаче, т. е. она кусочно непрерывно дифференцируема, х(0) = 0 и x(ti) = х\. Тогда в силу (ii) (Ло = 1) rrWpi(^i + u\t) —pu(t). Интегрируя это неравенство с учётом того, что Рис. 1. Задача Ньютона. x(t) dt— x(t) dt = x\, V о 0 получаем требуемое: ti о tdt l + x2(t) > ti 0 tdt Y+¥(t)
§3. Решения задач 33 Ответ. Решение задачи Ньютона равно нулю до некоторого момента г, определяемого граничным условием на правом конце, а далее оно идет по кривой Ньютона. 2. Задача о брахистохроне 1. Формализация (см. §1): XI О -^—-==—dx->min, у(0) = 0, y(xi) = уь (V2) Vy(x) где ось у направлена вниз. По виду это простейшая задача вариационного исчисления, однако у подынтегральной функции есть особенность в нуле и условия теоремы 1 п. 2.2 тем самым не выполняются. Тем не менее, как уже говорилось, будем действовать формально. 2. Принцип Лагранжа. Поскольку интегрант L = v J не зависит явно от х, то уравнение Эйлера имеет интеграл энергии (см. с. 23): су L — y'Lyt = const => у(1 + у' ) = С\. 3. Анализ. Из последнего уравнения следует, что Сделаем замену 2 Г СХ у = Cisiir- = -^-(1 -cost), г е (0,2тг). Тогда yf = ctg ^ и так как ^ = С\ sin | cos ^, то dx dx dy 1 . г г . 2 г — = — — = -r-rCi sm - cos - = d smz - , dr dy dr ctg ^22 2 т.е. x = ^-(r - sinr) + (¾.
34 §3. Решения задач Таким образом, учитывая, что у(0) = 0, получаем однопара- метрическое семейство циклоид У = 2"(1 ~ cosr)> х = -^(т ~ sinr)> (i) где константа С находится из условия: у(х\) = у\, х\ > О и у\ > 0. Ясно, что через точки (0,0) и (#i,yi) проходит единственная циклоида нашего семейства (см. рис. 2). Обозначим эту функцию у(-) и покажем, что она есть решение задачи. Это можно сделать разными способами. Проще всего воспользоваться известной формулой Вейерштрасса (см. [ИТ], с. 326). Семейство (i) однозначно покрывает весь четвертый квадрант, и тем самым определяется функция наклона центрального поля и(х,у). Если у(-)— любая допустимая функция для задачи (7¾) (т.е. у(-) G С1 [0,a;i], у(0) = 0 и у(х\) = yi), то в силу основной формулы Вейерштрасса XI J(y(')) - J(y(')) = £(x,y(x),u(x,y(x)),y'(x))dx ^ 0, V о ибо вследствие выпуклости интегранта L по у' функция Вейерштрасса £(я, у, и, у') = L(x, у, у') - L(x, у, и) - (у' - u)Ly> (ж, у, и) всюду неотрицательна. Можно также доказать, что у(-) доставляет абсолютный минимум в задаче (7¾) методом «принудительного ограничения», рассмотрев задачу оптимального управления, добавляя к этой задаче дополнительное ограничение \u(t)\ ^ ^ А. Применяя принцип максимума (доказав предварительно существование решения), а затем переходя к пределу при А —» оо, получим, что у(-) — решение задачи. Более подробно на этом останавливаться не будем. У (хъш) Рис. 2. Задача о брахи- стотроне.
§ 3. Решения задач 35 Ответ. Дуга арки циклоиды У = "2 (1 - cost), х = —(т - sin г), проходящая через точку (xi,yi), доставляет абсолютный минимум в задаче (7¾). 3. Задача Дидоны Эта задача связана с древней легендой о царице Дидоне, которой было позволено взять себе участок земли, примыкающей к берегу моря, и который можно окружить бычьей шкурой. Ди- дона разрезала шкуру на тонкие полоски, связала их в один тонкий ремень и, окружив им значительную территорию, заложила на ней город Карфаген (подробнее см. [АТФ], с. 12-16). 1. Формализация. Предполагая, что «ремень» представляет собой график некоторой функции, задача может быть формализована следующим образом: хо хо y(x)dx —>• max, Wl + y^x)dx = I, J (Рз) -хо -хо ч ' у{-х0) = у(х0) = О, у > 0. Задачу о максимуме площади, которую можно охватить кривой заданной длины, называют изопериметрической. Впоследствии так стали называть задачи вида: Jq(x(-)) —» min(max), Ji(x(-)) = а{, г = 1,... ,ra (и еще некоторые граничные условия), где Ji — интегральные функционалы простейшей задачи вариационного исчисления. Именно такую задачу Эйлер в своем труде «Metodus inviniendi... » называет «изопериметрической задачей, взятой в самом широком смысле». 2. Принцип Лагранжа. Для интегранта L = \0y + \Wl + y'2 выполнено уравнение Эйлера: -TxLyl+Ly = ° * Тх [AitttF '= °
36 §3. Решения задач 3. Анализ. Если Ло = 0, то Ai ф 0 и из уравнения Эйлера следует, что у* = const. Отсюда, в силу граничных условий, получаем, что у(х) = 0 — единственная экстремаль и при этом необходимо I = 2#о. х Рис. 3. Задача Дидоны. Пусть 2хо < / ^ 7гхо. Тогда Ао ф 0 и можно считать, что Ао = —1. Интегрируя уравнение Эйлера с учетом граничных условий, также приходим к единственной экстремали: у(х) = b- yb2 + xl - х2, которая есть окружность радиуса y/b2 + х^ с центром в точке
§ 3. Решения задач 37 (0,6), где Ь ^ 0 (см. рис. 3) и Ь находится из изопериметриче- ского условия: хо хо yjl + y2(x)dx=yjb2+x dx ■хо -хо yjb2 + Xq — X2 = 2\/b2 + Хп arcsin —. = I. Для того, чтобы доказать, что полученная кривая есть действительно решение задачи, можно и здесь воспользоваться методом «принудительного ограничения», т.е. рассмотреть задачу (7¾) с дополнительным ограничением \у'\ ^ А, а затем устремить А к бесконечности. При каждом А решение задачи существует (согласно теореме существования из Приложения II) и, как нетрудно убедиться, представляет собой симметричную относительно оси у кривую, которая на некотором отрезке —хо,— h] (h > 0) есть прямая х—> А(х + хо), затем эта прямая гладко сопрягается с окружностью, и потом, снова прямая х —» А(хо - х) на отрезке [h,xo] (см. рис. 3). Переходя к пределу при А —» оо, получаем Ответ. Если 2#о < I ^ 7гхо^ то найденная выше кривая есть решение задачи. Если I > пх^, то получаем нестандартное решение: полуокружность, поднятая на высоту (I - тпг0)/2. 4. Задача о минимальной поверхности вращения Она заключается в том, чтобы среди функций, графики которых лежат в верхней полуплоскости, соединяя две заданные точки, найти ту функцию, график которой при вращении вокруг горизонтальной оси образует поверхность минимальной площади. 1. Формализация. Далее мы рассматриваем частный случай этой задачи, когда точки находятся на одной высоте. Тогда за-
38 § 3. Решения задач дача формализуется следующим образом: to x(t)y/l + x2(t) dt -> min, x(t)^0, x(±t0) = h, (P4) ■to где to, h — положительные числа. Перепишем эту задачу как задачу оптимального управления с фазовыми ограничениями и (для того, чтобы гарантировать существование) с принудительным ограничением на управление: to x(t)y/l + u2(t)dt —» min, -to x = u, \u(t)\^A, x(t) ^ 0, x(±t0) = h. (i) Параметр А будем выбирать достаточно большим и в последующем перейдём к пределу при А —» оо. Решение задачи (i) (которое существует, см. Приложение II) обозначим (ж(•),{?(•)). 2. Принцип Лагранжа (см. теорему 4 §6). Функция Лагран- жа имеет вид: £((х(-),«(-)),А) = to to (\0x(t)y/l + u2(t)+ p(t)(x(t) - «(*))) dt - x(t) djiit). —to —to Здесь /i(-) — неубывающая ограниченная функция, непрерывная слева, порождающая меру, носитель которой сосредоточен там, где фазовая переменная х(-) равна нулю, р(-) —функция ограниченной вариации и Л — набор множителей Лагранжа, состоящий из неотрицательного числа Ао и функций р(-) и //(•). Принцип Лагранжа — это уравнение Эйлера: -p(t) + Аоy/l + u2{t) - dn(t) = 0 <* ^ p(t) = p(-t0) + Ао y/l + u2(t)dt - /i(t) (И) ■to
§3. Решения задач 39 и условие максимума max if(t,x(-),iz,p(t),Ao) = H(t) = const = с, (iii) \u\^A где #(£,x,г/,p,Ло) = p^ — \$x\/Y+u2. 3. Анализ. Легко понять, что Ао ф 0. Действительно, пусть Л0 = 0. Тогда в силу (iii) u(t) = Asignp(t), а в силу (и) функция р(-) не возрастает. Поэтому, если р(—*о) < 0» то р(*) < 0 Для всех t и, следовательно, й(£) = —А. Таким образом, функция х(-) строго монотонно убывает, что несовместимо с условием x(±to) = h. Если же р(—*о) > 0, то в силу (ii) и (iii) траектория х(-) не попадает на границу фазового ограничения и, значит, p(t) = р(—to) > 0 и тем самым w(t) = А, что снова несовместимо с условием x(±to) = h. Если p(-to) = 0, то в силу (iii) с = = 0, тогда р(-) = 0, что невозможно, так как все множители Лагранжа окажутся нулевыми. Итак, Ао ф 0 и поэтому будем считать, что Ао = 1. Выражение для Н(х,р) = тзх(ри — ху/1 + и2) легко найти: h(x,p) = {~^EZ: если S^(rf^)'X^0; [-x\/l + А2 + \р\А, в остальных случаях. Рассмотрим два типа экстремалей, отвечающих случаям с < 0 и с ^ 0. Если с < 0, то из выражения для Н(х,р) получаем, что x(t) > 0 для всех t, и эта функция удовлетворяет уравнению х = J^ — 1. Данное уравнение интегрируется подстановкой х = cosh г,1 что с учётом граничных условий приводит к однопараметрическому семейству экстремалей (цепных линий) x(t) = cosh^. Поверхности вращения, образуемых цепными линиями называются катеноидами. 1 sinh, cosh, tanh — обозначения для гиперболического синуса, косинуса и тангенса соответственно.
40 §3. Решения задач хк о h r = t0-% Рис. 4. Задача о минимальной поверхности вращения. Эти экстремали двукратно покрывают внутренность угла ^ > к, где к = sinh£o, а £о > 0 является решением уравнения tanh£ = £-1. (При этом можно проверить, что кривая х = = sinht касается прямых х = ±Ы и непосредственный подсчет даёт к = 1.5088...). Таким образом, если j- > к, то через точки (±£о,Л) проходят две экстремали, из которых одна не пересекает сторон угла (производная этих экстремалей не превосходит к), а другая касается этого угла и значит, содержит сопряжённые точки. (Во всём этом читатель без труда разберётся сам, но, если ему этого не захочется, он может прочитать об этом в книге [ИТ], с. 427-430). Таким образом, подозреваемой на • экстремум может быть лишь первая экстремаль. Но, повторимся, она не идёт по фазовому ограничению и не имеет (если \А\ > к) участков, где её производная равна \А\. Однако, для любой пары точек (±to,h), лежащих вне угла (т.е. когда j- < к), решение существует. Значит, это решение соответствует с ^ 0. Опишем экстремали. Из условия максимума для Н нетрудно понять, что для этих экстремалей \u(t)\ = А. В этом случае траектория х(-) на отрезке [-to, -г], где г = to — h/A, удовлетворяет уравнению х = —А. На отрезке [—т,т] траектория х(-) идет по границе фазового ограничения, т.е. x(t) = 0, и, на отрезке [г,to] удовлетворяет
§3. Решения задач 41 уравнению х = А (см. рис. 4). При А —» оо соответствующая поверхность вращения стремится к двум дискам радиуса /г, а значение минимизируемого функционала стремится к h2. Осталось провести «синтез решений» при фиксированном to. Ответ. Пока j- < к (единственным) решением будут два диска. Подсчёт показывает, что при k ^ j- < к\ = 1.8950... площадь двух дисков будет меньше площади соответствующего катеноида, при j- = k\ обе площади будут равны (т. е. задача имеет два решения), а при j- ^ к\ единственным решением будет катеноид. 5. Простейшая задача о быстродействии Задача заключается в том, чтобы тележку, которая движется прямолинейно без трения по горизонтальной поверхности и которая управляется внешней силой, изменяющейся в заданным пределах, остановить в определенном положении за кратчайшее время. Эта задача хорошо известна и разобрана во многих учебниках по теории оптимального управления (см., например, [ПБГМ], [Бол], [АТФ]). 1. Формализация. Пусть т — масса тележки, хо — ее начальная координата и г>о — начальная скорость. Внешнюю силу (силу тяги) обозначим через и, а текущую координату тележки через x(t). По закону Ньютона тх = и. Ограничение на тягу зададим в виде и е [^1,¾]. Без ограничения общности можно считать, что и\ = —1, щ = 1 и т = 1. Это приводит к следующей формализации задачи: Т —» min, mx = и, \и\ ^ 1, , (7¾) ж(0) = ж<ь x(0) = vo, ж(Г) = ж(Г) = 0, или в стандартной форме задачи оптимального управления (обозначая хо = £i, vo = £2)' Т —» min, х\ = Х2, Х2 = и, \и\ ^ 1, *i(0) = £1, х2(0) = &, XI (Г) = х2(Т) = 0.
42 §3. Решения задач 2. Принцип Лагранжа. Функция Лагранжа имеет вид С = Pl(±i - Х2) +Р2(^2 - и) ) dt+ О + Л0Г + Ai(xi(0) - 6) + Л2(х2(0) - 6) + A3xi(T) + А4х2(Г). Принцип Лагранжа приводит к соотношениям: a) уравнение Эйлера для L = pi(±i - х2) + р2(х2 - и): -—L±i+Lx% = О, г = 1,2 =>р! = О, р2 = -р\ =>P2(t) = Ct+d- b) условия трансверсальности по х для / = XqT + Ai(#i(0) — -6) + А2(х2(0) -6) + A3xi(T) + А4х2(Г): Pi(0) = Ab р2(0) = А2, pi(T) = -A3, р2(Т) = -А4; c) условие минимума по и: mm(-p2(t)u) = -p2(t)u(t) => u(t) = signp2(t) при p2(t) ф 0; d) стационарность по Г: Ст = 0 => Ао+Аз£1(Т)+А4±2(Т) = 0. Учитывая, что хг(Т) = 0, А4 = -р2(Т), р2(Т)и(Т) = |р2(Т)|, получаем Ао = |р2(Г)|. 3. Анализ. Если допустить, что Ао = 0, то р2(Т) = 0, причем |р2(£)| ф 0 (ибо иначе все множители Лагранжа были бы нули). Значит, p2(t) = C(t — Т), a u(t) = +1, либо u(t) = —1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением 6 = —\/26, если 6 ^ 0> и 6 — \/—26» если 6 ^ 0- Если же 6 и 6 не связаны этим соотношением, то Ао ф 0 и полагаем Ао = 1. Тогда из d) следует, что |р2(Т)| = 1, т. е. p2(t) равно либо p2{t) = C(t - Г) + 1, либо p2(t) = C(t — Т) — 1. Этим возможностям соответствуют такие управления: u+(t) = —1, если 0 ^ t ^ т, и u+(t) = 1, если т <t ^Т, и г£~(£) = 1, если 0 ^ t ^ т, и гГ~(£) = —1, если т <t ^Т. Для тех значений £, где гх(£) = 1, х2 = 1 => х\ — t + + C'=>x1 = £ + C't + C" = £ + C.
§3. Решения задач 43 Рис. 5. Задача быстродействия. Аналогично получаем, что для тех значений £, для которых u(t) = — 1, фазовая траектория — кусок параболы Это определяет движение траекторий по фазовой плоскости, изображенных на рис. 5. Покажем, что найденное решение х(-) = = х±(-), отвечающее заданной начальной точке (жо>^о)> Дей~ ствительно доставляет решение задачи (7¾). Предположим, что некоторая функция х(-) определена на отрезке [О,Г], имеет кусочно непрерывную вторую производную и х(0) = ж0, ЗД = vo, x(f) = x\f) = 0, причем f ^ Т. При Г < Т мы доопределим #(•), положив x(t) = 0 при t G [f,T]. После этого обе функции х(-) и х(-) будут определены на одном и том же отрезке [О, Т] и будут иметь одинаковые граничные условия х(0) = х(0) = ж0, х(0) = х(0) = vo, х(Т) = х(Т) = х(Т) = х(Т) = 0. Покажем, что если \х\ ^ 1, то х(-) = х(-) и, в частности, неравенство Т < Т невозможно. Тем самым будет доказана оптимальность функции #(•). Ввиду симметрии задачи ограничимся случаем, когда вначале управление и = х положительно. Если х\ ^ 1, то, интегрируя дважды неравенство x(t) ^ 1 и учитывая граничные условия, получаем т t х(т) - х(т) = (1 - x(s)) ds dt ^ 0, о о (i)
44 § 3. Решения задач причем равенство здесь возможно, только если во всех точках непрерывности x(s) = 1, а тогда x(t) = x(t), t G [0,г]. Аналогично, интегрируя дважды неравенство x(t) > —1, получаем тт 1 Л х(т)-ж(т) = (-l-aj(s))dscft<0, (ii) г t ч причем и здесь равенство возможно лишь, если x(s) = —1 и x(t) = x(t), £G [г,Г]. Сравнивая (i) и (ii), находим, что х(т) = х(т), а тогда x(t) = x(t), te [О,Г]. Ответ. Оптимальный процесс находится из условий \x(t)\ = 1 во всех точках, кроме, может быть, одной, при переходе через которую х(-) меняет знак. 6. Задача Фуллера Здесь рассматривается задача оптимального управления, которая была поставлена и исследована американским инженером А. Т. Фуллером [Фул]. Позднее выяснилось, что точно к такой постановке приводит задача, связанная с наискорейшим успокоением спутника, выведенного на орбиту. Сразу отметим, что это пример задачи, где оптимальное управление не является кусочно непрерывной функцией. 1. Формализация. J(x(-),u(-)) = x2(t)dt —» min, х = щ #(0) = 1, \u(i)\ ^ 1. Задача рассматривается на классе функций из L2OR+), У которых первая производная локально (т. е. на каждом конечном отрезке) абсолютно непрерывна, а вторая производная принадлежит £оо(М+). Обозначим это пространство функций через ™2,ооОМ-
§3. Решения задач 45 Перепишем задачу в стандартной форме x\(t)dt —» min, х\ = Х2, Х2=и, #i(0) = 1, |г/(*)| ^ 1. (П) 2. Принцип Лагранжа. Применим принцип Лагранжа к этой задаче, хотя она задана на полупрямой и формально не подходит ни под одну из сформулированных ранее теорем. Функция Лагранжа задачи (7¾) имеет вид С = L(t,Xi(t),X2(t),Xi(t),X2(t),u(t),pi(t),P2(t),Xo)dt+ + ^1(0),^2(0)), где L(t,Xi,X2,Xi,&2,U,pi,P2,Xo) = XoXi+pi(±i -Х2)+Р2{Х2 ~ и) и / = Ai(xi(0) - 1). Принцип Лагранжа заключается в том, что должно выполняться уравнение Эйлера по фазовым переменным: -^Li%{t) + Lx%{t) = 0, г = 1,2 ^ 4^> - pi + 2A0xi = 0, -р2 - р\ = 0, условие трансверсальности в нуле ^,(0)=^(0), г = 1,2 ^ pi(0) = Аь р2(0) = 0 (и) и условие минимума по и: mm(-p2(t)u) = -p2(t)u(t) <5 u(t) = signp2{t). (iii) |гх|<1 3. Анализ. Покажем, что Ao ф 0. Действительно, если Ао = = 0, то из (i) и (ii) следует, что рг(*) — ot Для некоторого
46 §3. Решения задач а ф 0 (если а = О, то все множители Лагранжа оказываются нулевыми), а тогда из (ш) вытекает, что решение задачи х(-) — парабола и она не может принадлежать L2OR+). Итак, Ао ф О и мы будем считать, что Ао = 1/2. Перейдём к исходным переменным и обозначим х = х\ и р = = Р2- Тогда условия (iii), (i), (и) (добавим еще условие задачи) запишутся так: 3f(.) = signp(.), р(.) = -£(.), р(0) = 0, £(0) = 1. (iv) Из этих соотношений следует, что p(t)x{t) +-±± - \p{t)\ = const. (v) Для проверки достаточно продифференцировать это тождество. Будем считать (и это эвристическое соображение), что константа справа в (v) равна нулю. Обозначим х(0) = -а < 0 (снова, это эвристическое предположение, но его естественность не должна вызывать сомнений). Тогда из (v) следует, что р(0) = 1/2а > 0 (vi) и, значит, при малых £ > 0 имеем (см. (iv)) t2 x(t) = — — at + 1. (vii) Вследствие (iv) и (vi) функция p(-) для таких t имеет вид »w-s + T-f + s- (viii) Пусть г —первый положительный нуль функции р(-). Подставляя его в (viii), получаем уравнение, связывающее а и г: + + — =0. (ix) 24 6 2 2а К J
§3. Решения задач 47 Далее воспользуемся автомодельностью задачи, т. е. инвариантностью уравнений (iv) относительно преобразований л-> (яа(-)>Ра(-))> где xx(t) = A2x(t/A), Px(t) = A4p(t/A). Отсюда следует, что если х(т) < 0, то функции х(*) = (х(г)г1х(л/1ад1*+г), р(Ь) = -(Цт))-2р(уЩтТ\г + т) удовлетворяют всем соотношениям в (iv). Исходная задача выпукла, а минимизируемый функционал строго выпуклый,1 так что решение (если оно существует) единственно и поэтому х(о = (х(г)г1х(л/1ад1*+т), р{Ь) = -{х{т)Г2р(уЩт)\1 + т). Дифференцируя первое равенство в нуле и затем возводя его в квадрат, получим соотношение £2(г) = -ЗД£2(0), которое в силу (vii) равносильно равенству (г - а)2 = -(т2/2 - ат + 1)а2. Относительно г это квадратное уравнение, решая которое, получаем, что т=а{1+^Щ- (х) 1 То есть J((l - 7)2(-) + 72/(-)) < (1 _ f)J(x(-)) + 7-%(0) Для любых 7 €(0,1) и *(.)#</(•)•
48 §3. Решения задач Отсюда видно, что а > л/2. Подставляя найденное выражение для г в (ix) и обозначая левую часть (ix) через /(а), легко обнаружить, что /(л/2) = 0, f(y/2) = —оо и /(а) —» +оо при а —» оо. Таким образом, существуют а > у/2 и т (связанное с а соотношением (х)), которые удовлетворяют равенству (ix). Построим теперь решение системы (iv). На отрезке [0, г] положим , N t2 л , ч £4 at3 t2 t xo{t) = --Ш + 1, po(t) = -— + -^--77 + 2 ' m/ 24 6 2 2Э Автомодельность задачи позволяет продолжить эти функции на всю полупрямую. В результате мы получаем пару функций, обозначим их #(•) и р(-), которые удовлетворяют условиям (iv) и которые финитны, так как точки склейки #(•) (нули р(-)) сходятся, как нетрудно проверить, к т(1 - Л)-1, где \=^(а2-2)/(а2 + 2). Таким образом, #(•) есть склейка счетного числа парабол и, зна- чит, х(-) имеет счетное число переключений. Покажем, что построенная функция #(•) есть действительно решение задачи (7¾). Во-первых, ясно, что она принадлежит W2)00(M+) и допустима в этой задаче. Пусть х(-) допустима в (7¾). Тогда, в частности, \x(t)\ ^ 1 и мы имеем £(0)- p(t)x(t)dt ^ р(0) - \p{t)\dt. (xi) Е+ R+ Так как (в силу (iv)) |p(t)| = p(t) sign p(t)=p(t)x(t), 1 Такие процессы, где управление за конечное время совершает бесконечное число переключений, называются четтеринг-режимом. Задача, решенная Фуллером была, по-видимому, первым примером такого рода. Ныне теория четтеринга развита достаточно глубоко, см., например, [БЗ].
§3. Решения задач 49 то, подставляя это в интеграл справа в (xi) и затем интегрируя два раза по частям, получим, что ш- R+ \p(t)\dt= xz(t)dt. R+ ~2 (xii) Далее, применяя неравенство Коши-Буняковского, соотношения (xi) и (xii), будем иметь 1/2 x2(t)dt > ~2 xz(t)dt x(t)x(t)dt = \Д+ \Д+ м+ 1/2 ^2 x\t)dt £(0)- p(t)x(t)dt J > 1/2 > ~2 x\t)dt sjfc+ т.е. #(•)— решение задачи (Рб)- Ответ. Решение задачи (Vq) есть финитная функция, представляющая собой склейку счетного числа парабол. Соответствующее оптимальное управление имеет счетное число переключений с 1 на —1 за конечное время. Вычисления на компьютере дают следующее значение для этой задачи: 5~f 2§(3 + 3л/33)~^ 7. Задача о расширенном воспроизводстве при налогообложении, пропорциональном прибыли Представим себе, что предприятие производит некоторую продукцию, и пусть x(t) —денежная сумма, получаемая за реализацию этой продукции в момент t в единицу времени. Доля u(t) этой суммы идёт на расширение производства. Считаем, что увеличение суммы x(t) пропорционально затратам: dx(t) dt = au{t)x{t), (i)
50 § 3. Решения задач где а — положительная константа. Считаем, что известен начальный капитал: х(0) = а, (и) где а — положительное число. Считаем также, что расходы на текущее производство пропорциональны производимой продукции (т.е. в единицу времени равны (3x(t)), а налог пропорционален прибыли (т.е. в единицу времени равен b(x(t)—u(t)x{t) — — /3x(t)). Поэтому прибыль за время от t = 0 до t = Т исчисляется выражением Q = Ъ(1 - u(t) - (3)x(t) dt. (iii) о Встаёт вопрос, как распорядиться долей u(t), направляемой на расширенное воспроизводство, чтобы к заданному моменту прибыль была бы максимальна? 1. Формализация. Соотношения (i)-(iii) приводят к следующей постановке (далее у = I — /3): т b{u{t) — ^)x{t) dt —» min, х = аих, 0 ^ и ^ 7? х(0) — а- о Это задача оптимального управления с фиксированным временем и закреплённым левым концом. 2. Принцип Лагранжа. Функция Лагранжа здесь такова: £ = ((u(t) - 7)x(t) + p(t)(x(t) - au(t)x(t))) dt. о Тогда должно выполняться a) уравнение Эйлера по х: —р — аир — 7 + ^ = 0; b) условие минимума по и: min x(t)u(l —p(t)a) = x(t)u(t)(l — p(t)a);
§3. Решения задач 51 с) трансверсальность по х: р(Т) = 0. 3. Анализ. Из Ь) вытекает, что если 1 — ра < 0, то u(t) = 7, а если 1 — ра > 0, то u(t) = 0, откуда и из а) следует, что р = и{\ — ра) — 7 ^ ~7- Таким образом, после переключения в точке г получаем: p(t) = —j(t - Т). При этом либо г = 0, либо г > 0. В последнем случае (Т — г)а7 = 1, т. е. г_Г-±. #7 Очевидная модификация теоремы существования из Приложения II показывает, что решение задачи (Vj) существует, и тогда из единственности экстремали получаем Ответ. Если — < Т, то до момента г = Т — -£- надо осу ' осу максимально «воспроизводиться», а потом лишь извлекать прибыль, если же -^- > Т, то «воспроизводиться» вовсе не следует. 8. Одна проблема космической навигации Рассмотрим задачу о мягкой посадке космического аппарата на плоский участок небесного тела, лишённого атмосферы. Примером такого небесного тела может служить Луна. Пусть космический аппарат движется по прямолинейной траектории, перпендикулярной поверхности небесного тела, m(t) — масса аппарата в момент £, a x(t) — расстояние от него до поверхности тела. На космический аппарат действует сила тяжести —ут и сила тяги ки. Положительные коэффициенты 7 (ускорения силы тяжести) и к (ускорения силы тяги) предполагаем постоянными; на управление и накладывается ограничение 0 ^ и ^ U. Тогда по второму закону Ньютона динамика полёта опишется уравнениями: тх = ки — 7^, т = —и, 0 ^ и ^U. (i) Поставим перед собой задачу мягко посадить аппарат, затратив минимум топлива (не фиксируя времени посадки).
52 § 3. Решения задач 1. Формализация. Поставленная задача приводит к следующей формализации (далее х обозначено через х±, время посадки через Г): то — т(Т) —» min, х\ = х2, х2 — 7? ^- ~и-> га Xi(0) = & х{(Т) = 0, г = 1,2, m(0) = m0, O^u^U. (Vs) Действительно, разность между начальной и конечной массами равна затраченному топливу; числа ж»(0) и то характеризуют начальные положения и начальную массу аппарата; соотношения Xi(T) = 0 означают, что посадка «мягкая» — аппарат «прилунился» с нулевой скоростью. 2. Принцип Лагранжа. Функция Лагранжа задачи имеет вид: т С = А0(га0 -га(Т)) + (pi(±i -х2) + р2(х2 Ь7)+ J га о + р3(т + и)) dt + Mixi(T) + ц2х2(Т). Закрепленные краевые условия на левом конце в функцию Лагранжа не вносим. Должны выполняться: a) уравнение Эйлера: -pi = 0, -р2 - Pi = 0, -рз + Р2—о = °; га/ b) условие минимума по и: min (P3(t)u-p2(t)—^r) =ps{t)u{t) -P2{t)-^jw; o^u^u \ m{t) J m{t) c) условия трансверсальности по фазовой переменной: Pi(T) = -/xi, Р2(Т) = -М2, Рз(Т) = А0; d) условия стационарности по Т: -Аош(Г) + Miii(T) + fjL2x2(T) = 0^ ^ Х0и(Т)-р2(Т) (¾^) +Р2(Т)7 = 0.
§ 3. Решения задач 53 3. Анализ. Из а) следует, что Pi (*) =р = const, рг(*) = ~pt + <Z> 9 — const. (ii) Обозначим ip(t) = -ps(t) + ^,w. Тогда из а) получим: m(t) Из условия стационарности по Т приходим к равенству: ф(Т)и(Т) = Р2(Т)Ъ И а из условия минимума по г/ получаем: u(t) = 0 при ^(£) < О, О ^ t К: Г. Если р = 0, то из (ш) следует, что ф({) = фо = const. При этом фо ф 0 (иначе все множители оказались бы нулями), а потому либо оптимальное управление тождественно равно нулю (что невозможно, ибо нельзя мягко прилуниться с выключенным двигателем), либо оно тождественно равно U. Если же р ф 0, то функция ф(-) строго монотонна, и, значит, имеется одно переключение с нуля на U. Пусть г — момент переключения. Движение аппарата при t ^ г задаётся формулами свободного падения: t2 zi = £1+62*-7 о"» ^2 = 62-7*» m(t) = m0. В фазовой плоскости (#1,0:2) эти соотношения задают параболу 6 - #2 (6 - Х2)2 Я1 = f 1 + 6 7 27 Движение аппарата на участке [г, Т] определяется уравнениями (i), где u(t) = U, xi(t)=£i, z2(t) = £2, m(rj = m0.
54 § 3. Решения задач Решение соответствующей задачи Коши имеет вид (а — t—т) Х1(т + a) = £i + &а ~ 2^а<2+ . кто ( Ua\ . Д Ua + ка + —^ 1 In 1 U \ т0 J \ т0 Х2(т + а) = £2 — 7а — ^1п ( 1 ) ) m = rno — Ua. Множество точек (£1,^2), из которых можно прийти в начало координат, включив полную мощность, задаётся в параметрической форме уравнениями х\(а) = Х2(а) = 0. Исключив из этих двух уравнений параметр а, получаем кривую ¢(£1,^2)- Ответ. Следует в течение времени г, определяемого первым положительным корнем уравнения г2 Ф(& + &т - 7у,& - it) = 0, (v) предоставить аппарату свободно двигаться, а затем включить тягу на полную мощность. Если при данных (Съй) уравнение (v) не имеет решения, мягкая посадка невозможна. 9. Гармонический осциллятор с принудительным ограничением Этот учебный пример весьма поучителен; он позволяет проникнуть в технику и вариационного исчисления, и оптимального управления. 1. Формализация. Пусть Т и А — положительные числа. Рассмотрим задачу: т J(x(-))= (x\t)-x\t))dt^ min, x{0) = x{T) = 0, |x(t)|<A
§ 3. Решения задач 55 Перепишем ее в форме задачи оптимального управления т J(x(-),u(-)) = (u2(t) -x2(t))dt-> min, x(t) = u(t), о x(0) = x(T) = 0, \u{t)\^A. (7¾) Решение задачи (7¾) существует (см. Приложение II), обозначим его (ж(-),2(-)). 2. Принцип Лагранжа. Функция Лагранжа этой задачи имеет вид: т £(¢(-),^(-),p(-)»^o,Ai,A2) = Ldt + l, о где L = Ь(х,х,щр, Ао) = Ао(г^2 — х2) + р(± — г/) и / = /(ж(0), х(Г), Аь А2) = Aix(O) + \2х(Т). Согласно принципу Лагранжа для задачи (7¾) (т. е. принципу максимума Понтрягина) найдутся такие множители Лагранжа Ао ^ 0, р(-) е С1([0,Г]), Ai и Аг, не все равные нулю, что -jZx(t) + Lx(t) = 0 ^ -p(t) - 2X0x(t) = О, (i) £fc(0) = k(o) & р(0) = Аь Lx(T) = -Tx(T) & p(T) = -X2 и min(A0^2-p(£)u) = А0г£2(£)-р(£)й(£) для п. в. t G [0,Г]. (ш) Для всех положительных Т и А нас интересуют решения задачи (7¾^ ее значение, а также ее экстремали, т.е. такие #(•), что пара (#(•),#(•)) удовлетворяет необходимым условиям минимума (i)-(iii).
56 §3. Решения задач 3. Анализ. Покажем сначала, что в соотношениях (i)-(iii) Ло ф 0. Действительно, если это не так, то из (i) следует, что р = const. Предположим, что р Ф 0. Тогда из (iii) вытекает, что u(t) = Asignp и так как х(0) = 0, то x{t) = At signp. Это невозможно, ибо х(Т) ф 0. Таким образом, р = 0, а значит, Ai = = Л2 = 0 согласно (и), т.е. все множители Лагранжа нулевые, что также невозможно. Итак, Ао ф 0 и мы будем считать, что Ао = 1/2. Ясно, что для всех положительных Т и А функция #(•), равная тождественно нулю, удовлетворяет условиям (i)-(iii). Из (iii) легко следует, что для п.в.£ е [0,Г] «(t) = <P(t)' Ш^А] (iv) Рассмотрим отдельно несколько случаев. а) |р(0)| ^ А. Если |р(0)| < Л, то \p(t)\ < А и в некоторой окрестности нуля. Тогда из (i) и (iv) вытекает, что в этой окрестности x(t) + x(t) = 0. (v) Так как х(0) = 0, то x(t) = Cs'mt и \С\ < А, поскольку С = £(0)=р(0). Таким образом, \p(t)\ < А всюду. Условие х(Т) = 0 удовлетворяется лишь тогда, когда либо С = 0, либо Т = ктг, keN. Если |р(0)| = Л, то функции x(t) = Csint, где \С\ = А, также экстремали при Т = ктг, keN. Итак, если |р(0)| ^ Л, то семейство функций x(t,C) = = С sin t — экстремали в (7¾) при Т = ктг, к G N. На фазовой плоскости с координатами х, р (см. рис. 6) при Т = тг точка (#(£),р(£)) движется по полуокружности.
§3. Решения задач 57 b) |р(0)| > А Пусть, для определенности, р(0) > 0. Тогда x(t) = At в некоторой окрестности нуля в силу (iv) и того, что х(0) = 0. Пусть г — первая точка, где р(т) = А (такая точка есть1, иначе мы никогда не удовлетворили бы условию х(Т) = 0). Так как (см. (i)) р(т) = —х(т) = -Ат < 0, то p(t) < А для точек t > т и близких к т. Тогда согласно (i) и (iv) для таких t функция х(-) удовлетворяет уравнению (v) и тем самым имеет вид x(t) — С\ cos t + (¾ sin t. Так как функция х(-) непрерывно дифференцируема, то в точке г необходимо выполнение условий Ат = С\ cos г + C<i sin г, A = —С\ sin г + C<i cos г. Отсюда следует, что С\ = А(т cost — sin г), С2 = A(cosr + г sin г). Подставляя эти значения в х(-) и р(-) = х(-), получаем для указанных точек t: x(t) = А(т cos(r — t) — sin(r — t)), p(t) = A(t sin(r - t) + cos(r - t)). Пусть 0 < 7 < 7г/2 таково, что cos7 = т/л/1 + г2, тогда эти соотношения можно записать так x(t) = A\/l + T2cos(7 + г - t), p(t) = ;4\/l + г2 sin(7 + г - t). (vi) Это означает, что на фазовой плоскости с координатами х, р (см. рис. 6) точка (x(t),p(t)) движется по окружности радиуса 1 На фазовой плоскости с координатами х, р (см. рис. 6) это означает, что точка (x(t),p(t)) от 0 до т движется по параболе р = р'(0) — х2/2А.
58 §3. Решения задач А л/1 + т2 от точки (Ат,А). Через некоторое время ti она приходит в точку (Ат, -Л) (при этом |р(£)| < А для всех г < t < t\). Легко видеть, что *i = 2arctg(l/r). Далее, в силу (iv), x(t) = -At + b и существует единственное Т такое, что х(Т) = 0, т. е. x(t) = = A(T-t). Из условия At = A(T-tir) следует, что t\ =Т-2т. Т = тг Г>тг Рис. 6. Гармонический осциллятор. Итак, общее время движения равно T = 2(r + arctg- j (vii) и построенная экстремаль (учитывая, что arctg(l/r) = 7 и то-
§3. Решения задач 59 гда из (vii) следует, что г + 7 = Т/2) имеет вид At, O^t^r; x(t) = { Ау/\ + r2 cos(t - Г/2), r^t^T-т; A(T -£), T-r^t^T. Функция справа в (vii) как функция г, монотонно возрастает на (0, +оо) и ее предел справа в нуле равен тг, поэтому только что построенная экстремаль возможна только при Т > тг. В частности, при Т < тг единственной экстремалью в исходной задаче является тождественный нуль. В силу симметрии функция -#(•) —также экстремаль. Заметим, что из (vii) следует, что Т = 2т + 2j, т. е. г+ 7 = Г Тогда (vi) можно записать так Г x(t) = A\/l + T2cos(£ - -), т pit) = -Ay/1 + г2 sin(t - -). Подсчитаем значение функционала на экстремали #(•). (viii) Т т (£2(t) - x2(t)) dt = (£2(i) - x2(t)) dt+ v о 0 T-t T + {x2(t) - x\t)) dt + (x2(t) - x\t)) dt = T-t 2/_ _3 /o /1 i _2 = A\r - r73 -(1 + r^) sin(T - 2т) + r - тл/3). Из (viii) следует (при £ = т), что 1 T = ^(l + r2)sin(r-2r)
60 § 3. Решения задач и поэтому т (x2(t)-x2(t))dt=--AV. о о Для каждого aGR обозначим через {а} число, равное [а], если а £Ъ, к[а\ — 1, если a G Z. Ответ. Пусть Т и А — положительные числа. Тогда 1) ес/ш Т < тг, то функция х(-) = 0 — единственная экстремаль в задаче (Vg), тем самым она является ее решением и значение задачи равно нулю; 2) если Т = тг, то функции x(t,C) = Csint, где \С\ ^ А, и только они — экстремали в (7¾)• Все они являются решениями задачи (7¾) и ее значение равно нулю. 3) если Т > тг, то следующие 2{^} + 1 функций: тождественный нуль, функции xm(t) = < *rm(t), 0<*<£ [ (-1)^1^ - (т - 1)£), (т - 1)£ <С t <$ Г, где At, O^t^ тт; жТ„ (t) = { A^l + r^cos(t - ^), Tm^t^ Т/т - тт; A(T-t), Z Tm^t^Z и тт — единственный корень уравнения -=2(r + arctg(l/r)), т а также функции (—хт(-)), т = 1,..., {Т/тг}, являются экстремалями в задаче (7¾).
§4. Доказательство теорем 61 Кроме того, если Т = ктт, к Е N и к > 2, то семейство функций x(t,C) = Csmt, где \С\ ^ А, —также экстремали в (7¾). Решениями задачи (7¾) являются функции xi(-) и —xi(-), значение задачи равно -2A2rf/3. §4. Доказательство теорем Доказательство теоремы 1 п. 2.2. Вывод необходимых условий экстремума в задаче вариационного исчисления (Ро), задаче Лагранжа (Pi) и задаче оптимального управления (Р) следует, по существу, одной схеме, восходящей к Лагранжу: мы варьируем экстремальный элемент конечным числом параметров, сводя исходную задачу к конечномерной. Затем мы пользуемся необходимыми условиями экстремума в таких задачах (которые приведены в Приложениях I и II) и еще (в задаче Лагранжа и задаче оптимального управления) соображениями, связанными с условиями компактности множества в терминах центрированной системы его замкнутых подмножеств. (а) Уравнение Эйлера для простейшей задачи. Для того, чтобы подчеркнуть единообразие рассуждений, запишем задачу (Ро) в форме задачи Лагранжа J(x(-),u(-)) = L(t,x(i),u(i))dt —» extr, V to x = и, x(U) = X{, i = 0,1. (i) Если x(-) — слабый локальный экстремум в (Ро), то это, очевидно, равносильно тому, что пара (ж(-),?/(•)), где и(-) = #(•), доставляет слабый локальный экстремум в задаче (i). Рассмотрим отдельно случай свободного правого конца, т. е. когда ограничение x(t\) = х\ отсутствует и случай закрепленных концов.
62 §4. Доказательство теорем 1. Случай свободного правого конца. По условию функция L непрерывна в окрестности кривой {(t,x(t),2(t))|tG[t0,*i]}, и поэтому согласно теореме П1.1 (о непрерывности суперпозиции отображений) интеграл J(x(-),u(-)) конечен. Пусть пара (#(-),2(-)) — слабый локальный экстремум в задаче (i). Построим семейство вариаций этой пары. Для и(-) G C([io,*i]) и a G М положим иа(-) = и(-) + аи(-) и обозначим через ха(-) решение задачи Коши х = ua(t), a; (t0) = хо, т.е. ха(-) = х(') + ау(',и(-)), где t y(t,u(-)) = u(r)dr. V to Ясно, что xa(to) = хо. Таким образом, для всех а пара (ха(-),иа(-)) допустима в (i). При малых а, скажем, для а G [-5,5], кривая {(t,xa(t),ua(t)) \ t G [*o>*i]} лежит в окрестности кривой {(t,x(t),u(t)) | t G [*o>*i]}- Для таких а положим g(a) = д(а;и(-)) = ti =J(xa(-),ua(-)) = L{t,x{t) + ay(t,u(-)),u{t) + au(t))dt. V to (ii) Так как (¢(-),2(-)) —локальный экстремум в задаче (i), то нуль — локальный экстремум функции д. Функция д дифференцируема в нуле. Действительно, подынтегральная функция в (ii) (обозначим ее /) по теореме П 1.1 непрерывна на [to» *i] х [_5,6]. В силу теоремы П1.2 (о производной суперпозиции отображений для случая п=1,га = 2ив = 1)и условий теоремы fa(t, ol) = Lx(t, x(t) + ay(t, г/(-)), u{t) + au{t))y(t, u(-))+ + Lu(t,x(t) +ay(t,u(-)),u(t) + au(t))u(t)
§4. Доказательство теорем 63 и эта функция непрерывна на [to» *i] х [—5,5], снова вследствие П 1.1 Тогда согласно теореме П 1.3 (о дифференцировании интеграла, зависящего от параметра) функция д дифференцируема на [—5,5], в частности, в нуле и, следовательно, в силу этой же теоремы и теоремы Ферма (теорема П 1.4) имеем ti (/(О) = [ (Lx(t)y(t,u(-)) + Lu(t)u(tj) dt = 0. (iii) to Пусть po(*) — решение задачи Коши: p = Lx(t), p(t\) = 0 на отрезке [io>*i]> T-e- t Po(t) = Lx{r)dr. tl Подставляя в (iii) вместо Lx(-) функцию po(-) и интегрируя по частям (учитывая, что y(t,u(-)) = u(t) и y(to,u(-)) = 0), будем иметь (-po(t) + Ы*)) u(t) dt = 0. (iv) to Это равенство справедливо для любого и(-) Е C([to,*i]). Пола- гая и(-) = -ро(*) + Lu(-), получаем, что интеграл от квадрата непрерывной функции равен нулю, значит, сама функция рав- на нулю, т.е. ро(-) = Lu(-). Таким образом, Lu(-)9 или, что то же, Lx(') е C1([to,ti]). Дифференцируя равенство ро(-) = Lx(-) и учитывая, что ро(#) — Lx(-) и po(*i) — 0> получаем соотношения (1а) и (16). 2. Случай закрепленных концов. Пусть теперь и(-) EC([£o>*i]) ti и J w(t) dt = 0. Строим то же семейство вариаций Лары (#(•), й(-)), что и выше, и поскольку ха(£г) = #ь i = 0,1, пара (жа(-),гха(-)) допустима в (i) для любого а. Далее, дословно повторяя предыдущие рассуждения, приходим к равенству (iv),
64 §4. Доказательство теорем справедливому для всех функций и(-) Е C([io,*i])> Для кото- ti рых J* u(t) dt = 0. В силу последнего для любой константы с to справедливо и такое равенство (-po(t) + Lu(t) + с) ix(t) dt = 0. (v) to Выберем с так, чтобы ti (-po(t) + Lu(t)-c)dt = 0. to Подставляя и(') = -Po(-) + Lu(-) -с в (v), снова получаем, что интеграл от квадрата непрерывной функции равен нулю и значит, -ро(-) + Lu(.)-c = 0. Отсюда следует, что Lu(-), или, что то же, Lx(-) принадлежит Cl(\to,ti]). Дифференцируя равенство ро(-) = Lx(-) -с и учитывая, что Ро(-) = LX(-), получаем уравнение Эйлера. (Ь) Уравнение Эйлера-Лагранжа для задачи Лагранжа. Здесь также рассмотрим два случая. 1. Случай свободного правого конца. Пусть пара (ж(-),гх(-)) — слабый локальный экстремум в задаче (Pi). Построим семейство вариаций этой пары. Пусть и(-) Е C([to,*i],Kr) и а Е R. Положим иа(-) = иа(-;и(-)) = и(-) + аи(-). По лемме П1.6 при N = 1 для всех достаточно малых а существует решение
§4. Доказательство теорем 65 х<х(') — ха(-;и(-)) задачи Коши х = (p(t,x,ua(t)), ж (to) = #о> т.е. пара (ха(-),иа(-)) допустима в (Pi). Так как ха(-) —» х(-) равномерно при а —» 0, то можно считать, что для таких а кривая {(t,xa(t),^a(t)) | t G [to,ti]} лежит в окрестности исходной кривой. Для этих а положим д(а) =д(а;и(-)) = 1 (?) = J(xa(-),ua(-)) = f(t,xa(t),u(t) +au(t))dt. V to Так как (ж(-),?/(•)) —локальный экстремум в задаче (Pi), то нуль — локальный экстремум функции д. Повторяя, фактически, рассуждения, которые были проведены при выводе формулы (iii) и учитывая при этом, что при каждом t е [*o>*i] функция & —> xa(t) непрерывно дифференцируема в окрестности нуля (согласно лемме П1.6), приходим к равенству </(о) = [ (l(t) • y(tM-)) + Ш • Ф)) dt = о, (но to где 2/(-,гх(-)) — производная функции а —» ха(-) в нуле. Пусть ро(*) — решение задачи Коши: Р = -Wx(t) + Д (t), p(ti) = 0. (iii') По теореме П 1.7 существования и единственности решения линейной системы такое решение существует на всем отрезке [to,ti] и единственно. Это сразу доказывает соотношения (2а) (с заменой ро(-) на р(*)) с Ао = 1 и (2с). Докажем (26). Подставляя в (и') вместо функции fx(-) ее выражение из (iii') и используя то, что в силу леммы П1.6 функция у(-,и(-)) является решением уравнения (**), будем иметь *i 0 = (ро(*)-1/(*^(-))+Ро(*) •!/(*, w(-))- to - Ро(<) ' &(*М<) + A(t) • ix(t))dt =
66 §4. Доказательство теорем ti to tl Ш - Po(t)Vu(t)) - U(t) dt. (iV) to Эти равенства справедливы для любого Беря в последнем интеграле в качестве и(-) функцию т Ju(') -Ро(')Фи(') получаем, что Это есть соотношение (26) (с заменой ро(*) на р(-) и с Ло = 1), и тем самым теорема для случая свободного правого конца доказана. 2. Случай закрепленных концов. Пусть пара (#(•),й(-))— слабый локальный экстремум в задаче (Pi). Построим семейство вариаций этой пары. Пусть N EN, щ(-) е C([£0,£i],Mr), а* ЕМ, г = 1, ...,ЛГ, й(-) = (г/i (•)»••• >%(•))» а = (аь...,адг) и гХа(',^(')) = ^(*) + ^^г^г(-)- г=1 По лемме П1.6 для достаточно малых а существует решение Жа(-;гг(-)) задачи Коши X = </?(*, х, г/а(*)), я(*о) = #0, определенное на всем отрезке [to, *i] и для каждого t Е [*o»*i] отображение а -» Xa(t)
§4. Доказательство теорем 67 непрерывно дифференцируемо. Можно считать, что для таких а кривая {(t,Xa(t;u(-)),Ua(t;u(-))) | t е [t0,ti]} лежит в окрестности исходной кривой. Положим д0(а) = д0(а;й(')) = J(xa(-;u(-)),Ua(-;u(-))). Снова те же рассуждения, что и при выводе формулы (iii), показывают, что частные производные функции до непрерывны в некоторой окрестности нуля и тем самым до непрерывно дифференцируема в этой окрестности. Рассмотрим задачу: 5о(а;й(-))-►extr, &(а;й(-)) = О, 1 ^ г ^ n, (v') где 5t(a;iZ(-)), 1 ^ г ^ п, — компоненты вектора Xa(ti;u(-))—xi. Ясно, что точка а = 0 является локальным экстремумом в этой задаче. Согласно правилу множителей Лагранжа (теорема П 1.5) найдется такой ненулевой вектор Л = \(Ъ(')) = (мо, Mi,..., Mn), что производная функции Лагранжа п £(а,А) = [лодо(щ и(-)) + ^2 тдг(а; и(-)) г=1 задачи (v') в точке а = 0 равна нулю, т. е. Мо *о /*(*) • г/(*,г^(.)) + /и(*) • Ui(t)) dt + М ' 2/(^1,^(-)) = О, г = 1,..., iV, (vi') где /i = (/ii,... ,/½) и 2/(-,гхД-)), 1 ^ г ^ Л/" —частные производные отображения а —» Жа(.;гг(-)) в нуле. Так как Л ф 0, то можно считать, что |Л| = 1, т. е. Л принадлежит единичной сфере $п пространства (Мп+1)'. Обозначим
68 §4. Доказательство теорем через А(й(-)) множество всех наборов множителей Лагранжа Л для задачи (v7), удовлетворяющих условию |Л| = 1. Ясно, что А(й(-)) — непустое замкнутое подмножество $п. Рассмотрим теперь семейство всех конечных наборов Ъ(-) = Ы-),...,им(-)), гхД.)€С([«о,*1],Кг), г = 1,..., ЛГ. Каждому такому набору, рассматривая соответствующую задачу (v7), сопоставим некоторое непустое замкнутое множество А(й(-)) с $п. Обозначим через Л совокупность всех таких подмножеств. Это центрированная система (см. Приложение I). Действительно, пусть A(iZi(-)),... ,Л(ггт(-)) — произвольный набор элементов из Л и й(-) — набор, состоящий из объединения наборов IZi(-),... ,йт(-). Возьмём Л е Л(й(-)). Тогда из (vi7) следует, что Л G А(щ(-)), г = 1,...,т, следовательно, 02=1-^(¾) Ф 0> т-е- ^"~ центрированная система. По лемме П1.8 о центрированной системе существует такое Л = = (До»Д) € $п, которое принадлежит всем элементам из Л, т.е. для любого набора й(-) с данным Л выполняются равенства (vi7). В частности, для любой функции и(-) G C([to,*i],Kr) справедливо равенство *i Мо /*(«). j/(t,ix(.)) + /u(t)-w(t)) dt + p.j/(tbix(.)) = 0. (vii') to Пусть pi(-) — решение задачи Коши: Р = ~P$x{t) + ~Pofx(t)i p(*i) = -p. (viii') По теореме П 1.7 такое решение существует, и это доказывает (2а) (обозначая pi(-) через р(-)) с Ло = Щ. Подставляя в (vii7) вместо функции щ]х{') ее выражение из (viii7), а затем вместо функции фх(')у(',и(-)) ее выражение из (**) в лемме П1.6 и учитывая, что y(to,u(-)) = 0 и pi(ti) = -Д, приходим точно так же, как и выше (см. вывод формулы (iv7)), к равенству ti (-Pi(t)ipu(t) + ЩШ) • u(t) dt = 0. to
§4. Доказательство теорем 69 Так как это равенство справедливо для любого то, как и раньше, беря и(-) = (-Рг(')Фи(') +Т*о7ч{'))Т\ получаем, что Pi(-)<Pu(-) =Щ1и('), т.е. выполняется равенство (26) (обозначая pi(-) через р(-)) с Л0 = До- (с) Принцип максимума Понтрягина. Снова рассматриваем два случая. 1. Случай свободного правого конца. Из теоремы П1.1 и условий теоремы следует, что подынтегральная функция кусочно непрерывна. Пусть пара (ж(-),г2(-)) — сильный минимум в задаче (Р). Построим семейство вариаций этой пары. Обозначим через Т = Т(и(-)) множество точек непрерывности гх(-). Пусть а ^ 0, г G (io>*i) П Г и v G U. Положим ua(t;r,v) = u(t), если t ¢. [т,т + а] и ua(t) = v, если t G G [r, r + а], причем а столь мало, что [г, г + а] с Т. Значения гха(-;г,г;) на концах отрезка [г, г + а] могут быть любыми. Согласно лемме П2.3 при N = 1 и условиям теоремы для достаточно малых а ^ 0 существует решение ха(-;т,г>) задачи Коши х = <р(£,а;,г/а(£;т,г;)), ж (to) — #о и тем самым пара (ха('',т,у),иа(-;т,у)) допустима в задаче (Р). Можно считать, что для таких а кривая {(£,ха(£;т, г>)) \ t G [io>*i]} принадлежит G, и для них положим go(a;r,v) = J(xa(-;T,v),ua(-',T,v)). Из оптимальности процесса (я( •),?/(•)) следует, что функция #о достигает минимума в нуле. Согласно следствию из леммы П2.3 функция до дифференцируема при достаточно малых а ^ 0 и тем самым ее производная справа в нуле должна быть неотрицательной, т.е. согласно формуле (***) из этого следствия h &rvf + fx(t)-yTv(t)dt>0, (i")
70 § 4. Доказательство теерем где ATVf = f(r,x(r),v) - f(r,x(r),u(r)) и yTV(-) — производная в нуле функции а —» ха (•; т, v). Пусть ро(-) — решение задачи Коши Р=-Р&(*)+ /*(*), P(*i) = 0. (и") Такое решение существует согласно теореме П 1.7, и поэтому доказаны соотношения (За) (с заменой ро(-) на р(-)) с Ао = 1 и (Зс). Докажем (36). Для t е [r,ti] имеем (j/rv(-) — решение уравнения (**) в лемме П2.3) fx(t)-yTV(t) = po{t)fix{t)yTV(t) + p0(t) -yTV(t) = (**) б? = Po(*) • 2/™(t) +Po(*) * 2/™(*) = ^(Po(*) * J/rV(*)). Интегрируя обе части этого равенства на отрезке [r,ti] и подставляя в (i"), получим 0") (ii") (**) 0 ^ Arv/ + po(*i) 'Vrvih) ~Po(r) -уТу(т) = (ii"),(**) д , / n д Так как это верно для любых г е Т и г> е С/, то доказано (36) (снова заменяя ро(*) на р(-)) с Ао = 1. 2. Случай закрепленных концов. Пусть Ua{-'->N)'— функция, построенная в лемме П2.3. Согласно этой лемме, следствию из нее и условиям теоремы при всех малых а ^ 0 существует Яа(-\М) — решение задачи Коши х = <p(t,x,Ua(t;Af)), x(to) = = хо, функция а —» go(a;J\f) = J(xa(-\N),Uci(-\N)) и отображение а —» x-a(h]J\f) непрерывно дифференцируемы в некоторой окрестности нуля, пересеченной с R+. (Если в точке а = (а1,...,адг) G М+ г-я координата равна нулю, то соответствующая производная понимается как производная справа.) Рассмотрим на этом множестве задачу: go(a;Af) —» extr, gi(a;Af) = 0, l^i^n, a e R+,
§4. Доказательство теорем 71 где gi(a;J\f), 1 ^ г ^ п, — компоненты вектора Xa(h;Af) - х\. Ясно, что точка а = 0 является локальным экстремумом в этой задаче. Согласно следствию 1 из теоремы П 2.2 существует ненулевой набор множителей Лагранжа Л = \(АГ) = (/io> Мъ • • • > Mn)> /io ^ 0 такой, что ]СГ=оМг#;(0 + 0;ЛГ) ^ 0, или что то же (согласно следствию из леммы П2.3), *i МО &rvf + fx(t) • УпуМ dt +M-J/TiVi(*i) ^0, г = l,...,iV, T* где fjL= (//1,...,/½). Дословное повторение рассуждений, связанных с применением леммы о центрированной системе из доказательства уравнения Эйлера-Лагранжа для задачи Лагранжа, приводит к тому, что существует такой ненулевой набор Л = (Д0>Д)> гДе Д — = (Д1?...,ДП), что для любой пары (t,v) е Т х U справедливо неравенство *i /х0 ATVf + fx(t) • yTV(t) dt \+ -p • y™(ti) > 0. (iii") Пусть pi(-) — решение задачи Коши: -Р = р£*(*) - До/*(*)> P(*l) = -Д- Такое решение существует, и поэтому (За) доказано (с заменой Pi(-) нар(-) и Д0 на Л0). Теперь, повторяя рассуждения, проведённые для случая свободного конца, получаем, что для всех для t Е [r,ii] справедливо равенство JI0fx(t) • yTV(t) = ft(pi(t) • у™ (£)), интегрируя которое и подставляя в (iii"), приходим к неравенству ~p0ATVf - — рх(т) • AtvP ^ 0, которое и есть соотношение (36) (снова с заменой pi(-) на р(-) и Д0 на ^о)- П
§ 5. Доказательство принципа максимума для общей задачи оптимального управления Пусть, по-прежнему, [to,ti] —заданный отрезок числовой прямой, даны функции /:ExRnxMr->R, <р: RxRnxRr-> Мп, ^0:MnxRn -> R, ф1: Rn х Rn -> R**, ^2: Mn х Mn -> Rk2 и многозначное отображение U, сопоставляющее каждому t G G [to, ti] некоторое подмножество U(t) С W. Задача оптимального управления, которую мы рассматриваем здесь, имеет вид: J(x(-),u(-)) = f(t,x(t),u(t))dt + ^o(x(to),x(ti)) -> min, V to x = ip(t,x,u), u(t)eU(t) для п. в. t G [to, ti], (P) ^i(x(to),s(*i)) < 0, ^2(x(t0),x(ti)) = 0, где ограничения, задаваемые отображениями ^ и ^, означают (в координатной форме), что имеются к\ ограничений типа неравенств и кч ограничений типа равенств. Обозначим через .AC([to,ti],Mn) совокупность всех абсолютно непрерывных на отрезке [to, ti] вектор-функций со значениями вМпи через Loo([to,ti],IRr) пространство всех измеримых существенно ограниченных на отрезке [to, ti] вектор-функций со значениями в W. Пару (ж(-),гх(-)) будем называть допустимым процессом в задаче (Р), если (х(.)М-)) G i4C([t0,ti],Rn) х Loo([to,ti],Rr), равенство x(t) = <p(t,x(t),u(t)) и включение u(t) G U(t) выполняются для п.в. t G [to, ti], для концевых значений (x(to),x(ti)) выполняются ограничения ^i(x(t0),x(ti)) ^ 0, ^2(x(t0),x(ti)) = 0 и минимизируемый функционал конечен. Введем в Loo([to,ti],IRr) метрику d(ui(-),v,2(-)) = mes{t G G [to, ti] | u\(t) Ф ^(t)}, где mes обозначает меру Лебега.
§ 5. Общая задача оптимального управления 73 Допустимый процесс (ж(-),?/(•)) называется локальным пон- трягинским минимумом, если для каждого достаточно большого с > 0 найдется такое 5 = 6(c) > 0, что для любого допустимого процесса (ж(-),гх(-)), для которого |(x(to),x(ti))-(x(to),x(ti))|<5, d(u(-),u(-)) < 5, |w(t)| ^ с для п. в. £, выполняется неравенство j(x(.), «(•))> J(x(-), ¢(-))- Очевидно, что понтрягинский минимум слабее сильного минимума в том смысле, что если (я(-),?/(•)) — сильный минимум в (Р) (т.е. из условия ||ж(-) - ж(-)Нс([*0,*1]Дп) < 5> справедливого для некоторого 5 > 0 и всех допустимых пар (ж(-),гх(-)), следует, что J(x(-),u(-)) ^ •/(:£(•), ?/(•))), то (я(-),й(-)) — понтрягинский минимум в данной задаче. Более того, следующий пример показывает, что понтрягинский минимум не обязан быть даже слабым минимумом. Действительно, рассмотрим задачу: 2 (u\t) - xz(t)) dt -> min, х = щ x(0) = 0, x(ti) = 0. о Если t\ ^ 7г, то нулевая пара (0,0) является сильным локальным минимумом, а если t\ > 7г, то она не является слабым минимумом, так как на интервале (0,ii) имеются сопряженные точки (см. [АТФ]). Но в то же время эта пара доставляет строгий понтрягинский минимум в рассматриваемой задаче для любых t\ > 0 (см. теорему 3 ниже или [Ар2]). Далее нам понадобится следующее определение: многозначное отображение U будем называть измеримым, если существует такая последовательность измеримых функций {^j(*)}?ii> что для п. в. t G [£(b*i] последовательность {uj(t)}j^1 лежит в U(t) и всюду плотна в этом множестве. Хорошо известны различные критерии измеримости многозначных отображений (см., например, [Вар]).
74 § 5. Общая задача оптимального управления Перейдем к формулировке теоремы. Пусть Ао>0, \ie(Rki)', t = l,2, p(Oe4C([to,ti],(Rn)'). Функция Лагранжа задачи (Р) такова: £(*(-М-М-),А) = L(t, x(t), i(t), iz(t),p(t), A0) dt + /(x(t0), x(ti), A), to где Ь(*,ж,ж,г/,р,А0) = А0/(*,ж,г/)+р- (ж-<р(*,ж,г/)), 2 и ж0 = ж(*0), xi = x(ti), A = (A0, Ab A2). Функция Понтрягина имеет вид #(*,ж,г/,р,Ао) = р •</>(*, ж, г/) - \0f(t,x,u). Теорема 2. (Необходимые условия минимума в задаче (Р)). Пусть (ж(-), ?/(•)) —локальный понтрягинский минимум в задаче (Р) и выполнены следующие предположения: для п. в. t функции (ж, г/) —» f(t,x,u) и (ж, г/) —» <р(£,ж,гх) непрерывны и непрерывно дифференцируемы по х; для любых (ж, г/) функции t —» f(t,x,u), t —» <p(i, ж, гг) измеримы; функции f, ср и их частные производные по х ограничены на любом ограниченном подмножестве RxKnx W; функции fa, г = 0,1,2 непрерывны в окрестности точки (x(to),x(ti)) и дифференцируемы в этой точке; многозначное отображение U измеримо. Тогда найдутся ненулевой вектор A = (Ao,Ai,A2), где Ао ^ 0, Ai ^ 0 и вектор-функция р(-) е AC([£o>*i]> (Мп)') та- кие, что выполнены: (а) уравнение Эйлера: --L^(t) + £*(*) = 0^ p(t) = -p(t)ipx(t) + ХоШ;
§5. Общая задача оптимального управления 75 (b) условия трансверсальности: LA(U) = (-1)%(и), i = 0,l & <*p(U) = (-l)^(x(t0),x(ti),A), % = 0,1; (c) условие минимума: min L(t, x(t), x(t), v,p(t), A0) = L(t, x(t), x(t),u(t),p(t), A0) veu(t) для n.e.te [to>*i] или, «/mo mo же самое, условие максимума: max #(t,x(t),v,p(t),Ao) = Я(*,ж(*),гх(*),р(*), A0) для n.e.te [*oj*i]/ (d) условие дополняющей нежесткости: Ai -^i(x(t0),x(ti)) = 0. (e) £с/ш, кроме того, функции f и <р непрерывно дифференцируемы по совокупности переменных, U(t) = U (т.е. отображение [/"(•) постоянно) и для допустимого процесса (ж(•),?/(•)) и множителей Лагранжа А,р(-) выполнены условия (a)-(d), то для n.e.te [to»*i] справедливо равенство: ^ff(t) = fft(t,x(t),e(t),p(t),Ao). 5 частности, если рассматриваемая задача автономна (т.е. f и <р не зависят явно от t), то функция Понтря- гина Н постоянна вдоль кривой (ж(-),гх(-),р(-)).
76 §5. Общая задача оптимального управления Замечание. Если в точке (x(to),x(ti)) концевые ограничения регулярны, т.е. raiik^2(#(*o)»#(*i)) — &2 и 3 77 Е G Ker^2(^(*o)>2c(*i)) такое, что ^(x(t0),x(ti)) • 77 > 0 для всех j, для которых $ij(x(to),x(ti)) = 0, (^(x(t0),^(*i))— производные отображений ^ = (^i,... ,^/¾)2^ г = 1,2, в точке (x(to),x(ti)), а ^у(ж(*о),^(*1))» 1 ^ 3 ^ &i —строки матрицы ^i(^(*o)»^(*i)))> то в сформулированной теореме условия А ф О можно заменить более сильным условием нетривиальности: Ao + |p(t)|^0 VtG[t0,*i]. Это несложное следствие соотношений (a)-(d) и того, что Л ф 0. Доказательство теоремы разобьем на четыре этапа. 1. Конечномерная аппроксимация. N-задача. Предположим сначала, что множества U(t) равномерно ограничены для п. в. t. Пусть S > 0 соответствует процессу (ж(•),?/(•)) в определении понтрягинского минимума. Как известно (см., например, [Нат]) почти все точки измеримой функции являются ее точками Лебега. Фиксируем е > 0. Тогда^согласно лемме П 2.5 существуетjra- кое измеримое множество М£ с [to»*i]» что (h—to)—£ ^ mesM£, функции и, щ, (р и / непрерывны^на множестве М£ х W1 х W и для каждого х все точки из М£ являются точками Лебега функций t —» <р(£,а;,г1(£)), t —» y?(t,ж,гх»(*)) и аналогично для функции /.1 Далее, из теоремы Линдлефа (см^Нат], с. 53)2 следует, что существует подмножество М£ с М£, полученное из М£ отбрасыванием не более, чем счетного множества точек так, что каждая точка из М£ является точкой конденсации. Таким образом, множество М£ не содержит изолированных точек и (*i -t0) - е ^ mes М£. 1 Напомним, что точка хо называется точкой Лебега функции х —> д(х), xo + h если в этой точке выполняется условие: lim^^o ft*"1 J \д(х) — д(хо)\ dx = 0. Xq 2 Теорема утверждает, что у несчетного множества существует точка конденсации, т. е. точка, каждая окрестность которой содержит несчетное подмножество данного множества. Отсюда легко вытекает, что из множества можно удалить такое его счетное подмножество, что каждая точка дополнения будет точкой конденсации полученного множества.
§ 5. Общая задача оптимального управления 77 Выберем во множестве М£ счетное всюду плотное множество различных точек {U},i = 2,3, Зафиксируем натуральное N такое, что N~2 < S/2. В силу свойств множества М£ для любой точки U существует последовательность различных точек из Ме, которая сходится к U. Поэтому для каждого натурального j ^ N существуют такие точки tjti(N) < ... < tjtN+i(N) из М£, что tje[tJfl(N),tjfN+1(N)l \tJfN+1(N) - tjfl(N)\ < N-1 \/j^N и [tjti(N),tjtN+1(N)] П [trtl(N),tjltN+1(N)] = 0 Vj ф f. Обозначим через H подмножество пространства C(RN,RN) квадратных N х N матриц £ = (fj,p), которое состоит из тех матриц £ G £(RN,RN), элементы которых удовлетворяют неравенствам 0 ^ £jiP ^ c(N). Здесь c(N) = \ min ttati+1(N) - t,ti(N)) > 0. Каждой матрице £ e H сопоставим допустимое управление по формуле: ип. с) = |Ч(*)> если * е (ЬАЮ> ЬАЮ + Ы> 1 < J>P < N'> \u(t) в противном случае. Множество управлений такого вида обозначим через Ы(Е). Теперь для фиксированных выше е > 0 и N рассмотрим задачу, полученную из задачи (Р) заменой множества управлений U на U(E). Эту задачу будем называть N-задачей. Выпишем ее в явном виде. Рассмотрим для этого задачу Коши: х = </>(*, я, u(t; О), я(*о) = хо, (5.2) где £ G Н и хо е Мп. Из стандартных теорем теории обыкновенных дифференциальных уравнений (с учетом леммы П 2.4) получаем, что для всех (GS, близких к нулю, и хо е Мп, близких к ж(£о)> существует единственное решение задачи (6.2), определенное на всем отрезке [to,*i]. Обозначим его через X(t;xo,£).
78 § 5. Общая задача оптимального управления Таким образом, iV-задача имеет вид: Фо(яо,0 -> min> *i(*o,0 < 0, Ф2(х0,0 = 0, (6.3) где *o(zo, О = Фо(хо, X(h;x0,0) + /(*, *(*; х0,О, «(*, О) <Й, v ^2(^0, О = Ф2Ы, X(ti; хо, £)) и хо пробегает некоторую окрестность x(to), а £ —некоторую окрестность нуля в S. 2. Необходимые условия минимума в N-задаче. Покажем, что задача (6.3) удовлетворяет условиям следствия 1 теоремы П2.2. Действительно, в силу стандартных утверждений теории обыкновенных дифференциальных уравнений существует такое 7 > 0, что отображение непрерывно на множестве [to,ti]x(x(to)+7Si)x(7S2f|s)5 где В\ и Вч — единичные шары соответственно в W1 и £(R^,R^). Более того, для произвольного заданного t G G [io>*i] отображение X(t;-,-) дифференцируемо относительно множества (x(£0)+7^i) х (7¾ ПН) по (хо>0 в точке (я(*о)>0)> т. е. для любых хо G x(to) + jBu £ G 7¾ П S, t G [t0, ti] справедливо представление: Х(*;х0,0=*(*;*(*о),0)+ +X,o (t)(x0 - x(t0)) + X€(t)£ + o(|x(t0) - *o| + №\). Здесь Хж (t) и -Х^(£) — соответствующие линейные операторы.1 1 Отметим, что X^(t) является всего лишь односторонней производной
§ 5. Общая задача оптимального управления 79 В силу леммы П2.6 где Ф — решение (фундаментальная матрица) матричного уравнения Ф(*) = <px{t, x(t), 2(*))Ф(*), Ф(*0) = И и Id — единичная матрица. Из сказанного следует, что iV-задача удовлетворяет всем предположениям следствия 1 теоремы П2.2. Согласно этому следствию существует такой ненулевой набор множителей Ла- гранжа АдГ = (Адг, Адг, Адг), что А^ > О, A]v ^ 0, A]v • *i(x(t0), 0) = 0 (6.4) и для функции Лагранжа Цхо,£, Xn) = А^Ф0(жо,0 + A]v • *i(so,0 + >?n ' ^2(^0,0 задачи (6.3) выполняются условия: CXQ(x(to),0,\N) = 0, (6.5) %Р№)),0, Алг) ^ 0, l^j.p^N. (6.6) Будем далее считать, что |Адг| = Адг + |Адг| + |Адг| = 1. Обозначим через рдг решение задачи Коши Р = ~P<Px(t) + X°Nfx(t), р(*о) = lx0 (я(*0), z(*i), Адг). (6.7) Тогда по формуле для решения линейного дифференциального уравнения имеем (см. теорему П1.7) PN(h) = = I lx0(^to\x(tl)^N) + X°N J Д(*)Ф(*)А J Ф-Ч*!). (6'8) и функция X не обязана быть дифференцируемой (даже в указанном смысле) в близких точках.
80 § 5. Общая задача оптимального управления Расшифруем теперь условия (6.5) и (6.6). Равенство (6.5) означает, что 0 = 1Xq (x(t0),x(ti), XN) + Ц (я(*о), x(ti), Xn)XXq (ti)+ ti + Л о N fx(t)XXQ(t)dt = Zo:0(x(to),^(*i), Aiv)+ to ti 0 + lXl (x(t0), x(ti), Ллг)Ф(*1) + A^ /*(*)*(*) Л. V to Из этих соотношений, используя (6.8), получаем: -Ц (я(*о), z(*i), Адг) = Piv(ti). (6.9) Таким образом, условия трансверсальности (Ь) доказаны. Перейдем к расшифровке соотношений (6.6). Фиксируем индексы j и р. Пусть матрица £ е Н такова, что единственным ее ненулевым элементом является £^р > 0. Обозначим AX(t,0 = X(t,x(to),0-^(*^(*o),0) и Д/(*,0 = А*,х(*,х(*оиЫ*,0) - /(*>£(*),«(*))• Тогда имеем 0 ^ -£&р(х(«о),0,Алг) = -^(^o)^(ti), AN) -X&p(ti)- а 0& V (/(t,x(t,x(t0),O^(t,O)*| k=o = v*0 = ^1 (pN(ti)-AX(tbO-A0NJA/(t,O*) +«(0 = to •Jlp (2} .-i 4?*,p tl I (p;v(t) • AX(t,0 ) - \%Af(t,t) ) dt + /.(0, to где я (f) -> 0, при £j?p -» 0.
§5. Общая задача оптимального управления 81 Здесь равенство = вытекает из (6.9) и определения производной по переменной £^р, а равенство = следует из формулы Ньютона-Лейбница и того, что ДХ(0,£) = 0. Далее, -(рлг(*)-ДХ(*,0) -ASrA/(t,o) Л = tl (рлг(*) • ДХ(*,0 +Рлг(*) * (^(*, X(t, ,x(t0), 0^(*,0)- (pN(t) ■ AX(t,o + н(t,x(t,oMt,ti),PN(t),\N)- to -H(t,x(t),u(t),pN(t),\°N))dt® h (3) 0 to (4) ti (pN(t) ■ AX(t,0 + Hx(t,x(t),u(t),PN(t),\%) ■ AX(t,0+ + H(t,x(t),u(t,O,PN(t),\0N)- - H(t,x(t),u(t),Ы*), *%)) dt + ofovp) (=} (H(t,x(t),u(t,0,PN(t),X°N)- to 0 - H(t, x(t),u(t),pN(t),XuN)) dt + o(^p). Равенство = верно в силу того, что I Hx(t,x(t),u(t,£),pN(t),\°N)-AX(t,Odt = to tl О Hx(t, x(t), u(t),pN{t), \"N) • AX(t, О dt + o(£J9P), to
82 §5. Общая задача оптимального управления (4) а = вытекает из того, что по построению вектор-функция рдг(-) удовлетворяет уравнению (6.7). Таким образом, мы получили, что О ^£-1 ti (H(t,x(t),u(t,0,PN(t)A°N\ - to о - H(t,x(t),u(t),PN(t),\"N)) dt + o(^p)). Но из определения управления г/(-,£) следует, что ti (H(t, x(t), u(t, 0,PN(t), X°N) - H(t, x(t), u(t),pN(t), X%)) dt = to - н(^р(М),щ>р(М))МЬАЮ),рм(^Ю)А%)) +o(^,p), так как по построению каждая из точек tjiP(N) является точкой Лебега каждой из функций Hp(t) = H(t,x(t),up(t),pN{t),\°N) и H(t) = H(t,x(t),u(t)iPN(t),\°N). Переходя к пределу при £^р —» 0, получаем, что ^#(^Р(Л0,*(^^ Vj,p^N. (6.10) 3. Предельный переход. Напомним, что е > 0 фиксировано. По построению векторы Лдг являются единичными, а векторы pw(*i) ограничены (в силу (6.9)), и поэтому можно считать, ЧТО Лдг —» Х£ И PN(h) —> —»pe(ti) при N —» оо. Из последнего и свойств решений линейных дифференциальных уравнений следует, что рдг(-) сходится
§ 5. Общая задача оптимального управления 83 при N —» оо равномерно на [to>*i] к функции ре(-)> которая удовлетворяет соотношениям (см. (6.7)) (6.11) Р=-р&(*) + А°Д(*), р(*о) = lx0{x(t0),x(t1),\£) и -t1(2(t0),x(ti),Ae)=Pe(ti). (6.12) Зафиксируем индексы j,p. В силу (6.1) имеем: tjiP(N) —»tj, iV —» оо. Переходя в (6.10) к пределу при iV —» оо и используя непрерывность соответствующих функций на Ме, получаем: По построению для любого фиксированного j последовательность {up(£j)} всюду плотна во множестве U(tj). Поэтому, используя непрерывность по и функций <р и /, получаем: Я(^,х(^),^),р£(^),Л^)^ В то же время последовательность {tj} всюду плотна в Ме. Поэтому, переходя в полученном неравенстве к пределу при j —» —» оо, имеем: H(t,x(t)Mt),Pe(t)A°e) > H(t,x(t),U,p£(t)A°e), Ми е U(t) и для п. в. t е Ме. Осуществляя аналогичным образом еще один предельный переход в (6.11) и (6.12) при е —» 0, получаем соотношения (a)-(d). Проведенные выше рассуждения были сделаны в предположении, что множества U(t) равномерно ограничены для п. в. t. В общем случае надо рассмотреть пересечение U(t) с шаром
84 §5. Общая задача оптимального управления достаточно большого радиуса, а затем в полученных соотношениях перейти к пределу при стремлении радиуса этого шара к бесконечности. 4. Доказательство условия (е). Наряду с задачей (Р) рассмотрим такую задачу: tl f(xn+1(t),x(t),u(t))(v(t) + l)dt + ^о(я(*о), x(ti}) -> min, *o x = (v + 1)<р(хп+1,х, u), xn+1 = v + 1, ^i(x(t0),s(*i)) < 0, i;2(x(t0),x(t1)) = 0, xn+1(*o) = *o, xn+1(*i)=ti, w(t) G C7(t), |v(t)| ^ 1/2 для п. в. t, которую будем называть ^-задачей. Управлением в ^-задаче является пара (гх(-),?;(•)), где v(-) — скалярная функция, а фазовая переменная (x,xn+1) е Mn+1 содержит дополнительную скалярную координату хп+1. Оказывается, что исходная задача (Р) и ^-задача эквивалентны в следующем смысле. Допустимый процесс (я( •),?/(•)) является локальным понтрягинским минимумом в задаче (Р) тогда и только тогда, когда процесс (#(-),0^+1 (-),^(-),0) является локальным понтрягинским минимумом в ^-задаче, где #^+1 = t. Действительно, пусть — допустимый процесс в ^-задаче. Тогда функция хп+1(-) лип- шицева и xn+1(t) ^ 1/2 для п. в. t. Поэтому в силу теоремы об обратной функции (см. [Кл], с. 231) функция хп+1(-) имеет обратную функцию х(*)> которая тоже является липшицевой. Положим x{t) = x{x{t)),u{t)=u{X{t)). Непосредственно проверяется, что (#(-),^(-)) является допустимым процессом в задаче (Р) и
§ 5. Общая задача оптимального управления 85 Обратный переход от допустимого процесса задачи (Р) к допустимому процессу ^-задачи очевиден. В силу доказанного процесс (х(-),0^+1 (-),^(-),0) является локальным понтрягинским минимумом в ^-задаче. Применим к нему необходимые условия, полученные на предыдущем этапе. В силу этих условий существуют множители Лагранжа Хр(*)>Рп+1(*)> Для которых имеет место (a)-(d). Из условия максимума (с) вытекает, что pn+1(t) + H(t) = 0, а из уравнения Эйлера (а) —что pn+1(t) = -Ht(t) для п. в.£. Дифференцируя первое из полученных тождеств по t и подставляя во второе, получаем (е). Теорема доказана. В заключение кратко обсудим связь необходимых условий минимума в форме принципа максимума Понтрягина с достаточными условиями оптимальности. Если ограничиться рассмотрением классических понятий слабого и сильного минимума, то принцип максимума Понтрягина (как и другие условия первого прядка) не гарантирует, вообще говоря, существование даже слабого локального минимума. Для доказательства его существования нужно привлекать условия второго порядка. В вариационном исчислении — это отсутствие сопряженных точек, в оптимальном управлении — это положительная определенность некоторых специальных квадратичных форм. Сказанное демонстрирует задача, рассмотренная перед формулировкой теоремы 2. Детальное обсуждение условий второго порядка (как необходимых, так и достаточных) выходит за рамки данной книги, и мы отсылаем читателя к книгам [ИТ] и [АТФ]. В то же время рассмотрение определенного выше понтрягин- ского минимума приводит к интересному эффекту. А именно, некоторое усиление условия (с) в теореме 2 дает достаточные условия локального понтрягинского минимума. Для простоты формулировок будем предполагать, что множества U(t) С W ограничены равномерно по t Е [to^i] и имеют вид: U(t) = {ueW \ R{u,t) ^ 0, S(u,t) = 0}, Vt G [t0,*i], где отображения R: W x [*0,*i] -> Kmi и S: W x [t0,*i] -> Mm2 непрерывны по совокупности переменных, дважды непрерывно
86 § 5. Общая задача оптимального управления дифференцируемы по и и удовлетворяют следующим условиям регулярности: для каждого t G [to»*i] и и € ^(*) rank Sfu (и, t) = 7¾ и 3 a(u,t) G Ker54(w,t) такое, что R'uj(u,t) • a(u,t) > О для всех j, для которых Rj(u,t) = О, (R'u(u,t) и 5^(w,t) — производные по г/ отображений Д = = (Дь...,Ят2)т и 5 = (Si,...,Smi)T в точке (u,t), a R'uj(u,t), 1 < j ^ mi —строки матрицы R'u(u,t)). Кроме того, будем предполагать, что в задаче фиксирован левый конец. Другими словами, рассматривается следующая задача ti J(x{-), u(-))= /(t,a;(t),tx(t))(ii + ^o(a;(ti))-^min, (Pi) v £ = (p(t,x,u), a; (t0) = a?o» ^i(x(*i))<0, ^2(x(*i)) = 0, (5.3) w(t) G C/(t) для п. в. t G [to, ti], Теорема 3. (Достаточные условия понтрягинского минимума). Пусть (х(-),и(-)) — допустимый процесс в задаче (Pi), существуют множители Лагранжа р(-) и X, для которых выполнены условия (a)-(d) теормы 2, и существует е > 0 такое, что н(г,Цг),Цг),р(г),Хо)>н(г,щЩ,р(г),Хо) + е\и-и(г)\2 для всех и G U(t) и n.e.t G [to, ii]. Тогда процесс (х(-),и(-)) является строгим локальным понтрягинским минимумом в задаче (Pi). Доказательство теоремы см. в [Ар2].
§ 6. Задачи с фазовыми ограничениями В прикладных задачах часто возникает ситуация, когда помимо ограничений, присутствующих в задаче (Р), есть еще ограничения на фазовые переменные. Рассмотрим здесь задачу такого вида: J(x(.)M-)) = ti /(t, x(t),u(t)) dt + i>o(x(to),x(ti)) -> min, to (P2) x = y?(t, ж, гг), ^i(x(to), xfa)) < 0, Mx(t0), x(h)) = 0, g%(t,x{t)) ^0, Vi E [*o,*i], г = 1,...,m, w(t) G U(t) для п. в. t € [*o»*i]» где /, у? и ^, г = 0,1,2, — те же, что и в задаче (Р), а #г: R х xRn-> R, 1 ^ г ^ га — заданные функции. Ограничения вида g%(t,x{t)) ^ 0 Vt называются фазовыми ограничениями. Исследование задач с фазовыми ограничениями существенно сложнее и поэтому мы ограничимся лишь формулировкой соответствующего результата — принципа максимума Понтрягина для задачи (Рг). Теорема 4. (Принцип максимума Понтрягина в задаче с фазовыми ограничениями). Пусть выполнены предположения теоремы 2 и функции gi, 1 ^ г ^ т, непрерывны по совокупности переменных и непрерывно дифференцируемы по х. Тогда если (ж(•),{£(•)) — сильный локальный минимум в задаче (Рг), то найдутся вектор A = (Ao,Ai,A2), где Ао ^ 0, Ai ^ 0, вектор-функция ограниченной вариации р(-): [to,*i] —> —» (Rn)', неотрицательные борелевские меры щ, 1 ^ г ^ т, сосредоточенные соответственно на множествах Т{ = {t е £ [*(b*i] I 9i(t,x(t)) = 0}, 1 ^ г ^ m, не равные одновременно нулю, такие, что выполнены:
88 §6. Задачи с фазовыми ограничениями (а) уравнение Эйлера: pit) = -Ц(ж(*о),£(*1),А)+ ti + т ti Нх(т, я(т), й(т),р(т), Ло) *г - ]П ^(т, я(т)) йщ\ г=1 (b) условия трансверсальности: (c) условие максимума: max Я(*,ж(*),гх,р(*),Л0) = H(t,x(t),u{t),p(t), Л0) uec/(t) для п. e.t е [to, ti]; (d) условие дополняющей нежесткости: Ai "0i(x(£o),x(£i)) = 0. (e) £сли, кроме того, функции f, ip и gi, 1 ^ г ^ га, непрерывно дифференцируемы по совокупности переменных, U(t) = U и для допустимого процесса (я( •),?/(•)) и жяо- жителей Лагранжа \,р(-) и щ, 1 ^ i ^ т, выполнены условия (a)-(d), то существует такая константа с, что ti тахЯ(*,ж(*),гх,р(*),Л0) + (Яг(т,х(т),г£(т),р(т), А0) dr- иеи t m ti i=l ^2 9it(r,x(r))) dm = c Vt G [t0, ti]. Впервые необходимые условия минимума в форме принципа максимума для задач оптимального управления с фазовыми
§6. Задачи с фазовыми ограничениями 89 ограничениями были получены Р. В. Гамкрелидзе (см. [ПБГМ]), а в приведенной здесь форме принцип максимума доказан А. Я. Дубовицким и А.А.Милютиным [ДМ]. Доказательство теоремы 4 можно найти в [ИТ], [Apl]. Рассмотрим здесь одну задачу оптимального управления с фазовыми ограничениями, интересную тем, что поведение оптимальных траекторий вблизи фазовых ограничений носит несколько неожиданный характер, что можно увидеть только применив принцип максимума. Обозначим х = (#i, Х2)т, хо = (хю, #2о)Т» и — (^ъ и2)Т и Рас" смотрим задачу X2(t) dt —» min, о (i) х = и, и х(0) = Xq. ^1, Х\ - Х2 ^ О, ~Х\ - Х2 ^ О, Множество G = {х = (#ь£2)т € М2 | х\ - Х2 ^ 0, —х\ - — Х2 ^ 0}, которое выделяют фазовые ограничения, симметрично относительно оси ординат (см. рис. 7), и поэтому далее будем считать, что #ю ^ 0. Рассмотрим сначала несколько случаев, когда поведение оптимальной траектории очевидно (и легко проверяемо). ПуСТЬ Х0 = (яю,£2о)Т е G> Х2° > > 0 и яю = 0. Тогда понятно, что надо идти вдоль оси ординат по направлению к нулю с максимальной по модулю скоростью, т. е. u(t) = = (0, -1)т и тем самым x\(t) = 0, X2(t) = Х20 - t. Если жг(1) ^ 0> то это и есть оптимальная траектория. Если же жг(1) < 0> то> начиная с момента ti, когда жг(*1) — 0> мы время 1 — ti должны «стоять» в нуле, т. е. u(t) е 0 и x(t) = 0 при tG[ti,l]. Рис. 7. Задача с фазовыми ограничениями.
90 §6. Задачи с фазовыми ограничениями Пусть теперь хю > 0. Если х2о — хю ^ 1, то процесс u(t) = (0, -1)т, xi(t) = жю, ж2(*) = я2о ~ *» очевидно, оптимален. Если хо = (хю,Х2о)т 7^ 0 принадлежит границе области, то, очевидно, надо идти вдоль границы по направлению к нулю с максимальной по модулю скоростью, т. е. u(t) = = (-1/^2)(1,1)т, xi(t) = х10 - (1/л/2)*, x2(t) = х20 - (1/д/2)*, и если мы достигли нуля за время меньшее единицы, то оставшееся время надо «стоять» в нуле и в этом случае u(t) = 0, x(t) = 0 (см. рис. 7). Теперь подробнее рассмотрим наиболее интересную ситуацию, когда хо принадлежит внутренности области G, хю > > 0, и траектория по времени разбивается на два участка [0, ti) и [ti,l], где t\ < 1, следующим образом. На участке [0,ti) траектория находится внутри области G, в момент времени t\ она попадает на границу, и дальше, как мы уже выяснили, ее путь предопределен. Нас интересует характер выхода траектории на границу. Оказывается, что это происходит гладким образом, т. е. вся траектория — гладкая кривая. Итак, пусть (х(-),и(-)) — оптимальный процесс в рассматриваемом случае. Согласно условию максимума в теореме 4 v(t)T 2(*) = Г77^ Для всех * G [°> Я гДе Р(*) Ф °> (2) а в силу уравнения Эйлера p(t) = (l-t)X0e1-fi(t)e2j (3) для всех t Е [0,1], где е\ = (0,1), е2 = (1,-1), функция //(•) (как функция нижнего предела интеграла по неотрицательной регулярной мере) монотонно убывает, непрерывна слева (регулярность меры) и постоянна на [0,ti). Проверим, что Ао ф 0. Допустим противное и покажем, что в этом случае все множители Лагранжа нулевые. Докажем сначала, что p(t) = 0 на [0,1]. Действительно, если Ао = 0, то из (3)
§6. Задачи с фазовыми ограничениями 91 следует, что p(t) = —fi(t)e2 для любого t G [0,1]. Как было отмечено выше, u(t) = (—1/л/2)(1,1)т на отрезке [ii, 1] и тогда, если г е [tb 1] и р(т) ф 0, то в силу (2) р(т) = (-|p(r)|/v^)(l, 1). Но векторы в2 и (1,1) ортогональны и поэтому, умножая скалярно последнее равенство на ег, получаем, что р(т) = 0. Противоречие доказывает, что p(t) = 0 на [ii,l]. Далее согласно условию (е) теоремы 4 имеем (с Ао = 0) maxp(t) • и = с = const. Из доказанного вытекает, что с = 0, а значит, р(£) = 0 для любого t Е [0,1]. Из равенства p(t) = —/i(t)e2 следует, что и /i(£) = 0 на [0,1]. Таким образом, все множители Лагранжа нулевые, что невозможно, и поэтому Ао Ф 0. Далее считаем, что Ао = 1. Гладкий выход на границу означает, что функция х(-) = и(-) непрерывна в точке t\. Для этого, в силу (2), достаточно доказать, что функция р(-) = (pi(*)?P2(*)) отлична от нуля и непрерывна в t\. Умножая (3) скалярно на вектор (1,1), получаем, что pi(t) +P2(t) = 1 -1, т.е. р(-) отлична от нуля всюду кроме точки t = 1. В силу (3) функция р(-) непрерывна слева и тем самым нужно доказать, что p(t\ + 0) = p(h). Допустим, что это не так. Тогда функция //(•) в точке t\ имеет скачок 5 = fi(ti) — - /i(ti + 0) > 0 (//(•) убывает) и из (3) вытекает, что p(ti + 0) = p(ti) + 6е2. (i) Если t\ < t < 1, то p(t) /Ои согласно (2) вектор p(t) пропорционален вектору (1,1). Следовательно, p(t) -е^ = 0 и в пределе при t —» t\ + 0 получаем, что p(ti + 0) • е^ = 0. Учитывая это, выводим из (i), что p(ti)-e^ = -25 <0. Отсюда в силу непрерывности р(-) слева вытекает, что р(£) х хе[ < 0 для t < t\ достаточно близких к t\. Это означает в силу (2), что e2-x(t) < 0 для тех же t. Поскольку e2-x(t{) = 0 (x(ti) принадлежит границе), то из этих соотношений следует,
92 §6. Задачи с фазовыми ограничениями что в2 • x(t) > 0 для t < t\ близких к ti, т.е. для данных t траектория находится вне области G, что невозможно. Таким образом, функция р(-) непрерывна в точке t\ и, значит, х(-) гладко выходит на границу (см. рис. 7). Для того, чтобы построить сам оптимальный процесс (ж(-),гх(-)) нужно знать два параметра: р(0) и ti —момент выхода х(-) на границу. Действительно, из (3) следует, что на интервале времени [0,ii] p(t) = р(0) + t\ei. Тогда из (2) мы найдем и(-) и, значит, #(•). Поведение оптимального процесса на границе известно. Выпишем уравнения, которым должны удовлетворять эти параметры. Из (2) и непрерывности р(-) в t\ имеем p(h)T 1 / 1 e(ti) = Ip(*i)I V2 V i Далее, x(ti) = Xq + " «*т * о ip(*)i и в2 • x(ti) = 0. Объединяя выписанные соотношения, приходим к следующим уравнениям (p(0)+tiei)T |р(0) + tiei (p(0) + tei)r dt =0 о относительно неизвестных р(0) и ti. Отметим одну особенность, характерную для задач с фазовыми ограничениями. Как уже говорилось выше, если фазовые ограничения отсутствуют, а концевые ограничения удовлетворяют некоторым условиям регулярности, то можно гарантировать выполнение соотношения: Ло + |р(£)| ^ 0 для всех t G [to» *i]- Если задаче фазовые ограничения присутствуют, то это уже не так: данное соотношение может нарушаться для любых множителей Лагранжа. Более того, следующий пример (предложенный
§6. Задачи с фазовыми ограничениями 93 А. Я. и В. А. Дубовицкими) показывает, что для любых множителей Лагранжа необходимо Ао = 0 и p(t) = 0 на (*о> *i]- Рас~ смотрим задачу 1 u(t) dt —» min, х = tu, x(0) = 0, x(l) = 0, — x ^ 0. о Покажем, что процесс (0,0) является оптимальным. Действительно, для любого допустимого процесса (х(-),и(-)) и любого 0 < е < 1 имеем (интегрируя по частям и учитывая, что из ограниченности и(-) следует, что \x(t)\ < ct и тем самым \х(е)\ < се2) 11 1 1 S1 гх(*) dt = t_1i(t) dt = -e~lx(e) + t~2x(t) dt ^ -e~lx(e), ее e 1 откуда при e —» 0 получаем, что /г/(£) dt ^ 0. о Из условия максимума следует, что tp(t) - А0 = 0, т.е. p(t) = Aot"1. Но функция р(-) ограничена и поэтому Ао = 0 и p(t) = 0 на (to,ti]. В качестве меры /ii можно взять 5-функцию в нуле. В то же время можно указать простые условия, гарантирующие существование таких множителей Лагранжа, для которых выполнены условия (a)-(e) теоремы 4 и при этом А0 + mes {t G [t0, h] | p(t) ф 0} > 0. Приведем эти условия, ограничиваясь для простоты случаем, когда U(t) = U, где С/ — ограниченное множество и концы траектории фиксированы (т.е. x(to) = #о и x(ti) = #i, a #o,xi заданы).
94 §6. Задачи с фазовыми ограничениями Будем говорить, что в точках хо и х\ выполнены условия управляемости относительно фазовых ограничений, если существуют такие щ,и\ g U, что gix(to,x0) - f(to,xo,u0) + git(t0,xo) < 0, Mi: gi(t0,x0) = 0 и 9ix(ti,xi) • f(ti,xi,ui) + git(ti,xi) > 0, Mi: g%{ti,xi) = 0. Лемма. Пусть процесс (¢(-),2(-)) является сильным локальным минимумом в задаче (Рг), # которой концы фиксированы, U(t) = С/, фазовые ограничения регулярны, т. е. для любого t G [to, ti] существует вектор a(t) G Мп такой, что 9ix(t,x(t)) • a(i) > 0 для всех тех г, для которых g%{t,x{t)) = 0 и в точках хо и х\ выполнены условия управляемости. Тогда существуют множители Лагранжа X, р(-) и щ, 1 < ^ г ^ т, для которых выполнены утверждения теоремы А, а также условие нетривиальности А0 + mes {t G [t0, *i] I p(t) ф 0} > 0. Доказательство см. в [Apl]. Отметим, что если исследуемый процесс, являющийся сильным локальным минимумом, удовлетворяет дополнительному предположению, называемому управляемостью траектории относительно фазовых ограничений, то для него справедлив принцип максимума Понтрягина с более сильным, чем приведенное в лемме, условием нетривиальности. Это условие нетривиальности имеет вид: Ао + |р(*)|^0, VtG(t0,*i). Об этом можно прочесть во 2-й главе книги [Apl]. Наряду с фазовыми ограничениями в задачах оптимального управления рассматриваются также ограничения вида ri(t,x(t),u(t)) < 0, 1 < г < /, для п. в. t G [to»*i]»
§6. Задачи с фазовыми ограничениями 95 называемые смешанными ограничениями. Хотя формально фазовые ограничениям являются частным случаем смешанных, однако рассмотрение фазовых ограничений в таком качестве неэффективно. Действительно, пусть смешанные ограничения регулярны. В предположении, что все функции п непрерывны по совокупности переменных и непрерывно дифференцируемы по и, регулярность смешанных ограничений означает, что для любых (t,x,u) таких, что ri(t,x,u) ^ 0, 1 < г < Z, выполняется следующее: 3 а(£, ж, и) Е R : а(£, ж, и) • r^(t, ж, и) < 0, \/г: n(t, ж, г/) = 0. Тогда формулировка и доказательство принципа максимума следуют стандартной схеме и не встречают затруднений (см. например, [Apl]). Исследование задач с регулярными смешанными ограничениями в известном смысле проще, чем задач с фазовыми ограничениями. Если же смешанные ограничения нерегулярны, то получение необходимых условий оптимальности принципиально усложняется и требует новых подходов и идей (см. [Мил]). Следует отметить, что построение теории таких задач в настоящее время находится лишь на начальном этапе.
Приложение I Дифференциальное исчисление функций многих переменных В этом приложении подробно обсуждаются вопросы, связанные с дифференцируемостью отображений конечномерных пространств и формулируется ряд утверждений, необходимых для основного текста. Кроме того, здесь приводятся некоторые сведения из теории обыкновенных дифференциальных уравнений и один топологический факт, касающийся понятия компактности в терминах центрированной системы. Здесь мы будем иметь дело с функциями многих переменных, т. е. с функциями, определенными на подмножествах пространства W1. Напомним необходимые для дальнейшего определения и факты, связанные с самим этим пространством, дифференциальными свойствами функций на нем, а также договоримся об обозначениях. Пространство W1 — это совокупность всех упо- /*i \ рядоченных наборов х = V хп ) называемых векторами или вектор-столбцами, а сами числа xi,... ,хп называются координатами вектора х. Ради экономии места, элементы W1 будем записывать так: где Т означает транспонирование. В W1 естественным образом вводится операция (покоординатного) сложения векторов и операция (покоординатного) умножения вектора на число, превращающие это множество в вещественное векторное пространство. Наряду с пространством W1 будем также рассматривать пространство (Шпу, элементы которого суть те же наборы из п действительных чисел, но расположенные в строку, с аналогичными операциями сложения и умножения на числа. Элементы (ШпУ также называем векторами или вектор-строками. Пусть из п действительных чисел,
Приложение I 97 a = (ai,...,an) G (Mn)' и x = (xi,... , xn)T G W1. Обозначим a-x = ^27=1агхгу т-e- это число есть матричное произведение вектор-строки а на вектор-столбец х. Для каждого a G G (Мп)' отображение х —» a • х, очевидно, есть линейный функционал (линейная функция) на W1. Легко видеть, что и любой линейный функционал I на W1 задается подобным образом с a = (/(ei),...,Z(en)), где е\ = (1,0,... ,0)т,... ,еп = (0,... ... ,0,1)т— стандартный базис в W1. В этом смысле мы отождествляем пространство (Rn)f с пространством всех линейных функционалов на Шп. Пусть х = (#i,..., хп)т G W1. Величина х = \/Х? + ... +Х п (или, короче, \х\ = VxT • х) называется длиной или модулем или евклидовой нормой вектора х. Для любых х, у G W1 справедливо неравенство Коши-Буняковского: т х -у < х У Длина вектора удовлетворяет следующим (легко проверяемым) свойствам: \х\ ^ 0 и |х| = 0 тогда и только тогда, когда х = 0, ах\ = \а\\х\ для любых х G R и a G R, |х + у| ^ \х\ + \у\ для любых х,у G R. Если х иу из Мп, то величина |х—у| называется расстоянием между векторами х и у. Пусть х G Мп и 5 > 0. Множества %(x;Rn) = {xGKn х — х <*} и B^;Mn) = {xGRn X — X ^5} называются соответственно открытым и замкнутым шаром с центром в точке х радиуса 5. Множество в Rn называется открытым, если с каждой своей точкой оно содержит и некоторый шар с центром в этой точке. Любое открытое множество, содержащее данную точку, называется окрестностью этой точки.
98 Приложение I Все введенные понятия без изменений переносятся на пространство (Rny. Пусть М — подмножество Rn и /: М —» R. Говорят, что функция / непрерывна в точке х е М, если для любого е > О найдется такая окрестность U точки х, что \f(x) — f(x)\ < в для всех х е М DU. Если функция / непрерывна в каждой точке множества М, то говорят, что / непрерывна на М. Пусть теперь задано отображение F: М —» Rm. Это равносильно тому, что на М задано т функций. Действительно, координаты вектора F(x) суть т функций на М. С другой стороны, если на М заданы функции /i,..., /т, то они определяют отображение F по правилу: х -> F(x) = (Л(ж),..., fm(x))T, хеМ. В этом смысле все вопросы, связанные с отображениями, можно свести к соответствующим вопросам для функций. Однако часто удобно (и полезно, имея в виду обобщения на бесконечномерный случай) иметь дело именно с отображениями. Говорят, что отображение F: М —» Rm непрерывно в точке х G М, если для любого е > 0 найдется такая окрестность U точки х, что \F(x)-F(x)\ <е для всех х е М DU. Если отображение F непрерывно в каждой точке множества М, то говорят, что F непрерывно на М. Легко проверить, что это эквивалентно тому, что все функции, задающие F, непрерывны в точке х е М (на М). Теорема П1.1. (о непрерывности суперпозиции отображений). Пусть Mi с W1, М2 С М™ Fi: Мх -> Rm, F2: М2 -> Rs и Fi(M\) с М2. Если отображение F\ непрерывно в точке х G G Mi, а отображение F2 непрерывно в точке F±(x) G М2> то суперпозиция отображений F2oF\\ М\ —» Rs непрерывна в точке х. Доказательство этой теоремы следует фактически из определений и поэтому мы его не приводим.
Приложение I 99 Пусть [/ — окрестность точки х G Шп. Говорят, что функция /:£/—► Ш дифференцируема в точке х, если существует такой линейный функционал на Мп, т.е. вектор a = (ai,...,an) G G (Мп)', что для всех h G Мп, для которых х + h G U, справедливо представление где r(/i)/|/i| —» 0 при h —» 0, т.е. г (Л) = о(/г). Вектор а, определяемый этим представлением однозначно, называется производной функции f в точке х и обозначается fix). Из определения легко следует (беря в качестве h векторы (/ii,0,... ... ,0)т,..., (0,... ,0, hn)T), что щ есть частная производная функции / по Х{ в точке х, 1 ^ г ^ п. Таким образом, fix) = = (df(x)/dxi,..., df(x)/dxn). Существование частных производных функции / в точке х не гарантирует, как показывают простые примеры,1 дифференцируемое™ (и даже непрерывности) / в данной точке. Однако, если все частные производные функции f непрерывны в х, то f дифференцируема в этой точке. Если функции Д и /2 дифференцируемы в точке хиа^^- любые числа, то легко видеть, что (ахД+аг/гУО?) = ai/i(#) + + a2f2{x). Если функция / дифференцируема в точке х, то она, очевидно, непрерывна в данной точке. Пусть А — симметричная матрица размера п х n, be (Мп)', с G R и /: W1 —» R — квадратичная функция, определяемая по правилу f(x) = х • Ах + Ъ • х + с. Тогда простая выкладка показывает, что f(x) = 2хТА + Ъ для любого X G Шп. 1 Например, функция, которая на плоскости равна нулю всюду, кроме множества {(х1,хг) | #2 = у/х{, #i > 0}, а на самом этом множестве тождественно равна единице.
100 Приложение I Если f дифференцируема в каждой точке множества U, то говорят, что / дифференцируема на U. Пусть Л: W1 —» Rm — линейный оператор. Мы будем отождествлять Л с его матрицей в стандартных базисах вГи Rm соответственно, так что Ах — произведение матрицы Л на вектор х. Пусть U — окрестность точки х Е W1. Говорят, что отображение F: U —» Rm дифференцируемо в точке х, если существует такой линейный оператор из W1 в Мт, т. е матрица Л размера га х п, что для каждого h е Шпу для которого х + h G U, справедливо представление F(x + h) = F(x) + Ah + p(h), где |p(/i)|/|/i| —» 0 при h —» 0, т.е. p{h) = o(h). Матрица Л, a она определяется этим представлением однозначно, называется производной отображения F в точке х и обозначается F'(x). Пусть U — окрестность точки х G W1 и fi: U —» R, г = 1,... ... ,т,— функции, задающие отображение F:U —» Mm. Условие дифференцируемости F в точке х эквивалентным образом записывается так: п fi(x + h) = fi(x) + ^2aijhj +pi{h), г = 1,..., га, где /г = (hi,..., /in)T и pi(/i)/|/i| —» 0 при /i —» 0, г = 1,..., га. Это означает, что функции /*: С/ —► R; г = 1,... ,т, дифференцируемы в точке х и dij = dfi(x)/dxj, г = 1,..., га, j = 1,..., п. Таким образом, F'(x) = (dfi(x)/dxj), г = 1,... ,га, j = 1,... ,п. Эту матрицу называют также матрицей Якоби отображения F в точке х. Легко видеть, что верно и обратное: если функции fi, г = 1,... ,га, дифференцируемы в данной точке, то задаваемое ими отображение также дифференцируемо в этой точке. Если отображение F дифференцируемо в каждой точке U, то говорят, что F дифференцируемо на U. Пусть функция / дифференцируема на U С Шп. Тогда определено отображение f:U—> (ШпУУ сопоставляющее х G U вектор
Приложение I 101 f(x). Если это отображение непрерывно в точке х (на [/), то говорят, что функция / непрерывно дифференцируема в х (на U). Последнее равносильно тому, что все частные производные функции f непрерывны на U. Обозначим через £(Mn,Mm) совокупность линейных операторов из W1 в Rm или, что то же (при указанном выше отождествлении), совокупность всех матриц А размера т х п. В этом векторном пространстве (с обычным поэлементным сложением матриц и умножением их на числа) введем норму A = maxlAxl. \х\<1 Простая проверка показывает, что норма удовлетворяет следующим условиям: \\А\\ ^ 0 и ||Л|| = 0 тогда и только тогда, когда А = 0; +А2\\ ^ olA а Л || для любых а еМи А еС(Шп,Шт); \\Аг + Ai|| + ||A2|| для любых А\,А2 G £(Rn,Rm). Расстояние между матрицами А\ и А\ определяется как \\А\ — -АгН- Теперь, аналогично тому, как это было сделано в Rn, мы можем ввести в £(Rn,Rm) понятия открытого и замкнутого шара, открытого множества и окрестности точки. Пусть М С R*. Отображение F: М -> £(Rn,Rm) непрерывно в точке х е М, если для любого е > 0 найдется такая окрестность U точки х, что \\F(x) — F(x)\ < е для всех х е Е М П U. Если отображение F непрерывно в каждой точке множества М, то говорят, что F непрерывно на М. Ясно, что задание отображения F: М —» £(Rn,Rm) равносильно заданию ran функций х —» a%j(x) на М, где a%j(x) — элементы матрицы F(x), и нетрудно проверить, что непрерывность F в х (на М) равносильна непрерывности всех этих функций в х (на М). Пусть U — окрестность точки х G Шп и отображение F: U —» —» Rm дифференцируемо на U. Тогда определено отображение F' из U в £(Rn,Rm), сопоставляющее х е U матрицу F'(x). Если это отображение непрерывно в х (на U), то говорят, что отображение F непрерывно дифференцируемо в х (на U). Непрерывная дифференцируемость F на U равносильна тому, что все
102 Приложение I частные производные функций, задающих это отображение, непрерывны на U. Пусть U — окрестность точки х G Mn, М — подмножество R*, у е М и F: U х М —» Rm. Если отображение х —» F(x, у) дифференцируемо в точке х, то соответствующую производную называют частной производной отображения F в точке (х,у) и обозначают Fx(x,y). Естественно, можно говорить о непрерывности этой производной в х (на U). Следующие две теоремы нам понадобятся при выводе необходимых условий экстремума. Теорема П1.2. (о производной суперпозиции отображений). Пусть U — окрестность точки х Е W1 и отображение F\: U —» Rm дифференцируемо (непрерывно дифференцируемо) в х. Пусть, далее, V — окрестность точки у = Fi(x) и отображение F2'. V —» Rk дифференцируемо (непрерывно дифференцируемо) в у. Тогда суперпозиция отображений F = F2 о F\: U —» Шк дифференцируема (непрерывно дифференцируема) в точке х и F'(x) = F>(y)F>(x). Доказательство этой теоремы практически не отличается от доказательства ее одномерного варианта (см., например, [Зор1], стр. 443). Теорема П 1.3. (о дифференцировании интеграла, зависящего от параметра). Пусть П = {(£, а) е R2 | t0 ^ t ^ ti, а0 ^ а ^ aj, функция f: П —» R и ее частная производная fa непрерывны на И, функции £,77: [ao,ai] —» [io»*i] непрерывно дифференцируемы. Тогда функция g: а 77(a) f(t,a)dt
Приложение I 103 непрерывно дифференцируема на [ao,ai] и для любого а е Е [ao,ai] справедлива формула 77(a) g\a) = f(rj(a),a)rj'(a)-f(t(a),a)£(a) + J fa(t,a)dt. Доказательство см., например, в [Зор2], стр. 402. Теорема Ферма и правило множителей Лагранжа Теорема П1.4 (Ферма). Пусть функция f определена в окрестности точки х еШп и дифференцируема в этой точке. Тогда если х — локальный экстремум f, то дх\ дхп Точки х, где fix) = 0, называются стационарными точками функции f. Доказательство. Пусть для определенности х — локальный минимум. Допустим, что f'{x) ^ 0. Тогда найдется такое h е Шп, что f(x) • h ^ 0. Следовательно, для всех достаточно малых а/0, знак которых противоположен знаку fix) • /i, будем иметь fix + ah) = f(x) + a(f(x) • h + r(a)/a) < fix) в противоречии с тем, что х — локальный минимум. □ Теорема П 1.5 (правило множителей Лагранжа для задач с равенствами). Пусть функции fi, 0 ^ г ^ т, непрерывно дифференцируемы в окрестности точки х Е Шп. Если х — локальный экстремум задачи /о(ж) -> extr, fi(x) = 0, 1 ^ г ^ га, то существует такой набор множителей Лагранжа А = (Ао,..., Ат),
104 Приложение I не равных одновременно нулю, что х является стационарной точкой функции Лагранжа С(х, A) = Y^Lo^ifi(x) данной задачи: т г=0 Доказательство этой классической теоремы можно найти во многих учебниках и монографиях. В Приложении II она выводится в качестве следствия более общих результатов (см. следствие 3 из теоремы П2.2). Сведения из теории обыкновенных дифференциальных уравнений При доказательстве части (Ь) теоремы 1 используются два факта из теории дифференциальных уравнений: частный случай теоремы о дифференцируемой зависимости решения дифференциального уравнения от параметров (лемма П1.6) и теорема существования и единственности решения линейной системы (теорема П 1.7). Лемма П1.6. Пусть N G N, щ(-) G C([£0,£i],Mr), <*i G G R, г = 1,..., JV, й(-) = (ui(-),...,un(-)), ol = (ab ... ,адг), txq(-,iZ(-)) = u(-) + Yji=iaiui(') и выполнены условия части (b) теоремы 1. Тогда найдется такая окрестность нуля V в RN, что для любого a G V существует решение Ха(-',й(-)) задачи Коти х = </?(*, ж, Wa(t;iZ(-))), x(to) = x0, (*) определенное на всем отрезке [to»*i]- Кроме того, Ха(-]й(-)) —» х(-) при а —» 0 равномерно на [io>*iL для каждого t G [to»*i] отображение а —» Xa(t',u(-)) непрерывно дифференцируемо naVu его частные производные в нуле на [*(b*i] удовлетворяют уравнениям: y = (px(t)y + (pu(t)ui(t), у(*о) = 0, l^i^N. (**)
Приложение I 105 Пусть задано отображение (матричная функция) A: [to»*i] —* —» £(Mn,Mn), сопоставляющее каждому t матрицу A(t) размера пхп. Мы говорим, что эта функция суммируема на [io>*i]> если на этом отрезке суммируемы все элементы данной матрицы. Теорема П1.7. (существования и единственности для линейной системы). Пусть матричная функция A: [to>*i] —> —» £(Mn,Mn) и вектор-функция Ь: [to»*i] ~* ^п суммируемы. Тогда для любых г G [£o>*i] и £ eM.n решение задачи Коши х = A{t)x + b(t), х(т) = £ существует на всем отрезке [to>*i] и единственно. Более того, это решение дается формулой x(t) = Ф(*) ( x(t0) + | Ф^ОО&ОО^ ) , to где Ф(-) — фундаментальная матрица, т.е. Ф(-) — решение матричного уравнения Ф = А(*)Ф, Ф(*0) = Id, a Id — единичная матрица. Замечание. Линейную систему р = —pA(t) + c(i), где Л —то же, что и выше, а с: [io>*i] —* (Кп)', называют системой, сопряженной к х = A(t)x + b(t). Для нее, при тех же предположениях на Л и с, справедлива аналогичная теорема существования и единственности и формула для решения. В конце этого приложения сформулируем одно утверждение топологического характера. Пусть {Ai} — некоторое семейство подмножеств R*. Говорят, что это семейство образует центрированную систему, Лебега если пересечение любого конечного числа членов этой системы не пусто.
106 Приложение I Лемма П1.8. (о центрированной системе). Множество М с С Шк компактно (т. е. ограничено и замкнуто) тогда и только тогда, когда любая центрированная система его замкнутых подмножеств имеет непустое пересечение. Доказательство см, например, в [КФ], стр. 99.
Приложение II Это приложение представляет самостоятельный интерес. Здесь доказывается конечномерный вариант обобщенной теоремы о неявной функции при минимальных предположениях, обсуждаются вопросы непрерывности, дифференцируемости и единственности неявной функции. На основе этой теоремы выводятся необходимые условия экстремума в конечномерной задаче с ограничениями типа равенств, неравенств и включений. Здесь также доказывается одна теорема существования в задаче оптимального управления. Кроме того, в этом приложении приведены некоторые результаты, связанные с теорией обыкновенных дифференциальных уравнений, и некоторые вспомогательные утверждения, необходимые для доказательства принципа максимума как в упрощенной, так и в общей задачах оптимального управления. Мы начинаем с некоторого обобщения понятия дифференцируемости отображения, данного в Приложении I, и пользуемся обозначениями, которые там были введены. Напомним, что Us(x;Rn) и В$(х;Шп) обозначают, соответственно, открытый и замкнутый шар вМпс центром в точке х радиуса 5. Пусть М — непустое подмножество Шп и задана точка х е М. Будем говорить, что отображение F: М —» W дифференцируемо в х относительно множества М, если найдется такой оператор Л: W1 —» Rs (т. е. матрица размера т х s), что для любого в > 0 существует 5 > 0 такое, что для всех х Е Us(x;Rn) П М выполняется неравенство \F(x)-F(x)-A(x-x)\ ^е х — X Легко видеть, что если х — внутренняя точка М, то это определение совпадает с тем, которое было дано раньше. Оператор Л будем обозначать F'(x) и называть производной отображения F в точке х (относительно множества М). В частности, если 5 = 1, т.е. если задана функция f:M—> —» М, то говорим о дифференцируемости / в х (относительно
108 Приложение II М) и соответствующий линейный функционал (элемент (Мп)') обозначаем f(x). Производная определяется, вообще говоря, неоднозначно, но нетрудно показать, что если, например, М — выпуклое множество с непустой внутренностью, то производная единственна. Ниже из контекста всегда будет ясно, относительно какого множества берется производная, и поэтому слова «относительно множества...» иногда будем опускать. Если Mi и М2 — подмножества Шк и Mn, х Е Мъу Е М2 и F: Mi х Mi —» Ms, то через Fx(x,y) и Fy(x,y) обозначаем частные производные, т. е. производные отображений х —» —» F(x,y) и у —» F(x,y) относительно множеств Mi и М2 в точках х и у соответственно. Обобщенная теорема о неявной функции и следствия из нее Доказательство обобщенной теоремы о неявной функции опирается на следующий результат Теорема (Брауэра о неподвижной точке). Пусть М — выпуклый компакт из W1 и F: М —» М — непрерывное отображение. Тогда существует такая точка х Е М, что F(x) = х. Теорема П2.1. (Обобщенная теорема о неявной функции). Пусть М — произвольное подмножество Rk, А — выпуклое подмножество Rn, имеющее непустую внутренность1, х Е Е М, yeAuF:MxA—> W. Пусть выполнены условия: 1) F(x,y) = 0; 2) отображение F непрерывно; 3) существует частная производная Fy(x,y) (относительно множества А) и при этом для каждого в > О 1 Непустота внутренности А нужна для единственности производной, о которой речь ниже.
Приложение II 109 найдутся такие Si(e) > 0 и 62(e) > О, что для всех х G USl(x;Rk) П М и у G иб2(у;Шп) П А справедливо соотношение \F(x,у) - F(x, у) - Fy(x, у)(у-у)\< е\У ~ V\i 4) Fy{x,y)yemtFy{x,y){A\ Тогда существует окрестность U точки х, отображение (неявная функция) <р: UDM —» А и константа К > 0 такие, что F(x,ip(x)) = 0 и \<р(х)—у\ ^ K\F(x,y)\ для всех х G UDM. Доказательство. Условие 4) равносильно тому, что OemtFy(%y)(A-y). Покажем, что найдутся такие: шар Br{0;Rs) С mt Fy(x,y)(A -у), г> О, непрерывное отображение R: Br(0;Rs) -> А-у и константа 7 > 0, что Fy(x,y)(R(z)) = z и |Д(*)|^7И для всех z G Br(0;W). Действительно, так как Fy(x,y)(A—y) — выпуклое множество и нуль принадлежит его внутренности, то это множество содержит 5-мерный симплекс S и О G intS (см. [МИТ]). Тогда и £?r(0;Ms) С mtS для некоторого г > 0. Пусть ei,..., es+i — вершины S. Любая точка z G S единственным образом представляется в виде z = ]РА*(2)е*,
по Приложение II где S + 1 А*(г)^0, l^i^s + 1 и ^2\i(z) = l, г=1 По условию существуют такие /¾ Е А — у, что Fy(x, у)/¾ = е», 1 < г < s + 1. Определим отображение R: Br(0;Rs) -> Мп, полагая Д(0) = 0 и R(z) = r~l\z\ J2t=i ^i(r\z\~~lz)fi> если z Ф Ф 0. Поскольку Y2t=l \{r\z\~lz)fi ^ ^4 — у (в силу выпуклости А - у), 0 ^ г_1|2:| ^ 1 (так как z G £?r(0;Ms)) и по условию 0 Е А — у, то (снова в силу выпуклости А —у) R(z) е А — у. Далее, s+1 Fy(x,y)R(z) — т 1к|^АДг|г| 1z)eir 1 Z = Z г=1 И \R(z)\ ^г"1 s+1 max l<i<s+l \fi\^2^i(r\z\ lz) =7|г|, »=i где 7 = r_1maxi^^s+i \fi\. Из определения Д и последнего неравенства следует, что R непрерывно и, таким образом, отображение с нужными свойствами построено. Пусть в условии 3) теоремы е = 1/27 и соответствующие ему ^1 — ^1(7) и <fe •= ^2(7)- Будем предполагать (уменьшая, если необходимо, 52 > 0), что #2/7 < т. В силу 2) можно считать (уменьшая, если необходимо, 5\ > > 0), что F(x,y) е US2/2y(0;Rs) для всех х е USl(x;Rk) П М. Положим С/ = Us1(x]Rk) и пусть х е С/ П М. Если F(x,y) = = 0, то полагаем <р(х) = у, и тогда утверждения теоремы выполняются очевидным образом (для любого X > 0). Пусть
Приложение II 111 F(x,y) Ф 0. Обозначим a = \F(x,y)\ и рассмотрим отображение Gx: £?2a(0;Ms) —» Ms, определенное формулой Gx(z) = z-F(x,R(z) + y). Проверим, что Gx корректно определено, непрерывно и переводит шар £?2a(0;Ms) в себя. В самом деле, пусть z е £?2a(0;Ms). Тогда, во-первых, B2Q(0;Rs)cBr(0;Ms), так как 2а ^ Щ ^ г. Во-вторых, |Д(*)|<7И<72а02, т.е. Таким образом (в силу условия 2) теоремы и непрерывности Д), отображение z —» F(x,R(z) +у) определено и непрерывно на £?2a(0;Ms), а значит, таково и отображение Gx. Далее, записывая Gx(z) в виде Gx(z) = -F(x, у) - (F(x, Д(*) + у) - F{x, у) - Fy(x, £)№))), будем иметь (учитывая условие 3) теоремы с е = I/27): 10^)1^1^,^)1 +(27)^1^)1 < < a + (27)-17N < a + (27)_172a = 2a, т.е. Gx непрерывно отображает шар £?2a(0;Ms) в себя. По теореме Брауэра о неподвижной точке существует такая точка z = z(x) е S2a(0;Ms), что Gx(z) = z или, что то же самое, F(x, R(z) + у) = 0. Обозначим (р(х) = R(z) + у. Из определения <р следует, что F(x,ip(x)) = 0 и, кроме того, \ф) -у\ = \R(z)\ < 72a = 27|F(x,y)| = tf|F(x,£)| при К = 27. □
112 Приложение II Следствие 1. (Обобщенная теорема об обратной функции). Пусть А — выпуклое подмножество W1, имеющее непустую внутренность, у Е А, отображение Ф: А —» W непрерывно и дифференцируемо в точке у относительно множества А иФ\у)уеЫФ\у){А). Тогда существуют окрестность U точки Ф(у), отобра- оюение (обратная функция) tp: U —» А и константа К > О такие, что Ф((р(х)) = х и \<р(х) — у| ^ К\х — Ф(у)\ для всех х е U. Доказательство. Пусть в теореме П2.1 М = Ms, х = Ф и F(x,y) = Ф(у)-х. Тогда все условия этой теоремы выполнены и мы сразу получаем утверждение следствия. □ Рассмотрим теперь вопрос о дифференцируемости неявной (обратной) функции. Следующий пример показывает, что если А ф M.n, то дифференцируемости, вообще говоря, может не быть даже при сколь угодно гладком исходном отображении. Покажем это для обратной функции. Пусть А = [О, I]2, Ф: А —» -> R, Ф(у) = ух - у2 (у = [уъУ2)Т) и пусть у = 0. Ясно, что Ф'(0) = (1, -1) и поэтому F'(0)(A) = [—1,1]. Условия следствия 1 выполнены. Поэтому найдутся окрестность нуля U и отображение <р: U —» А ((р = ((fi,(fi2)T) такие, что ip\{x) - ф2(х) = х для всех х е U. Поскольку ipi(x) ^ 0 и </>»(()) = 0, г = 1,2, то, если бы отображение (р было дифференцируемо в нуле, то по теореме Ферма необходимо выполнялись бы равенства ^(0) = 0, г = 1,2. Но тогда, дифференцируя тождество ipi(x) — <р2(х) = х в нуле, мы приходим к противоречию. Если А = Мп, то незначительное (и совершенно естественное) усиление условий теоремы П2.1 приводит к дифференцируемости неявной функции в точке х, а для обратной функции условия следствия 1 при А = W1 уже гарантируют дифференци- руемость обратной функции в соответствующей точке. Следствие 2. (Дифференцируемость неявной функции). Пусть в теореме П2.1 A = W1, s = п и существует производная Fx{x,y).
Приложение II 113 Тогда неявная функция <р дифференцируема в точке х относительно множества М и (р'(х) = -Fyl(x,y)Fx(x,y). Доказательство. Пусть U — окрестность точки х из теоремы П2.1. Существование производной Fx(x,y) означает, что для всех х е М справедливо представление F(x,y) = Fx(x,y)(x-x) + o(\x-x\). (i) Уменьшая, если необходимо окрестность U, можно считать, что \о(\х — х\)\ ^ х — X и тогда из оценки для неявной функции при х G С/, получаем \ф) - у\ < K\F(x,y)\ < K(\\Fx(x,y)\\ + 1) х — X х — X (ii) Теперь воспользуемся условием 3) теоремы. Пусть е > 0 и ему соответствует Si и (¾. Снова уменьшая U, можно считать, что U С Us1(x;Rn) и (в силу (ii)) \(р(х)-у\ < 52 для всех х G UDM. Тогда из 3) (учитывая, что F(x,(p(x)) = 0) и (ii) получаем: \F(x,y) + Fy(x,y)(ip(x) -у)| <ф(х) -у\ ^eKi\x-x т.е. F(x, у) + Fy(x, у)(<р(х) -у) = о{\х - х\). Объединяя это с (i), приходим к соотношению Fy(x, у)(ч>{х) - у) = -Fx(x, у)(х -х) + о(\х - х\). Условие 4) теоремы означает, что матрица Fy(x,y) обратима, Поэтому, применяя к обеим частям последнего равенства оператор F~l(x,y) и учитывая, что у = <р(х), будем иметь <р(х) = <р(х) - Fyl(x,y)Fx(x,y)(x -х) + о(\х -х\) для всех х е U П М, что доказывает следствие 2. □
114 Приложение II Следствие 3. (Дифференцируемость обратной функции). Пусть в следствии 1 А = Ш.п и s = п. Тогда обратная функция ip дифференцируема в точке Ф(у) и </(Ф{у)) = (Ф'(У))-1- Доказательство. Рассуждения здесь аналогичны тем, которые были в предыдущем следствии. Из дифференцируемости Ф в точке у и оценки для обратной функции следует, что х = Ф(<р(х)) = Ф(у) + Ф'(у)(ф) -у) + о(\х - Ф(у)|). Применяя к обеим частям этого равенства оператор (Ф'(у))-1, получаем, что ф) = ф(у)) + (Ф'^ГНх - Ф(у)) + о(\х - Ф(у)|) и тем самым утверждение доказано. □ Рассмотрим теперь вопрос о единственности и непрерывности неявной (обратной) функции. Предположения следствия 1 (тем более теоремы П2.1) не гарантируют ни единственности, ни непрерывности какой-либо из неявных (обратных) функций в какой-нибудь окрестности точки х. Начнем с единственности и покажем это на примере обратной функции. Рассмотрим функцию Ф: R —» R, определенную формулой: ФЫ = y + y2sm(l/y), если у ф 0 и Ф(0) = 0. Пусть у = 0. Ясно, что функция Ф непрерывна, дифференцируема в нуле, Ф'(0) = 1 и тем самым Ф'(0)(М) = R. Условия следствия 1 выполнены, но обратная функция не единственна. Действительно, рассмотрим последовательность ук = 1/2тгк, к Е N. Элементарно проверяется, что Ф'(Ук) — 0 и Ф"(ук) < 0, т.е. в точках ук у функции Ф строгие локальные максимумы. Поскольку Ф(ук) = Уъ то Для каждого к и всех достаточно малых е > 0 уравнение Ф(у) = ук~е имеет по крайней мере два решения. Так как ук —» 0 при к —» оо, то тем самым в любой окрестности нуля существует такая точка х, что уравнение Ф(у) = х имеет по крайней мере два решения.
Приложение II 115 Теперь рассмотрим вопрос о непрерывности обратной функции. Воспользуемся этим же примером. Пусть (р — обратная функция. Предположим, что она непрерывна в некоторой окрестности нуля U. Так как, очевидно, <//(0) = 1, то <р на U принимает все значения из некоторой окрестности нуля V. Пусть к е N столь большое, что ук = 1/27г/с е V и хк е U таково, что <р(хк) = ук. Как показано выше, в точке ук функция Ф имеет строгий локальный максимум, и поэтому для всех х G U, достаточно близких к хк, имеем Ф(<р(х)) < Ф(<р(хк)) = Ф(ук). Для этих же х, согласно следствию 1, Ф(<р(х)) = х, что приводит к противоречию: х ^ хк в окрестности х^! Предположения следствий, приводимых ниже, гарантируют и непрерывность неявной (обратной) функции. Однако на доказательстве этого останавливаться не будем. Следствие 4. (Единственность неявной функции). Пусть в теореме П2.1 А — Шп, s = п и условие 3) заменено следующим: 3') существует производная Fy(x,y) и при этом для каждого е > 0 найдутся такие Si(e) > 0 и 62(e) > О, что для всех х е USl(x]Rk) П М и у{ е Us2(y;Rn)f г = 1,2, справедливо соотношение1 \F(x,yi) -F(x,y2) -Fy{x,y)(yi -2/2)1 ^e\yi ~ 2/2 . Тогда существуют окрестности U и V точек х и у соответственно, неявная функция <р: U П М —» V и константа К > 0 такие, что F(x, ¥>(*)) = О и \<p(x)-y\^K\F(x,y)\ 1 Если отображение F не зависит от переменной х, то условие 3') известно как условие строгой дифференцируемости отображения F в точке у (см., например, [АТФ])
116 Приложение II для всех х е U П М, и при этом если (х,у) Е (U П М) х V и F(x,y) = О, то у = <р(х). Доказательство. Очевидно, что условие 3') влечет условие 3) теоремы П2.1. Пусть U — окрестность точки х, отображение (р и константа К > 0 из этой теоремы. Из 4) следует, что матрица Fy(x,y) обратима. Положим е = ^||F~1(x,у)||-1 и возьмем Si = 5i(e), (¼ = 52(e), отвечающие этому е в силу условия 3'). Уменьшая окрестность U, будем считать, что U С С Us1(x;Rk) и \(f(x)-y\ ^ S2/2 для любого х е UDM. Положим V = Us2/2{y', Кп). Тогда \<р(х) — j/| ^ (fe Для любых х eU П М и yev. Теперь докажем единственность. Пусть (х,у) Е (UDM) х V и F(x, у) = 0. Тогда имеем: \у-<р(х)\ = \Fyl(x,y)Fy(x,y)(y - ф))\ ^ ^\\р;\хШру{хЖу-Ф))\ = F~\x,y)\\ \F(x,y) - F(xM*)) ~ Fy&vKv ~ Ф))\ < ^^-^хм^у-ч^т-^у-Ф) 1 г/-</>(я)|, т.е. у = <р(х). П Следствие 5. (Единственность обратной функции). Пусть отображение Ф: Rn —» Мп дифференцируемо в точке у, матрица Ф'(у) обратима и отображение Ф строго дифференцируемо в точке у, т. е. для любого е > 0 найдется 5 > 0 такое, что для всех yi Е и$(у]Шп), г = 1,2, справедливо соотношение Ф(ш) - Ф(Ы - Ф'(з/)(з/1 - 2/2)1 < ф1 - 2/2 (*) Тогда существует окрестности U и V точек Ф(у) и у соответственно, обратная функция ip: U —» V и константа К > 0 такие, что Ф(<р(х)) = х и \<р(х) - у\ ^ К\х - Ф
Приложение II 117 для всех х G U, и при этом если (х,у) eU xV и Ф(у) = х, то у = (р(х). Доказательство. Нетрудно проверить, что соотношение (*) гарантирует непрерывность Ф в некоторой окрестности точки у. Поэтому все условия следствия 1 для A = Rn и s = п, выполнены. Остальные рассуждения такие же, как при доказательстве следствия 4. □ Необходимые условия экстремума в конечномерных задачах Рассмотрим экстремальную задачу: /о (ж) -> extr, х е А, (1) fi(x) ^ О, г = 1,..., га/, fi(x) = О, г = га/ + 1,..., га. Здесь функции /*, г = 0,1,...,га, определены на выпуклом множестве icRn, имеющем непустую внутренность. Свяжем с задачей (1) функцию Лагранжа т г=0 где Л = (Ао, Ai,..., Am) — вектор множителей Лагранжа. Теорема П2.2. (Необходимые условия экстремума в задаче (1)). Пусть в задаче (1) функции /», 0 ^ г < га, непрерывны на А и дифференцируемы в точке х относительно множества А. Тогда если х —локальный экстремум в (1), то найдется ненулевой вектор множителей Лагранжа А = (Ао, Ai,..., Am) такой, что Ао ^ 0 (Ао < 0), если задача на минимум (максимум), и при этом
118 Приложение II (a) Аг ^ 0, г = 1,... , га'; (b) Xifi(x) = О, г = 1,...,га'; (c) min £ж (ж, А) • ж = £ж(ж, А) • ж 4=> т т & min X] А»/[(ж) • ж = Y, Ai/f(ж) • ж. ж^л г=0 г=0 Доказательство. Пусть ж —локальный экстремум в задаче (1). Можно считать, что /t(x) = 0, l^i^m' + l. Действительно, отбросим те ограничения, для которых fi(x) < < 0. Легко понять, что ж —локальный экстремум и в новой задаче. Если для нее будут доказаны условия (а) и (с), то (Ь) будет выполняется автоматически. Дополнив найденный набор множителей Лагранжа нулевыми компонентами, соответствующими тем номерам, где fi(x) < 0, получим утверждения (а), (Ь), (с) для исходной задачи. Пусть, для определенности, ж —локальный минимум. Рассмотрим отображение Ф:ЛхК^+1->Г+1, определенное по правилу Ф(х,и) = = (Лfa) + Mo, fl(x)+Ui, . . . , /ш'(ж) +Um/, /m'+lfa), . . . , fm(x))T. Ясно, что Ф(ж, 0) = (/о (#),0). Из дифференцируемости функций /i, 0 ^ г < га, в точке ж следует дифференцируемость отображения Ф в точке (ж, 0) относительно множества А (Ф'(ж, 0) — матрица, строки которой суть (/о(ж), 1,0,... ,0), (Л(ж),0,1,0,...,0), ...,(/^,(ж),0,...,0,1), (/^+1(ж),0,...,0), ..., (/^(^),0,...,0)), а из непрерывности функций / на множестве А следует непрерывность отображения Ф на множестве АхМ?'+1.
Приложение II 119 Покажем, что Ф'(х,0)[(х,0)] ¢. ЫФ'(х,0)(А х М™'+1). Если это не так, то согласно следствию 1 (условия которого, очевидно, выполнены и где роли у и А играют соответственно (я,0) и Ах М™+1) найдутся окрестность U точки (/о(я),0), отображение (р: U —» А х R™ +1 и константа К > 0 такие, что |(^(у) - (ж, 0)| ^ К\у - (/о(ж),0)| для всех у е U. В частности, для всех достаточно малых е > 0 вектор у£ = (/о(#) - £,0) принадлежит С/ и |<p(j/e) - (х, 0)| < Ке. Отсюда следует, что какова бы ни была окрестность W точки х, найдутся такие хе е W П А и щ = (гхое,..., wm/e)T G R+'+1, что /о(яе) + u0e = = fo(x)-e, fi(x£) + ul£ = 0,...,/т/(же)+гхт/е = 0,/m/+i(a;e) = = 0, ...,/т(же) = 0, т.е. точка х£ допустима в задаче (1), но /о(яе) < /о(^е) + ЗДб = /о(я) - е < /о (я) в противоречии с тем, что х — локальный минимум. Таким образом, Ф'(х,0)[(х,0)] ¢. ЫФ'(х,0)(А х М™'+1). Множество Q = Ф'(х,0)(АхЖ™ +1) выпукло, поэтому выпукло и множество intQ. Пусть сначала intQ ф 0. По доказанному Ф'(я, 0)[(я, 0)] ¢ intQ. Следовательно, по теореме отделимости для выпуклых множеств (см., например, [КФ], [МИТ]) существует такой ненулевой вектор Л = (Ло, Ai,..., Am), что для всех у G int Q справедливо неравенство А • у ^ А • Ф'(я, 0)[(ж, 0)], которое, очевидно, справедливо и для всех у е Q. Но так как У = С/о(£) -^ + tx0,/i(x) -x + ui,...,ffm,(x) -ж + гхт/,/т/+1(ж) х xi,...,/^(i)' х)т, то это неравенство означает, что га га' га 5>Ш •* + £>«< > £)А<Я(х) -х, V(x,«) € Л х R™'+\ г=0 г=0 г=0 (i) где u = (од,^1,...,umf)T. Полагая в (i) х = х, находим, что А^ ^ 0, 0 < г ^ га', т. е. получаем утверждение (а) теоремы, а полагая u = 0, получаем
120 Приложение II утверждение (с). Если х — локальный максимум, то в качестве первой компоненты Ф(ж,гх) надо взять fo(x)—uo. Все рассуждения остаются прежними, но из (i) будет следовать, что Ло ^ 0. Пусть теперь intQ = 0. В этом случае Q лежит в некоторой гиперплоскости, т.е. существует такой ненулевой вектор Л = = (Ло, Ai,..., Am), что справедливо (i), но со знаком равенства. Из этого равенства при х — х следует, что А^ = 0, 0 ^ % ^ т! и, очевидным образом, выполняется утверждение (с) теоремы. □ Сформулируем теперь наиболее важные следствия этого результата. Пусть U — окрестность точки х G W1 и функции Jii 2 = U, 1, ... , Ш, определены на множестве U П (х + М+). Рассмотрим задачу: /о (ж) -> extr, xeUf](x + R*), (2) fi(x) ^0, г = 1,..., т!\ fi(x) = 0, г = т! + 1,..., га. Следствие 1. Пусть в задаче (2) функции fi, 0 ^ г ^ т, непрерывны на U П (х + R+) и дифференцируемы в точке х (относительно множества (х + Ж+)). Тогда если х —локальный экстремум в (2), то найдется ненулевой вектор множителей Лагранжа A = (Ao,Ai,... ..., Am) такой, что Ао ^ 0 (Ао ^ 0), если задача на минимум (максимум), и (a) Хг ^ 0, г = 1,... , га/; (b) Xifi(x) = 0, г = 1,..., га'; (c) Сх(х + 0,\)^0 <=> ЕТ=оХгЦ(х + 0)^0, где fl(x + 0) — производная справа функции fi в точке ж, 0 ^ ^ г ^ га. Доказательство. Легко видеть, что в данном случае /f(x) = /f(x + 0), 0<t<m,
Приложение II 121 и утверждение (с) теоремы равносильно тому, что т Yjhtiix + ty-xX) (3) г=0 для всех х G R+, что, в свою очередь, равносильно последнему утверждению следствия. □ Пусть U — окрестность точки х еШп и функции /*, г = 0,1..., m, определены на U. Рассмотрим задачу: /о(я)->extr, fi(x) < 0, г = 1,..., га', /»(#) = 0, г = га/ + 1,..., т. Следствие 2. Пусть в задаче (3) функции fa, 0 < г ^ га, непрерывны на U и дифференцируемы в х. Тогда если х —локальный экстремум в (3), то найдется ненулевой вектор множителей Лагранжа A = (Ao,Ai,... ..., Ат) такой, что Ао ^ 0 (Ао < 0), если задача на минимум {максимум), и при этом (a) Аг ^ 0, г = 1,... , га/; (b) Xifi(x) = 0, г = 1,..., га'; (c) £х{х, А) = 0 <=> Е?=о ^П(х) = 0. Доказательство. Здесь А = Шп и поэтому соотношение (с) теоремы возможно лишь в том случае, когда т г=0 Пусть U — окрестность точки х Е Ш.п и функции /г? 2 = U, 1, ... , га, определены на С/. Рассмотрим задачу /о(я)->extr, /»(ж) = 0, г = 1,...,га. (4)
122 Приложение II Следствие 3. (Правило множителей Лагранжа). Пусть в задаче (4) функции fi, 0 ^ г ^ т, непрерывны на V и дифференцируемы в точке х. Тогда если х —локальный экстремум в (4), то найдется ненулевой вектор множителей Лагранжа А = (Ло, Ai,..., Am) такой, что т £х(х,\) = 0 <=> ^АгЛ(*) = 0. г=0 Правило множителей Лагранжа, приведенное в Приложении I, сформулировано в классических предположениях непрерывной дифференцируемости функций Д в окрестности данной точки. Оно, конечно, является следствием этого результата. Несмотря на то, что в формулировках всех утверждений данного пункта фигурируют лишь производные этих функций в точке, отказаться от непрерывности функций в окрестности экстремальной точки, как показывает следующий пример, нельзя. Пусть D — функция Дирихле (равная 1 в рациональных точках и 0 — в иррациональных), Д: R2 —» М, г = О,1, где fo(x) =жь f ( \ — jxiX2 + Х2> если Х2 ^ °> 1 x\(D(x\) + 1), если Х2 = 0. Рассмотрим задачу: /о(ж) ->extr, fi{x) = 0. Единственная допустимая точка — это нуль, и поэтому она является решением данной задачи. Ясно, что /о(0) = (1,0) и нетрудно проверить, что функция Д дифференцируема в нуле и /{(0) = (0,1). Кроме того, Д имеет разрывы в любой окрестности нуля. Если бы было справедливо заключение следствия 3, то это означало бы, что векторы /о(0) и /{(0) линейно зависимы, что, очевидно, не так.
Приложение II 123 Сведения из теории обыкновенных дифференциальных уравнений При доказательстве части (с) теоремы 1 § 1 мы будем опираться на следующее утверждение о дифференцируемой зависимости от параметров решения дифференциального уравнения в случае, когда правая часть уравнения кусочно непрерывная функция. Лемма П2.3. Пусть выполнены условия теоремы 1 §1, N G G N, N — совокупность пар (n,Vi) G [*o>*i] х U, 1 ^ г ^ N, где to < т\ < ... < гдг < t\ и точки т% принадлежат Т — множеству точек непрерывности и(-),а = (ai,..., адг) G R+, причем ai столь малы, что отрезки N N Ai = Ai(a) = [п + г^2ajiTi + i^2ai + a^' 1 ^ i ^ N> 3=1 3=1 не пересекаются и принадлежат Т. Пусть, наконец, и-^ЛГ) = 1^' если t е [to'h] ^ ^=1 Аи ]vi, если t е Ai, 1 ^ г ^ N. Тогда найдется такая окрестность нуля V в RN, что для любого a G VDM+ существует решение Xa(-;N) задачи Коши x = ip(t,x,Ua(t;Af)), x(t0)=x0, (*) определенное на всем отрезке [*o»*i]- Кроме того, Xa(-,N) —> —» х(-) при а —» 0 равномерно на [to, ii], для каждого t G [to, ii] отображение а —» Xa(t',Af) непрерывно дифференцируемо на V П М+ (если в точке a = (ai,..., адг) G М+ г-ая координата щ = 0, то соответствующая частная производная понимается как производная справа) и его частные производные в нуле на [to>*i] удовлетворяют уравнениям: У = $x(t)y, у(гг) = Ат.щч>, l^i^N, (**) где Апщ(р = (р(п,х(т{),у{) - (р(т{,х(п),и(т{)).
124 Приложение II Доказательство этого утверждения может быть получено, опираясь лишь на стандартные теоремы существования и единственности решений дифференциальных уравнений и их дифференцируемой зависимости от параметров. Для случая, когда N = 1 это доказано в [АТФ]. Для произвольного N лемма П2.3 доказана там же как следствие более общих утверждений. Следствие. Существует такая окрестность нуля Vo в RN, что функция а-> g0(a]Af) = J(xa(-\N),Uoi(-\N)) непрерывно дифференцируема на Vo П W]_ и при этом |^(0 + 0;Л0 = AriVif + \ Ш • упщ{1) dt, l^i^N, (***) OOLi J n и yTivi(') —решение уравнения (**) из леммы П2.3. Доказательство. Рассмотрим задачу Коши: Z = ll)(t,Z,Uoi{'',M)), z(t0) = zo, (i) где По лемме П 2.3 для всех достаточно малых а ^ 0 существует решение задачи (i), которое при каждом t е [io»*i] непрерывно дифференцируемо по а. Далее, ясно, что Ха{-\М) = Ха(-;АГ) и так как Vs{-M) = f{t,Xa(t;M),Ua(t;M))dt = J(ха(-; Я), иа{-; Л0), to
Приложение II 125 то первая часть следствия доказана. Обозначим ~oti = (0,..., 0, а», 0..., 0)т, 1 ^ г ^ N. Тогда легко видеть, что Uai(t;Af) = u(t), если t ¢ [7¾ + ioti,п + (г + 1)а»], и Uai(t;AT) = Vi, если t е [г» + m^r^ + (г + 1)а»]. По определению (не отмечая для краткости зависимость фазовой переменной и управления от ЛО имеем: OCti QUO аг Гг + (г+1)аг (/(*, хщ(t), v^ - f(t,*(*),«(*))) d*+ = lim — <*г|о а» Тг+гаг tl + lim — аг|0 c^ Гг+(г+1)а, (/(t, Ха< (t), 2(t)) " /(t, X(t), S(t))) A. Второе слагаемое справа — это производная в нуле интеграла по параметру, к которому применима теорема П1.3, так как функция Xai(-) непрерывно дифференцируема по а*, а отрезок [n,ti] можно разбить на конечное число интервалов, на каждом из которых функция и(-) непрерывна. К первому интегралу применим теорему о среднем для интегралов и тогда в итоге получим: ддо (0 + 0;Л0 = = ЪтШ,хщ($,Ьг) - т,ЧОМО) + Ш ■ yTm(t)dt, OiiiO J Ti где f G [Ti+iai,Ti + (i + l)ai\. Когда a* -> 0, то, очевидно, £ -» г», 3¾ "* ^(7¾) по лемме П2.3 и гх(£) —» й(г^), так как и(-) непрерывна в точке т*. Второе утверждение следствия доказано. □
126 Приложение II Теорема существования Пусть -oo<£o<£i<oohL:M3—* М —функция переменных £,#,£. Рассмотрим задачу </(#(•)) = L(t,x(t),x(t))dt —» min, to \x(t)\ ^ А для п. в.£, x(to) = #о, x(ti) = х\ (Рол) на пространстве И^([*о»*1]) функций, удовлетворяющих условию Липшица, т.е. таких функций #(•), для которых существует число L = L(x(-)) > 0 (константа Липшица), что \x(t + К) — — x(t)\ ^ L\h\ для любых t е [*o>*i] и h таких, что t + h G [to»*i]- Функция, удовлетворяющая условию Липшица на [io>*i]> абсолютно непрерывна на этом отрезке и тем самым почти всюду дифференцируема на нем. Теорема (существования). Пусть в задаче (Рол) функция L непрерывна на R3 вместе со своей частной производной по х и для каждых tux функция х —» L(t, ж, х) выпукла. Тогда в задаче (Рол) существует решение, принадлежащее w£(Mi]). Доказательство. Пусть {хп(-)}п€^ — минимизирующая последовательность в (Рол)- Поскольку ясно, что у допустимых в (Рол) функций константа Липшица равна Д то все члены последовательности ограничены числом |#о| +^4(^1 - *о) и са~ ма последовательность равностепенно непрерывна. По теореме Арцела (см. [КФ] стр. 128-130) из {#п(-)}п€^ можно выделить подпоследовательность, равномерно сходящуюся к некоторой непрерывной функции #(•). Будем считать, что сама последовательность сходится к этой функции. Очевидно, что х(-)— липшицева с той же константой А, х(и) = Х{, г = 0,1, и тем самым допустима в задаче (Рол). Понятно, что последователь- ность {х(-)}п€^ ограничена в L2([i(b*i]) и поэтому из нее можно
Приложение II 127 выделить подпоследовательность, слабо сходящуюся к некоторой функции z(-) G b2([*o>*i]). Будем считать, что сама последовательность сходится к этой функции. Тогда, переходя к пре- t делу в равенстве xn(t) = хо + J xn(r)dr, получаем, что x(t) = to t А = хо + J z(r)dr для всех t G [to» *i] и значит, x(t) = z(t) для to п. в. t G [to, ti]. Покажем, что функция x(-) является решением задачи (Рол)- В выкладках ниже мы используем тот элементарно проверяемый факт, что если функция у(-) выпукла на М и дифференцируема в точке т, то для любого (GK справедливо неравенство у(£) — — У(т) ^ 2/(г)(£ _ т)- Итак, имеем: J(xn(.))-J(x(-))= {L{t,xn{t),xn{t)) - L{t,xn{t),x{t)))dt+ to + (L(t,xn(t),x(t)) - L(t,x(t), £(t))) dt ^ to > (xn(t) - x(t))L±(t, xn(t), x(t)) dt+ to h + (L(t,xn(t),£(t)) - L(t,x(t), £(t))) dt = to tl (xn(t) -£(t))(L*(t,xn(t),£(t)) -LA(t,x(t)^(t)))dt+ to tl + (xn(t) - x(t))LA(t, x(t), £(*)) dt+ to + (L(t, xn(t), £(t)) - L(t, x(t), x(t))) dt. to
128 Приложение II Первый интеграл в правой части выписанных соотношений стремится к нулю при п —» оо, так как первый сомножитель в подынтегральной функции по модулю не превосходит 2Л, а второй — равномерно стремится к нулю в силу непрерывности функции Lx и равномерной сходимости хп(-) к #(•). Второй интеграл справа стремится к нулю вследствие того, что хп(-) слабо сходится к #(•). Третий интеграл стремится к нулю по тем же соображениям, что и первый. Тогда, обозначая через S значение задачи (Рол) и переходя к пределу при п —» оо в соотношениях выше, получаем, что S — J(x(-)) ^ 0. Отсюда следует, что х(-) — решение задачи (Рол). П Замечание. Утверждение теоремы существования, очевидно, справедливо и для задачи со свободным правым концом. Некоторые леммы Функция /: [to, ti] xRn ->R переменных (t,x) называется функцией типа Каратеодори, если для каждого х е Rn функция t —» f(t,x) измерима на [to, ti] и для п. в. t е [to, ti] функция х —» f(t,x) непрерывна на W1. Лемма П2.4. Пусть f: [to, ti] х W1 —» R — функция типа Каратеодори и и: [to, ti] —» Rn — измеримое отображение. Тогда функция t —» f(t,u(t)) измерима на [to, ti]. Доказательство. Как и раньше, Ur(x) обозначает открытый шар в W1 радиуса г с центром в точке х. Пусть {а^}^ — счетное всюду плотное подмножество Шп (например, совокупность всех векторов с рациональными координатами). Для каждого г G N определим отображение щ: [to, ti] —» Шп по правилу: Ui(t) = Xj, где j — минимальный из тех номеров, для которых u(t) G Ui/i(xj). Отображения щ(-) измеримы. Действительно, если обозначить через Dij прообраз Ui/^Xj) при отображении гх(-), то Ui(t) = Xj тогда и только тогда, когда t принадлежит измеримому множеству D^ \ Ui=i Аь если j ^ 2, и Иц, если j = 1, и поэтому прообраз открытого множества при отображении щ(-) есть не более чем счетное объединение таких мно-
Приложение II 129 жеств. Из определений щ(-), г G N, сразу следует, что щ(Ь) —» —» u(t) при г —» оо для всех t G [*о> *i]- Функции t —» /(*,гц(£)), г G N, измеримы как суперпозиции измеримых функций с непрерывными (см. [КФ]) и, следовательно, измерима функция t —» —» f(t,u(t)) = \iirii-toQ f(t, Ui(t)) как предел измеримых функций [КФ]. □ Лемма П 2.5. Пусть f: [to, ti] х Mn —» R функция типа Кара- теодори и, более того, f локально липшицева по х равномерно по t, т. е. для каждого ограниченного множества A cRn найдется такая константа L(A), что \f(t,x\) — /(*,Ж2)| ^ ^ L(A)\xi — X2I для всех x\,x<i G А и t G [io>*i] и> кроме того, функция t —» f(t,x) измерима на [to>*i] для всех х G Ш.п. Тогда для любого е > 0 существует такое замкнутое множество М с [to,ti], что (ti - to) - mesM < е и функция (t,x) —» f(t,x) непрерывна на М xRn Доказательство. Пусть {#г}гем "~ счетное всюду плотное подмножество Шп. По условию для каждого г G N функция t —» f(t,Xi) измерима, и тогда согласно теореме Лузина найдется такое замкнутое множество М{ С [*о>*»]> что (*i _ *о) _ -mesMi < 2~ге и функция f(-,Xi) непрерывна на М{. Положим М = nSi ^- Тогда ясно, что М замкнуто и (ti - to) -mesM < < е. Покажем, что это множество искомое. Сначала проверим, что для любого х G Ш.п функция t —» f(t,x) непрерывна на М. Действительно, пусть {xik}keN — подпоследовательность {#i}ieN> сходящаяся к х. Функции /(-,^), A; G N, непрерывны на М и, если Л — ограниченное множество, которому принадлежит последовательность {xik}keN> то мы имеем \f(t,xik)-f(t,x)\ ^L{A)\xik-x\ для всех t G [to,ti]. Это означает, что f(-,Xik) сходится равномерно к/(-,х)наМи тем самым функция f(-,x) непрерывна на М. Пусть теперь (t,x) G М х W1 и (tj,Xj) —» (t,x) при j —» 00, tj G -M, и А — ограниченное множество, которому принадлежит
130 Приложение II последовательность {£j}j€n. Тогда \f(t3,x3)-f(%x)\ ^ |/(^х,0-/(^,х)| + |/(^х)-/(?,х)| ^ ^ Ь(А)\х0 -х\ + \/(^,х) - f(%x)l откуда сразу следует нужное утверждение. □ Пусть отображение <р: [to, ti] х Шп —» Шп измеримо по t при каждом ж, непрерывно дифференцируемо по х для почти всех t и вместе с ipx ограничено на любом ограниченном множестве в [to, ti] х Rn. Рассмотрим задачу Коши на [to>*i] х = <р(*,ж), ж (to) = яо» и пусть жо(-) — ее решение. Пусть, далее, числовая последовательность {sk}> £к Ф О, и последовательность {%} С W1 таковы, что lim^oo ^ = 0и lim^^oo rjk = rj. Лемма П2.6. При больших к существует решение ж&(-) на [*o>*i] задачи Коши X = </?(*, ж), Ж*(to) = ^0 + ед, e^1(x^(t) - жо(*)) —» z(i) равномерно на [to>*i]> где z(-) —решение уравнения в вариациях на [to,ti] Z = (fix(t, x0(t))z, z(*o) = Г]. Доказательство опирается на стандартные утверждения теории обыкновенных дифференциальных уравнений, и поэтому мы его не приводим.
Задачи Здесь представлено 40 задач для самостоятельного решения. Ко всем задачам даны ответы, а к некоторым — указания к решению. 1. J (x2(t) + x(t)) dt -> min, x(0) = 0, x(T0) = 0. о 2. J (x2(t) + x(t)) dt -> min, x(0) = 0. о To 3. j(x2(t) + x(t))dt-> min, \x(t)\ ^ 1, ¢(0) = 0. о 4. j(x2(t)+x(t))dt->mm, о \x(t)\ ^ 1, x(0) = 0, x(T0) = 0. 2 5. Jt2i2(t) dt -> min, x(l) = 3, x(2) = 1. l l 6. Jt2x2(t)dt —» min, #(0) = 0, #(1) = 1 (пример Вейер- o штрасса). l 7. Jt2/3i2(t)dt —» min, x(0) = 0, x(l) = 1 (пример Гиль- o берта). l 8. j(x2(t) - x(t)) dt -> min, x(0) = 0, x(l) = 1. о 2 9. J(ti2(t) - x(t)) dt -> min, s(l) = 0, x(2) = 1. l l 10. J(i2(t) + s(t)±(t) + 12tx(t)) dt -> min, x(0) = 1, s(l) = 4. о
132 Задачи 11. j(x2(t) - 4x(t)t) dt + 2ж2(1) - 2s(0) -> min. о 2 12. ](x2{t) + x(t)(t2 - 2)) dt + x2(0) + 2s(2) -> min. о To 13. j(x2(t)+x2(t))dt-> min, ¢(0) = 0, s(T0) = f. о To 14. J(i2(t) + x2(t))dt->min, |i(t)|<l, x(0) = 0, x(T0)=e 15. }(А2^+ж2^ + |х(^)|)^->тт, x(l)=£. о 16. J ((|±(t)| - 1)2. + x2(t)) dt - min, x(-l) = ¢, ¢(1) = ¢. -l /T-l 17. j x2(t)dt-ax2(T0) ->min, ¢(0) = 0. о l l 18. J±2(£)d£->min, Jx(t)dt = 3, #(0) = 1, ¢(1) = 6. о о 19. J x2(t) dt -> max, Jx2(t)dt^l, ж(0) = 0, ж(Г0) = 0. 0 о 1 l 20. J(x2(t) + 6tx(t))dt -> min, Jx(t)dt = 0, ¢(0) = 0, о 0 ¢(1) = 1. 21. J£2(£)d£->min, jx(t)smtdt = l, ¢(0) = 0, ¢(71-) = 0. о 0 111 22. Ji2(t)dt->min, J x(t) dt = -1.5, Jte(t)dt = -2, 000 ¢(0) = 2, ¢(1) = -14.
Задачи 133 1 1 23. jx2(t)dt->тт, Jtx(t)dt = 0, х(0) = -4, ж(1) = 4. 0 о 1 24. Jx2(t)dt -> min, ж(0) = ±(0) = 0, ж(1) = 1. о 1 25. jx2(t)dt -> min, ж(0) = 1, ж(0) = 0. о 2 26. Jx(t) dt -> min, -4 ^ x(t) < 2, ж(0) = 1, i(0) = 0, i(2) = о = -2. 27. /x(t) dt -> min, \x(t)\ < 1, x(0) = x(T0) = 0. о 28. j x(t) dt -» min, |x(t)| < 1, x(0) = x(0) = x(T0) = 0. о /t-i 29. I x(t)dt -» min, |x(t)| < 1, x(0) = x(0) = x(T0) = = x(To) = 0. 1 l 30. jx(t) dt -» min, jx2(t) dt = 144/5, x(0) = 1, о о x(0) = -4. 2 31. x(2) -» max, \x(t)\ < 2, x(0) = 0, Ji2(t)dt = 2. о 32. Г -► min, -1 < x(t) < 3, x(0) = 1, x(0) = x(T) = 0, x(T) = -1. 33. Г -► min, |x(t)| < 1, x(0) = fi, x(0) = &, ж(Т) = 0. т 34. Г -> min, ]x2(t)dt = 4, x(0) = 0, x(0) = 1, x(T) = -1. о 35. T -> min, |x(t)| < 2, x(-l) = -1, x(-l) = 0, x(T) = 1, x(T) = 0.
134 Задачи Т 36. J x2(t) dt -> extr, x(0) = 0, T + x(T) + 1 = 0. о l 37. Jx2(t)dt —» max, \x(t)\ ^ 1, x(0) = 0 (найти все экс- o тремали). 38. $ (x2(t) + x2(t))dt^ mm, x(0) = x(0) = 0, x(T0) = &, i(T0) = 6. To 39. J (x2(£) -x2(t)) dt -» min, x(0) = x(0) = x(T0) = x(T0) = о = 0. To 40. J (x2(t) - x2(t)) dt -»• min, x(0) = x(0) = 0, x(T0) = £i, ±(T0) = &• Ответы и указания к решениям 1. x(t) = (t2 — Tot)/4 — абсолютный минимум. 2. x(t) = (t2 — 2Tot)/4 — абсолютный минимум. 3. Если Г0 < 2, то x(t) = (i2 - 2T0t)/4; если Г0 > 2, то -i для 0 ^ t < Т0 - 2; t(t - 2Т0)/4 + (Т0 - 2)2/4 для Т0 - 2 < t < Т0 Во всех случаях х(-) — абсолютный минимум. 4. Если Т0 < 4, то x(t) = {t2 - T0t)/4; если Т0 > 4, то 1 -t для 0 < t < 5^; V * - То для Zb±4 ^ i ^ Т0.
Задачи 135 Во всех случаях х(-) — абсолютный минимум. Указание к задачам 1-4. Надо воспользоваться принципом Лагранжа и найти единственную экстремаль #(•). Тот факт, что это абсолютный минимум проверяется непосредственно. В задачах 3 и 4 можно воспользоваться теоремой существования из Приложения II (экстремаль единственна и решение существует, так что эта экстремаль и есть решение). 5. x(t) = 4/t - 1. 6. Значение задачи равно нулю и решение не существует. Указание: рассмотрите минимизирующую последовательность {хп(-)}9 где xn(t) = nt для 0 ^ t < 1/п и xn(t) = 1 для 1/п ^ t ^ 1. 7. x(t) = t1/3. Отметим, что решение не является непрерывно дифференцируемой функцией. 8. x(t) = —£2/4 + 5t/4 — абсолютный минимум. 9. x(t) = —t/2 + 3 In£/(2 In 2) + 1/2 — абсолютный минимум. 10. x(t) = ts + 2t + 1 — абсолютный минимум. Указание к задачам 8—10. Надо решить соответствующее уравнение Эйлера. 11. x(t) = -£3/3 — t + 7/3 — абсолютный минимум. 12. x(t) = t4/24 - t2/2 - £/3 - 1/3 - абсолютный минимум. 13. #(£,£) = £sinh£/sinh Го— абсолютный минимум. 14. Если |^| coshГ0 < 1, то £(£,£) = £sinh£/sinhr0; если |^| cosh Г0 > 1, то J ± sinh £/ cosh г для 0 < £ < г; 1 ±(tanhr + (£ - г)) для г < £ < Г0,
136 Задачи где г — решение уравнения То - £ = г - tanhr. Во всех случаях х(-) — абсолютный минимум. 15. Если |£| ^ 1, то #(£,£) = £; если |£| > 1, то ^ ^ iV Для 0 < t < |r?|_1; #(£,£) = ^ 7?cosh(£ — \rj\ ) для |rj| i ^ t ^ 1, где rj — решение уравнения 7?cosh(l - \rj\~1) = £. Во всех случаях x(-) — абсолютный минимум. 16. #(£,£) = el*l + (£ - е) cosh t/cosh 1. 17. x = 0 —абсолютный минимум, если а < Т0-1; если а = = Т0-1, то #(£) = ct — абсолютный минимум (с —произвольная константа), а значение задачи равно нулю; значение задачи равно -оо, если а > Т0-1. 18. x(t) = St2 + 2t+l. 19. Функции xk(t) = (2/r0)1/2sin(A;t7r/ro), к = 1,2,...- стационарные точки задачи. Абсолютный максимум доставляет функция x(t) = x\(t) = (2/Го)1/2 sin(7rt/To). 20. x(t) = t3/2 + 9t2/4 - 7t/4 — абсолютный минимум. 21. x(t) = 2 sin t/тг — абсолютный минимум. 22. x(t) = -10t3 - 12t2 + 6t + 2 — абсолютный минимум. 23. #(£) = 5£3 + 3£ — 4 — абсолютный минимум. 24. x(t) = (—ts + 3t2)/2 — абсолютный минимум. Указание к задачам 20-24. То, что данные функции доставляют абсолютный минимум, проверяется непосредственно. 25. x(t) = 1 (это можно заметить сразу, без вычислений, но можно решить задачу используя стандартные методы).
Задачи 137 26. x(t) = -2t2 + 1, если 0<t<ln x(t) = t2 - Qt + 4, если 1 < t < 2. 27. x(t) = t(t - T0)/2. 28. _ f-*2A еслиО<*<т; [t2/2 - 2rt + г2, если r ^ t < T0, где r = T0(l - 1/^2). 29. [ -t2/2, если 0 ^ t < T0/4; *(*) = "I *2/2 - *To/2 + T02/16, если To/4 < t < 3T0/4; -(t - T0)2/2, если 3T0/4 sC t < T0. 30. Здесь имеются две экстремали: —£4 + 4£3 — 6t2 — 4t + 1 и (t-1)4. 31. ж(£) = t — абсолютный минимум. Указание. To обстоятельство, что эта функция доставляет абсолютный минимум, следует из неравенства 2 /2 \ V2 х(2)= ir(t)«tt<V^[ i2(t)dtj =2. В последующих задачах, как правило, мы указываем только стационарные точки. Проверка того, что это действительно решение, оставляется читателю 32- $(t\ _ /_f2/2 + !' если 0 < t < \/3; j(\/3i-4)2/2-l, еслил/3<*<Т, где f = 4Д/3. 33. u(t) = 1 или u(t) = —1. 34. Г = 1; z(t) = t-t2.
138 Задачи (£ + 1)2-1,если -1 <t<0; 1-(£-1)2,если 0<t< 1. 36. x{t) = -2t. t ^-j- 37. Экстремали: Xk(t) = Jsignsin(2A; + 1)— dr, к = 0, ±1,...; о 2 x(t) = ±t. 38. x(t) = Ci sinh(£/y/2) sm(t/V2) + C2(cosh(t/y/2) sm(t/y/2) - —sinh(t/y/2)cos(t/y/2))9 где C\ и (¾ находятся из условий: ад) = ¢1, ад) = ¢2- 39. #(£) = 0, если То < Т, где Т —первый нуль уравнения cos Т cosh Т = 1; если То > Т, то значение задачи равно —00. 40. x(t) = С\ (cosh t - cos t)+C2(sinht- sin T), если T0 < T, где T —то же, что и в предыдущей задаче, С\ и (¾ находятся из условий: x(Tq) = £1, x(Tq) = £2; значение задачи равно нулю, если То = Т, ^i = ^2 = 0 и равно —оо, если То > Т. 35. Т=1; x(t) =
СПИСОК ЛИТЕРАТУРЫ [Apl] Арутюнов А. В. Условия экстремума. Анормальные и вырожденные задачи. —М.: Факториал, 1997. [Ар2] Арутюнов А. В. Принцип максимума Понтрягина и достаточные условия оптимальности для нелинейных задач//Дифф. уравнения, т. 39, №12, 2003, с. 1587-1595. [АТФ] Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. — М.: Наука, 1979. [БЗ] Борисов В. Ф., Зеликин М. И. (Borisov V. F., Zelikin М. I) Theory of chattering control. — Boston: Berkhauser, 1994. [Бол] Болтянский В. Г. Математические методы оптимального управления. — М.: Наука, 1969. [Вар] Варга Д. Оптимальное управление дифференциальными и функциональными уравнениями. — М.: Мир, 1977. [ДМ] Дубовицкий А. Я, Милютин А. А. Задачи на экстремум при наличии ограничений // ЖВМ и МФ, т. 5, № 3, 1965, с. 395-453. [Зор1] Зорич В. А. Математический анализ, часть I. —М.: Наука, 1981. [Зор2] Зорич В. А. Математический анализ, часть П. —М.: Наука, 1984. [ИТ] Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач.— М.: Наука, 1974. [Кл] Кларк Ф. (Frank Н. Clarke) Оптимизация и негладкий анализ. — М.: Наука, 1988.
140 Список литературы [КФ] Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. — М.: Наука, 1976 (4-ое изд.) [Мил] Милютин А. А. Принцип максимума в общей задаче оптимального управления. — М.: Физматлит, 2001. [МИТ] Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения. — М.: УРСС, 2003 (2-ое изд.) [Нат] Натансон И. П. Теория функций вещественной переменной. — М.: Наука, 1974. [ПБГМ] Понтрягин Л. С, Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Физматлит, 1961. [Фул] Фуллер А. Т. (Fuller А. Т.) Relay Control Systems Optimized for Various Perfomance Criteria//Proc. First World Congress IFAC, Moscow. Vol.1; London, 1960, p. 510-519.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА [1] Алексеев В.М., Галеев Э.М., Тихомиров В.М. Сборник задач по оптимизации. — М.: Наука, 1984. [2] Благодатских В. И. Введение в оптимальное управление. — М.: Высшая школа, 2001. [3] Болтянский В. Г. Математические методы оптимального управления. — М.: Наука, 1969. [4] Васильев Ф.П. Методы оптимизации. — М.: Факториал Пресс, 2002. [5] Гамкрелидзе Р. В. Основы оптимального управления. — Тбилиси: Изд-во Тбилисского университета, 1977. [6] Гелъфанд И.М., Фомин СВ. Вариационное исчисление. — М., Гос. изд-во физико-математической литературы, 1961. [7] Гирсанов И. В. Математическая теория экстремальных задач. — М.: Изд-во МГУ, 1970. [8] Дикусар В. В., Милютин А. А. Качественные и численные методы в принципе максимума. — М.: Наука, 1989. [9] Зеликин М. И. Оптимальное управление и вариационное исчисление. — М.: Изд-во МГУ, 1985. [10] Красовский Н.Н. Теория управления движением. — М.: Наука, 1968. [11] Ли Э. Б., Маркус Л. Основы теории оптимального управления. — Наука, М.: 1972.
142 Дополнительная литература [12] Тер-Крикоров A.M. Оптимальное управление и математическая экономика. — М.: Наука, 1977. [13] Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. — М., Наука, Главная ред. физико-математической литературы, 1969.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Дифференцируемость относительно множества 107 Допустимый процесс 13 Достаточные условия понтрягин- ского минимума 86 Задача Больца 22 Задача Дидоны 35 Задача Лагранжа 14 Задача Ньютона 19, 30 Задача о гармоническом осцилляторе 54 Задача о брахистохроне 17, 33 Задача о космической навигации 51 Задача о минимальной поверхности вращения 37 Задача о расширенном воспроизводстве 49 Задача с фазовыми ограничениями 87 Задача Фуллера 44 Замкнутый шар 97 Интегралы уравнения Эйлера 23 Конечномерная аппроксимация 76 Лемма о центрированной системе 106 Множество открытое 97 Множители Лагранжа 19 Обобщенная теорема о неявной функции 108 Обобщенная теорема об обратной функции 112 Общая задача оптимального управления 72 Оптимальный процесс 14 Открытый шар 97 Понтрягинский минимум 73 Правило множителей Лагранжа 122 Принцип Лагранжа 24 Принцип максимума Понтрягина 22 Производная отображения 100 Производная отображения относительно множества 107 Производная функции 99 Простейшая задача вариационного исчисления 15 Простейшая задача о быстродействии 41 Сильный локальный минимум 14 Слабый локальный минимум (максимум) 15 Теорема Брауэра о неподвижной точке 108
144 Пред Теорема о необходимых условиях экстремума в задачах с равенствами и неравенствами 117 Теорема о необходимых условиях экстремума в простейшей задаче вариационного исчисления, задаче Лагранжа и упрощенной задаче оптимального управления 20 Теорема о производной суперпозиции отображений 102 Теорема существования 126 Точка Лебега 76 Управление 13 Упрощенная задача оптимального управления 12 Уравнение Эйлера 20 Уравнение Эйлера-Лагранжа 20 указатель Условие дополняющей нежесткости 75 Условие максимума 21 Условие минимума 21 Условие нетривиальности 76 Условие трансверсальности 21 Условие управляемости относительно фазовых ограничений 94 Фазовые ограничения 87 Фазовые переменные 12 Функция Лагранжа 19 Функция Понтрягина 19 Функция типа Каратеодори 129 Центрированная система 105 АГ-задача 77 ^-задача 84
Арутюнов Арам Владимирович, родился в 1956 году, доктор физико-математических наук, профессор, зав. кафедрой нелинейного анализа и оптимизации РУДН, профессор кафедры системного анализа ВМК МГУ. Автор более 100 научных работ и двух монографий. Магарил-Илъяев Георгий Георгиевич, родился в 1944 году, доктор физико-математических наук, профессор кафедры высшей математики Московского государственного института радиотехники, электроники и автоматики, профессор кафедры общих проблем управления механико-математического факультета МГУ. Автор более 100 научных работ и трех монографий. Тихомиров Владимир Михайлович, родился в 1934 году, доктор физико-математических наук, Почетный профессор МГУ, зав. кафедрой общих проблем управления механико-математического факультета МГУ. Автор более 200 научных работ и более 20 монографий и учебников. Принцип максимума Понтрягина лежит в основе теории оптимального управления и является одним из самых ярких достижений теории экстремума. Книга, которую читатель держит в руках, написана известными специалистами в этой области математики. В ней приведены простые и ясные доказательства принципа максимума и необходимых условий экстремума в задачах вариационного исчисления. Применение этих результатов демонстрируется на большом числе примеров. Кроме того, в книге много полезного дополнительного материала и исторических комментариев. Думаю, что она будет с интересом воспринята самыми разными категориями читателей, от студентов до специалистов в области теории экстремальных задач. Illl III III I НИИ 1111IIIIII III Академик РАН Е. Ф. Мищенко |11 II III |1|1111111III III ISBN 5-88688-082-8 9II7 8 5 8 8 6 4 8 0 8 2 3 " ФАКТОРИАЛ ПРЕСС