Text
                    УДК 517.5, 517.97
ББК 22.15, 22.161.8
А 47
Алексеев В. М., Тихомиров В. М., Фомин С. В. Опти-
Оптимальное управление. — 2-е изд. — М.: ФИЗМАТЛИТ, 2005. — 384 с. —
ISBN 5-9221-0589-2.
Книга посвящена важнейшим проблемам теории экстремума — матема-
математическому программированию, вариационному исчислению и оптимальному
управлению. Главное внимание уделено принципу Лагранжа для необходимых
условий, а также достаточным условиям, выпуклым задачам, гамильтонову
формализму. Обсуждаются многие задачи, которые ставились и исследовались
на протяжении всей истории теории экстремума. Материал книги основан на
опыте преподавания теории экстремальных задач на механико-математическом
факультете МГУ, и он может служить учебным пособием по многим различным
курсам оптимизации.
Для студентов университетов, аспирантов, преподавателей и научных ра-
работников в области математики и её приложений.
Учебное издание
АЛЕКСЕЕВ Владимир Михайлович
ТИХОМИРОВ Владимир Михайлович
ФОМИН Сергей Васильевич
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
Редактор Е.Ю. Ходан
Оригинал-макет A.M. Садовский
ЛР №071930 от 06.07.99. Подписано в печать 03.08.05. Формат 60x90/16.
Бумага офсетная. Печать офсетная. Усл. печ. л. 24. Уч.-изд. л. 26,9. Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997, Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru;
http://www.fml.ru
Отпечатано с готовых диапозитивов в ПФ «Полиграфист»
160001, г. Вологда, ул. Челюскинцев, 3
Тел.: (8172) 72-55-31, 72-61-75, факс: (8172) 72-60-72
E-mail: form.pfp@votel.ru http://www.vologda/~pfpv
ISBN 5-9221-0589-2
9 785922405897
ISBN 5-9221-0589-2
© ФИЗМАТЛИТ, 2005
© В. М. Алексеев, В. М. Тихомиров,
С. В. Фомин, 2005


ОГЛАВЛЕНИЕ Предисловие ко второму изданию 7 Предисловие 8 Глава 1. Введение 11 § 1.1. Как возникают экстремальные задачи? 11 1.1.1. Классическая изопериметрическая задача. Задача Дидо- ны. A1). 1.1.2. Другие старинные экстремальные задачи в гео- геометрии. A6). 1.1.3. Вариационный принцип Ферма и принцип Гюйгенса. Задача о преломлении света. A9). 1.1.4. Задача о брахистохроне. Зарождение вариационного исчисления. B2). 1.1.5. Аэродинамическая задача Ньютона. B4). 1.1.6. Задача о рационе и транспортная задача. B5). 1.1.7. Задача о быстро- быстродействии. B5). § 1.2. Как формализуются экстремальные задачи? 26 1.2.1. Основные определения. B6). 1.2.2. Простейшие примеры формализации экстремальных задач. B7). 1.2.3. Формализация задачи Ньютона. B9). 1.2.4. Различные формализации класси- классической изопериметрической задачи и задачи о брахистохроне. Простейшая задача о быстродействии. C1). 1.2.5. Формализа- Формализация транспортной задачи и задачи о рационе. C3). 1.2.6. Ос- Основные классы экстремальных задач. C4). § 1.3. Правило множителей Лагранжа и теорема Куна-Таккера 38 1.3.1. Теорема Ферма. C8). 1.3.2. Правило множителей Лагран- Лагранжа. D0). 1.3.3. Теорема Куна-Таккера. D4). 1.3.4. Доказа- Доказательство конечномерной теоремы отделимости. D9). § 1.4. Простейшая задача классического вариационного исчисления и ее обобщения 50 1.4.1. Уравнение Эйлера. E0). 1.4.2. Необходимые условия в за- задаче Больца. Условия трансверсальности. E5). 1.4.3. Расши- Расширения простейшей задачи. E7). 1.4.4. Игольчатые вариации. Условие Вейерштрасса. F4). 1.4.5. Изопериметрическая задача и задача со старшими производными. F6). § 1.5. Задача Лагранжа и основная задача оптимального управления 69 1.5.1. Постановки задач. F9). 1.5.2. Необходимые условия в за- задаче Лагранжа. G1). 1.5.3. Принцип максимума Понтряги- на. G3). 1.5.4. Доказательство принципа максимума в задаче со свободным концом. G5). § 1.6. Решение задач 81
Оглавление 1.6.1. Геометрические экстремальные задачи. (82). 1.6.2. Аэро- Аэродинамическая задача Ньютона. (86). 1.6.3. Простейшая задача о быстродействии. (89). 1.6.4. Классическая изопериметриче- ская задача и задача Чаплыгина. (92). 1.6.5. Задача о брахи- брахистохроне и некоторые задачи геометрии. (97). § 1.7. Дополнение. Необходимые условия экстремума от Ферма до Понтрягина 98 1.7.1. Ферма. Задачи без ограничений. (98). 1.7.2. Лагранж. Задачи с ограничениями типа равенств и неравенств. (99). 1.7.3. Эйлер, Лагранж, Понтрягин. Задачи вариационного исчис- исчисления и оптимального управления. A00). Глава 2. Аппарат теории экстремальных задач 106 §2.1. Предварительные сведения из функционального анализа 106 2.1.1. Линейные нормированные и банаховы простран- пространства. A06). 2.1.2. Произведение пространств. Фактор- пространство. A08). 2.1.3. Теорема Хана-Банаха и ее след- следствия. (ПО). 2.1.4. Теоремы отделимости. A13). 2.1.5. Теорема Банаха об обратном операторе и лемма о правом обратном отображении. A16). 2.1.6. Лемма о замкнутости образа. A18). 2.1.7. Лемма об аннуляторе ядра регулярного оператора. A19). 2.1.8. Абсолютно непрерывные функции. A19). 2.1.9. Теорема Рисса об общем виде линейного функционала в пространстве С. Формула Дирихле. A22). §2.2. Основы дифференциального исчисления в линейных нормиро- нормированных пространствах 124 2.2.1. Производная по направлению, первая вариация, произ- производные Гато и Фреше, строгая дифференцируемость. A25). 2.2.2. Теорема о суперпозиции дифференцируемых отображе- отображений. A31). 2.2.3. Теорема о среднем и ее следствия. A34). 2.2.4. Дифференцирование в произведении пространств. Част- Частные производные. Теорема о полном дифференциале. A37). 2.2.5. Производные высших порядков. Формула Тейлора. A39). §2.3. Теорема о неявной функции 146 2.3.1. Формулировка теоремы о существовании неявной функ- функции. A46). 2.3.2. Модифицированный принцип сжимающих отображений. A47). 2.3.3. Доказательство теоремы. A48). 2.3.4. Классические теоремы о неявной функции и об обратном отображении. A51). 2.3.5. Касательное пространство и теорема Люстерника. A55). §2.4. Дифференцируемость некоторых конкретных отображений .... 158 2.4.1. Оператор Немыцкого и оператор дифференциальной свя- связи. A58). 2.4.2. Интегральный функционал. A61). 2.4.3. Опе- Оператор краевых условий. A65). §2.5. Необходимые сведения из теории обыкновенных дифференци- дифференциальных уравнений 166 2.5.1. Основные предположения. A67). 2.5.2. Локальная теоре- теорема существования. A69). 2.5.3. Теорема единственности. A71). 2.5.4. Линейные дифференциальные уравнения. A73).
Оглавление 2.5.5. Глобальная теорема о существовании и непрерывной зависимости решения от начальных данных и параметров. A77). 2.5.6. Теорема о дифференцируемой зависимости решений от начальных данных. A82). 2.5.7. Классическая теорема о дифференцируемой зависимости решений от начальных данных. A85). §2.6*. Элементы выпуклого анализа 188 2.6.1. Основные определения. A89). 2.6.2. Выпуклые множества и функции в линейных топологических про- пространствах. A95). 2.6.3. Преобразование Лежандра-Юнга- Фенхеля. Теорема Фенхеля-Моро. B02). 2.6.4. Субдиффе- Субдифференциал. Теорема Моро-Рокафеллара. Теорема Дубовицкого- Милютина. B07). Глава 3. Принцип Лагранжа для гладких задач с ограничениями 215 §3.1. Элементарные задачи 215 3.1.1. Элементарные задачи без ограничений. B15). 3.1.2. Эле- Элементарная задача линейного программирования. B19). 3.1.3. Задача Больца. B20). 3.1.4. Элементарная задача оптимального управления. B23). 3.1.5. Принцип Лагранжа для задач с равенствами и неравенствами. B23). §3.2. Принцип Лагранжа для гладких задач с ограничениями типа равенств и неравенств 226 3.2.1. Формулировка теоремы. B26). 3.2.2. Правило множите- множителей для гладких задач с равенствами. B28). 3.2.3. Редукция задачи. B30). 3.2.4. Доказательство теоремы. B31). §3.3*. Принцип Лагранжа и двойственность в задачах выпуклого про- программирования 234 3.3.1. Теорема Куна-Таккера (субдифференциальная фор- форма). B34). 3.3.2. Метод возмущений и теорема двойствен- двойственности. B36). 3.3.3. Линейное программирование: теорема существования и теорема двойственности. B41). 3.3.4. Теорема двойственности для задачи о кратчайшем расстоянии. Лемма Хоффмана и лемма о минимаксе. B47). §3.4*. Необходимые условия второго порядка и достаточные условия экстремума в гладких задачах 257 3.4.1. Гладкие задачи с равенствами. B57). 3.4.2. Гладкие за- задачи с равенствами и неравенствами — необходимые условия второго порядка. B59). 3.4.3. Достаточные условия экстремума для гладких задач с равенствами и неравенствами. B63). Глава 4. Принцип Лагранжа в задачах классического вариацион- вариационного исчисления и оптимального управления 267 §4.1. Принцип Лагранжа для задачи Лагранжа 267 4.1.1. Постановка задачи и формулировка теоремы. B67). 4.1.2. Редукция задачи Лагранжа к гладкой задаче. B72). 4.1.3. Обобщенная лемма Дюбуа-Реймона. B74). 4.1.4. Вывод
Оглавление условий стационарности. B76). 4.1.5. Задача со старшими производными. Уравнение Эйлера-Пуассона. B78). §4.2. Принцип максимума Понтрягина 282 4.2.1. Постановка задачи оптимального управления. B82). 4.2.2. Формулировка принципа максимума. Принцип Лагранжа в задаче оптимального управления. B86). 4.2.3. Игольчатые ва- вариации. B89). 4.2.4. Редукция к конечномерной задаче. B92). 4.2.5. Доказательство принципа максимума. B93). 4.2.6. Дока- Доказательство леммы о пакете иголок. B99). 4.2.7. Доказательство леммы об интегральных функционалах. C07). §4.3*. Задачи оптимального управления, линейные по фазовым пере- переменным 309 4.3.1. Редукция задачи оптимального управления, линейной по фазовым переменным, к задаче ляпуновского типа. C10). 4.3.2. Теорема Ляпунова. C12). 4.3.3. Принцип Лагранжа для ляпуновских задач. C15). 4.3.4. Теорема двойственно- двойственности. C22). 4.3.5. Принцип максимума для задач оптимального управления, линейных по фазовым переменным. C26). §4.4. Применение общей теории к простейшей задаче классического вариационного исчисления 329 4.4.1. Уравнение Эйлера. Условие Вейерштрасса. Условие Ле- жандра. C30). 4.4.2. Условия второго порядка для слабого экстремума. Условия Лежандра и Якоби. C32). 4.4.3. Гамиль- тонов формализм. Теорема об интегральном инварианте. C36). 4.4.4. Достаточные условия абсолютного экстремума в простей- простейшей задаче. C43). 4.4.5. Сопряженные точки. Достаточные условия сильного и слабого экстремума. C48). 4.4.6. Теоре- Теорема Э. Нётер. C57). 4.4.7. Вариационный принцип и законы сохранения в механике. C62). Комментарии и путеводитель по литературе 365 Список литературы 368 Список основных обозначений 375 Предметный указатель 379
Предисловие ко второму изданию Первое издание книги вышло в 1979 году. 1 декабря 1980 го- года завершился жизненный путь Владимира Михайловича Алексее- Алексеева — замечательного человека, выдающегося математика, педагога и просветителя. Готовя книгу к переизданию в серии «Классический университетский учебник» я ограничился только несколькими исправ- исправлениями, не желая менять что-либо существенное в тексте, подготов- подготовленном в окончательном виде В. М. Алексеевым со свойственной ему тщательностью. Но при этом я добавил восьмистраничное дополнение ко введению, где прослежен путь от Ферма до Понтрягина в области необходимых условий экстремума, требующий для своего преодоления знания математического анализа в объёме лишь инженерного или экономического вуза. В. М. Тихомиров
Предисловие Одной из характерных особенностей современной эпохи является все возрастающее внимание к проблемам управления. Как никогда прежде ощущается потребность в плодотворном и эффективном ис- использовании природных богатств, огромных людских ресурсов, матери- материальных и технических средств. Говоря о наиболее приметных явлениях научно-технического прогресса в XX веке, обычно называют расщеп- расщепление атома, первые шаги к освоению космоса, создание компьютеров и новых информационных технологий. На этом фоне теория управ- управления выглядит пока менее эффектно, хотя в развитии современной цивилизации она уже играет выдающуюся роль и есть основание думать, что в будущем эта роль станет еще значительней. Всюду, где имеется возможность активного участия человека, воз- возникает проблема отыскания наилучшего, или, как говорят, оптималь- оптимального, из возможных управлений. Вызванные к жизни потребностями экономики и техники оптимизационные проблемы потребовали в свою очередь создания новых разделов математики. В 40-х годах исследование задач экономики породило новое направление анализа, получившее название линейного и выпуклого программирования. В те же годы приобрели актуальность задачи управления летательными аппаратами и технологическими процессами сложной структуры. Соответствующая математическая теория была создана в середине пятидесятых годов и получила название теории оптимального управления. Выдающуюся роль сыграл в этом принцип максимума Понтрягина. В теории оптимального управления произошел синтез идей и методов исследования, с одной стороны восходящих к классикам вариационного исчисления, а с другой — вполне современных. Ее развитие самым существенным образом связано с именами отечественных математиков. Эта книга задумана как учебное пособие по различным курсам оптимизации, читаемым в университетах и вузах с повышенной математической подготовкой. Расскажем вкратце об общем замысле и плане книги. История исследования задач на экстремум, или, как сейчас обычно говорят, «экстремальных задач», началась не в наши дни —
Предисловие в той или иной мере такие задачи всегда привлекали внимание математиков. Мы хотели раскрыть перед читателями с самой разной предварительной подготовкой эту связь времен и неразрывность научной дороги. Это сделано в первой главе, рассчитанной на широкую аудиторию. Хотя используемый здесь математический аппарат минимален, мы старались выдержать стиль точного математического текста, ограничиваясь наиболее выразительными, но элементарными фрагментами истории изучения экстремальных задач. Наша цель — связать воедино первоначальные замыслы И. Кеплера и П. Ферма, задачи, поставленные X. Гюйгенсом, И. Ньютоном и И. Бернулли, идеи и методы Ж. Лагранжа, Л. Эйлера и К. Вейерштрасса с современным этапом теории, непосредственно продолжающей исследования великих предшественников. Кроме того, в первой главе описаны методы решения конкретных задач и приведены примеры решения на базе единой идеологии задач, поставленных в разные времена учеными разных направлений. Остальная часть книги адресована по преимуществу математикам. Возникновение новой теории стимулировало развитие и старых, и но- новых разделов математического анализа. Не все эти разделы должным образом представлены в современном математическом образовании. Нам кажется, что фрагмент классического анализа, объединенный вокруг темы «неявная функция», играет ныне исключительную роль во всех аспектах конечномерного и бесконечномерного анализа. То же самое можно сказать и об основах выпуклого анализа. Наконец, для теории оптимального управления существенно, что основные факты теории дифференциальных уравнений остаются верными и для уравне- уравнений с разрывными правыми частями. Названные выше три раздела анализа и геометрии излагаются во второй главе. Изложение теории собственно экстремальных задач представлено в третьей и четвертой главах. Их главную часть составляет содержание обязательного полугодового курса, читавшегося авторами на механико- математическом факультете МГУ. Текст препарирован так, что доказа- доказательства основных теорем занимают не больше одной лекции. Всюду выдержан принцип полноты изложения. Мы старались везде избежать пропусков, ссылок на очевидность и т. д. Некоторые стандартные обозначения (из теории множеств, функ- функционального анализа и т. п.) употребляются в тексте без пояснений. Поэтому для облегчения ориентировки читателей в конце книги при- приведен список основных обозначений с краткой их расшифровкой. Параграфы, номера которых отмечены в тексте и в оглавлении звездочкой, призваны подвести читателя к современным методам тео- теории экстремальных задач. Здесь изложение более соответствует мо- монографическому стилю, допускаются отдельные, правда, минимальные, ссылки на теоремы, хотя и ставшие классическими, но находящиеся пока за пределами традиционных программ. Эти параграфы написаны
10 Предисловие на основе специальных курсов «Выпуклый анализ», «Дополнительные главы теории экстремальных задач» и других, также читавшихся на ме- механико-математическом факультете МГУ в течение ряда лет. Более подробно о содержании читатель может узнать из оглавления, где выделены и названы все важнейшие результаты и факты, нашедшие отражение в книге. Из сказанного следует, что мы рассчитываем на разную читатель- читательскую аудиторию: прежде всего — на студентов университетов и вузов с повышенным математическим курсом, но также и на инженеров, экономистов и математиков, сталкивающихся с необходимостью ре- решать различные экстремальные задачи. Для этих читателей написано введение, а для тех, кто интересуется теорией экстремальных задач более серьезно, в конце помещен путеводитель по литературе — моно- монографической и обзорной. В постановке и лекционной разработке на механико-математи- механико-математическом факультете МГУ курса «Оптимальное управление» очень большая заслуга принадлежит Сергею Васильевичу Фомину; по его же инициативе создана и настоящая книга. В ней использован пер- первоначальный конспект лекций, написанный С. В. Фоминым совмест- совместно с В. М. Тихомировым. Безвременная кончина Сергея Васильевича в расцвете сил и таланта не дала ему возможности увидеть завершение своих замыслов. Мы выражаем свою искреннюю признательность коллективу кафед- кафедры общих проблем управления механико-математического факультета МГУ, принимавшему активное участие в обсуждении как методики преподавания курса «Оптимальное управление», так и характера изло- изложения отдельных затрагиваемых в книге вопросов. Мы считаем своим обязательным долгом отметить, что на фор- формирование математических концепций, положенных в основу этой книги, значительное влияние оказала творческая деятельность А. А. Милютина. Мы благодарны А. И. Маркушевичу за ценные консультации, а так- также А. П. Буслаеву и Г. Г. Магарил-Ильяеву, внимательно прочитавшим рукопись и сделавшим ряд весьма полезных замечаний. В. М. Алексеев, В. М. Тихомиров PS. Считаю своим долгом сказать здесь о двух людях, упомянутых выше. Алексей Алексеевич Милютин A925-2000) был нашим учите- учителем в теории оптимального управления. Он впервые прочитал курс «Оптимальное управление» на мех-мате МГУ. Алексей Иванович Мар- кушевич A908-1981) предоставил нам экземпляр из своей библиотеки великого труда Ньютона, что оказалось весьма важным для понимания истоков оптимального управления. В. М. Тихомиров
Глава 1 ВВЕДЕНИЕ § 1.1. Как возникают экстремальные задачи? Людям свойственно стремление к лучшему, и если им приходится выбирать из нескольких возможностей, то желание найти среди них оптимальную представляется вполне естественным. Слово «оптимальный» происходит от латинского optimus, что зна- значит — наилучший, совершенный. Для того чтобы найти оптимальную из возможностей, приходится решать задачи на отыскание максиму- максимума или минимума, т. е. наибольших и наименьших значений каких- то величин. Оба эти понятия — максимум и минимум — объеди- объединяются термином экстремум (от латинского extremum, означающего «крайнее»). Поэтому задачи на отыскание максимума или минимума называют экстремальными задачами. Методы решения и исследования различного рода экстремальных задач составляют специальные разделы математического анализа. По- Почти тот же смысл вкладывается в понятие «задача оптимизации»; в котором более отчетливо прослеживается связь с практическими применениями математики. Цель этой книги — познакомить читателя с теорией и приемами решения экстремальных задач. Но прежде чем переходить к формаль- формальному, логически последовательному изложению этой ветви математики, мы хотим обратиться к прошлому, чтобы лучше понять причины, по- побуждающие ставить и решать экстремальные задачи в их прикладном аспекте, т. е. как задачи оптимизации. Mercatique solum, facti de nomine Byrsam Taurino quantum possent circumdare tergo. P. Vergilius Mam «Aeneas» 0 1.1.1. Классическая изопериметрическая задача. Задача Ди- доны. Задачи отыскания наибольших и наименьших величин впер- впервые были поставлены античной наукой. Древнейшей из известных *) Столько купили земли и дали ей имя Бирса, сколько смогли окружить бычьей шкурой. (П. Вергилий Марон «Энеида».)
12 Гл. 1. Введение экстремальных задач является, пожалуй, классическая изопериметри- ческая задача. Трудно сказать, когда впервые была высказана мысль о наибольшей «вместимости» окружности и сферы среди всех замкну- замкнутых кривых одной и той же длины или поверхностей одной и той же площади. Один из последних учеников афинской школы платоников Симплиций (VI в. н. э.), составивший незадолго до окончательно- окончательного краха античной цивилизации обширный комментарий к трудам Аристотеля (IV в. до н. э.), пишет: «Доказано до Аристотеля, ибо он пользуется этим, как известным, а затем более полно — Архимедом и Зенодором, что среди изопериметрических фигур наиболее вмести- мым является круг, а среди изопифанных — шар». В этих словах обозначена постановка следующих экстремальных задач: среди плос- плоских замкнутых кривых, имеющих заданную длину, найти кривую, охватывающую наибольшую площадь, и среди пространственных замкнутых поверхностей, имеющих заданную площадь, найти по- поверхность, охватывающую наибольший объем. Для философа-пла- философа-платоника такая постановка задачи естественна и связана с поисками идеальных форм. Недаром круг и шар были в древности символами геометрического совершенства. Более прозаическую мотивировку той же изопериметрической зада- задачи и ряда близких к ней задач мы находим, пусть даже в несколько наивной, но достаточно отчетливой форме в легенде о Дидоне. Напом- Напомним ее, следуя «Энеиде» римского поэта Вергилия, две строки которого приведены выше в качестве эпиграфа. Финикийская царевна Дидона и с ней небольшой отряд жителей города Тира, спасаясь от преследований тирана — брата Дидоны, покинули родной город и в поисках счастья отправились на кораблях на запад вдоль берегов Средиземного моря. Выбрав на африканском побережье (нынешний Тунисский залив) удобное место, Дидона и ее спутники решили основать здесь поселение. По-видимому, эта идея не вызвала энтузиазма у местных жителей, но все же Дидоне удалось уговорить их предводителя Ярба, и он неосторожно согласился уступить Дидоне клочок земли, «который можно окружить бычьей шкурой». Не сразу понял простодушный Ярб хитрый замысел финикиянки. Разрезав шкуру на тонкие полоски, Дидона связала их в один длинный ремень и окружила им значительную территорию. На этой территории она заложила город Карфаген 0 . В память об этой истории карфагенская цитадель получила название Бирса 2). Все эти события легенда относит к 825 (или к 814) г. до н. э. Анализируя ситуацию, мы обнаруживаем несколько возможностей поставить здесь задачу оптимизации. *) Финикийское Картадашт — новый город. 2) На языке пунийцев (так римляне называли жителей Карфагена) — шкура. Это название употребляется до сих пор.
1.1. Как возникают экстремальные задачи? 13 А) Требуется указать оптимальную форму участка земли, который при заданной длине периметра L имеет наибольшую площадь S. Ясно, что это та же самая классическая изопериметрическая зада- задача 0 . Ее решением является круг. Упражнение. Считая бычью шкуру прямоугольником 1 м х 2 м и приняв ширину ремешка равной 2 мм, найдите L и максимальное S. (Авторам не удалось найти точные размеры Бирсы. Расположенная на вы- высоком F3 м) холме, она вряд ли была особенно большой. Для сравнения — длина стен Московского Кремля 2235 м.) Решение изопериметрической задачи заключено в следующем утверждении. Если спрямляемая кривая длины L ограничивает плоскую фигуру площади S, то L2^4irS, A) причем равенство имеет место тогда и только тогда, когда кри- кривая — окружность. Неравенство A) называется изопериметрическим; его доказа- доказательство можно найти в [21]. Б) Другие постановки задачи получаются, если, как это есте- естественно считать, Дидона хотела сохранить выход к морю. В отличие от классической изопериметрической зада- задачи, эти задачи мы будем называть задачами Дидоны. Для простоты рассмотрим сначала случай прямолинейного берега (рис. 1). Первая задача Дидоны. Среди всех дуг длины L, содержащихся в полу- полуплоскости, ограниченной прямой I и с кон- концами А, В G I, найти такую, которая вместе с отрезком [АВ] ограничивает фи- р , гуру наибольшей площади S. Решение. Пусть АС В — произвольная допустимая дуга с кон- концами А, В G /, ограничивающая фигуру площади S (рис. 1). Отразив ее симметрично относительно I, мы получим замкнутую кривую длины 2L, ограничивающую фигуру площади 2S. Согласно изопериметриче- скому неравенству BLJ > Att2S, B) откуда S^L2/Bir). C) *) Еще одна реальная ситуация, приводящая к той же задаче, описана Л. Н. Толстым в рассказе «Много ли человеку земли нужно». Разбор этого рассказа с точки зрения геометрии см.: ПерельманЯ. И. Занимательная гео- геометрия. — М.-Л.: Гостехиздат, 1950, — Гл. 12.
14 Гл. 1. Введение Следовательно, максимальным значением S может быть только 1/2/Bтг), и это значение действительно достигается, если АС В — полуокружность, опирающаяся на диаметр [АВ]. Задача имеет единственное решение с точностью до сдвига отрезка вдоль прямой (почему?). В) В предыдущей задаче положение концов А и В искомой дуги можно было выбирать на прямой / произвольно. Что произойдет, если эти концы будут заданы? Вторая задача Дидоны. Среди всех дуг длины L, лежащих в полуплоскости, ограниченной прямой I, и с заданными концами А, В е I найти такую, которая вместе с отрезком [АВ] ограничивает фигуру наибольшей площади. Решение. Ясно, что задача имеет смысл только при L > тг\АВ\ (в противном случае либо нет ни одной дуги, удовлетворяющей усло- условиям задачи, либо (при L = тг|АЕ>|) такая дуга только одна — сам отрезок [АЕ>]). Естественно ожидать по анало- аналогии с предыдущим, что решением будет дуга окружности, для которой [АВ] является хор- хордой. Такая дуга АС В определяется единствен- единственным образом. Дополним ее до полной окруж- окружности дугой ADB (рис.2). Длину дуги ADB Т обозначим Л, а площадь сегмента, ограничен- ограниченного этой дугой и отрезком [АВ], — а. Пусть теперь АСВ — произвольная дуга, рис 2 удовлетворяющая условиям задачи и ограни- ограничивающая вместе с [АВ] площадь S. Замкну- Замкнутая кривая ACBD имеет длину L + A и ограничивает площадь S + а. Согласно A) Att(S + a) ^ (L + ЛJ, откуда S < -i- (L + ЛJ - а. 4тг Как и в A), равенство, а значит, и максимальная S достигаются тогда и только тогда, когда кривая ACBD является окружностью, т. е. когда дуги равны: АСВ = АСВ. Обратим внимание на следующее различие в двух разобранных за- задачах. В первой задаче Дидоны запас конкурирующих кривых больше, поскольку положение точек А и В не задано. Впрочем, без ограничения общности одну из них, скажем А, можно считать фиксированной. Положение точки В тогда определяется дополнительным условием: АСВ не просто дуга окружности, как во второй задаче Дидоны, но это полуокружность. В эквивалентной форме: в своих концах искомая дуга подходит к прямой / под углом 90°. Мы увидим потом, что здесь проявляется общий принцип: предоставляя концам искомой кривой некоторую свободу, мы должны потребовать, чтобы в них выполнялись некоторые условия, называемые условиями трансверсальности. Фор- Форма же искомой кривой в обеих задачах одинакова, она определяется
1.1. Как возникают экстремальные задачи? 15 некоторым уравнением (уравнением Эйлера), которое должно выпол- выполняться вдоль кривой. В нашем случае во всех точках искомая кривая должна иметь одну и ту же кривизну. Г) Рассмотрим теперь, что произойдет, если берег не является прямой линией, ограничась случаем фиксированных концов. Легко сообразить, что если между точками А и В берег мало отличается от прямой, то решением остается та же дуга окружности АСВ, что и раньше. Предыдущее доказательство применимо полностью, только буквой а следует обозначать площадь, заштрихованную на рис. 3. Отсюда же видно, что будет в случае, когда между А и В находится глубокий залив. Пусть, например, между А и В берег прямой, но из точки D перпендикулярно АВ прорыт канал DC. Считая, что граница го- города должна проходить по суше, мы видим, что решением задачи будет та же дуга АСВ, пока точка D остается внутри нее (рис.4, а). Если же канал DC пересек дугу АСВ, но еще \АС\ + \СВ\ < L, решением является кривая, составленная из двух дуг окружностей D В А D В Рис.3 Рис. 4 С Е АС и СВ (рис. 4, б). В предельном случае \АС\ + \СВ\ = L решением является ломаная АСВ, а при \АС\ + \СВ\ > L решение не существует. Рассмотренный вариант можно было бы назвать задачей Дидоны с фазовыми ограничениями. Д) Наконец, остановимся еще на од- одном варианте задачи Дидоны. Пусть по каким-то соображениям (например, ввиду запрета жрецов бога Эшмуна, храм которого впоследствии находился _ в Бирсе) стены города нельзя вести бо- А В лее чем под углом 45° к линии берега, который мы снова предполагаем пря- прямым. Такая задача была бы уже зада- задачей оптимального управления. Ее решение можно найти при помощи принципа максимума Понтрягина, с которым мы познакомимся ниже. В типичном случае решение выглядит, как на рис. 5. Отрезки АС и BE образуют с линией берега угол 45°, a CDE — дуга окружности. Рис.5
16 Гл. 1. Введение А F F Рис. 6 С 1.1.2. Другие старинные экстремальные задачи в геометрии. Уделив изопериметрической задаче достаточно много места, мы остано- остановимся на некоторых других экстремальных задачах с геометрическим содержанием, которые рассматривались математиками разных веков. Такие задачи встречаются, в частности, в трудах величайших матема- математиков античности — Евклида, Архимеда и Аполлония. В «Началах» Евклида (IV в. до н. э.) имеется лишь одна задача на максимум (книга 6, предложение 27). В современ- современной редакции она выглядит так. Задача Евклида. В данный тре- треугольник ABC вписать параллело- параллелограмм ADEF (рис. 6) наибольшей пло- площади. Решение. У искомого параллело- параллелограмма точки D, Е и F являют- являются серединами соответствующих сто- сторон данного треугольника. Доказать это можно разными способами. Например, легко показать, что площади паралле- параллелограммов DDGE и FHEF одинаковы. Отсюда следует, что площадь параллелограмма ADEF меньше пло- площади параллелограмма ADEF, ибо последняя равна площади фигуры ADGEHF, содержащей параллелограмм ADEF. ш В дошедших до нас сочинениях Архимеда (III в. до н. э.) изо- периметрическая задача не упоминается. Доныне неизвестно, что было сделано Архимедом в этой области, и потому приведенные в п. 1.1.1 слова Симплиция остаются пока загадочными. Решение же одной изопифанной (т. е. относящейся к фигурам равной площа- площади) задачи имеется в сочинении Архимеда «О шаре и цилиндре». Там ставится и решается задача о максимальном объеме, который могут иметь сегменты шаров одинаковой по площади боковой поверхности. Ответом в этой задаче является полушар (подобно тому, как полу- полукруг является решением второй задачи Дидоны). «Коника» или «Конические сечения» — так называется величайшее творение Аполлония (Ш-П в. до н. э.). К нашей теме относится пятая книга «Конических сечений». Вот что пишет Ван дер Варден: Аполло- Аполлоний ставит «задачу о том, как провести из одной точки О к коническо- коническому сечению самый длинный и самый короткий прямолинейные отрезки. Однако он дает больше, чем обещает: он определяет все проходящие через О прямые, которые пересекают коническое сечение под прямым углом (в настоящее время их называют нормалями), разбирает, при каком положении О задача имеет два, три или четыре решения». Перемещая точку О, он «определяет ординаты граничных точек G\
1.1. Как возникают экстремальные задачи? П Рис. 7 и 6?2, где число проходящих через О нормалей разом переходит с 2 на 4 и обратно» 0 (рис. 7). Вместе с гибелью античной цивилизации научная деятельность в Европе замирает примерно до XV века. В XVI в. закладываются основы алгебры и появляются первые экс- экстремальные задачи алгебраического содер- содержания. Вот, например, задача, предлагавшаяся Н. Тартальей (XVI в.): разделить число во- восемь на две части так, чтобы произведе- произведение произведения этих частей на их раз- разность было максимальным. До XVII в. не было выработано никаких общих приемов решения экстремальных за- задач, и каждая из них решалась специально для нее разработанным приемом. В 1615 г. вышла книга И. Кеплера «Новая стереомет- стереометрия винных бочек» 2). Кеплер начинает кни- книгу так. «В тот год, как я женился, урожай винограда был хороший и вино дешево, а потому мне, как хорошему хозяину, следовало запастись вином. Я купил его несколько бочон- бочонков. Через некоторое время пришел продавец — измерить вмести- вместимость бочонков, чтоб назначить цену за вино. Для этого он опускал в каждый бочонок железный прут, и, не прибегая ни к какому вычислению, немедленно объявлял, сколько в бочке вина». (Этот «метод» мы иллюстри- иллюстрируем на рис. 8.) Кеплер очень удивился. Ему показалось стран- странным, как с помощью одного измерения можно вы- вычислить вместимость бочек разной формы. «Я счел для себя подходящим, — пишет Кеплер, — взять новый предмет математических занятий и исследо- исследовать геометрические законы такого удобного изме- измерения, и выяснить его основания». Для разреше- разрешения поставленной задачи Кеплер закладывает основания интегрального и дифференциального исчисления и заодно дает первые общие пра- правила решения экстремальных задач. Он пишет (цитируем по кни- книге Е. А. Предтеченского) 3) «Кеплер, его жизнь и научная деятель- деятельность»: «Под влиянием благодатного гения, бывшего, без сомнения, Рис. 8 О Ван дер Варден Б. Л. Пробуждающаяся наука. — М.: Физмат- гиз, 1959. 2) Кеплер И. Новая стереометрия винных бочек. — М.-Л.: ОНТИ- ГТТИ, 1935. 3)Предтеченский Е. А. Кеплер, его жизнь и научная деятель- деятельность. — Петербург: изд. 3. И. Гржебина, 1921.
18 Гл. 1. Введение хорошим геометром, бочары стали придавать бочкам ту форму, которая при данной длине линии, измеренной мерщиком, дает возможность судить о наибольшей вместимости бочки, а так как вблизи вся- всякого максимума изменения бывают нечувствительны- м и, то небольшие случайные отклонения не оказывают заметного влияния на емкость». В выделенных нами словах и заложен тот основной алгоритм на- нахождения экстремумов, который впоследствии был оформлен в точную теорему сначала (для многочленов) Ферма A629 г.), а затем — Ньюто- Ньютоном и Лейбницем и получил название теоремы Ферма. Отметим еще, что Кеплер решил несколько конкретных экстре- экстремальных задач, в частности задачу о цилиндре наибольшего объема, вписанном в шар. В заключение этого пункта приведем еще одну геометрическую за- задачу, которой в XVII в. интересовались многие математики (Кавальери, Вивиани, Торичелли, Ферма и др.). В XIX в. ею занимался немецкий геометр Штейнер, и потому эту задачу часто называют задачей Штейнера 0 . Задача Штейнера. В плоско- плоскости треугольника найти точку, сум- сумма расстояний от которой до вершин треугольника минимальна. Решение. Приведем изящное гео- геометрическое решение этой задачи для остроугольного треугольника. Пусть в треугольнике ABC (рис. 9) величина угла С ^ 60°. Совершим поворот тре- треугольника ABC вокруг точки С на угол 60°. Получим треугольник А'В'С. Возь- Возьмем теперь любую точку D в тре- треугольнике ABC, а через D' обозначим образ D при нашем повороте. Тогда сумма длин \AD\ + \BD\ + \CD\ равна длине ломаной \BD\ + \DD'\ + \D'A'\, ибо треугольник CDD' равносторонний и \D'A'\ = \DA\. Пусть теперь D — точка Торичелли, т. е. уточка, из которой все стороны треугольника видны под углом 120°^и D1 — образ D при пово- повороте. Нетрудно понять, что тогда точки В, D, D1 и А1 лежат на одной прямой и, значит, точка Торичелли и является решением задачи. ¦ Мы познакомили читателя с несколькими экстремальными задача- задачами геометрического содержания, поставленными и решенными в раз- Рис. 9 *) Отметим заодно, что впоследствии подобные задачи стали возникать при строительстве дорог, нефтепроводов и городских коммуникаций.
1.1. Как возникают экстремальные задачи? 19 ные времена. Постановку их лишь частично можно оправдать практи- практическими потребностями — основным стимулом здесь, пожалуй, было желание показать красоту самой геометрии. 1.1.3. Вариационный принцип Ферма и принцип Гюйгенса. Задача о преломлении света. С именем Пьера Ферма связана фор- формулировка первого вариационного принципа для физической пробле- проблемы. Речь идет о вариационном принципе Ферма в геометрической оптике. Экспериментально закон преломления света был установлен Снеллиусом. Вскоре Декарт дал теоретическое объяснение этого за- закона. Однако при этом у Декарта получалось, что в более плотной среде (скажем, в воде) скорость распространения света больше, чем в менее плотной (например, в воздухе). Этот факт многим показался сомнительным. Ферма дал другое объяснение явления. Его основная идея состояла в том, что луч света «избирает» такую траекторию, вдоль которой время, затрачиваемое на преодоление пути от одной точки до другой было бы минимальным (в сравнении с любыми другими траекториями, соединяющими те же точки). В однородной среде, в которой скорость распространения света во всех точках и во всех направлениях одина- одинакова, время, затрачиваемое светом на прохождение некоторой траек- траектории, пропорционально ее длине. Поэтому траектория минимального времени, соединяющая точки А и В — это просто отрезок [АВ]: в однородной среде свет распространяется прямолинейно. Вывод закона преломления Снеллиуса из вариационного принципа Ферма сейчас содержится в школьных учебниках (см. также п. 1.6.1). В основу принципа Ферма положено допущение о том, что свет распространяется по некоторым линиям. X. Гюйгенсу A629-1695) при- принадлежит другое объяснение законов распространения и преломления света, основанное на представлении о свете как о волне, фронт которой движется со временем. Отвлекаясь от обсуждения физических пред- предпосылок этой идеи, и, в частности, от вопроса о том, что такое свет — волна или поток частиц, дадим следующее, скорее, наглядное, чем стро- строгое, определение. Волновым фронтом St называется множе- множество точек, которых достигает за время t свет, распространяемый некоторым источником Sq. Если, например, источник So — это точка, а среда однородна, то St — это сфера («сфе- Рис- Ю рическая волна») радиуса vt с центром в So (рис. 10). С ростом t волновой фронт расширяется равномерно во все стороны со скоростью v. Линии же распространения света образуют пучок лучей (радиусов), ортогональных St в каждый момент t. По ме- мере удаления от источника сферическая волна становится все более
20 Гл. 1. Введение Ks, Рис. 11 и более плоской и, если мы вообразим источник бесконечно удален- удаленным, то в пределе волновой фронт оказывается плоскостью, равномерно движущейся со скоростью v и остающейся перпендикулярной пучку лучей света, которые теперь параллельны между собой (рис. 11). Для определения движения волново- волнового фронта в более сложных ситуациях Гюйгенс пользуется следующим правилом («принцип Гюйгенса»). Каждая точка вол- волнового фронта St сама становится вторич- вторичным источником, через время At мы полу- получаем семейство волновых фронтов от всех этих вторичных источников и истинный волновой фронт St+At в момент t + At есть огибающая этого семейства (рис. 12). Легко видеть, что распространение све- света от точечного источника в однородной среде и предельный случай плоской волны удовлетворяют принципу Гюйгенса. В качестве примера применения этого принципа в простейшей неоднородной среде приведем вывод закона Снеллиуса «по Гюйгенсу». Пусть параллельный пучок световых лучей падает на плоскую границу Е раздела двух однородных сред; для простоты будем представлять себе, что Е горизонтальна, а свет падает сверху (рис. 13). Через г; 1 и i?2 обозначим скорости рас- распространения света над и под Е и че- через а\ и а<1 — углы падения и пре- преломления (отсчитываемые от нормали N к Е). Волновой фронт А\А^А дви- движется со скоростью v\ и в некоторый момент t свет, вышедший из точки Рис- 12 Д достигает границы Е в точке В. После этого точка В становится вто- вторичным источником сферических волн, распространяющихся в ниж- нижней среде со скоростью г>2- В точку С\ свет придет в момент vAt t+At и =t = t \вс{ V\ , а в промежуточную точку D sinai . К моменту t\ сферическая е [ВС\] — в момент t2=t-\- \BD волна от вторичного источника В будет иметь радиус r\ = v — t) = \BC\\— sinai, а волна от D — радиус т^ = v<i(t\ — t^) = = \DC\\— sinai. Касательные С\С и С1С2 к этим сферам совпадают, поскольку = ^ sina, = 171
1.1. Как возникают экстремальные задачи? 21 Точка D были взята на ВС\ произвольно, и, следовательно, вторич- вторичные волны в момент t\ имеют огибающей прямую СС\, образую- щую с L угол а*} такой, что sm^ = — sinaj. А это и есть закон Снеллиуса sin oi2 V2 sina\ v\' Принципы Гюйгенса и Ферма тесно связаны между собой. В самом деле, пусть нам известно положение волнового фронта St в некоторый момент t. Где он будет находиться через некоторое время At? Возьмем точку С е St+At (Рис- 14). По определению существует А е Sq и путь N v2 Рис. 13 Рис. 14 АС, который свет проходит за время t + At, и, в соответствии с прин- принципом Ферма, любой другой путь из А в С требует большего времени. По непрерывности на дуге АС найдется точка В такая, что от А до В свет проходит за время t, а от В до С — за время At. Так как дуга АС обладает свойством минимальности, то этим же свойством должны обладать и дуги АВ и ВС. Действительно, если бы существовал, например, путь, по которому из А в В свет мог бы добраться меньше чем за время t, то, дополнив этот путь дугой ВС, мы бы получили путь из А в С, по которому свет идет меньше, чем за время t + + At, а это невозможно. Отсюда следует, во-первых, что В е St, а во- вторых, что точка С принадлежит волновому фронту, отвечающему точечному источнику света, находящемуся в В, и времени At. Это вполне согласуется с принципом Гюйгенса: точка В стала вторичным источником и распространяющаяся от нее волна оказалась через время At в точке С. Идея волнового фронта, принцип Гюйгенса и рассуж- рассуждение, набросок которого мы только что привели, явились базой для будущей теории Гамильтона-Якоби, а в середине нашего века — для так называемой теории динамического программирования, которая
22 Гл. 1. Введение является важным инструментом решения прикладных экстремальных задач. * * * Вслед за вариационным принципом Ферма было открыто множество других вариационных принципов — сначала в механике, а затем в фи- физике. Со временем у большинства ученых созрела уверенность в том, что природа всегда «избирает» движение, как бы решая некоторую задачу на экстремум. Здесь уместно привести слова Эйлера: «В мире не происходит ничего, в чем не был бы виден смысл какого-нибудь максимума или минимума». В наши дни Карл Зигель позволил себе такое шутливое высказывание: «По Лейбницу наш мир является наи- наилучшим из всех возможных миров, а поэтому законы можно описать экстремальными принципами». 1.1.4. Задача о брахистохроне. Зарождение вариационного ис- исчисления. В 1696 г. появилась заметка И. Бернулли с интригующим заглавием: «Problema novum, ad cujus solutionem mathematici invitan- tur» («Новая задача, к решению которой приглашаются математики»). В ней была поставлена следующая зада- задача: «В вертикальной плоскости даны две точки А и В (рис. 15). Определить путь АМВ, спускаясь по которому под дей- _ ствием собственной тяжести тело М, на- М ^Х. л ^ чав двигаться из точки А, дойдет до точ- точки В в кратчайшее время» 0 . ^ 1Г Решение этой задачи, по словам Лейб- Рис. 15 I ница, «столь прекрасной и поныне неиз- неизвестной», было дано самим И. Бернулли, а также Лейбницем, Я. Бернулли и еще одним анонимным автором, в котором знатоки «ех unge leonem» (по словам И. Бернулли) 2) сразу же узнали Ньютона. Кривая наикратчайшего спуска или брахистохрона оказалась циклои- циклоидой. Решение Лейбница было основано на аппроксимации кривых ло- ломаными. Развитая впоследствии в работах Эйлера, эта идея заложила основы прямых методов в вариационном исчислении. Замечательное решение Я. Бернулли использовало принцип Гюйгенса и идею «вол- «волнового фронта». Однако наибольшую популярность получило решение самого автора. Его мы и приведем. Введем в плоскости систему координат (х, у) так, чтобы ось х была горизонтальна, а ось у направлена вниз. В соответствии с законом Галилея скорость тела М в точке с координатами (х,у(х)) (если 1) Может быть нелишне напомнить, что некоторый отдаленный намек на по- постановку задачи о брахистохроне содержится в «Беседах» Галилея. Там дока- доказывается, что, двигаясь по хорде, тело придет в конечную точку позже, чем двигаясь по окружности, стягиваемой хордой. 2) По когтям (узнают) льва (лат.).
1.1. Как возникают экстремальные задачи? 23 Т = тело без трения спускается по кривой у(-) — см. рис. 16) не зависит от формы кривой у(-) между точками А и (х,у(х)), а зависит лишь от ординаты у(х) и равна ^2ду[х), где д — ускорение силы тяжести. При этом требуется найти наименьшее время, которое потребуется на преодоление пути от А к В, т. е. надо минимизировать интеграл ds Г ds v ~ I ^2ду(х) ' АВ АВ где ds — дифференциал длины дуги. Но (в силу принципа Ферма из п. 1.1.3) мы получим в точности ту же задачу, если будем исследовать траектории света в неодно- неоднородной (двумерной) среде, где скорость в точке (х,у) равна л/2ду . Далее, И. Бернулли «дробит» среду на параллельные слои, где считает А у(х) + dy 2/1 х х + dx х А -a2 \ «2 \ Рис. 16 скорость постоянной и равной Снеллиуса получаем V\ Рис. 17 i, i = 1,2,... (рис. 17). В силу закона = const, где oti — углы падения луча. Переходя к пределу при измельчении слоев (Бернулли, разумеется, не останавливался на обосновании за- законности такой процедуры), получаем, что = const, v[x) где v(x) = л^2ду(х), а а(х) — угол между касательной к кривой ?/(•) в точке (х,у(х)) и осью Оу, т.е. sina(x) = 1/д/1 + {у'{%)J • Итак, уравнение брахистохроны:
24 Гл. 1. Введение Интегрируя его (подстановкой у = С sin2 —, dx = С sin2 — dt), приходим к уравнениям циклоиды: С С x = C\ + — (t- sint), у = — A - cost). Подчеркнем различие между задачей Евклида и Кеплера (о вписан- вписанном цилиндре) и, скажем, задачей о брахистохроне. Множество всех вписанных в треугольник параллелограммов и множество всех вписан- вписанных в шар цилиндров зависят от одного параметра. Таким образом, в этих задачах требуется найти экстремум функции одного переменно- переменного. В задаче же о брахистохроне множество всех кривых, соединяющих две точки, бесконечномерно. Здесь требуется найти экстремум функ- функции бесконечного числа переменных. История математики проделала неожиданный скачок — от единицы сразу к бесконечности, от теории экстремумов функций одного переменного — к теории задач типа задачи о брахистохроне, т. е. к вариационному исчислению, как стали называть этот раздел в XVIII в. Вскоре после работы И. Бернулли было решено много задач, по- подобных задаче о брахистохроне: о кратчайших линиях на поверхности, о равновесии тяжелой нити и другие. Годом же рождения вариационного исчисления принято считать 1696 г. — год брахистохроны. Однако исторически это не совсем верно. Об этом мы расскажем в следующем пункте. 1.1.5. Аэродинамическая задача Ньютона. В 1687 г. вышли «Математические начала натуральной философии» Ньютона. В разделе седьмом, озаглавленном «О движении жидкостей и сопротивлении брошенных тел», Ньютон рассматривает задачу о сопротивлении шара и цилиндра в «редкой» среде 0 . Затем в «Поучении» Ньютон исследует вопрос о сопротивлении усеченного конуса, движущегося в той же «редкой» среде. В частности, он обнаруживает, что среди всех конусов, имеющих данную ширину и высоту, наименьшее сопротивление будет испытывать конус с углом 135°. Заметив мимоходом, что данный результат может быть «не бесполезен при построении судов», Ньютон пишет так: «Quod si figura DNFG ejusmodi sit ut, si ab ejus puncto quovis N ad axem AB demittatur perpendiculum NM, et dicatur recta GP quae parallela sit rectae figuram tangenti in N, et axem productam sicet in P, fuerit MN ad GP ut GPcub ad ABP x CB^, solidum quod figurae hujus revolutione circa axem AB describitur resistetur minime omnium ejusdem longitudinis & latitudinis». Сказанное Ньютоном можно перевести следующим образом: «Ко- «Когда же кривая DNFG будет такова, что если из любой ее точки N опустить на ось АВ перпендикуляр и [из заданной точки G] провести О См. предложение 34, теорема 28 в кн.: Крылов А. Н. Собрание трудов, т. 7. - М.-Л.: Изд. АН СССР, 1936.
1.1. Как возникают экстремальные задачи? 25 прямую GP, параллельную касательной к кривой в точке N, пере- пересекающую ось в точке Р, то [имеет место пропорция] MN : GP = = GP3 : (АВР х GB2), тогда тело, получающееся вращением этой кривой около оси АВ, будет испытывать наименьшее сопротивление в вышеупомянутой редкой среде среди других тел той же длины и ширины» (см. рис. 18, принадлежащий Ньютону). Ньютон не дал объяснения тому, как он пришел к своему решению. Впоследствии он передал своим комментаторам наброски вывода, но они были опуб- опубликованы лишь в 1727-1729 гг., ко- когда уже завершался первый этап вариационного исчисления. Подго- Подготовительные материалы Ньютона, опубликованные лишь в наше вре- время, показывают, что он владел эле- элементами многих конструкций, впо- впоследствии осуществленных Эйлером и Лагранжем. Как мы увидим да- Рис- 18 лее, задачу Ньютона следует отнести даже собственно не к вариационному исчислению, а к оптимальному управлению, теория которого начала разрабатываться в пятидесятые годы нашего века. 1.1.6. Задача о рационе и транспортная задача. Предположим, что запасы некоторого продукта распределены по нескольким базам и что этот продукт должен быть доставлен нескольким магазинам. Стоимость перевозки единицы продукта от каждой базы до каждого магазина известна, и известно, сколько продукта должно быть достав- доставлено в каждый магазин. Транспортная задача заключается в состав- составлении оптимального в этой ситуации плана перевозок, т. е. в указании того, какое количество данного продукта надо перевезти из каждой базы в каждый магазин, чтобы суммарная стоимость перевозки была минимальной. Похожая задача о рационе состоит в том, чтобы при определенном ассортименте продуктов, заданном содержании в каждом из них питательных веществ и известной стоимости единицы каждого продукта составить рацион, удовлетворяющий необходимым потребно- потребностям с минимальными денежными затратами. Такого рода задачи в огромном количестве возникают в конкрет- конкретной экономике. Обе упомянутые выше задачи относятся к разде- разделу, называемому линейным программированием. Теория линейного программирования была построена лишь в сравнительно недавнее вре- время—в сороковые-пятидесятые годы нашего века. 1.1.7. Задача о быстродействии. Приведем простейший пример экстремальной задачи с «техническим» содержанием. Пусть имеет- имеется тележка, движущаяся прямолинейно без трения по горизонталь- горизонтальным рельсам. Тележка управляется внешней силой, которую можно
26 Гл. 1. Введение изменять в заданных пределах. Требуется остановить тележку в опре- определенном положении в кратчайшее время. Эту задачу мы называем далее простейшей задачей о быстродействии. Особенность постановок экстремальных задач техники состоит в том, что действующие силы делятся на две части. Одна из них — это силы природы (скажем, сила тяготения), другая (скажем, си- сила тяги) регулируется человеком. При этом, естественно, возникают ограничения на управляемые воздействия, связанные с техническими возможностями. Теория решения подобных задач была построена еще позже — в конце пятидесятых годов. Ее называют теорией оптимального управления. * * * Итак, откуда берутся экстремальные задачи? Приведенными здесь примерами мы постарались показать, что ответов на этот вопрос много. Экстремальные задачи возникают как из естествознания, из экономики и техники, так и вызываются потребностями самой математики. По- Поэтому теория экстремальных задач и ее практический аспект — теория оптимизации — приобрели в наши дни большую популярность. § 1.2. Как формализуются экстремальные задачи? 1.2.1. Основные определения. Каждая из задач § 1.1 была сфор- сформулирована в содержательных терминах той частной области, где эта задача возникла. Обычно экстремальные задачи ставятся именно так, и, вообще говоря, не всякую задачу обязательно надо решать аналитически. К примеру, задачи Евклида и Штейнера мы решили чисто геометрическим способом. Однако если мы все-таки желаем воспользоваться преимуществами аналитического подхода, то первое, что необходимо, это осуществить перевод задачи с «содержательного» языка на формальный язык анализа. Такой перевод называется форма- формализацией. Точно поставленная экстремальная задача включает в себя следу- следующие элементы: функционал 0 /: X —> R, определенный на некото- некотором множестве X, и ограничение, т. е. некоторое подмножество С С С X. (Через R обозначается «расширенная вещественная прямая», т. е. совокупность всех вещественных чисел, пополненная значениями — —оо и +оо.) Множество X называется иногда классом допустимых элементов, а точки х е С — допустимыми по ограничению. При этом сама задача формулируется так: найти экстремум (т. е. нижнюю или *) В теории экстремальных задач числовые функции часто называют функ- функционалами.
1.2. Как формализуются экстремальные задачи? 27 верхнюю грань) функционала f при условии, что х G С. Для той же задачи будет употребляться стандартная запись: /О) -> inf(sup); xeC. A) Таким образом, для точной постановки надо описать X, f и С. Если X = С, то задача A) называется задачей без ограничений. Точку х будем называть решением задачи A), минималъю (соответ- (соответственно максималъю) или абсолютным минимумом {максимумом), если f(x) ^ f(x) (соответственно f(x) ^ /(#)) для всех х € С. Как пра- правило, все задачи будем записывать^как задачи минимизации, заменяя задачу f(x) —> sup, xGC, задачей /(ж) —> inf, х е С, где /(ж) = —f(x). В тех случаях, когда хотим подчеркнуть, что для нас безразлично, рассматривается ли задача минимизации или максимизации, мы пишем f(x) -> extr. Далее, множество X у нас обычно бывает наделено топологией, т. е. в нем имеет смысл понятие близости элементов. Это можно сде- сделать, например, задав в X набор окрестностей (как это стандартно делается в Rn или в нормированном пространстве). Если X — то- топологическое пространство, то х называется локальным минимумом, если существует такая окрестность U точки х, что х — решение задачи f(x) —> inf, x G С П U. Аналогично определяется локальный максимум. 1.2.2. Простейшие примеры формализации экстремальных за- задач. Приведем формализацию некоторых задач § 1.1. Начнем с зада- задачи Евклида (см. п. 1.1.2, рис.6). Из подобия треугольников DBE и ABC получаем: h(x)/H = х/Ъ. Здесь х — сторона \AF\ паралле- параллелограмма ADEF, Н — высота ААВС, h(x) — высота ABDE, Ъ = = \АС\ — длина стороны АС. Площадь параллелограмма ADEF равна (if — h(x))x = Н(Ъ — х)х/Ъ. Теперь получаем следующую формализа- формализацию задачи Евклида: } -> sup, 0 < х < Ъ, <& х(х - b) -^ inf, х е [0,Ь]. A) Три элемента, из которых состоит всякая формализация, здесь суть: X = R, f = H(b- х)х/Ъ, С = [О, Ъ]. Формализуем задачу Архимеда об изопифанных сегментах шаров (см. п. 1.1.2). Пусть h — высота шарового сегмента, R — радиус шара. Объем шарового сегмента, как известно из геометрии, равен 7rh2(R — /г/3), а площадь поверхности 2irRh. Отсюда видно, что задачу Архимеда можно формализовать двояко: 2 тт/г2 (R - \ ] -> sup, 2тгД/г = a, R^O, 2R^h^0, B)
28 Гл. 1. Введение или, исключая R из функционала в B), ha Trft3 ~2 3~ sup, B') ^ft2). (последнее неравенство проистекает из-за того, что ft ^ 2R =>¦ а В первом случае X = R\, f = nh2(R - ft/3), С = {(Д, ft) | 2тгДЛ = = a, 2R > ft}; во втором, полагая X = [0, д/а/тг], имеем задачу без ограничений с функционалом / = fta/2 — 7rft3/3. Задача Кеплера о максимальном по объему цилиндре, вписан- вписанном в шар (см. п. 1.1.2), допускает такую очевидную формализацию: 2тгжA -х2) -^sup; 0<ж<1 (X = R,C= [0, 1]). C) Здесь шар имеет единичный радиус, г х — длина половины высоты цилиндра. Вопрос о преломлении света на границе двух однород- однородных сред, решаемый с помощью вариационного принципа Ферма (см. п. 1.1.3 рис.19), сводится к такой задаче. Пусть две однородные среды раз- разделены плоскостью z = О, причем ско- скорость распространения света в верхнем полупространстве равна v\, а в нижнем г?2. Мы ищем траекторию луча, идущего из точки А = @,0, а), а > 0, в точку В = (?,0, -/3), C > 0. По соображениям симметрии луч будет лежать в плоско- плоскости у = 0. Пусть С = (х, 0,0) — точка преломления луча. Тогда время распро- распространения луча из А в В равно /а2 + х2 z, а С в X Рис. 19 Т(х) = В соответствии с принципом Ферма координата искомой точки х, где происходит преломление, находится из решения задачи = C = R). D) Т(х) = V\ V2 Заметим, что получилась задача без ограничений. Аналогично следующая задача без ограничений \х - ?i| + \х - ?2| + \х - ?з| —> inf> E) где X = С = R2, ?i, ?2, 6з — ТРИ заданные точки плоскости R2, \х = = Jx\+x\, является формализацией задачи Штейнера (см. п. 1.1.2). Отметим важную особенность функционала задачи E) — он является выпуклой, но не всюду дифференцируемой функцией.
1.2. Как формализуются экстремальные задачи? 29 Задача Аполлония о кратчайшем расстоянии от точки ? = (?ь?2) ДО эллипса, задаваемого уравн \\ \\ пускает, очевидно, такую формализацию: = (?ь?2) ДО эллипса, задаваемого уравнением х\/а\ + х\/а\ = 1, до- доF) X = R2, С = ix af a^ х, Итак, мы познакомились с формализацией простейших задач. Фор- Формализация более сложных задач, возникающих в естествознании, тех- технике или экономике, обычно составляет специальную и не слишком тривиальную проблему. Там сама формализация зависит от физических или иных гипотез. В следующем пункте мы покажем это на примере задачи Ньютона. 1.2.3. Формализация задачи Ньютона. Формализация этой за- задачи зависит, естественно, от законов сопротивления среды. Нью- Ньютон представлял себе среду (он называл ее «редкой») состоящей из неподвижных частиц фиксированной массы га, являющихся абсолютно упруги- упругими шарами. Примем и мы эту гипотезу. Пусть тело вращения вокруг оси х (рис. 20) движется в направлении, обрат- обратном оси х («вниз») в описанной нами «ред- «редкой» среде Ньютона со скоростью v. Эле- Элемент dr на оси г при вращении вокруг оси х описывает кольцо площади da = = 27rrdr, и этому кольцу соответствует по- пояс dYl на самом теле вращения. За вре- время dt этот пояс «вытеснит» объем dV = = 2nrdrvdt. Пусть р — плотность среды. Тогда число частиц, ударившихся о слой, Рис. 20 равно N = — dV = т т at, где т — масса частицы. Подсчитаем силу dF, действующую на слой dH за вре- время dt. Пусть участок ds наклонен к оси г под углом (р. Отражаясь от сЕ, одна частица получает приращение импульса, равное m(v2 — — vi) = — 2mvcos(p • п, где v = |vi| = |v2|, n — единичный вектор d t нормали к сЕ, а ср = arctg — — угол ds с горизонталью. В силу третьего закона Ньютона тело получает противоположное прираще- приращение импульса m2v cos ip • п, а за время dt таких приращений будет N, причем в силу симметрии компоненты импульса, ортогональные оси вращения, в сумме дают нуль, а осевая компонента суммарного
30 Гл. 1. Введение приращения импульса равна Nm 2v cos ip cos cp = m2v cos2 cp = 4pirv2r dr dt cos2 p p (p. ifl В силу второго закона Ньютона это выражение равно dF dt, откуда dF = кг dr cos2 ср, к = 4ртгг>2, а общая сила сопротивления равна R т dv A) + (dx/drf A) о Таким образом, заменив г на t и й на Г, мы приходим к экстре- экстремальной задаче т Легко сообразить, не решая задачи B) (впервые это отметил Ле- жандр в 1788 г.), что нижняя грань в задаче равна нулю. Действи- Действительно, если выбрать ломаную х(-) с очень большой по модулю произ- производной (рис.21), то интеграл B) будет очень мал. С другой стороны, для любой функции х(-) интеграл в B) неот- неотрицателен. Таким образом, нижняя грань значений интеграла равна нулю. Отмеченное только что обстоятельство неоднократно вызывало критику, иногда и злорадную. Один из последних приме- примеров — в книге Янга 0 говорится: «Ньютон Y сформулировал вариационную задачу о те- теле вращения, испытывающем наименьшее сопротивление при движении в газе. При- гис- Z1 нятыи им закон сопротивления физически абсурден, в результате чего поставленная им задача не имеет решения (чем более зазубрен профиль, тем меньше сопротивление)... Если выводы Ньютона хотя бы приблизительно были верны, то мы не нуждались бы сегодня в дорогостоящих экспериментах в аэродинамических трубах». Задорно сказано! Многих людей утешает мысль, что и великие грубо ошибаются. Но так ли обстоит дело в дан- данном случае? Прежде всего, заметим, что сам Ньютон не формализовал свою задачу — это за него сделали (и не вполне удачно) другие. Для правильной формализации надо учесть неявно подразумевавшуюся мо- монотонность профиля (при зазубренном профиле частицы испытыва- испытывают многократные отражения, что искажает всю картину). Требование *) Я н г Л . Лекции по вариационному исчислению и теории оптимального управления. — М.: Мир, 1974.
1.2. Как формализуются экстремальные задачи? 31 монотонности делает задачу физически осмысленной. С учетом этого обстоятельства решение самого Ньютона не только «приблизительно» верно, но поразительно верно в деталях, о чем речь пойдет впереди. Более того, физические гипотезы, выдвинутые Ньютоном, и само его решение аэродинамической задачи оказались весьма актуальными в со- современной сверхзвуковой аэродинамике, когда на очередь дня встало построение сверхскоростных и высотных летательных аппаратов. Допущение о монотонности приводит к следующей формализации задачи Ньютона: ж@)=0, ж(Т)=?, XGR+. C) 1.2.4. Различные формализации классической изопериметри- ческой задачи и задачи о брахистохроне. Простейшая задача о быстродействии. Первые две из упомянутых в заглавии задач принадлежат к числу известнейших, но оказываются едва ли не са- самыми трудными для полного исследования. Мы дважды формализуем каждую из них — один раз традиционным, общеизвестным способом, другой — менее известным. Этим хотелось бы подчеркнуть принци- принципиальную неединственность процедуры формализации. На самом деле, выбор удачной формализации составляет самостоятельную проблему, и во многом успех при решении задачи зависит от искусства, которое здесь будет проявлено. Начнем с классической изопериметрической задачи. Пусть длина кривой равна L, а сама кривая задана параметрически функциями #(•), у(-), причем в качестве параметра взята длина дуги s, отсчитываемая вдоль кривой от некоторой ее точки. Тогда в любой точке выполнено соотношение x2(s) + y2(s) = 1, и, кроме того, х@) = x(L), y@) = y(L), так как кривая замкнута. Для большей определенности в расположении искомой кривой можно потребовать также, чтобы ее центр тяжести попал в начало L L координат, т. е. чтобы имели место равенства x(s) ds = y{s) ds = о о L = 0. Площадь S кривой (#(•),?/(•)) равна xijds. Отсюда получается о следующая формализация: L S = \xyds —> sup; x2(s) + y2(s) = 1, (О [ x(s) ds = [ y(s) ds = 0, x@) = x(L), y@) = y(L). о о
32 Гл. 1. Введение Однако ту же задачу можно формализовать и по-другому. Предста- Представим себе самолет, пилот которого получил задачу облететь за заданное время возможно большую площадь и вернуться на свой аэродром. Если максимальная скорость самолета не зависит от направления полета, то данная задача приобретает следующую естественную формализацию. 1 т Площадь должна быть максимальна <^> — j(x(t)v(t) — y(t)u(t)) dt —> 2 о —> sup, где x(t) = u(t), y(t) = v(t). Максимальная скорость самолета равна V <^> и2 + v2 ^ V2. Самолет возвращается на свой аэродром <^> х@) = х(Т), у@) = = У(Т). Возможна и более общая постановка, когда максимальная скорость зависит от направления (например, при наличии ветра). Тогда мы по- получаем более общую задачу: [xv — yu) dt —> sup, x = и, у = v, о x@) = x(T), 2/@) = y(T), (w, v) G A, B) где А — множество всех допустимых скоростей самолета. Если А — круг, то мы, очевидно, приходим к классической изопе- риметрической задаче, если А — «сдвинутый» круг (что соответствует постоянному ветру), то получается известная задача Чаплыгина. Приведем теперь самую традиционную формализацию задачи о брахистохроне. Введем, как и в п. 1.1.4 (рис. 16), в плоскости систему координат (х, у) так, чтобы ось х была горизонтальна, а ось у направлена вниз. Не ограничивая себя в общности, можно считать, что точка А совпадает с началом координат. Пусть координаты точки В — (х\,у\), х\ > 0, у\ > 0 (см. рис. 16) и у(-) — функция, задаю- задающая уравнение кривой, соединяющей точки А и В. Напомним, что в соответствии с законом Галилея скорость тела М в точке (х,у(х)) зависит не от формы кривой у(-) в интервале @,х), а лишь от самой ординаты у(х), причем эта скорость равна л^2ду{х), где д — ускорение силы тяжести. Следовательно, время Т, требуемое для преодоления участка кривой длины ds = \]dx2 + dy2 на участке от (х, у(х)) до (х + + dx, у(х) + dy), равно ds/^/2ду{х). Отсюда получается следующая формализация задачи о брахистохроне: = 0, y(xl)=yl. C) Приведем другую формализацию задачи о брахистохроне, идейно близкую ко второй формализации классической изопериметрической
1.2. Как формализуются экстремальные задачи? 33 задачи, следуя упоминавшейся статье И. Бернулли 1696 г., в которой он отталкивался от вариационного принципа Ферма. Представим себе неоднородную среду, в которой скорость распро- распространения света зависит лишь от «глубины» у по закону v2 = 2gy. Тогда луч света в соответствии с вариационным принципом Ферма будет проходить путь от А до В в кратчайшее время. Так получается формализация задачи о брахистохроне в виде задачи о быстродействии: Т -> inf, х = ^/у и, у = ^/у v, и2 + v2 = 2д, ш ж@) = 2/@) = 0, х(Т)=хи W Аналогично выглядит и формализация простейшей задачи 0 быстродействии (п. 1.1.7). Пусть масса тележки га, ее началь- начальная координата хо, а начальная скорость vo. Внешнюю силу (силу тяги) обозначим через и, а текущую координату тележки — через x(t). Тогда по закону Ньютона тпх = и. Ограничение на тягу зададим в таком виде: и ? [щ,щ]. Отсюда Т —> inf, mx = и, и?[и1,щ], E) х@) = х0, х@) = щ, х(Т) = х(Т) = 0. Получилась постановка, весьма похожая на B) и D). Отметим одно важное обстоятельство. На самом деле мы «недофор- мализовали» еще наши задачи. Например, в формализации C) не ука- указана точно область определения функционала 3 и, следовательно, пока неизвестно, на каком классе кривых рассматривалась задача (т. е. не определено множество X п. 1.2.1). То же относится и к остальным формализациям этого пункта. Впрочем, «классики» зачастую вообще не обращали внимания на аккуратную формализацию задач, а просто решали их «недоформализованными». Но мы хотим в дальнейшем быть педантичными и точными до конца, а потому придется заниматься этим несколько скучным делом — указывать всякий раз, в каком классе объектов ищется (или было найдено) решение. 1.2.5. Формализация транспортной задачи и задачи о рационе. Начнем с транспортной задачи. Введем такие обозначения: ai — количество единиц продукта, находящегося на г-й базе, 1 < г < ш, bj — потребность (в тех же единицах) в j-м магазине, 1 ^ j ^ п, Cij — стоимость перевозки единицы продукта из г-й базы в j-и магазин, Xij — планируемое количество единиц продукта для перевозки из г-й базы в j-й магазин. m n Тогда стоимость перевозки равна Yl Y1 сЦхч-> и ее НУЖНО миними- г=1 з = \ зировать. Ограничения при этом следующие: а) х^ ? R+ (очевидное ограничение на величину перевозки); 2 В. М. Алексеев и др.
34 Гл. 1. Введение б) ^2 х^ ^ di (нельзя вывезти больше того, что есть); т в) J2 xij = bj (нужно перевезти ровно столько, сколько необхо- г=1 димо). В итоге получается следующая формализация: = Ъз,хуеП+. A) Задача о рационе формализуется также просто. Пусть име- имеется п продуктов (зерно, молоко и т. п.) и т веществ (жиры, белки, углеводы и пр.). Допустим, что для полноценного питания необходимо bj единиц j-ro вещества. При этом ац есть содержание j-ro вещества в единице г-го продукта, a q — цена единицы г-го продукта. Обозначив через Xi потребление г-го продукта, получаем задачу т п i=l 7 = 1 •7 ~^ ^п^' п т аи У Xi —> inf, ^S^uijXi ^ bj, Xi ^ 0. B) i=\ i=\ 1.2.6. Основные классы экстремальных задач. Мы кратко упо- упомянули уже в § 1.1, что в теории экстремальных задач выделилось несколько достаточно ясно очерченных классов задач. Прежде чем их описывать, проведем беглый обзор тех способов, какими задавались ограничения в задачах, формализованных выше. Во-первых, нам встретились формализации, где ограничения от- отсутствовали вовсе (скажем, в задаче о преломлении света или задаче Штейнера). Во-вторых, случалось, что ограничения были заданы си- системой равенств (например, в задаче Аполлония, в задаче о брахисто- брахистохроне в формализации C) п. 1.2.4, где равенствами заданы краевые условия). В-третьих, ограничения задавались неравенствами (напри- (например, в транспортной задаче). Наконец, в-четвертых, некоторые огра- ограничения записывались в виде включений (например, ограничение х G G R+ в задаче Ньютона, ограничение (u,v) ? А, где А = {(и,v);u2 + + v2 ^ 1}, в классической изопериметрической задаче в формализа- формализации B) п. 1.2.4). Подчеркнем некоторую условность такого разделения. Скажем, ограничение х G R+ в задаче Ньютона можно было бы записать в виде неравенства х ^ 0, а ограничение (и, v) ? А в классической изопе- изопериметрической задаче можно было бы записать в виде неравенства и2 + v2 < 1. Наоборот, всякое неравенство f(x) < 0 можно заменить на равенство f(x) +и = 0и включение и е R+ и т. д. Тем не менее с точки зрения, принятой в этой книге, разде- разделение ограничений на равенства и неравенства, с одной стороны, и включения — с другой, имеет свой смысл. В курсах анализа при- приводится (а в § 1.3 об этом будет сказано подробно) правило мно-
1.2. Как формализуются экстремальные задачи? 35 жителей Лагранжа для решения задач на «условный экстремум». Как известно, применение этого правила начинается с составления «функции Лагранжа», в которую входят как исследуемый функцио- функционал, так и функции, задающие ограничения. Может оказаться, что по разным причинам некоторые ограничения выгодно не включать в функцию Лагранжа. Так вот, в виде включений мы и выделяем именно те ограничения, которые при решении соответствующей задачи в функцию Лагранжа не войдут. При этом, как и при формализа- формализации задачи (где бывает много способов и выбор удачного зависит от искусства исследователя), в вопросе о разбиении ограничений нет однозначности. Перейдем к описанию основных классов экстремальных задач. В дальнейшем с достаточно общих позиций будут рассмотрены следующие четыре класса. I. Гладкие задачи с ограничениями типа равенств и неравенств. Здесь класс допустимых элементов X будет обычно нормированным пространством 0 , и ограничение С задается равен- равенством F(x) = 0, где F — отображение X в другое нормированное пространство Y, и конечным числом неравенств fi(x) < О, г = 1,..., га. В итоге получается класс задач /oO)^inf, F(x)=0, /г(Ж0, г=1,...,га. A) При этом предполагается, что функции fit i= 1,2, ...,ш, и отоб- отображение F обладают некоторыми свойствами гладкости. Гладкую задачу /о(х) —> inf будем называть элементарной гладкой задачей2) . П. Классическое вариационное исчисление. Здесь традиционным классом допустимых элементов является банахово про- пространство X = Cl([to,t\],~Rn) непрерывно дифференцируемых п-мер- ных вектор-функций х(-) = (х\(-),... ,хп(-)), в котором норма задается формулами Функционалы в задачах классического вариационного исчисления бывают обычно следующих типов: 1) Термины «нормированное пространство» и «банахово пространство» используются здесь и ниже только для корректности постановки задачи. Точные определения читатель найдет в п. 2.1.1. В задаче A) можно для простоты считать, что х = (х\,... ,хп) — вектор в n-мерном арифметическом пространстве Rn. ) Задачи на максимум или с неравенствами другого знака (^) легко при- приводятся к виду A), см. § 3.2. 2*
36 Гл. 1. Введение — интегральные, т. е. функционалы вида и и 4(х(-))= \b(t,x,x)dt = \ L(t,xi(t),... ,xn(t),xi(t),... ,xn(t)) dt; B) to t0 — терминальные, т. е. функционалы вида 5T(x(-)) = /(x(to),x(ti)) = /(xi(to),...,xn(to),xi(ti),...,xn(ti)); C) — смешанные функционалы вида m(x(-))=J(x(-))+ff[x(-)). D) (В дальнейшем функционалы D) мы называем также функционалами Больца.) Ограничения в задачах классического вариационного исчисления обычно распадаются на две части: — дифференциальные связи вида M(t,x(t),x(t)) =0o>Mi(t,x\(t),...,xn(t), x\(t),... ...,xn(t))=0, i=l,2,...,p; E) — граничные условия вида ^(x(to),x(U)) = O^^j(xl(to),...,xn(to),xl(U),...,xn(U)), F) j= 1,2,... ,5. В B) и E) L, Mi и в C) и F) /, i/ij — гладкие функции 2п + 1 и 2п переменных соответственно. Задача J(x(-))^mf, M(t,x,x)=0, i/j(x(to),x(ti))=O G) называется задачей Лагранжа. Задача Зв(х(-)) -^ inf, M(t, х, х) = 0, ф(х(Ь0), x(ti)) = О называется задачей Больца. Задача 2Г(х(-)) -^ inf, M(t, х, х) = 0, i/>(x(to),x(ti)) = О называется задачей Майера. Задачу без ограничений и ЗВ(х(-)) = \ L(t,x(t),x(t))dt + l(x(to),x(ti)) -+ inf (8) to будем называть элементарной задачей Больца.
1.2. Как формализуются экстремальные задачи? 37 Задача и 4(х(-)) = [ L(t, x(t), x(t)) dt -> inf, x(t0) = xo, x(U) = x\ (9) to называется простейшей векторной задачей классического вариаци- вариационного исчисления, а в случае, если п = 1, то — простейшей за- задачей классического вариационного исчисления. Для простоты здесь мы ограничились задачами с фиксированным временем. Более общую постановку, в которой функционал и ограничения зависят также от переменных to и t\, читатель найдет в гл. IV. III. Задачи выпуклого програ м м ир ова н и я. Здесь класс допустимых элементов X является линейным пространством, а огра- ограничение С задается системой равенств F(x) = 0 (где F: X —> Y, Y — другое линейное пространство), неравенств fi(x) ^ 0, г = 1,2, ...,т, и включений х G А. В итоге получается класс задач /oO)^inf, F(x)=0, /;(VK0, г=1,...,га, х е А. A0) При этом предполагается, что функции fi, г = 0, 1,..., т, выпуклы, отображение F аффинно (т. е. F(x) = Ах + rj, где г\ — фиксированный вектор, а Л — линейный оператор из X в У), а А — выпуклое множество. Если в A0) все функции fi линейны, а А — некото- некоторый стандартный конус, то задачу A0) называют задачей линейного программирования. Если в A0) ограничения отсутствуют, то задачу fo(x) —> inf с выпуклой функцией /о мы называем элементарной вы- выпуклой задачей без ограничений. IV. Задачи оптимального у прав лен и я. В этой книге бу- будет рассмотрен следующий класс задач оптимального управления, где х eRn, ue Rr: g(to,x(to)^i,x(ti))^mf, A1) to х = (p(t,x,u), i/>(to,x(to),t\,x(t\)) =0, и eii. При этом в A1) моменты to и t\, вообще говоря, не фиксирова- фиксированы, все функции /: R x Rn x Rr -> R, <p: R x Rn x Rr -^ Rn, ф: R х Rn х R х Rn -^ Rs, g = R x Rn x R x Rn -^ R предполагаем непрерывными по совокупности переменных и непрерывно дифферен- дифференцируемыми по переменным t и х; множество Я — некоторое, вообще говоря, произвольное подмножество Rr. Для полного описания задачи осталось лишь объяснить, что же составляет здесь класс допустимых элементов. На первых порах будем рассматривать совокупность вектор-функций (х(-),и(-)), где и(-) опре- определена и кусочно-непрерывна на [to,ti], причем для всех t выполнено
38 Гл. 1. Введение включение u(t) G Я, а #(•) непрерывна на [to,ti] и дифференциру- дифференцируема во всех точках, кроме тех, где и(-) терпит разрыв; при этом во всех точках дифференцируемости х(-) выполнено равенство x(t) = = 4>{t,x{t),u{t)). Задачи, в которых функционалом является t\, называются задача- задачами о быстродействии. * * * Теперь можно посмотреть, в какие классы попадают задачи пп. 1.2.1-1.2.5. Задачу Евклида (см. A) п. 1.2.2) можно отнести и к гладким задачам, и к задачам выпуклого программирования. Задача Архи- Архимеда в формализациях B) и Bх) п. 1.2.2 и задача Кеплера C) п. 1.2.2 относятся к числу гладких задач. Задача о преломле- преломлении света (см. D) п. 1.2.2) — это и элементарная гладкая зада- задача, и элементарная выпуклая задача. Задача Штейнера (см. E) п. 1.2.2) — элементарная выпуклая задача. Задача Аполлония (см. F) п. 1.2.2) — гладкая задача с ограничениями типа равенств. Задача Ньютона (см. C) п. 1.2.3) — задача оптимального управ- управления. Классическая изопериметрическая задача в фор- формализации A) п. 1.2.4 относится к классическому вариационному ис- исчислению, а в формализации B) — к оптимальному управлению. Задача о брахистохроне (см. C) п. 1.2.4) — простейшая за- задача классического вариационного исчисления; эта же задача в фор- формализации D) п. 1.2.4 — задача о быстродействии оптимального управления. Транспортная задача и задача о рационе (см. A) и B) п. 1.2.5) — задачи линейного программирования; про- простейшая задача о быстродействии — задача оптимального управления. Итак, задачи формализованы и классифицированы. Посмотрим те- теперь, что может дать для их решения аппарат анализа. § 1.3. Правило множителей Лагранжа и теорема Куна-Таккера 1.3.1. Теорема Ферма. Первый общий аналитический прием ре- решения экстремальных задач был разработан Пьером Ферма. Открыт он был, по-видимому, в 1629 г., но впервые достаточно полно изложен в письме к Робервалю в 1638 г. Можно посоветовать читателю обра- обратиться к книге Декарта 0 , где приведено это письмо, и самому вник- вникнуть в первоначальную мысль Ферма. На современном языке (правда, у Ферма лишь для полиномов) прием Ферма сводится к тому, что *) Р. Декарт. Геометрия./ С приложением избранных работ П. Ферма и пе- переписки Декарта. — М.-Л.: ГОНТИ, 1938, с. 154.
1.3. Правило множителей Лагранжа и теорема Куна-Таккера 39 в точке экстремума х в задаче без ограничений f(x) —> extr должно иметь место равенство f'(x) = 0. Как мы помним, первый намек на этот результат содержится в словах Кеплера из «Стереометрии винных бочек». Точный смысл рассуждения Ферма приобрели через 46 лет, когда в 1684 г. появилась работа Лейбница, в которой закладывались основы математического анализа. Уже само заглавие этой работы, которое на- начинается так: «Nova methodus pro maximis et minimis...» («Новый ме- метод нахождения наибольших и наименьших значений...»), показывает, какую важную роль сыграла задача о нахождении экстремумов в ста- становлении современной математики. В своей статье Лейбниц не только получает в качестве необходимого условия соотношение f'(x) = 0 (сей- (сейчас этот результат называют теоремой Ферма), но и употребляет вто- второй дифференциал для различения максимума и минимума. Следует, конечно, напомнить, что большинство излагаемых Лейбницем фактов было к тому времени известно также и Ньютону. Но его работа «Метод флюксий», завершенная в основном к 1671 г., была опубликована лишь в 1736 г. Перейдем теперь к самой теореме Ферма, напомнив предварительно некоторые факты из анализа. Начнем с одномерного случая, когда функции определены на вещественной прямой R. Функция /: R —> R одного переменного называется дифференцируемой в точке х, если найдется такое число а, что f(x + X)=f(x) + aX + r(X), где г(А) = о(|А|), т. е. для любого г > 0 найдется 5 > 0 такое, что из |А| ^ 5 следует |r(A)| ^ ?|А|. Число а называется производной f в точке х и обозначается fix). Таким образом, f'(x) = lim(/(# + A) — - тух. Теорема Ферма. Пусть f — функция одного переменного, дифференцируемая в точке х. Если х — точка локального экстре- экстремума, то Пх) = 0. A) Точки х, в которых выполнено соотношение A), называются ста- стационарными. В соответствии с общими определениями п. 1.2.1 точка х достав- доставляет функции / локальный минимум (максимум), если найдется такое е > 0, что из неравенства \х — х\ < г следует неравенство f(x) ^ f(x) (^ /(#)). Согласно теореме Ферма точки локального экстремума (мак- (максимума или минимума) являются стационарными. Обратное, разумеет- разумеется, неверно: например, f(x) = х3, х = 0. Доказательство. Допустим, что х — локальный минимум функции /, но f'(x) =«/0. Пусть для определенности а < 0.
40 Гл. 1. Введение Задав г = |се|/2, найдем из определения производной такое 5 > 0, что из |А| < 5 следует |г(А)| < |а||А|/2. Тогда для 0 < А < 5 получаем f{x + А) = f{x) +а\ + г(Л) < fix) + аХ + ^ = f(x) - ^ < fix), т. е. х не является точкой локального минимума /. Противоречие доказывает теорему. ¦ Для многих переменных (а тем более для «бесконечного числа пере- переменных») имеется несколько разных определений производных. Более подробно говорится об этом в гл. II (см. п. 2.2.1). Здесь мы напомним лишь основное определение (в бесконечномерном случае принадлежа- принадлежащее Фреше). Функция /: Rn -^Rn переменных называется дифференцируемой в точке х, если найдутся числа (а\,..., ап) (кратко обозначим их через а) такие, что г=1 где \r(h)\ = o(\h\), т. е. для любого г > 0 найдется 5 > 0 такое, что из \h\ = Jh\ + ... + ft2 < 5 следует \r(h)\ < e\h\. Набор а = (a\,... ,an) называется производной f в точке х и обозначается также ff(x). Подчеркнем, что f'(x) — это набор из п чисел. При этом число с^ = = \\m[f(x + Ае^) — f(x)]/\, где е^ = @,..., 1,...,0) (единица стоит на Л—^0 г-м месте), называется i-й частной производной f и обозначается fXi(x) или — (х). Таким образом, f\x) = (fXl(x),..., fXn(x)). Coot- CJX'i ношение ff(x) = 0 означает, что /Ж1(ж) = ... = fXn{%) = 0. Из «одномерной» теоремы Ферма вытекает очевидное следствие: Следствие (теорема Ферма для функций п пере- переменных). Пусть f — функция п переменных, дифференцируемая в точке х. Если х — точка локального минимума функции f, то f'ix)=0&fXiix)=0, г=1,...,п. B) Точки х G Rn, в которых имеют место равенства B), также назы- называются стационарными. Доказательство следствия. Если х доставляет экстремум функции /, то точка нуль должна быть экстремумом функции (pi(X) = = f(x + Лег). По теореме Ферма <^@) = 0. Но ^@) d= fXi(x). 1.3.2. Правило множителей Лагранжа. Этот пункт посвящен гладким конечномерным задачам. Еще раз напомним о причудливо- причудливости исторического развития нашей темы. Вслед за методом решения одномерных экстремальных задач наступила эра классического вариа- вариационного исчисления. Для задач вариационного исчисления с ограни- ограничениями, т. е. в бесконечномерной ситуации, Лагранж сформулировал
1.3. Правило множителей Лагранжа и теорема Куна-Таккера 41 в «Аналитической механике» A788 г.) О свое знаменитое правило множителей, и только спустя примерно десятилетие в «Теории ана- аналитических функций» в 1797 г. он применил его к конечномерным задачам. Конечномерной гладкой экстремальной задачей с ограничениями типа равенств (или задачей об условном экстремуме) называется задача /о(ж) -+ extr, fx(x) = ... = fm(x) = 0. A) Функции Д: Rn —> R, k = 0, 1,..., га, должны здесь обладать некоторыми свойствами гладкости (т. е. дифференцируемости). В этом пункте будем предполагать, что в некоторой окрестности U простран- пространства Rn все функции Д непрерывно дифференцируемы (в том смыс- смысле, что все частные производные dfk/dxi существуют и непрерыв- непрерывны в U). Точка х ? U, fk(%) = 0, к = 1,2,... ,т, доставляет локальный ми- минимум (максимум) в задаче A) в том случае, когда найдется такое г > 0, что если точка х е U удовлетворяет всем ограничениям (fi(x) = = 0, г = 1,...,ш) и \х — х\ < г, то fo(x) > fo(x) (соответственно /о(я) < fo(x)). Функцию ^ = ^,Л,Ло) = ^Л^Л(х), B) к=0 где Л = (Ai,...,Am), называют функцией Лагранжа задачи A), числа Ао, Аь ..., Ат — множителями Лагранжа. Правило множителей Лагранжа. 1. Пусть в задаче A) все функции /о, /ь •••, fm непрерывно дифференцируемы в окрестно- окрестности точки х. Если х — точка локально го^экстр емума^в задаче (\), то найдутся множители Лагранжа А = (Аь ..., Аш) и Ао, не равные одновременно нулю и такие, что выполняются условия стационар- стационарности функции Лагранжа по х ^(ж,А,Ао)=О^^(ж,Аь...,Аш,Ао)=О, C) г = 1,2,...,п. 2. Для того чтобы Ао ф 0, достаточно, чтобы векторы f[(x), ..., f'm(x) были линейно независимы. Таким образом, для определения х, А и Ао получается п + т урав- уравнений: я ЕАЛ^) =0- i=['-'n' /i(*) = - = /m(a:)=0 D) ОЛагранж Ж. Аналитическая механика. — М.-Л.: Гостехиздат, 1950.
42 Гл. 1. Введение с п + т + 1 неизвестными. Следует учесть, что множители Лагран- жа определены при этом с точностью до пропорциональности. Если известно, что Ао ф 0 (а это — важнейший случай, ибо если Ао = = 0, то соотношения C) отражают лишь вырожденность ограничений и не связаны с функционалом), то можно, умножив все А^ на константу, добиться равенства Ао = 1. Тогда число уравнений сравняется с числом неизвестных. В более симметричной форме уравнения D) записываются так: %х = 0, ?х = 0. D') Их решения называются стационарными точками задачи A). Со времен Лагранжа (слова Лагранжа приводятся чуть ниже) почти на протяжении целого века правило множителей формулировалось с Ао = 1, хотя без дополнительных предположений, например линейной независимости, в таком виде оно неверно. Для подтверждения сказан- сказанного рассмотрим задачу \ х\ —> inf, х\ + х\ = 0. Очевидным и единственным ее решением является х = @,0), ибо это — единственная допустимая точка. Попробуем теперь составить функцию Лагранжа с Ао = 1 и применить далее соотношение C). 4) Имеем 9В = х\ + \{х\ + х^), откуда Q(? Q(? -=- = 0 => 2\х{ + 1=0, -^ = 0 => 2\х2 = 0 ОХ\ ОХ2 и первое из этих уравнений несовместно с уравнением х\ + х\ = 0. В качестве условия регулярности, гарантирующего, что Ао ф 0, обычно используют линейную независимость производных f[(x), ..., ..., f'm(x) (см. выше утверждение 2 теоремы). Однако проверка этого условия обычно сложнее, чем проверка непосредственно из уравне- уравнений C) того, что Ао не может равняться нулю (см. решения задач в § 1.6). Поэтому приведенная выше формулировка теоремы, не со- содержащая никаких дополнительных предположений, кроме гладкости, очень удобна. Доказательство теоремы опирается на одну из важнейших теорем конечномерного дифференциального исчисления — теорему об обрат- обратной функции [14, т. 1, с. 455], [9, т. 1, с. 259]. Теорема об обратной функции. Пусть ф\(х\,... ,xs), ..., ф3(х\,... ,xs) — s функций s переменных непрерывно дифференциру- дифференцируемых в некоторой окрестности точки х. Пусть при этом якобиан
1.3. Правило множителей Лагранжа и теорема Куна-Таккера 43 отличен от нуля. Тогда существуют такие го > О и 5q > О, что для любого г] = (щ,... ,rjs), \rj\ ^ го найдется ?, |?| ^ 5q, такое, что ф(х + ?) = ф(х) -\-г), и при этом ? —> О, когда 77 —^ О. Более общие варианты этой теоремы будут доказаны в §2.3. Доказательство правила множителей Лагранжа. Пусть точка х доставляет локальный минимум в задаче A). Возможно одно из двух: или векторы /q(#), •••, ffm(x) линейно зависимы, или эти векторы линейно независимы. А) Пусть векторы линейно зависимы. Тогда ненулевые А&, к = = 0, 1,... , га, для которых имеют место условия C), можно подобрать по определению. Б) Пусть векторы линейно независимы. Приведем это к противоре- противоречию с тем, что х — локальный минимум в задаче A). Рассмотрим отображение Ф(х) = (fo(x) — fo(x), f\(x),..., fm(x)). () '( По условию векторы матрицы А = f'm(x) линейно независимы, т.е. ранг dfpjx) dfpjx) \ дх\ ' '"' дхп r)f (т\ r)f (г) uJm\Jj) uJm\^) \ дх\ равен т + 1. Допустим для определенности, что первые т + 1 столбцов матрицы А линейно независимы, т. е. dfo(x) dfo(x) det \ дх\ дхт+\ 'd'fm(x) \ дх{ Следовательно, функции ф\(х\,..., хт+\) = fo(x\,..., хт+\, жш+2,..., хп) - fo(x\,..., хп), ф2(х\,..., хт+\) = /i (х\,..., хт+\, 5?ш+2,..., хп),..., Фт+\(Х\, ... ,Хт+\) = fm(x\, ... ,Жш+1,Жш+2, ••• Лп) удовлетворяют условиям теоремы об обратной функции. По этой тео- теореме для любого г, 0 < г < го, найдутся х\(г), ..., хт+\(е), такие, что ,...,a;m+i(?),xm+2,...,xn) - fo(x) = -г, /i (х\ (г),..., хт+\ (г), хт+2, • • •, хп) = 0, E) fm(x\(г),...,xm+i(e),5?m+2,...,хп) = 0, причем Хг(г) -^ Xi при г ^ 0, г = 1,2,..., m + 1. Но из E) прямо сле- следует, что точка х не является точкой локального минимума. Искомое противоречие получено. Утверждение 2 теоремы очевидно. ¦
44 Гл. 1. Введение Обобщение правила множителей Лагранжа на бесконечномерные задачи с равенствами и неравенствами будет дано в гл. III. А теперь — еще несколько слов об истории. Первое упоминание о правиле множителей содержится в работах Эйлера по изоперимет- рическим задачам A744 г.). Затем оно было выдвинуто Лагранжем в его «Аналитической механике» A788 г.) для широкого класса задач вариационного исчисления (так называемых задач Лагранжа, о чем будет еще сказано). В 1797 г. в книге «Теория аналитических функций» Лагранж затрагивает вопрос и о конечномерных задачах 0. Он пишет: «On peut les reduire а се principe generale. Lors qu'une fonction de plusieurs variables doit etre un maximum ou min- minimum, et qu'il у a entre ces variables une ou plusieurs equations, il suffira d'ajuoter a la fonction proposee les fonctions qui doivent etre nulles, multipliees chacune par une quantite indeterminee, et la chercher ensuite le maximum ou minimum comme si les variables etaient independantes; les equations qu'on trouvees, serviront a determiner toutes les inconnues». «Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно приба- прибавить к минимизируемой функции функции, задающие уравнения связи, умноженные на неопределенные множители, и искать затем максимум или минимум построенной суммы, как если бы переменные были неза- независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных». Не будет преувеличением сказать, что основная часть этой книги посвящена раскрытию замысла Лагранжа в применении к задачам разной природы. Изложим здесь еще раз основную мысль Лагранжа. Пусть требуется найти экстремум в задаче A). Тогда следует составить функцию Лагранжа B) и рассмотреть задачу Я?(х, А, Ао) —> extr без ограничений. Необходимое условие в этой задаче без ограничений в соответствии с теоремой Ферма для функций п переменных дает нужные уравнения 98Х = 0. Итак, в соответствии с принципом Лагран- Лагранжа уравнения для экстремума в задаче с ограничениями совпадают с уравнениями для задачи 9В(х, А, Ао) —> extr без ограничений при надлежащем выборе множителей Лагранжа А, Ао. Мы увидим далее, что для очень большого числа задач общий замысел Лагранжа оказывается правильным. 1.3.3. Теорема Куна-Таккера. В этом пункте мы рассмотрим задачи выпуклого программирования, для которых идея Лагранжа приобретает наиболее завершенную форму. Этот класс задач стали изучать сравнительно недавно. Основы теории линейного (а это част- х) Lagrange J. L. Theorie des fonctions analytiques, Paris, 1797.
1.3. Правило множителей Лагранжа и теорема Куна-Таккера 45 ный случай выпуклого) программирования были заложены в работе Л. В. Канторовича в 1939 г. Теорема Куна-Таккера — основной резуль- результат этого параграфа — была доказана в 1951 г. Рассмотрим следующую экстремальную задачу (задачу выпуклого программирования): /o(a;)->inf, /;(» < О, i=l,...,m, х e А, A) где X — линейное пространство (не обязательно конечномерное), fi — выпуклые функции на X, А — выпуклое подмножество X. Отметим, и это существенно, что A) — это задача минимизации, а не максими- максимизации. Напомним, что множество С, лежащее в линейном пространстве, называется выпуклым, если вместе с любыми двумя своими точками х и у оно содержит также и весь отрезок [х, у] = {z | z = ах + A — — а)у, О ^ а ^ 1}. Функция /: X —> R называется выпуклой, если для любых х и у ? X выполнено неравенство Иенссена f(ax + A - а)у) < af(x) + A - a)f(y), Va, 0 < а < 1, или, что то же самое, если «надграфик» /, т. е. множество является выпуклым множеством в произведении R х X. Функцию J m x), B) где Л = (Аь...,Аш) называют функцией Лагранжа задачи A), числа Ао, ..., Ат — множителями Лагранжа. При этом в выражении B) не нашло места ограничение х е А. Теорема Куна-Таккера. 1. Пусть X — линейное простран- пространство, fi'. X —> R, г = 0, 1,... ,т, — выпуклые функции на X, А — выпуклое подмножество X. Если х является решением задачи A), то найдутся множители Лагранжа Ао, А, не равные одновременно нулю и такие, что: а) тш9?(х, А, Ао) = 2?(х, А, Ао) (принцип минимума); б) Хг ^ 0, г = 0, 1,..., т (условие неотрицательности); в) \fi(%) =0. г = 1,2, ...,m (условие дополняющей нежестко- нежесткости). ^ 2. Если Ао ф 0, то условия а)-в) достаточны для того, чтобы допустимая точка х была решением задачи A). 3. Для того, чтобы Ао ф 0, достаточно, чтобы нашлась точка х G А, для которой справедливо условие Слейтера fi(x) < 0, г = = 1,..., т.
46 Гл. 1. Введение Таким образом, если выполнено условие Слейтера, то можно счи- считать Ао = 1. Соотношение а) отражает мысль Лагранжа в наиболее завершенной форме: если х доставляет минимум в задаче с ограничениями (типа неравенств), то эта же точка доставляет минимум функции Лагран- Лагранжа (в задаче без тех ограничений, которые включены в функцию Лагранжа). Соотношения б) и в) характерны для задач с неравенства- неравенствами (подробнее см. § 3.2). Доказательство теоремы Куна-Таккера опирается на одну из важ- важнейших теорем выпуклого анализа — теорему отделимости. Правда, здесь нам достаточно ее простейшего конечномерного варианта, кото- который мы сейчас сформулируем, а докажем в следующем пункте. Конечномерная теорема отделимости. Пусть С — выпуклое подмножество в HN, не содержащее точки 0. Тогда найдутся такие числа а\, ..., а^, что для любого х = = (х\,... ,ждг) G С выполняется неравенство N ^CLiXi^O C) г=1 N (другими словами, гиперплоскость J2 aixi — 0' проходящая через 0, г=1 делит R^ на две части, в одной из которых целиком лежит С). Доказательство теоремы Куна-Таккера. Пусть х — решение задачи. Не ограничивая себя в общности, можно считать, что fo(x) = 0, — иначе введем новую функцию /о(х) = /о(х) — fo(x). Положим C = {/iGRm+1,/i = (/xo,...,/xm) I Зже A:fo(x) </х0, /i(x)</xifi^l}. D) Дальнейшую часть доказательства разбиваем на несколько этапов. А) Множество С непусто и выпукло. Действительно, любой век- вектор /i G Rm+1 с положительными компонентами принадлежит С, ибо в D) можно положить х = х. Следовательно, множество С непусто. Докажем его выпуклость. Пусть fi = (/ig,..., /im) и // = (/ig,..., ц'т) G G С, 0 ^ а ^ 1, х и х' — такие элементы из А, что (в соответствии с D)) /о(ж) < /х0, /о(ж') < А*о> Мх) ^ А*г, fi(x') < /i-, г > 1. Положим ха = ах + A — а)а/. Тогда жа G А, поскольку А выпукло, а ввиду выпуклости функций fa fi(xa) = fi(ax + A - a)xr) < т. е. точка a/i + A — a)/ix G С
1.3. Правило множителей Лагранжа и теорема Куна-Таккера 47 Б) Точка О G Rm+1 не принадлежит С. Действительно, если бы точка 0 принадлежала С, то ввиду определения D) отсюда следовало бы, что имеется элемент х ? А, для которого выполняются неравенства: /о(х) < О, fi(x) < 0, г > 1. Но из этих неравенств следует, что х не есть решение задачи. Значит, О ^ С. Поскольку С выпукло и 0 ^ С, можно применить теорему отдели- отделимости, согласно которой найдутся такие Ао, ..., Аш, что г=0 для любого /i G С. ^ В) Множители А^ г > 0 в E) неотрицательны. Действитель- Действительно, в п. А) мы говорили уже, что любой вектор с положительными компонентами принадлежит С, в частности, С принадлежит вектор (г,...,г, \,г,...,г), где г > О и 1 стоит на го-м месте, го ^ 0. Подставив эту точку в E), получаем, что А^о ^ —г J2 Xi, откуда в силу произ- вольности е > 0 следует, что А^о ^ 0. Г) Множители \, г ^ 1, удовлетворяют условиям дополняю- дополняющей нежесткости. Действительно, если fjo(x) =0, jo ^ 1> то Ра" венство Xjofjo(x) = 0 тривиально. Пусть /Jo(x) < 0. Тогда точка E,0,... ,0, fjo(x),O,... ,0), где число /Jo(x) стоит на jq-m месте, а 5 > > 0, принадлежит С — достаточно взять точку х в качестве точ- точки х в D). ^ ^ Подставив эту точку в E), получим, что Xjofjo(x) > — Ао^, откуда из-за произвольности 5 > 0 получается неравенство Aj0 ^ 0. Но было доказано в п. В), что Aj0 > 0, значит, Aj0 = 0 и Xjofjo(x) = 0. Д) В точке х выполнен принцип минимума. Действительно, пусть х е А. Тогда точка (fo(x) + 5, f\(x),..., fm(x)) принадлежит С для любого 5 > 0 (см. определение D)). Поэтому с учетом E) Xofo(x) + + S ^ifi(x) ^ ~^о^, а отсюда (в силу произвольности 5 > 0) следует г=1 _ _ неравенство ^?(ж, А, Ао) > 0. Теперь же, если учесть равенство fo(x) = 0 и условия дополняющей нежесткости, получаем для любого х G А m ?{хХ%) > 0 = ^2%fi(x) = Щ,ХХ). г=0 Утверждение 1 теоремы доказано. Е) Докажем утверждение 2. Если допустить, что Ао ^ 0, то можно считать Ао = 1 (ибо множители Лагранжа, удовлетворяющие соотноше- соотношениям а)-в) теоремы, сохраняют свои свойства при умножении на любой
48 Гл. 1. Введение положительный множитель). Но тогда для любого допустимого х (х G G A, fi(x) ^ О, г ^ 1) получаем /о(я) § /о(ж) + 5] А»Л(ж) = <?(ж, А, 1) % ЩХ О = г=1 г=1 т. е. ж является решением задачи. Ж) Докажем утверждение 3. Пусть выполнено условие Слейтера, (т. е. для некоторого х G А имеют место неравенства fi(x) < 0, г ^ 1), но при этом в утверждении 1 Ао = 0. Тогда сразу же получается противоречие (в выкладке используется, что не все А^ = 0, г ^ 1): т &(х, А, 0) = Y^ Xfi (х)<0 = Щ, А, 0), г=1 в то время как вследствие а) У!(х, А, 0) > ^?(ж, А, 0). ¦ Приведем еще один^вариант теоремы Куна-Таккера. При выполне- выполнении условия Слейтера Ао > 0 и поскольку множители Лагранжа опре- определены с точностью до положительного множителя, можно считать, что Ао = 1. Теперь функция Лагранжа определена на множестве А х R™ = {(х, А) | х = (х\,..., хт) G А; А = (Аь ..., Am), A^ ^ 0} и соотношения а)-в) равносильны тому, что (х, А) является ее седловой точкой, т. е. СЮ( \ \\ СЮ(^^~ \ \\ СЮ(^^~ \ \\ IРС\ ПИП Ju I X, /Л, 1 ) <=>Су(Ж, /Л, 1 ) nicAiX „Ay ( Ду, /Л, 1 ). V / Действительно, левое равенство F) совпадает с а), а правое явля- является следствием в) и б): !?(х, А, 1) = jo{x) + г=1 г=1 В §§2.6, 3.1, 3.3, 4.3 мы расскажем о других теоремах выпуклого анализа и выпуклого программирования.
1.3. Правило множителей Лагранжа и теорема Куна-Таккера 49 Замечание. В «выпуклом анализе» оказывается удобным рас- рассматривать функции со значениями в расширенной числовой прямой R = R U {—оо, +оо}, т. е. удобно разрешить функциям принимать бес- бесконечные значения —оо, +оо. На расширенную числовую прямую рас- распространяются с некоторыми ограничениями правила арифметики (об этом подробнее сказано в примечании в п. 2.6.1). Легко убедиться в том, что приведенное доказательство теоремы Куна-Таккера остается применимым без изменений и к таким функциям. 1.3.4. Доказательство конечномерной теоремы отделимости. Фор- Формулировка теоремы была приведена выше. Напомним, что С — выпуклое множество в R^ и 0 ^ С. А) Пусть НпС — линейная оболочка множества С, т. е. наименьшее линей- линейное подпространство, содержащее С. Возможно одно из двух: либо НпС ф R^, либо НпС = R^. В первом случае НпС — собственное подпространство в R^, N и потому существует содержащая его гиперплоскость ^ пгХг = 0, проходящая г=1 через нуль. Она и является искомой. Б) Если НпС = R^, то из векторов, принадлежащих С, мы можем выбрать N линейно независимых и потому образующих базис в R^. Обозначим их е\, ..., едт; вг ? С, г = 1,..., N. Рассмотрим в R^ два выпуклых конуса: «отрицательный ортант» Ж\ = Г /v N 1 = < ж G R х = Yl 0iei> ft < 0, i = I,... ,N > и коническую оболочку I г=1 J множества С: Ж2 = 1 х е х = ^ otitii, ^г G С, щ ^ 0, i=l,...,s, s любое г=1 N Эти конусы не пересекаются. Действительно, если бы вектор х = — г=1 7г > 0, принадлежал Ж2, то нашлись бы такие s G N, йг ^ 0 и ^ G С, что ж = ^ йг^г- Но тогда точка 0 оказалась бы принадлежащей С, ибо эта точка г=1 могла бы быть представлена в виде выпуклой комбинации X = ~ - N г=1 г=1 7г точек из С. В) Поскольку Ж\ открыто, из доказанного в Б) следует, что ни одна из точек Ж\ не может принадлежать замыканию Жч множества Ж%. (Отметим, что Жъ замкнуто и выпукло. Почему?) Возьмем произвольную точку из Ж\, N ^ например хо = — Е ^г, и найдем ближайшую к ней точку ?о ? Жъ. Такая точка г=1 существует, а именно, это та из точек компактного множества Ж^ П В(хо, |хо|), в которой непрерывная функция f(x) = \х — xq\ достигает своего минимума.
50 Гл. 1. Введение Г) Проведем через ?о гиперплоскость Н, перпендикулярную хо — ?о, и по- покажем, что она искомая, т. е. что О G Я и множество С целиком лежит в одном из двух замкнутых полупространств, ограниченных этой гиперплос- о костью. Мы докажем даже больше, а именно, если Н — внутренность того о из полупространств, которое содержит точку ж0, то ЯпХг = 0. Поскольку множество С С Жч, оно целиком содержится в замкнутом полупространстве, о дополнительном к Н. Предположим противное, и пусть ?i ? Н ПЖ4. Тогда угол жо?о6 острый. Кроме того, [?(b?i] ? Жч, поскольку Жч выпукло. Опустим из жо на прямую (?o,?i) перпендикуляр (хо,^), & ? (Со,6) и покажем, что ?о не является ближайшей к ж0 точкой Жч. Действительно, точки ?о, 6 и 6 лежат на одной о прямой и^Я (почему?). Если ?2 ? [?o,?i]» то & ? «#2 и |ж0 — 61 < |^о — — ^о| (перпендикуляр меньше наклонной). Если же ?i лежит между ^0 и ^2, то |xo~?i| < |хо — ?о| (из двух наклонных та меньше, основание которой лежит ближе к основанию перпендикуляра). С другой стороны, Н проходит через точку 0, ибо иначе луч, исходящий из 0 в направлении точки ?о и целиком лежащий в Ж^ (почему?), обязательно о имел бы общие точки с Н. § 1.4. Простейшая задача классического вариационного исчисления и ее обобщения 1.4.1. Уравнение Эйлера. Вскоре после работы И. Бернулли о брахистохроне стали появляться (и решаться) многие задачи того же типа. И. Бернулли поставил перед своим учеником Л. Эйлером пробле- проблему найти общий путь их решения. В 1744 г. вышел труд Эйлера «Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes sive solutio problematis isoperi- metrici latissimo sensu accepti», «Метод нахождения кривых линий, обладающих свойствами максимума или минимума, или решение изо- периметрической задачи, взятой в самом широком смысле», в котором были заложены теоретические основы нового раздела математического анализа. В частности, аппроксимируя кривые ломаными, Эйлер вывел дифференциальное уравнение второго порядка, которому должны были удовлетворять экстремали. Впоследствии Лагранж назвал его уравнением Эйлера. В 1759 г. появляется первая работа Лагранжа и с ней новые методы исследования. Лагранж «варьирует» кривую, подозреваемую на экстремум, выделяет из приращений функционалов главные линейные части, которые называет вариациями, и пользуется тем, что в точке экстремума вариация должна обращаться в нуль. Метод Лагранжа становится впоследствии общепринятым. Этим методом и мы выведем далее уравнение Эйлера. Отметим еще, что после работ Лагранжа по предложению Эйлера весь раздел
1.4. Простейшая задача классического вариационного исчисления 51 математики, к которому применялся метод Лагранжа, стали называть вариационным исчислением. Перейдем к выводу уравнения Эйлера для простейшей задачи клас- классического вариационного исчисления. В п. 1.2.6 этим именем была названа экстремальная задача и J(x(-)) = \ L(t, х, х) dt —> extr, x(to) = хо, x(t\) = х\, A) to рассматриваемая в пространстве непрерывно дифференцируемых функ- функций Cl([to,t\]), —оо < to < t\ < оо. Пространство Cl([to,t\]) является банаховым, т. е. полным нормированным, относительно нормы: = max( max x(t)\, max x(t)\). Будем предполагать, что функция L (ее называют интегрантом или лагранжианом задачи) непрерывна по совокупности переменных вместе со своими частными производными Lx и Lx. Теорема. (Необходимое условие экстремума в про- простейшей задаче классического вариационного исчис- исчисления.) Пусть функция х(-) G Cl([to,t\]) доставляет локальный экстремум в задаче A). Тогда она удовлетворяет уравнению -jt Li(t, x(t), x(t)) + Lx(t, x(t),x(t)) = 0. B) Уравнение B) называется уравнением Эйлера. Допустимая функ- функция х(-), для которой оно выполнено, называется стационарной точ- точкой задачи A) или экстремалью. Таким образом, локальные экс- экстремумы задачи являются экстремалями; обратное, вообще говоря, неверно. Локальный экстремум в пространстве Cl([to,t\]) в вариационном исчислении называют слабым. В соответствии с общими определени- определениями функция х(-) доставляет локальный минимум (максимум) в за- задаче A) в пространстве Cl([to,t\]), если найдется такое г > 0, что для всякой функции х(-) G Cl([to,t\]), для которой x(to) = x(t\) = О и \\х{'I11 ^ ? выполняется неравенство Доказательство теоремы проведем дважды. Сначала воспользуемся рассуждением Лагранжа. Правда, при этом придется дополнительно предположить, что функция 11—> Lx(t,x(t),x(t)) непрерывно дифферен- дифференцируема. Затем докажем важную лемму Дюбуа-Реймона, из которой наша теорема вытекает и без дополнительного допущения. Обобщение конструкции Дюбуа-Реймона окажется существенным в гл. IV.
52 Гл. 1. Введение Доказательство теоремы складывается из трех этапов. А) Определение первой вариации по Лагранжу. Пусть х(-) ? Cl([to,t\]). Рассмотрим функцию Л ь-> <р(Х) = 3(х(-) + + Хх(-)). Имеем ?, A) dt = [ L(?, x(t) + Аж(?), ж(?) + Xx(t)) dt. to t0 Допущения, наложенные на L, позволяют дифференцировать функ- функцию F под знаком интеграла (для этого достаточно, чтобы функ- 8F ции (?, А) —> F(t,X) и (t, A) ^ -^— (t, А) были непрерывными [14, т. 2, с/Л с. 661], [9, т. 2, с. 107]). Дифференцируя и подставляя А = 0, получаем \t))dt, C) to где p(t) = Li(t, x(t),x(t)), q(t) = Lx(t, x(t), x(t)). Итак, \im(J(x(-) + Аж(-)) — J(x(-))/X) существует для любого Л—^0 х(-) е Cl([to,t\}). Обозначим этот предел 5J(x(-),x(-)). Функция х(-) I—> 5J(x(-), x(-)) называется первой вариацией по Лагранжу функционала 3. Б) Преобразование первой вариации с помощью интегрирования по частя м. Пусть x(to) = x(t\) = 0 и функция р(-) непрерывно дифференцируема. Следуя Лагранжу, имеем и и 6J(x(-),x(')) = \(q(t)x(t)+p(t)x(t))dt = \a(t)x(t)dt, D) to t0 где a(t) = —p(t) + q(t) (произведение p(t)x(t) обращается в нуль на концах промежутка интегрирования). Нам известно, что х(-) доставляет локальный экстремум, для опре- определенности пусть это будет минимум, в задаче A). Отсюда следует, что функция А I—> (р(Х) имеет локальный минимум в нуле. Вследствие теоремы Ферма (см. п. 1.3.1) (р'@) = 53(х(-),х(-)) = 0. Сопоставляя это с D), мы получаем, что для произвольной функции х(-) ? Cl([to,t\]) и такой, что x(to) = x(t\) = 0, имеет место равенство a(t)x(t) dt = 0. to В) Основная лемма классического вариационного исчисления. (Лемма Лагранжа). Пусть непрерывная функ- и ция 11—> a(t), t ? [to, ti] обладает тем свойством, что a(t)x(t) dt = 0 to
1.4. Простейшая задача классического вариационного исчисления 53 для любой непрерывно дифференцируемой функции х(-), у которой x(t0) = x(t\) = 0. Тогда a(t) = 0. Доказательство. Допустим, что а(т) /0 в некоторой точке г ? [to,t\]- Тогда вследствие непрерывности а(-) найдется отрезок А = = [тьгг] С (to,t\), на котором а(-) не обращается в нуль. Пусть для определенности a(t) ^ m > 0, t G А. Построим функцию 0, t ^ А. Нетрудно проверить, что х(-) ? Cl([to,t\]); кроме того, x(to) = x(ti) = и = 0. По условию леммы a(t)x(t) dt = 0. С другой стороны, по теореме to [ [ о среднем [14, т. 2, с. 115], [9, т. 1, с. 344] [ a(t)x(t) dt = a(?) [ ж(?) dt > to t0 > 0, и это противоречие доказывает лемму. ¦ Сопоставляя полученное в А) и В), убеждаемся, что —p(t) + q(t) = = 0, а это и требовалось доказать. Г) Лемма Дюбуа-Реймона. Пусть на [to,ti] функции а(-) м &(•) непрерывны, и пусть E) для любой х(-) ? С1 ([to, t\]) такой, что x(to) = x(t\) = 0. Тогда функция а(-) непрерывно дифференцируема и da(t)/dt = b(t). Доказательство. Интегрируя в E) второе слагаемое в подынтеграль- подынтегральном выражении по частям, получаем *i * * *i 0 = [ (a(t) - [ b(s) ds)x(t) dt + [ b(s) ds x(t) = t0 t0 t0 ° ti t = Ua(t)- \ b(s) ds)x(t) dt. F) t г Докажем, что cp(t) = a(t) — 6(s) (is = const. Если это не так, то найдутся *о такие п и Т2, что </?(ti) / ^(Т2)- Без ограничения общности можно считать, что п и Г2 - внутренние точки отрезка [to, ti] и </?(ti) > ^(гг). Выберем 5 > 0 так, чтобы [тг — 5,Тг + 5] С [to, ti], г = 1,2, и чтобы (/?(s + Ti) — (/?(s + Г2) ^ a > 0 при \s\ < 5.
54 Гл. 1. Введение Теперь возьмем функцию ж(-), производная которой имеет специальный вид ( -(t - ri + S)(t -п-6), t? [п - 6,п + 6], [ 0 для остальных t. Если положить x(to) = 0, то в силу G) x{t\) = x{t) dt = 0, так что для такой *о ж(-) должно иметь место F), но Ц г t T1+6 т2+E a(t) - [ 6(s) ds U(t) dt = [ ip{t)x{t)dt+ \ ip(t)x(t) dt = 5 = f (ip(n + s) - (р(т2 + s))E - s)(s + 5) -8 8 -6 t Противоречие показывает, что cp(t) = a(t) — b(s) ds = const, а тогда a(-) *o дифференцируема и da/dt = 6. ¦ Применив лемму Дюбуа-Реймона к первой вариации C), получаем, что В только что проведенных рассуждениях заключен зародыш так называемого метода вариаций, с помощью которого выводятся раз- различные необходимые условия экстремума. Суть его состоит в следую- следующем. Пусть х — точка, подозреваемая на минимум в задаче f(x) —> inf, х ? С. Тогда можно попытаться построить непрерывное отображение Л ь-> х(Х), Л ? R+ так, чтобы х@) =хи х(Х) ? С, 0 < Л < Ао. Эту кривую естественно назвать вариацией аргумента. Положим (р(Х) = = f(x(X)). Допустим, что функция (р оказывается дифференцируемой справа по Л. Если х — действительно точка минимума, то должно выполняться неравенство (//(+0) = lim(<^(A) — (р(О))/Х > 0, посколь- ку, очевидно, ц>(Х) ^ (р@) = f(x). Если удается построить достаточно массивное множество вариаций аргумента, то полученный набор нера- неравенств (//(+0) ^ 0, относящихся ко всем вариациям, образует неко- некоторое необходимое условие минимума. При выводе уравнения Эйлера использовались «вариации по направлениям»: х(Х) =х + Хх. При вы- выводе необходимого условия Вейерштрасса и принципа максимума будут использоваться вариации другого вида — так называемые «игольча- «игольчатые» (см. пп. 1.4.4 и 1.5.4). В заключение отметим следующие два первых интеграла уравнения Эйлера:
1.4. Простейшая задача классического вариационного исчисления 55 1) Если лагранжиан L не зависит от х, то уравнение Эйлера имеет очевидный интеграл p(t) = LA(t,x(t)) = const. Этот интеграл называют интегралом импульса. 2) Если лагранжиан L не зависит от t, то уравнение Эйлера имеет первый интеграл H(t) = L±(x(t), x(t))x(t) - L(x(t), x(t)) = const. Он называется интегралом энергии (оба названия восходят к класси- классической механике; мы еще будем иметь возможность к этому вернуться; см. пп. 4.4.6 и 4.4.7). Для доказательства вычислим производную: ^ = L,(x(t),x(t))x(t) + ^Li(x(t)i(t))i(t)- - Lx{x(t),x{t))x~(t) - Lx(x(t),x(t))S(t) = = (jt L,(x(t), ад - Lx(x(t), ад) x(t) = о в силу уравнений Эйлера. Следовательно, H(t) = const. Замечание. По ходу дела мы использовали дополнительное пред- предположение о существовании второй производной x(t). Это предположе- предположение можно ослабить, но совсем без него обойтись нельзя. Отметим еще, что уравнение Эйлера — это дифференциальное уравнение второго порядка. Его общий интеграл зависит (вообще го- говоря) от двух произвольных постоянных. Их значения мы находим из граничных условий. 1.4.2. Необходимые условия в задаче Больца. Условия транс- трансверсальности. Простейшая задача, рассмотренная в предыдущем пункте, — это задача с ограничениями: граничные условия x(to) = = хо, x(t\) = х\ образуют два ограничения типа равенств. Следующая задача — так называемая задача Больца — является задачей без огра- ограничений. Пусть L удовлетворяет тем же условиям, что и в п. 1.4.1; / = 1(хо,х\) — непрерывно дифференцируемая функция двух перемен- переменных. Рассмотрим задачу на экстремум в пространстве Cl([to,t\]): и Щх(-))= \L(t,x,x)dx + l(x(to),x(ti))^e*tT. A) to Ее и называют задачей Больца. Теорема (необходимое условие экстремума в зада- задаче Больца). Пусть функция х(-) ? Cl([to,t\]) и доставляет ло- локальный минимум в задаче A). Тогда выполняется уравнение Эйлера -jtLi(t, x(t),x(t)) + Lx(t, x(t), z(t)) = 0 B)
56 Гл. 1. Введение и условия трансверсальности: -Lx{to,x{to),x{to)) = , Доказательство. Действуя в точности так, как на первом этапе доказательства теоремы предыдущего пункта, получим такое выраже- выражение для первой вариации функционала 5В\ О. D) где р(-) и q(-) определены соотношениями C) предыдущего пунк- dl(x(to),x(ti)) • п 1 т м та, a ai = , г = 0, 1. 1ак как х{-) — точка локально- локального минимума, 53)(х(-),х(-)) = 0 для любой точки х(-) ? Cl([to,t\]). В частности, 533(х(-),х(-)) = 0 для любой х(-) ? Cl([to,t\]), у которой x(to) = x(t\) = 0. По лемме Дюбуа-Реймона функция р(-) непрерывно дифференцируема и при этом = д(?). Интегрируя D) по частям и используя то, что p(t) = q(t), приходим к следующему выражению для первой вариации по Лагранжу функционала Больца: и = J (q(t) - p(t))x(t) dt + (а0 - p(to))x(to) + to + (ai +p(t\))x(t\) = (од -p(to))x(to) + (ai +p(ti))x(ti). E) Положив в E) последовательно x(t) = (t — to), а затем t — t\, получаем, что од = p(to), —ol\ = p(ti). ¦ Итак, мы снова получили уравнение второго порядка и два краевых условия — условия трансверсальности. Выше была рассмотрена «одномерная» задача Больца. Совершенно аналогично ставится векторная задача: и 3f(x(-)) = L(t, x\,..., хп, х\,..., хп) dt+ где L:RxRnxRn^R, I: RnxRn^ R.
1.4. Простейшая задача классического вариационного исчисления 57 Необходимые условия экстремума здесь также имеют вид B), C), только соответствующие уравнения надо понимать векторно: - — L^.(tbxi(t),...,xn(t),xi(t),..., ..,xn(t),J1(t),...,Jn(t))=O, Bх) )9... 9xn(t0)9xi(ti)9... 9xn(t{)) г = 0, 1; j = \9...9п. 1.4.3. Расширения простейшей задачи. Простейшую задачу классического вариационного исчисления в п. 1.4.1 мы рассматривали в пространстве Cl([to,t\]). В этом — определенная дань традиции. Пространство Cl([to,t\]), конечно, удобно, но далеко не для каждой задачи оно является естественным. В частности, при тех предполо- предположениях относительно интегранта (непрерывность L, Lx, L% по сово- совокупности переменных (t,x,x)), существование решения в пространстве Cl([to,t\]) не всегда можно гарантировать. Приведем один из простей- простейших примеров. Пример Гильберта. Рассмотрим задачу 1 J(x(-)) = U2^x2 dt -> inf, x@) = 0, x(l) = 1. 0 Здесь уравнение Эйлера имеет интеграл импульса (см. п. 1.4.1) t2/3x = С, откуда следует, что единственной допустимой экстремалью является x(t) = t1/3. Эта экстремаль не принадлежит пространству Cl([to,t\]) (почему?). Вместе с тем она доставляет абсолютный минимум в задаче. Действительно, пусть х(-) — любая абсолютно- непрерывная функция 0, для которой интеграл «#(#(•)) конечен и х@) =х(\)=0. Тогда 2$(t)x(t) + x2(t)) dt = 1 I \x(t)dt- 0 l) Об абсолютно непрерывных функциях говорится в п. 2.1.8. Читатели, не знакомые с этим понятием, могут считать, что ж(-) непрерывно дифференци- дифференцируема в полуинтервале @, 1], интегрируема в несобственном смысле на отрезке [0, 1], имеет конечный интеграл J(x(-)) и х{0) = хA) = 0.
58 Гл. 1. Введение Итак, решение задачи существует, но не принадлежит пространству Среди знаменитых «проблем Гильберта» некоторые посвящены ва- вариационному исчислению. В частности, в двадцатой проблеме речь идет о существовании решения. Гильберт 0 пишет так: «Я убежден, что эти доказательства существования можно будет провести с помо- помощью некоторого общего основного положения, на которое указывает принцип Дирихле и который, вероятно, приблизит нас к вопросу о том, не допускает ли решение каждая регулярная вариационная задача..., если в случае необходимости самому понятию решения придать рас- расширенное толкование». Оптимизм Гильберта подкрепляется огромным опытом классического анализа. Здесь мы вкратце обсудим проблему «расширенного толкования» решения на примере простейшей вариаци- вариационной задачи. Одна из конструкций расширения состоит в том, что к первоначаль- первоначальному классу допустимых элементов добавляются новые и функционал при этом доопределяется на этих новых элементах. В этом направлении мы сделаем скромный шаг — осуществим расширение простейшей задачи на класс кусочно-гладких функций. Напомним, что кусочно-гладкой функцией на [to,ti] называется функция #(•), обладающая тем свойством, что сама она непрерывна, а ее производная кусочно-непрерывна, т. е. непрерывна всюду на [to,ti], за исключением конечного числа точек to < т\ < ... < тш < t\, и при этом в точках т^ производная х(-) имеет разрывы первого рода. Напри- Например, функция ГО, -1 <? <0, X{t) = \ t2sini, 0<t, имеет производную, которая не является кусочно-непрерывной. Совокупность всех кусочно-гладких функций на [to,ti] обозначим KCl([t0,ti])- Интегральный функционал и J(x(-)) = \L(t,x(t)>i(t))dt A) to (ср. п. 1.4.1) естественно продолжается на элементы х(-) ? G KCl([to,t\]), поскольку для таких х(-) подынтегральная функция кусочно-непрерывна и интеграл существует. Рассмотрим теперь простейшую задачу J{x(-)) -> extr, x(t0) = хо, x(tx) = xi B) 1) Проблемы Гильберта / Под ред. П. С. Александрова. — М.: Наука, 1969, с. 55.
1.4. Простейшая задача классического вариационного исчисления 59 в пространстве KCl([to,t\]). В конце этого пункта будет приведен пример функции L, удовлетворяющей стандартным условиям, для ко- которой задача вида B) в пространстве Cl([to,t\]) решения не имеет, а в KCl([to,t\]) — имеет, так что проведенное расширение задачи оказы- оказывается разумным (хотя в примере Гильберта минимум не достигается и в КС1). Несколько аккуратней надо быть с понятием локального решения. Если в окрестность элемента х(-) ? KCl([to,t\]) мы будем по-прежнему зачислять такие #(•), что малы как сами разности x(t) — x(t), так и их производные (ср. определение слабого экстремума в п. 1.4.1), то вновь добавленные элементы будут располагаться далеко от старых. Действительно, если производная х(-) имеет в некоторой точке ска- скачок величины 5, то ни одна из функций х(-) ? Cl([to,t\]) не может удовлетворять неравенству \x(t) —x(t)\ < 5/2 для всех t (для которых x(t) существует). Это, вообще говоря, неудобно: обычно хотят, чтобы старое пространство лежало в расширенном всюду плотно. Поэтому близость в KCl([to,t\]) мы будем определять, сравнивая только сами функции, но не их производные. Это приводит к замене понятия слабого экстремума (п. 1.4.1) понятием сильного экстремума. Определение. Функция х(-) ? KCl([to,t\]) доставляет силь- сильный минимум (максимум) в задаче B), если существует такое г > О, что для любой х(-) ? KCl([to,t\]), для которой x(to) = xq, x(t\) = х\ и И-)-я(-)||о= sup \x(t)-x(t)\<e, C) ?e[?0,?i] выполняется неравенство «#(#(•)) ^ *ЯЖ0) (^ <&(%(')))• Лемма о скруглении углов. 1) Если функция L = L(t,x,x) непрерывна по совокупности аргументов, то Ы3(х(-)) = mfJ{x(-)) . D) x(-)eKC\[to,u}) x(-)ec\[to,u}) x(tO)=XQ, x{t\)=X\ x(tO)=XQ, x(t\)=X\ lk@-^(')llc<e \\x{-)-x{-)\\c<e 2) Равенство D) сохранится, если брать только те х(-) ? ? КС1 ([to, t\]), которые удовлетворяют неравенствам C) для за- заданных х(-) и г > 0. 3) Утверждение остается верным и при замене inf на sup. Доказательство. Поскольку KCl([to,t\]) D Cl([to,t\]), левая часть в D) не больше правой и нужно лишь доказать обратное неравенство. Предположим противное. Если inf «/(#(•)) < inf J(x(-)), то найдутся такая кусочно-гладкая х(-) и такое г\ > 0, что J(x(-)) < < miJ(x(-)) — rj. Пусть т^, г = 1, 2,..., ш, — точки разрыва производной х и Ai = x(ji + 0) — x(ji — 0) — ее скачки в этих точках.
60 Гл. 1. Введение На замкнутом ограниченном множестве Ж= {(t,x,x) \to^t ^tu\x-x(t)\ < < max |Дг|?0/4, I* - x(t)\ < max |A;|/2} непрерывная функция L ограничена: \L(t,x,x)\ ^ M. Функция a(t) = { ~^—' 1*1 ^ *' E) { 0, |t| > 1 непрерывна, а ее производная при t = 0 имеет скачок величины — 1. Поэтому функция 5а ( —^ ), гра- ^ 5 ' а, фик которой получается из графи- п-5 h п+5~1 ка а(-) подобным преобразованием и сдвигом (рис. 22) также непрерыв- Рис. 22 на, и ее производная непрерывна, кроме точки Ti, где она по-прежнему имеет скачок — 1. Теперь нетрудно проверить, что функция xs(t) = x{t) непрерывна вместе со своей производной на [to,ti], причем x$(t) = = x(t) вне отрезков [тг — 5,Тг -\- 5]. В частности, для достаточно ма- малых 5 эти отрезки не перекрываются, х$(и) = х(и) = Xi, г = 0, 1, и \xs(t) - x(t)\ < max |Дг|V4» 1^@ ~ Ш)\ ^ тах|Д^|/2, ибо соглас- согласно E) \a(t)\ < 1/4, |d(t)| < 1/2. Поэтому при 5 < 50 J(xs(-)) - J(x(-)) = и и = \L(t,x5(t),x5(t))dt- lb(t,x(t),x(t))dt = m ^+5 = Y^ (L(t,x5(t),x5(t))-L(t,x(t), x(t)))dt и, следовательно, inf J(x(-)) - г] + 4m5M < in если 5 достаточно мало. Так как а^О) ^ С1 ([to, ti]), мы пришли к про- противоречию. При малых 5 функция х§(-) будет удовлетворять неравен- неравенствам C), если х(-) им удовлетворяет. Отсюда следует второе утвер- утверждение леммы. Третье утверждение очевидно. ¦
1.4. Простейшая задача классического вариационного исчисления 61 Следствие. Если функция х(-) ? Cl([to,t\]) доставляет в зада- задаче B) абсолютный или сильный минимум (максимум) в простран- пространстве Cl([to,t\]), то она обладает тем же свойством и в простран- пространстве KCl([t0,t\})- Проведенное нами расширение на самом деле не всегда оказывается достаточным. Кроме того, пространство KCl([to,t\]) не является пол- полным (относительно метрики, определяемой левой частью C)). Более естественным было бы расширение задачи на класс H^Qto^i]) Функ~ ций, удовлетворяющих условию Липшица 0 . Но это потребовало бы некоторых сведений из теории функций. Есть и еще одна важная кон- конструкция расширения простейшей задачи, которую мы здесь обсудим на примере. Пример Больца. Рассмотрим задачу \ x2f (x(-))=\((l-x2 о inf, ж@)=0, Допустим, что ? = 0. Тогда ясно, что решение задачи не суще- существует. Действительно, нижняя грань функционала равна здесь нулю. Для того чтобы понять это, достаточно рассмотреть минимизирующую последовательность функций из КС1([0, 1]): = sign sin 2imrdr, n= 1,2,... (рис. 23). Функции xn(-) равномер- равномерно стремятся к нулю и i^(t) e 1, за исключением конечного числа то- 1 чек, т .е. 3(хп(-)) = \x2n(t)dt о С другой стороны, если то J(xq(-)) = 1, а если 1 x2dt>0. х(- 0. = 0, ф 0, то Рис. 23 о Дело в том, что функционал 3 не полунепрерывен снизу — мы уста- установили, что в любой близости от функции хо(-) = 0, где функционал принимает значение единица, есть функции, где значение функционала значительно меньше (J(xn(-) —> 0). Так вот, возможно «полунепре- «полунепрерывное снизу» расширение задачи, когда функционал 3 заменяется х) Отметим, однако, что и при этом расширении мы не получим существо- существования в примере Гильберта: функция t \-^ ?1//3 условию Липшица не удовлетво- удовлетворяет.
62 Гл. 1. Введение функционалом = Jim J(x(.))9 ()() а сам запас первоначальных функций (скажем, Cl([to,t\]) или KCl([to,t\])) остается прежним. Предельный переход у(-) —> х(-) понимается здесь в пространстве C([to,t\]) (т. е. в смысле равномерной сходимости). Оказывается, что функционал Jf допускает простое описание. В примере Больца <?(x(-))=\(((x2-l)+J+x2)dt, где Г 0, \х\ \ х2- 1, |±| < 1, > 1. В общем случае, когда ч L(t, x,x) dt, to U to где L — «овыпукление» L по х, т. е. функция х —> L(t,x,x) есть наи- наибольшая выпуклая функция, не пре- превосходящая функции х —> L(t,x,x). Это утверждение называется теоре- теоремой Боголюбова. Этот же пример Больца можно использовать для построения зада- задачи B), в которой минимум достига- достигается на кривой с изломом. Однако по чисто техническим соображениям мы рассмотрим несколько иную задачу: -1 Рис. 24 = Uf(x) + х2) dt -> inf, x(to)=xo, x(t\)=. to F) где функция (u) = ((\u\ - = < o, 1, непрерывно дифференцируема и выпукла (рис. 24).
1.4. Простейшая задача классического вариационного исчисления 63 В частности, график f(u) лежит не ниже любой своей касательной, т. е. всегда f(v)>f(u)+f'(u)(v-u). Поэтому для любых двух функций #(•), х(-) ? KCl([to,t\]), удовле- удовлетворяющих заданным граничным условиям x{ti) = x{ti) = Xi, г = 0, 1, имеем и = J(/(*(*)) - f(Ht)) + ^2 W - ^2@) ^ to U to 2x(t)(x(t) - x(t)) + (x(t) - x(t)f) dt Предположим теперь, что х(-) во всех точках диффенцируемости удо- удовлетворяет уравнению Эйлера f(S(t)) = 2x(t) G) Интегрируя по частям на каждом отрезке непрерывности х(-), получаем - x(t)) dt+ п) ~ x(Ti)) = О, если в дополнение к G) функция p(t) = ff(x(t)) (импульс) непре- непрерывна. Таким образом, функция х(-), удовлетворяющая уравнению Эйлера, условию непрерывности р(-) и краевым условиям, является решением задачи F). Например, x(t) = е^' с изломом в точке t = = 0 является решением этой задачи для to = — 1, t\ = 1, xq = х\ = е. Действительно, ' \ О, x(t) = е~\ t < О,
64 Гл. 1. Введение откуда \x(t)\ ^ 1 и, значит, P(t) = лад = /2(et -1}' t > o, ?<0, скачка в точке t = 0 не имеет: р(+0) = р(—0) = 0. Кроме то- того, -rp(t) = 2e^l = 2x(t), так что уравнение Эйлера удовлетворяет- удовлетворяется. dt 1.4.4. Игольчатые вариации. Условие Вейерштрасса. Понятие сильного экстремума ввел в вариационное исчисление Вейерштрасс. Для доказательства необходимого условия сильного минимума Вейер- Вейерштрасс употребил специальные вариации такого вида (рис. 25, а) т-Л т-Л Рис. 25 x\(t) =x(t) te [r-A,r], te [т,т Д A) Производная вариации h\(-) имеет вид, изображенный на рис. 25, б. Эта производная несколько напоминает иголку, в связи с чем подобные вариации называют «игольчатыми». Игольчатые вариации приспособ- приспособлены к исследованию задач на сильный экстремум. Перейдем к выводу необходимого условия Вейерштрасса. Рассмот- Рассмотрим простейшую задачу классического вариационного исчисления и 3{х(')) = I L(t, х, х) dt -> inf, x(t0) = xq, x(t\) = х\ B)
1.4. Простейшая задача классического вариационного исчисления 65 на классе KCl([to,t\]) кусочно-гладких функций. Пусть х(-) — экстре- экстремаль, подозреваемая на сильный минимум; для простоты будем считать ее гладкой. Следуя общему замыслу метода вариаций, рассмотрим функцию ^{\) = J{xx{-)) = S{x{-) + hx{-)), C) где h\ определено формулами A), г — внутренняя точка [to,ti], ? — произвольное число. Для достаточно малых А ^ О функция х\(-) допустима в задаче B), т. е. x\(U) = x(U) + h\(ti) = Xi, г = 0, 1. Функция ср(-) определена при неотрицательных Л. Докажем, что она диф- дифференцируема справа в точке нуль. Из определения A) сразу видно, что а) |М011о= max \hx(t)\ = О(Х), te[to,ti] D) б) \hx(t)\ = zV\=o(V\), te(r,T + V\). Отсюда т = | (L(t,xx(t)Mt)+Q-L(t,x(t),2(t)))dt+ + I (L(t,xx(t),xx(t))-L(t,x(t),S(t)))dt=^l+g2. E) T Интеграл^ в E) можно оценить так: /j = A(L(r,х(т),х(т) + 0 - L(t,x{t),x{t))) + о(Л) F) (надо воспользоваться теоремой о среднем из дифференциального исчисления, см. п. 2.2.3, и оценкой Dа)). Для оценки второго интеграла^ представим разность А = L(t,x(t) + hx(t),x(t) + hx(t)) - L(t,x(t),x(t)) в виде А = Lx(t,x(t),ic(t))hx(t) + LA(t,x(t),ic(t))hx(t) + о(\/Л) (опять-таки надо применить теорему о среднем и оценку D6)), проинтегрируем второй член по частям и воспользуемся тем, что (ибо ж(-) — экстремаль). В итоге получаем =0 ± (т, х(т), ?(т)) + о(Л). G) 3 В. М. Алексеев и др.
66 Гл. 1. Введение Сопоставляя F) и G), находим -Цт, х(т), ?(т)) - ?L±(г, х(т), ?(т))) + о(А). (8) Таким образом, функция (/?(•) имеет в точке Л = 0 правую производную щи := лю А = L(r,x(r), J(r) +0 - Цт,х(т)Мт)) - ?Ь*(т,х(т),2(т)). Но если х(-) доставляет сильный минимум, то J\x\(-)) ^ 3(х{-)) и, значит, у/(+0) = lim(^(A) - (р(О))/Х ^ О, А \,0 т. е. выполнено соотношение -^(r,x(r),^(r))>0 (9) для любого (GR. Функция (?(?, х, у, z) = L(t, x, z) - L(t, x, у) - (z- y)Ly(t, x, y) называется функцией Вейерштрасса. Таким образом, доказана следующая Теорема (необходимое условие Вейерштрасса для сильного минимума). Для того чтобы экстремаль х(-) е Cl([to,t\]) простейшей задачи классического вариационного исчисления B) доставляла сильный минимум, необходимо, чтобы для любого т е [to,t\] и любого ? е R было выполнено неравенство g(r, ж(т), ж(т), х(т) + 0 = L(t, ж(т), х(т) + 0- - L(t, х(т), Цт)) - ?1*(т, х(т), Цт)) > 0. 1.4.5. Изопериметрическая задача и задача со старшими про- производными. Изопериметрической задачей (с закрепленными конца- концами) в вариационном исчислении называют обычно такую задачу: и Jq(x(-)) = /о(?, х, х) dt -^ extr, to -)) = fi(t,x,x)dt = ot.i, i = 1,.
1.4. Простейшая задача классического вариационного исчисления 67 x(t0) =х0, x(t\) =х\. Предполагается, что функции fa удовлетворяют тем же условиям, что и L в п. 1.4.1: они сами и их частные производные по х и х непрерывны по совокупности переменных. Для простоты ограничимся случаем т = 1. Теорема (необходимое условие экстремума в изо- периметрической задаче). Пусть функция х(-) доставля- доставляет локальный (относительно пространства Cl([to,t\})) экстремум в задаче #М-)) = \ fi(t,x, x) dt = аи x(U) =xit г = О, 1 A') to и при этом функции t i—> fox(t,x(t),x(t)) и t \-^ f\x(t,x(t),x(t)) при- принадлежат Cl([to,t\]). Тогда найдутся числа Xq, Ль не равные нулю одновременно и такие, что для интегранта L = Ло/о + X\f\ выпол- выполнено уравнение Эйлера -jtL*{t, x(t), x(t)) + Lx(t, x(t), x(t)) = 0. B) Доказательство. А) Аналогично тому, как это было проделано в начале доказательства теоремы п. 1.4.1, вычисляем первые вариации функционалов Jo и 3\ по Лагранжу: {t)x(t) + qi(t)x(t)) dt, i = 0, 1, C) где Pi(t) = fa(t,x(t),x(t)), qi(t) = fix(t,x(t),x(t)). Возможно одно из двух: или 53\ = 0 Ух(-) G Cl([to,t\]), x(to) = = x(t\) = 0 или 5J\ ф 0. В первом случае по теореме п. 1.4.1 ~ fu(t, x(t), Щ) + fix(t, x(t), x(t)) = @) и, положив Ao = 0, Ai = 1, немедленно получаем B). Б) Пусть 53\ ф 0 и, значит, существует функция у(-) G Cl([to,t\]), у (to) = y(t\) = 0, для которой вариация 5J\(x(-),y(-)) ^ 0. Рассмотрим функции двух переменных <р{(а, /3) = Ji(x(-) + ах(-) + /Зу(.)), г = 0, 1, з*
68 Гл. 1. Введение предоставив читателю проверить, что они непрерывно дифференцируе- дифференцируемы в окрестности нуля, причем ^ = 5Ji(x(),x()), = 5Ji(x(),y()). Лемма. Для любой х(-) е Cl([to,t\]) такой, что x(to) = x(t\) = 0 @,0) = да ' дC d d @,0) = 0. D) Доказательство. Если определитель D) ф 0, то отображение (а,C) \-^ ((ро(а,C),(р\(а,C)) переводит некоторую окрестность точки @,0) на некоторую окрестность точки (<^о@,0), <^?i @,0)) (соответ- (соответствующую теорему об обратном отображении мы уже использовали в п. 1.3.2). В частности, найдутся такие а и /3, а, следовательно, и до- допустимая функция х(-) + ах(-) + /Зу(-), что (/?о(<% /5) = ^о(^@ + сеж(-) + + /3у(-)) =fo(x(-))-e, где ? > 0^ a ^i(a,/3) = ^i@,0) = #i(x(-)) = = аь Это противоречит тому, что х(-) доставляет локальный минимум в задаче A). ¦ В) Из равенства D) имеем «¦«•>•*<¦»-SMI «ш*» -° (знаменатель здесь по предположению отличен от нуля). Полагая Ао = = 1, Ai = — 5Jo(x(-),y(-))/5J\(x(-),y(-)), убеждаемся, что А0ад(ж(.), ж(.)) + Wi (ж(-), ж(.)) = 0 для любой х(-) е Cl([to,t\]), у которой x(to) = x(t\) =0. Легко видеть, что левая часть E) имеет вид E) to Применяя основную лемму вариационного исчисления, получаем урав- уравнение , ~dt (^oPoW + Aipi(t)) + (Xoqo(t)+ \\qi(t)) = 0, совпадающее с B). ¦ Задачу (Iх) впервые рассмотрел Эйлер в своей знаменитой работе 1744 г. Там же методом ломаных было получено соотношение B). Соб-
1.5. Задача Лагранжа и основная задача оптимального управления 69 ственно говоря, это и составляло основное содержание работы. Несом- Несомненно, в ней уже содержатся начала метода множителей Лагранжа. В заключение бегло рассмотрим задачу со старшими производными: extr, x(j\u)=x{, г = 0,1, j = 0, ...,n-l. За подробностями отошлем читателя к [2] или [3]. Эту задачу бу- будем исследовать в пространстве Cn([to,t\]) функций, непрерывных вместе с производными до порядка п на отрезке [to,ti]. Функцию / и ее производные по х, х, ..., х^ будем предполагать непрерывными по совокупности переменных. Пусть х(-) — функция, подозреваемая на экстремум. Вычислим первую вариацию функционала по Лагранжу: Из условия локальной экстремальности вытекает, что 5J(x(-),x(x х)) =0, если только х^\и) = 0, г = 0,1, j = 0, 1,..., п — 1. Инте- Интегрируя G) по частям (предоставив читателю сформулировать нужные требования на гладкость Pj(-)), преобразуем первую вариацию к виду x(t)dt и, применив обобщение основной леммы классического вариационного исчисления на случай функций из Cn([to,t\}) с условиями x^\ti) = 0, г = 0, 1, j = 0, 1,..., п — 1 (это обобщение также предоставляем проду- продумать читателю), получим, что необходимым условием экстремальности х(-) является выполнение следующего уравнения, называемого уравне- уравнением Эйлера-Пуассона: § 1.5. Задача Лагранжа и основная задача оптимального управления 1.5.1. Постановки задач. Важным этапом в истории естество- естествознания явилось сочинение Жозефа Луи Лагранжа «Аналитическая механика», опубликованное в 1788 г. В частности, трактат Лагранжа
70 Гл. 1. Введение сыграл исключительную роль и в развитии вариационного исчисления. Именно там была поставлена следующая задача на условный экстремум: A) to Ф(?, x(t), x(t)) = 0 & <$>j(t, x(t),x(t)) = 0, j=l,...,m, B) x(to) = xo, x(t\) = x\. Здесь x(-): [to,ti] -> Rn, /: R x Rn x Rn ^ R, Ф: R x Rn x Rn ^ Rm. Задачу A) и различные ее модификации, связанные с дополнительны- дополнительными ограничениями (другими граничными условиями, дополнительными интегральными соотношениями и т. п.; см. также 1.2.6), стали называть впоследствии задачей Лагранжа. Для решения задачи A) Лагранж использовал тот основной прием, о котором говорилось в п. 1.3.2, — правило множителей. Впрочем, оно не было им аккуратно обосновано, и потребовалось более ста лет для того, чтобы придать рассуждениям Лагранжа вид строго доказанной теоремы. Отметим два наиболее важных частных типа ограничений, охваты- охватываемых общим выражением B). Ограничение Ф(?,ж) = 0, когда функ- функция в B) не зависит от х, называется в вариационном исчислении фазовым. В механике фазовые ограничения называют также голоном- ными связями. Другой случай — когда соотношения B) можно разрешить относи- относительно производных х. Тогда это ограничение записывается в форме уравнений х = (p(t,x,u), x(-): [to,t\] —> Rn, u(-): [to,t\] —> Rr, cp: R x х Rn x Rr —> Rn. Переменные х(-) здесь называют фазовыми, пере- переменные и(-) — управлениями. Этому важнейшему случаю мы и уделим основное внимание. Точнее говоря, будем рассматривать далее задачу и J(x(-),u(-)) = J f(t, x(t), u(t)) dt + фо(х(к), x(ti)) -+ extr, (Iх) to x — (p(t, x, u) = 0, i/j(x(to),x(t\)) = = O(^^(^o),^i))=O, j=l,...,s). B0 При этом в (Iх), Bх) /: V -> R, ip: V -^ Rn, ф: W -^ Rs, где V и W — открытые множества в пространствах R x Rn x Rr и Rn x х Rn соответственно. Моменты времени to и t\ будем считать здесь фиксированными. Ограничение х — (p(t, x, и) = 0 называется дифференциальной свя- связью, ограничения ф(х(го),х(Ь\)) = 0 называются граничными или кра- краевыми условиями. Задачу (Iх), Bх) будем называть задачей Лагранжа в понтрягинской форме.
1.5. Задача Лагранжа и основная задача оптимального управления 71 Все функции /,(риф предположим непрерывно дифференцируе- дифференцируемыми. Далее в гл. IV будет рассмотрен еще более общий случай, когда to и t\ также могут меняться, допускаются изопериметрические ограни- ограничения типа равенств, неравенств и т. п. Задачу (Iх), Bх) будем рассматривать в банаховом пространстве Z = Cl([to,t\],~Rn) х C([?o,?i],Rr). Иначе говоря, будем рассматривать пары (х(-),и(-)), где х(-) — непрерывно дифференцируемая п-мерная вектор-функция, а и(-) — непрерывная r-мерная вектор-функция. Пару (х(-),и(-)) будем иногда сокращенно обозначать через z. Элемент z = (х(-),и(-)) ? Z будем называть управляемым процес- процессом в задаче (Iх), Bх), если x(t) = (p(t,x(t),u(t)), Vt ? [to,t\], и допу- допустимым управляемым процессом, если, кроме того, удовлетворяются краевые условия. Допустимый элемент 2Г= (х(-),и(-)) будет называться оптимальным в слабом смысле процессом или слабым минимумом в задаче (Iх), Bх), если он доставляет локальный минимум в задаче, т. е. если найдется такое г > О, что коль скоро \\х — х\\\ < г и \\и — - и\\о < г, то J(z) > J(z). 1.5.2. Необходимые условия в задаче Лагранжа. Попробуем применить к задаче (Iх), Bх) предыдущего пункта общий прием Лагранжа, о котором шла речь в п. 1.3.2. По аналогии с конечномер- конечномерным случаем функцию Лагранжа следует записать так: и ?(x(-),u(-Y>P(-)>»>bo) = \Ldt + l, A) to где L(t, х, х, и) = p(t)(x — (p(t, х, и)) + Xof(t, x, и), B) s l(xo,xi) = ^2njil>j(xo,xi),\o =/x0. C) To, что «терминальная часть» или терминант функции Лагранжа / имеет вид C), не вызывает сомнения — здесь имеется полное подобие с конечномерным случаем. Что же касается ограничения х = ip(t,x,u), то оно должно выполняться для всех t ? [to,t\], и соответствующий «множитель Лагранжа» р(-) по аналогии должен быть функцией t, а его вклад в функцию Лагранжа имеет вид интеграла, а не суммы. Итак, функция Лагранжа составлена. Следуя рецепту Лагранжа, нужно теперь искать условия экстремума полученного выражения, «как если бы переменные были независимы». Иначе говоря, следует рассмотреть задачу адО,<);Я')>ЯА0)^ех^, D) считая множители Лагранжа фиксированными. Задача D) — это зада- задача Больца, рассмотренная в п. 1.4.2. Выписанные там условия экстре-
72 Гл. 1. Введение мума в применении к задаче D) приведут к правильным уравнениям, называемым уравнениями Эйлера-Лагранжа. Точнее, имеет место следующая теорема. Теорема Эйлера-Лагранжа. Если 2Г= (х(-),и(-)) — опти- оптимальный в слабом смысле процесс для задачи {V), Bх) п. 1.5.1, то найдутся множители Лагранжа Ао = До ^ О 6 задаче на ми- минимум и^ О в задаче на максимум, р(-) G Cl([to,t\],Hn), Д = = (Дь... ,ДД не равные одновременно нулю 0 и такие, что будут выполнены уравнения Эйлера -jt Li(t,x(t),x(t),u(t)) + Lx(t,x(t),x(t),u(t)) = 0, E) Lu(t,x(t),x(t),u(t)) =0, F) и условия трансверсальности к^х(к),х(и)), к = o,i. G) Вследствие того, что L не зависит от й, а / от и, уравнение Эйлера по и имеет вырожденный вид F), а условий трансверсальности «по ш> нет вовсе. Эту теорему (и даже в несколько более общем виде) мы докажем в §4.1 как прямое следствие общей теоремы, касающейся правила множителей Лагранжа для гладких бесконечномерных задач. Отметим, что из этой теоремы следует необходимое условие экстремума в изопериметрической задаче (с произвольным числом изопериметрических условий) и уравнение Эйлера-Пуассона для задач со старшими производными. Изопериметрические ограничения 3 (x(-)) = I fi(t,x,x)dt = аи г = 1,... ,m; x e Rn, можно учесть, введя новые фазовые переменные, связанные со старыми дифференциальной связью xn+i(t) = fi(t,x\(t),... ,xn(t), x\(t),...,xn(t)) и удовлетворяющие краевым условиям i= Если теперь применить теорему Эйлера-Лагранжа, то получатся нужные необходимые условия в изопериметрической задаче. При 1) Математик-пурист отметит вопиющую неточность в этой фразе: Ао и Дг это числа, а р(-) — элемент функционального пространства, так что они и не могли бы равняться одному и тому же нулю одновременно. Каждое из них может равняться или не равняться своему нулю в своем пространстве. Однако все мы так привыкли отождествлять нули всех пространств, что эта фраза уже не режет глаз.
1.5. Задача Лагранжа и основная задача оптимального управления 73 исследовании задачи со старшими производными ее можно свести к виду (Iх), Bх), полагая х = х\, х\ = Х2, ..., хп = и и применяя далее теорему Эйлера-Лагранжа. 1.5.3. Принцип максимума Понтрягина. В пятидесятых годах многочисленные потребности прикладных дисциплин (техники, эконо- экономики и др.) стимулировали постановку и рассмотрение нового клас- класса экстремальных задач, получивших название задач оптимального управления. Необходимое условие экстремума для задач этого клас- класса — «принцип максимума», — сформулированное Л. С. Понтрягиным в 1953 г., было доказано и развито впоследствии им, его учениками и сотрудниками (см. [12]). Важно отметить, что это условие имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа: в качестве обязательного условия в решение зада- задачи оптимального управления входит решение вспомогательной задачи на максимум (отсюда название — «принцип максимума»). Здесь мы будем рассматривать частный случай общей постановки задачи оптимального управления, когда в задаче Лагранжа в понтря- гинской форме (см. (Iх) и Bх) п. 1.5.1) появляется еще одно дополни- дополнительное условие на управление: wGil. Точнее говоря, будет рассматри- рассматриваться такая задача: и f(x(-),u(-)) = J /(?, x(t),u(t)) dt + фо(х(го), x(ti)) -+ inf, A) to x(t)-ip(t,x(t),u(t))=O, ^j(x(t0),x(tl))=0, j=l,...,5, B) и ей. (З) Функции /, (p, i/jj — такие же, как в (Iх), Bх) п. 1.5.1, а й — фиксированное множество в Rr. Более общая задача будет рассмотрена в гл. IV. Задачу Лагранжа мы рассматривали в некотором банаховом про- пространстве. Здесь же, желая применять самые простые средства, из- изберем иной путь описания допустимых элементов, сходный с тем, о котором шла речь в п. 1.4.3, где простейшая задача классического вариационного исчисления была расширена до задачи в пространстве KCl([to,t\]) кусочно-дифференцируемых функций. Пару (х(-),и(-)) будем называть управляемым процессом в зада- задаче A)-C), если управление и(-) : [to,t\] -^ й — кусочно-непрерыв- кусочно-непрерывная функция, фазовая траектория х(-) кусочно-непрерывно дифферен- дифференцируема и при этом всюду, кроме точек разрыва управления и(-), функция х(-) удовлетворяет дифференциальному уравнению x(t) = = (p(t,x(t),u(t)). Управляемый процесс называется допустимым, если, кроме того, удовлетворяются краевые условия. Допустимый процесс (х(-),и(-)) называется оптимальным, если найдется такое г > 0, что для всякого допустимого управляемого про-
74 Гл. 1. Введение цесса (х(-),и(-)) такого, что \x(t) —x(t)\ < г, Vt G [to>^i] выполняется неравенство jf(x(-),u(-)) ^ J(x(-),u(-)). Попробуем снова применить к задаче A)-C) общий прием Лагран- Лагранжа, о котором речь шла в п. 1.3.2. Функция Лагранжа задачи A)-C) будет иметь тот же вид, что и в задаче Лагранжа — ограничения типа принадлежности (mgH) в функцию Лагранжа не включаются. Итак, -I D) to где L(t, х, х, и) = p(t)(x — (p(t, х, и)) + Ао/(?, х, и), E) l(xo,xi) = ^/jJJipj(x0,xi), /xo = Ao. F) i=o Далее, как всегда, нужно рассмотреть задачу #(z(-),«(-);p(-).?.Ao)^inf G) (считая множители Лагранжа фиксированными) «как если бы переменные были независимы». Задача G) естественным путем распадается на две: адо,ад;ЯО,ЯА0)^м (по *(•)), (8) ад-),<);Я-)>ЯАо) -^inf (по О е °11), (9) где через °Ы мы обозначили множество кусочно-непрерывных функций со значениями в Я. Задача (8) — это снова задача Больца; задача же (9) имеет, как легко понять, следующий простой вид: to где x(t, и) = A0/(t, x(t),u) - p(t)(p(t, x(t),u). Необходимое (и достаточное) условие экстремума в задаче A0) совершенно очевидно: и(-) е °U доставляет минимум в задаче A0) тогда и только тогда, когда всюду, кроме точек разрыва и(-) выполнено соотношение minL(t, x(t),x(t), и) = L(t, x(t),x(t),u(t)) & -uGii <^> max\p(t)ip(t, x(t), u) - Ao/(?, x(t),u)\ = = p(t)ip(t, x(t), u(t)) - A0/(t, x(t), u(t))- A1)
1.5. Задача Лагранжа и основная задача оптимального управления 75 Необходимые условия экстремума в задаче (8), соединенные с A1), приводят к необходимым условиям экстремума в задаче A)-C), полу- получившим название принципа максимума Понтрягина (из-за специфического вида условия A1)). Точнее, имеет место следующая теорема. Теорема (принцип максимума Понтрягина). Если (х(-),и(-)) есть оптимальный процесс для задачи A)-C), то най- найдутся множители Лагранжа Ло = До ^ О, р(') ? KCl([to,t\],Hn*)y Д = (Дь..., fis), не равные нулю одновременно и такие, что выполнено уравнение Эйлера jt Li(t,x(t),$(t),Щ) = Lx(t,x(t),$(t),Щ), A2) принцип максимума A1) и условие трансверсальности k = 0,1. A3) 1.5.4. Доказательство принципа максимума в задаче со сво- свободным концом. Здесь принцип максимума Понтрягина будет доказан в простейшей ситуации, когда терминальная часть функционала отсут- отсутствует, один из концов закреплен, а второй свободен, т. е. в A) п. 1.5.3 фо = 0, а в B) i/jj(xo,x\) =xOj -%, j = l,...,n. Таким образом, мы имеем задачу и J(x('),u(')) = J f(t, x(t),u(t)) dt -> inf, A) to x(t) - ip(t, x(t), u(t)) = 0, x(t0) = xo, B) и ей. C) Функции /, fx, (p, (px предполагаются (как и в предыдущем пункте) непрерывными по совокупности переменных. Посмотрим, как выглядит в этом случае принцип максимума Понт- т рягина. Поскольку у нас функция l(xo,x\) = J^ Дг(^ог —xqi) не зависит г=1 от х\, из условий трансверсальности A3) п. 1.5.3 получаем Ыи,х(и),х(и)Жи))=Ш = о. D) Далее, уравнение A2) п. 1.5.3 приобретает вид -jt Ь± + Lx = 0 ^ -Ш = Щ)Фх$) - %>Ш, E) где мы ввели сокращенные обозначения: fx(t) = fx(t,x(t),u(t)), <Px(t) = (px(t,x(t),u(t)). Если допустить, что Ло = 0, то вследствие
76 Гл. 1. Введение единственности решения задачи Коши для однородного уравнения E) должно быть р(-) = 0, а значит, в силу условия трансверсальности на левом конце (см. A3) п. 1.5.3) и /1 = 0. Но это противоречит условию теоремы, согласно которому не все множители Лагранжа могут быть одновременно нулями. Значит, Ао ф 0 и можно считать Ао = 1. Но тогда р(-) однозначно (в силу единственности решения задачи Коши для линейной неоднородной системы) определяется уравнением E) и краевым условием D). Суммируя сказанное, можно сформулировать принцип максимума так: Теорема (принцип максимума Понтрягина для за- задачи со свободным концом). Если процесс (х(-),и(-)) являет- является оптимальным в задаче A)-C), то для решения р(-) системы = p(t)(px(t) - fx{t) F) с краевым условием р(П)=0 G) в точках непрерывности управления и(-) выполнен принцип макси- максимума max(p(t)(p(t, x(t),u) — f(t, x(t), и)) = uEii = p(t)<p(t, x(t), u(t)) - f(t, x(t), u(t)). Для доказательства этой теоремы, как и в предыдущих случаях, воспользуемся методом вариаций. Начнем с определения элементар- элементарной — вейерштрассовской — игольчатой вариации, аналогичной той, что была применена в п. 1.4.4. Обозначим через То множество тех точек из (to,t\), в которых функция и(-) непрерывна. Зафиксируем точку г G G То, элемент v ? Я и число А > 0 настолько малое, что [г — А, г] С То. Управление (t), если t Ф \т — А, г), w> l\ ' 8 v, если t e [r — A, r), назовем элементарной игольчатой вариацией управления и(-). Пусть x\(t) = x\(t;r,v) — решение уравнения х = (p(t,x,u\(t)) с начальным условием x\(to) = x(to) = xq. Назовем x\(t) элементарной игольчатой вариацией траектории, а пару (x\(t),u\(t)) — элементарной вари- вариацией процесса (х(-),и(-)). Пару (r,v), определяющую эту вариацию, будем называть элементарной иголкой. Доказательство теоремы как обычно разбиваем на этапы. Первые два этапа целиком относятся к теории обыкновенных диффе- дифференциальных уравнений. А) Лемма о свойствах элементарной вариации. 1. Пусть элементарная иголка (г, v) фиксирована. Тогда существует такое Ао > 0, что при 0 < А < Xq:
1.5. Задача Лагранжа и основная задача оптимального управления 11 1) траектория х\(-) определена на всем отрезке [to, ti] и при А { О x\(t) ~^ %{t) равномерно на [to,t\]; 2) при t ^ г, 0 ^ Л ^ Ло, существует и непрерывна по А произ- производная 7 — x\(t;r,v) = z\(t]r,v), которая при Л = 0 определяется как производная справа; 3) функция 11—> y(t) = zo(t;r,v) на отрезке [r,t\] удовлетворяет дифференциальному уравнению (9) и начальному условию у(т) = ф, х(т), v) - <р(т, х(т), и(т)). A0) Доказательство леммы основано на двух известных фактах теории обыкновенных дифференциальных уравнений: локальной тео- теореме существования и единственности и теореме о непрерывно диф- дифференцируемой зависимости решения от начальных данных. Эти тео- теоремы в нужной для нас форме содержатся в стандартных учебниках по обыкновенным дифференциальным уравнениям [10, 11, 15]. Кроме того, читатель может обратиться к тексту § 2.5. Докажем лемму сначала для случая, когда функция и(-) непрерывна. Рассмотрим дифференциальные уравнения x = ip(t,x,ux(t)), A1) x = <p(t,x,u(t)). A2) Согласно (8) правые части этих уравнений совпадают при t < г — Л, а так как x\(to) =xo = x(to)j то по теореме единственности решения задачи Коши x\(t) = x(t) при t < т — Л и по непрерывности хЛ(т-Л) = х(т-Л). A3) В частности, ?(А) непрерывно дифференцируема по Л и ?@) = х(т), С;@) = -?(т) = -<р(т,х(т),и(т)). A4) Обозначим через E(t, s,?) решение задачи Коши для дифференциального уравнения с фиксированным управлением v: x = if(t,x,v), x(s) = ?. A5) В соответствии с локальной теоремой существования и единственности можно подобрать такие е\ > 0 и Si > 0, что S(?, s,?) определено при \t-r\<Su \s-t\<Su \?-х(т)\<еи а в силу теоремы о зависимости решения от начальных данных S — непрерыв- непрерывно дифференцируемая функция.
78 Гл. 1. Введение Согласно (8) и A3) для определения x\(t) на отрезке [т — Л, г] мы должны в A5) положить ? = ?(А) = х(т — Л) и если Х\ < 5 выбрано так, что |?(А) — — х(т)\ < ?\ при 0 < А < Аь то x\(t) = S(t, т - А, f (А)), т - А < t < т. В частности, ха(т) = ~(т,т-А, ?(А)), A6) будучи суперпозицией непрерывно дифференцируемых функций, сама непре- непрерывно дифференцируема по А и 7/@) = х(т),т/@) = -Ss(r, = -Ев(т,т,?@)) - ~е(т,т,?@))<р(т,х(т),Й(т)) A7) в силу A4). Решение E(t, s,?) задачи Коши A5) удовлетворяет эквивалентному интегральному уравнению J3((T,s,0.v)AT. A8) s Дифференцируя его по s, имеем t г ж(сг, S(cr, s,?>),v)Es(cr, s,?>)da и, полагая t = s = т, ? = х(т), получаем (с учетом очевидного тождества н(м,о = О Ss(r,r,x(r)) = -(^(т,ж(т),г;). A9) Аналогично, дифференцируя A8) по ? и подставляя те же значения аргументов, получаем Ez(t,t,x(t)) = E B0) (здесь Е = (d^i/d^k) = (^г/е) — единичная матрица). Подставляя A9) и B0) в A7), имеем 7/@) = х(т), т/@) = <р(т, х(т), г;) - (^(г, ?(т),Й(т)). B1) Далее, функция S непрерывна в точке (т,т,х(т)), причем Е(т,т,х(т)) = = х(т), а ж(-) непрерывна в точке т. Поэтому для любого е > 0 существует такое 5 > 0, что при \t-r\<S, \s-t\<6, \?-x(t)\<6 выполняются неравенства |H(t, s, 0 - х(т) | < г/2, |x(t) - х(т) | < г/2. B2) Возьмем положительное Ai < S столь малым, чтобы при 0 < А < Ai вы- выполнялось неравенство |?(А) — х(т)\ < S. Тогда для т — А < ? < т, s = т — А и ? = ?(А) будут иметь место неравенства B2), откуда \xx(t) - x(t)\ = |H(t,т - А,?(А)) - x(t)\ < < S(t, т - A, f (А)) - ж(т)| + |ж(т) - x(t)| < е/2
1.5. Задача Лагранжа и основная задача оптимального управления 79 Поскольку x\(t) = x(t) при to ^ t ^ т — Л, О < Л < Ai => \x\(t) - x(t)\ <?, t0 < t < т, чем доказано первое утверждение леммы. Теперь обозначим через X(-,rj) решение задачи Коши для уравнения A2) с начальным условием х(т) = rj. По теореме о зависимости решений от началь- начальных данных существует такое ?2, что X(t,rj) определено при \г) — х(т)\ < ?2, г < t < t\ и является непрерывно дифференцируемой функцией. Согласно (8) и A6), а также в силу теоремы единственности x\(t) = X(t, rj(X)). Снова, как суперпозиция непрерывно дифференцируемых функций, x\(t) непрерывно дифференцируема по (t, А) при т < t < t\ и 0 < А < А2, где А2 выбрано так, чтобы при 0 < А < А2 выполнялось неравенство \rj(X) — х(т)\ < ?2- Полагая Ао = min(Ai, A2), мы видим, что верно второе утверждение леммы. Переходя от уравнения A2) к эквивалентному интегральному уравнению, имеем с учетом A6) г x\(t) = rj(X) + (f(cr, х\(ст),п(сг)) da. Дифференцируя это уравнение по А и полагая затем А = 0 и обозначая, как d и в условии леммы, y(t) = —x\(t) находим А=0 y(t) = т?'@) + J <рх((т, х(а), й(а))у{<т) da. Т Это интегральное уравнение эквивалентно уравнению (9) с начальным услови- условием у(т) = т/@)> совпадающим с A0) ввиду B1). Если управление и(-) — кусочно-непрерывная функция, то поступаем сле- следующим образом. Для простоты пусть точек разрыва две, скажем, а\ и а2, и т (в которой и(-) должно быть непрерывным) расположена между ними: to < < а\ < т < (Х2 < t\. В полосе to < t < a\ системы A1) и A2) (в которых при t = а\ нужно считать управление равным его предельному значению и(а\ — — 0) = lira u(t)) совпадают и по теореме единственности x\(t) = x(t). t—KX\ —0 Теперь переходим в полосу а\ < t < «2 (снова полагая на ее границах управление равным предельным значениям и(а\ + 0) при t = а\ и u(ct2 — 0) при t = «2)- Здесь мы решаем уравнения A1) и A2) с начальным условием х = х(а\). Наши предыдущие утверждения применимы, и мы убеждаемся в непрерывной дифференцируемости x\(t) по А. Наконец, в полосе «2 ^ t < t\ (с тем же соглашением о значении управ- управления при t = «2) решаем наши дифференциальные уравнения с начальными условиями х\(а2) и х(а2). Еще раз ссылаясь на теорему о зависимости ре- решения от начальных данных, доказываем непрерывную дифференцируемость x\(t) по А при «2 ^ t ^ t\ и вычисляем y(t) = -jvX\(t) тем же способом, d\ Л=о что и раньше. ¦ Б) Лемма о приращении фу н кциона л а. Положим х(А) = = $(х\(-),и\(-)) и докажем, что эта функция дифференцируема справа в точке А = 0.
80 Гл. 1. Введение Пусть р(') — решение системы F) с краевым условием G). Тогда = a(r, v), л=+о где а(т, v) = /(г, ж(г), г;) - /(г, ж(г), — р(г^ Доказательство. Поскольку ]. B3) Х(Л) - х@) = J /(?, xA(t), wA(t)) dt - J /(?, x(t), to 4 *i = J [/(t, xA(t), ад) - /(t, ад, ад)] dt+ т т + J [f(t,xx(t),v) - f(t,x(t),u(t)]dt, имеем л|о Л + А=+0 т ¦lim{ f [f(t,xx(t),v) - f(t,x(t),u(t)]dt. A|0 Л J r-A Поскольку по лемме п. A) x\(t) непрерывно дифференцируема по Л, в первом члене применимо обычное правило дифференцирования под знаком интеграла, а во втором воспользуемся теоремой о среднем, после чего dt+ A=0 ),v) -/(с,ж(с),гх(с)] = ч J fx(t, x(t),u(t))y(t) dt + /(r, x(r), v) - /(г, х(т), Й(г)) B4) (здесь мы воспользовались тем, что т — А < с < т и потому с —*> т; хд(с) —>> —>> ж(г) в силу первого утверждения леммы п. A); y(t) обозначает то же, что и в этой лемме.
1.6. Решение задач 81 Далее, р(-) удовлетворяет системе F), а у(-) удовлетворяет системе (9). Поэтому = fx(t)y(t). Интегрируя это равенство в пределах от т до t\ и учитывая краевое условие G) для р(-) и условие A0) для у(-), получаем и t, fx(t)y(t) dt = j jt [p(t)y(t)\ dt = p(t)y(t) x(t),v) - <р(т,я(т),Й(т))]. B5) Сопоставив B4), B5) и B3), получаем, что х'(+0) = cl(t,v).m В) Завершение доказательства. Если правый конец сво- свободен, то в силу леммы п. А) всякая элементарная вариация допусти- допустима (при достаточно малом Л). Значит, если (х(-),и(-)) — оптимальный процесс, то при малых Л J(xx(-), их(-)) > ^(ж(-), и(-)) & Х(А) > х@) =Ф ХХ(+0) > 0. Применив лемму п. Б) получим, что условие a(r,v) > 0 необходимо для оптимальности (х(-),и(-)). Но г G То и и е Я были произволь- произвольны. Мы доказали, следовательно, что для любого t, принадлежащего множеству точек непрерывности управления и(-), и для любого и е й выполнено неравенство ШМЪ Ш и) - f{t, x(t), и) < p{t)v{t, x(t), u(t)) - f{t, x(t),u(t)), равносильное неравенству a(t,u) ^ 0 и A1). Теорема полностью дока- доказана. § 1.6. Решение задач Задачи, о которых говорилось в начале главы, — задачи, поставлен- поставленные с разными целями и в разные времена, — здесь будут рассмотре- рассмотрены единообразно, по одной стандартной схеме, диктуемой принципом Лагранжа. Эта схема состоит из шести этапов: 1. Запись формализованной задачи и обсуждение проблемы суще- существования и единственности решения. 2. Составление функции Лагранжа. 3. Применение принципа Лагранжа. 4. Исследование возможности Ао = 0. 5. Нахождение стационарных точек, т. е. решение уравнений, выте- вытекающих из принципа Лагранжа.
82 Гл. 1. Введение 6. Исследование стационарных точек, выбор решения и запись от- ответа. Во всех задачах, о которых пойдет речь, принцип Лагранжа яв- является строго обоснованной теоремой либо уже доказанной, либо доказываемой в последующих главах. Применимость единой схемы к задачам столь разного содержания подчеркивает универсальность этого принципа. Разумеется, рассматривая другие задачи, исследовате- исследователи могут столкнуться с ситуациями, которые не подходят ни под одну из известных конкретных схем (классическое вариационное исчисле- исчисление, оптимальное управление, линейное программирование и т. п.). Тем не менее и здесь принцип Лагранжа в том или ином его понимании может оказаться верным или, по крайней мере, может быть полезным ориентиром. Понимание общих идей и ситуаций, в которых он при- применим, — о них речь пойдет в гл. III и IV — может помочь найти необходимые условия экстремума и в измененной обстановке. Впрочем, не менее важно отдавать себе отчет и в том, что принцип Лагранжа верен не всегда, и потому опасно применять его бездумно. 1.6.1. Геометрические экстремальные задачи. Здесь решены все задачи, поставленные в п. 1.1.2 и формализованные в п. 1.2.2. Первый этап предложенной схемы предполагает обсуждение вопроса о существовании решения. Геометрические задачи этого пункта конеч- конечномерны, и существование решения в них обеспечивает следующая теорема. Теорема Вейерштрасса. Пусть функция f: HN —> R непре- непрерывна и для некоторого а множество S!af = {х \ f(x) < а} непусто и ограничено. Тогда решение задачи f(x) —> inf существует. Доказательство этой теоремы очевидным образом следует из классической теоремы Вейерштрасса о существовании минимума непрерывной функции на ограниченном и замкнутом подмножестве в R^ [14, т.1, с. 176, 370], [9, т. 1, с. 234], ибо множество gaf, очевидно, замкнуто. Переходим к решению задач. Задача Евклида о вписанном параллелограмме. Эта задача была формализована так (см. A) п. 1.2.2): 1. /о0*0 = х(х - b) -> inf, 0 < х < Ь. Мы опустили несущественный множитель Н/Ъ и свели задачу к за- задаче минимизации. Функция /о непрерывна, отрезок [0,Ь] ограничен и замкнут. По теореме Вейерштрасса решение задачи существует. Пусть это решение х. Ясно, что х ф 0 и х ф Ь, ибо /о(О) = /о(Ь) = = 0, а функция принимает и отрицательные значения. Значит, х ? ? @,Ь). Функция /о — гладкая. Поэтому надо искать стационарные точки в задаче /о (х) —> inf. 2-5. %(х) = 0^х = 6/2. 6. В силу единственности стационарной точки х = Ь/2 ? [0, Ъ] есть решение задачи, т. е. искомый параллелограмм ADEF характеризуется
1.6. Решение задач 83 тем, что \AF\ = \АС\/2, т.е. F есть середина отрезка [А, С]. Этот факт и был установлен в п. 1.1.2 геометрическим путем. Примечание. Наша задача оказалась элементарной гладкой за- задачей. Поэтому функция Лагранжа не выписывалась и пп. 2-5 «сли- «слились». Была использована теорема Ферма (п. 1.3.1). Задача Архимеда об изопифанных сегментах шаров (п. 1.2.1). Решение здесь совершенно аналогично задаче Евклида и поэтому при- приводится без комментариев. 1. /о (ft) = fta/2 - Trft3/3 -> sup; 0< ft < л/а/тг. 2-5. /<J(ft) = 0 => ft = v/a/^. 6. Значение /о в нуле равно нулю, а в точке д/а/тг меньше, чем значение в стационарной точке у/а/2тг. Значит, ft = у/а/2тг есть решение задачи. Вспомнив, что a = 2irRh, получаем h = R, т. е. искомый шаровой сегмент является полушаром (высота равна радиусу). Задача Аполлония о кратчайшем расстоянии от точки до эл- эллипса. Она была формализована так (см. F) п. 1.2.2): 1. fo(xi,x2) = (х\ -бJ + (Х2 ~ ЬJ -> inf; /1(^1,^2) = (х\/а\J + + (^2/а2J = 1. Эллипс — ограниченное и замкнутое множество, функ- функция /о непрерывна, значит, решение х = (х\,Х2) по теореме Вейер- штрасса существует. Функции /о и /i — гладкие. 2. jj? = АО((Ж1 - бJ + (я2 - бJ) + Ai((xi/aiJ + (x2/a2J - 1). 3. ?Xl =O=>Ao(Ji-^i) + Ai^i/a? = O, ^?Ж2 = 0 ^А0(х2 - 6) + Xix2/a22 = 0. 4. Пусть Ао = 0. Тогда Х\ ^ 0 (множители Лагранжа не равны нулю одновременно!). Значит, из 3-го этапа следует, что х\ = ж2 = 0 => => /i @,0) = /i (х\, ж2) =0^1- Итак, Ао ^ 0, и можно положить Ао = 1. Обозначим при этом Ai = A. 5. (Для простоты ограничиваемся случаем, когда <^i<^2 7^ 0.) (хг - &) + Ххг/а2г = 0, i= \,2^хг= . ;г i ., г= 1,2. (а| + А) Подставляя в уравнения эллипса, получаем KW + MW A) 6. Число стационарных точек задачи (т. е. точек, соответствую- соответствующих тем А, которые удовлетворяют уравнению A)) не больше че- четырех (см. рис. 26, неравенство (р@) = i\/a\ + ?f/ai > ^ показывает, что ip(X) изображена для точки (^ь^2), лежащей вне эллипса). Для полного решения задачи надо решить уравнение A), получить А^, найти соответствующие точки x(\i), подставить эти точки в /о и найти наименьшее из полученных чисел.
84 Гл. 1. Введение Примечания. 1. Задача 1 — это гладкая задача с ограничением типа равенства. В пп. 2-5 применялось правило множителей Лагран- жа (п. 1.3.2). 2. Соотношения (xi — <^) + Xxi/a2 = 0 имеют очевидный геомет- геометрический смысл: вектор ? — х, соединяющий точку ? с минимальной точкой х, пропорционален вектору- градиенту функции f\ в точке х, т. е. вектор ? — х лежит на нормали к эллипсу. Этот факт был установ- установлен впервые Аполлонием. 3. Выведем из полученных на- нами соотношений уравнение кривой, «разделяющей» те точки ?, к кото- рым можно провести две нормали, от точек, к которым можно прове- сти четыре нормади. Очевидно, что это разделение происходит для Л, удовлетворяющих соотношению A), для которых -ах —а2 О ЗГ Рис. 26 /-9 9 (а? + ЛK {а\ + . = 0, Л е (-а\,-а 2)' B) Из B) имеем А = где Подставляя в A), получаем уравнение разделяющей кривой Это — уравнение астроиды (см. рис. 7 в § 1.1). Вне астроиды каждая точка имеет две нормали, внутри нее — четыре, на самой астроиде — три (за исключением вершин, где имеется две нормали). Описанный здесь результат также был получен Аполлонием в его «Конике». Задача Кеплера о вписанном цилиндре (см. C) в п. 1.2.2). Решение этой задачи подобно решению задачи Евклида, и мы его не комментируем. 1. /о(ж) = х(х2 - 1) -> inf, 0 < х < 1. 2-5. %(х) = 0 => Зх2 = 1 => х = л/3 /3. 6. В силу единственности стационарной точки в @, 1), х = л/З/3 есть решение задачи: искомый цилиндр характеризуется тем, что отношение его высоты 2х к радиусу л/1 — х2 равно л/2. Задача о преломлении света. Эта задача была поставлена и решена методом Гюйгенса в п. 1.1.3. Здесь мы даем стандартное решение ее, восходящее к Лейбницу (см. D) в п. 1.2.2).
1.6. Решение задач 85 ^/ inf. Все лебеговы множества 3?afo непрерывной функции /о компактны, и, значит, по теореме Вейерштрасса решение задачи существует. 2-5. f'{x) = 0 ^ sin(p\ sin ip 2 ^ = V\ V2 (см. рис. 19 в п. 1.2.2). 6. Точка х, удовлетворяющая последнему уравнению, единствен- единственна (проверьте!), значит, она и является решением задачи. Итак, точка преломления луча света на границе двух сред характеризуется тем, что отношение синуса угла падения к синусу угла преломления равно отношению скоростей распространения света в соответствующих средах. Это и есть закон Снеллиуса. Задача Штейнера. Она была формализована так (см. E) в п. 1.2.2): 1. /о(ж) = \х - 61 + \х- 61 + \х - ?з| -+ inf, х е R2, ^GR2, i= 1,2,3, Решение задачи существует по теореме Вейерштрасса (проверьте!). Возможно одно из двух: либо решение совпадает с одной из точек t;i, г = 1,2,3, либо не совпадает ни с одной. Будем решать задачу в последнем случае. Тогда функция будет гладкой в окрестности точки х (проверьте!). 6. Уравнение C) означает, что три единичных вектора, смотрящие из х в сторону ?i, ?2» Сз соответственно, в сумме равны нулю. Зна- Значит, эти векторы параллельны сторонам равностороннего треугольника, и, следовательно, величины углов ^ж^, ?2^3> ?з^?ь П°Д которыми из точки х видны стороны треугольника, равны 120°. Таким образом, точка х является точкой Торичелли. Она может быть найдена как точка пересечения двух дуг окружностей, стягиваемых хордами [?1,^2] и [?ь?з] и вмещающих углы 120°. Это построение возможно, если только ни один из углов треугольника не больше 120°. В противном случае дуги не пересекаются, и, значит, невозможно, чтобы точка х не совпадала ни с одной из точек ?^, г = 1,2,3. Но тогда она должна, очевидно, совпадать с вершиной тупого угла, ибо против тупого угла лежит самая большая сторона треугольника. Ответ: Искомая точка есть точка Торичелли, если все вели- величины углов треугольника меньше 120° и есть вершина тупого угла в остальных случаях.
86 Гл. 1. Введение Итак, все геометрические задачи, о которых говорилось в п. 1.1.2, а также задача о преломлении света из п. 1.1.3 решены. Заодно решим и задачу Тарта л ьи: 1. /о(ж) = х{8 - х)(8 - 2х) -> sup, 0 < х < 4. 2-5. fb(x) = О => Зх2 - 2Ах + 32 = 0 => х = 4 - 4/л/З . 6. Ответ: Одно число равно 4 — 4/л/З , другое 4 + 4/л/З . 1.6.2. Аэродинамическая задача Ньютона. Эта задача была поставлена в п. 1.1.5 и формализована в п. 1.2.3. 1. J -—^ ->inf' * = м> ж(°) = °' Ж(Т) = f' м G R+- Для такого рода задач доказать непосредственно теорему суще- существования не совсем просто. Главная беда — невыпуклость интегранта ?/A + и2) по и при и ^ 0. Но тем не менее эту задачу мы решим до конца. Наш дальнейший план таков. Предположив, что решение задачи существует, мы применим к гипотетическому решению принцип Лагранжа. Выяснив, что существует единственная допустимая в задаче стационарная кривая (т. е. допустимая кривая, для которой выполня- выполняются все условия, диктуемые принципом Лагранжа), непосредственной выкладкой убедимся, что именно она доставляет абсолютный минимум. В заключение вспомним слова Ньютона и убедимся, что найденное решение в точности то, которое было им описано в 1687 г. т 2. ? = J L dt + /хож(О) + /XI (х(Т) - С), о L = —5-2+р(ж-гх). 1 + и1 3. Уравнение Эйлера: -—Lx + Lx =0=>p(t) = const =po. A) Условие трансверсальности: Ро = До = -?i • B) Условие минимальности по и: 4. Если допустить, что Ао = 0, то необходимо, чтобы ро ф 0 (ибо иначе из B) вытекали бы равенства Ао = ро — До — Ai — 0» но все мно- множители Лагранжа не могут обратиться в нуль одновременно). Если же Ао = 0 и ро 7^ 0, то из C) следует, что u(t) = 0, а значит, x(t) = t = [ u(t) dr = 0. о
1.6. Решение задач 87 Но тогда искомое тело не имеет «длины» — оно является плоской пластиной. Если же ? > 0, то Ло ф О и можно считать, что Ло = 1. Отметим еще, что случай щ ^ О также невозможен, ибо при этом функция t/{\ + и2) — рои монотонно убывает и C) не выполняется при и > u(t). 5. Из C) (с Ло = 1) следует, что до некоторого момента оптимальное управление равно нулю (проверьте, что при р0 < 0 и малых t функция и —> (t/(\ + и2)) — рои достигает минимума при и = 0). Затем опти- оптимальное управление и(-) должно быть найдено из уравнения 2ut D) получающегося из уравнения Lu = 0. Момент излома г определяется тем, что функция и —> (т/A + и2)) — рои имеет два равных миниму- минимума—в нуле и в точке, определяемой из D) при t = т. Иначе говоря, в момент излома должны удовлетворяться соотношения (далее через и(т) обозначено и(т + 0) ф 0): 2и(т)т т Из второго уравнения получаем: —u2(r)r/(l +Й2(г)) =рои(т), откуда ро = ~г^(г)/A +и2(т)). Подставив это соотношение в первое уравне- уравнение E), находим, что и2(г) = 1 => и(т) = 1 (ибо и ^ 0) и тогда снова из первого уравнения E) получаем равенство г = —2ро- После излома оптимальное решение удовлетворяет соотноше- соотношению D), из которого следует, что 2и 2 Но dx dx dx dt dt po ( 1 dt du dt du du 2 \ и Интегрируя это соотношение с учетом равенства х(т) = 0, и(т) = 1, получаем параметрические уравнения искомой оптимальной кривой u+U +4^yl + 8P0' G) 2 V- l2" + )' ^0<°- 6. Кривую G) называют кривой Ньютона. При этом в G) и G G [1,оо). Нетрудно понять, что пересечение прямой х = at с кривой
Гл. 1. Введение 0 Рис. 27 Ньютона, соответствующей параметру ро — ~1> единственно. Действи- Действительно, х(-,— 1) непрерывна и выпукла, ибо du 1 ^ ~ ~dt ~ dt/du ^ Но, с другой стороны, из формул G) вид- видно, что кривая Ньютона х(-,ро) получает- получается из кривой х(-,—\) гомотетией с центром в @,0) и коэффициентом |ро| (рис.27). Зна- Значит, для того чтобы провести кривую се- семейства G) через заданную точку (?, Т), нужно найти точку пересечения прямой х = = ?t/T с кривой х(-,— 1) и затем сделать соответствующую гомотетию кривой х(-, — — 1). Получим допустимую кривую х(-). Убе- Убедимся, что она дает абсолютный минимум в задаче. Для этого вернемся к соотноше- соотношению C) с Ло = 1. Пусть х(-) — любая допустимая кривая (т. е. х(-) ? е КС1([0,Т}), х@) = 0, х(Т) = О- Тогда в силу C) - Pox(t) -pou(t). Проинтегрировав это соотношение и учитывая, что u(t) = x(t) и x(t) dt = x(t) dt = ^, получаем I tdt tdt 1 +ж Задача полностью решена. Примечания. 1. В п. 2-5 применялся принцип Лагранжа для задачи оптимального уравнения, сводящийся к принципу максимума Понтрягина (п. 1.5.3). 2. Сопоставим теперь полученное решение с решением, описанным самим Ньютоном. Вспомним слова Ньютона, приведенные в п. 1.1.5 и посмотрим еще раз на его чертеж (рис. 18). При этом наряду с бук- буквами, расставленными самим Ньютоном, используем еще и некоторые наши обозначения. Имеем: \MN\ = t, \BM\ = х, \BG\ = г, угол BGP = = ср, и тогда из построения Ньютона получаем, что tgtp = x(t), \BP\/\BG\=tgip^\BP\=TX, \GP\2 = \BG\2 + \BP\2 = (x2 + 1)т2.
1.6. Решение задач 89 Теперь из пропорции Ньютона \MN\ : \GP\ = \GP\3 : 4\ВР\ х \GB\2, подставляя наши обозначения, получаем I т3(ж2 + IK/2 xt т ~~ ^ (г2 4- П2 ~~ 4' ATI ^ Но это — не что иное, как соотношение D), в которое подставлено зна- значение ро = — т/2. Из (8), рассуждая так же, как и раньше, мы находим интегрированием выражение G) для кривой Ньютона. Отметим еще, что «затупленность» кривой и условие на скачок в точке G <^> г (угол там равен 135°) были по существу предусмотрены Ньютоном в его «Поучении» об усеченном конусе. Таким образом, задача Ньютона была им решена полностью, но смысл его решения оказался недоступным ни для его совре- современников, ни для многих его последователей — вплоть до нашего времени. 1.6.3. Простейшая задача о быстродействии. Поставленная в п. 1.1.7, эта задача была формализована следующим образом: Т —> inf, mx = и, и^[и\,щ}, /,ч x@)=x0, x@)=v0, х(Т)=х(Т)=0 ^ (см. E) в п. 1.2.4). Случай щ = щ интереса не представляет, поскольку при этом не для всякой пары (#о>^о) существует функция #(•), удовле- удовлетворяющая всем ограничениям A), а если такая функция существует и отлична от тождественного нуля, то значение Т определяется одно- однозначно, так что задачи минимизации в сущности и нет. При щ < щ мы можем уменьшить число параметров задачи при помощи замены x(t) = A?(t) + B(t — ТJ. В терминах функции ?(х х) общий вид задачи A) не меняется, но параметры хо, vo, щ, щ приобретают другие значения. В частности, если положить А=(и\— щ)/2т, В = (щ то ^ G [—1, 1]. Имея это в виду, будем считать далее в A) т = 1, щ = = — 1, щ = +1. Кроме того, обозначим х = х\, х = х^. Теперь приступаем к реализации нашей стандартной схемы: т 1. Т= [ 1-cte->iiif, xi=x2, x2 = u, wg[-1,1], B) xi @) = х0, х2@) = v0, хх(Т) = х2(Т) = 0. С существованием решения мы поступим точно так же, как и в предыдущем пункте: найдя из принципа Лагранжа функцию х(-), «по- «подозреваемую» на оптимальность, непосредственной проверкой убедим- убедимся в том, что она дает нам решение задачи.
90 Гл. 1. Введение т 2.g=\Ldt + in (xi @) - x0) + fJL2(x2@) - 0 -\-V\X\(T) + У2Х2(Т\ C) где L = Ло + pi(^i — x2) + p2{x2 — u)- 3. Уравнения Эйлера-Лагранжа: Ьж. + Ьж. =0, г = 1, 2 =>¦ = 0, = —р\. D) at at at Условия трансверсальности: Р1@)=Дь p2@)=/i2, Pi(T) = -i?i, fe(T) = -z>2. E) Принцип максимума: опустив не зависящие от и слагаемые, можно записать это условие в виде p2(t)u(t) = 1 если любое из [-1, 1], если p2(t) = 0. w Кроме того, в рассматриваемой задаче переменным является также конечный момент времени Т (ведь именно его мы и минимизируем), так что формально эта задача не укладывается в рамки п. 1.5.3. Можно показать, и это будет сделано в гл. IV, что в такой ситуации к уравне- уравнениям D)-F) следует добавить еще и условие 98т = 0 (стационарность функции Лагранжа по Т), вполне согласующееся с общей идеологией принципа Лагранжа. Дифференцируя C) по Т и учитывая равенства х2(Т) = и(Т), х\(Т) = х2{Т) = 0, получаем Ут = Ао + 92и(Т) = 0. G) 4. Обращается ли Ло в нуль или нет — специальной роли в данной задаче не играет, поскольку Ло не входит в D)-F). 5. Из уравнений D) заключаем, что p\(t) = const, a p2(-) — произ- произвольная линейная функция. При этом p2(t) ф 0, ибо D) (Б) G) ^ Ш) = ° ^ Ш) = ° У Ai = h = v\ =  = О Н Ло = О и все множители Лагранжа оказываются нулями. Линейная функция, отличная от тождественного нуля, обращается в нуль на отрезке [О, Т] не более одного раза. Поэтому из F) получаем следующие возможности для оптимального управления: а) u(t) = \; б) u(t) = -l (р2(-) не обращается в нуль на [О, Т]), в) и® = \ -1, r<t^T,
1.6. Решение задач 91 (р2(-) обращается в нуль в точке t = т, значение управления в точке г несущественно, так как изменение его в одной точке не оказывает влияния на функцию х(-) (почему?); по той же причине можно опустить случай г = Т и г = 0.) С\ \ Рис. 28 Дальнейшие рассмотрения удобно вести на фазовой плоскости (х\,х2) (рис.28). Решая задачу Коши х\=х2, x2 = u(t), xi(T)=x2(T)=0 (8) для одного из управлений а)-г), получаем единственное решение, а с ним и единственную начальную точку (#о>^о) — (х\@),х2@)), которая этому решению соответствует. Нетрудно проверить, что при всевозможных г и Т эти начальные точки однозначно покрывают всю плоскость. Прежде всего, х\ = х2, х2 = х\=х2, x2 = х\ = х\/2 (9) A0) и, таким образом, фазовые траектории на участках постоянства управ- управления лежат на параболах одного из семейств (9) или A0). Управлению а) соответствуют начальные точки, лежащие на дуге OF А (рис. 28): хо = Vq/2, vo < 0; управлению б) — точки на дуге ODB: хо = -^о/2' ^о > 0. Начальные точки С, лежащие слева от разделительной линии BDOFA (хо = —^о|^о|/2) отвечают управлениям в): на дуге CD се- семейства (9) u(t) = 1, в момент t = г попадаем в точку D, происходит переключение управления, и далее движемся по дуге DO с u(i) = — 1. Аналогично начальным точкам Е справа от разделительной кривой соответствуют управления г). 6. Остается показать, что найденное единственное решение x(t) = = x\(t), отвечающее заданной начальной точке (xo,vq), действительно доставляет решение задаче B).
92 Гл. 1. Введение Предположим, что некоторая функция х(-) определена на отрезке [О, Т], имеет ^усочно;непрерывную ^торую производную и х@) = xq, х@) = v0, х(Т) = х(Т) = О, причем Т < Т. При Т < Т мы доопределим х(-), положив x(t) = 0, t G [Т,Т]. После этого обе функции х(-) и х(-) будут определены на одном и том же отрезке [О, Т] и будут иметь одинаковые граничные значения х@) = х@) = х0, х@) = х@) =v0, ,] ] ч х(Т) = х(Т) = х(Т) = ЦТ) =0. [ } Покажем, что если \х\ ^ 1, то х(-) = х(-) и, в частности, неравенство Т <Т невозможно. Тем самым будет доказана оптимальность функции х(-). Ввиду симметрии задачи ограничимся управлением в) (или его предельным случаем а)). Если \х\ ^ 1, то, интегрируя дважды неравен- неравенство x(t) ^ 1 и учитывая A1), получаем г t х(т) - х(т) = J J(l - x(s)) dsdt ^ 0, A2) о о причем равенство здесь возможно, только если во всех точках непре- непрерывности x(s) = 1, а тогда x(t) = x(t), t G [0,г]. Аналогично, интегрируя дважды неравенство x(t) ^ — 1, получаем тт х(т)-х(т) = [ [(-1 -x(s))dsdt^O, A3) г t причем и здесь равенство возможно лишь, если x(s) = — 1 и x(t) = x(t), t<=[T,T\. Сравнивая A2) и A3), находим, однако, что х(т) = х(т), а тогда, как уже было сказано, x(t) = x(t), t e [0, Т]. Примечание. Из соотношений E)-G) следует равенство Ло = = \р2(Т)\, и, таким образом, равенство Ло = 0 в этой задаче оказы- оказывается возможным, когда Р2(*) обращается в нуль при t = Т. Тогда функция Р2(-) ф 0 (ибо иначе все множители Лагранжа были бы нуля- нулями) и вследствие равенства Р2(Т) = 0, р^{') н^ меняет знака и, значит, переключений управления нет вовсе. Следовательно, случай Ло = 0 соответствует движению по линиям переключения AFO и BDO. 1.6.4. Классическая изопериметрическая задача и задача Ча- Чаплыгина. Стариннейшая экстремальная задача — первая из двух названных в заголовке — была поставлена в п. 1.1.1 и формализована разными способами в п. 1.2.4. В частности, формализация B) п. 1.2.4 сводит ее к более общей задаче, охватывающей также и задачу Чаплы- Чаплыгина. Исходя из этой формализации, приведем сейчас решение обеих задач, следуя нашей стандартной схеме. Итак:
1.6. Решение задач 93 1 т 1 Г 1. S = — (xv — уи) dt —> sup ; A) ? J о ж = и, y = v, (и, v) е А, х(О) = х(Т), 2/@) = у(Т). Множество допустимых скоростей А будем считать замкнутым вы- выпуклым ограниченным множеством в R2. Упражнение. Покажите, что для разрешимости поставленной задачи необходимо, чтобы 0 ? Л Указание: можно воспользоваться результатом упражнения 2 в п. 2.2.3. т 2. ?=\Ldt + /х(ж@) - х(Т)) + 1/B/@) - у(Т)), B) о где . L = -у (жг; - уи) + р(х - и) + q(y - v). 3. Уравнения Эй л ера - Л arpa нжа: Условия трансверсальности: ЯО) = Я^) = Д, q@) = q(T) = v. Принцип максимума: Ш) + ^ x(t)\ v(t) = p(t) - ^ y(t)J и + (q(t) + ^ x(t)\ v\ . D) 4. Если допустить, что Ао = 0, то из уравнений Эйлера-Лагранжа p(t) = const, q(t) = const, причем р2 + q2 > 0, ибо иначе ввиду условий трансверсальности все множители Лагранжа оказались бы нулями. Теперь принцип максимума приобретает вид puit) + qv(t) = max (pu + $Ъ), (гг,г;)ЕА откуда видно, что (u(t),v(t)) все время принадлежит одной и той же прямой, а именно одной из двух опорных к множеству А прямых, перпендикулярных вектору (р, q) (рис.29). Поэтому x(t) = u(t) = u@) - a(t)q, y(t) = v(t) = v@) + a(t)p,
94 Гл. 1. Введение откуда, интегрируя, получаем t x(t) = х@) + u@)t - [ a(t) dt - q, о t y(t) = y@) + v(O)t + J a(t) dt • p. E) Полагая в E) t = T и используя краевые условия х@) = = х(Т), у@) =у(Т), убеждаемся, что вектор (q,—p) пропорционален (u@),v@)), после чего из E) видно, что (x(t),y(t)) все время лежит на прямой, прохо- (u(i) v(i)) ДЯ1Деи через (х@),у@)) параллельно векто- вектору ((},—р). Следовательно, замкнутая кривая {(x(t),y(t)),0 < t < Т} вырождается (лежит на прямой) и ограничиваемая ею площадь равна нулю (покажите это аналитически, ис- исходя из указанного выше выражения для S\). Следовательно, эта кривая не может быть оп- оптимальной. 5. Из этапа 4 следует, что можно поло- положить Ло = 1. Тогда из C) Рис. 29 v v(t) р + - = 0 => p(t) + ^Y = b = const, x и _ _/Ч x(t) q - - = 0 => q(t) ~^2L = a = const- Подставляя эти выражения в D), получаем (x(t) - a)v(t) - (y(t) - b)u(t) = max {(x(t) - a)v - (y(t) - b)u}. F) {u,v)eA Оставляя теперь в стороне общий случай, ограничимся двумя част- частными вариантами. а) Классическая изопериметрическая задача. Здесь и из F) находим G) где (скалярное произведение векторов (х — а,у — Ъ) и (г;, — и) будет наи- наибольшим, когда они одинаково направлены и второй имеет максималь-
1.6. Решение задач 95 но возможную длину, т. е. 1). Из G) имеем т. е. на оптимальной траектории (*) - «J + №) - ь = max ((x(t) — a)v — (y(t) — Ъ)и) = R = const. (8) {)eA Отсюда заключаем, что оптимальная траектория является окруж- окружностью с центром в точке (а, Ъ) и радиусом R. Поскольку угловая скорость движения по этой окружности равна и через время Т мы должны возвратиться в ту же точку (быть может, совершив несколько оборотов), 2тгп = — и R = -—. Площадь, огра- ограниченная найденной кривой, будет при этом равна т т 1 Г If S = -Uxv-yu)dt= -\ (ху - ух) dt = о о т If R2 Т Т2 Следовательно, п = 1 (окружность обходится только один раз) и S = = Т2/Аи. Заметим, что здесь Т — это длина кривой, б) Задача Чап л ы г и на. Здесь (uo,O) — вектор скорости ветра, V ^ \щ\ — максимальная скорость самолета. Для решения вспомогательной экстремальной задачи (x(t) — a)v — (y(t) — Ъ)и —> sup , можно, например, сделать подстановку г^ = г^о+^, v = г] и восполь- воспользоваться тем же геометрическим соображением, что и в предыдущем случае. Это дает уравнения где теперь уже величина
96 Гл. 1. Введение не будет постоянной. Однако - ^ W) = так что - Т7 У(*) = V max {(^@ - °)v ~ (W) - Ь)и) = const« V Т7 У(*) V max { V (u,v)eA Следовательно, оптимальная кривая — это эллипс с уравнением ((х - аJ + (у - бJ) '/2 _ Ц у = const. A0) Как и в предыдущем случае, можно показать, что он обходится тра- траекторией (x(t),y(t)) ровно один раз. Заметим, что если бы скорость самолета была меньше скорости ветра (V < \щ\), он не мог бы вер- вернуться в исходную точку (докажите это и сравните с упражнени- упражнением в начале этого пункта), а кривая A0) была бы гиперболой, т.е. незамкнутой. Примечание. Вопреки принятой схеме, мы обошли молчанием вопрос о существовании решения. Это не случайно: простой ссылкой на теорему Вейерштрасса здесь не обойдешься. Наметим вкратце воз- возможный путь рассуждений. Прежде всего без ограничения общности можно считать, что х@) = = !/@) = 0. Используя теорему Арцела [КФ, гл.2, §7], можно установить, что множество пар функций {(х(-), у(•))}, удовлетворяющих на отрезке [0, Т] обобщенному условию Липшица U+t2, <Kt,, t^T A1) и краевым условиям ж@) = х(Т) = 0, j/@) = у(Т) = 0 компактно в пространстве С([0, Т]) х С([0, Т]). Далее, на этом множестве функционал «площадь» определен и яв- является полунепрерывной снизу функцией. Применяя соответствующее обобщение теоремы Вейерштрасса, убеждаемся в существовании ре- решения (#(•), у{-))- Наконец, функции, удовлетворяющие условию A1), дифференци- дифференцируемы почти всюду, причем (x(t),y(t)) ? А. На эту ситуацию ока- оказывается возможным распространить принцип максимума, и, сле- следовательно, к решению (х(-),у(-)) применимы приведенные выше рассуждения.
1.6. Решение задач 97 1.6.5. Задача о брахистохроне и некоторые задачи геометрии. Рассмотрим следующую серию простейших задач классического вари- вариационного исчисления: 1. у{хх)=у\. A) В нее попадает несколько интересных задач: при а = О получается задача о кратчайших линиях на плоскости, при а = —1/2 — задача о брахистохроне (см. п. 1.2.4), при а= 1 — задача о минимальной поверхности вращения; при а = — 1 — задача о кратчайших линиях на плоскости Лобачевского в интерпретации Пуанкаре (полуплоскость Пуанкаре [13, с. 131-132]). Интегрант fa = уал/\ + у'2 в задачах A) не зависит от х. Поэтому уравнение Эйлера (п. 1.4.1) имеет интеграл энергии, из ко- которого мы и находим все экстремали, лежащие в верхней полуплоско- полуплоскости. 2-4. У1 jay - / = const =Ф у~2а(\ + у'2) = D2. B) 5. Сначала разберем случай отрицательных а: а = —/3, /3 > 0. Тогда = dx => х - С\ = , —. C) и* - у^ Делаем замену dy sm Подставляя полученные выражения в C), приходим к следующим соотношениям (D1^ = С): и-С sin1/^ t т - С, + — sin1/^ s ds ^ f s В частности, если /3=1/2 (брахистохрона), получается семейство циклоид, заданных в параметрической форме (г = 2?): Если /3 = 1 (полуплоскость Пуанкаре), получаем семейство полуокруж- полуокружностей y(t,C,Cx) = С sin ?,?(?, С, Ci) = Ci -Ccost^ (x-CxJ + y2 = С2. 4 В. М. Алексеев и др.
98 Гл. 1. Введение § 1.7. Дополнение. Необходимые условия экстремума от Ферма до Понтрягина Здесь доказываются важнейшие результаты теории экстремума, связанные с именами Ферма, Эйлера, Лагранжа и Понтрягина. При написании этого текста существенный вклад был внесён А. В. Арутюновым и Г. Г. Магарил-Ильяевым. 1.7.1. Ферма. Задачи без ограничений. Начнем с конечномер- конечномерных задач, т. е. с задач в пространстве Rn. Пространство Rn состоит из векторов-столбцов х = : . Наряду с векторами-столбцами бу- \ I \ п ) дем рассматривать векторы-строки у = (у\,..., уп). Совокупность всех векторов-строк обозначим (Rn)'. Если х — вектор-столбец (вектор- строка), то хт обозначает «транспонированный вектор», т. е. соответ- соответствующую вектор-строку (вектор-столбец). Пусть у Е (Rn)x, axG Rn, тогда полагаем у • х = Y^Jk=\ Укхк- Число \х\ = VxT • х = л/Х]/с=1 x\ называется длиной или модулем х. Напомним, что множество V С Rn называется открытым (<^> V Е Е ff(Hn)), если V^o G У Зг > 0 такое, что множество {х G Rn | \х — — хо\ < г} (открытый шар с центром в хо радиуса г) принадлежит V. Открытое множество, содержащее х, называется окрестностью х. При этом будем писать V е @(x,Rn). Пусть V е @(x,Rn) и / : V -^ R. Задача /(x)^extr (Pi) называется задачей без ограничений (в Rn). Определение 1. Говорят, что точка х является локальным ми- минимумом (максимумом) задачи (Pi), если существует такая окрест- окрестность Vo С V точки х, что для всех х е Vo выполнено неравенство: f(x) ^ f{x) (f(x) ^ f(x)). В этом случае будем писать х G locmin(Pi) (locmax(Pi)). Запись х G locextr(Pi) обозначает, что х — либо локаль- локальный минимум, либо локальный максимум. Напоминание. Говорят, что функция / : V —»> R (V G €(x, Rn)) диф- дифференцируема в точке х, если существует такой вектор а Е (Rn);, что для всех х Е Rn, для которых х + х Е V справедливо равенство f(x + х) = /(ж) + + а - х + г(ж), где г(ж) = о(ж), т. е. Нтж^о |г(ж)|/|ж| = 0). Вектор а (опреде- (определяемый этим соотношением однозначно) называется производной f в точке х и обозначается f'{x). Будем писать в этом случае / Е Dl(x). Теорема 1 (Ферма). Пусть V е @(x,Rn), f : V -> R, f e e Dl(x) и x E locextr(Pi). Гог^а /'(ж)=0. A)
1.7. Дополнение 99 Доказательство. Далее используется теорема Ферма для функ- функций одного переменного и теорема о производной суперпозиции функ- функций. Пусть х ? Rn. Для всех а ? R таких, что х + ах ? V положим д(а) = д(а;х) = f(x-\-ax). Из теоремы о производной суперпозиции следует, что д ? Dl@) и д'@\х) = fix) • х. Из условия теоремы вы- вытекает, что д имеет локальный экстремум в нуле. Тогда из теоремы Ферма получаем, что д'@;х) = fix) • х = 0. В силу произвольности х отсюда следует, что f'(x) = 0. ¦ 1.7.2. Лагранж. Задачи с ограничениями типа равенств и неравенств. Пусть V ? €(Yln) и fi : V —> R, 0 ^ г ^ га. Задача /о(ж)->extr, fi(x)=0, l^i^m (P2) называется задачей с ограничениями типа равенств (в Rn). Определение 2. Вектор х ? V, для которого fi(x) = 0, 1 ^ г ^ ^ га, называется допустимым в (Рг). Допустимый вектор х называется локальным минимумом (максимумом) в задаче (Рг), если существует такая окрестность Vo С V точки х, что /о(х) ^ fo(x) (fo(x) ^ fo(x)) для всех допустимых векторов х ? Vo. Вектор х — локальный экстремум, если это либо локальный минимум, либо локальный максимум. Функ- Функцию 9Е(х,\) = Х^о^/^)' где ^ = (^о»"'^т)> называют функцией Лагранжа задачи (Рг), числа А^, 0 ^ г ^ т, — множителями Лагран- Лагранжа задачи (Рг), вектор А = (Ао,...,Аш), — вектором множителей Лагранжа. Теорема 2 (Правило множителей Лагранжа). 1. Пусть V ? €(x,Yln), функции fi : V —> R, 0 ^ г ^ т, непрерывны на V и принадлежат Dx(x). Если х ? locextr(P2), то существует ненулевой вектор множителей Лагранжа А = (Ао,...,Аш) такой, что 2. Пусть V ? €(х,Ип), функции fo'.Vn (x + R^) -^ R, 0 < г < га, непрерывны на V П (ж + R™) и существуют ai ? (Rn)x такие, что fi(x-\- 0) = cti (т. е. fi(x-\-x) = а^ • х + г (ж) Уж таких, что х -\- х ?V Г) Г) (х -\- RIj:) и Нтж^о 1Г(Ж) 1/1^1 = 0' 0 ^ г ^ га). ?суш ж G locextr(P2), то найдётся ненулевой вектор А = (Ао,...,Аш), (Ао > 0, если х — локальный минимум и Ао < 0, если х — локальный максимум) мно- множителей Лагранжа такой, что 9Ех(х + 0, А)) = X^I^i ^гЛ(^ + 0) ^ 0- Доказательство. Докажем 1). Здесь мы используем заме- замечательный результат Брауэра: непрерывное отображение п-мерного шара в себя имеет неподвижную точку. Без ограничения общности можно считать, что х = 0 и /о(О) =0. Пусть F(x) = (fo(x),..., fm(x))T и Ff@) — матрица, строки которой суть //@), г = 0, 1,..., га. Имеется альтернатива: a) Fx@)Rn ф Rm+1
100 Гл. 1. Введение и б) F'@)Rn = Rm+1. В первом случае векторы //@), 0 < г < т линейно зависимы, и это означает B). Покажем, что б) ведёт к противоречию. Пусть {е^}^0 — некото- некоторый базис в Rm+1. Найдутся векторы {/г}^0 такие> что F"(tyfi = = ei, 0 ^ г ^ т. Построим непрерывное «правое обратное» отобра- отображение R : R™+1 -+ Rn, полагая R(y) = Е?=оУг/г Для у = YT=oViei- Элементарно проверяется, что F/@)R(y) = у и \R(y)\ ^ С\у\ для всех у G Rm+1 и С не зависит от у. Отсюда и из дифференцируемости функций в нуле следует, что G(y) = F(R(y)) = у + р(у), р(у) = о(у) при у —> 0. Пусть 5 > 0 таково, что |?/ — G(?/)| ^ 1^/1/2 для всех у таких, что \у\ ^ 5 и пусть, для определенности, 0 G looming)• По векто- РУ V = (~^/2,0,...,0)т построим отображение Ф^ : В@,5) -^ Rm+1, Фп(у) =V + V- G(y), где В@,6) = {у е Rm+1 | \у\ < 5}. Имеем \®v(y)\ ^ I7?! + I?/ ~ ^B/I ^ ^' т- е- ^^ ~~ непрерывное отображение шара В@,5) в себя. Из теоремы Брауэра о неподвижной точке следует, что существует вектор у, для которого у = Ф-rjiy) => F(R(y)) = G(y) = rj. Таким образом, построена точка R(r]) (вблизи 0 G Rn, так как \R(y)\ < < С5 и 5 можно выбрать как угодно малым) такая, что fo(R(y)) < < 0, fi(R(y)) = 0, 1 < г < ш, т. е. 0 ф locmin(P2)- Полученное про- противоречие доказывает теорему. Утверждение 2) доказывается вполне аналогично. ¦ 1.7.3. Эйлер, Лагранж, Понтрягин. Задачи вариационного ис- исчисления и оптимального управления. Пусть —оо < to < t\ < оо, U — некоторое подмножество пространства Rr, / : [to,t\] x Rn x U -^ -^ R (/ = /(?, х, и)) — функция п + г + 1 переменного {(t, x,u) \ t ? ? [to,t\],x eRn,ue U}), ip : [to,t\] xRnx[/^Rn. Задача mm, x = (p(t,x,u), x(t0) = x0 (P3) называется задачей оптимального управления со свободным (пра- (правым) концом, а если граничные условия (т. е. соотношения x(ti) = = Xi г = 0, 1) фиксированы, то — задачей оптимального управления с закреплёнными концами. Соотношение х = (p(t, x, и) называется дифференциальной связью. Переменные х в задаче (Рз) называют фазовыми, переменные и — управлениями. Задачу (Р3) будем рас- рассматривать в пространстве Z = PCl([t0,U], Rn) x PC([t0, ti],Rr) (P — от слова piecewise — кусочный, состоящий из кусков), в котором функции управления кусочно непрерывны, а фазовые функции кусочно непрерывно дифференцируемы. Пара функций (х(-),и(-)) ? Z, удовле- удовлетворяющая ограничениям задачи, называется допустимым процессом. Определение 3. Допустимый процесс (х(-),и(-)) называется оптимальным, если существует число г > 0 такое, что для любого до- допустимого процесса (х(-),и(-)), для которого \\х(-) — ^(-)||c([to,ti],Rn) =
1.7. Дополнение 101 = maxtG[t(btl] \x(t) — x(t)\ < г выполняется неравенство $(х(-),и(-)) ^ >/(?(•),?(•)). Функция ^(ж(.),м(.),А) = J^ i(t,x(t),x(t),u(t))dt, где L = L(t,x,x,u) = \of(t,x,u) +p(t) • (x - cp(t,x,u)) (p(t) ? (Rn)' на- называется функцией Лагранжа задачи (Рз); функция L называется интегр актом. Далее мы используем сокращённые обозначения: Lx(t) = Lx(t, x(t),x(t), u(t)), fx(t)=fx(t,x(t),u(t)) и т. д. Теорема 3. (Необходимые условия для задачи оп- оптимального управления, принцип максимума Понтря- гина). Пусть (х(-),и(-)) — допустимый процесс в задаче (Рз), где /, fx, (р, (рх определены и непрерывны на множестве {(t,x,u) \ t G G [to,t\], \x — x(t)\ < 5,и е U} (при некотором 5 > 0). Если (х(-),и(-)) является оптимальным процессом в задаче (Рз) с закреплёнными концами, тогда существуют число Ло и вектор-функция р(-) е ? PCl([to,t\], (Rn)x), не равные нулю одновременно, такие, что вы- выполнены уравнения Эйлера по х\ -^Ы*) + Lx(t)=O & -р = p(px(t) - \ofx(t). C) и условие минимума по и: ттЬ(т,х(т),х(т),и) = L(r) <^> и & Л0/(г, x(t),v) - р(т) - ср(т, x(t),v) ^ Ло/(т) - р(т) - ф(т) C) для любой точки т непрерывности и(-). В задаче со свободным концом Ло = 1 и удовлетворяется (помимо C)) следующее условие трансверсальности: ЫП)=О. E) Если ввести функцию H(t,x,p,u) = p • cp(t,x,u) — Xof(t,x,u), то условия C) и D) (совместно с дифференциальной связью) переписыва- ютсятак: ш maxp(r) • (р(т, х(т),и) - Л0/(т, х(т), и) = и = р(т) ¦ <р(т) - Ао/(т), Уи б U. D') Соотношения Cх) и Dх) называют принципом максимума Пон- трягина.
102 Гл. 1. Введение Замечание. Если U = Rr, задачу (Рз) называют задачей Лагран- жа вариационного исчисления. Её рассматривают также в простран- пространстве W = С1 ([to, t\], Rn) x C([to,t\],Hr), и локальный минимум в W называют слабым (а минимум, соответствующий определению 3, — сильным). Условие сильного минимума в задаче Лагранжа может быть дополнено соотношением Lu(t) = 0, являющимся очевидным следстви- следствием соотношения D). Простейшая задача вариационного исчисления, изопериметрические задачи, задачи со старшими производными реду- редуцируются к задаче Лагранжа. Доказательство. Напоминания. Далее будут использованы сле- следующие результаты из теории обыкновенных дифференциальных уравнений (ОДУ): теорема существования и единственности в задаче Коши, теорема о непрерывной зависимости решения задачи Коши от параметров и начальных условий, теорема о дифференцируемости решения задачи Коши по параметрам и начальным условиям и теорема о существовании и единственности решения задачи Коши для линейного уравнения. Все они входят в стандартные курсы дифференциальных уравнений, (см., например, [11] §§17, 21, 22) и кроме того, подробно изложены в этой книге. Помимо этого, мы будем пользовать- пользоваться определением компактности в форме леммы о центрированной системе (см. КФ гл. II, §6). Докажем сначала теорему для задачи со свободным концом (более детально это было изложено в п. 1.5.4.) Пусть (х(-),и(-)) — опти- оптимальный процесс в задаче (Рз) со свободным концом. Рассмотрим «игольчатую» вариацию функции управления и(-) (где а ^ 0, v G U, г точка непрерывности и{-))\ (При этом выберем а настолько малым, что и(-) непрерывна на всем отрезке [г — а,т].) Из теоремы существования и единственности решения задачи Коши в теории обыкновенных дифференциальных уравнений вытекает, что существует решение ха(-) задачи х = (p(t,x,ua(t)), x(to) = хо, опреде- определенное на всем отрезке [?о,т]. При этом: a) xa(t) = x(t) при t G [to,r — — a]; 6) на отрезке [г — а, г] выполняется равенство ха(?) = х(т) + о( 1), и тогда по теореме о среднем — х(т) = х(т — а) + (p(t, xa(t), v)dt — х(т) = (г) где AT^v(p = (p(r,x(r),v) — <р(т). Рассмотрим теперь решение такой за- задачи Коши х = (p(t, х, u(t)), х(т) = ха(т)(= aAT:V(p + o(a)). По теореме о непрерывной зависимости решения от начальных данных решение этой задачи при малых а существует и определено на всем отрезке
1.7. Дополнение 103 [t,?i]. Обозначим его также ха(-). По теореме о дифференцируемой зависимости решения по начальным получаем, что при t ^ r где Уту(') — решение задачи Коши уравнения в вариациях: у = (px(t)y, у(т) = ср(т, х(т), v) - ф(т) = ATVip, (in) \\rarv(')\\c([t0,u})/a -^°- Обозначим gTV(a) = д(ха('),иа(-)). Тогда име- имеем г 9rv(a) - gTV@) = J (f(t,xa(t),v) - Rt))dt+ г—а + \(f(t,xa(t),u(t)) - f(t))dt{i)^l) a(ATVf + lfx(t)-yTV(t)dt) плюс о(а), где ATVf = f(r,x(r),v) — f(r). Из оптимальности процесса (?(•),?(•)) следует, что ^гг;(а) -^^@) > 0, т. е. О/ » \ (IV) Пусть ро(-) решение задачи Коши линейного уравнения — р = p{px(t) — — fx(t) (т. е. уравнения C) с Ло = 1) с граничным условием po(^i) = 0. Используя выражения для ро(*) и Уту(-), получаем и -yTV(t\) -ро(т) -уТу(т) = jt(po(t) - yTV(t)) = т и = \ fx(t) • yTV(t)dt. (v) Отметим еще, что xa(t\) = x(t\)+ayTV(t\) + o(a). (vi) Таким образом из (ш) и (гг;) вытекает, что 0 < ATVf + J^ fx(t) x х yTV(t)dt = ATVf —р(т) • ATV(p. Теорема для свободного конца дока- доказана. ¦ Перейдём к рассмотрению задачи с закреплёнными концами. Пусть N — натуральное число, J\f — совокупность пар (т^г^) ? [to,ti] x U, 1 < г < 7V, где to < Ti < ... < гдг < ti и точки т^ принадлежат множеству Т точек непрерывности и(-), а = (а\,... ,aw) G R^, причем с^ столь
104 Гл. 1. Введение малы, что отрезки А^ = АДа) = [тг + i^2j=\ otj + оцл% + *S?=i aj]' 1 < г < TV, не пересекаются и принадлежат множеству Т. Рассмотрим функцию , ^ = /ОД, если t е [*0,*i] \ (Jill Ai, al ' ; \vit t e A^ Обозначим через x-u{-\JV) решение задачи Коши: х = cp(t, х, u-a(t]^V)), x(to) = xo- Из теории обыкновенных дифференциальных уравнений следует, что решение этой задачи существует и при малых a G R+ определено на всем отрезке [to,ti]. Обозначим go(a;^V) = {x-q[{-\J\/),Uo[{-\JV)), а через gi(a;jV), 1 < г < ^ п, компоненты вектора Xo[(t\\jV) — x\ и рассмотрим экстремальную задачу go(a',j?) -^ min, gi(a;,A) =0, 1 ^ г ^ n, «G R^. (г;гг) Функции gi(-',N), г = 0, 1,... ,п, в силу теорем из теории ОДУ, удовле- удовлетворяют условиям пункта 2) теоремы 2, и при этом ясно, что вектор а = 0 является решением данной задачи. Согласно теореме 2 существу- существует ненулевой набор множителей Лагранжа Л = A(*/f) = (/io,/ii,...,/in)> /io ^ 0, такой, что 5^^=о/^г^(^ + 0'^) ^ 0' или что то же (см- fa) и (ш)) где /i = (/ii,...,/in). Так как А ^ 0, то можно считать, что |А| = 1, т. е. А принадлежит единичной сфере Sn пространства (Rn+1)x. Обозначим через к(Л) множество всех наборов множителей Лагранжа А для зада- задачи (тг), удовлетворяющих условию |А| = 1. Ясно, что A(yf) — непустое замкнутое подмножество Sn. Итак, каждому набору ^сопоставляется непустое замкнутое подмножество к(Л) сферы Sn. Обозначим через *sdсовокупность всех таких подмножеств. Это центрированная система. Действительно, пусть Л(^) с Д 1 ^ г ^ s и jVq — набор, состоящий из объединения наборов Л\,... ,J\fs. При этом ясно, что если A G G Л(«уГо)> то A G K{J^i), i= 1,...,5, т. е. ^4 — центрированная система. Следовательно, по лемме о центрированной системе существует такое А = (До'Д)' Д — (Дь ••• >Дп) ^ ^П' которое принадлежит всем элементам из А. Это означает, в частности, что для любой пары (r,v) eT x U справедливо неравенство fx(t) - yTv(t)dt + /i • yTV(ti) > 0. (viii)
1.7. Дополнение 105 Пусть р(-) решение задачи Коши: -Р = P<Px(t) - ~Po?x(t), p(t\) = -Д. (ix) Тогда для t ? [r,t\] имеем ЩШ ' Vrv(t) (=} p(t)(px(t)yTV(t) +p(t) • yTV(t) ( = } ( } ilrv(t)+№ • I/Tf,(t) = |(p(t) • yTV(t)). Интегрируя обе части этого равенства на отрезке [r,t\] и подставляя в (viii), получим 0 < Tk^Tvf+p{tx)-yTV{tx)-p{T)-yTV{r)+Ti-yTV{tx)^ ^ } (ix),(iii) _ / \ л = l^o^rvj -Р\Т) • ATV(p, что вместе с (гж) доказывает теорему 3 (с заменой До на ^о)-н Исторический комментарий. Первый намек на теорему 1 содер- содержался в письмах Ферма к Мерсенну и Робервалю в 1638 г.; формулировка пункта 1) теоремы 2 (с Ао = 1 и без оговоренных условий гладкости) приведена в одной из книг Лагранжа, опубликованной в 1797 г. (см. стр. 44); правило множителей Лагранжа для гладких задач с неравенствами было доказано Джоном в 1948 г.; теорема 3 (доказанная В. Г. Болтянским в I960 г.) яви- явилась итогом работ, инициированных Л. С. Понтрягиным в пятидесятые годы прошлого века; простейшая задача вариационного изчисления, изоперимет- рическая задача (необходимые условия для них были найдены Эйлером — см. § 1.4) и задача Лагранжа (см. § 1.5) являются частным случаем задачи C), и необходимые условия для всех этих задач являются следствием теоремы 3.
Глава 2 АППАРАТ ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ Читатель познакомился с различными постановками экстремальных задач, с основными понятиями и общими идеями, а также получил представление о некоторых приемах решения этих задач. Теперь мы пе- переходим к последовательному и достаточно формальному изложению соответствующей математической теории. Общность развиваемой теории и ее сравнительная простота оказа- оказались возможными за счет свободного использования фактов и поня- понятий, относящихся к смежным разделам математики, в первую очередь функционального анализа. Здесь они изложены в нужной нам форме. Значительную часть главы составляет то, что можно было бы назвать «Элементами дифференциального исчисления». § 2.1. Предварительные сведения из функционального анализа В этом параграфе рассказывается о тех фактах функционального анализа, на которые мы далее опираемся при построении теории экс- экстремальных задач. Доказательства, которые можно прочесть в учебни- учебнике А. Н. Колмогорова и С. В. Фомина [КФ], мы, как правило, опускаем. 2.1.1. Линейные нормированные и банаховы пространства. Напомним, что линейное пространство X называется нормированным, если на X определен функционал || • ||: X —> R, называемый нормой и удовлетворяющий трем условиям: а) ||ж||^0, УхеХ и ||ж||=0 ^х = 0, б) ||аж|| = |а|||ж||, Ух е X, Уа е R, A) в) \\х\ +#2 || ^ ||#l|| + 11^2 ||, VX\,X2 G X. Иногда, чтобы подчеркнуть, что норма задана именно в X, мы пишем II-Их- Всякое нормированное пространство становится метрическим, если ввести в нем расстояние р(х\,х2) = \\х\ -х2\\.
2.1. Предварительные сведения из функционального анализа 107 Полное (относительно введенного расстояния) линейное нормиро- нормированное пространство называется банаховым пространством. Упражнения. Пусть X = R2. Какие функции из перечисленных ниже и при каких значениях параметров задают норму в X? 1. N(x) = (\xi\p + \x2\p)l/p, 0 < р < оо; 2. N(x) = |ацЖ1 + а\2Х2\ + |агiжi + 022^21; 3. N(x) = тах{|ацЖ1 + а\2Х2\, \cl2\X\ + а22^2|}. 4. Описать все нормы в R2. 5. Доказать, что все нормы в R2 эквивалентны. (Нормы N\ и N2 на- называются эквивалентными, если существуют такие с > 0 и С > 0, что c7Vi(x) < 7V2(x) < CWi(x), Vx e X.) Совокупность Х* всех линейных непрерывных функционалов на X (сопряженное к X пространство) является банаховым пространством, если задать в X* норму ||ж*||х* = sup (x*,x), Ikll где (х*,х) означает результат применения к х функционала х*. Подробнее об этом см. [КФ, гл. IV, §2]. Упражнение 6. Найти нормы в пространствах, сопряженных к описан- описанным в упражнении 1-4. Для нас важнейшую роль будут играть следующие банаховы про- пространства. Пример 1. Пространство С (К, Rn) непрерывных вектор-функций х(-): К —> Rn, заданных на компакте К с нормой Пространство С(К,И) мы обозначаем просто С (К). Пример 2. Пространство Cr([to,t\],Hn) r раз непрерывно диффе- дифференцируемых вектор-функций х(-): [to,t\] —> Rn, заданных на конечном отрезке [to,ti] С R, с нормой Пространство Cr([to,t\],R) мы обозначаем Cr([to,t\]). Упражнения. 7. Доказать, что всякое конечномерное нормированное пространство явля- является банаховым. 8. Доказать, что единичный шар конечномерного нормированного простран- пространства является выпуклым, замкнутым, ограниченным центрально-симметрич- центрально-симметричным множеством, для которого начало координат является внутренней точкой, и наоборот, для любого выпуклого замкнутого ограниченного центрально-сим- центрально-симметричного множества, для которого начало координат является внутренней точкой, существует такая норма, в которой это множество является единичным шаром. 9. Привести пример нормированного, но не банахова пространства.
108 Гл. 2. Аппарат теории экстремальных задач 2.1.2. Произведение пространств. Фактор-пространство. Пусть X и У — линейные пространства. Их произведение X х У, т. е. мно- множество всех пар (х,у), х G X, у ? У, превращается в линейное про- пространство, если операции сложения и умножения на число определить покоординатно: (хиу\) + (х2,У2) = {х\ +%2,У\ +2/2), а(х,у) = (ах,ау). Если X и У — нормированные пространства, то и в произведении X х Y можно ввести норму, например, так: \\(x,y)\\XxY = тж{\\х\\х,\\у\\у}. A) Упражнение. Проверьте, что ||ж||х + \\y\\y и у||ж||х + \\y\\Y — также некоторые нормы в X х У, эквивалентные норме A). Имеют место следующие очевидные леммы. Лемма 1. Если X и У — банаховы пространства, то и X х У банахово. Доказательство предоставляется читателю. Лемма 2. Всякий линейный функционал А е (X х У)* однознач- однозначно представим в виде где х* G X* и у* G У*. Доказательство. Положим (х*,х) = (Л, (х,0)}, (у*,у) = = (А, @, у)). Линейность этих функционалов очевидна, а непрерыв- непрерывность (<^> ограниченность) вытекает из оценок: Однозначность представления B) также не вызывает сомнений. ¦ Поскольку при любых х* G X* и у* G У* формула B) определяет некоторый функционал Л G (X х У)*, то мы получили полное описание пространства (X х У)*. Кратко оно дается следующей формулой: (X х хУ)* =Х*0У*. Пусть теперь X — линейное пространство, L — некоторое его подпространство. Положим х ^ х', если х — х' G L. Введенное отно- отношение будет отношением эквивалентности (ибо очевидно, что х ^ х, х\ ^ Х2 =^ Х2 ^ х\ и х\ ^ Х2, Х2 ^ х% => Х\ ^ х$), а значит [КФ, гл. I, §2] определено разбиение X на классы. Класс эквивалентных элемен- элементов по введенному выше отношению называется классом смежности по подпространству L. В совокупности классов смежности естествен- естественным образом вводятся операции сложения и умножения на число (КФ, гл. III, § 1, п. 4); при этом выполняются аксиомы линейного простран- пространства. Таким образом, совокупность классов смежности превращается
2.1. Предварительные сведения из функционального анализа 109 в линейное пространство, называемое фактор-пространством X по L и обозначаемое X/L. Классом смежности тг(ж), которому принадлежит элемент х е G X, является класс х -\- L. Отображение тг: X —> X/L является ли- линейным (докажите!). Его называют каноническим отображением X на X/L. (Отображение тг является, разумеется, эпиморфизмом 0.) Очевидно, что L = Кегтг. Пусть теперь X — нормированное пространство и L — его подпро- подпространство. Положим U\\x/L = ini\\x\\x, C) ИЛИ M\\x/l = mf \\х\\х= inf ||хо + ж'||. C') 7ГЖ = ? 7ГЖ0=С Из определений C), Cх) сразу следует, что оператор тг непреры- непрерывен (||тпс|| ^ ||ж||) и для любого ? G X/L найдется xGl, для которого тгх = е ||xK2||e||x/L. D) Теорема о фактор-пространстве. Пусть X — нормиро- нормированное пространство и L — его замкнутое подпространство. Тогда функция || • \\х/ь> задаваемая соотношением C), является нормой на X/L. Если пространство X является банаховым, то фактор- пространство X/L с нормой || • \\х/ь также является банаховым. Доказательство. Необходимо доказать, во-первых, что функ- функционал || • \\х/ь удовлетворяет аксиомам нормы и, во-вторых, что пол- полнота X влечет за собой полноту X/L. Докажем первое утверждение теоремы, т.е. проверим выполнение аксиом A) п. 2.1.1. Аксиома a): ||?||x/l ^0 (VO вследствие неотрицательности нормы в X. Если ? = 0, то в качестве х е ? можно взять х = 0, и потому ||0||x/l — 0- Пусть ||?||x/l = 0- Тогда из C) следует, что существует последовательность {хп\, хп G ^ такая, что ||жп|| —> 0, т.е. хп -^ 0. Вследствие замкнутости ^, 0 G ?, т. е. ^ есть нулевой элемент в X/L. Аксиома б): Пусть а е R. Тогда, если тгж = ?, то \№\\х/ь = inf JI2/II = inf ||аж|| = |а| inf ||ж|| = |а| ||^||. Аксиома в): 116+611= inf ||#i +^2 +^х|| = inf ||ж1+^1+Ж2 + Ж2Ц < cc'GL < inf ЦЖ1+Ж1Ц+ inf \\x2 +411 = ||6\\x/l + WbWx/L- x) To есть отображает Х на все X/L.
ПО Гл. 2. Аппарат теории экстремальных задач Докажем второе утверждение теоремы, т. е. полноту X/L. Пусть {?п} — фундаментальная последовательность в X/L, т. е. Уе > О 3N(e): n > N(e) => Un+m ~ Ы\х/ь < е, Vm > 1. Выберем Sk = 2~k и номера Пк такие, что ||?nfc+m - Cnfc || < 2~fc, к > 1. Тогда ||^П2 — ?П11| ^ 1/2, и вследствие D) существуют представители Xi ? ?ni такие, что ||#2 ~#i|| ^ 1- Аналогичным путем построим эле- элементы {хп}п^3 так, что \\хк - хк-\\\ < г"^), хк е ^nfc, fc = 3,4,... Последовательность {xk}^=i фундаментальна в X (проверьте), al- полно по условию. Значит, существует предел xq = lim Хк. Рассмот- к^оо рим класс ^о — кхо. Тогда Unk - Ы\х/ь = inf \\хк -х0- х'\\х < \\хк - хо\\х -^ 0 . Итак, ^nfc —> ^о» а тогда и ^п ^ ^о в силу фундаментальности {^п}- Значит, X/L — полное. ¦ Упражнения. 1. Пусть X = С([0, 1]), 0 < т\ < Т2 < ... < тт < 1, подпространство L состоит из функций х(-) G С([0, 1]) таких, что х{тг) =0, г = 1,...,ш. Найти фактор-пространство X/L и определить || • ||х/ь- 2. Обобщить результат упражнения 1 и доказать, что если F — замкнутое подмножество отрезка [0, 1] и }) \x(t)=0,teF], то пространство С([0,1])/Ь^ изометрически изоморфно пространству C(F). 2.1.3. Теорема Хана-Банаха и ее следствия. В теории экстре- экстремальных задач важную роль играют теоремы отделимости и некото- некоторые другие факты выпуклого анализа. Большинство из них является следствием теоремы Хана-Банаха, которую часто называют первым основным принципом линейного анализа. Учитывая, что эта теорема входит во все стандартные курсы функционального анализа, огра- ограничимся здесь лишь ее формулировкой и некоторыми важнейшими следствиями. В этом пункте X j- линейное пространство, R — расширенная числовая прямая, т. е. R = R U {—оо, +оо}_. Определение 1. Функция р: X —> R называется выпуклой и од- однородной, если р(х + у) < р(х) + р(у) для любых х,уеХ, A) р(ах) = ар(х) для любых х G X и а > 0. B) Примеры. 1) X — нормированное пространство, р(х) = ||ж||. 2) X — линейное пространство, L — линейное подпространство вХ, 0, х е L, +оо, х Ф L.
2.1. Предварительные сведения из функционального анализа 111 3) X — линейное пространство, 1\, ..., 1т — набор линейных функционалов на X; р(х) = max((l\,x),..., (lm,x)). Важный пример доставляет следующее Определение 2. Пусть А — выпуклое подмножество линейного пространства X, содержащее 0. Его функция Минковского /jlA(-) опре- определяется равенством fiA(x) = inf{? > 0 | x/t e A} C) (если таких t > 0, что x/t ? А, нет вовсе, то jjlA(x) = +оо). Предложение 1. Функция Минковского неотрицательна, вы- выпукла и однородна; {х | fiA(x) < 1} С А С {х | fiA(x) < 1}. D) Если X — линейное топологическое пространство 0, то непрерывна в точке 0 тогда и только тогда, когда 0 G int A. Доказательство. Если /iA(x) или fiA(y) равно +оо, то A) верно. Поэтому пусть fiA(x) < +oo и fiA(y) < +oo. По определению для любого г > 0 найдутся такие t и s, что 0 < t < fiA(x) + г/2 и ж/t g A, 0 < s < /лА(у) + г/2 и у/5 G А. Но тогда % + У ^^У^ t + s t t + s s t + s поскольку А выпукло и, следовательно, fiA(x + у) < t + 5 < /М(ж) Ввиду произвольности е верно A). Далее, для а > 0 цА(ах) = inf{t > 0, ax/t e A} = inf{as > 0, ж/s ei} = = a inf {5 > 0; ж/5 е А} = так что верно B). Неотрицательность цА(х) и второе включение в D) следуют непо- непосредственно из определения. Если /iA(x) < 1, то существует t G @, 1), для которого x/t e А, а поскольку 0 G А и А выпукло, ж = 0- A -?) + -•? е Д так что первое включение в D) верно. 1) О линейных топологических пространствах см. [КФ, гл. III, §5].
112 Гл. 2. Аппарат теории экстремальных задач Пусть теперь X — линейное топологическое пространство. Тогда имеет место следующая цепочка эквивалентностей: /лА(-) непрерывна Уг > О, 3U? Э О, Мх е Ue,fj,A(x) <г^ 3Ui 3 0,Vx eUuii,A(x) < 1 <* 3U\ Э О, U\ С А^Ое ЫА (здесь U? и U\ — окрестности точки 0; вторая эквивалентность верна ввиду однородности /лА(-) и возможности положить U? = eU\).m Предложение 2. Для того чтобы линейный функционал х* на линейном топологическом пространстве X был непрерывен, необходимо и достаточно, чтобы для некоторой выпуклой однород- однородной непрерывной в точке 0 функции р(-) для всех х G X выполнялось неравенство (х*,х) ^р(х). E) Доказательство. Необходимость устанавливаем сразу, полагая ^(ггЛ — |/Г* Г\| Р\х) — \\х 'х/\- Предположим теперь, что верно E) и р(х) непрерывна в точке 0. Тогда для любого г > 0 найдется окрестность U Э 0 такая, что р(х) < < г для всех х е U. Поскольку 0 G U и 0 = (—0) G (—U), существует окрестность W такая, что 0 е W С U Г) (-U). Если х е W, то х и — х е U и в силу E) (ж*, х) < р(х) < г, (х* — х) ^ р(—х) < г. Следовательно, \(х*,х}\ < г для всех х е W, т. е. х* непрерывен в 0. Остается заметить, что линейный функционал, непрерывный в одной точке, непрерывен на X [КФ, гл. IV, § 1]. Теорема Хана-Банаха [КФ, гл. IV, § 1]. Пусть р: X —> R — выпуклая однородная функция на линейном пространстве X, и пусть 1: L ^ R — линейный функционал на под- подпространстве L пространства X такой, что (I, х) < р(х) для всех х е L. F) Тогда существует линейный функционал К, определенный на всем X, являющийся продолжением I, т. е. (A,x} = (l,x), xeL, G) и удовлетворяющий неравенству (Л, х) < р(х) для всех х е X. (8) Следствие 1. Пусть X — нормированное пространство и xq e Gl, xq t^ 0. Тогда найдется элемент Л Е X* такой, что ||Л|| = 1 и (Л,ж0) =
2.1. Предварительные сведения из функционального анализа 113 Доказательство. На подпространстве L = {х | х = а^о, a G R} зададим линейный функционал I, полагая {1ахо)=а\\хо\\. (9) Функция р(х) = ||ж|| — выпуклая однородная и A,ахо) = = а||#о|| ^ Ы \\хо\\ — ll^^oll — р(с^о)> так что имеет место неравен- неравенство F). По теореме Хана-Банаха I продолжается до линейного функционала Л на всем X, причем выполняются соотношения G) и (8). Вспоминая определение нормы функционала (п. 2.1.1), имеем из (8) ||Л|| = sup (Л, х) ^ sup р(х) = 1, N1=1 N1=1 так что, в частности, Л G X*. С другой стороны, из G) и (9) (А,х0) = A,х0) так что верно второе утверждение доказываемого следствия и, кроме того, N1=1 а потому ||Л|| = 1. ¦ Из следствия 1 немедленно вытекает Следствие 2. Если нормированное пространство X нетриви- нетривиально (т. е. I/ {0}), то и сопряженное к нему пространство X* нетривиально. 2.1.4. Теоремы отделимости. В этом пункте X — линейное топологическое пространство, X* — сопряженное к нему пространство, состоящее из всех линейных непрерывных функционалов на X. Определение 1. Функционал х* е X* разделяет множества Ас X и В С X, если sup(х*, х) ^ inf (x*,x), A) А х^в и строго разделяет А и В, если sup (х*, х) < inf (x*, х). B) А х^в Геометрически неравенство A) означает, что гиперплоскость Н(х\с) = {х | (х\х) =с}, где sup (ж*, х) < с < inf (ж*, х) отделяет множества Aw В друг от друга А х^в е в том смысле, что А лежит в одном полупространстве (if_|_(#*,c) = = {х | (х*,х) < с}), порожденном Н(х*,с), а В — в другом (Я_(ж*,с) =
114 Гл. 2. Аппарат теории экстремальных задач = {х | (х*,х) ^ с}) (рис.30), неравенство B) означает, что при этом с можно выбрать так, чтобы А и В лежали внутри соответствующих полупространств и не имели общих точек с Н(х*,с) (рис. 31). Первая теорема отделимости. Если множества А с X и В с X выпуклы, непусты и не пересекаются между собой, при- причем А открыто, то существует ненулевой линейный непрерывный функционал, разделяющий А и В. Рис. 30 Рис. 31 Доказательство. А) Поскольку А и В не пусты, существуют точки ао Е A, bo Е В. Множество С = (А - а0) - (В - bo) = {х | х = а - а0 - Ъ + Ьо, а е А, Ъ е В}, очевидно, выпукло (см. также предложение 1 и упражнение 2 в п. 2.6Л), содержит 0 и открыто (действительно, если х = а — — ао — Ь + Ьо и a G А, то существует окрестность U, a G U С А, а тогда ж Е С/ — ао — Ь + Ьо С С. Кроме того, с = Ьо — ао ^ С, так как в противном случае Ьо — ао = а — ао — Ъ + &о Для некоторых а G i и b ? В, откуда а = & G ^ПБ, т. е. эти множества пересекаются, вопреки условию. Б) Обозначим через р(х) функцию Минковского множества С. Согласно предложению 1 п. 2.1.3 р(х) — неотрицательная выпуклая однородная и непрерывная в точке 0. Кроме того, р(х) ^ 1 для всех хеС. В) На подпространстве L = {х | х = ас = а(ро — G R} определим линейный функционал /, полагая A,ас) = ар(с). Тогда для а > 0 имеем A,ас) = ар(с) = р(ас), а для а ^ 0 A,ас) = = ар(с) ^ 0 ^ р(сес), поскольку р(-) неотрицательна. Следовательно, для всех х Е I/ выполняется неравенство (/,ж) ^ р(ж) и по теореме Хана-Банаха / можно продолжить до линейного функционала Л тако- такого, что (Л, ас) = (I, ас) = ар(с), aeR C)
2.1. Предварительные сведения из функционального анализа 115 (А,х)^р(х), хеХ. D) Поскольку р(-) непрерывна в 0, из D) следует непрерывность функци- функционала Л (предложение 2 п. 2.1.3). Г) Для любых a G А и Ъ G В имеем (Л, а - Ь) = (Л, а - ао - Ь + Ьо) + (Л, а0 - Ьо) < поскольку а — ао — b + bo^C, a на С функция р(х) ^ 1; кроме того, мы использовали D). Но при 0 < t < 1 точка (bo — ao)/t = c/t не может принадлежать множеству С, ибо С выпукло и содержит 0, а на [0, c/t] лежит точка с = bo — ао ф С. Поэтому р(Ьо — ао) = inf < t > 0 г 1. E) Следовательно, (Л, а — Ь) < 1 — р(Ьо — ао) < О для любых а е А и b e е В. В неравенстве (Л, а) < (Л, b) a e А и b e В можно выбирать независимо, поэтому sup (Л, а) ^ inf (Л, Ь). Кроме того, согласно C) и E) (Л, bo — ао) = р(Ьо — ао) ^ 1, так что Л ф 0. Значит, Л разделяет А и В. ш Замечание. В п. 1.3.3 мы уже доказали теорему отделимо- отделимости в случае конечномерного пространства X. Сравнивая ее условия с условиями только что доказанной теоремы, мы видим, что в конечно- конечномерном случае можно опустить условие открытости А (то, что в п. 1.3.3 одно из множеств было точкой, — не существенно). Условия первой теоремы отделимости можно ослабить и требовать, чтобы hit А ф 0 и (hit А) Г) В = 0. Однако совсем обойтись без существования внут- внутренних точек хотя бы у одного из множеств нельзя. Уп ражнения. 1. Пусть А — выпуклое множество в линейном топологическом простран- пространстве X, int А ф 0 и х* G X*. Докажите, что sup(х*,х) = sup (x*,x). F) хеА xeintA 2. Выведите из F) теорему отделимости для случая выпуклых А и В, таких, что ЫАф0,Вф0,ВГ)ЫА = 0. 3. Докажите.что в пространстве X = 12 компактный эллипсоид А = I х = [хк] е k В = {х = [хк] | хк =t/k,t>0} к=\ и луч
116 Гл. 2. Аппарат теории экстремальных задач нельзя разделять никаким непрерывным линейным функционалом. Вторая теорема отделимости. Пусть X — локально вы- выпуклое линейное топологическое пространство [КФ, гл. III, §5], А — непустое, замкнутое выпуклое подмножество в X и х Е X — точка, не принадлежащая А. Тогда найдется ненулевой линейный непрерывный функционал, строго разделяющий А и х. Доказательство. Поскольку х^Аи А замкнуто, существует окрестность V Э х такая, что А П V = 0. Ввиду локальной выпукло- выпуклости X существует выпуклая окрестность В С V точки х. Ясно, что В П А = 0 и по первой теореме отделимости существует ненулевой функционал ж*, разделяющий А и В: sup (х*, х) ^ inf (х*, х). Остается заметить, что inf (х*, х) < (х*, х), х<ЕВ ибо нижняя грань ненулевого линейного функционала х* не может достигаться во внутренней точке х множества В. ш Определение 2. Аннулятором А1- подмножества X линейного пространства X называется множество тех линейных функционалов / на X, для которых A,х) = 0 для всех х Е А. Заметим, что А1- всегда содержит О Е X*. Лемма о нетривиальности а н нуля тора. Пусть L — за- замкнутое подпространство локально выпуклого линейного тополо- топологического пространства X, причем L ф X. Тогда аннулятор ZA содержит ненулевой элемент х* el*. Доказательство. Возьмем любую точку х ^ L. По второй тео- теореме отделимости существует ненулевой функционал х* Е X*, строго разделяющий х и L (L — подпространство линейного пространства и, следовательно, выпукло): * Т\ < (Т* г) G) Если бы существовало xq E L, для которого (x*,xq) ф 0, то, по- поскольку ахо Е L для любого а Е R, было бы sup(x*,x) > sup(x*,axo) = +оо, вопреки G). Следовательно, (х*,х) = 0 на L, и потому х* Е 1А.и 2.1.5. Теорема Банаха об обратном операторе и лемма о пра- правом обратном отображении. Вторым принципом линейного анализа является следующая теорема:
2.1. Предварительные сведения из функционального анализа 117 Теорема Банаха об обратном операторе. Пусть X uY — банаховы пространства, А: X —> Y — непрерывный линейный оператор. Если А является мономорфизмом, т. е. и эпиморфизмом, т. е. Im Л = {у \у = Ах,х е X} = Y, то Л — изоморфизм между X и Y, т. е. существует линейный непрерывный оператор М = Л: Y —> X такой, что Доказательство [КФ, гл. IV, § 5]. В нашем курсе будет много- многократно использовано такое следствие теоремы Банаха: Лемма о правом обратном отображении. Пусть X и Y — банаховы пространства, А — непрерывный линейный опе- оператор из X в Y, являющийся эпиморфизмом. Тогда существует отображение М: Y —> X (вообще говоря, разрывное и нелинейное), удовлетворяющее условиям Ао М = IY, \\М(у)\\ < С\\у\\ для некоторого С > 0. Отметим, что в силу второго условия М — непрерывное в нуле отображение. Доказательство. Оператор Л непрерывен, следовательно, его ядро КегЛ, являющееся прообразом точки нуль, будет замкнутым подпространством. По теореме о фактор-пространстве (п. 2.1.2) про- пространство Х/КетА банахово. Определим оператор Л: Х/КетА —> Y, положив Л^ = Ах на классе смежности ? = тле. Это определение кор- корректно: х\^ Х2 Е ? => ъх\ = 7ГЖ2 = ^ => х\ — Х2 G Кег Л => Ах\ = Ах%. Оператор Л линеен: если тго^ = <^, г = 1,2, то + а2^) = А(а\х\ Оператор Л непрерывен: для любого откуда Наконец, оператор Л биективен (взаимно однозначен). Действительно, Л — эпиморфизм вместе с Л: Уу G Y Зх G X, Ах = у =>¦ для ? = тг(ж), Л^ = у. С другой стороны, КегЛ = 0: Л? = 0, тгж = ^ ^> Лж = 0 ^> ж G Итак, доказано, что оператор Л есть непрерывный линейный би- биективный оператор из Х/КетА в Y. По теореме Банаха об обратном
118 Гл. 2. Аппарат теории экстремальных задач операторе существует непрерывный обратный к Л оператор М = Л, М: Y —> Х/КегЛ. Для элемента ? е My найдем в соответствии с D) п. 2.1.2 такой элемент х = #(?), что xG(h ||ж|| ^ 2||^||х/кегЛ- Поло- Положим М(у) = #(?). В итоге (Л о М)(у) = Ах(О =А? = Шу = у, \\М(У)\\ = Ыш < 2||С||х/КегЛ = 2\\Му\\х/КегА < 2||М|| \\y\\. ш 2.1.6. Лемма о замкнутости образа. Пусть X, Y и Z — банаховы пространства, А: X —> Y и В: X —> Z — линейные непрерывные операторы. Равенство Сж = (Аж, Вх) определяет линейный непрерывный оператор С: X —> У х Z. Упражнение. Докажите, что если норма в Y x Z определяется равен- равенством A) п. 2.1.2, то ||С|| = тах{||А||, ||В||}. Лемма о замкнутости образа. Если подпространство Im А замкнуто в Y и подпространство В Ker A 0 замкнуто в Z, то подпространство Im С замкнуто в Y x Z. _ Доказательство. Замкнутое подпространство Y = Im А банахо- банахова пространства Y само является банаховым пространством и А: X —> —> У — эпиморфизм. Ш лемме из п. 2.1.5 существует правое обратное к А отображение М: Y —> X. Пусть (у, z) принадлежит замыканию образа оператора С Это означает, что найдется последовательность {хп I n ^ 1} такая, что у = lim Ажп, ^ = lim Bxn. Положим п^оо п^оо ^п = М(Ажп - у) (у ? Y как предел элементов Ахп G У). Учитывая свойства М, полу- получаем А(хп - ?п) = Ахп -(А о М)(Ахп -у)=у, Un\\ = \\M(Axn-y)\\^C\\Axn-y\\^O. Поэтому В^п -^ 0 и lim В(хп — ?n) = lim Бжп = z, т. е. ^ принадле- принадлежит замыканию множества п^оо Е = {С = Вх | Ах = у}. Это множество является сдвигом подпространства ВКетА: Сь С2 ? ? =К» = ?^> Аж» = 2/, г = 1,2 => ^C2-Ci =5(x2-xi),A(x2-xi) =0^B = Ci + (C2-Ci)> Ci e ?,C2-Ci О То есть образ ядра оператора А при отображении
2.1. Предварительные сведения из функционального анализа 119 Но ?> Кег А замкнуто по условию, значит, замкнуто и множество X. Следовательно, z, принадлежащий замыканию X, принадлежит и са- самому Е, что означает существование элемента х, для которого Ах = у, Вх = z. Итак, (у, z) G ImC. ¦ 2.1.7. Лемма об аннуляторе ядра регулярного оператора. Пусть X, У — банаховы пространства, А: X —> У — линейный непрерывный эпиморфизм. Тогда (Ker AI- = ImA*. Доказательство. А) Пусть ж* G Imi* <^ х* = А*?/*. Тогда, если х G КегД то (х*,х) = (А*?/*, ж) = (у*, Ах) = 0, т.е. ImA* С С (КегА)-К Б) Пусть ж* G (КегА)-1, т.е. Ас = 0 ^> (х*,х) = 0. Рассмотрим отображение С: X —> R х У, Сх = ((ж*,ж), Ас). Образ ядра А при отображении ж* есть нуль, т. е. замкнутое множество, и по лем- лемме о замкнутости образа (п. 2.1.6) ImC — замкнутое подпростран- подпространство в R х У. Оно не совпадает с R x У, поскольку, например, A,0) ф ImC (действительно, если (а,0) = ((х*,х),Ах), то Ах = 0 => ^а = (ж*, х) =0). По лемме о нетривиальности аннулятора замкнутого собственно- собственного подпространства (п. 2.1.4) существует ненулевой линейный непре- непрерывный функционал Л е (ImCI- С (R х У)* и, вспоминая лем- лемму об общем виде линейного функционала на произведении про- пространств (п. 2.1.2), находим число Ло Е R* = R и элемент у* е У*, такие, что (Лож* + А*у*, х) = \о(х*,х) + (у *, Ае) = (Л, Сж) = 0, Ух. Случай Ло = 0 невозможен, ибо Im A = У и, значит, Следовательно, х* = А*(—у*/Хо), т.е. ж* Е ImA* и (КегА)^ С С 1т А*, ш 2.1.8. Абсолютно непрерывные функции. В теории оптималь- оптимального управления постоянно приходится иметь дело с дифференциаль- дифференциальными уравнениями вида x = (p(t,x,u(t)), A) где и(-) — заданная функция, называемая управлением. При этом, хотя функция (p(t,x,u) достаточно хорошая (непрерывная или даже гладкая), управление и(-) таковым, вообще говоря, не является. Оно может быть кусочно-непрерывным, а иногда даже удобно считать и(-) всего лишь измеримой функцией. Поэтому правая часть уравнения A) может оказаться разрывной, и следует уточнить, что понимается под его решением. Замечание. В этом пункте «измеримость», «интегрируемость», «почти всюду» и т. д. понимаются в обычном лебеговом смысле [КФ,
120 Гл. 2. Аппарат теории экстремальных задач гл. V, §§4, 5]. То же правило сохраняется и в остальной части книги, за редкими исключениями, оговариваемыми особо: например, в фор- формулах следующего пункта интеграл понимается в смысле Стилтьеса или Лебега-Стилтьеса [КФ, гл. VI, §6]. Если речь идет о вектор- нозначных или матричных функциях, то соответствующими свойства- свойствами должна обладать каждая их компонента. Например, функция х(-) = = (х\(•),...,хп{-))\ [а,/3] —> Rn измерима и интегрируема, если каждая из числовых функций Xi(-) : [а, /3] —> R обладает тем же свойством, и по определению C,C C , \x(t)dt=nxl(t)dt,...,\xn(t)dt). B) а ^а а ' Наиболее естественно считать (мы так и поступим), что диффе- дифференциальное уравнение A) вместе с начальным условием x(to) = xq эквивалентны интегральному уравнению t x(t) = хо + (p(s, x(s),u(s)) ds. C) to Для того чтобы это было справедливо, х(-) должна быть неопреде- неопределенным интегралом своей производной, т. е. необходимо, чтобы имела место формула Ньютона-Лейбница t x(t) -x(r) = \x(s)ds. D) г Функции х(-), для которых выполняется D), в лебеговской теории интегрирования называются абсолютно непрерывными [КФ, гл. VI, §4]. Важно, что этим функциям можно дать другое, эквивалентное и эффективно проверяемое определение. Определение. Пусть X — линейное нормированное простран- пространство, А = [а,C] — отрезок числовой прямой. Функция х(-): А —> X называется абсолютно непрерывной, если для всякого г > 0 найдется такое 5 > 0, что для любой конечной системы попарно непересекаю- непересекающихся интервалов (ak,Ck) С [а,C], к= 1,2, ...,7V, сумма длин которых N ^2(Рк - oik) < 5, E) к=\ выполняется неравенство N :е. F) к=\
2.1. Предварительные сведения из функционального анализа 121 Пример. Функция х(-): А —> X, удовлетворяющая условию Лип- Липшица ||ж(*1)-ж(*2)|| <#|*i -*2|, tut2 е А, абсолютно непрерывна. Действительно, здесь 5 = г/К. Непосредствен- Непосредственно из определения видно, что абсолютно непрерывная функция равно- равномерно непрерывна на А (берем N = 1). Предложение 1. Пусть X и Y — линейные нормированные пространства, А — отрезок числовой прямой. Если функции Xi(-): А —> X, г = 1,2, абсолютно непрерывны и ci ? Е R, то и функция с\Х\(-) + с^х^-) абсолютно непрерывна. Если функции х(-): А —> X и А(-): А —> 2!(Х, Y) абсолютно непре- непрерывны, то и функция А(-)х(-): А -^ Y абсолютно непрерывна. Если функция Ф(-): G -^ Y удовлетворяет условию Липшица на множестве Ж С G, а функция х(-): A^G абсолютно непрерывна и imx(-) = {у | у = x(t),t ? А} с Ж, то функция Ф(ж(-)): А -^ У абсолютно непрерывна. Доказательство. Первое утверждение непосредственно следу- следует из определения (см. также [КФ, гл. VI, §4]). Для доказательства второго заметим, что х(-) и А(-), будучи непрерывными, ограничены, так что \\x(t)\\^Mx, \\A(t)\\^MA, teA. Теперь для любой системы непересекающихся интервалов (^,Д) с С А, к = 1,... ,7V, имеем N J2 И(АМ&) - А(ак)х(ак)\\ ^ к=\ N N < J2 \WkWk) - А(рк)х{ак)\\ + Y, ШРк)х{ак) - А(ак)х(ак) < к=\ к=\ N N Е k=l k=l N N ^МА^ Ы/Зк) - х(ак)\\ + Мх ^ \\А(/Зк) - А(ак)\\. к=\ к=\ Выберем 5 > 0 так, чтобы из E) следовали неравенства N N —^ <=" <=~ 2_^\\х((Зк) -х(ак)\\ < к=\ Тогда N V \\А{(Зк)х{13к) - А(ак)х(ак)\\ < -?— МА + -|- Мх = г,
122 Гл. 2. Аппарат теории экстремальных задач так что А(-)х(-) абсолютно непрерывна. Аналогично, если ||Ф(Ж1) - Ф(ж2)|| < К\\хх - х2\\, Vxux2 е Л, то N N если 5 > 0 выбрано так, чтобы из E) следовало F) с заменой г на г/к. ш Основную теорему этого пункта мы сформулируем только для конечномерного X, чтобы не определять операцию интегрирования в произвольном нормированном пространстве (для X = Rn доста- достаточно иметь в виду B)). Только этот случай нам в дальнейшем и понадобится. Теорема Лебега [КФ, гл. VI, §4]. Если функция х(-): А^ —> Rn абсолютно непрерывна, то она дифференцируема почти всю- всюду, ее производная х(-) интегрируема на А и для всех t, r G А имеет место равенство D). Если функция ?(•): А —> Rn интегрируема на А и г G А, то функ- t ция x(t) = ?(s) ds абсолютно непрерывна и x(t) = ?(?) почти всюду. Т В соответствии с этой теоремой мы будем в дальнейшем функцию х(-) называть решением дифференциального уравнения A), если она абсолютно непрерывна и удовлетворяет A) почти всюду. Действи- Действительно, по теореме Лебега этого достаточно, чтобы из A) следова- следовало C). Обратно, если х(-) удовлетворяет C) (т. е., в частности, t —> —> (p(t,x(t),u(t)) — интегрируемая функция), то по теореме Лебега х(-) абсолютно непрерывна и почти всюду имеет место A). В заключение этого пункта приведем еще одно утверждение, число- числовой аналог которого хорошо известен в лебеговской теории интегриро- интегрирования, и доказательство которого предоставляется читателю в качестве упражнения. Предложение 2. Измеримая функция х(-): А —> Rn интегри- интегрируема тогда и только тогда, когда \х{-)\ интегрируема. При этом x(t) dt \x(t)\dt. G) 2.1.9. Теорема Рисса об общем виде линейного функциона- функционала в пространстве С. Формула Дирихле. Определения функции ограниченной вариации и интеграла Стилтьеса мы будем предполагать известными [КФ, гл. VI, §§2 и 6]. Функцию ограниченной вариации v(-): [a,/3] ^R будем называть канонической, если она непрерывна справа во всех точках интервала (а, C) и v(a) = 0.
2.1. Предварительные сведения из функционального анализа 123 Теорема Ф.Рисса [КФ, гл. VI, § 6]. Каждому непрерывному линейному функционалу х* G С([а,/3])* соответствует канониче- каноническая функция ограниченной вариации v(-): [a, /3] —> R такая, что для всех х(-) е С([а,C}) Р \ A) и такое представление единственно: если для всех х(-) ? С([а,/3]) и для канонической v(-) Р x(t)dv(t) = 0, то v(t) = 0. Эта теорема легко обобщается на векторный случай. Пусть в\ = = A,0,... ,0), в2 = @, 1,... ,0), ... — единичные векторы стандарт- стандартного базиса в Rn. Произвольный элемент х(-) = (х\(•)>••• Дп(')) ^ G С([а, /3]), Rn) представляется в виде k=\ Если теперь ж* е C([a,/3],Rn)*, то к=\ к=\ где функционалы х^ G С([а,/3])* определяются равенствами (#?,?(•)) = (()). Применяя к ж^ теорему Рисса, получаем представление Набор функций ограниченной вариации v(-) = (v\ (•),... ,vn(-)) есте- естественно назвать векторнозначной функцией ограниченной вариации (значения — вектор-строчки) v(-): [а,/3] -^ Rn*. Тогда формула B) может быть переписана в виде \(t), C) совпадающем с A) с точностью до порядка сомножителей. Как и в тео- теореме Рисса, соответствие между х* и v(-) будет взаимнооднозначным при соблюдении условия «каноничности» функции v(-).
124 Гл. 2. Аппарат теории экстремальных задач Каждая функция ограниченной вариации v(-): [а, /3] —> R определя- определяет обобщенную меру (или «заряд» [КФ, гл. VI §5]). Интеграл Стил- тьеса A) и есть интеграл по этой мере. Аналогично векторнозначная функция ограниченной вариации v(-): [а, /3] —> Rn* определяет на [а,/3] меру с векторными значениями, интегралом по которой является C). Меру, соответствующую функции ограниченной вариации v(t), приня- принято обозначать dv(t). Если t7i(-) и v2{-) — две функции ограниченной вариации на от- отрезке [а,/3], то на квадрате [а,/3] х [а,/3] определено произведение мер dv\(-) x dv2(-) и справедлива теорема Фубини [КФ, гл. VI, §4]. В частности, имеет место известная формула для перестановки преде- пределов интегрирования («формула Дирихле»): t ч Р ,Р . f(t,s)dvl(s)\dv2(t) = [ \f(t,s)dv2(t)\dvl(s). D) При обобщении формулы D) на векторнозначные функции (а это нам далее понадобится) следует быть внимательным к порядку сомно- сомножителей. Например, если то D) следует писать так: \\\dv2{t)f{t,8)\dvx{s). E) jd«2(t)|j/(t,s)dw,(s) § 2.2. Основы дифференциального исчисления в линейных нормированных пространствах Дифференциальное исчисление — это тот раздел математическо- математического анализа, в котором изучаются локальные свойства гладких отоб- отображений. На интуитивном уровне гладкость отображения означает возможность локально аппроксимировать его подходящим аффинным отображением — дифференциалом, или, более общо, полиномиальным отображением, и получить отсюда информацию о свойствах изуча- изучаемого отображения. Наряду с выпуклым анализом дифференциаль- дифференциальное исчисление является основным аппаратом теории экстремальных задач. Основы дифференциального исчисления скалярных функций на прямой были заложены Ньютоном и Лейбницем. Задачи вариаци- вариационного исчисления потребовали распространить понятие производной и дифференциала на отображения многомерных и бесконечномерных пространств. Это было сделано Лагранжем в XVIII в. и в наше время более полно Фреше, Гато, Леви и другими математиками.
2.2. Основы дифференциального исчисления 125 2.2.1. Производная по направлению, первая вариация, про- производные Гато и Фреше, строгая дифференцируемость. Хорошо известно, что для вещественных функций одного вещественного пере- переменного два определения — существование конечного предела и возможность асимптотического разложения при h —> О F(x + h) = F(x) + F'{x)h + o(h) B) — приводят к одному и тому же понятию дифференцируемости. Для функций нескольких переменных, а тем более для функций с бес- бесконечномерной областью определения дело обстоит не так просто. Определение A) и обобщающее его определение частной производной приводят к понятиям производной по направлению, первой вариации и производной Гато. В то же время обобщение определения B) приво- приводит к производной Фреше и строгой дифференцируемости. Пусть X и Y — линейные нормированные пространства, U — окрестность точки х в X, F — отображение из U в Y. Определение 1. Предел + ХН)Р(х) лю Л в предположении, что он существует, называется производной F в точке х по направлению h и обозначается F'(x\ h) (а также у других авторов (VhF)(x), DhF(x), dhF(x)). Для вещественных функций (Y = = R) мы будем поднимать A) несколько расширенно, допуская в каче- качестве предела —оо и +оо. Определение 2. Пусть для любого h ? X существует производ- производная по направлению F'(x\h). Отображение 5+F(x;-): X —> Y, опреде- определяемое формулой 5+F(x;h) = F'(x;h), называется первой вариацией отображения F в точке х (про функцию F мы говорим в этом случае, что она имеет в точке х первую вариацию). Если 5+(x,—h) = —5+(x,h) при всех h, иначе говоря, если для любого h ? X существует предел SF(x, h) = hm — АО Л то отображение h i—> 5F(x; К) называют первой вариацией по Лагран- жу отображения F в точке х (см. п. 1.4.1). Определение 3. Пусть F имеет в точке х первую вариацию и при этом существует линейный непрерывный оператор Л ? 9В(Х, Y) такой, что 5+F(x; h) = Ah. Тогда оператор Л называется производной Гато отображения F в точке х и обозначается Fl(x).
126 Гл. 2. Аппарат теории экстремальных задач Таким образом, F^(x) — это такой элемент из S!(X,Y), что для любого h G X при Л I О выполняется соотношение F(x + АЛ) = F(x) + XF^h + o(A). D) Несмотря на внешнее сходство соотношений B) и D), между ними есть глубокое различие. Как мы увидим ниже, уже для X = R2 функ- функция, дифференцируемая по Гато, может не быть непрерывной. Дело в том, что в разложении D) о(Х) не обязана быть равномерной по h. Определение 4. Пусть в окрестности точки х отображение F можно представить в виде F(x + h) = F(x) + Л(Л) + а(Л)||Л||, E) J 0. F) Тогда отображение F(-) называют дифференцируемым по Фреше в точке х и пишут F ? Dl(x). Оператор Л называется производной Фреше (или просто производной) отображения F в точке х и обозна- обозначается F'(x). Соотношения E) и F) можно записать еще и так: F(x + h) = F(x) + F'(x)[h] + о(||Л||). G) Отсюда легко следует, что производная Фреше определена однознач- однозначно (для производной Гато это очевидно, поскольку однозначно опре- определение производных по направлению), ибо равенство \\K\h — Л2/1Ц = = о(||/г||) для операторов Л^ ? S?(X,Y), г = 1,2, возможно лишь при Ai = Л2. Наконец, на языке г — 5 E) и F) формулируются так: для любого г > 0 найдется 5 > 0, при котором для всех h таких, что \\h\\ < 5, выполняется неравенство \\F(x + h)-F(x)-Ah\\^s\\h\\. (8) Это делает естественным дальнейшее усиление. Определение 5. Отображение F называют строго дифферен- дифференцируемым в точке х (и пишут F ? SDl(x)), если существует такой оператор Л ? S?(X,Y), при котором для всякого г > 0 найдется такое 5 > 0, что для всех х\ и Х2, удовлетворяющих неравенствам \\х\ — х\\ < < 5, ||#2 ~~ ^|| < $> выполняется неравенство \\F(xi) - F(x2) - Л(Ж1 - х2)\\ < e\\xi - ж2||. (9) Полагая в (9) х2 = х и х\ = х + /г, получаем (8), так что стро- строго дифференцируемая функция дифференцируема также и по Фреше и A = F/(x). Производная Fx(x) (Гато, Фреше или строгая) по определению яв- является линейным отображением из X в Y. Значение этого отображения
2.2. Основы дифференциального исчисления 127 на векторе h ? X мы будем часто обозначать Ff(x)[h]. Для число- числовых функций одного переменного (когда X = Y = R) пространство 9В(Х, Y) = ^?(R, R) линейных непрерывных отображений из R в R естественно отождествляется с R (линейной функции у = кх сопостав- сопоставляется ее угловой коэффициент к). Именно в этом смысле в элементар- элементарном анализе производная в точке — это число (угловой коэффициент касательной), а соответствующее линейное отображение из R в R — это дифференциал dy = Ff(x)dx (здесь dx и dy — элементы одномер- одномерного векторного пространства R). Хорошо известно также, что для функций одного переменного опре- определение 3 (или совпадающее с ним в этом случае определение первой вариации по Лагранжу) и определение 4 эквивалентны (функция имеет производную в точке тогда и только тогда, когда в этой точке она имеет дифференциал) и приводят к одному и тому же понятию производной, введенному по сути дела Ньютоном и Лейбницем. Определение 2 применимо здесь к функциям, имеющим в точке х обе односторонние производные, не обязательно совпадающие. Для функций нескольких переменных A < &\тХ < оо) в элементарном анализе употребляются определение 1 (если h — единичный вектор, то C) — это обычное определение производной по направлению; если h — базисный вектор оси ОХк, то заменив в C) А | 0 на А —> 0, получим определение частной производной dF/dxk) и определение 4 (существование полного дифференциала). Обобщение понятия производной на бесконечномерные простран- пространства было стимулировано задачами вариационного исчисления. Опре- Определение первой вариации 5F(x;h), ее обозначение и название дал Лагранж. На языке функционального анализа это же определение было дано Гато, а потому первую вариацию по Лагранжу иногда называют дифференциалом Гато. Требование линейности в определении произ- производной Гато стало общепринятым после работ П. Леви. Наиболее упо- употребительно в анализе (как конечномерном, так и бесконечномерном) определение производной Фреше, однако для многих целей (в част- частности, и для наших дальнейших) существования производной Фреше в точке не хватает, надо чуть больше. Это и привело к понятию строгой дифференцируемости. Предложение 1. Между определениями 1-5 и непрерывно- непрерывностью функции имеют место следующие импликации: © Ч U непрерывность непрерывность ^ ^ r r ^ в окрестности в точке х ^ ^ точки х ни одна из которых не может быть обращена.
128 Гл. 2. Аппарат теории экстремальных задач Доказательство. Положительная часть доказательства (т.е. существование импликаций) немедленно следует из определений, а отрицательная (невозможность обращений) подтверждается набором контрпримеров, подробный разбор которых предоставляется читателю в качестве упражнения. 1) 2 не влечет 3: f\\ R —> R, f\(x) = \х\. В точке х = 0 вариация нелинейна. Тот же пример показывает, что из непрерывности в точке не следует дифференцируемости по Фреше или Гато. 2) 3 не влечет 4: /2: R2 -> R, Г 1, | 0 / \ _ Г 1, Х\ = ^2» Ж2 > О, v ь 2; | 0 в остальных точках. Этот пример показывает, что функция может быть дифференцируемой по Гато (в точке @,0)), не будучи непрерывной. 3) 4 не влечет 5: /3: R —> R, г / ч _ Г х2, х рационально, /31 ; — | о^ ж иррационально. В точке х = 0 эта функция дифференцируема (по Фреше), но не строго дифференцируема. ¦ Упражнения. 1. Покажите, что функция f\\ R2 —*> R, определяемая в полярных коорди- координатах на R2 равенством f\(x) = rcos3(/? (ж = (xi,X2) = (г cos <?, г sin <?>)), имеет в точке @,0) первую вариацию по Лагранжу, но не дифференцируема по Гато. 2. Если функция F E SDl(x), то в некоторой окрестности точки х она удовлетворяет условию Липшица. 3. Если числовая (X = Y = R) функция .F E SDl(x), то F'(x) существует почти во всех точках некоторой окрестности точки ж. Предложение 2. Если отображения Fi: U ^ Y, i = 1,2, и А: U —> i/?(y, Z), г^в Z — нормированное линейное пространство, диф- дифференцируемы в смысле одного из определений 1-5 (одного и то- того же для всех трех отображений), то: для любых щ Е R, г = 1,2, отображение F = a\F\ + ^2^2 в точке х дифференцируемо в том же смысле, причем F'(x)=alF{(x)+a2F!,(x), или Ff(x\ h) = a\F[(x\ h) + a^F^ix] h); отображение
2.2. Основы дифференциального исчисления 129 в точке х дифференцируемо в том же смысле, причем Ф'(ж; К) = А\х\ h)Fi(x) + A(x)Fl(x; К). Доказательство непосредственно получается из определе- определений. ¦ В частном случае, когда X = R и A: U —> jJ?(y,R) = У*, Ф(х) = = (A(x),Fi(x)} — числовая функция, и последнюю формулу можно переписать так: что вполне соответствует обычной формуле дифференцирования. Приведем два простейших примера вычисления производных. 1) Аффинное отображение. Отображение А: X —> У одного линейного пространства в другое называется аффинным, если суще- существует линейное отображение Л: X —> У и константа а е Y такие, что А(х) = Ах + а. Если X и У — нормированные пространства, а Л G S?(X,Y), то отоб- отображение А строго дифференцируемо в любой точке х и при этом А'(х) = Л. Это утверждение проверяется непосредственно. В частности, если А линейно (а = 0), то t4/(o;)[/i] = A(h), a производная постоянного отоб- отображения (Л = 0) равна нулю. Упражнение 1. Докажите обратное: если производная (достаточно в смысле Гато) отображения А: X —>> У существует в каждой точке х Е X и для всех х одна и та же, то А — аффинное отображение. 2) Полилинейное отображение. Пусть X и У — линей- линейные топологические пространства, а ^?П(Х,У) — линейное простран- пространство непрерывных полилинейных отображений декартова произведения Хп = X х ... х X в У. Напомним, что отображение И(х\,...,хп) на- п раз зывается полилинейным, если при каждом г отображение линейно. Если X и У нормированы, то непрерывность П равносильна ограниченности, т. е. конечности числа ||П||= sup ||П(жь...,жп)||. A0) Нал 1^1,..., |ЫК1 В этом случае QHn(X,Y) является нормированным линейным простран- пространством с нормой A0) и выполняется неравенство .||а:„||. A1) 5 В. М. Алексеев и др.
130 Гл. 2. Аппарат теории экстремальных задач Функция Qn(x) = U(x,... ,х) называется формой степени п (при п = 2 квадратичной, при п = 3 — тернарной), отвечающей полилиней- полилинейному отображению П. Из определений вытекает, что n(x + ft) = Qn(x) + , ft, A2) г=1 а потому Qn(-) дифференцируема по Фреше в каждой точке х и A3) г=1 (в обеих формулах A2) и A3) в г-м члене суммы аргумент ft стоит на г-м месте, а остальные аргументы равны х). Если отображение П симметрично, т.е. И(х\,... ,хп) не меняется при любой перестановке аргументов Xi, то A3) превращается в Q'n(x)[h] = nU(h,x,... ,х). В частности, если X — вещественное гильбертово простран- пространство со скалярным произведением (• | •), А е 9?(Х,Х) и П(х\,Х2) = = (Ах\ | Х2), то Q2(x) = (Ах | х) — квадратичная форма оператора А — дифференцируема и Q'2(x)[h] = (Ах | К) + (Ah \ х) = (Ах + А*х \ ft), так что Q'2(x) естественно отождествляется = x/i(x I x) 1/2|1ж1|2 Ах -\- А*х. с вектором Например, для Q^(x) = x/i(x I x) — 1/2|1ж1|2 производная Упражнение 2. Докажите, что Qn(^) = П(ж,... ,ж), где П ? строго дифференцируема при всех х. Более сложный пример доставляет Предложение 3. Пусть U С 9В(Х,Y) — множество непрерыв- непрерывных линейных операторов А: X —> Y, для которых существует обратный оператор А~х е 9S(Y,X). Если хотя бы одно из про- пространств X или Y банахово, то U открыто и функция Ф(А) = = А~х дифференцируема по Фреше в любой точке А е U, причем Ф'(А)[Н] = -А~1НА-1. Доказательство. Если пространство X банахово, то ряд k сходится в 9В(Х,Х) при ||Я|| < ЦА" и, как нетрудно k=Q проверить непосредственно, (А + Н) СЮ в k=Q Г-1 СЮ X—V /с=0 \/с 7-1 Н)=1Х.
2.2. Основы дифференциального исчисления 131 Следовательно, (А + Я) = 22(-А~1Н)кА-1 A4) при ||Я|| < ||А~хЦ, так что В(А, \\А~1\\~1) с U и U открыто. Если пространство Y банахово, то A4) следует заменить на к=0 Далее, из A4) имеем Я) -А~х + АГХНАГХ\\ = Z-^y -=o(\\H\\) ~2 [ ~ \\Л~1\\ \\П\\ при Я —> О, а следовательно, функция Ф(А) = А~х дифференцируема и ее производная Фреше Ф'(А)[-] = — А~х(-)А~х.ш Упражнение 3. Докажите, что Ф(А) строго дифференцируема в любой точке A G U. 2.2.2. Теорема о суперпозиции дифференцируемых отображе- отображений. Теорема о суперпозиции. Пусть X, Y, Z — норми- нормированные пространства] U — окрестность точки х в X, V — окрестность точки у в Y; (p: U —> V, (р(х) = у; ф: V —> Z; f = ф о ср: U —> Z — суперпозиция отображений (риф. Если ф дифференцируема по Фреше в точке у, а (р в точке х дифференцируема по Фреше (дифференцируема по Гато, имеет первую вариацию или имеет производную по направлению К), то f обладает в точке х тем же свойством, что и (р, и при этом или ^ ^ ^ Если ф строго дифференцируема в у, а (р строго дифференциру- дифференцируема в х, то f строго дифференцируема в х. Доказательство. Рассмотрим подробно два крайних случая — производную по направлению и строгую дифференцируемость. А) По определению производной Фреше ф(у) = ф(у) + ф'(у)\у — у\ + а(у)\\у — Ш, где _ lim^a(y) = а(у) = 0. 5*
132 Гл. 2. Аппарат теории экстремальных задач Если существует ^ h) = Ит Ф+^)Ф) = Ит Л|о Л л|0 Л|о Л л|0 Л то Ит f@+\h)-f(x) = Ит ф(ф + Xh)) - ф(у) = л|0 Л л|0 Л л|0 Л (р(х + Xh) — у lim ^Х ^ 1 +Пта(^(ж + АЛ))Пт Л что и доказывает B). Б) Обозначим для краткости А\ = (р'(х), А^ = фг(у). По определе- определению строгой дифференцируемости для любых е\ > О, е^ > 0 найдутся такие 5\ > О, §2 > 0, что \\х\ — х\\ < 5ь ||ж2 ~~ 2"|| < ^i ^ ||^(xi) — ip(x2) — А\(х\ — х2)\\ ^ ^ ?\ \\Х\ — Х2\\, C) \\У\ - У\\ < *2, ||2/2 - ?|| < ^2 => ||^B/1) - ^B/2) - А2(у\ - у2)\\ < ^ ?21|2/1 ~~ 2/21|- D) Для любого ? > 0 подберем si > 0 и ?2 > 0 так, чтобы выполнялось неравенство по этим е\, 82 найдем 5\ > 0, 52 > 0 так, чтобы имели место соотноше- соотношения C) и D), и наконец положим S = mm <5i, —-— Если теперь ||xi — х\\ < 5 и ||ж2 — х\\ < 5, то в силу C) Ai(xi - х2)\\ + ||Ai(^i - ж2)|| < -х2\\ + \\А{\\ \\х{ -х2\\ = (||Ai|| +?i)||a;i -х2\\. E) Полагая в этом неравенстве поочередно х\ = х и х% = ж, получаем
2.2. Основы дифференциального исчисления 133 так что для yi = (p(xi) справедливо D). Используя теперь D), C) и E), получаем \\f(xi)-f(x2)-A2Al(xi-X2)\\< < \\ф(фх)) - ф(ф2)) ~ А2(ф{) - ф2))\\ + + \\А2(ф1) - ф2)) - А2Ах(хх - х2)\\ < - ф2)\\ + \\А2\\ \\фх - ф2) - Ах(хх - х2)\\ < ^е2(\\Ах\\+ех)\\хх -Ж2|| + ||А2||е1||ж1-Ж2|| = +ехе2 + \\А2\\ех)\\хх-х2\\ ^ е\\хх - х2\\, что и означает строгую дифференцируемость / в точке х. Полагая в этих рассуждениях х2 = х, хх = х + h, мы получим доказательство теоремы для случая дифференцируемости ср по Фреше. Остальные утверждения получаются анализом уже доказанного равен- равенства B). ¦ Следующий контрпример показывает, что теорема о суперпозиции не имеет, вообще говоря, места, если ф дифференцируема лишь по Гато. Пример. Пусть X = Y = R2, Z = R; ф) = ((рх(хх,х2),(р2(хх,х2)) = (х2х,х2); 11 \ 11 \ Г 1 при у\ = у%, у2 > О, rwj rwv>v*) i q B остальных случаях (ср. с контрпримером в доказательстве предложения 1 п. 2.2.1). Здесь (р дифференцируема по Фреше в точке @,0) и даже строго (проверьте!), ф дифференцируема по Гато в @,0), однако функция ?( \ // \/ \ i/2 \ Г 1 f(x) = (ф о (л)(х) = ф(хихо) = < п При Ж2 = 1^1 I > 0, в остальных случаях не дифференцируема по Гато в @,0) (и даже не имеет в этой точке производных по направлениям h = A, 1) и h = (— 1, 1)). Следствие. Пусть X и Y — нормированные пространства, U — окрестность точки у в Y, f: U ^ R дифференцируема по Фре- Фреше в точке у и Л е Я?(Х, Y). Тогда f о Л: A~l(U) —> R дифференци- дифференцируема по Фреше в точке х = Л~1 (у) и (/оЛ)'(х) = Л*(/'оЛ)(х). F) Доказательство. В соответствии с определениями (/' о А)(х) = f'(Ax) = f {у) 6 ЩУ, R) = Y* (/ о К)\х) = f'(Ax) о Л = f'(y) о Л е ?(Х, R) = X*.
134 Гл. 2. Аппарат теории экстремальных задач Теперь имеем для любого h ? X <Л*(/'оЛ)(ЗД = ((/'оЛ)(х),ЛЛ) = = (f (у) о Л)Л = (f (у) о Л, h) = ((/ о Л)'(ЗД, чем доказано F). 2.2.3. Теорема о среднем и ее следствия. Хорошо известно, что для числовых функций одного переменного справедлива теорема Лагранжа, называемая также теоремой о среднем значении или формулой конечных приращений: если функция f: [а, Ъ] —> R непрерывна на отрезке [а, Ъ] и дифференцируема в интер- интервале (а, Ъ), то существует точка с G (а, Ъ) такая, что f(b)-f(a) = f(c)(b-a). A) Нетрудно убедиться также в том, что формула A) остается справед- справедливой и для числовых функций f(x), аргумент которых принадлежит произвольному линейному топологическому пространству. В этом случае [а, Ъ] = {х | х = а + t(b - а), 0 < t < 1}, аналогично определяется интервал (a, b), a дифференцируемость можно понимать в смысле Гато. Полагая мы сводим доказательство к случаю одного вещественного переменно- переменного. Совсем не так обстоит дело для векторнозначных функций. Пример. Пусть отображение /: R —> R2 определяется равенством /(?) = (sint, — cost). Тогда для каждого t существует (строгая) произ- производная Фреше /'(?) (докажите!): ff(t)[a] = (cost, sint)a = (acost,asint). В то же время для любого с /Bтг) - /@) = 0 ф /х(с)[27г - 0] = B7TCOSC, 27rsinc), так что формула A) не имеет места. Можно заметить, однако, что сама формула A) используется в ана- анализе много реже, чем вытекающая из нее оценка \f(b) — f(a)\ ^ М\Ъ — — а\, где М = sup \f'(x)\. Мы покажем сейчас, что в этом более слабом виде утверждение распространяется уже на случай произвольных нор- нормированных пространств. По традиции оно сохраняет название «теоре- «теорема о среднем», хотя, конечно, должно было бы именоваться «теоремой об оценке конечного приращения». Теорема о среднем. Пусть X и Y — нормированные ли- линейные пространства и открытое множество U С X содержит отрезок [а,Ь].
2.2. Основы дифференциального исчисления 135 Если функция f: U —> Y дифференцируема по Гато в каждой точке х ? [а, Ь], то ||/F)-/(а)К sup ||/'(с)||||Ь-а||. B) се[а,Ь] Доказательство. Возьмем произвольно у* ? У* и рассмотрим функцию В каждой точке отрезка [0, 1] эта функция имеет лево- и правосторон- правостороннюю производные: aj.0 -a * f(a+(t-a)(b-a))-f(a оцо \ —а ', lim и аналогично Ф'+(г) = ШФ{* + а)а~т =(y\f(a + t(b-a))[b-a]}. Так как эти производные совпадают, то Ф(^) дифференцируема (в обычном смысле) на [0, 1], а потому и непрерывна на том же отрезке. По формуле Лагранжа существует такое в ? @, 1), что {у*, № - Да)} = ФA) - Ф@) = Ф'@) = (у*, f (а + в(Ь - а))[Ь - а}). Воспользуемся теперь следствием 1 из теоремы Хана-Банаха (п. 2.1.3), согласно которому для любого элемента у ? У найдется ли- линейный функционал у* е У* такой, что \\у*\\ = 1 и (у*, у) = \\y\\. Выбрав именно так функционал у* для элемента у = f(b) — /(а), получаем ^\\y*\\\\f'(a + e(b-a))\\\\b-a\\^ sup ||/'(c)|| ||b - а\\, с€[а,Ь] что и требовалось доказать. ¦ Приведем несколько следствий из теоремы о среднем. Следствие 1. Пусть выполнены все условия теоремы о среднем uAe?(X,Y). Тогда - /(а) - А(Ь - а)|К sup ||/'(с) - Л|| \\Ъ - а\\. C) с€[а,6]
136 Гл. 2. Аппарат теории экстремальных задач Доказательство. Применим теорему о среднем к отображению g(x) = f(x) - Кх.ш Следствие 2. Пусть X uY — нормированные пространства, U — окрестность точки х в X и отображение f: U —> Y диф- дифференцируемо по Гато в каждой точке х Е U. Если отображение х \-^ /f(#) непрерывно (в равномерной операторной топологии про- пространства ??(X,Y)) в точке х, то отображение f строго диф- дифференцируемо в х (а следовательно, и дифференцируемо по Фреше в той же точке). Доказательство. По заданному г > О найдем 5 > О так, чтобы выполнялось соотношение \\x-x\\<6^\\ft(x)-ft(x)\\<e. D) Если \\х\ — х\\ < 5 и \\х2 — х\\ < 5, то для любого х = х\ + t(x2 — х\) е е [xi,x2], 0< t < 1, и \\х -х\\ = \\Х\ +t(x2 - Х\) - х\\ = \\t(x2 - Х) + A -t)(x\ -x)\\ < < t\\x2 - х\\ + A - t)\\xx -x\\<t5 + {\-tM = 5, так что в силу D) ||/f(#) — f'{x)\\ < г. Применяя следствие 1 для Л = /f(a?)> получаем sup \\&(х)-&(х)\\\\х1-х2\\^е\\х1-х2\\, что и означает строгую дифференцируемость / в х. ш Определение. Пусть X и Y — нормированные пространства. Отображение F: U —> Y, определенное на некотором открытом под- подмножестве U С X, принадлежит классу С1 (С/), если в каждой точке х G U оно имеет производную и отображение х i—> F'(x) непрерывно (в равномерной операторной топологии). Следствие 2 показывает нам, что здесь можно не оговаривать, какая производная имеется в виду. Этим замечанием постоянно пользуются при проверке дифференцируемости конкретных функционалов: доказы- доказывается существование производной Гато и проверяется ее непрерыв- непрерывность, а это уже гарантирует строгую дифференцируемость (и, значит, существование производной Фреше). Упражнения. Пусть в условиях теоремы о среднем Y = Rn и отобра- отображение х —»> fr(x) непрерывно в U С X. Тогда a]. E) 2) Существует оператор Л ? $(X,Y), принадлежащий замкнутой выпук- выпуклой оболочке (см. п. 2.6.2) множества {fr(x),x E [а,Ь]} и такой, что f(b)-f(a) = A(b-a).
2.2. Основы дифференциального исчисления 137 3) Обобщите 1) и 2) на случай произвольного банахова пространства Y, определив подходящим образом интеграл в E). 2.2.4. Дифференцирование в произведении пространств. Част- Частные производные. Теорема о полном дифференциале. В этом пункте X, Y, Z — нормированные пространства. Рассмотрим сначала случай отображения, значения которого лежат в произведении Y x Z, F:U^YxZ,UcX. Поскольку точкой Y x Z является пара (у, z), отображение F также состоит из двух компонент: F(x) = (G(x),H(x)), где G: U —> У, Я: U —> Z. Непосредственно из определений выводится следующее Предложение 1. Пусть X, Y, Z — нормированные простран- пространства, U — окрестность точки х в X, G: U —> Y, H: U —> Z. Для того чтобы отображение F = (G, Я): U -^Y x Z было диф- дифференцируемо в точке х в смысле одного из определений 1-5 п. 2.2.1, необходимо и достаточно, чтобы этим же свойством обладали G и Я. При этом ^ ^ ^ или Т?Г(С; и\ _ (Q41f h) /7'(г h)) J- \ JU ^ / v J V v_T I Ju у I v J у -L -L \ JU } I v J J • Перейдем теперь к случаю, когда область определения отображения F: U —> Z лежит в произведении пространств U С X х Y. Определение. Пусть X, Y, Z — нормированные пространства, U — окрестность точки (х, у) в X х Y, F: U -^ Z. Если отображение х \-^ F(x, у) дифференцируемо в точке х (по Гато, по Фреше или строго), то его производная называется частной производной по х отображения F в точке (х, у) и обозначается Fx(x, у) dF _ _ или -j— (х, у). Аналогично определяется частная производная по у dF уух>у) ~ ду ух>у)' Теорема о полном дифференциале. Пусть X, Y и Z — нормированные пространства, U — окрестность в X х Y, F: U —> —> Z — отображение, имеющее в каждой точке (х, у) G U частные производные Fx(x,y) и Fy(x,y) в смысле Гато. Если отображения (х, у) i—> Fx(x, у) и (х, у) i—> Fy(x, у) непрерывны в точке (х, у) G U в равномерной операторной топологии, то F строго дифференцируема в той же точке и при этом Ff(x, у)[?, г]} = Fx(x, у)? + Fy(x, y)rj. Доказательство. Задавшись произвольным г > 0, выберем 5 > > 0 столь малым, чтобы «прямоугольная» окрестность V = В(х, 5) х В(у, 5) = {(х, у) | \\х - х\\ < S, \\у - у\\ < 6}
138 Гл. 2. Аппарат теории экстремальных задач точки (х, у) содержалась в С/, и в ней выполнялись неравенства \\Fx(x,y)-Fx(x,y)\\<s, \\Fy(x,y)-Fy(x,y)\\<s. A) Теперь имеем A = F(xuy\) -F(x2,y2) -Fx(x,y)(xi - х2) - Fy(x,y)(yi - у2) = = [F(xuyi) - F(x2,yi) - Fx(x,y)(xx -x2)] + + [F(x2,2/i) - F(x2,2/2) - Fy(x, y)(yi - y2)]. Легко видеть, что если точки (х\,у\), (х2,у2) лежат в V, то и (х2,у\) ? ? V и, более того, оба отрезка [(x\,yi),(x2,yi)] и [(х2,у\),(х2,у2)] содержатся в V С U. Поэтому функции х \-^ F(x,y\) и |/и F(x2,y) дифференцируемы по Гато: первая имеет производную Fx на [жь^], вторая Fy на [2/1,2/2]- Применяя теорему о среднем к этим функциям (в форме неравенства C) п. 2.2.3 с соответствующими Л), получаем в силу A) sup ^^ [2/i ,2/2] -х2\\ +е\\ух - Следствие. Для того чтобы F ? С1 (U), необходимо и доста- достаточно, чтобы в U частные производные Fx и Fy были непрерывны. Как предложение 1, так и теорема о полном дифференциале без труда обобщаются на случай произведения любого конечного числа пространств. Остановимся еще на конечномерном случае. Пусть F: U —> Rm определена на открытом множестве U С Rn. Поскольку естественным образом Rm = Rx ... xR, Rn = Rx ... xR, m раз п раз можно воспользоваться как предложением 1, так и теоремой о полном дифференциале. Если F(x) = \Fm(x)J \Fm(Xi,...,xn) \hn
2.2. Основы дифференциального исчисления 139 то F[{x) F'(x)\h] = dF2 (x)hj \ j=i v ' ¦¦¦ дхп v ' _ 8Fm (x) ... -—(x) = fx (x).k. B) \ Матрица порядка m x n дх w " называется матрицей Якоби отображения F в точке х. Легко видеть, что это есть не что иное, как матрица линейного оператора F'(x)\ Rn -^ Rm, отвечающая стандартным базисам в Rn и Rm. В классическом анализе обычно обозначают = dx = dx\ dxri и формула B) имеет вид ^dF Доказанное в этом пункте утверждение является обобщением хоро- хорошо известной теоремы о том, что существование непрерывных част- частных производных является достаточным условием дифференцируемо- сти функции нескольких переменных. 2.2.5. Производные высших порядков. Формула Тейлора. В этом пункте X и Y — нормированные пространства, U — открытое подмножество в X. Дифференцируемость всюду понимается в смысле Фреше. Если отображение f:U^Y дифференцируемо в каждой точке х е U, то определено отображение f'(x): U —> 3}(X,Y). Поскольку
140 Гл. 2. Аппарат теории экстремальных задач 9В(Х, Y) также является нормированным пространством, можно ста- ставить вопрос о существовании второй производной По индукции определяются производные высших порядков: если в U уже определена f(yU~x\x), то () (D , Y) ...)• п раз Определение 1. Пусть /: С/—> У. Будем говорить, что f^ существует в точке х G U, если в некоторой окрестности этой точки существуют f\x), f"(x), ..., f(yU~x\x) и существует f(n\x). Если f(n\x) существует в каждой точке х G U и отображение х ь-> —> f(n\x) непрерывно в равномерной (порожденной нормой) тополо- топологии пространства Я!(Х,... ,3?(X,Y)...), то / называется отображением класса Cn(U). В дальнейшем нам понадобятся некоторые свойства полилинейных непрерывных отображений (см. пример 2 в п. 2.2.1). Предложение 1. Нормированные пространства 9Еп(Х, ж, (А,У)) и У? \X,Y) изометрично изоморфны. Доказательство. Если тг G $п(Х,$т(Х, У)), то п(х\,..., хп) G G it (a , Y) и равенство П(Ж1, ... , Хп, Хп+\, ... , Хп+т) = 7Г(Ж1, ... , Хп) [хп+\, ... , Жп+т] ( 1) определяет полилинейное отображение П пространства хп+т = = X х ... х X в У. Обратно, всякое такое отображение П определяет п+ттг раз при помощи равенства A) полилинейное отображение тг пространства Хп = Ix...xl в пространство полилинейных отображений Хт п раз в У. Остается заметить, что ||П|| = sup ||П(жь...,а;п+т)|| = = SUp SUp = sup Следствие 1. 3?(X,3?(X,...,S!(X,Y) ...)) изометрично изо- n раз
2.2. Основы дифференциального исчисления 141 Таким образом, можно считать, что f(n\x) G 9?n(X,Y). Значение этого полилинейного отображения на векторах (?i,...,?n) будем обо- обозначать f(n\x)[t;i, ... ,?п]- В соответствии с индуктивным определением - lim ¦f(a;Q + Q^2' -¦ '^ /(}(^о)[6, - ,Ц B) Для произвольного П G ^?П(Х,У) и произвольного набора различ- различных индексов (гь ..., г&), каждый из которых принимает одно из значе- значений 1, 2, ..., п, обозначим Xij —ill ,1—1,Z,... ,K, хг=х,гфч,-Лк' Предложение 2. Если П е 2?n(X,Y) и Q(x) = Щх, ...,х), то г=1 п п r(x)[hi,h2] = 1={U C) =0 при /c>n (в формуле для Q^ суммирование производится по всем перестанов- перестановкам индексов). Доказательство этих формул получается непосредственной вы- выкладкой (ср. также пример в п. 2.2.1). Заметим, что из C) вид- видно, что каждая производная Q^ является симметрической функцией от (h\,...,hi). Ниже мы увидим, что это не случайно. Предложение 3. Если отображение П е $n(X,Y) симметрич- симметрично и Q(x) = Щх,...,х) =0, то П = 0. Доказательство. Положим <p(t\,...,tn) = Q(t\x\ _ V^ tix t?...t%>Nai_ann(xu..j,xi;...,xn,.::,xn),
142 Гл. 2. Аппарат теории экстремальных задач где в Е^ собраны члены, у которых среди индексов i\, ..., гп равны единице а\ штук, ..., равны п — ап штук, a NaXmOLn — число членов в этой сумме (в последнем переходе мы воспользовались симметрией Щ. По условию ip(t\,..., tn) = О, поэтому равны нулю все коэффи- коэффициенты этого многочлена. В частности, равен нулю и коэффициент п\Щх\,... ,хп) при t\t2...tn.m Теорема о смешанных производных. Если для функции f: U —> Y существует вторая производная f"(x), то для всех ?, г] G Доказательство. По определению второй производной f'(x) - f'(x) = (ГУ(Щх -х]+ а(х)\\х - х\\, где а(х) е <?(Х, Y) и lim а(х) = а(х) = 0. D) При достаточно малых г] и х, близких к х, функция ip(x) = f(x + rj)-f(x) определена и <р'(х) = f(x + V) - f(x) = f(x + V) - f(x) - (f(x) - f'(x)) = = (f')'(x)[x + г] — х] + а(х + г))\\х + г] — х\\ — - (f'Y(x)[x -х\- а(х)\\х - х\\ = В частности, E) и потому <р'(х) ~^(х) = а(х + г])\\х - х + г]\\ -а(х)\\х-х\\ - а(х+ г))\\г)\\. F) В силу D) для любого г > 0 найдется такое 5 > 0, что \\х -х\\ <5 => \\а(х)\\ < г, G) откуда ввиду F) \\х - х\\ < 5/2, \\n\\ < 5/2 => \\<р'(х) - <р'(х)\\ < 2е(\\х - х\\ + ||г/||). (8) При достаточно малых ? и г] вторая разность = f(x + С + V) - Я* + 0- f@ + V)+ f@) (9)
2.2. Основы дифференциального исчисления 143 имеет смысл и, используя E), G) и (8), мы получаем при ||?|| < 5/2, \Ы < S/2 sup Заменяя ? и ту на ??, try, где теперь ? и г/ могут быть любыми фиксированными, а ? G R должно быть мало, мы получаем неравенство Меняя местами в проведенных выше рассуждениях ? и г/, мы полу- получаем наряду с A0) неравенство \\A(tt,tr,)-t2f"(x№v]\\ < 3et2(||e|| + |М|)Ы|. A1) Но A(trj,t?) = A(t?,trj), поскольку вторая разность (9) симметрична относительно ? и г/ и из A0) и A1) вытекает по сокращении на t2 неравенство Ввиду произвольности г это приводит к C).и Название, которое мы дали этой теореме, связано с тем, что в классическом анализе ей соответствует теорема о независимости 2 смешанной производной от порядка дифференцирования: ох оу (почему?). дудх Следствие 2. Производная f^(x) (если существует) являет- является симметрической полилинейной функцией. Доказательство. При п = 2 это утверждение только что дока- доказанной теоремы. Далее рассуждаем по индукции, используя равенства Воспользовавшись индукционной гипотезой, получаем из левого ра- равенства инвариантность f(n\x)[{;, r}\,..., т}п-\] относительно переста- перестановки аргументов щ, а из теоремы 1 и правого равенства следует инвариантность относительно транспозиции ? и щ. Для доказательства симметричности f^ix) этого достаточно. ¦
144 Гл. 2. Аппарат теории экстремальных задач Переходя от симметрической полилинейной функции к соответству- соответствующей ей форме (см. пример в 2.2.1), мы получаем из производной дифференциал. Определение 2. Пример. Если Q(x) = П(х,... ,х), где П е ??n(X,Y), то, согласно предложению 2, dkQ(O; К) = О при к ф и dnQ(O;h) = k\Q(h). Лемма. Если f(n\x) существует и f(x) = 0, fix) = = 0,...,fn\x) =0, то Го ||Л||~ Доказательство. При и = 1 утверждение верно по определению производной. Далее рассуждаем по индукции. Пусть и > 1. Положим g(x) = f'(x). Тогда д(х) =0, ..., д(п~1\х) = 0, и по индукционной гипотезе для всякого г > 0 найдется такое 5 > 0, что \\д(х + Ы)\\ < еЦЫГ-1 при \\Ы\\<6. Теперь по теореме о среднем при \\h\\ < 5 имеем < sup \\Пх + Ы)-Г(х)\\\\Ц = hie[o,h] = sup \\д(х + Ы)\\\\Щ^ sup erll/^ll^-Ml^ll = вг||Л||^. - hie[0,h] hie[O,h] Теорема о формуле Тейлора. Если fn(x) существует, то 1 п! где f(x + h) = f(x) + df(x; h) + ... + - dnf(x; h) + an lim an(ft) = an@) = 0. Доказательство. Рассмотрим функцию = Пх + 0 - f{x) - df(x; О - ... - - dnf(x; 0. 77/1 Воспользовавшись приведенным выше примером и равенством dkf{x;i) = /W(ж)[?,...,?], f(k)(x) e ?k(X,Y), получаем dkg(O;h) = = dkf(x;h)-^(k\dkf(x;h))=O.
2.2. Основы дифференциального исчисления 145 Применяя следствие 1, согласно которому д(к\0) — симметрическая функция из 9В (X,Y), и предложение 3, согласно которому симмет- симметрическая функция обращается в нуль, коль скоро обращается в нуль соответствующая ей форма, мы заключаем, что д@) = О, ..., д(п\0) = = 0. По лемме ||#(?)|| = °A1^1|п)' и утверждение теоремы доказано, причем an(h) = —-— при h ^ 0. ¦ Упражнение. Если f^n\x) существует в звездной окрестности точки х, то 1) 2) h)-f(x)-df(x;h) - ... - (п-1)! sup ||/(n)(c) c?[x,x + h] f(x + h)-f(x)- df(x; h)-...--dnf(x,h) п\ < sup \\fK'4(c)-f^\x)\\^-. c?[x,x+h] n- Указание. Один из возможных путей решения: при п > 1 производная f\x) непрерывна в окрестности точки х, и можно воспользоваться равенством 1 f(x + h) - f(x) = J f(x0 + th) dt[h] (см. упражнение в п. 2.2.3). Неравенства этой задачи являются обобщениями классической фор- формулы Тейлора с остаточным членом в форме Лагранжа, в то время как теорема дает нам ту же формулу с остаточным членом в форме Пеано. Доказательство существования старших производных в смысле Фреше у конкретных отображений зачастую сопряжено с громоздкими выкладками. В то же время вычисление производных, а точнее, диф- дифференциалов, т. е. соответствующих однородных форм, обычно можно произвести сравнительно легко. Чаще всего это делается с помощью понятия вариации по Лагранжу. Определение 3. Функция / = U —> Y в некоторой точке х ? U имеет п-ю вариацию по Лагранжу, если для любого h ? X функция (p(ot) = f(x + oih) дифференцируема в точке а = 0 до порядка п вклю- включительно. При этом n-й вариацией / в точке называется отображение h I—> 5nf(x; h), определяемое равенством T1If(x + ah) aa A2) Q=o
146 Гл. 2. Аппарат теории экстремальных задач Следствие 3. Если существует f^(х), то f имеет п-ю вари- вариацию по Лагранжу в точке х, причем 5nf(x;h) = dnf(x;h) = f{n)(x)[h,...,h}. A3) Доказательство легко получается по индукции из формулы Тейлора, так как, согласно последней, f(x + ah) = f{x) + ^ df(x; h) + ... + °^ dnf{x; h) + o(an). Таким образом, если мы заранее уверены в существовании про- производной f(n\x), то вычислить dnf(x;h) можно, пользуясь формула- формулами A2) и A3) на основе дифференциального исчисления для функций скалярного аргумента, что, конечно, много проще. Согласно предложе- предложению 3 дифференциалом dnf(x;h) производная f(n\x) (т. е. полилиней- полилинейная функция) однозначно определяется. Обратное, конечно, неверно: функция может иметь n-ю вариацию, не имея производной Фреше /(п). Читателю предоставляется самостоятельно выяснить, какими до- дополнительными свойствами должна обладать n-я вариация, чтобы был верен аналог достаточного условия дифференцируемости (следствие 2 п. 2.2.3). § 2.3. Теорема о неявной функции Доказываемое в этом параграфе обобщение классической теоремы о неявной функции может быть с успехом применено в различных разделах анализа. В дальнейшем мы будем иметь возможность в этом убедиться. 2.3.1. Формулировка теоремы о существовании неявной функ- функции. Пусть X — топологическое пространство, Y и Z — банаховы пространства, W — окрестность точки (хо,уо) в X х Y, Ф — отображение из W в Z, Ф(жо,^о) — zo- Если: 1) отображение х \-^ ^(х,уо) непрерывно в точке хо; 2) существует линейный непрерывный оператор Л: Y —> Z та- такой, что для любого г > 0 найдутся число 5 > 0 и окрестность S точки хо, обладающие тем свойством, что из условия х G S и неравенств \\yf — уо\\ < 5, \\уП — у$\\ < 5 следует неравенство 3) ЛУ = Z, то найдутся число К > 0, окрестность °И точки (#o,zo) в и отображение (р: °Ы —> Y такие, что: а) ^(x,(p(x,z)) = z\ б) \\ф,г) - уъ\\^
2.3. Теорема о неявной функции 147 2.3.2. Модифицированный принцип сжимающих отображе- отображений. Лемма. Пусть Т — топологическое пространство, Y — бана- банахово пространство, V — окрестность точки (to,yo) в Т х Y, Ф — отображение из V в Y. Тогда, если существует окрестность U точки to в Т, число C > О и число в, О < в < I, такие, что из t G U, \\y-yo\\ < /3 следует: а) (*,Ф(^))е7; б) \\Ф(Ь,Ф(г,у)) -Ф(Ь,у)\\ ^в\\Ф(Ь,у) -у\\; в) ||Ф(*,г/о)-2/о||</?A-0), то последовательность {yn(t) \ n ^ 0}, рекуррентно определяемая равенствами yo(t) = 2/о, yn(t) = $(t,yn-i(t)), о при любом t e U содержится в шаре В(уо,/3) = {у | \\у — уо\\ < /3} и равномерно по t ? U сходится к отображению 11—> (p(t), причем Доказательство. Доказываем лемму по индукции. Пусть t — некоторый элемент из U. Обозначим через Гп утверждение: «элемент о yk(t) определен для 0 ^ к ^ п и принадлежит В(уо,/3)». Вследствие о того, что yo(t) = уо ? В(уо,/3), утверждение Го верно. Пусть Гп верно. Тогда для 1 ^ к ^ п имеем \\yk+i(t) - Vk(t)\\ Hf ||Ф(*^(*)) Ф(*г(*))|| d =f O\\yk(t) - yk-i(t)\\. Отсюда, продолжая проведенное рассуждение, получим yk-x{t) - s/fc_2(*)ll Пусть теперь fc^l, fc + /^n+l; тогда вследствие неравенства треугольника \\yk+l{t)-yk(t)\\ = yk+i(t) - yk(t)\\ < yo\
148 Гл. 2. Аппарат теории экстремальных задач В частности, полагая в A) k + 1 = п+ \, к = 1, и используя условие в), получаем \\yn+l(t) — г/о 11 = ||l/n+i(t) - yx{i) + y\{t) - yolK < \\Vn+№ - г/iWII + Il2/i(*) - yoll < 0/9 + /?(i - 6») = p. Значит, Fn+i верно, откуда по индукции утверждение верно для всех п. Но тогда из A) получаем \\yk+l(t)-yk(t)\\ < -^-в ||Ф(*,гл)) -г/о11. vz, л ^ 1. B) Из B) следует, что последовательность {yk{t) \ к ^ 0} фундаментальна и вследствие полноты У сходится к некоторому элементу, который мы обозначим (p(t). Переходя в B) к пределу при / —> оо, получаем, ЧТ° вк - Vk(t)\\ < т^ ЦФ(*.уо) - уо\\ < окC. C) Из C) следует, что отображение 11-^ yk(t), t GU, равномерно сходится к отображению t н^ f(t). Наконец, положив в C) к = 1, получим - Уо\\ = \\Ф) - V\(t) + 2/1 (t) - уо\\ < + мш -уо\\ = 2.3.3. Доказательство теоремы. Доказательство сформулирован- сформулированной в п. 2.3.1 теоремы разбиваем на несколько пунктов. А) По условию теоремы Л есть эпиморфизм из Y в Z. Значит, по лемме о правом обратном отображении (п. 2.1.5) существует отоб- отображение М: Z —> Y такое, что (ЛоМ)(г) = г, A) KC||*|| B) для некоторого С > 0. Положим Т = X х Z и проверим применимость леммы п. 2.3.2 для отображения Ф(?, у) = Ф(х, z,y) = y + M(z - Ф(ж, у)). Б) Задав 9, 0<9<1иг = в /С, где С — константа из B), найдем окрестность Si точки xq и число /Зо > 0 так, чтобы из неравенств \\уг — — 2/о|| < Аь Из/" — 2/о|| < А) следовало (в соответствии с условием 2) теоремы) неравенство (при xGSi) ||Ф(х, у') - Ф(х, у") - А(у' - у")\\ < е\\у> - у"\\. C) О Обозначим V = Si x Z х В(уо,/3о). В) Пусть /3 = А)/(С||Л|| + 2). Используя непрерывность функции (x,z) \-^> Ф(ж, ?/о) — ^ в точке (жо,^о) (см. условие 1) теоремы), выберем
2.3. Теорема о неявной функции 149 окрестность S2 С Si точки xq и 7 > 0 так, чтобы из (х, z) Е °Ы = S2 x о х Б(^0,т) следовало неравенство \\Щх,Ш)-г\\<(Ц\-6)/С. D) Г) Если (x,z) е °U и у 6 B(yo,l3), то ||Ф(х, z,у) - Ы| =f НУ -Уо + Щг - Щх, у))\\ 2 - Ф(ж, уо) - Ф(ж, у) + Ф(аг, у0) - А(у - уо)\\} < \\у - уо\\ + C{\\z - Щх, \\Щх, у) - Щх,т) - А(у - уо)\\ + \\А(у - I1} < \\У — Z/o11 -Ь C{\\z - Щх,уо)\\ + 4У - Уо\\ + ||А|| \\у - уо\\} < < A + в + С\\А\\)\\у - уо\\ + C\\z - Щх, уо)\\ E) (ибо гС = в[). Из E) в силу D) получаем, во-первых, что \\Ф(х,г,у)-уо\\ < < A + в + С||Л||)/3 + СР^~е) = B + С||Л||)/3 = /30. E') Значит, выполнено условие а) леммы п. 2.3.2: (х, г,Ф(х, z,y)) G V. Во- вторых, при у = уо получаем {С^^- = рA-в). E") Значит, выполнено условие в) леммы п. 2.3.2. о Д) Если снова (x,z) Е °М, у Е В(уо,/3), то Ф(х, z, Ф(х,г, = При этом ЛФ(з откуда , у)) - Ф(ж,; Ф(х,г,у) + вследствие :,z,y) = Ay ч def z,y) = M(z — A) + ЛМ( — Ф(х, z, у) = = Щх, у) + Л(Ф(ж, z, у) - у). G)
150 Гл. 2. Аппарат теории экстремальных задач о Подставляя G) в F) и учитывая, что в силу Eх) Ф{х,г,у) G В(уо,/3о), получаем \\Ф(х,г,Ф(х,г,у))-Ф(х,г,у)\\® = \\М(г-Щх,Ф{х,г,у)))\\®С\\г-Щх,Ф(х,г,у))\\® C) Ф(х,г,у)) -У(х,у) -А(Ф(х,г,у) - у)\\ < Ф(а;,г>г/)||. (8) Таким образом, выполнено условие б) леммы п. 2.3.2. Е) Еще раз сравним лемму п. 2.3.2 и наши построения. Тополо- Топологическому пространству Т в лемме соответствует у нас произведение X х Z, точке to — точка (хо, zo), окрестности U точки to — окрестность °U точки (#o,?o)> окрестности V в лемме соответствует окрестность V, построенная в Б), отображению (t,y) i—> <&(t,y) соответствует у нас отображение (х, z, у) н-> Ф(х, z, у), числу /3 в лемме соответствует число /3, построенное в В). Тогда соотношение Eх) означает, что выполнено условие а) леммы, соотношение E") — что выполнено условие в), наконец, соотноше- соотношение (8) означает, что выполнено условие б). Значит, можно применять лемму. Ж) По лемме последовательность {уп(х, z) \ n ^ 0}, (x,z) ? °U, определяемая рекуррентно равенствами yo(x,z) =2/o, yn+\(x,z) = $(x,z,yn(x,z)), о содержится при всех пH в шаре В(уо,/3) и равномерно сходится к функции (p(x,z), причем = \\M(z - ЩхгУ0)Ж1 - в) (| -?—Q \\z - Ф(ж так что выполняется утверждение б) теоремы с К = С/A — в). 3) \\Щх,ф,г))-г\\< (О < \\Ч(х,ф,г))-Щх,уп(х,г))\\ + \\Щх,уп(х,г)) - z\\ < < \\Щх, ф, z)) - Ф(аг,уп{х, z)) - А(ф, z) - yn{x, г))|| + + ||Л(^(Ж, z) - уп(х, z))\\ + \\AM(z - Щх,уп{х, z)))\\ C<2) < Е\\ф, z) - уп[х, z)\\ + \\A\\ \\ф, z) - уп(х, z)\\ + + \\A\\\\yn+l(x,z)-yn(x,z) при п —> оо. Поэтому Ф(ж, ip(x, z)) = z. и
2.3. Теорема о неявной функции 151 2.3.4. Классические теоремы о неявной функции и об обрат- обратном отображении. Из доказанной выше общей теоремы легко вы- выводятся две классические теоремы, постоянно используемые в различ- различных прикладных для анализа областях, например в дифференциальной геометрии. По сравнению с п. 2.3.1 мы усилим в двух направлениях требования, предъявляемые к функции Ф. Во-первых, теперь она будет предполагаться непрерывно дифференцируемой, а во-вторых, — и это наиболее существенно — оператор Л, входящий в формулировку тео- теоремы п. 2.3.1, будет предполагаться обратимым. Все это обеспечивает гладкость и единственность неявной функции. А) Классическая теорема о неявной фу н кци и. Пусть X, Y, Z — банаховы пространства, W — окрестность в X х Y, Ф: W —> Z — отображение из класса CX(W). Если: 1)Ф(аг0,гЛ))=О; _ A) 2) существует обратный оператор [Фу(хо,уо)] 1 G S?(Z,Y), то существуют такие г > О и 5 > О и такое отображение ср: о о В(хо,5) —> Y класса Cx(B(xq,5)), что: а) фо) = у о; B) б) ||ж-жо|| <5^> \\ф)-уо\\ <еи^(х,ф)) = 0; о о в) в «прямоугольнике» В(хо,5) х В(уо,е) равенство Ф(ж, ?/) = О возможно только при у = <р(х); г) <р'(х) = -[Ч!у(х,<р(х))]-1Ч!х(х,ф)). 3) Доказательство. Из непрерывной дифференцируемости Ф в W следует выполнение условий 1) и 2) теоремы существования неявной функции из п. 2.3.1 (для проверки 2) надо положить Л = Фу(жо, уо) и воспользоваться теоремой о среднем). Условие 3) выполнено, по- поскольку существует 4f~l(xo,yo). Значит, по этой теореме найдутся число К > 0, окрестность U Э хо и отображение (р: U -^Y такие, что Ф(ж,<р(ж))=0, D) \\ф)-уо\\^К\\Щх,уо)\\. E) Полагая в E) х = xq и используя A), получаем B), а D) дает вторую половину утверждения б). Б) Отображение Ф е Cl(W) и потому строго дифференцируемо в точке (хо,уо) (следствие 2 п. 2.2.3). Следовательно, для всякого к > > 0 найдется такое е{к) > 0, что \\xi - хо\\ < е(я), \\у{ -уо\\< е(х), г = 1, 2, =ф 2,2/2) - Фж(^о, 2/o)(«i - х2)- ж2||,||2/1 — 2/211>- F) Сначала положим щ = УгЦФу l(xo,yo)\\ 1 и найдем соответствую- соответствующее г = s(kq). Поскольку Ф(ж, ?/) непрерывна и Ф(жо,^о) = 0, найдется
152 Гл. 2. Аппарат теории экстремальных задач такое 5, О < 5 < е, что o,5) = {x\\\x-xo\\<5}cU \\х-хо\\<5^\\Щх,уо)\\<^Щ\\ф)-уо\\<е, G) а следовательно, выполняется первая половина утверждения б). о Предположим теперь, что Ф(ж, у) = 0 в точке (х,у) G В{х$,5) х о х В(уо,е). Применяя F) с указанным выше хо (#i = ?2 = ж, у\ = у, у2 = </?(ж)), имеем F) что возможно лишь при у = (р(х), т. е. верно утверждение в). В) При тех же щ, г, 5 положим в F) х\ = х, х% = xq, у\ = У2 = Уо- Тогда ^ \\ф) - 2/о|| < ^(ЦФгвСжо, 2/оI1 + ^о)\\х - хо\\. (8) Теперь зададим произвольно к\ > 0 и применим F) к 5i = min<J?(xi), — имеем < ЦФу Ч^о, Уо)\\*1 тах{||ж - жо||, \\ф) - уо\\} где F) (8) С = \\%1(х0,у0)\\тж{\,К(\\Ъх(х0,у0)\\ + я0)}.
2.3. Теорема о неявной функции 153 Поскольку к\ можно выбирать произвольно, доказанное неравенство означает, что при х —> xq %\х0, Уо)^хЫ, Уо)(х - х0) + <р(х) -уо = о(х - х0) или ср(х) = уо + [-Ф~1(хо, Уо)^х(хо, уо)](х - хо) + о(х - хо), а следовательно, существует производная Фреше (р'(хо), и равен- равенство C) имеет место при х = xq. Чтобы доказать дифференцируемость (р при остальных х, напом- напомним, что множество операторов Л, для которых существует обратный, открыто в S?(X,Y) (предложение 3 в п. 2.2.1). Поэтому, уменьшив, если нужно, 5, мы можем считать, что Ф (ж, </?(#)) существует при ||ж-жо|| < s- Теперь можно повторить все доказательство, заменив точку (хо,уо) точкой (х,(р(х)), где \\х — хо\\ < 5. В силу доказанной выше единствен- единственности мы получим ту же самую функцию ip(x) (по крайней мере, если \\х — х\\ достаточно мало) и для нее формула C) будет верна при х = = х. Так как х было произвольно, то утверждение г) имеет место при о всех х е В(хо,5). Наконец, производная tp'(x) непрерывна, так как, согласно C), она представляется в виде суперпозиции непрерывных отображений х \-^ (х, (р(х)), (х, у) I—> ^х(х, у), (х, у) \-^ ^у(х, у) и А ь-> А~х (послед- (последнее непрерывно, поскольку оно дифференцируемо по Фреше согласно предложению 3 п. 2.2.1). ¦ Замечание. Если в дополнение к условиям теоремы Ф е Cr(W), г ^ 2, то ере Сг(В(х0, 5)). Действительно, из формулы C) и теоремы о суперпозиции можно вывести, что <р"(х) = -{Ф„(ж, ф)Г1 о Фж(х, ф))}' существует и непрерывна. Далее рассуждаем по индукции. Теорема об обратном отображении. Пусть Y и Z — банаховы пространства, W — окрестность точки уо в Y, Ф: W —> -^ Z — отображение класса Cl(W), zq = Ф(^о)- Если существует обратный оператор Ф^з/о) ^ S!(Z,Y), то: о а) существует такое е > 0, что В(уо,е) С W и V = {z \ z = о = Ф(з/), \\у - 2/о|| < ^} = Ф(В(уо,е)) — окрестность z0 e Z; б) существует отображение Ф: V -^ Y класса Cl(V), обратное о к Ф | В(уо,е), т. е. такое, что (y,z)GB(yo,e)xV; (9)
154 Гл. 2. Аппарат теории экстремальных задач в) Ф'(г) = [Ф'(ФО))]-1. A0) Доказательство. А) Отображение Ф G CX(W) строго диффе- дифференцируемо в каждой точке W, в частности и в у$. Поэтому для всякого к > 0 найдется е{н) > 0 такое, что \\yi-yo\\<e(x),i=l,2,^ - ФB/2) - Ф/B/о)B/1 - 2/2)|| < *||2/1 - 2/2||. (И) о Выберем ? > 0 так, чтобы для всех у G В(уо,г) существовал об- обратный оператор 4f'(y)~l (см. предложение 3 п. 2.2.1) и чтобы было е<е(к0), гдехо = 1/2||Ф'Ы-11Г1- О Последнее обеспечивает инъективность отображения Ф на В(уо,е): 2/ь2/2 е В(уо,е),Щух) = =>- Il2/i -2/2II = ||Ф/B/о)Ф/B/о)B/1 -2/2I1 < (и) < ЦФ'О/оГ1 II ||ФB/0 - ФB/2) - Ф7B/о)B/1 - 2/2I1 < < И^Ы)!^ |i II2/1 -2/2II = 2 II2/1 -2/2II =^2/1 =2/2. // N_i о Далее мы докажем, что шар В{у$,е) — тот самый, о котором о говорится в п. а) теоремы, а пока положим V = Ф(.В(?/о>?))- Ввиду инъ- о ективности отображения Ф | В(уо,е) оно обратимо, так что существует о Ф: V —> В(уо,е), обладающее свойством (9). о Б) Для любой точки у G В(уо,е) применим теорему п. 2.3.1 к отоб- отображению Ф(у) (не зависящему от ж, так что пространство X может быть любым) в окрестности точки у. Условие 1) этой теоремы здесь тривиально; условие 2) превращается в условие строгой дифференци- дифференцируемое™ в точке у и, как было отмечено, выполнено, причем Л = о = ФХ(^); условие 3) выполнено, поскольку уе В(уо,е) и в соответствии с выбором г существует Ф'^). По теореме п. 2.3.1 существует окрестность U точки 2Г = Ф(?/) и отображение (р: U —> Y такие, что Щ(р(г)) = г, A2) Mz)-y\\^K\\z-z\\ A3) О для некоторого К > 0. Возьмем 5 > 0 столь малым, чтобы B(*z, 5) С U и чтобы было 5 < (г — \\уо — у\\)/К. Тогда
2.3. Теорема о неявной функции 155 к => \\ф) -yo\\<s^z = Щф)) е ЩВ{уо,?)) = = V => B(z, 5) с V. О Таким образом, каждая точка ?еУ имеет окрестность B(z, 5) С V, о так что V открыто. Кроме того, для z G B(zq,5) в силу инъективности Ф. В) Докажем теперь дифференцируемость отображения Ф и форму- формулу A0). В силу строгой дифференцируемое™ Ф в точке у = ФB) имеет место аналог A1): для всякого к > 0 найдется е(я) > 0 такое, что Полагая здесь у\ = Ф(г), У2 = У = ФB), имеем и -м . е(н) A3) A4) „_. ч _, ^ , ч A5) A2) и потому Ф(г) - ФB) - Ф'(у)"'(-г - 2) = Ф - 2) при ^ —> ?, так как х произвольно. Поэтому существует производная Фреше Ф;{г) = Ф^у), так что A0) доказано. Производная Ф'(г) непрерывна на V, так как, согласно A0), она представляется в виде су- суперпозиции непрерывных отображений z н-> Ф(^), у ^ Ф'B/) и ^- ^ ^--1 (последнее непрерывно в силу предложения 3 п. 2.2.1). 2.3.5. Касательное пространство и теорема Люстерника. В этом пункте X — нормированное пространство, М — некоторое его подмножество.
156 Гл. 2. Аппарат теории экстремальных задач Определение. Элемент h ? X называется касательным векто- вектором к М в точке хо е М, если существуют такие г > О и отображение г: [—г, г] —> X, что: а) ж0 + aft + r(a) G М, б) г (а) = о(а) при а —> 0. Элемент h ? X называется односторонним касательным векто- вектором к М в точке хо е М, если существуют ? > 0 и отображение г: @, г) —> X такие, что выполнено а), и б) имеет место при а | 0. Множество всех касательных векторов к М в точке #о, обознача- обозначается ТХоМ, множество односторонних касательных векторов — T+QM. Очевидно, что ТХоМ С Т+М и что ТХоМ = Т+М П (-Т^М). Если множество ТщМ является подпространством в X, то оно называется касательным пространством к М в точке х§. Замечание. В геометрии обычно касательной прямой, плос- плоскостью и т.д. называют не ТХоМ, а аффинное многообразие хо + + ТЖ0М (рис.32, 33). Примеры (подробные доказательства предоставляются читате- читателю). 1) X = R2, М = {{х, у) | х 2 0} (рис. 34); Т+ М = М, Г@,0)М = @,0)J Рис. 33 Рис. 34 2) X = R2, М = {{х,у) | х > 0,у > 0} = R2. (рис.35); ТA0)М = = {(о,0) | а е R}, Т(о,о)М = {0}, Т(о,,)М = {@,Ь) = {(a, b) | a e R,b 0}, Г+0)М = М, Т+Л) У" e R}, Т+ЩМ = M = {(a,b) |O0,6eR}. 3) X = Y x R, где Y — нормированное пространство, М = = {(у, z) | z = Ц2/Ц} — конус (рис. 36). ттм = {о}, T+fi)M = М. Уп ражнения. 1. Предполагая, что Y — гильбертово пространство (например, Y = R2), найдите Т(Уг\\у\\)М и Т^^у^М в примере 3) при у ф 0 (рис. 36).
2.3. Теорема о неявной функции 157 2. Найдите ТаМ и Т+М, где: а) М = {2~п |га = 1,2,...}и{0} С R, а = 0; б) М== в) М = {( га = 1,2,... I U {0} С R, а = 0; = у3} CR2, a = @,0) и а= A,1); х2 ^у3} CR2, а= @,0) и а = A,1); ж2 ^ ?/3} CR2, а= @,0) и о= A,1); е) М = {(ж, у, z) | z = 1, если ж и у рациональны; z = 0 в остальных случаях}, а = @,0, 1). Во многих случаях, в том числе и представляющих интерес для теории экстремальных задач, множество касательных векторов может быть найдено при помощи следующей общей теоремы. У Рис. 35 Рис. 36 Теорема Люстерника. Пусть X, Z — банаховы простран- пространства, U — окрестность точки хо в X, F: U —> Z, F(xo) = 0. Если F строго дифференцируемо в точке xq и F'{xq) является эпиморфизмом, то множество М = {х | F(x) = 0} имеет в точке xq касательное пространство Доказательство. А) Пусть h e T+M. Тогда, если г(•) — отобра- отображение из определения одностороннего касательного вектора, то в силу строгой дифференцируемости 0 = F(x0 + ah + г (а)) = F(x0) + aF'(xo)h + о(а) = aF'(xo)h + о(а). Значит, F'(xo)h = 0 и Т+М С KerF'(x0). Б) Применим теорему п. 2.3.1 к отображению 4f(x,y) = F(x -\- у). Вследствие строгой дифференцируемое™ F отображение х ь-> Ф(ж,0) непрерывно в точке xq и -у
158 Гл. 2. Аппарат теории экстремальных задач если \\х — #о|| < $> \W\\ < $> \\у"\\ < ^- Условие 3) теоремы п. 2.3.1 также выполняется, ибо F'(xq) отображает X на Z. В соответствии с этой теоремой существует отображение у?: U —> X окрестности U С X точки жо такое, что Ф(ж, ip(x)) = 0 ^ F(x + <р(ж)) = О, \\ф)\\^К\\Щх,0)\\=К\\П*I Остается лишь положить г (а) = <р(хо + ah). Тогда F(x0 + ah + г {а)) = F(x0 + ah + ip(x0 + ah)) = О, \\r(a)\\ = = K\\F(x0 + ah) - F(xo)\\ = K\\F'(xo)ah + o(\\a = K\\aF'(xo)h + o(a)\\, и если h G KerF'(xo), то ||r(a)|| = o(a). Следовательно, KerF'(xo)cTXoM сТ+М.ш На уровне геометрической интуиции теорема Люстерника выглядит весьма прозрачно. Пренебрегая строгостью, можно определить каса- касательное пространство L к множеству М в точке xq тем, что «с точ- точностью до бесконечно малых высшего порядка» М аппроксимируется аффинным многообразием xq + L. Но «в бесконечно малой окрестно- окрестности» точки хо функция F аппроксимируется своей линейной частью: F(x) « F(x0) + F'(xo)(x - х0) = F'(xo)(x - х0) A) (точка хо е М, и потому F(xo) = 0), а множество М = {х | F(x) = 0} аппроксимируется множеством М = {х | F'(xo)(x-xo) =0} = KerFf(x0)+x0. Таким образом, «с точностью до бесконечно малых высшего порядка» М совпадает с аффинным многообразием М = xq + KerF'(xo), и, следовательно, KerF'f^o) — касательное пространство. § 2.4. Дифференцируемость некоторых конкретных отображений 2.4.1. Оператор Немыцкого и оператор дифференциальной связи. Пусть U — открытое множество в R x Rn, и пусть функция f(t,x): U —> Rm и ее частная производная fx(t,x) непрерывны в U. Зададим равенством f(t,x(t)), to^t^U A)
2.4. Дифференцируемостъ некоторых конкретных отображений 159 отображение Л\ °Ы —> C([to,t\],Hm), определенное на множестве ^=M-NC([to,ti])Rn)|(t)a;(t)Nt/) «о <*<*,}. B) Это отображение мы будем называть оператором Немыцкого. Упражнение 1. Проверьте, что множество B) открыто в С ([to, ?i],Rn). Предложение 1. Оператор Немыцкого, заданный соотноше- соотношением A), непрерывно дифференцируем на множестве B) и при этом ' C) — матрица Якоби. Доказательство. Вычислим сначала первую вариацию по Лагранжу отображения J\f. По определению а Слева и справа здесь стоят элементы пространства С ([to, ti],Rm), т. е. некоторые функции от t G [to, ^i]- При фиксированном t имеем = Ит f(t,x(t)+ah(t))-f(t,x(t)) = = fx{t,x(t))h(t) = Ut)h(t). E) Чтобы убедиться в том, что сходимость здесь имеет место также в смысле пространства C([to,ii],Rm), т.е. что она равномерна, заме- заметим, что для некоторого а > 0 компакт .X={(t,x) | \x-x(t)\ <a, io < * < *i} С С/ и на этом компакте /х равномерно непрерывна. Это значит, что Если |а| < E/||/i(-)||c, то по теореме о среднем (п. 2.2.3) Цх(-) + ah(-)) - ,4\х(-)) - ШШ)} = max а II f(t, x(t) + ah(t)) - f(t, x(t)) - fx(t, x(t))ah(t) maxn max \\fx(t,x(t) + 6ah(t)) - fx(t,x(t))\\ \h(t)\ < <e||/i||c- F)
160 Гл. 2. Аппарат теории экстремальных задач Поэтому сходимость в E) действительно равномерна и доказано суще- существование первой вариации по Лагранжу Поскольку первая вариация задается линейным оператором а именно -/^г(^(')) ~~ это оператор умножения на матричную функцию fx(t) и этот оператор ограничен: М'г(*(-)IК max\\fx(t,x(t))\\, G) te[to,t\] то *Л\х(-)) дифференцируем по Гато. Чтобы доказать непрерывность производной Гато, оценим норму разности = sup IIMOIIc = sup max \\fx(t,x(t))h(t) - fx(t,x(t))h(t)\\ < max\\fx(t,x(t))-fx(t,x(t))\\. te[to,ti] Снова с помощью компакта Ж и равномерной непрерывности fx, убеж- убеждаемся в непрерывности -^г(ж(')) относительно х(-) G °U. Применяя теперь следствие 2 из п. 2.2.3, мы убеждаемся, что ,Л{х{-)) имеет в каждой точке множества °Ы производную Фреше и строго дифферен- дифференцируемо. Ввиду равенства J\fv = J\f производная Фреше непрерывна в °Ы.ш Упражнение 2. Докажите, что в G) имеет место равенство. Пусть теперь U — открытое множество в R x Rn x Rr, и пусть функция f(t,x,u): U —> Rm и ее частные производные fx, fu непре- непрерывны в U. Отображение J\f\ °U ^ С ([to, ti],Rm), определенное на мно- множестве (t,x(t),u(t))eU, to^t^u}c 1t1],Rr) (8) равенством Jix(-),u(-))(t)=f(t,x(t),u(t)), (9) мы также будем называть оператором Немыцкого. Предложение 2. Оператор Немыцкого, заданный соотноше- соотношением (8), непрерывно дифференцируем на множестве (9) и при этом U Ut)v(t), A0)
2.4. Дифференцируемостъ некоторых конкретных отображений 161 где Доказательство. Как и в предыдущем случае, у отображения J\f существуют частные производные ,4u(x(-),u(-)) и отображения Ли: 'Ш- непрерывны в °И. Остается сослаться на теорему о полном дифферен- дифференциале из п. 2.2.4. ¦ Пусть далее U и °Ы — те же, что и в предыдущем примере, функция (p(t,x,u): U —> Rn и ее частные производные (рх, (ри непрерывны в U. Отображение Ф: °Ы ^ C([to,t\],Hn), определенное равенством Ф(х)(-), «(•))(*) = x(t) - <p(t, x(t), u(t)), A3) будем называть оператором дифференциальной связи. Предложение 3. Оператор дифференциальной связи, задан- заданный соотношением A3), непрерывно дифференцируем на множестве (8) и при этом Ф\х{-),и{-))Ш«OK*) = Ш - Vx{t)h{t) - (pu{t)v(t), A4) где (й*|р», ,,, = 1 „). (.5) т i=l „, „=1 Доказательство. Отображение Ф есть разность линейного непрерывного оператора (х(-),и(-)) \-^> х(-) и оператора Немыцкого Л(х(-),и(-))(Ь) = (p(t,x(t),u(t)). Поэтому доказываемое утверждение следует из общих свойств производных (п. 2.2.1) и предложения 2. ¦ 2.4.2. Интегральный функционал. Пусть U — открытое множе- множество в R х Rn х Rn, и пусть функция /(?, х,х): U —> Rm и ее частные производные fx, fx непрерывны в U. Отображение 3\ °W-^ Rm зададим на множестве Щ-= {х(-) е cl([to,ti],Rn) I (t,x(t),x(t)) eU,to^t^ U} A) б В. М. Алексеев и др.
162 Гл. 2. Аппарат теории экстремальных задач равенством \{t,x{t),x{t))dt. B) Предложение 1. Интегральное отображение B) непрерывно дифференцируемо на множестве A) и при этом \ C) to где ^V D) E) Доказательство. Представим отображение B) в виде суперпо- суперпозиции где — линейный непрерывный оператор, определяемый равенством Л: ^ —оператор Немыцкого, определяемый равенством (9) п. 2.4.1 (при г = = п), и — оператор интегрирования также линейный и непрерывный. Все эти операторы дифференциру- дифференцируемы (см. п. 2.2.1 и предложение 2 п. 2.4.1), причем производная ли- линейного оператора совпадает с ним самим, а производная оператора Немыцкого дается формулой A0) п. 2.4.1. По теореме о суперпозиции 3f(x(.)) = IoJ^'(Dx(.))oD, F)
2.4. Дифференцируемость некоторых конкретных отображений 163 т. е. = I{Jf\Dx{.))[Dh{.)]} = 1{Л'(х(.)9 to Этим доказана формула C). Непрерывность J'(x(-)) следует из непре- непрерывности производной оператора Немыцкого и равенства F).и Упражнение. Найдите нормы операторов D и /. В задачах классического вариационного исчисления и оптималь- оптимального управления рассматриваются также интегральные функционалы вида B) с переменными пределами интегрирования to и t\. Чтобы включить их в общую схему, поступим следующим образом. Пусть предположения относительно f(t,x,x) те же, что и раньше, А С R — некоторый отрезок, <M={(x(-),to,ti) I ж(.) е C\A,Rn), (t,x(t),x(t)) e U, t e A, to,t\ e intA}. G) Определим отображение 3\ °Ы —> Rm равенством и f(x(-),to,ti) = \ f(t,x(t),x(t))dt. (8) to Предложение 2. Интегральное отображение (8) непрерывно дифференцируемо на множестве G) и при этом г=\ , (9) г=0 ),т0, тх] = \(fx(t)h(t) + fi(t)h(t)) dt + f(t to где fx(t) и fx(t) даются формулами D) и E), а f(t)=f(t,x(t),ic(t)). A0) Доказательство. Воспользуемся теоремой о полном дифферен- дифференциале из п. 2.2.4. Частные производные существуют в соответствии с предложением 1 и классической теоремой о производной интеграла по верхнему и нижнему пределам интегрирования: 6*
164 Гл. 2. Аппарат теории экстремальных задач Приступаем к проверке непрерывности частных производных. = sup \\f(to,x(to),x(to))ro - f(to,x(to),x(to))ro\\ < < \f(to,x(to),x(to)) - f{to,x(to),x(to))\. A1) Кроме того, \x(t0) - x(to)\ < \x(t0) - x(to)\ + \x(t0) - x(to)\ < \x(t0) - x(to)\ - x(to)\ -ж(Г0)|. A3) Поэтому, если to -^ to и #(•) -^ ж(-) в С1 (A, Rn), то х(Ц) -^ x(to), x(to) -^ x(to) и, значит, правая часть неравенства A1) стремится к нулю. Следовательно, $to(x('),to,t\) непрерывно зависит от (х(х x),to,ti) (от t\ эта производная не зависит вовсе). Непрерывность Jti{x('),to,t\) проверяется аналогично. Б) Выберем число а > 0 так, чтобы компакт Ж= {(t,x,u) | \x-x(t)\ < a, \u-x(t)\ < a, t e А} С U. На этом компакте производные fx(t,x,x) и fx(t,x,x) равномерно непрерывны и ограничены. Теперь при \\х(-) — х(-)\\с^ ^ а имеем: = sup sup Ж \to-to\) + mzx{\\fx(t,x(t),x(t)) - fx(t,x(t),ic(t))\\ + [to.ti]
2.4. Дифференцируемостъ некоторых конкретных отображений 165 Первый член стремится к нулю при to —> to и t\ —> ti. Второй оце- оценивается с использованием равномерной непрерывности так же, как в доказательстве предложения 1 п. 2.4.1, и тем самым стремится к ну- нулю, когда х(-) —> х(-) в пространстве С^А, Rn). Применяя теорему о полном дифференциале, получаем (9).и 2.4.3. Оператор краевых условий. Пусть функция^(to,^o^b х\): W —> Rs непрерывно дифференцируема на открытом множестве W С С R х Rn х R х Rn, и пусть W={(x(.),to,ti)\x(.)eCl(A,Rn), t0,ti GintA,(to,x(to),ti,x(ti) e W}. A) Отображение Ф: 9f ^ Rs, определяемое равенством ^(x(-),to,t1) = ^(to,^(to),ti,x(t1)), B) называется оператором краевых условий. Предложение. Оператор краевых условий B) непрерывно диф- дифференцируем на множестве A) и при этом + x(ti)fi], C) где ^г = ^(*о,ж(*о),?ьж(*1)), г = 0, 1, D) фХг =^jXl(to,x(to),tux(t\)), г = 0,1. E) Доказательство. А) Рассмотрим сначала простейшее отобра- отображение ev: C^A, Rn) x int A -^ Rn, определяемое равенством ev(x(-),to) =x(t0) (отображение значений). По х(-) это отображение линейно, и потому evx(.)(x(-),to)[h(-)}=h(to). Частная производная по to —это обычная производная evto (?(•), ?о)Ьо] =х(?о)то. Проверяем непрерывность: \\eyx(-)(x(-),to) -evx(.)(x(-),to)\\ = sup \\h(t0) - h(bo)\\ < IIMOIIci^1 < sup sup \\h@)\\\t0-h\^\to-?o\^0
166 Гл. 2. Аппарат теории экстремальных задач при to —> to. Далее = sup \\x(to)ro - x(to)ro\\ = \\x(to) - x(to)\\ —> 0, Iro^l когда to —> to и x(-) —> x(-) в пространстве Cl(A,~Rn), как это было показано при доказательстве предложения 2 п. 2.4.2 (неравенства A2) и A3)). В силу теоремы о полном дифференциале (п. 2.2А) ev(x(-),to)'[h(-),TO] = h(t0) + х(?)т0. Аналогично убеждаемся в непрерывной дифференцируемости отобра- отображения (x(-),t\) —> x(t\). Б) Воспользовавшись теоремой о суперпозиции, убеждаемся в диф- дифференцируемости отображения B) и справедливости равенства C).и Упражнение 1. Пусть отображение ev: С1 ([0,1]) х @,1) ^К опреде- определено формулой ev(x(-),to) = x(to) (ср. п. 2.4.3). Докажите, что: а) для существования второй вариации 52 ev(x(-), to) необходимо и доста- достаточно, чтобы существовала x(to) и при этом S2ev(x(-),to)[h(-),T] = 2h(to)T + x(to)T2; б) отображение ev не имеет второй производной Фреше, хотя его первая производная Фреше дифференцируема по Гато. Указание. h(t0 + т) - h(t0) ф o(\\h\\2 + т2). § 2.5. Необходимые сведения из теории обыкновенных дифференциальных уравнений Как уже отмечалось в п. 2.1.8, дифференциальные уравнения х = = (p(t,x,u(t)), рассматриваемые в задачах оптимального управления, имеют свою специфику. Поскольку мы допускаем разрывные управле- управления и(-), их правая часть не обязана удовлетворять условиям стан- стандартных теорем из курса дифференциальных уравнений. К тому же нужные сведения о решениях не всегда излагаются в этих курсах в удобной для нас форме. Поэтому для полноты изложения, а так- также чтобы проиллюстрировать возможность применения здесь общих теорем §§ 2.3 и 2.4, мы приводим в этом параграфе доказательства основных теорем: существования, единственности и дифференцируе- дифференцируемости решений, а также некоторые специальные утверждения, отно- относящиеся к линейным системам. Часть формулировок дана в несколь- несколько более общей форме, чем это обычно необходимо. Чаще всего мы имеем дело только с кусочно-непрерывными управлениями и(-), но и в этом случае удобно говорить об «измеримости», «интегрируемо- «интегрируемости» и т. п.
2.5. Необходимые сведения из теории дифференциальных уравнений 167 Функция х(-) называется решением дифференциального уравнения x = F(t,x), если она абсолютно непрерывна (см. п. 2.1.8) и удовлетворяет уравне- уравнению почти всюду. В эквивалентной форме х(-) должно быть решением интегрального уравнения x(t) = x(to) + F(s, x(s)) ds. to 2.5.1. Основные предположения. Здесь и далее будем предпо- предполагать, что G — открытое множество в R x Rn и что функция F: G —> Rn удовлетворяет следующим трем условиям: A) Для любого х функция t i—> F(t,x), определенная на сечении Gx = {t | (t,x) ? G}, измерима и интегрируема на любом конечном отрезке, содержащемся в Gx. Б) Для любого t функция х ь-> F(t,x), определенная на сечении Gt = {х | (t,x) ? G}, дифференцируема (хотя бы в смысле Гато). B) Для любого компакта Ж С G существует такая локально инте- интегрируемая функция fc(-), что \\Fx(t,х)\\ ^ kit), Уи,х)?Ж. A) (Функция называется локально интегрируемой, если она интегрируе- интегрируема на любом конечном отрезке.) Типичный пример доставляет функция F(t,x) = (p(t,x,u(t)), где (p(t,x,u) и (px(t,x,u) непрерывны на G х °Ы, а и: R —> °Ы ку- кусочно-непрерывна. Условия А) и Б) здесь очевидны, a kit) мож- можно положить равной максимуму ||.РЖ(?,ж)|| на Ж. Другой пример — F(t,x) = A(t)x, где А(-) измеримая локально интегрируемая матричная функция, Замечание. Условия А)-В) более ограничительны, чем известные условия Каратеодори [6], но они лучше приспособлены, с одной сто- стороны, к нашим потребностям (рассмотрение уравнений х = (p(t,x,u(t)) с разрывными управлениями и(-), но с существованием производной (рх), и к нашим возможностям (аппарат дифференциального исчисле- исчисления § 2.2), с другой. Лемма 1. Для любого компакта Ж С G существует локально интегрируемая функция х(-) такая, что B) кт, существуют та «цилиндр» Ctoxo = {(?, x)\\t- to| ^5,\x- xo\ Доказательство. Поскольку Ж — компакт, существуют такие 5 > 0 и г > 0, что для любой точки (to,xo) ? Ж «цилиндр»
168 Гл. 2. Аппарат теории экстремальных задач Для этого цилиндра, согласно В), найдем локально интегрируемую функцию ktoXo(t). Снова используя компактность, покроем Ж конечным числом ци- N линдров: Ж С U CtiXi- г=1 Функция N *(*) = $}№**)! + W*) • ?]X[u-6,u+s\(t) г=\ — искомая (х[а,р](') ~ характеристическая функция отрезка [а,/3]; \F(t,Xi)\ интегрируема на [U — 5,ti + 5] в силу А)). Действитель- Действительно, (t,x) еЖ=>31,(ь,х) eCtiXi => => \F(t,x)\ < \F(t,Xi)\ + \F(t,x) - F(t,Xi)\ < <|F(t,x)|+ sup \\Fx(t,c)\\e^x(t) ce[x,Xi] (отрезок [(t,x),(t,Xi)] С Ct-x- и применима теорема о среднем п. 2.2.3)). Лемма 2. Если функция х: А —> Rn непрерывна на отрезке А и ее график {(t,x(t)) \ t G А} лежит в открытом множестве GcRx Rn, а функция F: G —> Rn удовлетворяет условиям А)- В), то функция t I—> /(t) = F(t,x(t)) измерима и интегрируема на А. Доказательство. При достаточно малом ? > О Х={(?,ж) | |ж-ж(*)| <?, t G А} с G, и пусть fc(-) — функция, отвечающая этому компакту в силу усло- условия В). Непрерывная функция х(-) является равномерным пределом кусочно-постоянных функций хп(-) и без ограничения общности гра- графики хп(-) лежат в Ж. На каждом интервале постоянства хп(-) функция t \-^ fn(t) = = F(t,xn(t)) измерима и интегрируема по условию А), а потому /п(-) измерима и интегрируема на А. Используя теорему о среднем (п. 2.2.3) и A), имеем \Ш -№\ = \F(t,xn(t))-F(t,x(t))\ < k{t)\xn(t) -x(t)\, откуда fn(t) -^ f(t) при всех t G А, а значит, /(•) измерима как предел измеримых функций [КФ, гл. V, §4]. Наконец, и, следовательно, /(?) интегрируема.
2.5. Необходимые сведения из теории дифференциальных уравнений 169 2.5.2. Локальная теорема существования. Пусть на открытом множестве GcRx Rn функция F: G —> Rn удовлетворяет услови- условиям А)-В), и пусть компакт Ж С G. Тогда существуют такие 5 > О и г > О, что для любой точки (t,x) ? Ж и для (t§,x§), удовлетворяющих неравенствам |?о — t\<5, \xq — х решение X(t,to,xo) задачи Коти x = F(t,x), x(to)=xo, г, A) B) определено на отрезке [t — 5, t + 5] и является непрерывной функци- функцией по совокупности аргументов. Доказательство. Применим к рассматриваемой ситуации прин- принцип сжимающих отображений в формулировке п. 2.3.2. Задача Ко- ши B) эквивалентна интегральному уравнению x(t) = F(s,x(s))ds, C) и мы применим лемму п. 2.3.2 к отображению (•) = х0 + J F(s, x(s)) ds. D) Выберем 7 и C так, чтобы Xi = {(?, ж) | |t - t\ < 7, /3, е Ж} С G, и пусть fc(-) и х(-) — интегрируемые функции, отвечающие в силу В) и леммы 1 п. 2.5.1 этому компакту. Займемся проверкой условий леммы п. 2.3.2. Топологическим пространством Т здесь будет множество A), U = Т, Y = С([Т- 5,?+ 5},Пп), где 5, 0 < 5 < 7. мы подберем позже; yo(s) = х, V = {(to,xo,x(-)) | 1*0-*]<<*, |*o- Константы ?и^ таковы, что 0<6>< 1 и0<?<^A-^). Условие в) п. 2.3.2 выполняется, если для t ? [t — 5, t + 5] . E) + </3A-0). F)
170 Гл. 2. Аппарат теории экстремальных задач По лемме 1 п. 2.5.1 \F(s,x) будем иметь ), и, выбрав 5 достаточно малым, t+5 t+5 x(s)ds<P(l-9)-e, G) t-5 t-5 откуда следует F), поскольку + F(s, x)ds -x to — x [ F(s,x)ds t+5 t-<5 Условие а) п. 2.3.2 означает, что отображение (to,xo,x(-)) (to, xq, Ф(Ьо, xq, x(-))) переводит V в себя. Оно выполняется, если F(s, x(s)) ds — x для (to,xo,x(-)) G У и t G [t — E, t + <5]. Оценим здесь левую часть, используя F), теорему о среднем и A) п. 2.5.1: ds — x + F(s,x) ds — x to t+5 </3A-6»)+ [ t-5 1-0+ k(s)ds t-5 если выполняется неравенство 0, (8) чего мы можем добиться, уменьшив, если нужно, 5.
2.5. Необходимые сведения из теории дифференциальных уравнений 171 Наконец, поскольку уже проверено условие а), условие б) п. 2.3.2 выполняется, если ||Ф(*о,жо,ж(.))-Ф(*о,жо, 2/(-))|| <: ОМ-) - у(-)\\ для любых (to,xo,x(-)) e V и (to,xo,y(-)) e V. Но = max t = max {F(s, x(s)) - F(s, y{s))}ds 1 lL t+5 J k(s)ds\\x(-)-y(-)\\^O\\x(-)-y(- t-5 в силу (8). Таким образом, лемма п. 2.3.2 применима, и потому последователь- последовательность Xn(-,to,xo), определяемая равенствами Xo(-,to,xo) =хи (9) равномерно по (to,#o) из A) сходится в пространстве C[(t — 5,i-\- + 5],Rn), т.е. равномерно по t G [t — 5,t + 5]. Переходя к пределу в (9), получаем, что X(t,to,xo) = lim Xn(t,to,xo) удовлетворяет инте- п^оо тральному уравнению C) и, следовательно, является решением задачи Коши B). По индукции легко проверяется, что X(t,to,xo) непрерыв- непрерывны, а поскольку сходимость равномерна, то и X(t,to,xo) непрерывна по совокупности аргументов. ¦ 2.5.3. Теорема единственности. Лемма (неравенство Гронуолла). Пусть неотрицательные функции а(-) и и(-) измеримы на отрезке А, причем а(-)оо(-) на А интегрируема. Если для некоторых Ь>0ит^Аи для всех t G А выполняется неравенство a(s)cj(s)ds Ъ, то для всех t e A u(t) < be a(s) ds (i) B)
172 Гл. 2. Аппарат теории экстремальных задач Доказательство. Пусть сначала t ^ т. По условию N = a(s)cj(s) ds < оо А и, согласно A), По индукции находим, что из A) вытекают неравенства t (га- 1)! t -| 771—1 a(s) ds ml 1m ¦ C) Действительно, при т = 0 C) верно, а если (З) верно при некотором га, то, подставив эту оценку в A) и воспользовавшись равенством а(а) da а(а) da\ ds = — fc+i fc+1 fc+ 1 убеждаемся, что C) верно для m+ 1. Переходя в C) к пределу при т —> оо, получаем A). При ? ^ г рассуждаем аналогично, надо лишь везде поменять ме- местами пределы интегрирования. (Заметим, что функция а(-) не обя- обязательно интегрируема, так что правая часть в B) может оказаться бесконечной.) ¦ Теорема единственности. Пусть функция F: G —> Rn удо- удовлетворяет условиям А)-В) п. 2.5.1 в открытом множестве G С () С R х Rn г = 1,2, — интервалы в R и Rn — два решения задачи Коши B) п. 2.5.2, графики которых содержатся в G. Тогда x\(t) = x2(t) для всех t ? Ai П А2. Доказательство. Множество А = {t \ x\(t) = ж2(?)}, очевидно, замкнуто в Ai П А2 и непусто, поскольку to ? А. Остается проверить, что оно открыто, и тогда утверждение теоремы будет следствием связ- связности интервала Ai П А2. Пусть t ? А, так что x\(t) = ж2(?) = х. Выберем такие 7 > 0 и /3 > О, /3} С G и чтобы (t,Xi(t)) ? Ж чтобы Ж = {(?, ж) | \t — t\ < 7' |# — ^ при \t —1\ ^75 функция k(t) отвечает Ж в силу условия В) п. 2.5.1. Применяя теорему о среднем (п. 2.2.3) и неравенство A) п. 2.5.1, находим, что
2.5. Необходимые сведения из теории дифференциальных уравнений 173 - x2(t)\ ^F(s,x{(s))-F(s,x2(s))]ds — x2(s)\ ds Если теперь к функции u(t) = \x\(t) — х2(i)| применить на [t — 7,t + 7] только что доказанную лемму (а(?) = k(t), Ъ = 0), то, согласно B), xi(t)=x2(t). Следовательно, (? — 7, t + 7) С А и А открыто. ¦ 2.5.4. Линейные дифференциальные уравнения. В этом пункте А — отрезок числовой прямой, А: А -> ^(Rn, Rn), 6: А -> Rn и с: А -> Rn* — интегрируемые матричная функция и две вектор-функции; ж = = (х\,... ,хп) G Rn, p= (pi,...,Pn) ^ Rn*. Мы будем рассматривать линейные системы дифференциальных уравнений x = A(t)x + b(t) A) р= -pA(t) + c(t) B) (иногда систему B) называют сопряженной системе A)). Хорошо известно, что для линейных систем существование решений удается доказать нелокально, в нашем случае — на всем отрезке А. Лемма. Если функции А: А -> ^(Rn,Rn), Ь: А -> Rn и с: А -^ -^> Rn* измеримы и интегрируемы на отрезке А, то любая задача Коши для уравнений A) и B), поставленная в момент to e А, имеет единственное решение, и это решение продолжается на весь отрезок А. Доказательство. Поскольку все рассуждения аналогичны, ограничимся уравнением A). Для удобства продолжим функции А(-), Ь(-) и с(-) на все R, положив их равными нулю вне А. Тогда функция F(t,x) =A(t)x + b(t) будет удовлетворять условиям А)-В) п. 2.5.1 в области G = Rx Rn, и потому к дифференциальному уравнению A) применима теорема единственности п. 2.5.3 и локальная теорема существования п. 2J5.2 в каждой точке (t,x), так что решение уравнения A), у которого x(t) = = х, заведомо единственно и определено на некотором отрезке [t — -5,t + 6\. Заметим теперь, что если \х\ ^ М, то \F(t,x)\^\\A(t)\\M+\b(t)\, \\Fx(t,x)\\ = \\A(t)\\.
174 Гл. 2. Аппарат теории экстремальных задач Вернувшись к доказательству теоремы п. 2.5.2, мы можем выбрать достаточно произвольно константы j, /3, 9 и г, например, положив 9 = 1/2, /3 = 4, е = 7 = 1, и тогда неравенства G) и (8) п. 2.5.2, определяющие 5, приобретут вид t+5 t+5 М \ \\A(s)\\ds+ \ \b(s)\ds t-5 t-5 t+5 C) J \\A(s)\\ds^ 1/2. t-5 Поскольку ||А(-)|| и \Ь(-)\ интегрируемы, то мы можем выбрать 5 > > 0 столь малым (и не превосходящим 7=1)' чтобы неравенства C) выполнялись при всех t [КФ, с. 301]. Следовательно, решение урав- уравнения A), у которого x(t) = х, определено на отрезке \t — 5,t + 5] с гарантированным 5, одним и тем же для любого t и любого х, такого, что \х\ ^ М. Пусть теперь заданы to E А и хо и ищется решение уравнения A), у которого x(t0) = х0. D) Положим М = \\b(s)\ds\e± \\A(s)\\ds E) Задача Коши A), D) эквивалентна интегральному уравнению = х0 + [ A(s)x(s) ds + [ b(s) ds, откуда \x(t)\ < A(s)x{s)ds b(s) ds \\\A(s)\\\x(s)\ds F) Решение х(-) задачи A), D) заведомо определено на отрезке Ai = = [to — 5, to + 5]. Применяя на этом отрезке лемму п. 2.5.3 к функ- функции uo(t) = \x(t)\, (a(t) = \\A(t)\\, b = \xo\ + [ \b(s)\ds j, получаем
2.5. Необходимые сведения из теории дифференциальных уравнений 175 неравенство Г \\A(s)\\ds (?) и, в частности, \x(to) ±5)| ^ М согласно E). Поэтому в точках (to ± ± 5, x(to ± 5)) снова можно воспользоваться локальной теоремой суще- существования и продолжить решение х(-) на отрезок А2 = [to — 25, to + Дальше процедура повторяется. Неравенство F) справедливо на А2, а значит, на А2 верно G) и \x(to ± 25) | ^ М и т. д. За конечное число шагов мы продолжим решение задачи Коши A), D) на весь отрезок А. ¦ Явные формулы для решений систем A) и B) выражаются через фундаментальную матрицу решений однородной системы х = A(t)x. (8) Определение. Фундаментальной матрицей fl(t,r) решений системы (8) называется матричная функция п: А х А —> i^(Rn,Rn), являющаяся решением задачи Коши (t)Q(t,T), (9) иь П(т,т) = Е. A0) Другими словами, каждый столбец матрицы u(t,r) является реше- решением системы (8), а при t = г эти п столбцов обращаются в набор единичных векторов стандартного базиса в Rn е\ = A,0, , 0), е^ = = @,1 0) еп = @,0 1). Теорема. Если матричная функция А(-) интегрируема на от- отрезке А, то фундаментальная матрица Q,(t,r) системы (8) суще- существует и непрерывна на квадрате А х А, причем: 1) U(t, s)U(s, r) = U(t, г) для всех t, s, r e А; A1) 2) O(t, r) при каждом t является решением дифференциального уравнения 9П(*'Г) =-n(t,r)A(r). A2) Кроме того: 3) Если функция Ъ: А -^ Rn интегрируема на отрезке А и х(-) — решение системы A), то для любых t, r G А t x(t) = Cl(t,T)x(r)+ \u(t,s)b(s)ds. A3)
176 Гл. 2. Аппарат теории экстремальных задач 4) Если функция с: А —> Rn* интегрируема на отрезке А и р(-) — решение системы B), то для любых t, r G А г p(t) = р(т)П(т, t) - [ c(s)Q(s, t) ds. A4) t Доказательство. Непосредственной подстановкой с использо- использованием (9) проверяется, что для любого ? G Rn функции х\ (t) = Q(t, s)Q(s, т)? и x2(t) = Q(t, т)? являются решениями системы (8), а так как в силу A0) xi(s) = n(s,s)Q(s,T)€ = fi(s,r)^ = x2(s), то по теореме единственности n(t,s)Q(s,T)Z = xi(t) = x2(t) = Поскольку ? любое, должно выполняться A1). Фиксируя в A1) s, мы представляем функцию пары переменных u(t,r) в виде произведе- произведения двух функций одной переменной, а так как обе они непрерывны, то О непрерывна по (t,r) на А х А. В частности, она ограничена. Полагая в A1) t = т, получаем Q,(t,s)Q,(s,t) = Е, откуда Cl(t,s) = [Cl(s, t)]~l. Согласно предложению 3 п. 2.2.1 матричная функция f(A) = А~х непрерывно дифференцируема на множестве обратимых матриц и Множество Ж = {А | А = fl(s,t),s,t G А} является образом компакта А х А при непрерывном отображении О: А х А —> i/?(Rn,Rn), а по- потому это компакт и на нем функция / ограничена: ||/(А)|| < М — и удовлетворяет условию Липшица, так как \\f(A)-f(B)\\ = \\В~1 -А~1\\ = || - В~\В - А)А~Х\\ ^М2\\В-А\\. Согласно предложению 1 п. 2.1.8 функция (?>(«§) = O(t, s) = 0E, t)~ = /@E, ?)) абсолютно непрерывна, и в силу A5) и теоремы о суперпозиции п. 2.2.2 почти всюду = -[f2(s,t)]-1A(s)f2(s,t)[f2(s,t)]-1 = -U(t,s)A(s), чем доказано A2).
2.5. Необходимые сведения из теории дифференциальных уравнений 177 Представив правую часть A3) в виде Q(t,г) \х(т) + jП(т, s)b(s) ds\, A5) г мы убеждаемся в ее абсолютной непрерывности. Действительно, Q,(r,s)b(s) интегрируемо (как функция s) на А, а интеграл от инте- интегрируемой функции абсолютно непрерывен (п. 2.1.8). Следовательно, квадратная скобка в A6) абсолютно непрерывна по t. Остается заме- заметить, что произведение двух абсолютно непрерывных функций также абсолютно непрерывно (предложение 1 п. 2.1.8). Равенство A4) доказывается аналогично. ¦ 2.5.5. Глобальная теорема о существовании и непрерывной зависимости решения от начальных данных и параметров. Вернемся к рассмотрению задачи Коши: x = F(t,x), A) x(t0) = х0 B) для дифференциальных уравнений, правая часть которых удовлетворя- удовлетворяет условиям А)-В) п. 2.5.1. Используя локальную теорему существова- существования и теорему единственности, мы можем, как это и делается в курсах дифференциальных уравнений, продолжить решение X(-,to,xo) задачи Коши A), B) на максимальный интервал его существования (а, Ь). При этом из теоремы п. 2.5.2 следует, что при t [ а и при t ] Ь это реше- решение должно покидать любой компакт Ж С G, ибо, пока (t,x(t)) ? Ж, решение гарантировано продолжается на интервал (t — 5,t + 5), откуда a-\-5<t<b — 5 ввиду максимальности интервала (а,Ь). Следующая теорема показывает, в каком смысле X(-,to,xo) непрерывно зависит от (to,xo). Теорема 1. Пусть на открытом множестве GcRx Rn функ- функция F: G —> Rn удовлетворяет условиям А)-В) п. 2.5.1, и пусть х: [to,ti] —> Rn — решение уравнения A), график которого Г = = {(t,x(t)) \to^t^U}cG. Тогда существуют 5 > 0 и окрестность G D Г такие, что для любых (to,xo) e G решение X(-Ato,xo) задачи Коши A)-B) определе- определено на отрезке А = [to — 5, t\ + S\ и функция (t, to, xo) \-^ X(t, to, xo) яв- является непрерывной функцией по совокупности аргументов на А х х G. В частности, при to —> т, хо —> х(т) решение X(t,to,xo) -^ x(t) равномерно по t G А. Доказательство. А) Применив локальную теорему существо- существования в точках (to,x(to)) и (t\,x^t\)), продолжим решение х(-) на неко- некоторый отрезок А = [to — 5,t\ + 5] так, чтобы график х(-) по-прежнему содержался в G. После этого выберем ?так, чтобы компакт Ж={^,х) | \x-x(t)\ ^e, t e А} с G.
178 Гл. 2. Аппарат теории экстремальных задач Применив к Ж теорему п. 2.5.2, найдем такое 5 > О, чтобы при (to, xq) ? ? Ж решение X(-,to,xo) было определено на [to — 5, to + 5]. Наконец, пусть k(t) и х(-) — локально интегрируемые функции, соответствую- соответствующие Ж согласно условию В) и лемме 1 п. 2.5.1. Обозначим теперь t ? (to- +$),\x-x(t)\ и покажем, что при достаточно малом г > О эта область обладает свойствами, указанными в формулировке теоремы. Б) Пусть два решения Xi(-), i= 1,2, уравнения A) определены на отрезке [/3,7] С А, причем (t, Xi(t)) ? Ж, /3 ^ t ^ 7» и пусть г ? [/3,7]- Применяя теорему о среднем (п. 2.2.3) и неравенство A) п. 2.5.1, полу- получаем \xi(t)-x2(t)\ = xx (r) + f F(s, x\ (s)) ds - x2(t) - I F(s, x2(s)) ds \xi{t)-x2{t)\ \[F(s,xl(s))-F(s,x2(s))} ds k(s)\xi(s) -x2{s)\ds . C) По лемме п. 2.5.3 (a(s) = k(s), uj(s) = — Х2(т)\) имеем \xi(t) - x2(t)\ ^ \xx(t) - х2(т)\е В) Выберем теперь г > 0 так, чтобы \k(s)ds — X2(s)\, b = \x\(r) — k(s)ds , /3 < t < 7- D) E) и пусть (to,^o) ? G. Поскольку G С «Ж, решение х(-) = X(-,to,xo) определено на [/3,7] = [?о — 5,to + 5] П А. Покажем, что оно останется на этом отрезке в Ж. Действительно, пусть Т = sup{t | t0 < t < min{t0 + 5,?\ + ^}; (s, x(s)) ? X, Vs ? [t0, t]}. F) На отрезке [to,T] к решениям х(-) и х(-) применимы рассуждения п. Б) доказательства и в силу D) \х(Т) - х(Т)\ т k(s)ds k(s)ds k(s)ds ее*
2.5. Необходимые сведения из теории дифференциальных уравнений 179 Но тогда (Т,х(Т)) ? intJ{ и точка (t,x(t)) остается в Ж и при t > > Т, близких к Т, что противоречит определению F). Аналогично рассуждаем и для t < to. Поскольку (/3,х(/3)) е Ж и G>#(т)) ^ ^ решение #(•) определено на отрезке [to — 25, to + 25] П А. К этому отрезку снова применяем те же рассуждения и убеждаемся, что (t,x(t)) остается в Ж. Продолжая эту процедуру, убеждаемся, что х(-) определено на А. Г) По доказанному любое решение X(-,to,xo) остается в Ж, если (to,xo) ? G. Вспоминая о функции х(-), получаем неравенство X(tuto,xo) -X(t,to,xo)\ = ^F(s,X(s,to,xo))ds ¦ G) Возьмем теперь два решения, у которых (to,xo) e G и (to,xo) e G. Тогда ввиду D) и G) X(t,to,xo)-X(t,to,xo)\ < \ф)<Ь k(s)ds k(s)ds (8) что, очевидно, стремится к нулю при t ^^t, to -^ to, #о "^ жо» доказывая непрерывность X(t, to, жо)- Полагая в (8) t = t, to = т, xq = ж(г) и вспо- вспоминая, что по теореме единственности X(t,r,x(r)) = x(t), имеем k(s)ds J t0 откуда X(t,to,xo) -^ x(t) равномерно при xq -^ x(r), to —> т.и Перейдем теперь к непрерывной зависимости решений от парамет- параметра. Предположим, что нам дано семейство дифференциальных уравне- уравнений x = Fa(t,x), (9) зависящих от параметра a G Я, где Я — некоторое топологическое пространство. Теорема 2. Пусть на открытом множестве GcRx Rn функ- функции семейства {Fa: G —> Rn | a e Я} удовлетворяют при каждом
180 Гл. 2. Аппарат теории экстремальных задач Rn — решение уравнения t ^ ti} С G, и пусть еще a G Я условиям А) и Б) п. 2.5.1; х: [to, tij F) при а = а и график Г = {(t,x(t)) \ to выполняются условия В') Д/гя любого компакта Ж С G существуют такие локально интегрируемые функции х(-) ^ fc(-), ^mo ^тгя любых (t,x) G J^ a G Я имеют место неравенства \\Fax(t,x)\\^k(t). Г) lim [ A0) (П) Тогда существуют 5 > 0, окрестность G D Г в G, и окрестность U Э а в Я такие, что для (?о,#о) ^ ^ a ?U решение xa(t,to,xo) задачи Коши (9), B) определено на отрезке А = [to — 5, ti + 5] t0 —> г g [to, ti], ж0 ^ ж(г), а ^ а равномерно по t G [to,ti]. Доказательство этой теоремы проводится по той же схеме, что и доказательство теоремы 1 с небольшими изменениями. В пунк- пункте А) мы учитываем, что число 5 в локальной теореме существования определяется неравенствами G) и (8) п. 2.5.2 и в силу условия Вх) может быть выбрано одним и тем же для всех а е Я. В пункте Б) заменяем х\(-) решением ха(-) уравнения (9), а х^{^х х) — решением х(-). В оценке следует учесть, что теперь правые части уравнений разные, в связи с чем ха(т)-х(т) и D) заменяется неравенством — Fa(s, x(s))}ds t + k(s)\xa(s) — x(s)\ ds \ха(т) -ж(г)| + + U{Fa(s,x(s)) - Fu(s,x(s))}ds k(s)ds ¦ D')
2.5. Необходимые сведения из теории дифференциальных уравнений 181 В неравенстве E) надо заменить г на 2е, а 5 и U следует с учетом условий В') и Г) выбрать так, чтобы выполнялись неравенства t \{Fa(s,x(s))-F&(s,x(s))}ds U+5 < \Fa(s,x(s)-Fu(8,x(s))\ds^ to U+5 ?o -5 U A2) Тогда рассуждения пункта В) (с заменой D) на Dх)) остаются в силу одновременно для всех a G U. В пункте Г) следует в неравенство (8) внести уточнение, вытекаю- вытекающее из замены D) на Dх), после чего мы получаем x0 - x(t) ¦\\Fa(s,x(s))-Fa(s,x(s))\ ds k(s)ds и остальное очевидно. ¦ Следствие. Если выполнены все условия теоремы 2, причем условие Г) в усиленной форме: _ _ Гх) для любой функции х: [to,t\] -^ Rn, график которой лежит в G и любого a G Я lirn^ то решение xa(t,to,xo) задачи Коти (9), B) является на А х G x U непрерывной функцией от (t,to,xo,a). Доказательство. При любых (to,xo) ? G и а е U график решения х(-) = Ха(-Ло>%о)'- Д ~^ ^п лежит в G. Теперь мы можем применить теорему 2, заменив в ее условиях х(-) на х(-).ш
182 Гл. 2. Аппарат теории экстремальных задач Аналогом основного свойства фундаментальной матрицы линейной системы (формула A1) предыдущего пункта) является следующее тож- тождество: X(t,to,xo). A3) Оно автоматически вытекает из теоремы единственности, поскольку каждая из частей является решением уравнения A) и при t = г обе они совпадают. Читателям рекомендуется продумать связь между этим тождеством и принципом Гюйгенса п. 1.1.3. 2.5.6. Теорема о дифференцируемой зависимости решений от начальных данных. До сих пор наше изложение было основано на сравнительно слабых предположениях А)-В) п. 2.5.1. Чтобы продви- продвинуться далее и установить дифференцируемость решения задачи Коши X(t,to,xo) по начальному значению xq, эти предположения придется несколько усилить. При этом открывается возможность применения классической теоремы о неявной функции. В доказательстве теоремы этого пункта мы не будем останавливаться на существовании реше- решения X(t,to,xo) для (to,xo) G G и его продолжимости на все t ? А, поскольку и то и другое следует из теоремы 1 п. 2.5.5. Тем не менее читателю полезно убедиться в том, что оба эти факта также вытекают из теоремы о неявной функции и при желании можно было бы обойтись без ссылки на предыдущий пункт. (Аналогичное рассуждение будет полностью проведено в п. 2.5.7, где при еще более сильных предполо- предположениях доказывается дифференцируемость по to и теорема о неявной функции применяется в несколько ином варианте, чем здесь.) Теорема. Пусть на открытом множестве GcRx Rn функция F: G —> Rn удовлетворяет условиям А) и В) п. 2.5.1 и условию: Ъ') для любого t функция х i—> F(t, x) непрерывно дифференцируе- дифференцируема на сечении Gt = {х | (t,x) Е G}. Пусть х: [to,t\] —> Rn — решение уравнения A) п. 2.5.5, график Г = {(t,x(t)) | to < t < t\} которого содержится в G^u пусть 5, г и G — те же, что в теореме 1 п. 2.5.5; д = [?0-??i +?]. Тогда для любого фиксированного to Е А отображение хо ь-> о |—> X(-,to,xo) из B(x(to),e) в C(A,Rn) непрерывно дифференцируемо по Фреше, причем дх~0 =°(Мо)' A) где 17 — фундаментальная матрица решений уравнения в вариациях z = Fx(t,X(t,tQ,xQ))z. B) Доказательство. Пусть компакт Ж и функция k(t) — те же, что и в теореме 1 п. 2.5.5. Множество f = {х(') е С(Д,Rn) | (t,x(t)) eG,te A},
2.5. Необходимые сведения из теории дифференциальных уравнений 183 очевидно, открыто в C(A,Rn). Равенством t &(х0, x(-))(t) = х0 + [ F(s, x(s)) ds - x(t) C) to определим отображение ?T\ Rn x ^ —> C(A,Rn). Очевидно, что &(х0, х(-)) = 0 <& x(t) = X(t, t0, х0). D) о Пусть х~о G B(x(to),e) фиксировано и x(t) = X(t,to,x~o). Проверим, что в окрестности точки (хо,х(-)) применима классическая теорема о неявной функции п. 2.3.4. Действительно, «^жо(жо>ж(*)Жо] — Со» оче~ видно, непрерывна. Теперь вычислим производную Гато: а 10 а a - E) Чтобы убедиться в существовании предела, равномерного по t, заме- заметим, что по теореме о среднем (п. 2.2.3) * F(S,x(S))+aas))-F(s,x(s))dc а t0 A где ra(s)= r/max \\Fx(8,c)-Fx(s,x(s)m(8)\. Ввиду условия Бх) ra(s) —> 0 при каждом s и а [ 0, а в силу A) п. 2.5.1 |ra(s)| < 2fcE)||^||. По теореме Лебега об ограниченной сходи- сходимости [КФ, с. 302] убеждаемся в существовании предела E). Оператор
184 Гл. 2. Аппарат теории экстремальных задач ограничен: "If t J и непрерывно зависит от х(-), так как 1 = sup sup Fx(x,x(s))?(s) ds — Fx(s,x(s))^(s)ds При ||ж(-) — x(-)\\ —> О имеем в силу Бх) ||^(в,ад) - Fx(s,x(s))\\ -^ 0, V5 G А, и снова в силу A) п. 2.5.1 \\Fx(s,x(s)) — Fx(s,x(s))\\ ^2k(s), так что применима теорема Лебега. Сославшись на следствие 2 п. 2.2.3, уста- устанавливаем, что существует непрерывная производная Фреше ^(.). Пусть г](-) е C(A,Rn) произвольна. Согласно E) ds - № = ф) F) и для применимости теоремы о неявной функции нужно убедиться в однозначной разрешимости этого уравнения. Подстановкой + rj(t) = ((t) приведем его к интегральному уравнению to которое в свою очередь эквивалентно линейному дифференциальному уравнению C(t) = Fx(t, x(t))at) - Fx(t, x(t))ri(ty, C(*o) = 0. G) Остается сослаться на лемму п. 2.5.4. По теореме Банаха (п. 2.1.5) ^~^ ограничен. По теореме о неявной функции существует непрерывно диффе- дифференцируемое в некоторой окрестности U Э хо отображение ip: U -^ -^ C(A,Rn) такое, что ^(хо,(р(хо)) = 0. Согласно D) (p(xo)(t) = = X(t,to,xo), так что отображение xq \-^ X(t,to,xo) действительно
2.5. Необходимые сведения из теории дифференциальных уравнений 185 дифференцируемо по Фреше в точке Щ. По той же теореме о неявной функции и, как уже было найдено, ?(?) — решение интегрального уравнения F), принимающего вид to Следовательно, ? = Fx(s,x(s))?, ?(*<>) =?о и по теореме п. 2.5.4 ?(?) = О(?, ?q)?o- Отсюда дХ 2.5.7. Классическая теорема о дифференцируемой зависимо- зависимости решений от начальных данных. В этом пункте мы снова будем рассматривать задачу Коши x = F(t,x), A) x(t0) = х0, B) но уже в классической ситуации, когда F(t,x) и ее частная производ- производная Fx(t,x) непрерывны в G. Для удобства читателей, доказательство формулируемой ниже теоремы будет проведено независимо от дока- доказательств теорем пп. 2.5.5 и 2.5.6. Ссылки на локальную теорему существования (п. 2.5.2) и теорему единственности (п. 2.5.3) можно заменить ссылками на любой учебник по дифференциальным уравне- уравнениям. Теорема. Пусть на открытом множестве GcRx Rn функция F: G —> Rn и ее частная производная Fx непрерывны, и пусть х: [to,ti] —> Rn — решение уравнения A), график которого Г = = {(t,x(t)) | to ^ t ^ t\} содержится в G. Тогда существует такое 5 > 0 и такая окрестность G D Г, что для любых (?о>#о) tjl решение X(t,to,xo) задачи Коши A), B) определено на А = [to — 5,t\ + 5], является непрерывно дифференци- дифференцируемой функцией по совокупности аргументов в области (to — 5,t\ + + 5) х G и при этом Х(г,т,х(т)) = х(т), C) г)Х — {t,T,x(T)) = F{t,x(t)), D)
186 Гл. 2. Аппарат теории экстремальных задач — (?, t0, x(r)) = -Q(t, t)F(t, x(t)), E) дХ ¦(t,T,x0) =O(t,r), F) где Q,(t, т) — фундаментальная матрица решений системы уравне- уравнений в вариациях z = Fx(t,x(t))z. Доказательство. А) Применив локальную теорему существо- существования в точках (to,x(to)) и (t\,x(t\)), продолжим х(-) на отрезок А = [to — 5,t\ + 5] так, чтобы график {(t,x(t)) | t e А} по-прежнему содержался в G. После этого выберем г > 0 так, чтобы J{={(t,x) | ? g A, \x-x(t)\ ^e}cG. На компакте Ж функции F(t,x) и Fx(t,x) равномерно непрерывны. Б) Теперь в области f = {(x(-),to,xo)\\x(t)-x(t)\< < e,Vt 6 A;to e intА,ж0 б R™} С C'(A,R") xRxR" определим функцию '.?: ^ —> С(А, Rn) x R™ равенством ^())W f ^f (*)) ) . G) \ x(to) -хо ) Очевидно, что равенство Щх(-), to,xo) =0 эквивалентно задаче Ко- ши A), B). В частности, по условию теоремы ^(ж(-),т,ж(т)) = 0. Функция ^непрерывно дифференцируема в области (Q. Действительно, в G) входят линейные отображения х(-) \-^ dx(-)/dt, хо \-^ —хо, оператор краевых условий (ж(-),?0) ^ ^(^о) и оператор Немыцкого {x(t)} \-^ {F(t,x(t))}, которые непрерывно дифференциру- дифференцируемы согласно пп. 2.4.1, 2.4.3. При этом (F{t (9) &xo(x(-),to,Xo)[?o]=( Л V <10> В) Пусть х = x(i), так что (t,x) G Г. Проверим обратимость опера- оператора ,5гж(.)(ж(-),?,ж). Равенство 1П) х Rn
2.5. Необходимые сведения из теории дифференциальных уравнений 187 эквивалентно задаче Коши ?-ад?(*))? = <(*). ш = 7. (и) которая по теореме п. 2.5.4 имеет решение t = U(t,t)-y+ \u(t,s)((s)ds. Таким образом, #ж(.) отображает банахово пространство С1(А,Кп) на все банахово пространство C(A,Rn) x Rn. Поскольку при ?(•) = = 0 и 7 = 0, задача A1) имеет только нулевое решение, ^(.) взаимно однозначен. По теореме Банаха (п. 2.1.5) оператор 9Т~(\ существует и ограничен. Г) По классической теореме о неявной функции (п. 2.3.4) существу- существует такое 5 > О и такое непрерывно дифференцируемое отображение Ф: {(to,xo) \\to-t\<5, \x0 - х\ < 5} -+ Cl(A,Rn), что Обозначим Тогда X(t,to,xo) — решение задачи Коши A), B) и при этом — = F(t,X(t,to,xo)), A2) ^{to,xo) —> (to,xo), то Ф{1о,хо) —> Ф{1о,хо) в ul(/\,ti'i), т.е. X(t,to,xo) ^ X(t,to,xo) равномерно на А. Отсюда вытекает непре- непрерывность X(t,to,xo) по совокупности аргументов. То же рассуждение вместе с формулами A2)—A4) показывает, что и производные функции X(t,to,xo) непрерывны. Д) Предыдущие рассуждения были применимы к начальным усло- условиям (?о,#о), находящимся в (^-окрестности точки (t,x) G Г. Эта точка выбиралась произвольно, и можно покрыть весь график Г такими окрестностями. Если X^(t,to,xo) и X^(t,to,xo) определены в двух из этих окрестностей, которые имеют общую точку (?о,#о), то X^^(to,to,XO) = Xq = X^\tQ,to,Xo)
188 Гл. 2. Аппарат теории экстремальных задач и по теореме единственности п. 2.5.3 X^(t,to,xo)=X^(t,to,xo), Vte A. Следовательно, X(t,to,xo) корректно определено для (to,xo), принад- принадлежащих некоторой окрестности Г и, очевидно, непрерывно дифферен- дифференцируемо в этой окрестности. Е) Остается получить формулы C)-F). Равенство C) имеет место по теореме единственности, а тогда D) является следствием A2). По теореме о неявной функции а потому из A3) и (9) имеем дХ _ Поэтому ——(t,r,x(r)) является (по t) решением задачи Коши A1) с( = 0и 7 = ~%(r) = ~F(t,x(t)), и потому имеет место E). Аналогично ^ф дхо ' х^> а потому из A4) и A0) имеем дХ ,. ^ дхок' ' Следовательно, -—(t,r,x(r)) является (по t) решением задачи Ко- OXq ши A1) с С = 0, откуда а это равносильно F).i § 2.6*. Элементы выпуклого анализа Выпуклый анализ — это раздел математики, где изучают выпуклые множества и функции. Роль этих понятий была уже продемонстриро- продемонстрирована в п. 1.3.3 (теорема Куна-Таккера) и, учитывая, что в большинстве современных работ по экстремальным задачам выпуклость занимает важное место, мы, кроме элементарных сведений, даем здесь набро- набросок теории двойственности (теорема Фенхеля-Моро) и рассказываем о простейших свойствах субдифференциала — понятия, обобщающего на случай выпуклых функций понятие дифференциала. В §§ 3.3, 3.4,
2.6. Элементы выпуклого анализа 189 4.3 будет показано, как применяются эти понятия. Изложение этого параграфа опирается по преимуществу на пп.2.1.3 и 2.1.4. 2.6.1. Основные определения. Пусть X — линейное веществен- вещественное пространство. Определение 1. а) Множество СсХ называется выпуклым, если вместе с любыми двумя своими точками х\ и х^ оно содержит весь отрезок [#ь#2] = {х \ х = ах\ + A — а)х2, 0 < а < 1}. б) Множество А С X называется аффинным многообразием, если вместе с любыми двумя своими точками х\ и х^ оно содержит всю прямую {х | х = ах\ + A — а)х2, ol е R}. в) Множество К С X называется конусом (с вершиной в начале), если вместе с любой своей точкой xq оно содержит весь луч {ахо | а > 0}. Пустое множество по определению считается выпуклым, аффин- аффинным многообразием и конусом. Совокупность всех выпуклых множеств из X обозначается 2)(Х). Непосредственно из определения 1 вытекает Предложение 1. а) Пересечение любого числа выпуклых мно- множеств (соответственно аффинных многообразий или конусов) само является выпуклым множеством (соответственно аффинным мно- многообразием или конусом). б) Образ f(A) и полный прообраз f~l(B) выпуклых множеств (аффинных многообразий, конусов) А а X, В с Y при линейном отображении f: X —> Y является выпуклым множеством (аффин- (аффинным многообразием, конусом). в) Сдвиг С + ? выпуклого множества С (аффинного многообра- многообразия) является выпуклым множеством (аффинным многообразием). г) Конус К является выпуклым множеством тогда и только тогда, когда х\,Х2 G^4 (х\ + х%) Е К. д) Аффинное многообразие А является линейным подпростран- подпространством в X тогда и только тогда, когда 0 Е А. Упражнение 1. Докажите, что аффинное многообразие является сдви- сдвигом некоторого линейного подпространства. Определение 2. а) Пересечение всех выпуклых множеств С, содержащих данное множество М, называется выпуклой оболочкой множества М и обозначается convM; convM= П С, С еШМ). A) cdm ^v ' v '
190 Гл. 2. Аппарат теории экстремальных задач б) Если в A) вместо выпуклых множеств берутся всевозможные выпуклые конусы К D М (аффинные многообразия A D М, линейные подпространства L D М), то пересечение называется конической (со- (соответственно аффинной или линейной) оболочкой М и обозначается coneM (affM, HnM). Определение 3. Пусть х\, ..., хп — элементы из X. Элемент п X — > Л^Х^ \ ) i=\ называется линейной, аффинной, конической или выпуклой комбина- комбинацией х\, ..., хп, если в B) соответственно: для линейной — А^ любые, п для аффинной — J^ Ai = 1, i=\ для конической — А^ ^ 0, п для выпуклой — ^\ = \, \^ 0. г=\ По индукции доказывается, что если х\, ..., хп принадлежат выпук- выпуклому множеству С, выпуклому конусу К, аффинному многообразию А или линейному подпространству L, то соответственно их выпуклая, коническая, линейная или аффинная комбинация принадлежит С, К, А или L. Предложение 2. а) Выпуклая (коническая, аффинная или линейная) оболочка множества М состоит из всех выпуклых (ко- (конических, аффинных или линейных) комбинаций элементов из М. 6) Множество М выпукло (является выпуклым конусом, аф- аффинным многообразием или линейным подпространством) тогда и только тогда, когда оно совпадает со своей выпуклой (кониче- (конической, аффинной или линейной) оболочкой. Доказательство проведем для выпуклого множества М — в остальных случаях оно аналогично. Обозначим через М множество всех выпуклых комбинаций точек из М. Множество М D М и выпук- выпукло, ибо если т\ 1712 i=\ i=\ V^Q/r = i? j = 1,2, г=\ то для а е [0, 1] m\ I7i2
2.6. Элементы выпуклого анализа 191 а эта последняя сумма является выпуклой^комбинацией точек хц,... • ••>#mib х\2, •••, хт22. Значит, convМ С М (ибо convM есть пересе- пересечение всех выпуклых множеств, содержащих М). С другой стороны, как было замечено выше, каждая точка из М додержится в любом выпуклом множестве, содержащем М, и потому М С convM. Если М выпукло, то в A) можно взять С = М, и тогда, очевидно, convM = М. Обратно, если convM = М, то М выпукло по определе- определению выпуклой оболочки и предложению 1 а).и Упражнение 2. Докажите, что алгебраическая сумма М\ + ... + Мп = { X | X = ^ Жг, Xi ? М, 1= \, ... ,П конечного числа выпуклых множеств (конусов, аффинных многообразий, ли- линейных подпространств) обладает тем же свойством. Примеры. 1) Выпуклые непустые множества на прямой — это од- одноточечные множества и промежутки всех видов (отрезки, интервалы, полуинтервалы, лучи замкнутые и открытые и вся прямая). 2) Всякое линейное подпространство или аффинное многообразие — выпуклое множество. Упражнение 3. Докажите эти утверждения. 3) Выпуклым многогранником называется выпуклая оболочка ко- конечного множества точек. Важный частный случай — п-мерный сим- симплекс, т. е. выпуклая оболочка п + 1 аффинно независимых точек (ни- (никакая из них не является аффинной комбинацией остальных). Упражнение 4. Докажите, что выпуклая оболочка трех точек в R , не лежащих на одной прямой (двумерный симплекс), является треугольником с вершинами в этих точках. Что будет, если точки лежат на одной прямой? В конечномерном пространстве предложение 2 можно усилить. Со- Соответствующее утверждение мы называем теоремой Каратеодори, хотя, строго говоря, это название относится лишь к той его части, в которой идет речь о выпуклой оболочке. Теорема Каратеодори. Пусть dim (linA) < оо. Каждая точ- точка, принадлежащая выпуклой (конической, аффинной или линейной) оболочке множества А, является выпуклой (конической, аффинной или линейной) комбинацией не более чем s точек х\, ..., xs из А. Для выпуклой и аффинной оболочек s = п + 1 и точки х\, ..., xs можно считать аффинно независимыми. Для конической и линейной оболочек s = п и точки х\, ..., xs можно считать линейно независимыми. Доказательство. А) Ограничимся наиболее сложным случаем выпуклой оболочки, указав затем, какие изменения следует внести в доказательство в остальных трех случаях.
192 Гл. 2. Аппарат теории экстремальных задач Согласно предложению 2 а) каждое х G conv А может быть пред- представлено в виде х = Х\Х\ - к г=\ \kxk, > О, = 1, C) (в определении выпуклой комбинации А^ > 0, но ясно, что А^ = О можно опустить). Покажем, что если х\, ..., Xk аффинно зависимы, то число точек в этом наборе можно уменьшить, сохранив представление вида C). Действительно, если точки х\, ..., х^ аффинно зависимы, то одна из них есть аффинная комбинация остальных; без ограничения общ- к-\ ности Xk = 1Л\Х\ + ... + fik-\Xk-\, J2 №г — 1- Положив еще /i& = — 1, г=1 к к имеем J2 1^гхг — О' J2 № = 0- Пусть теперь г=1 г=1 а = mm < Тогда г=1 г=1 г=1 г=1 причем все AJ ^0 в силу выбора а и по крайней мере одно из них равно нулю. Удалив из набора {х\,... ,хь} те Xi, для которых А^ = = 0, мы получаем представление вида C) с меньшим числом точек к к к \ г=1 г=1 г=1 Обозначим через s(#) наименьшую мощность набора {х\,... ,Xk}, для которого представление C) возможно (в каждом непустом мно- множестве натуральных чисел есть наименьшее). Только что прове- проведенное рассуждение показывает, что в наборе {х\,... ,xs^} точки должны быть аффинно независимы. Остается заметить, что в 71- мерном пространстве любые п + 2 точки {х\,... ,жп+2} аффинно зависимы. Действительно, точки Xi — хп+2, г = 1,...,п+ 1, долж- должны быть линейно зависимыми, и если, например, xn+i — хп+2 = / \ J2 г=1 п п 1 — J^ А^ + J2 г=1 г=1 остальных. , ТО Хп+\ = п+2 + ^ Лгжг- ТаК КаК г=1 / г=1 = 1, то жп+1 является аффинной комбинацией
2.6. Элементы выпуклого анализа 193 Б) Для случая аффинной оболочки в приведенном рассуждении опускается все, связанное с неравенствами Л^ > О, А^ ^ О, и можно положить а = —Xi/fii для любого г с щ ф 0. В остальных двух случаях аффинные комбинации заменяются ли- линейными и число линейно независимых точек не может быть больше п. Для конической оболочки сохраняются рассуждения с неравенствами; для линейной оболочки и их можно опустить. ¦ Переходим к описанию выпуклых функций. Здесь, как и далее в этом параграфе, будем называть функцией отображение /: X —> R, где R = R U {—оо, +оо} — расширенная числовая прямая 0 . С каждой функцией можно связать два множества: dom/ = {х е X | f(x) < +оо}, epi/ = {(х,а) GlxR|a^ f(x), x e dom/}, называемые соответственно эффективным множеством и надграфи- ком функции /. Упражнение 5. Докажите, чт_о_множество С С X х R является надгра- фиком некоторой функции /: X —*> R тогда и только тогда, когда (ж, а) Е С, C^ а^> (х,/3) еС. Определение 4. Функция /, у которой dom/ ф 0 и всюду /(ж) > —оо, называется собственной, остальные функции называются несобственными. Функция /: X —> R на линейном пространстве X называется выпуклой, если epi/ — выпуклое множество в X х R. Совокупность всех выпуклых функций на X обозначим 1/[Х\ Прямо из этого определения вытекает Предложение 3. а) Для выпуклости собственной функции / необходимо и достаточно, чтобы для любых точек Х{ Е dom/ п и любых oil ^ 0, г = \,...,п, таких, что J2 ai = Ь выполнялось г=1 неравенство Иенссена: п \ п D) г=1 О Арифметические операции и неравенства, в которых участвуют несоб- несобственные числа +оо и —оо, определяются так (далее а Е R любое, р > 0): (+оо) + (+оо) =+оо, (+оо)(±оо) = ±оо, +оо > а ±оо + а = ±оо, (—оо)(±оо) = ^оо, —оо < а, ( —ОО) + ( — ОО) = —ОО, (i°°) ' Р = ioo, +OO > —ОО, -(+оо) = -оо, (±оо) -0 = 0, — (—оо) = +оо, (i°°) ' (~р) = Т°°» выражения (+оо) — (+оо), (+оо) + (—оо) и (—оо) — (—оо) объявляются ли- лишенными смысла; не определяются и операции деления с несобственными числами. 7 В. М. Алексеев и др.
194 Гл. 2. Аппарат теории экстремальных задач п б) Сумма Yl fi(x) конечного числа и верхняя грань Vafa(%) = г=1 = sup{fa(x)} любого семейства выпуклых функций выпукла. а Примеры. 1) Выпуклые функции на прямой. Пусть fo(x): (а,/3) —> R, причем на интервале (а,/3) С R существует произ- производная /о(ж), которая не убывает. Положим Г ff\(r\ Т f1 (cv Й\ •^ ' ~ | +оо, х ф (а,/?). Для этой функции dom/ = (a,C). Проверим, что она выпукла. Про- Произвольная точка отрезка, соединяющего точки (xi,Zi) ? epi/, i = 1,2, имеет вид (ах\ + A — а)#2> otz\ + A — а)^), а ? [О, 1]. Применим формулу Лагранжа: OLZ\ + A — Oi)z2 — j(oiX\ + A — Qt)x2) ^ ^ af(x\) + A — a)f(x2) — f(pLX\ + A — a = aff(c\)(x\ - (ax\ + A - a)x2))+ + A - a)f(c2)(x2 - (axi + A - так как x\ ^ c\ ^ axi + A — a)^2 ^ c2 ^ ^2 и производная по условию не убывает. Следовательно, (ах\ + A — a)x2,az\ + A — a)^) ? epi/ и / выпукла. ¦ Упражнение 6. Пусть выпуклая функция /: R —»> R конечна на интер- интервале / = (а,C). Докажите, что / непрерывна на / и имеет в каждой точке х ? I левую и правую производные f-'(x), /+;(ж), которые на / не убывают и совпадают всюду, кроме не более чем счетного множества точек. 2) Пусть на выпуклом открытом множестве U нормированного про- пространства X функция /о принадлежит классу С2 (п. 2.2.5) и ее второй дифференциал d2fo = /о'(ж)[?>?] неотрицателен. Как и в предыдущем примере, положим f(x) = { Мх), х б U, J ^ ' \ +00, х фи. Ограничение этой функции на любую прямую в X обладает свойствами функции, рассмотренной в предыдущем примере (докажите!). Поэтому / выпукла (для проверки выпуклости epi/ достаточно ограничиться всевозможными сечениями этого множества двумерными вертикальны- вертикальными плоскостями в X х R). Эти примеры дают нам большой запас конкретных выпуклых функ- функций. Таковыми будут на R функции ех, ах2 + Ъх + с при а ^ 0, — In x (дополненный значением +оо при х ^ 0) и т. д. В евклидовом про- пространстве выпуклой является квадратичная функция f(x) = (Ах | х) + + (Ъ | х) + с, где А — положительно определенный симметричный оператор.
2.6. Элементы выпуклого анализа 195 3) Индикаторная функция. Так называется функция Ьоо, х ? А, О, хеА. Ясно, что 5А(х) е Т[Х) тогда и только тогда, когда А е %)(Х). 4) Функция Минковского (см. п. 2.1.3). Неравенство Иенсена D) является источником многих важных неравенств, используемых в раз- разных разделах математики. В частности, применив его (с с^ = 1/п) к функциям f / ч _ Г -Inж, х >0, /lW ~ | +оо, х <0, !ж1пж, ж > О, О, ж = О, +оо, ж < О, мы получаем в первом случае известное неравенство Коши между средним арифметическим и средним геометрическим, а во втором — важное в теории вероятностей неравенство для энтропии распределе- / п НИЯ (pi, ... ,Рп)> гДе Pi = %i / У2 Xi, Xi ^ 0, / i=l n if (p) = — У^Рг lnp^ ^ Inn. i=\ 2.6.2. Выпуклые множества и функции в линейных тополо- топологических пространствах. Предположим теперь, что X — локально выпуклое линейное топологическое пространство [КФ, гл. III, §5]. Как известно, в этом случае сопряженное пространство X*, состоящее из всех линейных непрерывных функционалов, является достаточно богатым (см. там же, гл. IV, §§1-2), и это нам доставляет большой запас выпуклых множеств и функций. Простейшими выпуклыми множествами в X являются гиперплос- гиперплоскости и полупространства (здесь х* е X*) Н(х*,а) = {х | (х*,х) = а} — гиперплоскость, if_i_(x*,a) = {х | (х*,х) ^ а} 1 — замкнутые полу- Н_(х\а) = {х | (х\х) ^ a} J пространства, о Н-(х*,а) = {х | (х*,х) < а} | — открытые Н-(х*,а) = {х | (х*,х) > а} ) полупространства. Упражнение 1. Проверьте, что эти множества выпуклы. 7*
196 Гл. 2. Аппарат теории экстремальных задач Далее, назовем выпуклым полиэдром пересечение конечного числа замкнутых полупространств (подчеркнем, что это пересечение не обя- обязано быть ограниченным множеством). Упражнение 2. Докажите, что в Rn всякий выпуклый многогран- многогранник (п. 2.6.1) является выпуклым полиэдром и что всякий ограниченный вы- выпуклый полиэдр является выпуклым многогранником. Приведем сводку нужных в дальнейшем топологических свойств выпуклых множеств (по поводу встречающихся топологических терми- терминов см. [КФ, гл. III, §5]). Предложение 1. Пусть А — выпуклое множество. Тогда: а) все точки полуинтервала [х\,Х2), где х\ Е int A, x% Е А, при- принадлежат int А; б) внутренностъ_ int А и замыкание А множества А выпуклы; если int Аф 0, то А = int A. Доказательство, а) Пусть Vc A — выпуклая окрестность точки х\. Произвольная точка х Е [х\,Х2) имеет вид х = ах\ + A — — а)х2, 0<а< 1 и aV + A — а)х2 — ее окрестность, содержащаяся в А, т. е. х Е int A. Из утверждения а) следует, что А с int А, если int А ф 0, откуда А с int А. Обратное включение очевидно. б) Если Xi E int А, г = 1,2, то, согласно а), [жь^г] Е int A, т.е. int А выпукла. Пусть теперь Xi E А, г = 1,2. Возьмем любую выпуклую окрестность нуля V. По определению замыкания существуют х\ Е (xi + + V) П А, г = 1,2. Для произвольной точки х = ах\ + A — а)х2 Е Е [#ь#2] положим х' = a#i + A — а)х'2. Тогда жх Е А и жх Е a(^i + + V) + A — a)(#2 + Ю = # t^'_T- e- кажДая окрестность точки х пересекается с А, откуда х Е А и А выпукло. ¦ Определение 1. Пересечение всех замкнутых выпуклых мно- множеств, содержащих множество А, называется выпуклым замыканием множества А и обозначается conv A. Ясно, что conv А выпукло и замкнуто. Предложение 2. а) conv A = А <^> множество А выпукло и за- замкнуто; б) conv А совпадает с пересечением всех замкнутых полупро- полупространств, содержащих А; в) conv A = conv A. Доказательство. Первое утверждение непосредственно следует из определения. Включение conv А С conv А также очевидно (не вся- всякое выпуклое множество, содержащее А, еще и замкнуто), а потому convA С conv А. С другой стороны, conv Д будучи выпуклым (пред- (предложение 16)), замкнутым и содержащим А, должно по определению содержать также и conv А, откуда conv A = conv A. Далее, обозначим через В пересечение всех замкнутых полупро- полупространств, содержащих А. Тогда conv А С В (не всякое замкнутое вы- выпуклое множество, содержащее А, является еще и полупространством).
2.6. Элементы выпуклого анализа 197 Пусть точка xq ^ conv А. По второй теореме отделимости (п. 2.1.4) существует линейный функционал х* Е X*, строго разделяющий xq и convA (х*,хо}> sup (x*,x)=a. хGconvA Отсюда xq ^ Н+(х*, a) D conv A D А, и потому жо ^ В. Следовательно, conv А = В. ш Упражнение 3. В гильбертовом пространстве h рассмотрим беско- Г °° 1 нечномерный эллипсоид В = < х = {х\,Х2,...) ^ (хп/ап) < 1 > с полуося- l n=l J ми ап. а) Докажите, что множество В выпукло и замкнуто. б) Найдите условия на ап, при которых ink В ф 0. в) Пусть int В ф 0 и точка у = (у\,у2, •••) лежит на границе эллипсоида, оо т. е. Y1 {Уп/сьп) = 1- Докажите, что через у можно провести гиперплоскость п=\ так, что В будет лежать по одну ее сторону. г) Всегда ли верно предыдущее утверждение, если int В = 0? Подобно тому как простейшими выпуклыми множествами являются полупространства, простейшими выпуклыми функциями будут аффин- аффинные функции а(х) = (х*,х)-Ь, жЧ1, Ъ е R. Упражнение 4. Докажите, что а(-) выпукла; найдите epia. Предложения 1 и 2 имеют свои аналоги. К их формулировке мы и перейдем. Определение 2. Пусть /: X —> R. Функция /, определяемая условием epi/ = epi/, называется замыканием функции /; если / = /, то функция называется замкнутой. Функция conv/, опре- определяемая условием epi (conv/) = conv (epi/), называется выпуклым замыканием /. Упражнение 5. Проверьте, что epi/ и conv/ суть надграфики некото- некоторых функций (см. упражнение 5 п. 2.6.1). Ясно, что conv/ = / <^> / выпукла и замкнута. Напомним также, что функция /: X —> R называется полунепре- полунепрерывной снизу в точке хо, если lira /(ж) ^ /(%), и просто полунепре- рывной снизу, если то же самое верно для любого х§. Упражнение 6. Докажите, что /: X —>> R полунепрерывна снизу тогда и только тогда, когда для любого с Е R множество i?c/ = {ж | /(ж) ^ с} замкнуто в X. Предложение 3. а) Для того чтобы собственная функция была замкнутой, необходимо и достаточно, чтобы она была полу- полунепрерывна снизу.
198 Гл. 2. Аппарат теории экстремальных задач б) Для того чтобы выпуклая функция / была непрерывной на int dom / достаточно, чтобы / была ограничена в окрестности U некоторой точки х и конечна в точке х. При этом / собственная, int dom / ^ 0, intepi/ = {(х,а) е X x~R\ x e int dom/, а > f(x)} ^ 0 и f(x) = (conv/)(#), Ух G int dom/. В соответствии с упражнением 6 будем проверять замкнутость множеств 9Bcf • Доказательство. А) Пусть / замкнутая функция. Тогда epi/ — замкнутое множество в X х R. Гиперплоскость Н = {(х,а \ а = с} также замкнута. Значит, замкнуто и множество 9Scf = {х \ f(x) < с}, ибо epi/ П Н = {(х,с) | х е 9Scf} и отображение х ь-> (ж, с) является гомеоморфизмом. Пусть, наоборот, все i/?c/ замкнуты и (жо,о^о) ^ epi/- Тогда f(xo) > ао, а следовательно, /(жо) > &о + ? для некоторого ? > О и хо ^ ^ско+е/- Ввиду замкнутости ^ско+е/ существует окрестность У Э жо такая, что У П 3?ao+?f = 0, т. е. f(x) > ао -\- г, х ^V. Открытое множество {(х,а) \ х е V, а < ао + г} содержит (хо,ао) и не пересе- пересекается с epi/. Следовательно, дополнение к epi/ открыто, а сам epi/ замкнут. Б) Лемма. Пусть X — локально выпуклое пространство, V — выпуклая окрестность точки х в X, f — выпуклая функция на X, принимающая в точке х G V конечное значение (\f(x)\ < oq) и огра- ограниченная в V сверху. Тогда / непрерывна в точке х. Доказательство леммы. Произведя сдвиг х ь-> х + х и вы- вычитая из / константу f(x), сведем дело к случаю, когда х = 0, 0 G G V, /@) = 0, sup f(x) ^ С. При этом У можно считать симметричной окрестностью нуля (иначе мы рассмотрели бы W = V П (—У)). Пусть 0 < а < 1 и ж G aV. Тогда ж/a G V и из-за выпуклости / мы имеем /О) = /(A - аH + ах jo) < A - a)/@) + af(x/a) < aC. С другой стороны, —х/а G V ввиду симметрии V и, используя равен- равенство 0 = х/(\ -\- а) -\- а/(\ + а)(—ж/а) и выпуклость /, получаем 0 = /@) = f(x/(l + a) + a/(l + a)(-a:/a)) < < 1/A + a)f(x) + a/(l + a)f(-x/a), а значит, /(ж) ^ —af(—x/a) ^ —aC. Итак, если ж G aV, то \f(x)\ ^ aC, т. е. / непрерывна в нуле. ¦ Следствие. В условиях леммы int dom / ^ 0. В) Возвращаемся к доказательству пункта б) предложения 3. По лемме и следствию из нее / непрерывна вхи int dom/ ^ 0.
2.6. Элементы выпуклого анализа 199 Предположим, что f(y) = —оо для некоторого у, т. е. для любого a Е R точка (у, a) Е epi/. Поскольку epi/ выпукло, (A - Х)х + \y,(l- X)f(x) + Аа) е epi/, для любого a G R, откуда /(A — Х)х + А?/) = —оо, что при A j О противоречит непрерывности /вж. Таким образом, f(y) > —оо всюду, т. е. / является собственной. Пусть теперь у Е intdom/. Найдем р > 1 такое, что z = ж + р(у — — ж) Е intdom/ (это можно сделать, ибо пересечение открытого мно- множества intdom/ с прямой, проходящей через х и у, есть открытый интервал этой прямой). Гомотетия G с центром в z и коэффициентом (р — \)/р переводит х в у и окрестность У в окрестность V точки у. При этом, если ( е G(V) = V, то ( = (р - \)/рх + z/p, x e V и /(о <9-^ т + ^ т < ^ с+i /(^), следовательно, / непрерывна в точке у по лемме, т. е. / непрерывна на intdom/. Если (жо,о^о) ? intepi/, то по определению найдутся окрестность W точки xq и ? > 0 такие, что {(ж, а) \ х € W, \а — ао\ < г} С epi/, откуда хо G intdom/ и ао > /(#о). Обратное включение: {(ж, а) | ж G intdom/, а > /(ж)} С intepi/ очевидно; в частности, intepi/ ^ 0. Поскольку / выпукла, conv(epi/) = epi/. Вспоминая определение 2 и предложение 2в), имеем epi(conv/) = conv (epi/) = conv(epi/) = Следовательно, всегда (conv/)(ж) ^ /(#)• Если же / непрерывна в точ- точке х (или хотя бы полунепрерывна снизу) и f(x) > а, то это же неравенство сохранится и в целой окрестности точки х, а потому (х, а) ^ epi/ = epi(conv/) и (conv/)(x) > а. Поэтому (conv/)(x) = = /(ж). В частности, в условиях пункта б) доказываемого утверждения это равенство верно для х G int(dom/). ¦ Упражнение 7. Пусть / выпукла на X и /(ж) = —оо в некоторой точке х G intdom/. Тогда /(ж) = —оо, Ух Е intdom/. Определение 3. Аффинная функция а(ж) = (х*,х) — Ъ называ- называется опорной для функции /, если: а) а(х) < /(ж) для всех х; б) для всякого г > 0 найдется такое ж, что а(ж) > /(ж) — е. Другими словами, b = sup{(x*,x)-f(x)}. A)
200 Гл. 2. Аппарат теории экстремальных задач Теорема Минковского. Собственная функция / выпукла и замкнута тогда и только тогда, когда она является верхней гранью множества всех своих опорных аффинных функций. Доказательство. 1) «Тогда». Аффинная функция выпукла и за- замкнута, так как ее надграфик — замкнутое полупространство. Далее, для любого семейства функций {fa} имеем epi \ sup fa I = \ (х, z)\z^ sup fa(x) \ = I J I « ) = n{(x,z) | z > fa(x)} = nepi/a, B) a a и если все fa выпуклы и замкнуты, то epifa — выпуклые замкнутые множества и их пересечение обладает тем же свойством. 2) «Т о л ь к о т о г д а». По условию В = epi / — замкнутое выпуклое непустое множество bIxR. Согласно предложению 2 В является пересечением всех содержащих его замкнутых полупространств. Так как всякий линейный непрерывный функционал на X х R имеет вид (х*,х) + Xz, х* е X*, Л G R (см. п. 2.1.2), замкнутое полупространство определяется неравенством (x*,x)+\z^b. C) Поскольку В = epi/ непусто и вместе со всякой своей точкой (xo,zo) содержит все точки (xq,z), z > zq, В может содержаться в полупро- полупространстве C), только если Л < 0. При Л = 0 полупространство C) будем называть вертикальным. Очевидно, что epi/ = {(x,z) | f(x) O}C {(x,z) | (x*,x) ^b}^ С {х | (ж*, х) < b} = Я+(ж*,6) => => epi/ С Н+(х*,Ъ) xR. При Л < 0 все члены неравенства C) можно разделить на |Л|, так что можно считать Л = — 1 и полупространство C) совпадает с надгра- фиком аффинной функции а(х) = (х*,х) — Ь. Но В = epi/ С epi a <^> f(x) > а(х), Ух. Поэтому epi/=nepian П [Я+ (ж*, b) x R]. D) а^/ domfCH+(x*,b) Теперь заметим, что хотя бы одна аффинная olq ^ / существует (в противном случае epi/ вместе с точкой (жо>^о) содержало бы все точки (xq,z), zeR, откуда f(xo) = —оо, вопреки тому, что / —
2.6. Элементы выпуклого анализа 201 собственная). Но epia0 ПЯ+(ж*,6) х R = {(x,z) | ао(ж) < z, (ж*, х) < Ъ} = = nUx,z)\ao(x) + \((x*,x)-b)^z} = = П ер1{ао(ж)+Л((ж*,ж) -Ъ)}, и если ао(ж) < f(x) и dom/ С Н+(х*,Ь), то /(ж) < +оо => (х\х) -Ъ^0^> ао(х) + Х((х\ х) - Ъ) < /(ж). Следовательно, epiao П [Я+(ж*,6) х R] с П epia, так что в D) мы можем избавиться от всех вертикальных полупространств Н+ +(х*,Ь). Итак, epi / = П epi a и, согласно B), f(x) = sup{a(x) | а(ж) аффинная и < /(ж)}. E) Остается заметить, что в E) можно брать только опорные к / функции, поскольку верхняя грань не изменится, если из всех функций а(х) = = (х*,х) —b^ f(x) с одним и тем же х* мы оставим ту, у которой Ъ определяется равенством A), т.е. опорную. ¦ Упражнение 8. Если /: X —»> R выпукла и замкнута и f(x) = — оо, то f(x) = —оо, Ух G dom/. Для гладких функций мы можем воспользоваться следующим утверждением. Предложение 4. Если функция f выпукла и дифференцируема по Гато в точке х$, то функция а(х) = (/f(xq),x — xq) + }(xq) является для нее опорной. Доказательство. Условие б) определения 3 следует из равен- равенства а(хо) = f(xo). Предположим, что f(x\) < а(х\) для некоторого х\. Тогда f(x\) < а(х\) — е для некоторого е > 0, и потому при 0 < а < 1 f(x0 + a(xi - ж0)) = /(A - а)х0 < A - a)/(x0) +a/(xi) < A - a)f(x0) + a(a(xx) - e) = = A - a)f(xo) + a(/(x0) + (/f(^o), xx - x0) - e) = = f(x0) + a(/f ( Следовательно, < (fr(xo),xi -х0) -е, что противоречиво. Тем самым выполнено и условие а).и
202 Гл. 2. Аппарат теории экстремальных задач Пусть теперь функция /: X —> R дифференцируема по Гато в каждой точке xq е X. Составим для нее функцию Вейерштрас- са (ср. п. 1.4.4): Цх, хо) = f(x) - f(x0) - (fr(xo), х - х0). Предложение 5. Для того чтобы f была выпуклой, необхо- необходимо и достаточно, чтобы выполнялось неравенство &(х, xq) ^ 0, Ух, хо. Доказательство, а) Если / выпукла, то %>(х,хо) > 0, Ух, хо в силу только что доказанного предложения 4. б) Пусть хо = ах\ + A — а)х2, 0 ^ а ^ 1. Неравенства *ё(х\, хо) ^ 0, <ё(х2,хо) > 0 означают, что точки (x\,f(x\)), (x2,f(x2)) лежат в по- полупространстве {(x,z) | z > f(xo) + (fr(xo),x — хо}}. Следовательно, и отрезок, их соединяющий, лежит в том же полупространстве, а по- потому , ax\-\-(l- a)x2 - x0) = Таким образом, выполнение условия Вейерштрасса из п. 1.4.4 для всех точек (t,x,x) эквивалентно выпуклости лагранжиана L(t,x,x) по х. 2.6.3. Преобразование Лежандра-Юнга-Фенхеля. Теорема Фенхеля-Моро. По-прежнему пусть X — локально выпуклое линейное топологическое пространство, а X* — его сопряженное. Зададимся теперь произвольной функцией /: X —> R и исследуем подробнее множество ее опорных функций. Естественно считать при этом функцию собственной, так как в соответствии с определением f(x) ^ а(х) > —оо всюду, если / имеет хотя бы одну опорную, а случай /(ж) = +оо тривиален: любая аффинная функция является опорной. Определение. Функция на X*, определяемая равенством {<>-/(*)} A) хех называется сопряженной к f функцией или ее преобразованием Юнга-Фенхеля (иногда преобразованием Лежандра), а функция /**(*)= sup{(p,x)-/*(p)} B) Рех* — второй сопряженной к / функцией. Из равенства A) п. 2.6.2 видно, что множество опорных для / функ- функций находится во взаимно однозначном соответствии с множеством тех р ? X*, для которых f*(p) конечно: (р,Г(р) ф ±оо) ~ ар(х) = (р,х) - f(p). C)
2.6. Элементы выпуклого анализа 203 Замечание. Несмотря на кажущуюся симметрию формул A) и B), /** ф (/*)*• Дело в том, что (/*)* по определению следует рас- рассматривать на (X*)*, а не на X. Только для рефлексивных пространств (/*)* и /** естественно отождествляются. Предложение 1. 1) Функции /* и /** выпуклы и замкнуты. 2) Для любых х G X и р G X* выполняется неравенство Юнга: №+f*(p)>(j>9x). D) 4) ?<ш* /(ж) < я(ж), то /*(р) > <f (р) и /**(ж) < <Г (х). Доказательство. 1) Из A) и B) видно, что обе функции полу- получаются как верхняя грань некоторого множества аффинных функций, а потому их надграфики являются (по формуле B) п. 2.6.2) пересече- пересечением замкнутых полупространств и, значит, выпуклы и замкнуты. 2) Из A) вытекает, что при любых х ? X и р G X* должно быть f*(p) ^ (р>х) — /(#)> что равносильно D). 3) По уже доказанному f(x) > (р,х) — /*(р), откуда /О) > sup{(p,x) - f*(p)} = f**(x). р 4) Очевидное следствие определений. ¦ Примеры. 1) Пусть f(x) = (х$,х) —b — аффинная функция. Такая функция имеет только одну опорную — себя самое. Поэтому Г(р) = snp{{p,x) - (х*0,х) + Ъ} = \ +00' I ± Х}: E) [ О р — Х0 /"(я) = snp{(p,x) - f*(p)} = (x*0,x) - b = f{x). F) 2) Пусть, как и в примере 1 п. 2.6.1, fix) = [ f0^' а<х<^ J^ } \ +оо, х ф (а,C), причем /о(ж) на (а, C) непрерывна и монотонно возрастает. Обозначим А= КтЫх), В= ЬтШх). Для любого р G (-4,-6) равенство р = /q(xq) выполняется при неко- некотором xq g (се,/3). Так как /(ж) — выпуклая функция, то (предложе- (предложение 4 п. 2.6.2) а(х) = f(x0) + f(xo)(x - х0) =рх- (рх0 - f(x0)) — опорная функция, и, значит, равенства Пр)=рхо-/оЫ, Р = /оЫ G)
204 Гл. 2. Аппарат теории экстремальных задач задают /*(р) параметрически в (А, В) (функция /*, определяемая равенствами G), называется в классическом анализе преобразованием Лежандра /о). Упражнения. 1. Что можно сказать в этом примере о f*(p) при р ? (А, В)? 2. Для следующих функций / на R указать dom/, epi/, проверить выпуклость и замкнутость и вычислить /* и /**: О, ж) е\ (ж In ж, ж > О, О, ж = О, +оо, ж < О, Г ха м) О, ж <0 { +оо, ж < О н) \х\а/а (о> 1). 3) Следующий пример мы используем далее в § 3.3. Предложение 2. Пусть функция /: Rs —> R определена равен- равенством f(x) = f(x\,...,xs) = тах{жь ...,xs}. +oo в остальных случаях. Доказательство. Поскольку / является максимумом конечного числа линейных (а значит, выпуклых и непрерывных) функций, ее вы- выпуклость и непрерывность очевидны. s Если р^ ^ О, J2 pi = I, то (р, х) г г=\ /*(р) = 5}, и потому = 0. С другой стороны, если /*(р) < +оо, то обязательно /*(р) = 0 (в силу однородности функций хи(рд)ижи тах{ж,... ,ж5}), т. е. для таких р выполняется неравенство Xi — тах{жь ...,xs} ^ 0, г=\ Подставляя в это неравенство Xj =0, j ^ i, Xi = ^, получаем Pi? < max{^,0}, откуда щ > 0. Положив в том же неравенстве Xi = a,
2.6. Элементы выпуклого анализа 205 г = 1,..., s, получаем г=1 г=1 4) Сопряженная функция к норме в нормирован- нормированном пространстве. Предложение 3. Пусть X — нормированное пространство, N(x) = ||ж||. Тогда 7V* совпадает с индикаторной функцией 5В* единичного шара сопряженного пространства X*, a N**(x) = N(x). Доказательство. Если ||р|| > 1, то (p,xq) > \\xq\\ для некоторого хо, и тогда f*(p) = sup{(p,x) - \\x\\} > sup{(p,ax0) -а||жо||} = +оо. Если же ||р|| ^ 1, то (р,х) ^ ||ж|| и f*(p) =sup((p,x) - ||ж||) =0. х Далее, Г(х) = sup{(p,x) - Г(р)} = sup [fax)} = \\x\\ = N(x). IIII 5) Пусть X = R, f(x) = 1/A -\-x2). Тогда, как легко понять, и, таким образом, равенство /**(#) = /(ж), которое мы наблюдали в примерах 1) и 4), здесь не выполняется. Следующая теорема, которая принадлежит к числу важнейших в выпуклом анализе, показывает, что совпадение / и /** отнюдь не является случайным. Теорема Фенхеля-Моро. Пусть X — локально выпуклое топологическое линейное пространство, f: X —> R — функция, всюду большая — оо. Тогда а) f**(x) = f(x) тогда и только тогда, когда f выпукла и зам- замкнута. б) /**(#) = sup{a(x) | а(х) — аффинная и < /(#)}• в) ?суш существует хотя бы одна аффинная функция а(х) ^ f(x) (эквивалентные условия: f*(p) ф +оо или f**(x) > —оо всюду), то /**(#) — наибольшая из замкнутых выпуклых функций, не пре- превосходящих f(x), т. е. /** = conv/. г) (/**)* = /*. Доказательство. А) «Только тогда» следует из 1) предложе- предложения 1. Предположим теперь, что а(х) < f(x) — аффинная функция.
206 Гл. 2. Аппарат теории экстремальных задач В примере 1) мы установили, что а**(ж) = а(х). Воспользовавшись снова предложением 1, имеем а потому sup{a(x) | а(х) — аффинная и < f(x)} < f**(x) < f(x). (8) Отсюда прежде всего следует «тогда» в а), ибо когда / выпукла и замкнута, левая и правая части в (8) совпадают (для собственной / по теореме Минковского, а если / = +оо, то и левая часть равна +оо). Тем самым а) доказано. Б) Для произвольной / возможны три случая. Если аффинной функции а(х) < f(x) не существует, то f*(p) = sup{(p, x) — f(x)} = х = +оо при всех р и, значит, /**(#) = —оо. Но в этом случае и левая часть в (8) равна —оо (sup0 = —оо по определению), т.е. б) имеет место. Если же существует аффинная а(х) < /(#), то из (8) вытекает, что /**(#) > —оо всюду. Остаются две возможности. Если /**(#) = = +00, то f(x) = +00 и обе функции равны левой части в (8), так как аффинная функция здесь может быть любой. Если же /** — собственная, то по теореме Минковского f**(x) = sup{a(x) | а(х) опорная для /**(ж)}. Сопоставляя с (8), находим sup{a(x) | а(х) аффинна и ^ f(x)} ^ ^ f**(x) = sup{a(x) | а(х) опорная для f**(x)} ^ sup{a(x) \ а(х) аф- аффинная и ^ f(x)}. Таким образом, и в этих случаях 6) имеет место. В) Пусть далее существуют аффинная функция а(х) ^ f(x) и g(x) ^ f(x) — произвольная замкнутая выпуклая функция. Положим ]г(х)=*ир{д(х),Г(х)}. Эта функция замкнута, выпукла и всюду f(x) ^ h(x) > —оо. Следова- Следовательно, h(x) = h**(x) </**(ж) ^h(x), а потому h(x) = f**(x) и д(х) < f**(x), чем доказано в). Г) Поскольку /**(#) < /(ж), то (/**)*(р) > /*(р). С другой стороны, в силу неравенства Юнга f(x) > a(#) = (p,x) — /*(р), откуда при конечном f*(p) в силу (8) Г(х) 2 а(х) и (Г)*(Р) = = snp((p,x) - Г(х)) < 8ир({р)Ж> - а(ж)) = Г(р). X X Случай f*(p) = +00 тривиален, а при f*(p) = —оо получаем f{x) = Г(х) = +ж и (Г*)*(р) = -сю = /*(р).
2.6. Элементы выпуклого анализа 207 Упражнение 3. Пусть / выпукла и ограничена сверху в окрестности некоторой точки. Тогда /**(ж) = f(x), Ух Е intdom/. 2.6.4. Субдифференциал. Теорема Моро-Рокафеллара. Теоре- Теорема Дубовицкого-Милютина. Пусть X — локально-выпуклое линей- линейное топологическое пространство, / — функция на X, /: X —> R. Определение. Субдифференциалом f в точке xq называется подмножество X*, состоящее из таких элементов х* Е X*, для которых выполнено неравенство f(x)-f(xo)^ (х*,х-хо), УхеХ. A) Субдифференциал функции / в точке хо обозначается df(xo). Таким образом, df(xo) — это множество «угловых коэффициентов» аффинных функций а(х) = (х*,х) — Ь, опорных к f в точке хо, т. е. таких, что в формуле A) п. 2.6.2 верхняя грань достигается в xq\ b= (х*,х0) - f(x0). B) Предложение 1. Су б дифференциал df(xo) является выпук- выпуклым (возможно пустым) множеством в X*. Доказательство. Пусть х* Е df(xo), г = 1,2. Тогда по опреде- определению f(x) — /(xq) ^ (х*,х — xq), f(x) — f(xo) ^ (^2,х — xq). Умножив первое неравенство на а, второе — на A — а), где а Е [0, 1], и склады- складывая, получаем f(x) - f(xo) > (ах\ х - х0), Ух. Примеры. 1) Субдифференциалы некоторых функ- функций на прямой и п л о скости. Предоставим читателю проверить, что: _ / [-1,1], х = 0, sign х, х ^ 0. б) /2 (ж) = dh(x) = в) h(x) =тах(|ж1|,|ж2|), (х Е R2) {у I \yi I +1: (signal, 0), @,si conv((signxi,0), @,
208 Гл. 2. Аппарат теории экстремальных задач 2) Субдифференциал нормы в нормированном про- пространстве. Предложение 2. Пусть X — нормированное пространство, X* — его сопряженное, N(x) = ||ж||. Тогда !В*, где В* — единичный шар сопряженного про- пространства, если х = 0, {ж* е X* | ||ж*|| = 1, (х*,х) = \\x\\}, если х ^ 0. Доказательство. Как было отмечено выше (соотношение C) п. 2.6.3), множество опорных функций к / находится во взаимно од- однозначном соответствии с множеством {х* G X*,f*(x*) ^ ±оо}, при- причем ах*(х) = (х*,х) -f*(x*). Согласно предложению 2 п. 2.6.3 так что опорными к N являются функции (х*,х), \\х*\\ ^ 1. Равенство B) превращается в О = (х\хо)-\\хо\\, C) так что любая функция х —> (х*,х), \\х*\\ ^ 1 является опорной к N в точке xq = 0 и cW@) = В*. Если же xq ^ 0, то множество х* ЕБ*, для которых имеет место C), совпадает с указанным в формулиров- формулировке. ¦ В приведенных выше примерах субдифференциал существовал в каждой точке. Разумеется, для невыпуклых функций (например, для — х\) его может не быть ни в одной точке. Однако и выпуклые функции могут не иметь субдифференциалов даже в точках из эффективной области. Вот простейший пример: Г~ " А ^ 1, х\ > 1. В точках х\ = +1 и Х2 = — 1 субдифференциал пуст. Достаточ- Достаточное условие существования субдифференциала будет получено да- далее (см. следствие из теоремы Моро-Рокафеллара). Следующая теорема является аналогом в выпуклом анализе теоре- теоремы о линейном свойстве дифференциала. Теорема Моро-Рокафеллара. Пусть fi, i = 1,...,п, — вы- выпуклые собственные функции на X. Тогда г=1
2.6. Элементы выпуклого анализа 209 Если же в некоторой точке х все функции, кроме, быть может, одной, непрерывны, а эта последняя в х конечна, то в любой точке х имеет место равенство ) =1 / г=1 Доказательство. Ограничимся случаем п = 2; большее число слагаемых рассматривается по индукции. Включение df\(x) + 9/2(ж) С С d(f\ +/2)(х) сразу следует из определения субдифференциала. Пусть х^ е d(f\ +/г)(жо). Без ограничения общности можно счи- считать, что хо = 0, х^ = 0, fi@) = 0, г = 1,2. Действительно, если эти соотношения не выполнены, то вместо /i и /2 можно рассмотреть функции дх (х) = /i Оо + х) - /i 92(х) = /2(^0 + ^) - Итак, пусть 0 G <9(/i + /2)@). Согласно A) это означает, что min(/1(x) + /2(х)) = /,@) + /2@) = 0. X Пусть х — та точка, где f\ непрерывна, а /2 конечна. Рассмотрим два выпуклых множества с, = а > /] (х), х s int dom /i} = int epi /i, -а ^ /2(ж)}. Ясно, что множества С\ и С2 выпуклы, непусты ((х, —/г(ж)) G Сг), Ci открыто и т^ ^ в силу предложения 3 б) п. 2.6.2: непрерывная в точке х функция f\ ограничена в ее окрестности) и С\ П С^ = 0. Действительно, если (а\,х\) G С\ П С^, то /i(xi) < а ^ —/2(^1), т.е. 0 = min(/!(i) + /2(ж)) < /,(аг,) + ^(ж,) < 0, чего не может быть. По первой теореме отделимости (см. п. 2.1.4) С\ отделяется от С^ ненулевым линейным функционалом (х*,/3): inf ((ж|,ж)+^а) ^ sup ((ж|,ж)+^а). F) (xa)GC () Ясно, что /3^0, ибо иначе верхняя грань равнялась бы +оо. Если допустить, что /3 = 0, то sup (x\,x) ^ inf (x\,x). х G int dom /i xGdom/2 Но максимум линейной функции не может достигаться во внутренней точке, а потому (х*,х) < sup (х*,х) < inf (ж|,ж) < (х*,х). d/ xGdom/
210 Гл. 2. Аппарат теории экстремальных задач Противоречие показывает, что /3^0. Следовательно, можно в F) поделить все члены на |/3|, и тогда, если обозначить х* = |/31 хо^^ и воспользоваться тем, что epi/i С intepi/i = С\ (предложение 1 п. 2.6.2), мы получим *19х) ~f\(x)}= sup {{Щ,х)-а} = = sup {(xi,x) -a} 4; inf {(xi,x) -a} = (x,a)ed (x,a)EC2 При ж = 0 значения функций в фигурных скобках совпадают и равны нулю (/i@) = /2@) = 0). Значит, /i(a;) -/,@) > (Щ,х), h(x) - Следствие 1. Пусть f — выпуклая функция, непрерывная в точке #о- Тогда df(xo) ^ 0. Доказательство. Рассмотрим функцию оо, х т^ xq. Функции / и 5{жо} удовлетворяют условиям теоремы Моро- Рокафеллара. Равенство X* = <Э(/ + 5{xq})(xq) = df(xo) + 95{жо}(хо) = df(xo) + X* означает, что df(xo) ^ 0. ¦ На самом деле, субдифференциал df(xo) выпуклой функции, непре- непрерывной в точке жо, является выпуклым компактом в *-слабой тополо- топологии. Пусть К — конус (п. 2.6.1). Конус К*, состоящий из тех элементов ж*, для которых (х*,х) > 0, Ух е К, называется конусом, сопряжен- сопряженным с К. Если О G К, то из определения A) вытекает сразу равенство 85 К @) = -К*. Следствие 2. Пусть К\, ..., Кп — выпуклые открытые кону- конусы, имеющие непустое пересечение. Тогда п кХ = П i=1 ) г=Х
2.6. Элементы выпуклого анализа 211 Действительно, добавим к Ki начало координат и рассмотрим функции 5Ki. Применив к ним теорему Моро-Рокафеллара (в точке xG П^, г=1 отличной от нуля, все 5Ki непрерывны), получим, что .—»i = -&M Д i^ 1 @) = -d IJ2SK* (°) г=1 г=1 Следствие 3. Теорема Ду б о в ицкоro-Ми лютина о пересечении конусов. Для того чтобы выпуклые конусы К\, ..., Кп, Кп+\, из которых первые п открыты, не пересекались, необходимо и достаточно, чтобы нашлись функционалы х* е G Щ, i = \,... ,п + \, не равные одновременно нулю и такие, что п+1 г=1 Доказательство. «Необходимо». Не ограничивая себя в общ- п ности, можно считать, что К = П ^ / 0. Тогда К — открытый конус, г=1 не пересекающийся по условию с Кп+\. По первой теореме отделимо- отделимости можно отделить К от Кп+\ ненулевым линейным функционалом у*ех*-. inf(y*,x}^ sup (y*,x). Последнее соотношение означает, что у* G К*, а (— \)у* G K^+i (точка х = 0 — предельная как для К, так и для Кп+\). По следствию 2 п разложим у* в сумму у* = ^x*,x*Gi(*, 1 < г < п; обозначив (—1)у* г=1 через ж^_|_1, получим требуемое. «Достаточно». Пусть не равны одновременно нулю х* G К"* и J^ ж* = 0. Пусть xG П i(j, ж / 0, и ж*о /0, 1 ^ io ^ п- Тогда г=\ ^=1 ж G intK"i0 ^> (х*о,х) > 0 и, значит, 0 = (Х]Ж1'Ж) ^ 0- Противоречие доказывает теорему. ¦ Теорема Ду бови цкого-Ми л юти на о субдифферен- субдифференциале максимума. Пусть f\, ..., fn — выпуклые функции на ло- локально выпуклом топологическом пространстве X, непрерывные в точке хо; f(x) = max{f\(x),..., fn(x)}; I = {i\,..., is} — набор индексов такой, что = f(xo) при i e I, < f(xo) при i ф I.
212 Гл. 2. Аппарат теории экстремальных задач Тогда df(x0) = conv{dfb{x0) U ... U dfia(x0)} = к=\ к=\ Доказательство. А) Если г е I и х* е dfi(xo), то f(x) - f(x0) = f{x) - fi(x0) > fi(x) - fi(x0) > > (ж*, x - xo) => x* e df(x0) => df(x0) D U dfi(x0 => iei => df(x0) D conv I \Jdfi{xo) \ , причем последняя импликация является следствием выпуклости df(xo) (предложение 1). Обратное включение будет доказано индукцией по числу функций. При п = 1 утверждение очевидно. В дальнейшем будем предполагать, что для (п — 1) функции оно верно. Б) Лемма. Если функция f(x) выпукла и неравенство ф) = f{x) - fix,) - (х\ х - х0) > 0 G) выполняется в некотором открытом выпуклом множестве V, при- причем (fix) =0 для некоторого х е V, то х* е df(xo). Доказательство. Покажем, что неравенство G) имеет место при всех х\ утверждение леммы следует отсюда по определению суб- субдифференциала. Пусть х произвольно. Функция (р выпукла вместе с /, и если (р(х) < < 0, то для любого а е @, 1) (рЦ\ — а)х + ах) < A — a)(pi~x) + а<р(х) = а<р(х) < 0. При достаточно малом а точка A — a)x + axeV, и мы пришли к противоречию. Следовательно, ip(x) ^ 0 при всех х. ш В) Пусть х* G df(xo). Покажем, что тогда либо хо является реше- решением следующей задачи выпуклого программирования: <Ро(х) = h (х) - f(x0) - (х*,х - х0) -^ inf, (8) <р{(х) = fi(x) - /(х0) - (х*,х -хо)^О, гфги (9) либо утверждение теоремы верно. Действительно, если первое не имеет места, то для некоторого х ipo(x) <O = (poixo), ipiix)^0, i^n. A0)
2.6. Элементы выпуклого анализа 213 По непрерывности неравенство (ро(х) < О сохраняется в некоторой выпуклой окрестности V Э х, т. е. /il(x)-/(x0)<(x*,x-x0>) xeV. A1) Теперь вспомним, что х* G df(xo), а следовательно, должно выпол- выполняться неравенство max{fi(x),..., fn(x)} - f(x0) > (х*,х-х0). Сопоставив его с неравенством A1), заключаем, что при х eV имеет место неравенство ф) = тах{/г(х) | г ф ц} - f(x0) - {х*,х- х0) > 0. A2) В то же время, согласно A0), ip(x) = max{fi(x) | г ф i\) - f(x0) - (х*,х-х0} < 0, так что (р(х) = 0 и по лемме х* G df(xo), где f(x) =max{fi(x) | г фц}. Поскольку / образовано (п — 1) функцией, то в силу индукционной гипотезы ж* е conv \ U dfik (х0) > С conv \ U dfik (х0) > . \ U dfik (х0) > Г) Зная, что xq — решение задачи (8)-(9), мы можем воспользо- воспользоваться теоремой Куна-Таккера (п. 1.3.3); следует обратить внимание на замечание, сделанное после доказательства этой теоремы: хотя в силу предложения 3 п. 2.6.2 наши функции непрерывны на intdom, вне него они могут обращаться в +оо. По теореме Куна-Таккера существуют не равные нулю одновремен- одновременно множители Лагранжа Ао, А^ ^ 0, г ф i\, для которых xq — точка минимума функции Лагранжа ?(х;\) = \о<ро(х) + J2XW(X)- Кроме того, должны выполняться условия дополняющей нежест- нежесткости, согласно которым А^ = 0, если (рг(хо) = /г(^о) — /(#о) Ф Ф 0, т.е. при г ф I. Перенумеровав Ао в А^ и (р$ в (р^, имеем 9?(х,\) = ^\i(pi(x), а так как множители Лагранжа определены iei с точностью до положительного множителя, можно считать, что ?А<=1. iei
214 Гл. 2. Аппарат теории экстремальных задач Теперь имеем ?{х, А) ^2 iei J \iei \iei / Применяя теорему Моро-Рокафеллара и учитывая, что из определения субдифференциала вытекает очевидное равенство d(Xf)(x0) = Xdf(x0), справедливое при А > 0, мы убеждаемся в том, что ж* = У^\{х*, х* е dfi(x0),
Глава 3 ПРИНЦИП ЛАГРАНЖА ДЛЯ ГЛАДКИХ ЗАДАЧ С ОГРАНИЧЕНИЯМИ Основная цель этой главы — обоснование принципа Лагранжа для гладких задач с ограничениями типа равенств и неравенств, а так- также вывод достаточных условий экстремума для таких задач. Общие результаты этой главы применяются затем в гл. 4 к задачам классиче- классического вариационного исчисления и оптимального управления. Посколь- Поскольку на элементарном уровне часть материала излагалась уже в гл. 1, читателю рекомендуется параллельно просматривать соответствующие места в §§ 1.3-1.4. §3.1. Элементарные задачи 3.1.1. Элементарные задачи без ограничений. Пусть X — топо- топологическое пространство, U — окрестность в X, /: U —> R. Задача f(x) -> extr C) называется элементарной задачей без ограничений (экстремальной — здесь и далее подразумевается). В случае, если X — линейное норми- нормированное пространство и / обладает гладкостью в каком-либо смысле, то задачу (з) называют элементарной гладкой задачей] если X — линейное топологическое пространство и / — выпуклая функция, то задачу (з) на минимум называют элементарной выпуклой задачей. Определение локального экстремума для задачи (з) см. в п. 1.2.1. Если х доставляет локальный минимум (максимум, экстремум), в за- задаче (з), мы пишем кратко х ? loaning (х ? locmax^, х ? locextr^). Определения различных терминов, связанных с понятием гладкости см. в §2.2. Начнем с простейшего — одномерного случая, когда X = R. Лемма. Пусть функция f: U —> R определена на некотором интервале [/CR, содержащем точку х. а) Если f имеет в точке х производные справа и слева и х ? ? loaning (Ьстахз), то f'(x + 0)^0, ff(x — 0)^0(ff(x-\-0)^0, ff (x — 0)^0). A) Если же в A) выполнены строгие неравенства, то х ? loaning
216 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Пусть далее функция f дифференцируема к раз в точке х. б) Если х ? loaning (locmax^), то либо f^(x) = О, 1 ^ г ^ к, либо существует такое s, I < s < [k/2], что f'(x) = ... = fV°-l\x)=O, /Bs)(^)>0 (/Bs)(^)<0). B) в) Если существует такое s, 1 ^ s ^ [к/2], что выполнены соот- соотношения B), то х G looming (locmax^). Утверждение б) при к = 1 (х ? locextr^ => fix) = 0) известно в анализе как теорема Ферма. Эту теорему мы доказали в п. 1.4.1. Доказательство. Утверждения а) сразу следуют из определе- определений односторонних производных и локального экстремума. Утвержде- Утверждение б) при к = 1 (теорема Ферма) вытекает из а), если учесть, что существование производной влечет за собой равенства f'(x) = /х(х + + 0) = f'(x — 0). Пусть далее к > 1 и для определенности речь идет о минимуме. По формуле Тейлора C) Пусть f(x) = ... = fm-x\x) =0, I <т^к, fm\x) ф 0. Возможно одно из двух: т — нечетно и т — четно. В первом случае пусть </?(?) = = /(?+ V^), (GR. Из C) следует тогда, что <р е D^O) и ^@) = = f(m\x)/m\ ^ 0, а по теореме Ферма должно быть (//@) = 0. Про- Противоречие показывает, что т должно быть четным. Но тогда, полагая ^@ = /(^ + v^)» (H, получаем из A) ^(+°) = f{m\x)/m\ > 0, доказывающее утверждение б). Утверждение в) сразу вытекает из фор- формулы Тейлора f(x + h) = f(x) + f{2s\x)h2s/Bs)\ + o(h2s), из которой видно, что если f^s^(x) > 0, то х ? locmin^, если же fBs\x) < 0, тоже locmax^. ¦ Следующие утверждения являются почти непосредственными след- следствиями определений. Теорема 1 (необходимое условие экстремума пер- первого порядка). Пусть в (з) X — нормированное линейное про- пространство и функция f имеет в точке х ? U производную по на- направлению h. Если х ? looming (x ? locmax^), то f(x;h)>0 (f'(x;h)^O). D) Следствие 1. Пусть f имеет первую вариацию (первую вари- вариацию по Лагранжу) в точке х. Если х ? looming (x ? locmax^), то 6+f(x, h)^0,\/heX F+f(x, К) < 0, Vft ? X) E)
3Л. Элементарные задачи 217 Следствие 2. Пусть f имеет производную в смысле Фреше (Гато) в точке х. Тогда, если х ? locextr ъ, то /'(*) = 0 (#.(*) =0). F) Утверждение следствия 2 также называют теоремой Ферма. Точки х, в которых выполнено равенство F), называют стационарными точками задачи (з). Теорема 2 (необходимое условие экстремума вто- второго порядка). Пусть в (з) X — нормированное линейное про- пространство и f имеет вторую вариацию по Лагранжу в точке х ? U. Тогда, если х е loaning (x ? locmax^), то выполнены следующие соотношения: 6f(x, К) = О, Vft ? X, G) 52f(x, h)^0,Vh?X {52f(x, h) < 0, Vft ? X). (8) Доказательство. Равенство G) содержится в следствии 1. Неравенства (8) немедленно вытекают из определения второй вариации по Лагранжу и утверждения б) леммы. ¦ Следствие 3. Пусть f имеет вторую производную в смысле Фреше в точке х. Тогда, если х ? loaning (x ? locmax^X то выпол- выполнены такие соотношения: /'(?) = 0, (9) /"(?)> 0 (/"(жКО). A0) (Эти неравенства означают, что квадратичная форма d2f = = f"(x)[h, h] неотрицательна (неположительна).) Доказательство. Воспользовавшись формулой Тейлора (см. п. 2.2.5), имеем <р{а) = f(x + ah) = f(x) + af'(x)[h] + у f"(x)[h, h] + o(a2), откуда h) = <p"(O)=f"(x)[h,h], и остается сослаться на G) и (8).и Следствие 2 утверждает, что локальные экстремумы являются ста- стационарными точками. Мы упоминали уже в п. 1.4.1, что обратное неверно. Чтобы получить достаточные условия, приходится привлекать к рассмотрению производные более высоких порядков, как это мы уже делали в лемме. Теорема 3 (достаточное условие экстремума вто- второго порядка). Пусть в (з) X — нормированное пространство
218 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями и f имеет вторую производную в смысле Фреше. Тогда, если выпол- выполнены соотношения /'(?)= О, (И) f"(x)[h, h] ^ a\\h\\2, V/i e X(f"(x)[h, h] < -a\\h\\2, V/i e X) A2) для некоторого а > О, mo x ? looming (x G locmax^). Доказательство. Если выполнено первое из неравенств A2), то, снова обратившись к формуле Тейлора, имеем f{x + h)= f{x) + f(x)[h] + ^- [h, h] + oi\\hf) > если h t^ 0 и \\h\\ достаточно мала. Следовательно, х G locmin^. Случай максимума рассматривается аналогично. ¦ Условие A2) называют условием строгой положительности (от- (отрицательности) второго дифференциала /. Замечания. 1. В конечномерном случае, когда X = Rn, утвер- утверждения теорем 1-3 хорошо известны из курса математического анали- анализа (см. об этом также в п. 1.4.1). Теорема Ферма означает следующее: f(x) = о & dfix)/dxx =... = dfix)/dxn = о. A3) Из необходимого условия второго порядка вытекает, что в конечно- конечномерной задаче на экстремум утверждение х ? loaning влечет (поми- / d2f(x) мо A3)) неотрицательную определенность матрицы ( ——^~ V OXi (JXj t^Wj^0' V/iGRn. A4) ( df{x) \ Условие положительной определенности матрицы I -—^- I гаран- \ C/X'i СУХ j J тирует, как нетрудно убедиться, строгую положительность второго дифференциала (и, значит, является достаточным условием минимума в стационарной точке). В бесконечномерных пространствах это не так. сю Пример. Пусть X = /2, /(#) = J2((x<j/n3) ~ х))- Тогда точка х = 0 i=i является стационарной, /х@) = 0, а второй дифференциал / в нуле — положительно определенным Но вместе с тем 0 ^ locmin^, ибо на последовательности {еп/п}^=1 (ei — г-й базисный вектор пространства /2) функционал
3Л. Элементарные задачи 219 / принимает отрицательные значения: f(en/n) = A/п5) — A/п4) < О, а сама последовательность стремится к нулю. 2. В одномерном случае лемма, с которой начинается этот пункт, дает в некотором отношении исчерпывающий ответ на вопрос о том, является ли заданная точка точкой локального минимума бесконечно дифференцируемой функции / или нет: за исключением тривиального случая, когда все производные в данной точке равны нулю, лемма дает ответ на поставленный вопрос. Даже для функций двух переменных такого рода исчерпывающей процедуры, по-видимому, нет. 3. Неравенства A2) накладывают серьезные ограничения на струк- структуру нормированного пространства X. Если выполнено первое из них, то симметричная билинейная функция (? | rj) = f"(x)[?,rj\ задает в X скалярное произведение, а неравенства = ГШ>€\> <*М\\2 показывают, что норма, порожденная этим скалярным произведени- произведением, эквивалентна исходной. Следовательно, X линейно гомеоморф- но евклидову (предгильбертову) пространству. В частности, неравен- неравенства A2) не могут иметь места в пространствах С и С1. 3.1.2. Элементарная задача линейного программирования. В п. 1.2.6 мы в общих чертах описали класс задач линейного программирования. Здесь будет рассмотрена самая простая из задач этого класса. Для нас она интересна тем, что при ее рассмотрении мы познакомимся с важными условиями экстремума — условиями соответствия и согласования знаков и условием дополняющей нежесткости. Пусть X = Rn, a G Rn* — элемент сопряженного пространства, а = = (а\,... ,ап). Рассмотрим задачу п ах —> inf(sup); <^> У^бвд —> inf(sup); C) Символ ^ здесь означает, что в соответствующем ограничении может стоять один из знаков ^, ^ или =. Задачу (з) будем называть элемен- элементарной задачей линейного программирования. Будем говорить, что для вектора а выполнено условие соответ- соответствия знаков (с ограничениями Х{ ^ 0), если ai ^ 0 при ограничении Хг ^ 0, пг ^ 0 при ограничении Xi ^ 0 и пг может иметь любой знак, если ограничение имеет вид равенства xi = 0. В случае, если нера- неравенства «оборачиваются», т. е. если пг ^ 0 при ограничении Xi ^ 0, cti ^ 0 при ограничении Х{ ^ 0 (и снова а^ — любого знака при Х{ = = 0), то будем говорить, что выполнено условие согласования знаков. В первом случае мы пишем ai ^ 0, во втором а^— ^ 0.
220 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Теорема (необходимое и достаточное условие экс- экстремума в элементарной задаче линейного програм- программирования). Для того, чтобы точка х G Rn доставляла абсо- абсолютный минимум (максимум) задаче (з) необходимо и достаточно, чтобы были выполнены: а) условия соответствия (согласования) знаков аг^0 (oi$0), A) б) условия дополняющей нежесткости diXi = 0, г = 1,..., п. B) Доказательство. Допустим, что (з) — задача минимизации и го-е ограничение имеет вид Xi0 ^ 0. Если допустить, что а^0 < 0, то нижняя грань в задаче (з) равна —оо, ибо Xi0 может принимать сколь угодно большие положительные значения. Поэтому условие а^0 ^ 0 необходимо для того, чтобы значение задачи (искомый inf) было ко- конечно. Если допустить теперь, что ai0Xi0 ф 0, то вследствие условия Хщ > 0 и доказанного неравенства aio ^ 0 на самом деле aioxio > 0. Но тогда точка х не будет минималью задачи, ибо на допустимом век- векторе х = (х\,... ,Xio-\,Q,Xio+i,... ,хп) имеем ах < ах. Достаточность условий A), B) очевидна: если для определенности (з) — по-прежнему задача минимизации и выполнены условия соответствия знаков и до- дополняющей нежесткости, то для любого допустимого вектора х G Rn получаем ах ^ 0, в то время, как для х в силу B) ах = 0. ¦ Упражнение. Вывести доказанную теорему из теоремы Куна-Танкера. 3.1.3. Задача Больца. Пусть А — конечный замкнутый отрезок вещественной прямой. Рассмотрим банахово пространство ? = C1(A,Rn) xRxR, состоящее из элементов ? = (x(-),to,t\). В этом пространстве рассмот- рассмотрим задачу и = J L(t, x(t), x(t)) dt + /(t0, x(to),t\,x(h)) -> extr. C) to При ЭТОМ В C) фуНКЦИИ (t,X,x) \-^ L(t,X,x) И (to,Xo,t\,X\) -^ -^ l(to,xo,t\,x\) определены в открытых подмножествах V и W пространств R x Rn x Rn и R x Rn x R x Rn соответственно и to, t\ e А. Обе функции будем предполагать по меньшей мере непре- непрерывными. Задача (з) называется задачей Больца с незакрепленным временем, а функционал в (з) — функционалом Больца. В п. 1.4.2 был рассмотрен ее частный вариант, когда п = 1 (о случае п > 1 было лишь кратко упомянуто) и моменты времени to и t\ были закрепленными.
3Л. Элементарные задачи 221 Лемма. Пусть функции L и I и их частные производные Lx, Lx, lti и lXi, г = О, 1, непрерывны в областях V и W соответственно. Тогда функционал SB является непрерывно дифференцируемым (по Фреше) на следующем открытом подмножестве пространства S: СМ={? = ШЛоЛх) I x(-) e Cl(A,Rn);te А, (t,x(t),x(t)) e V; (to,x(to),ti,x(ti)) e W,to,h е int A}, и при этом to + Li(t)h(t)) dt + L(ti)ri - L(bo)TO +TtoTO +Ttln + + TXo(h(to)+x(to)To) +TXl(h(ti)+x(?o)ri), A) где L(t) = L(t,x(t),$(t)),Lx(t) = Lx(t,x(t),$(t)), ТХг =lXl(to,x(to)Su4U)), г = 0,1. Доказательство. Функционал SB является суммой интеграль- интегрального и терминального функционалов. Их непрерывная дифференциру- емость была доказана в пп. 2.4.2 и 2.4.3. (Терминальный функционал ? —> l(to,x(to),t\,x(t\)) является частным случаем оператора краевых условий.) Чтобы получить A), остается воспользоваться формулами (9) п. 2.4.2 и C) п. 2.4.3. ¦ В соответствии с этой леммой (з) является элементарной глад- гладкой задачей без ограничений. Поэтому мы можем применять к ней необходимые и достаточные условия экстремума п. 3.1.1. Расшифровка утверждения теоремы Ферма приведет нас к следующей теореме. Теорема 1 (необходимое условие экстремума пер- первого порядка в задаче Больца). Пусть выполнены условия леммы. Если элемент ? = (x(-),to,t\) ? S принадлежит множеству °U и доставляет локальный минимум задаче (з), то 1) выполнены условия стационарности по х(-): а) уравнение Эйлера ~Li(t)+Lx(t)=O, B) б) условия трансверсальности по х Li(ti) = (-l)%it г =0,1; C)
222 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями 2) выполнены условия трансверсальности по t: Я(Гг) = (-1)г+%, г = 0,1, D) где H(t) = Lx(t)$(t)-L(t). Соотношения B) и C) уже встретились нам в п. 1.4.2. Условия трансверсальности по t встречаются здесь впервые, но впоследствии в гл. 4 мы постоянно будем иметь с ними дело. Доказательство. Было сказано уже, что задача (з) является гладкой элементарной задачей, и к ней применима, следовательно, теорема Ферма (следствие 2 п. 3.1.1), согласно которой () = 0 <* ®\Ш = 0, Vr/= (&(•)> т-о, Ti)GH. Вспоминая A), получаем из E) и 0 = &(?)[rj\ = J(Lx(t)h(t) + Lx(t)h(t)) dt + aoh(to) + to @ F) где для краткости введены такие обозначения: аг=ТХг,(Зг=Ти +ТхМо) + (-l)i+1i(?), г = 0, 1. G) Соотношение S)'(i)[rj\ = 0 имеет место для любого элемента г] = = (/i(-),To,Ti). Рассмотрим сначала элементы вида г] = (/г(-),0,0), /г G 1^), h(U)=O, г = 1,2. Тогда из F) (8) для любой вектор-функции h(-) G С1 ([to, ti), Rn) такой, что h(to) = = /i(ti) = 0. Но с такой ситуацией нам пришлось уже встречать- встречаться в п. 1.4.1. Из леммы Дюбуа-Реймона, доказанной там, мы сра- сразу получаем соотношение B) (в п. 1.4.2 лемма Дюбуа-Реймона бы- была доказана для скалярных функций, и здесь ее следует приме- применять поочередно к каждой компоненте вектор-функции /г(-); пола- полагая h\(-) = ... = hi-i(-) = /ii+i(-) = ... = hn(-) = 0, мы сводим (8) к аналогичному скалярному соотношению с одной компонентой Ы(-) и получаем г-е уравнение системы B)). Jlpn этом заодно доказы- доказывается непрерывная дифференцируемость L±(t). Но тогда в выраже-
3Л. Элементарные задачи 223 нии F) можно произвести интегрирование по частям, что (с уче- учетом B)) дает + (ai + Li@i))h(ti) + /30r0 + An (9) для произвольных векторов /i(to), /i(?i) и чисел то и ть Отсюда и из G) немедленно следуют соотношения C) и D).и Как мы видим, доказательство теоремы, в сущности, такое же, как и в гл. 1. Только там нам пришлось вычислять производные кустарно, а здесь мы воспользовались общими теоремами дифференциального исчисления §§ 2.2 и 2.4. 3.1.4. Элементарная задача оптимального управления. Пусть Я — топологическое пространство и ср: [to,t\] х Я —> R. Рассмотрим задачу to в пространстве KC([to,t\],il) кусочно непрерывных функций и(-): [to,t\] —> Я со значениями в Я. Функцию (р будем предполагать непре- непрерывной в [to,ti] х Я. Задачу (з) назовем элементарной задачей опти- оптимального управления. Теорема (необходимое и достаточное условие ми- минимума в элементарной задаче оптимального управ- управления). Пусть функция и(-) ? К С ([to, t\],ii) и доставляет абсо- абсолютный минимум в задаче (з). Тогда для любой точки непрерывно- непрерывности функции и(-) выполнено соотношение minf(t,u) = f(t,u(t)). A) uEii Доказательство. Допустим, что соотношение A) не выполнено и существуют точка т (где и(-) непрерывна) и элемент v G Я такие, что f(r,v) < f(r,u(r)). Вследствие непрерывности функций t —> f(t,v) и t-> f(t,u(t)) в окрестности точки т найдется такой интервал А = = [т — 5,т + 5], что f(t,v) < f(t,u(t)) при t G Д. Положим й(?) = = й(?) при ? ^ А и й(?) = v при ? G А. Тогда f(u(-)) < f(u(-)) вопреки минимальности и(-). 3.1.5. Принцип Лагранжа для задач с равенствами и неравен- неравенствами. В гл. 1 уже несколько раз обсуждался принцип, которому соответствуют необходимые условия для задач с ограничениями. Здесь, после того, как нами выделены некоторые «элементарные» задачи, можно подвести кое-какие итоги. Рассматривавшиеся экстремальные задачи были формализованы так, что ограничения делились на две группы, первая из которых имела вид равенств. По ограничениям этой группы составлялась функция
224 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Лагранжа. Далее мысленно ставилась задача о соответствующем экс- экстремуме функции Лагранжа по второй группе ограничений — по той группе, которая не участвовала в формировании функции Лагранжа. При этом оказывалось, что полученная экстремальная задача либо сама оказывалась элементарной, либо элементарными оказывались «частичные» задачи, получаемые фиксированием всех неизвестных, кроме одного. Необходимые условия для полученных элементарных задач в своей совокупности и составляли искомый набор необходи- необходимых условий экстремума. Предоставим читателю убедиться, что все необходимые условия, о которых речь шла в гл. 1, и все необходимые условия, о которых речь пойдет далее в гл. 4, соответствуют описанной процедуре. Исключение составляют задачи с неравенствами, в которых появляются дополнительные условия. Этими задачами мы займемся в следующем параграфе, а здесь покажем, что и они также могут быть включены в рамки описанного «принципа Лагранжа». Пусть (для определенности) у нас имеется задача минимизации /o(x)^inf; F(x)=0, ft(x)$O, i=l,...,m, C) где наряду с равенствами встречаются и неравенства (X и У в (j) - линейные топологические пространства, ff. X —> R, F: X —> Y). Вве- Введением новых переменных щ приведем задачу (з) к виду /о (ж) -> inf; F(x) = О, /*(ж) +щ = 0, щ ^ 0, г = 1,..., га, (з) и разобьем ограничения на две группы, первая из которых состоит из равенств (F(x) = 0, fi(x) + щ = 0), а вторая группа — из огра- ограничений вида щ ^ 0. Для задачи (J) составим функцию Лагранжа, игнорируя ограничения второй группы: ^+щ) + (у*,Р{х)), А = (АЬ...,АШ), условившись о знаке множителя Ао (в задаче на минимум Ао > 0, на максимум Ао ^ 0). В задаче о минимизации функции Лагранжа (при фиксированных множителях) _ ^ ^ <ё(х,и,у*,\,\о) —> inf имеется две группы переменных х и и. Если закрепить переменные и = и, то получается элементарная задача без ограничений (гладкая, выпуклая и т. п.), и здесь можно написать нужное необходимое условие экстремума, причем, как легко видеть, щ в это условие не войдут. Если же фиксировать переменные х = х, то получится элементарная задача линейного программирования. Условия экстремума, написанные
3Л. Элементарные задачи 225 в соответствии с п. 3.1.2, дают нам условия соответствия знаков множителей Лагранжа Л %^0 A) и условия дополняющей нежесткости \{щ=0&\{Мх)=0. B) Далее мы будем каждый раз пользоваться этой процедурой, но, если у нас имеются ограничения типа неравенств, составляя функ- функцию Лагранжа, сразу будем писать ее укороченной: 9В(х,у*, А, Ао) = т — Yl ^ifi(x) + (y*,F(x)) — и именно такую функцию будем назы- г=0 вать функцией Лагранжа задачи (з). Нужно помнить только, что к условиям ее экстремума по х следует присоединить соотношения, вытекающие из A), B), а именно, условия согласования знаков Л(ж)$0=^А^0 A') и дополняющей нежесткости Заметим теперь, что принцип Лагранжа (как, например, и теорема Ферма для гладкой экстремальной задачи) дает только необходимые условия экстремума, т. е. выделяет множество «подозреваемых» объектов, но не доказывает их «виновности». Поэтому для полного решения задачи мы должны либо иметь в распоряжении набор доста- достаточных условий экстремума, либо иметь уверенность в существовании решения. Первое позволит «провести экспертизу»: каждый из выделенных необходимыми условиями объектов мы подвергаем проверке на доста- достаточность. Найдя среди них тот, который удовлетворяет достаточным условиям, мы считаем задачу решенной. Во втором случае искомое решение (существование которого за- заранее известно или доказано) обязано попасть в число подозревае- подозреваемых объектов, удовлетворяющих необходимым условиям экстремума. Вычисляя для каждого из них значение функционала, мы объявляем решением тот, где это значение экстремально. Разумеется, ни тому, ни другому приему нельзя отдать предпочте- предпочтения. Достаточные условия обычно не совпадают с необходимыми, и по- потому могут оставаться «подозреваемые», «вину» которых установить не удается (например, теоремы п. 3.1.1 не дают ответа о существовании экстремума в точке х для «плоской» функции f(x), у которой f(k\x) = = 0 при всех к). С другой стороны, даже зная, что решение существует, мы можем оказаться в затруднении, если необходимыми условиями выделяется бесконечное (или просто очень большое) множество подо- подозреваемых объектов. 8 В. М. Алексеев и др.
226 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями В большинстве вопросов существования решения оказывается воз- возможным обойтись усовершенствованным вариантом классической тео- теоремы Вейерштрасса, которую мы уже упоминали в п. 1.6.1: сущест- существование является следствием компактности множества допустимых элементов и полунепрерывности функционала. Определение. Функция /: X —> R, определенная на топологи- топологическом пространстве X, называется полунепрерывной снизу в точке хо, если lim f(x) ^ /(#о)> и просто полунепрерывной снизу, если она полунепрерывна снизу в каждой точке (ср. п. 2.6.2). Теорема Вейерштрасса. Полунепрерывная снизу функция f: X —> R достигает минимума на всяком счетно-компактном под- подмножестве топологического пространства X. Доказательство. Пусть АсХ — счетно-компактное подмно- подмножество и S — значение задачи /О) -> inf, хеА, C) S= inf/(ж). По определению нижней грани мы можем выбрать минимизиру- минимизирующую последовательность задачи C), т. е. такую последовательность точек хп G А, что f(xn) —> S. По определению счетной компактности из хп можно выбрать подпоследовательность хПк, сходящуюся к неко- некоторой точке xei. Ввиду полунепрерывности f(x) < lim f(xnk) = lim f(xn) = S и так как, с другой стороны, f{x) не может быть меньше значения задачи C), f(x) = S, т. е. х — точка минимума. ¦ Следствие. Пусть f полунепрерывна снизу на топологическом пространстве X. Если некоторое лебеговское множество 98af = = {х | f(x) < а} функции f непусто и счетно компактно, то f достигает на X своего минимума. § 3.2. Принцип Лагранжа для гладких задач с ограничениями типа равенств и неравенств 3.2.1. Формулировка теоремы. Рассмотрим экстремальную зада- задачу: /0(x)^extr; F(x)=0, fi(x)$O, г=1,...,ш. A) Символ fi(x) g? 0 означает, что г-е ограничение имеет вид либо fi(x) = 0, либо fi(x) ^ 0, либо fi(x) ^ 0. Задачи типа A), где X и Y — нормированные пространства, fi — гладкие функции на X, a F — гладкое отображение из X в Y,
3.2. Принцип Лагранжа для гладких задач 227 называются гладкими экстремальными задачами с ограничениями типа равенств и неравенств. Функцией Лагранжа задачи A) называется функция т ${х, у\ А, Ао) = Y, Хгп(х) + (y*,F(x)), B) г=0 где в B) А = (АЬ...,АШ) е Rm*, Ao G R, у* G У* - множители Лагранжа. Теорема (правило множителей Лагранжа для глад- гладких задач с равенствами и неравенствами). Пусть X и Y — банаховы пространства, U — открытое множество в X, функции fi'. U —> R, г = 0, 1,..., т, и отображение F: U —> Y строго дифференцируемы в точке х. Если х доставляет локальный экстремум задаче A) и если образ lvnF'(x) есть замкнутое подпространство в Y, C) то найдутся такие множители Лагранжа у*, А, Ао, для которых выполняются: а) условие стационарности функции Лагранжа по х $х{х,у*Х%) = 0, D) б) условие согласования знаков: Ао ^ 0, если задача на минимум, Ао ^ 0, если задача на максимум, Xi ^0, i= l,...,m, E) в) условия дополняющей нежесткости \ifi(x)=0, i=\,...,m. F) Напомним еще, что^запись А^ ^ 0 означает следующее: если в фор- формуле A) fi(х) > 0, то Xi < 0, если fi(х) < 0, то А^ > 0, наконец, если fi(x) = 0, то Xi может иметь любой знак. Утверждение о существовании множителей Лагранжа, удовлетво- удовлетворяющих совокупности условий а)-в), находится в точном соответствии с общим приемом снятия ограничений — об этом как раз и говорилось в последнем пункте предыдущего параграфа. Поэтому сформулирован- сформулированный результат мы называем еще принципом Лагранжа для гладких задач с равенствами и неравенствами. Доказательство общей теоремы базируется, с одной стороны, на теореме о неявной функции из § 2.3, а с другой — на теореме Куна-Таккера, т. е. в конечном счете — на конечномерной теореме отделимости. Теорема Куна-Таккера была доказана нами в § 1.3, и ссылка на нее — единственная по существу содержательная ссылка на первую главу в этой части книги. Привлечение теоремы Куна- Таккера связано с наличием в A) неравенств, и оно несколько
228 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями осложняет доказательство. Случай же, когда неравенства отсутствуют, совсем прост, но вместе с тем и содержателен, и поучителен. Поэтому мы разберем его отдельно, хотя, конечно, этот случай является авто- автоматическим следствием общего результата. При чтении следующего пункта мы рекомендуем сравнивать параллельно бесконечномерный вариант доказательства с конечномерным, разобранным в п. 1.3.2. 3.2.2. Правило множителей для гладких задач с равенствами. Теорема (принцип Лагранжа для гладких задач с ра- равенствами). а) Пусть X и Y — банаховы пространства, U — открытое множество в X, f: U —> R, F: U —> Y — функция и отображение, строго дифференцируемые в точке х. Если точка х является точкой локального экстремума в задаче F(x)=0 A) и если образ ImF'(x) — замкнутое подпространство в Y, то най- найдутся такие множители Лагранжа Ао Е R и у* ? Y*, для которых выполнено условие стационарности функции Лагранжа: (ex(x,y*M=0^(\of'(x),x} + (y*,F'(x)[x}} = 0, Ух. B) б) Если выполнено условие регулярности отображения F, т. е. если ImF^x) совпадает со всем пространством Y, то множитель Ао отличен от нуля. Доказательство проведем для задачи на минимум. Определим отображение &{х) = (/О) - f(x),F(x)), &\ U -> R х Y. Отображение &, очевидно, строго дифференцируемо в х и SF (х) = (f()()) Возможно одно из двух: образ Im# (x) может совпадать или не совпадать с пространством R x Y. А) Разберем сначала случай lm^\x) /Rx7. К отображению SF (х) применим лемму о замкнутости образа (п. 2.1.6). Образ ImF'(x) замкнут по условию, образ f'(x)(Ker F'(x)) есть либо {0}, либо R, т. е. замкнутое подмножество R. Значит, по цитированной лемме об- образ 1т,9г\х) замкнут в R x Y. Так как он не совпадает с R x Y, 1т ^\х) — собственное замкнутое подпространство. Но по лемме о нетривиальности аннулятора (п. 2.1.4) найдутся число Ао и элемент у* (см. п. 2.1.2, где говорится об общем виде линейного функционала в произведении пространств), не равные нулю одновременно (|Ао| + + ||??*|| ^ G) w такие, что <А0/'(ЗД + {y*,F\x)[x\) = 0, Ух. Но это соотношение совпадает с B).
3.2. Принцип Лагранжа для гладких задач 229 Б) Пусть теперь Im,?Т (х) = R x Y. Тогда мы можем применить теорему о существовании неявной функции (см. пп. 2.3.1-2.3.3). Согласно этой теореме 0 существуют константа К > О, окрестность °11 точки @,0) в пространстве R x Y и отображение ip: °Ы —> X такие, что &{<р(а,у)) = (а,у) и Ыа,у)-х\\^К\Щх)-(а,у)\\. C) Положим х(е) = ip(—e,O) = ip(z(e)). Тогда из C) имеем &{x(e)) = z(e)&f(x(e))-№ = -e9 F(x(e))=0, D) \\х(е) - х\\ = УШ) - х\\ < АГ||@,0) - (-?, 0)|| = К\е\. E) Из D), E) следует, что х(е) — допустимый элемент в зада- задаче A), сколь угодно близкий к х и вместе с тем f(x{e)) < f(x), т. е. х (? locmin A). Противоречие доказывает, что равенство 1пь^ (х) = = R х Y невозможно. Тем самым верно утверждение а) теоремы. В) Пусть F — регулярно в точке х и Ло = 0. Тогда у* ф 0 и соотно- соотношение B) приобретает вид: (у*, F'(x)[x\) = 0, Ух. Выберем элемент у такой, что (у*,у) ф 0 (это возможно, ибо у* ф 0), и найдем элемент х такой, что Ff(x)[x] = у (он существует ввиду равенства Ff(x)X = У). Тогда 0 ф (у*,у) = (y*,Ff(x)[x}} = 0. Этим противоречием доказано второе утверждение. ¦ Замечание. Мы построили доказательство по той же схеме, что и до- доказательство конечномерного правила множителей Лагранжа (п. 1.3.2), и оно оказалось столь же простым и кратким. Правда, это потребовало некоторой подготовки: были использованы три факта из функционального анализа: тео- теорема о нетривиальности аннулятора (т. е. в конечном счете — теорема Хана- Банаха), лемма о замкнутости образа и теорема о неявной функции. Для завер- завершения общей теоремы — доказательства правила множителей для задач с нера- неравенствами — нам, помимо этих трех фактов, понадобится еще лишь теорема Куна-Таккера, являющаяся прямым следствием конечномерной теоремы отде- отделимости (см. п. Е) доказательства теоремы в п. 3.2.4). Удивительно, что столь малыми средствами, относящимися к общим математическим структурам, по- получается результат, в качестве прямого следствия из которого с помощью незначительных вспомогательных средств также общего плана (теорема Рисса о линейных функционалах в пространстве С и стандартные теоремы о диффе- дифференциальных уравнениях) в следующей главе будут выведены содержательные 1) Приведем сопоставление обозначений теоремы п. 2.3.1 с обозначениями этого пункта. X — топологическое пространство в теореме о неявной функ- функции (н. ф.) здесь состоит из одной точки {жо}, ^(Н-Ф) ^ X, ^(н.ф.) oRxF, Ф(ж,у) = Ф(жо,2/)(н.ф.) & .Цх), Л(н.ф.) & ^'(х), 2/0(н.ф.) & х, ?0(н.ф.) & <^> 0 G R х Y. Условие 1) теоремы удовлетворяется тривиально, условие 2) выполнено вследствие строгой дифференцируемости ^ ибо *(W) - *(W) - Му' - У") О У7{х') -Щх") - &'(х)[х' - х"], и, наконец, условие 3) выполнено, поскольку 1т,^'(х) = R x Y.
230 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями конкретные результаты: необходимые условия экстремума в задачах классиче- классического вариационного исчисления и оптимального управления. 3.2.3. Редукция задачи. Перед тем, как приступить к доказа- доказательству теоремы, сформулированной в п. 3.2.1, произведем некоторое преобразование ее условий. Сначала, заменив, если нужно, /о на (— — 1)/о, сведем задачу к задаче на минимум. Если среди ограничений вида fi(x) ^ 0 или fi(x) ^ 0 есть такие, что fi(x) < 0 или соответ- соответственно fi(x) > 0, то мы их отбросим, поскольку с локальной точки зрения они несущественны, ибо выполняются во всех точках некоторой окрестности точки х. Далее, если в A) п. 3.2.1 имеются неравенства fi(x) ^ 0, fi(x) = 0, мы заменим их на неравенства (-l)fi(x) ^ 0. Равенства же fi(x) = 0 присоединим к равенству F(x) = 0. Перенуме- Перенумеровав теперь заново все неравенства, задающие ограничения, получим следующую задачу, эквивалентную A): /0(x)^inf; F(x)=0, fj(x)^O, j=l,...,m, A') где F(x) = {F{x)Jfh+\{x)i...Jil{x)) и для каждого j, 0 < j < /i, существует такое Sj = +1 или — 1, что Ш=е,/ф). B') В задаче (Iх) х доставляет локальный минимум и при этом fj(x) = 0, j = l,...,m. Покажем теперь, что для задачи AQ выполнены все условия тео- теоремы. Действительно, X и Y x R^-^ _ банаховы пространства. Функции fj и отображение F строго дифференцируемы в точке х (в силу того, что F и fj были таковыми). Осталось показать лишь, что L = ImF'(x) замкнуто в У х R?""\ Имеем F'(x) = (Ff(x),<?\x)), где Ф'(х)[х] = ((/4+1(х),х),...,(/Дх,х)), Ф'(х): X -^R^-^. Образ ImF'(x) замкнут по условию, а подпространство Ф'(x)\KerF'(х)] С С R^~m замкнуто, как и любое подпространство конечномерного^про- странства. Значит, по лемме о замкнутости образа (п. 2.1.6) ImF'(x) замкнут в У х R^~m. Предположим теперь, что для задачи (Iх) доказываемая теоре- теорема верна и, следовательно, существуют множители Лагранжа у* = — (у* Дт+ь ••• Дд)> ^j» J1 = 0, 1,..., т, для которых верны а) и б) п. 3.2.1 (условия в) выполняются автоматически, ибо fj(x) =0, j = = 1,... ,m). В силу б) Xj > 0, j = 0, 1,... ,ш, а в силу а) т 5'x(x)y*)Ab...,A??l)Ao) = ^Ai/7'(^) + (y*0^)'(^) = 0) C') ~ т _ _ _ где ?= t:\jfjix) + {у* 3=0
3.2. Принцип Лагранжа для гладких задач 231 Теперь остается положить Ло = Ао, А^. = SjXj, j = 1,...,га, A^. = = \j\ j = m + 1,...,/i и A^ = 0, если /j(x) 7^ 0. Полученный набор будет удовлетворять, очевидно, условиям дополняющей нежесткости и условию согласования знаков (ибо в Bх) Sj = +1, когда ограничение имеет вид ДДж) ^0 и ?j = -1 при /^. ^ 0). Кроме того, поскольку условие стационарности функции Лагранжа выполняется или не вы- выполняется для обеих функций одновременно. Итак, в дальнейшем можно ограничиться лишь рассмотрением за- задачи (Iх). Однако для простоты мы больше не будем ставить тильду (~) над F, fj и т. 3.2.4. Доказательство теоремы. Итак, пусть нам дана задача: /o(a;)^inf; F(x)=0, fj(x) < 0, j = \,...,m, A) причем выполнены все условия теоремы п. 3.2.1 и fj(x) = 0, j = = l,...,m. Без ограничения общности можно считать также, что и/о(ж)=О. Разобьем доказательство на несколько этапов. А) Линейный случай. Рассмотрим сначала простейшую си- ситуацию, когда fo = x* — линейный функционал, fi = 0, г = 1,..., т, a F = Л — линейный непрерывный сюръективный оператор. Точка х = 0 решение задачи (х*,х) -> inf; Ах = 0 (Ае g(X, Y),A(X) = Y) B) тогда и только тогда, когда х* G (КегЛ)^. По лемме об аннуляторе ядра (п. 2.1.7) существует элемент у* е Y* такой, что х* + А*у* = 0. Но это соотношение в точности есть принцип Лагранжа для задачи B): ж* + Л*у* = 0 & <?х@, у*, 1) = 0, где <?(х,у*,\о) = \о(х*,х) + (у*, Ах) = (Аож* +Л*у*,ж) — функция Лагранжа задачи B). Таким образом, в этой ситуации принцип Лагран- Лагранжа верен. Б) Вырожденный случай. ImF'(x) есть собственное под- подпространство Y. Вследствие леммы о нетривиальности аннулято- ра (п. 2.1.4) найдется элемент у* е (ImF'fflI- <^> (у* о F')(x) = 0. Остается положить А^ = 0, г = 0,..., т, и убедиться в том, что принцип верен и в рассматриваемом вырожденном случае. Далее считаем, что F — регулярный оператор в точке х, т. е. ImF'(x) =Y. Положим для 0 ^ k ^ m Ак = {х\ (fl(x), x)<0, i = fc,fc+l,...,m, F'(x)[x]=0}.
232 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями В) Лемма 1 (основная). Если х есть локальное решение в задаче A), то множество Aq пусто. Иначе говоря, max (fi(x),x) > О, Ух е KeiF'(x). Доказательство. Предположим, что Aq непусто, т. е. существу- существует элемент ? такой, что F'(a?)[?] = О, (Д(х),?) = fa, fa < О, 0 < г < га. Тогда по теореме Люстерника (п. 2.3.5) существует отображение г: [— —а, а] —> X, а > 0, такое, что 0, AG [-а,а], г(А) = о(А). C) При малых А > 0 имеем для г = 0, 1,... ,т неравенства fi(x + АС + г(Л)) = fi(x) + \{f<(x),0 + о(Х) = ЛА + о(А) < 0. D*) Соотношения C) и D^) г = 1,..., ш, означают, что для малых А > 0 элемент х-\- А? + г(А) является допустимым в задаче A). Но при этом неравенство Dо) противоречит локальной минимальности х. ш Г) Лемма 2. Если Аш есть пустое множество, то для задачи A) верен принцип Лагранжа. Доказательство. Пустота Аш означает, что х = 0 является решением задачи {fm{x),x)^M, F'(x)[x]=0. В силу п. А) для этой задачи справедлив принцип Лагранжа, а значит, он справедлив и для задачи A) (надо только положить Ао = ... = = Am_i=0). Таким образом, из пп. В) и Г) вытекает, что либо принцип Лагран- Лагранжа уже обоснован (Ат = 0), либо существует такое к, 0 ^ к < т, что Ак = 0, Ак+Х ф 0. E) Д) Лемма 3. Если выполнены соотношения E), то нуль явля- является решением следующей задачи линейного программирования'. i = k+ \,...,m,Ff(x)[x] =0. F) Доказательство. Предположим, что г] — такой допустимый в задаче F) элемент (т.е. (fl[(x),rj) ^0, г ^ к + 1, Ff(x)[rj] = 0), что (fk{x),r]} < 0. Пусть ( — элемент, принадлежащий Ak+\, т.е. (Л(^)'С) < 0> г ^ fc + 1, F (x)[Q = 0. Тогда при малом г > 0 элемент г] + е? принадлежит Ак в противоречии с E). ¦ Е) Завершение доказательства. Применяем к задаче F) теорему Куна-Таккера (п. 1.3.3), учтя при этом, что условие Слейтера для этой задачи выполнено (из-за непустоты Ak+\). По этой теореме
3.2. Принцип Лагранжа для гладких задач 233 найдутся такие неотрицательные числа \k+\, ..., Аш, что точка нуль является решением задачи т , x}+ Y1 &#(?)>х) -*inf> *"(?)N = °- G) г=/с+1 (Это последнее утверждение есть не что иное, как принцип минимума для задачи F), причем множитель Лагранжа при функционале взят равным 1 вследствие выполнимости условия Слейтера.) Но задача G) есть опять-таки задача, о которой говорилось в п. А). Для нее ве- верен принцип Лагранжа или, что в данной ситуации одно и то же, применима лемма об аннуляторе ядра оператора F'(x). Иначе говоря, существует элемент у*, для которого i=k+l Но это и есть условие стационарности функции Лагранжа, если положить Ао = ... = Хк-1 = О, А& = 1. ¦ По ходу доказательства при А\ ф 0 оказалось, что Ао = 1. По- Покажем, что если F регулярно (т.е. ImFf(x) = Y), то в этом случае вообще никакой набор множителей Лагранжа, для которого выполне- выполнено условие стационарности функции Лагранжа, не может содержать множитель Ао = 0. Действительно, при А\ ф 0 существует элемент h такой, что F'(x)[h] =0, (f!-(x),h} < 0, ij= l,.^,m. Допустим теперь, что нашлись множители Лагранжа А = (Аь ..., Аш), у*, не равные нулю одновременно и такие, что 9Вх(х, у*, А,0) =0. Тогда ввиду неравенств ^i(f-(x),h} <0 имеем 0 = SBx(x,y*,X,O)[h] = J2Mfl@).h) + (y*,F'(x)[h]) = г=\ г=\ и теперь 0 = Ух(х,у*>*>0)[х] = (y*,F'(x)[x])9 Vx вопреки предположению. Выделим сказанное в отдельное предложение. ^ Пр ед л ожен и е. Для того чтобы в теореме п. 3.2.1 Ао ф 0, до- достаточно добавить к ее условиям, что lvnF'(x) =Y и существует элемент h G Ker Ff(x), для которого (Д(х), h) < 0, г = 1,..., т. Дополнительные допущения, о которых здесь говорится, будем на- называть условиями усиленной регулярности задачи A).
234 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями В формулировке доказанного нами принципа Лагранжа участвует важное (и вдобавок единственное, помимо требований гладкости и ба- наховости) условие замкнутости образа lmFf(x). Необходимо отме- отметить, что без условий такого типа принцип Лагранжа может оказаться неверным. Прежде всего при отказе от требований сюръективности оператора Л g S!(X,Y) (X и Y — банаховы пространства) формула (КегЛ)^ = = 1тЛ* может оказаться неверной, точнее, может оказаться, что 1тЛ* есть собственное подпространство (Кег Л)-1-. Например, если X = Y = = h, х — (х\,...,хп,...) G h, Ах = (х\,#2/2,...,хп/п,...), то КегЛ = = {0} и, значит, (КегЛ)^ = 1%, в то время как 1тЛ = 1тЛ* ф 1% (ска- (скажем, элемент у = A, 1/2,..., 1/п,...) принадлежит 1%, но решения уравнения Ах = у, очевидно, не существует). Теперь мы можем уже привести пример задачи, для которой принцип Лагранжа неверен. Пример. Пусть X и Y — банаховы пространства и оператор Л G G 9B(X,Y) таков, что Кег Л* = {0}, а 1тЛ* есть собственное подпро- подпространство (КегЛ)-1-. Выбрав х* G (КегЛ)^ \1тЛ*, рассмотрим задачу (х*, х) —> inf; Ax = 0. Для этой задачи принцип Лагранжа неверен. Действительно, х = 0 является точкой минимума, и если бы нашлись Ао и у* G У* такие, что Ух(О,у*,\оЩ =0, V/iGl^A0(x*,/i) + (f,A/i) =0, Vftel, то Ао = 0 (ибо иначе х* G 1тЛ*), а значит, А*у* = 0 ^> у* = 0. Упражнение 0. Пусть Z = Y = l2, z = (z\,..., zn,...) е h, Az = = (zi,z2/2,...,zn/n,...), у ? 1тЛ, X = R x Z, /(x) = /(a, 2?) = a, F(x) = = F(a, z) = Az -\- a2y. Покажите, что для задачи f(x) —*> inf; F(x) = 0 принцип Лагранжа неверен. § 3.3*. Принцип Лагранжа и двойственность в задачах выпуклого программирования 3.3.1. Теорема Куна-Таккера (субдифференциальная форма). Принцип Лагранжа для задач выпуклого программирования (теорема Куна-Таккера) был уже доказан в п. 1.3.3. В этом пункте дается «субдифференциальная форма» этой теоремы и проясняются связи с другими понятиями выпуклого анализа. Пусть X и Y — банаховы пространства, Л: X —> Y — линей- линейный непрерывный оператор, ff. X —> R, г = 0, 1,...,т — выпуклые функции, а = (а\,..., ат) ? Rm, Ъ G Y, А — выпуклое множество в X. х) Предложено студентом 4 курса В. В. Успенским.
3.3. Принцип Лагранжа и двойственность 235 Рассмотрим следующую задачу выпуклого программирования: /о(^) —^ inf; fi(x) ^ di, i=\,...,m, Ax = b, xGi. C) Множество {x | Ax = b} обозначим через В. Функцией Лагранжа задачи (з) является функция ?{х, у*, А, Ао) = Xofo(x) + J2 ХШх) - аг) + (у*, Ах - Ъ). г=\ Предложение. Пусть х — точка абсолютного минимума в за- задаче (з). Тогда х — точка абсолютного минимума в элементарной задаче f(x) = тах(/о(ж) - fo(x),f\(x) - аь ..., fm(x) - ат) + где 5(А Г) В) — индикаторная функция множества А П В. Действительно, если существует элемент х, для которого f(x) < О, то это означает, во-первых, что х G A, x G В (<^> Ах = Ь), во-вторых, что fi(x) < cti, г = 1,..., т (т. е. что х — допустимый элемент в задаче), и, в-третьих, что fo(x) < fo(x) вопреки условию. ¦ Теорема (субдифференциальная форма теоремы Куна-Таккера). Пусть в (з) функции fi, i = 0,\,... ,т, непрерывны в точке х G А П В, доставляющей абсолютный s^ 7TZ, ^^ минимум в задаче. Тогда найдутся числа А^ ^ 0 такие, что J2 К = _ г=о = 1, \ifi(x) = 0, i ^ \, и элемент х* е д5(А П В)(х), для которых ^+?*. A) г=0 Доказательство. Согласно предложению х доставляет абсо- абсолютный минимум в элементарной задаче (У). По теореме 1 п. 3.1.1 О е df(x). Функция д(х) = тах(/0(ж) -^fo(x),f\(x) - аь ..., fm(x) - — ат) выпукла и непрерывна в точке х е АП В (т. е. принадлежа- принадлежащей dom 5(АП В) и, значит, по теореме Моро-Рокафеллара (п. 2.6.4) df(x) = дд(х) + 85(А П В)(х). Наконец, по теореме Дубовицкого- Милютина (п. 2.6.4) 8д(х) = conv(dfil(x) U ... U dfis(x)), где ij — те и только те индексы, для которых fi(x) = g(x). Таким образом, существуют два элемента <^* G 8д(х) и ж* G 95(А П В)(х), для которых + ж* = О, Г е сопу(а/г, (ж) и... и dfis (х)) & С = S Осталось положить А^ = 0, г ф {гь ... ,г5}. i
236 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Упражнение. Пусть В = {х \ Ах = Ь}. Докажите, что если хо Е В, Следствие 1 (принцип Лагранжа для задачи вы- выпуклого программирования с ограничениями типа равенств и неравенств). Пусть в условиях теоремы А = Х и образ X при отображении А замкнут в Y. Тогда найдутся такие множители Лагранжа Ло Е R, Л Е Rm , у* Е Y*:, что % >0, г >0, АгЛ(ж) =0, г ^ 1, (х,Г ,А,А0) =?(х,у*,\,Хо)' B) Действительно, если 1тЛ есть собственное подпространство в Y, то можно положить А^ = Ао = 0, у* Е flmA)-1-. Если же Л — сюръек- тивный оператор, то д5В(х) = (КегЛ) = 1тЛ*. Тогда, согласно A), 0 Е дх$(х, у*, А, Ао) = X] ^idfi(x) +1тЛ*, и, значит, по определению г=0 субдифференциала Уж. 3.3.2. Метод возмущений и теорема двойственности. В преды- предыдущем пункте задачу выпуклого программирования (з) мы рассматри- рассматривали как одну индивидуальную задачу. Со многих точек зрения ока- оказывается естественным и плодотворным рассмотрение целых семейств задач подобного рода. Фиксировав fi, Л, а^, А и Ь, включим задачу (з) в семейство /о(ж) —> inf; /г(ж)+«г ^ ^г, г=1,...,т, Лж + ту = 6, xG А (з(о^,гу)) (Разумеется, можно было бы просто объявить щ и Ъ переменными параметрами семейства, но, введя параметры с^, ту так, как указано выше, мы получаем более красивые формулы.) Совокупность задач {(з(о^,гу))} назовем возмущением задачи (з) = (з@,0)). Мы уже видели в п. 3.3.1, что задача (з) сводится к элементарной. Сейчас мы проделаем то же самое для семейства (з(а, 7/)), однако несколько по-другому. А именно, обозначим fix-a n) = i ^°(ж)' еСЛИ ^(ж)+а* ^cii, Ах + г] = Ъ, х еА, ({, J ^ ' ' '' 1 +оо, в остальных случаях. ^ ' Тогда семейство ($(а,г])) можно записать в виде элементарной задачи /О; а, г]) -> inf (noxGl). B)
3.3. Принцип Лагранжа и двойственность 237 В дальнейшем, говоря о задаче (з(а, 7/)), мы не будем различать ее ис- исходную формулировку от B). Значение этой задачи, т.е. inf/o, при указанных ограничениях является функцией от а = (а\,... ,ат) и г], которую мы обозначим через S, S: Rm x У —> R и иногда будем называть S-функцией: S(a,ri) = mif(x;a,ri)= inf /0(ж). C) Лемма. Пусть F(x,z) — выпуклая функция на произведении линейных пространств X и Z. Тогда функция S(z) = inf Fix, z) X выпукла на Z. Доказательство. Пусть (zi, ti) G epi/S, г = 1, 2 и A G [0, 1]. Тогда S(zi) ^ti, i = 1,2, и для любого г > О существуют (xi,Zi) такие, что -Р(#г> ^г) < U + ?> * — 1> 2. Отсюда в силу выпуклости F ^i + A - X)z2) < < XF(xuzi) + A - A)F(x2,2?2) < A(ti +e) + (l- X)(t2 + в) = = Ati + A -X)t2 + e. Ввиду произвольности г > О F(Axi + A - А)ж2, Xzi + A - А)^2) < < Xt{ + A - A)t2 =Ф 5(A^i + A - X)z2) < < Ati + A -X)t2 => (Xz\ + A - AJ2,A*i + A -X)t2) e epiS. m Предложение 1. Пусть X и Y — линейные пространства, А с X — выпуклое множество, Л: X —> Y — линейное отображение. Если функции fi'. X —> R, г = 0, 1,... ,т, выпуклы, то функция f(x;a,rj), определяемая равенством A), выпукла на X х Rm x У. Доказательство. Множества Мо = {(ж,а,7/,?) | (x,t) e epi/o}, Mi = {(Х, а, Г], t) | fi(x) + «г < ^г}, МА = {(x,a,r/,t) | x e А}, МЛ = {(х, а, г], t) \ Ах + ту = 6} выпуклы в X х Rm х У х R. Действительно (нарушая иногда для удобства порядок сомножителей): Mq = epi/o x Rm x Y, Ma = А х х Rm х У х R, МЛ = Л^) х Rm x R, где Л: (х, у) ^ Ах + у - линейное отображение из X х Y в Y и М^ = <тepi{/^ — а^} х Hm~l x х У х R, где а: (х, t) \-^ (x, —t) симметрия в X х R. Отсюда видно, что все эти множества выпуклы, и остается заметить, что epi / = П МгПМаП Мл. ¦ г=0
238 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Следствие 1. S-функция задачи (з (<%??)) выпукла на Rm x У. В § 2.6 мы уже видели, что выпуклость позволяет сопоставлять различным объектам (функциям, множествам) двойственные объекты в сопряженном пространстве. То же самое справедливо и для задач выпуклого программирования. Далее мы будем предполагать, что X и У — локально выпуклые пространства, X* и У* — их сопряженные, \ / \ \ \ г- тут* Л — (Ль ... ,Am) E ±1 Определение 1. Семейство экстремальных задач д(х*; А, ту*) -> sup(no A е Rm*, г?* e У*), (з*(ж*)) где (— \)д(х*\ А, ту*) = /*(#*; А, ту*) — преобразование Юнга-Фенхеля (п. 2.6.3) функции (х, a, rj) н->/(ж, а, 77), определяемой равенством A), называется двойственным к семейству $(а,г]) <^> B). Задача з* = 3*@) называется двойственной к задаче з = з@» 0) (от" носительно семейства возмущений i{a,rj)). Значение задачи з*(ж*) обозначим :*) = sup g(x*\\rf). D) Поскольку функция /* выпукла, противоположная ей функция g вогнута. Двойственные задачи можно было бы называть задачами вогнутого программирования, но мы предпочитаем обойтись без нового термина. Определение 2. Функцией Лагранжа пары семейств %{а,C) и з*(^*) или расширенной функцией Лагранжа задачи (з) называется функция Ж1х Rm* х У* —> R, определяемая соотношениями т х ? Л, А ? R+ , E) —оо, х ? А, А ^ R!p*, +00, х ? А. При фиксированных (А, ту*) эта функция выпукла по х, a jpn фиксированном ж выпукла по (А, ту*) противоположная функция —9S. Заметим, что 9E(x)\,rf) =^O,rf,A, 1), ж?Д AgR!^*, F) где 9В — функция Лагранжа задачи (з), определенная в п. 3.3.1. Предложение 2. Пара двойственных семейств i(a,rj) u$*(x*) однозначно определяется их функцией Лагранжа, поскольку где *A) и *B) обозначают преобразования Юнга-Фенхеля по аргу- аргументам х и (А, ту*) соответственно.
3.3. Принцип Лагранжа и двойственность 239 Доказательство. По определению преобразования Юнга- Фенхеля = sup {(x*, х) + Ха + (rf, ту) — /(ж; Л, ту)} = (ж,а,77) sup {{x*,x) + Xa+(r]*,r])-fo(x)} = АКЬ С т Л sup <^ (ж*, х) - /о(ж) - ? Xi(fi(x) - di) - (г]*,Ах - b) \ A G R?* чем доказано второе из равенств G). Попутно мы получили полезное соотношение [ -oo,A^R!p*. С другой стороны 0 , + 00, Ж sup ( г=1 !+оо, если ж ^ А или Лж — b ^ —rj или /г(ж) — а^ > —а^ для некоторого г, = /о(ж) в остальных случаях = /(ж; а, г/). ¦ Следствие 2. Сопряженная функция к S-функции задачи з(а, ту) имеет вид { - inf g(x,rj*,\, 1), AeR™*, v ; ; V У | +оо, A^Rip*. V У О Как и в п. 2.6.3, вычисляя сопряженную к функции, определенной на со- сопряженном пространстве (в нашем случае на Rm* x Y*), мы считаем результат функцией на исходном пространстве, а не на втором сопряженном.
240 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Доказательство. По определению S*(\,rf) = sup(Aa + (rf,77) - inf /(ж; а, г/)) = («,77) = sup (Ла + (rj*,rj) - /О; а, г/)) = -д@; А, г/*), после чего (9) следует из F) и (8). Таким образом, двойственная к задаче з = з@»0) задача з* = 3*@) может быть сформулирована также и так: AeR™*, rf еУ*. Замечание. Определение двойственной задачи зависит, вообще говоря, от того, в какое семейство возмущений мы включим исходную задачу (з). Равенства E) и F), определяющие расширенную функцию Лагранжа и равенства G), показывают, тем не менее, что семейства {(з(о^,гу))} и {(з*(^*))} в некотором смысле естественно соответствуют задаче (з) и, таким образом, задача (з*), эквивалентная A0), в том же смысле является ее естественной двойственной. Упражнение. Покажите, что если функции fi и множество А выпуклы и замкнуты и если /о(ж) не обращается в —оо на множестве допустимых х задачи (з), то двойственное (с учетом сноски к доказательству предложения 2) к семейству {(з*(^*))} семейство совпадает с {($(а,г]))}, и, таким образом, задачи (з) и (з*) образуют пару двойственных друг другу задач. Теорема двойственности для задач выпуклого программирования. Предположим, что S-функция семейства {(з(о^,гу))} непрерывна в точке @,0). Тогда: для любых (a,rj) ? е int(domS') S(a,r))= sup (Aa + (rf,77)+ inf ^>,rf,A, 1)). A1) Значения задачи (з) и двойственной ей задачи (з*) равны между собой inf /0(x) хеА Ax=b = sup \ini\fo(x) + f]Xl(fl(x)-ai) + {r1*,Ax-b)\\. A2) Доказательство. По следствию 1 функция S выпукла, а из непрерывности ее в одной точке вытекает (предложение 3 п. 2.6.2)
3.3. Принцип Лагранжа и двойственность 241 непрерывность и равенство S(a,rj) = (conv S)(a, rj) для всех (a, rj) G G int(domS'). По теореме Фенхеля-Моро (п. 2.6.3) и следствию 2 5(а,ту) = S**(a,rj) = sup (Aa + (г)\г)) - 5*(A,г/*)) = (A.77*) = sup (Aa + (ту*, ту) + inf ^>, 77*, A, 1)), чем доказано A1). Подставляя а = О, ту = 0, получаем A2). ¦ Следствие 3 (теорема о минимаксе). В условиях тео- теоремы двойственности справедливо соотношение sup inf #(ж,7/*,А, 1)= inf sup ^>,rf,A, 1). A3) Доказательство. Левая часть A3) равна Е@) и в силу A2) совпадает с 5@,0). Что же касается правой части, то inf sup <?(х,г)*,\, 1) = inf sup 9E(x\\,r)*) = Х^А х^А = inf ((-^)*^(х;0,0)) = inf /(ж; 0,0) согласно G) и также совпадает с 5@,0). 3.3.3. Линейное программирование: теорема существования и теорема двойственности. Пусть X — линейное пространство, X' — алгебраически сопряженное с ним (т. е. совокупность всех линейных функционалов на X), К — некоторый полиэдральный конус (т. е. пересечение конечного числа полупространств Hj = {(x'j,x) ^ 0,х^ G G Xf,j = l,...,s} — иногда, впрочем, от условия полиэдральности отказываются). Экстремальные задачи вида (#о,ж) "^ inf; fi(%) — (xi>x) ^ Ы> i=l,...,m, x^K, A) составляют отдельный класс задач линейного программирования. В этом пункте будет рассмотрен конечномерный случай, когда X = = Rn, X' = Rn*, К = R™. В этом случае задачу A) можно переписать так 0 : сх -> inf; Ах > Ъ, х > 0, B) 1) Напомним, что для конечномерных пространств мы имеем два обозначе- обозначения: п г=1
242 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями где с G Rn*, A = (dij), j = 1,..., п, г = 1,..., m, — матрица, задаю- задающая линейный оператор из Rn в Rm, Ъ ? Rm. Символ z1 ^ z для конечномерных векторов zr и z означает, что все координаты вектора не превосходят соответствующих координат вектора z'. Задачу B) назовем конечномерной задачей линейного программирования. Эта задача — частный случай общей задачи выпуклого программирования. Однако в ней имеется еще более специальная структура: все функции здесь линейны и конус полиэдрален. Как и обычно, условимся, что если задача B) несовместна, т. е. не имеет допустимых элементов, то ее значение считается равным +оо. Теорема существования. Если множество допустимых значений конечномерной задачи линейного программирования B) непусто и ее значение конечно, то задача имеет решение. Доказательство теоремы 1 опирается на один простой факт конечномерной геометрии. Напомним, что коническая оболочка cone С некоторого множества С С X определяется равенством cone С = < х G X s > и является выпуклым множеством (п. 2.6.1). Мы будем говорить, что конус cone С порожден множеством С. А) Лемма о замкнутости конечнопорожденного ко- конуса в конечномерном пространстве. Всякий конус в ко- конечномерном пространстве, порожденный конечным множеством точек, замкнут. Доказательство. Пусть К = cone С С R^, С = {z\,..., Zk}, Zi G R^. Доказательство проведем по индукции. 1) к = 1. Тогда К = conejzi} = {х \ х = \\Z\,\\ ^ 0} — полупрямая, т. е. замкнутое множество. 2) Допустим теперь, что лемма верна для к = s — 1. Докажем ее для к = s. Возможны два случая: а) конус К содержит векторы —z\, ..., — zs. Тогда К есть подпро- подпространство конечномерного пространства и, следовательно, замкнутое подмножество; б) хотя бы один из векторов (—^), г = l,...,s, например (—zs) не принадлежит конусу К. Обозначим через К\ = conejzi,..., zs-\}. По индуктивному предположению конус К\ замкнут. Пусть вектор z принадлежит замыканию конуса К, т.е. z = lim?n; (nGK, n > 1. п По определению ^п е К = cone{zu ..., zs} <& ?п = г=1 где (п е К\ и Asn > 0.
3.3. Принцип Лагранжа и двойственность 243 Если допустить, что Asn —> оо при п —> оо, то —zs = lim ^—г—— = lim -т^— G if i П-ЮО Asn П-ЮО Asn (напомним, что t;n —> z, и потому ^n/Asn —> 0, a Cn/Asn ? -K"i вместе с (п), т. е. —zs G К\ вследствие замкнутости К\, что противоречит до- допущению. Значит, Asn не стремится к бесконечности и можно выбрать подпоследовательность Asnfc, сходящуюся к некоторому числу Aso ^ 0. В этом случае (пк — ?>пк — ^snkzs -^ Z — XsoZs = Z. В силу замкнутости К\ вектор ?G K\ и, следовательно, z = I+\sozs e К. ш Б) Докажем теперь теорему существования. Рассмотрим в пространстве Rm+1 множество К, образованное таки- такими векторами (a,z), a G R, z G Rm, для каждого из которых найдется хотя бы один вектор х G R!f. такой, что еж ^ а, Аж ^ z. Множество К — это конус, ибо если (a, z) G К, то для некоторого х G R!f:, еж ^ а, Аж ^ ^. Но тогда для любого t^O,txG R!f:, c(tx) ^ ta, A(tx) > tz, т. e. t(a, ^) e K. Покажем, что конус К порожден конечным множеством векторов в Rm+1: Ci = (ci,an,... ,ami), C2 = (c2,ai2,...,am2),---,Cn = = \Cn, CL\n, ... , &mn)-> Cn+l =(l,0>...,0)> Cn+2 = @,-1,0,...,0)>...,C Прежде всего Q ? К, так что conej^i,... ,(п+т+\} С К. Действитель- Действительно, если 1 ^ г ^ п, надо взять в качестве х стандартный базисный вектор ei\ для остальных г надо взять х = 0. Пусть теперь вектор ( = (a, z) = (a, z\,..., ^m) G К. Тогда для некоторого х G Rn, ж = = (х\,..., жп) такого, что ^i ^ 0, ..., хп ^ 0 и некоторых /Зо ^ 0, /3j ^ 0, выполняются соотношения п п 2_^ CjXj + /Зо = а, у. aijxj — fij = z%, г = 1,..., m. Но это как раз и означает, что п т С = (а' ^) = ^_^ xjCj + /^оСп+1 + ^^ АСп+г+Ь j=l г=1 ж7 > о, /з0 > о, а > о,
244 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями т. е. С е cone{Ci,...,Cn+m+i}- По лемме из предыдущего пункта конус К замкнут. По условию теоремы задача B) имеет допустимый элемент х и значение зада- задачи а > —оо. Из определения К следует, что точка (а, Ь), где а = = сх, принадлежит К. При этом, очевидно, что а ^ а. Следовательно, множество Я = {a G R | (a, b) ? К} непусто и а = inf{a | a G Я}, т. е. (а, Ь) принадлежит замыканию конуса К, а значит, и самому К. Следовательно, существует элемент х ^ 0, для которого Ах ^ Ь и сх ^ а, т. е. х — решение задачи. ¦ Переходим к рассмотрению двойственной задачи. Теорема двой- двойственности приобретает здесь более законченный вид, чем в преды- предыдущем пункте, поскольку ввиду специальной структуры ^-функция задачи оказывается замкнутой. В соответствии с формулами E) и F) п. 3.3.2 расширенная функция Лагранжа имеет вид {сх + Х(Ь- Ах), х е R+, AGRf, -оо, хеЩ, A^Rip*, +оо, х ? Щ. Отсюда мы находим семейство возмущений задачи B) и двойственное семейство. Согласно G) п. 3.3.2 f(x; а) = (— 9?)*^ = sup(Aa + 9?(х, А)) = А Г +оо, х ф Щ, Х(Ь-Ах), хеЩ = сх, х ^ 0, Ах ^ Ь + а, +00 в остальных случаях. Обозначая z = Ъ + а, получаем возмущение задачи B) сх —> inf, х ^ 0, Ах ^ z. C) Аналогично для определения двойственной задачи мы должны вычис- вычислить () 0, А) = {-9S )@,А) = X !- sup(-cx - \(Ъ - Ах)), А > О, Xb, A > О, ХА < с, —оо в остальных случаях.
3.3. Принцип Лагранжа и двойственность 245 Это дает задачу ХЪ -> sup; ХА < с, А > О, D) двойственную задаче B). Она имеет такое же строение, как зада- задача B), и легко понять, что если, отправляясь от задачи D), постро- построить двойственную задачу по тому же правилу, по которому из за- задачи B) получилась задача D), то мы вернемся к задаче B). По- Поэтому имеет смысл говорить о паре двойственных задач линейного программирования. Теорема двойственности. Для пары двойственных задач линейного программирования справедлива следующая альтернати- альтернатива: либо значения задач конечны и равны и в обеих задачах су- существует решение, либо в одной из задач множество допустимых элементов пусто. В первом случае х е Rn и X е К171*, в том и только в том случае, будут решениями задач B) и D) соответственно, когда они допустимы в этих задачах и удовлетворяют одному из двух соотношений сх = ЛЬ, E) Х(Ах -Ъ) = (ХА - с)х. F) Во втором случае одна из задач несовместна, а другая либо несовместна (т. е. ее множество допустимых элементов пусто), либо имеет бесконечное значение. Доказательство. А) Построение ^-функции. Снова рассмотрим тот же конус К, что и в теореме существования. Если (a, z) G К и /3 ^ а, то (/3, z) Е К, а потому К является надграфиком функции S(z)=inf{a\ (a,z) e К}. G) Из доказательства теоремы существования следует, что inf достигается и S(z) есть значение задачи C) и, следовательно, формула G) опреде- определяет ^-функцию задачи B). Поскольку К — выпуклый и замкнутый конус, ^-функция задачи B) замкнута и выпукла. Б) Вычислим функцию S*, сопряженную с функцией S. По опреде- определению, = sup(Az - S(z)) = sup{Az - inf {еж | x e R+, Ax > z}} = - ex | x e R+, z e Rm, z < Ax}. (z,x) Очевидно, что sup{Az | z G Hm,z ^ Ax} = XAx < oo в том и только в том случае, когда А ^ 0.
246 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Таким образом, ( sup(XA - с)х, если Л е R?*, S*(\) = l х^ + = [ +оо, если Л ^ R!p* _ Г 0, если ХА < с, Л > О, ~~ 1 +оо в остальных случаях. Поэтому S**(z) = sup{Xz | ЛА < с, Л > 0}. (8) В частности, отсюда видно, что S**(b) — значение двойственной задачи D). В) Завершение доказательства. Функция S не может рав- равняться тождественно +оо, ибо S@) ^ 0, так как нуль — допустимый элемент в задаче сх —> inf, Ах < 0, х > 0; следовательно, domS* ^ 0. Возможно одно из двух: 1) S(z) > -оо, Mz или 2) существует ¦?, для которого 5B) = —оо. Случай 1) в свою очередь распадается на два: 1а) Ъ е domS и 16) Ь ^ domS'. В случае la) S — собственная функция и значе- значение задачи конечно. Вследствие замкнутости S по теореме Фенхеля- Моро (п. 2.6.3) S**(b) = S(b) и теперь из (8) видно, что двойственная задача D) имеет то же значение, что и прямая B) и, в частности, сов- совместна. В силу теоремы существования решение существует в обеих задачах. В случае 16) S(b) = +оо, т. е. задача B) не совместна. Снова из теоремы Фенхеля-Моро получаем, что S**(b) = S(b) и, значит, задача D) совместна, но ее значение бесконечно. В случае 2) S(z) = —оо для всех z ? domS (см. упражнение 8 п. 2.6.2). По определению 5*(А) = +оо и S**(z) = —оо. В частности, S**(Ь) = —оо, т. е. задача D) несовместна. Если Ъ ? domS, то задача B) совместна и ее значение бесконечно: S(b) = —оо. Если же Ъ ф domS, то S(b) = +оо задача B) несовместна. Альтернатива полностью обоснована. Вернемся теперь к случаю 1а). Там, как было доказано, существуют решения задач B) и D). Обозначим их х и А соответственно. Доказано, что значения задач равны: сх = ХЬ, т. е. выполнено E) и, значит, Х(Ах - Ь) = ХАх - ХЬ = ХАх - сх = (ХА - с)х, т.е. выполнено F). Далее, если х и А — допустимые элементы (т.е. х > О, А > О, ХА < с, Ах > Ь), то сх > ХАх > ХЬ. Поэтому, если сх = ХЬ, то х и А — решения задач. Далее, если Х(Ах — — Ъ) = (ХА — с)х, то сх = ХЬ, т. е. х и А — решения задачи.
3.3. Принцип Лагранжа и двойственность 247 Таким образом, если х и Л — решения, то выполнены и E), и F); если х и Л допустимы и выполнено либо E), либо F), то х и Л — решения задач. Теорема полностью доказана. ¦ Упражнение. Во что превращается в рассматриваемой ситуации теорема о минимаксе (следствие 3 п. 3.3.2)? 3.3.4. Теорема двойственности для задачи о кратчайшем рас- расстоянии. Лемма Хоффмана и лемма о минимаксе. Пусть Y — нормированное пространство, В С Y — непустое подмножество Y. Величина SB(v)=p(v,B)=mi\\y-ri\\ A) уев называется расстоянием от точки г] до множества В. Исследова- Исследование функции Sb(tj) является одной из основных в теории приближе- приближений (см. [84]). Если В — выпуклое множество, мы получаем задачу выпуклого программирования. Доказываемая ниже теорема двойствен- двойственности имеет в анализе многочисленные приложения. Итак, пусть В — выпуклое множество. (Далее оно фиксировано, и мы опускаем индекс В в обозначении функции S.) Тогда функция г] I—> S(rj) является ^-функцией такой задачи: ||z|| —> inf; у — z = rj, у е В. B) Приведем B) к стандартному виду задачи выпуклого программиро- программирования (см. (з) в п. 3.3.1). Для этого положим X = Y x Y, х = (y,z), fo(x) = ||z||, Ax = z — у, Л: X —> Y, А = {х = (y,z) | у е В} и тогда задача B) примет вид /o(a;)->inf; Ах + г] = 0, х е А. C) Из сказанного вытекает выпуклость функции S (следствие 1 п. 3.3.2). В дальнейшем нам понадобится следующее важное геометрическое понятие. Определение. Опорной функцией множества В с У называет- называется функция sB: У* —> R, определяемая равенством sB(y*) = sup(y*,y). в Теорема двойственности для задачи о кратчайшем расстоянии. Величина S(rj) допускает следующее двойственное представление: S(V) = p{v, В) = sup{{y*, r,) - sB(y*) | \\у*\\ < 1}. D) Доказательство. Очевидно, что S(rj) > 0, Vry. С другой сторо- стороны, S(rj) < \\уо — 7/Ц, где уо — любая точка из В. Значит, S ограничена сверху и снизу и, следовательно, непрерывна всюду на Y (предло- (предложение 3 п. 2.6.2). Теперь можно применить теорему двойственности
248 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями из п. 3.3.2. Поскольку в B) неравенства отсутствуют, функция Лагран- Лагранжа имеет вид Из формулы A1) п. 3.3.2 получаем S(V) = sup I (у*, г?) + mf (||z|| + {y*,z -y))\ = Vz€Y = supl ({y*,7]}-sup{y*,y}) -sup((-j/*,z>- y* I \ уев J zeY = Sup{(y*,t1)-sB(y*)-N*(-y*)}, У* где N(z) = \\z\\, a N*(z) = 0 при ||^*|| < 1 и +оо при ||^*|| > 1. (Предложение 3 п. 2.6.3.) Отсюда следует D).и В дальнейшем понадобится следующее обобщение следствия 2 п. 2.6.4. Лемма о сопряженном кону се. Пусть X и Y — банаховы пространства, А: X —> Y — линейный сюръективный оператор из X в Y, х*, ..., ж* — элементы сопряженного пространства X*, и пусть К = {х\ (х*,х) <0, г = 1,..., «s, Лж = 0} — конус в X. Тогда всякий элемент х^ из сопряженного конуса К* = {х* | (х\х) >0, хеК} допускает представление в виде г=1 для некоторых Хг > 0 и у* ? У*. Доказательство. А) Обозначим L = П Кегж*, Z = KerA/L, г=0 и пусть тг: KerA -^ Z — естественная проекция, отображающая х ? ? КегЛ в класс тг(ж) G ^, его содержащий. Покажем, что dimZ ^ s + + 1. Действительно, пусть zo, ..., ^s+i — произвольные элементы из Z, Zi = 7r(xi). Однородная линейная система s + 1 уравнений s+l (^Л г = 0,1,...,,,
3.3. Принцип Лагранжа и двойственность 249 с (s + 2) неизвестным имеет ненулевое решение Ао, ..., As+i. Тогда х = ^2/\jXj е Кегж*, г = О,..., s, => х е L => 0 = тг(ж) = S+l S+1 i=o j=o Следовательно, любые 5 + 2 элементов из Z линейно зависимы и d = = dim Z < 5 + 1. Б) Выбрав в Z некоторый базис /ь ..., /^, установим стандартный изоморфизм между Z и Rrf и между Z* и Rrf* г=1 Далее, определим функционалы z* G Z*, г = 0, 1,..., 5, равенствами и рассмотрим в Z* выпуклый конус -conej^,...,^} - lz 2^ *zi> i^ Г l г=1 J Поскольку Z* конечномерно, а конус К конечно порожден, то по лемме из п. 3.3.3 он и замкнут. _ Предположим, что — Zq ^ К. Тогда по второй теореме отделимо- отделимости (п. 2.1.4) существует линейный функционал / G (Z*)*, строго раз- разделяющий {—Zq} и К: A,-4) > sup{(U*> I z* e К} = sup Jj><U?> I А^ о| . Ноггогда обязательно (/, z*) < 0 (иначе sup = +оо), 0 = sup{(/, z*) \ z* e еК}и (l,z*) <0. Теперь заметим, что /, как и всякий линейный функционал на ко- конечномерном пространстве Z*, задается линейной формой
250 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями d Выбрав в классе а = J2 aifi ^ Z = КегЛ/L представителя xq e КегЛ, г=1 а = тг(жо) имеем, с одной стороны, (х;,х0) = {z*,n(x0)) = {z*,a) = {l,z*) < 0 и, следовательно, х0 е КегЛП П {х | (х?,х) ^0} = К. С другой стороны, (х*0,х0) = (^о,7г(жо)) = (^,а) = (l,zo) <0 и, следовательно, ж^ ф К* вопреки условию леммы. Таким образом, предположение — Zq ^ К приводит к противоречию, s и потому — Zq = J2 ^izt Для некоторых Xi ^ 0. г=1 В) Для любого ж G КегЛ =0. S Поэтому Xq + J^ Л^ж* G (КегЛ)-1, и по лемме о ядре регулярного г=1 S оператора (п. 2.1.7) ^о + S ^г^* = Л*(—у*) для некоторого у* eY*.m г=\ Лемма Хоффмана. Пусть выполнены те же условия, что и в лемме о сопряженном конусе. Тогда для функции расстояния от точки х до К справедливо неравенство E) i=\ где (#*,#)+ равно (х*,х), если (х*,х) > 0, и нулю в остальных случаях, а константа С не зависит от х. Доказательство. Множество К, являющееся пересечением ко- конечного числа полупространств и подпространства, — выпуклый конус в X. Вычислим его опорную функцию sK. Пусть х* G X*. Возможно одно из двух: либо найдется такой элемент хо е К, что (х*,хо) > 0, либо (х*,х) < 0, Ух е К. В первом случае sK(x*) > t{x*,xo) Vt G R+ и, значит, sK(x*) = +оо. Во втором случае (—1)ж* принадлежит сопряженному конусу ко- s нуса К и, значит, по предыдущей лемме х* = J2 ^ixt + ^*у*, А^ ^ 0, г=1
3.3. Принцип Лагранжа и двойственность 251 s +oo в остальных случаях. Применив теперь формулу D) (теорему двойственности) к нашей задаче, получаем р(х,К) = sup{(x*,x) | ж* = ^Л^* + А*у*,\{ > 0, ||ж*|| < 1}. F) г=1 Подпространство L = lin{#*,... ,ж*} + 1тЛ* является суммой зам- замкнутого подпространства L\ = 1тЛ* (ибо 1т Л* = (КегЛ)-1, а ан- нулятор всегда замкнут) и конечномерного подпространства L^ = = {х*,...,ж*}. Поэтому I/ замкнуто в X (докажите!) и, следовательно, s банахово. Оператор А\: Rs х У* -^ L, А\(\,у) = J^ А^ж* + Л*у* ли- г=1 неен, непрерывен и отображает Rs x У* на банахово пространство L. По лемме о правом обратном отображении (п. 2.1.5) существует отоб- отображение М\\ L —> Rs х У* такое, что Ai о Mi = IL, ||Mix*|| < С||^*||- Тогда, если ||ж*|| < 1, то ЦМ^Цк^у* = ? |А»| + ||г/*|| < С. Таким г=1 образом, в выражении F) можно считать, что 0 ^ А^ ^ С, \\у*\\ ^ С, откуда и получаем г=1 ) Заметим, что если конус К задается лишь равенствами К = {х | (х*,х) =0, Ах = 0} (т. е. является подпространством), то он допускает определение и через неравенства Применив лемму Хоффмана, получаем и в этом случае, что
252 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Лемма о минимаксе. Пусть X и Y — банаховы простран- пространства, Л: X —> Y — сюръективный оператор, х* G X*, г = 1,..., s, а = (а\,... ,as). Определим функцию S: Rs x Y —> R равенством S(a, у) = . inf max (а{ + «, х}). G) Ax+y=0 l^i^s Если max (х* ,х}^0 для любого х G Кег Л, то имеет место следующая формула двойственности: гs S(a, у) = sup< \^ аопо + (?/*, у) ai ^ О, " " гж*=(Н. (8) г=1 г=1 этом inf в G) достигается на некотором (быть может, не единственном) х = ж (а, у), ^ существуют такие С > О, С > О, не зависящие от а, у, что при подходящем выборе х(а, у) \\х(а,у)\\ < C{\S(a,y)\ + \а\ + \\y\\} < С(\а\ + \\y\\). (9) Доказательство. Существование минимума в G), выпуклость S и формулу (8) мы докажем редукцией к двум стандартным задачам, рассмотренным выше. А) Вспомогательные отображения. Нам придется дважды воспользоваться леммой о правом обратном отображе- отображении (п. 2.1.5). Во-первых, существует М: Y —> X такое, что Л о М = /, ||М(?/)|| ^ С\(у). Во-вторых, пусть (р: X —> Rs определяется равенством (р(х) = ((х\,х),..., (ж*,х}). Обозначим L = ^(КегЛ). По той же лемме существует отображение /i: L —> Кег Л такое, что Далее, как и всякое подпространство в Rs, L может быть задано S некоторой системой линейных уравнений Yl hjij = 0» ' = Ь ••• ,р, или при помощи отображения /3: Rs ^ Rp, /3^ = J^ b/j^ условием /3^ = Б) Ограниченность S(a,y). Поскольку Лж + у = 0<^>ж = М(—?/) +^о, хо е Кег Л =Ф а^ + {х*,х) = = ^ + «,М(-2/)> + «,жо>, (Ю) то, полагая, xq = 0, мы получаем, с одной стороны, неравенство inf ш^{аг + {х*,х))^ш^{\аг\+С{\\х*\\Ы\}АМК, A1)
3.3. Принцип Лагранжа и двойственность 253 а, с другой стороны, при Ах + у = 0, согласно A0), тах(а* + (х*,х)) > mm (flj -C,||a;J|| IMI) > -К, A2) так как по условию тах((ж*,жо)) ^ 0 (#q G КегЛ). Из A1) и A2) следует оценка \S(a,y)\^K=mm{\ai\+Cl\№\\\\y\\}. A3) В) Существование минимума. Обозначив + (ж*, М(—?/)) +Ки вспоминая, что ж0 ? КегЛ^ ((ж*,жо),...,(ж*,жо)) = <р(жо) е L = ^(КегЛ) =Кег/3, мы видим из A0) и G), что S(a,y) -\- К является значением задачи i + &) -^ inf; (GL<^c^ inf; а^ + ^ < с, /3^ = 0. A4) В силу A3) S(a,y) + К > 0, и потому к A4) можно безболезненно присоединить условие с > 0. Задачу A4) можно привести к стандартному виду задачи линейного программирования B) п. 3.3.3 в Rs+1. Для этого обозначим zq = с, Zi = = c-^-ai, z = (zi,...,zs), в = A,..., 1), a = (au...,as), z = (zo,z). Условие /3? = 0 записывается в виде /?? = 0 <& /3(сО - z-a) = c/30- /3z- /3a = 0o Bz^b, В={-/30 C)> Ь={-/За — матрица порядка 2р х (s + 1) и 2р-мерный вектор (фактически мы заменили равенство /3? = 0 двумя неравенствами /3? ^ 0 и /3? ^ 0. Поэтому задача A4) эквивалентна задаче ^o^inf, Bl^b, z^O, A5) имеющей стандартный вид. Эта задача совместна (например, вектор BК, 2К — а\,..., 2К — as) допустимый; соответствующее ? = 0 ? L и ее значение S(a,y) + К конечно (и даже неотрицательно). По тео- теореме существования из п. 3J3.3 она имеет решение ?. Следовательно, задача A4) имеет решение ? = (S(a,у) + КH — z^—a, и тогда S(a, у) + К = max {дц + ?Л = max |а7- + (ж*, М(—?/)) + ?Л + К И 5(а, у) = max {а^ + (ж*, х}}, где, согласно A0) и определению отображения /i: L —> КегЛ, ж = М(-у)+^. A6)
254 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Г) Выпуклость S и теорема двойственности. Функ- Функция (а, у) \-^ S(a, у) является ^-функцией следующей задачи выпуклого программирования: max(r/i,...,r/s) -> inf, -щ + (х*,х) + а{ = О, Лж + у = 0. A7) Полагая Z = Rs х ХУ, У = Rs х У, ^ = (т?, ж), /о(г) = max(r/i,...,r/s), Д <*/ ( ( Т** ТМ ТЬ ( Т** ТМ Т) А ^7*1 -i \./С/ у \ *Aj 1 • «Ду / /1.9*** 9 \ *~^ Q 9 *^^ / IS 9 Л-«Д^ у • приведем A7) к стандартному виду ((з) в п. 3.3.2): Следовательно, функция (а, у) ь-> S(a,y) выпукла (следствие 1 п. 3.3.2). Согласно A^3) она ограничена, а потому и непрерывна на всем про- пространстве У (предложение 3 п. 2.6.2). По теореме двойственности из п. 3.3.2 (напомним, что неравенства в задаче A8) отсутствуют) S(a, у) = sup{(^*, (а, у)} + inf [(z*, Az) + max (r/b ... rjs)]}. A9) 2* ^ Ho z* e (Rs x У)* = Rs* x У*, т. e. z* представим в виде (а, у*), а = = (a\,..., as) G Rs*, y* G У*, так что (z*,(a,y))=aa+ (у*,у), (z\Az) = E ai((xlx) - гц) + (j/*, Ax). B0) г=1 Согласно предложению 2 п. 2.6.3 преобразование Юнга-Фенхеля функции f(rj) = max(tj\, ... ,rjs) имеет вид S _ 0, если аг > 0, ^ с^ = 1, 77 I +00 в остальных случаях. Теперь из B0) и B1) имеем inf(max(r/i,...,r/s) + (^*,A^)) = Г * 1 = — sup < ary — maxG71,... ,rjs) — (V^a^* + Л*у*,ж) > = О, если а^ > 0, ^) ^ = 1, Л*у* + ^) а^* = О, г=1 г=1 —оо в остальных случаях. Подставляя это в A9), получаем (8).
3.3. Принцип Лагранжа и двойственность 255 Д) Геометрическая лемма. Пусть L — подпространство, а К — конечно порожденный конус в Rs. Тогда существует такое N > О, что для любого a G Rs р@, (L + а) П К) < 7Vp(O, L + а) < ЛГ|а| B3) (формула остается справедливой и в случае (L + а) П К = 0, если мы условимся считать, что р@, 0) = —оо). Доказательство, а) Пусть К = сопе{х\,... ,хт}. Разложим каждый вектор на две компоненты — содержащуюся в подпространстве L и ортогональную к нему: b, yi ? L, c,zieL±. Тогда /9@, (L + а) П K) = infflf | = inf ¦ т г=\ = inf ¦ 0, 2?») - b - с e L \ = i=\ i=\ m г=1 VA, max {Ы}+ ^ ^ 1 <i,<m, Zi = c\. B4) С другой стороны, р@, L + a) = Ы{\г] + а\ \ г) ? L} = = inf{|r/ + c| \r]f eL} = \c Поскольку г=1 С|2 = 0, ^1, ... , Zm}, i=\ мы видим, что B3) будет следовать из B4), если для некоторого N\ > >0 с ? ь ... ,zm} 0, B5) г=1 г=1 (при этом в B3) мы будем иметь N = N\ max {\yi\} + 1). б) Пусть L\ = linj^i,..., zm}, dim Li = п. Выделим всевозмож- всевозможные наборы индексов / = {i\,... ,in}, для которых {z^,..., Zin} — базис в L\. Каждому такому набору отвечает линейное отображение
256 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями п Л/: Rn —> Li, определяемое формулой Л/ж = Yl xk%ik- Поскольку к=\ к\ {zix,..., Zin} — базис в Li, существует обратное отображение. По теореме Каратеодори (п. 2.6.1) каждый вектор с ? cone{z\,..., ...,zm} является конической комбинацией не более чем п линейно независимых векторов Zi с = \ixzix + ... + \iaZia Дополнив, если нужно, набор {z^,. векторами Zi3+l, ..., Zin и положив A С = Л7Л, Л = (Лг1,...,Лг„), Xik > О, п. ,Zi3} до базиса в L\ некоторыми +1 = ... = Xin = 0, мы видим, что Поэтому п Ел- к=\ п|Л| п|| 71| птах{||Л71||}|с|. Этим доказано B5) для N\ = птах{||Л7 ||}. Е) Завершение доказательства леммы о минимаксе. По- Последнее, что осталось нам сделать, — получить оценку (9). Для этого вернемся к левой из задач A4). Элемент ? = (?ь ...,?s) является ее ре- решением тогда и только тогда, когда S(a, у) + К, г=1,...,5, B6) (поскольку S(a, у) -\- К — значение задачи, по крайней мере для одного индекса здесь будет иметь место равенство). Вспоминая определение Ъг в п. В) и обозначая а = (аь ..., as), где аг=Ъг- S(a, у)-К = аг + « переписываем B6) в ^иде ?^ + а^ ^ 0. Таким образом, ? — решение A4) Поэтому (-у)) - S(a, у), B7) + aG (L + а) П (—R^_). ? решение A4)} = р@, (L + а) П (-R+)). Поскольку —R+ = сопе{—е\,..., — es} — конечно порожденный ко- конус, правая часть по геометрической лемме п. Д) не превосходит Np@, L + a) < N\a\. Следовательно, и так как ^решение A4)} < iV|a|, ? + а\ + |а|, inf{|?| | ? решение A4)} < (N + 1)|а|.
3.4. Необходимые и достаточные условия экстремума 257 Если а ф 0, то (N + 1)|а| < (N + 2)|а|, и среди решений задачи A4) мы можем выбрать такое, обозначим его ?, у которого B8) Если а = О, то ? = 0 решение и B8) снова верно. Воспользовавшись формулой A6), находим по ? элемент ж = ж (а, При его оценке учитываем неравенства l|M(-2/)||<Ci|M|, IKOIKC-aiei B9) (ср. определение правых обратных отображений Мир пункте А)) и /з \ V2 B7) а — ' x a\ \ ^ у5 max{|ai ,..., as\) \S(a,y)\] < [|a| + C, max \\x*\\ \\y\\ + \S(a,y)\], C0) а также оценку A3): A6),B9) _ B8) C0) ||()|| C||||C|^| C||||C(iV 2)|| max ||<| A3) C,A + >/i max ||<||2C2(iV Поэтому верно (9) с константами С = max{Ci A+^(^ + 2)^ max ||ж*||, C2(N С = max{Ci(l + V5 max ||^*||2C2(iV + 2)), 2C2GV + § 3.4*. Необходимые условия второго порядка и достаточные условия экстремума в гладких задачах Снова разберем сначала случай, когда неравенства отсутствуют. 3.4.1. Гладкие задачи с равенствами. Рассмотрим задачу /(a;)->extr; F(x)=0. A) Теорема 1 (необходимые условия второго поряд- порядка). Пусть X и Y — банаховы пространства, U — открытое 9 В. М. Алексеев и др.
258 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями множество в X, функция f:U^Hu отображение F: U —> У строго дифференцируемы в точке х G U и имеют в этой точке х вторую производную Фреше. Если х доставляет локальный минимум (максимум) в задаче A) и если F регулярно в точке х (т. е. lm.F'(x) = У), то существует множитель Лагранжа у* ? Y* такой, что ?х(х,У*>1)=0, B) ?хх(х,У*> 1)[Л,Л] > 0 « О), УЛ е KeiF\x), C) где ${х,у*, 1) = f(x) + (y*,F(x)). Доказательство. Равенство B) было доказано в п. 3.2.2. Да- Далее разбираем случай х ? locmin A). Пусть h ? KeiFf(x). Согласно теореме Люстерника (п. 2.3.5) h ? T^tl, где Ж = {х \ F(x) = 0}, т. е. существует отображение г(-): [—?,?] -^ Л такое, что F(x + th + r(t)) =0, r(t) = o(t), t ?[-?,?]. D) В силу D) х -\-th-\-r(t) — допустимый элемент в задаче при t ? [—?,?] и, следовательно, f(x) ^ f(x-\-th-\-r(t)), ибо х ? locmin(l). Поэтому f(x) < f(x + th + r(t)) = Щ + th + r(t),y*, О = Отсюда немедленно следует C).и Теорема 2 (достаточное условие минимума). выполнены условия предыдущей теоремы и, кроме того, для неко- некоторого а > 0 выполнено неравенство &хх(х,У*, l)[h,h] ^ 2a\\h\\2, УН е KeiF'(x). E) Тогда х есть точка локального минимума в задаче A). Доказательство. Без ограничения общности можно считать, что f{x) = 0. Обозначим через B(h\,Ji2) билинейную форму ^(*1)[^^2]- По теореме о смешанных производных (п. 2.2.5) В — непрерывная симметричная билинейная форма. Выберем г > 0 так, чтобы <р{е) =a(l-sf- 2\\B\\(l + е)е - \\B\\e2 - | > 0 F) (поскольку (р@) = а/2 > 0, это сделать можно). Функции F и Я?(-,у*, 1) по условию имеют в точке х вторые произ- производные Фреше по х. Воспользовавшись формулой Тейлора (теорема 2
3.4. Необходимые и достаточные условия экстремума 259 п. 2.2.5) и учтя, что F(x) = О, <?(х, у*,1) = 0> &х(х,у*,\) = О, найдем такое 5\ > О, чтобы при \\h\\ < 5\ выполнялись неравенства \\F(x + h) - F'(x)h\\ = \\F(x + h)- F(x) - F'(x)h\\ < C, \\h\\\ ^ {7 Применяя лемму из п. 2.1.5, построим правое обратное к F'(x) отоб- отображение М: Y —> X, F'(x) о М = /, ||МB/)|| < С\\у\\. По выбранному ранее г > 0 подберем 5, 0 < 5 < 5\ так, чтобы 5ССХ < е. (8) Пусть теперь \\h\\ < 5 и х -\- h — допустимый элемент в задаче, т. е. F(x + К) = 0. Положим /i2 = M(Fx(x)/i) и обозначим через /ii разность h — /i2- Тогда из оценки для М(?/), G) и (8) имеем INK cil^'O^IKCdц/jH2 <e||/i||, (9) F'(x)hi = F\x)(h - h2) = F'(x)h - F'(x)M{F'{x)h)) = 0. Таким образом, h\ ? KerF'(x). Из (9) вытекает, что A - ||fti|| < A +?)||/г||. В итоге получаем, учитывая F), E) и G): /(ж + h)= Щ+h,у\ 1) > B(h,h) - | в(ы,ы)-2\\в\\ им \\h2\\ - \\в\\ \\h2\\2 - - \\h\\2 > Ч - sf - 2\\B\\(l + s)s - \\В\\г2 - |) \\h\\2 >0, т. е. x G locmin(l). ¦ 3.4.2. Гладкие задачи с равенствами и неравенствами — необ- необходимые условия второго порядка. Рассмотрим задачу: /'n (rp\ v iy-1-p ТТ'( ' ^Л — Г) 1" • (т} <С О 7 — 1 ТП A ^ U\ / nil., J- \^) vy, jiyu;j <^ w, б 1, ... , //t/. ^y Меняя, если нужно, знаки функций мы можем свести к (з) любую задачу из § 3.2. Функция Лагранжа задачи (з) имеет вид m г=\ Теорема. Пусть X, Y — банаховы пространства, U — от- открытое множество в X, х G U, функции fii U -^ R, г = 0, 1,... ,ш и отображение F: U —> Y строго дифференцируемы в точке х, имеют в этой точке вторую производную Фреше и, кроме того, fi(x) = 0, г = 1,..., т. Если х доставляет локальный минимум в задаче (з), и регулярно в точке х (т. е. lmF'(x) = Y), то: 9*
260 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями а) множество D множителей Лагранжа (у*,Х,Хо), у* G У*, Л G Rm*, Ло таких, что г=0 IU ^(ж,2/*,А,А0)=0 является непустым выпуклым компактом в У* х Rm* x R; б) для любого ho, лежащего в подпространстве L = {h | (fl(x), ft) = 0, i ^ 0, Fx(x)/i = 0}, B) найдутся такие множители Лагранжа (у*(ho), A(/io), Ao(^o)) ? А что ?xx(x,y4ho),\(ho),\o(ho))[ho,ho}^O. C) Доказательство. Обозначим для краткости F'(x) = Л, /гх(^) = _ г* — л^. А) Рассмотрим отображение (р: а —> X* симплекса сг = = ^ (А, Ао) | Аг > 0, ^ Аг = 1 >, определяемое равенством ^(А, Ао) = I г=0 J т = Y, ^ix* • Тогда г=0 т (у*,\,\о) е D &^2\>х*{ +у* о А = = <р(\, Ао) + Л*у* = 0 => <р(\, Ао) G GlmA* => (А,А0) ecri =(/;-1AтЛ*). По условию 1тЛ = У, а следовательно (п. 2.1.7), 1тЛ* = (КегЛ)^ и потому замкнут. Значит, а\ — замкнутое подмножество компакта и само компакт. Заметим теперь, что КегЛ* = {0}. Действительно: ft* еКегЛ* => (A*ft*,x) =0,Vx^ (ft = 0,Vx => ft* g (ImAI =Ф ft* = 0. Так как замкнутое подпространство 1тЛ* банахова пространства само есть банахово пространство, по теореме Банаха существует обратное к Л* отображение Г: 1тЛ* —> У*. Теперь Следовательно, D есть образ компакта а\ при непрерывном отображе- отображении (А, Ао) •—> (—Г^(А, Ао)> Аь Ао) и» значит, является компактом.
3.4. Необходимые и достаточные условия экстремума 261 Непустота D следует из принципа Лагранжа, доказанного в § 3.2. Выпуклость D является очевидным следствием условий A). Впрочем, ее можно вывести из выпуклости а и 1тЛ*, заметив, что рассмотрен- рассмотренные выше отображения были линейными. Этим закончено доказатель- доказательство утверждения а). Б) Как и в п. 3.3.1, заменим задачу с неравенствами задачей с ра- равенствами f(x) = тахЩх) - fo(x),fi(x),..., fm(x)} -+ inf; F(x) = 0. C') Если х ? loaning, то х ? loaning. Действительно, x ? locmin/ => У г > 0, Зх? : \\x? — x\\ < e, F(xe) = 0, f(xe) < 0 => fo(xe) < /o(x), fi(xe) < 0, i = 1,..., m, F(x?) = 0 => x (? locmin3. Далее исследуем задачу (У). В) Пусть ho ? L. Ввиду компактности D найдутся такие (у*,\, Ао), что = max <?xx(x,y*,\,\o)[ho,ho] = (y*,x,xo)eD m ^2\ifi(x)[ho,ho} + (y*,F"(x)[ho,ho}) \ Xi > 0, г=0 г=0 г=0 Утверждение б) эквивалентно неравенству Ф(/го) ^ 0. Предположим, что Ф(/го) < 0- Обозначив А2 (Л) /Г у^//(ж)[Ло,Ло], D) рассмотрим задачу max (аДА) + (ж*, ж)) ^ inf; Ах + у(А) = 0. E) Проверим, что к этой задаче применима лемма о минимаксе из п. 3.3.4. Действительно, max (х*,х) > 0, Ух ? КегЛ — необходимое условие минимальности х в задаче (з) (лемма 1 п. 3.2.4). Кроме того, по условию оператор Л сюръективен.
262 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями По лемме о минимаксе найдется элемент xq(\), обладающий свой- свойствами: max (оДА) + (х*, хо(Х))) = S(o(A), у(Х)), F) где S(a(X),y(X)) — значение задачи E); ||жо(А)|| ^ Cijmax |аДА)| + ||у(А)||} ^ СА2. G) При этом согласно (8) п. 3.3.4 S(a(\),y(\)) = А2 Г т = у maxi^2xifi@)iho>ho\ + (^^''(^[fto^o]) Л "- (8) г=0 г=0 Но тогда из G) вытекает, что ЦАЛо + ^o(A)|| = О(А). По формуле Тейлора (п. 2.2.5) F(x + жо(А) + АЛ0) = F(x) + F'(x)xo(X) + + Х- F"(x)[A/io + жо(А), АЛ0 + хо(Х)] + о(А2) = + о(А2)=о(А2 (напомним, что h0 eLcKeiFf(x) F'(x)xo{X) + (А2^)^^)^, ho] = 0.) При доказательстве теоремы Люстерника в п. 2.3.5 было построено отображение (р: U —> X окрестности U Эх такое, что Р(х + ф)) = 0 и Ых)\\ ^ K\\F(x)\\. Полагая г(А) = <^(ж + жо(А) + А/io), имеем F(x + жо(А) + А/г0 + г(А)) = 0, K\\F(x + хо(Х) + АЛ0)|| = ^(А2). Но тогда, применяя формулу Тейлора к /^ и используя F) и (8), получим f(x + жо(А) + Xh0 + г(А)) = тах(/0(ж + жо(А) + А/г0 + г(А)) - /0(ж),
3.4. Необходимые и достаточные условия экстремума 263 fi(x + xo(X) + Afto + r(A)), г = 1,...,ш) = = max < max ((xt.xoW) + ^Л'О^оДоА + о(А2) = = уФ(М+о(А2)<0 при малых А2. Итак, Ф(Ло) < 0 => ж ^ looming =Ф ж ^ looming. Проти- Противоречие доказывает теорему. ¦ 3.4.3. Достаточные условия экстремума для гладких задач с равенствами и неравенствами. Как и в предыдущем пункте, исследуем задачу fJT\ _>. inf- Fir) — 0 f(r) < 0 (г) J0\x) ^ И11» Г \х) — w> Ji\x) ^ w- \Ь) Теорема. Пусть X, Y — банаховы пространства, U — от- открытое множество в X, х е U, функции fi: U —> R, i = 0, 1,..., т, и отображение F: U —> Y — строго дифференцируемы в точке х (допустимой в ($)) и имеют в этой точке вторую производную Фреше, причем fi(x) = 0, г = 1,..., т. Предположим, что существуют множители Лагранжа A G Rm*, у* eY* и число а > 0 такие, что Хг > О любого h, лежащего в подпространстве L = {h\ (fl(x),h) =0, г^1, Ff(x)h = 0}. C) Тогда х доставляет локальный минимум в задаче (з). Доказательство. А) Пусть х + ft — допустимый элемент, т. е. Проведем двумя способами оценку величины fo(x + h). Имеем т /О(Ж + ft) = /о(? + ft) + ^ Аг/Дж + ft) + г=1 ш -\- (у* Fix -\- ft)) — \ Х- fix -\- К) = г=1 ^ m ^ г=1
264 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями Первый способ оценки основан на прямом разложении: т fo(x + h) = ?(x + h, y*,\, 1) - 22Xifi(x + h) = г=1 = Щх,у*,Х, \) + (?х{х,у*,% \)Щ- г=1 г=1 m — /о(#) — / (^ifi(x),h)+r\(h), F) г=1 где остаточный член r\(h) есть O(||/i||J. Второй способ основан на том, что вследствие неравенств Л^ > О, т ^ fi(x + К) < 0 сумма Yl Kfi(x + h) < 0 и, следовательно, г=1 , G) 1 ^^ где через B(h,h) обозначена квадратичная форма -3?хх(х,у*,\,\) [h,h], а остаточный член r^ih) = o(||/i||2). Б) Обозначим через К конус, состоящий из тех h, для которых (fl(x),h) <0, г > 1, ^х(ж)/1 = 0. В силу леммы Хоффмана произвольное h можно разложить в сумму h\ + /12, где h\ ? К, a h^ допускает оценку: |f | (8) Воспользовавшись далее замечанием, сделанным в п. 3.3.4 после леммы Хоффмана, и формулой Eх) п. 3.3.4 /ii можно также разложить в сумму h\ = h[ + h'{, где h[ G L, a /ix/ допускает оценку Мы использовали то, что F'(x)h\ = 0 (ибо h\ G If) и то, что K/i(?Ui}| = Ш$),К +h'{)\ = \(fl(x),h'{)\ = = -</ЯЗД> (ибо (//(^.Л',) = 0, а (//(ж), Л,) < 0).
3.4. Необходимые и достаточные условия экстремума 265 В) Из D) получаем O = F(x + h)-F(x) = F'(x)h + ro(h), 0>Mx + h) = (f((x),h)+pi(h), i=\,...,m, где ||го(/г)|| и \pi{h)\ — величины порядка O(||/i||2). Используя эти оценки в (8), находим, что если х + h — допустимый элемент, то Jf \. (И) Фиксировав е\ е @, 1], о величине которого мы позаботимся далее, выберем 5 е (О, ||5|| ) так, чтобы из неравенства \\h\\ < 5 следовали бы неравенства Е iir(ft)n <? 11Ли 1ИЛ)н < f г=1 j=0 Далее выберем число А > 0 так, чтобы ^% - d max(\i\\fl(x)\\) -1^0, A3) и, наконец, выберем величину е\ так, чтобы для г = (С\ + A)^i выпол- выполнялись бы неравенства г < 1,аA - гJ - 2||Б||еA + г) - ЦБЦе2 - а/2 ^ 0. A4) Г) Завершение доказательства. Пусть х-\-h — допусти- допустимый элемент. Представим h, как и в Б), в виде суммы: h = h[ + /г'/ + /i2- Возможны два случая: а) Ц/г'/Ц > A?i||/i|| и б) Ц/г'/Ц < A?i||/i||. В случае а) имеем из (9) при \\h\\ < 5 M\\h\\ < \\h'{\\ < С2 (-Е(Л(х),/1;'> J . A5) Тогда вследствие F), A5), A1), A2) и A3) получаем F) х^л - A5),(П),A2) fo(x + h) У /о(ж) - 5](^Л(ж), М7 + Л2> + n(h) > г=1 AO ||Л|| (А||Л()||)С1 ||/г|| - е, ||/i|| = A3) )||) 1) ^ /() l) - С, (<||/;()||) Пусть теперь имеет место случай б). Тогда \\h'{\\ |||| значит, в силу A1) и A2), если обозначить h'2 = Ы[ + /i2> то
266 Гл. 3. Принцип Лагранжа для гладких задач с ограничениями \\h'2\\ = \\h'( + h2\\^{A + C{)sx\\h\\=e\\h\\. Тогда h = h\ + h'2, где A - e)\\h\\ < \\h\\\ < A +e)||/i||. Теперь применим эти неравенства, а также G), B), A2) и получаем G) /о(ж + h) > /0(ж) + B(h, h) + r2{h) = = /0(ж) + B(h[ + ti2, h\ + ti2) + r2(h) = = fo(x) + B{h\ ,h\) + 2B(h\,ti2) + B(ti2, h'2) + r2(h) b> 2 fo(x) + (a(l - ef - 2\\B\\e{\ + e) - \\B\\e2 - |) \\h\\2 > > Mx). Теорема доказана.
Глава 4 ПРИНЦИП ЛАГРАНЖА В ЗАДАЧАХ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Предмет этой главы ясен из ее заглавия. Особое внимание мы уде- уделяем, с одной стороны, выявлению сходства двух разновидностей тео- теории, подчеркивая это едиными обозначениями, а с другой — выяс- выяснению различий в классической и современной постановках задач. Сначала мы рассмотрим необходимые условия в так называемой задаче Лагранжа. К этой задаче могут быть сведены многие остальные задачи классического вариационного исчисления. Затем будет выведен прин- принцип максимума Понтрягина, являющийся одним из наиболее важных средств в современных задачах оптимального управления. Остальная часть главы посвящена более специальным классам задач и выво- выводу следствий из общей теории. Менее подробно мы останавливаем- останавливаемся на рассмотрении достаточных условий экстремума, ограничиваясь только частными ситуациями. § 4.1. Принцип Лагранжа для задачи Лагранжа 4.1.1. Постановка задачи и формулировка теоремы. Зафикси- Зафиксируем замкнутый отрезок А = [а, /3] С R и рассмотрим банахово прос- пространство Н = С1 (A, Rn) х С(А, Rr) х R х R, состоящее из элементов ? = (x(-),u(-),to,t\). В этом пространстве рассмотрим задачу: , (I) to x = ip(t,x(t),u(t)), B) . C)
268 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления При этом в A)-C) U V -^R, ф{: W -> R, г = 0, l,...,m; ip: V -> —> Rn, где V и W — открытые множества в пространствах R x Rn x х Rr и R х Rn х R х Rn соответственно. Все перечисленные функции предполагаются по крайней мере непрерывными. Знак ^ имеет тот же смысл, что и в § 3.2. Задачу A)-C) мы называем задачей Лагранжа в понт- рягинской форме. Частные случаи этой задачи обсуждались в §§1.4, 1.5 и в §3.1. Функционалы того же типа, что и 3$i, содержащие как интегральную, так и терминальную части, были ранее названы функционалами Больца (см. пп. 1.4.2 и 3.1.3). Если в ограничении SBi ^ 0 терминальная часть является кон- и стантой, т.е. оно принимает вид \ fi(t,x,u)dt ^ а^, то вслед to за Эйлером мы называем такое ограничение изопериметрическим. Если, наоборот, отсутствует интегральный член, то ограничение i/ji(to,x(to),ti,x(t\)) ^ 0 называется граничным, или краевым условием. Ограничение B) называется дифференциальной связью. Такой вид дифференциальной связи — разрешенный относительно х — является характерным признаком понтрягинской формы задачи. Лагранж задает дифференциальную связь уравнением i/j(t,x,x) = 0 (вкратце об этом говорилось в п. 1.5.1). Наконец, в отличие от гл. I, отрезок времени [to, ^i] в задаче A)-C) не предполагается фиксированным. Четверку ? = (#(•), и(-), to, t\) ? S будем называть управляемым процессом в задаче A)-C), если to, t\ ? intA, (t,x(t),u(t)) ? V для t ? А и всюду на [to,ti] удовлетворяется дифференциальная связь, т.е. x(t) = (p(t,x(t),u(t)), и допустимым управляемым процессом, если эта четверка является управляемым процессом и, кроме того, выполнены условия C). Четверка ? = (х(-),и(-),to,t\) называется оптимальным в слабом смысле процессом, или слабым экстремумом в задаче A)-C), если она является локальным экстремумом в пространстве S, т. е. если найдется такое г > 0, что для любого допустимого управляемого про- процесса ?, удовлетворяющего условию ||? — ?||н < ?> выполняется одно из неравенств: ^?о(?) ^ ^о@ в случае минимума и &о{0 ^ &о@ в случае максимума. Функцией Лагранжа этой задачи называется функция D) где Ло 6 R,p{-) 6 Cl{A,Rn*),X = (Ab...,Am) € R"
4.1. Принцип Лагранжа для задачи Лагранжа 269 — множители Лагранжа, т L(t, х, x,u) = Y^ Kfi(t, х, и) + p(t)(x - ip(t, x, и)) E) г=0 — лагранжиан, или интегрант, и г=0 — терминант. Далее мы в этом и следующем параграфах пользуемся, как и ранее, следующими сокращениями: LA(t) = LA(t,x(t),x(t),u(t)), Lx(t)=Lx(ttx(t)tx(t)tu(t))t Lu(t) = Lu(t,x(t),x(t),u(t)), &tk =?гЛЮЛ')>*оЛ1',р(-)ХХо) и т. п. Теорема Эйлера-Лагранжа. Пусть функции fi'. V —> R, г = 0, 1,..., т, (р: V —> Rn и их частные производные по х и и непрерывны в открытом множестве V пространства R x Rn x Rr, а функции Фг: W -^ R, г = 0, 1,... ,т, непрерывно дифференцируе- дифференцируемы в открытом множестве W пространства R x Rn x R x Rn, и пусть х(-) е Cl(A,Rn), u(-) e C(A,Rr), to, U e int А таковы, что (t,x(t),u(t)) eV, t e A, (to,x(to),U,x(ti)) e W. Если ? = (x(-),u(-),to,t\) является оптимальным в слабом смысле процессом для задачи A)-C), то найдутся множители Лагранжа Ао ^ 0 в случае задачи на минимум и ^ 0 в задаче на максимум, р(-) ? (^(Д,Rn*), A = (Ai,...,Am), не равные одновременно нулю и такие, что: а) выполнены условия стационарности функции Лагранжа: по х(-) (?х(.) = 0): ~LA(t)+Lx(t)=O, G) at ЫЪ) = (-l)ktk, A; = 0,1; (8) по и{-) (#„(.) = 0): Lu(t) = 0; (9) по tk ?tk=0, k = 0,1; (Ю)
270 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления б) выполнено условие согласования знаков: Аг^О, г=1,...,га; A1) в) выполнены условия дополняющей нежесткости: \гЗЗг(?)=0, г=1,...,га. A2) Как и в §§3.1, 3.2, неравенства A1) означают, что А^ ^ 0, если в условии C) 3ti(?) < 0, Xi < 0, если в C) 3ti(?) > 0 и А^ может иметь любой знак, если ^?г(?) — О- Утверждение о существовании множителей Лагранжа, удовлетворя- удовлетворяющих совокупности условий а)-в), кратко называется нами принципом Лагранжа для задачи Лагранжа A)-C). Покажем, что утверждение теоремы находится в полном соответ- соответствии с общим принципом Лагранжа, о котором говорилось в гл. 1 и в п. 3.1.5. Действительно, функция Лагранжа 9В является функцией трех аргументов: #(•), и(-) и (to,t\). Таким образом, согласно общему принципу Лагранжа, надлежит рассмотреть три задачи: (а) Щх(-),и(-),?оЛ1',р(-)ХЬо) ->extr, (/3) ?(x(.),u(.),to,U;p(.)X\o) G) g{x{-),u(-),to,tup{')X\o) Задача (а) является элементарной задачей Больца, и условия ста- стационарности G) и (8) написаны в полном соответствии с п. 1.4.2 и теоремой п. 3.1.3. Задача (/3) также является задачей Больца, но вы- вырожденной, поскольку и не входит в лагранжиан, a u(to) и u(t\) — в терминант. Уравнение Эйлера-Лагранжа поэтому превращается в (9), а условия трансверсальности становятся бессодержательными: 0 = 0. Наконец, G) является элементарной задачей и A0) есть просто теорема Ферма (см. пп. 1.3.1 и 3.1.1). Условия дополняющей нежесткости и условия согласования знаков также, как мы знаем, написаны в соответствии с общим принципом Лагранжа, примененным к ограничениям типа неравенств (п. 3.1.5) Таким образом, основную теорему этого параграфа можно сфор- сформулировать так: если функции, входящие в постановку задачи, об- обладают достаточной гладкостью, то для локального экстремума выполнен принцип Лагранжа. Условия стационарности можно переписать в более развернутом виде. В соответствии с E) получаем: из G) г=0 (иногда Gа) называют сопряженным уравнением)] из (9) v ' m 1]А<Ли(*); (9а) г=0
4.1. Принцип Лагранжа для задачи Лагранжа 271 из (8) p(tk) = (-\)klXk, к = 0,1; и, наконец, из A0) 0 = (-l)*!^) + Ttk +TXh ' i=0 ltk + (-l)kp(tk)ic(tk) = = (-1) fc-1 т т.- г=0 + 1 tk или г=0 Функцию H(t, x, p, u) = LxX — L = A0a) , u) A3) г=0 мы будем называть функцией Понтрягина рассматриваемой задачи. С ее помощью уравнения Gа)-A0а) и уравнение B) можно записать еще и так: A4) dx dt dp dt p(tk) = (-\)kTXk, H(tk) = (-\)k-lTtk, A; = 0,1. A5) Замечание. Иногда функцию A3) называют функцией Гамиль- Гамильтона. Мы вкладываем в термин «функция Гамильтона» или «гамильто- «гамильтониан» другой смысл, более естественный с точки зрения классической механики, и называем так функцию = H(t,x,p,u(t,x,p)), A6) где u(t,x,p) — неявная функция, определяемая из уравнения Hu(t,x,p,u) = 0. При выполнении стандартных условий применимости теоремы о неявной функции уравнения A4) принимают обычный вид канонической гамильтоновой системы dt ~ р' dt ~ х- [ ' Полезно заметить, что набор условий, который доставляет сфор- сформулированная теорема, в некотором смысле является полным. Дей- Действительно, для определения неизвестных функций (#(•), р(-), и(-))
272 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления мы имеем систему из дифференциальных уравнений B) и Gа) и конечного уравнения (9а). Выражая из последнего (разумеется, когда это можно сделать, например, если выполнены условия теоремы о неяв- неявной функции) и(-) через х(-) и р(-), мы получаем систему из 2п ска- скалярных дифференциальных уравнений (эквивалентную системе A7)). Ее общее решение зависит от 2п произвольных постоянных и еще от множителей Лагранжа А^, среди которых т независимых. Добавляя сюда еще to и t\, мы получаем всего 2п + т + 2 неизвестных. Для их определения мы имеем 2п + 2 условия трансверсальности A5) и т условий дополняющей нежесткости A2). Таким образом, число неизвестных совпадает с числом уравнений. Именно это и имелось в виду, когда выше было сказано о «полноте» набора условий. Разумеется, разрешимости полученной системы урав- уравнений указанное обстоятельство никак не гарантирует. 4.1.2. Редукция задачи Лагранжа к гладкой задаче. Обозначим через Y пространство C(A,Rn) и запишем задачу A)-C) п. 4.1.1 в виде ^0(C)^extr; Ф@ = 0, Щ?) $ 0, г=1,...,ш, A) где Ф@(*) = *(*)-?(*, *(*М*)). B) Отображение Ф и функционалы 35 i определены в области 7= {x(-),u(-),to,ti) I (t,x(t),u(t)) e V,t e A; t0,U eintA,(to,x(to),ti,x(ti)) eW} пространства S. Задала A) имеет тот же вид, что задача п. 3.2.1 предыдущей главы, для которой принцип Лагранжа был уже доказан. Предположения соответствующей теоремы распадались на три группы: банаховостъ основных пространств, гладкость отображений и замкнутость обра- образа бесконечномерного отображения. Проверим, что в задаче A) все эти требования выполняются. Банаховость пространств Е и Y очевидна — пространства С1 и С являются основными для нас примерами банаховых про- пространств (см. пп. 2.1.1 и 2.1.2). Гладкость (а именно непрерывная дифференцируемость по Фре- ше) функционалов 35i, г = 0, 1,..., т, следует из результатов § 2.4. Действительно, с интегральной частью мы можем поступать точ- точно так же, как и в предложении 2 п. 2.4.2, заменив всюду х(х х) на и(-), а дифференцируемость терминальной части доказана в п. 2.4.3 (это оператор краевых условий). При этом, согласно фор-
4.1. Принцип Лагранжа для задачи Лагранжа 273 мулам (9) п. 2.4.2 и C) п. 2.4.3, имеем для ? = (x(-),u(-),to,, t\), r\ = = (Л(-). «(•). 7D. ri) r\ - fi(tO)ro + TXlh(t{) +TXox(bo)ro+TXlx(b\)T\ C) (ср. лемму п. 3.1.3). Отображение B) также непрерывно дифференцируемо по Фре- ше (см. предложение 3 п. 2.4.1). Его производная, согласно A4) п. 2.4.1, имеет вид ^ Ф'(ОМ(*) = Ш - &(*Ж*) - ^(*)w(t). D) Из непрерывной дифференцируемости по Фреше функционалов 3$i и отображения Ф следует их строгая дифференцируемость, требуемая в теореме о принципе Лагранжа. Замкнутость о 6jp а з а отображения Ф имеет место в силу его регулярности: образ Фх(^J совпадает с Y. Действительно, взяв произ- произвольное у(-) е Y = С(Д, Rn), положим v(-) = 0, го = т\ = 0. Уравнение эквивалентно линейному дифференциальному уравнению h(t) — — <px(t)h(t) = y(t) с непрерывными коэффициентами, которое имеет решение h(-) G C^A, Rn) в силу теоремы существования для линейных систем (п. 2.5.4). Таким образом, выполнены все условия теоремы п. 3.2.1. Для определенности будем считать, что A) — задача на минимум. Согласно принципу Лагранжа, если ? = (x(-),u(-),to,t\) — локальная минималь A), то найдутся множители Лагранжа Ао, А е Rm* и эле- элемент у* G У* = (C(A,Rn))* такие, что для функции Лагранжа ), t0,U;y\ А, Ао) = * оФ E) выполнены условия согласования знаков, дополняющей нежесткости и стационарности $Z = 0&?x{.)=0, ?„(.)= 0, ?tk=0, fe = 0,l. Три соотношения, из которых складывается правая часть, мы называем далее стационарностью по #(•), и(-) и по t/c соответственно.
274 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Однако мы замечаем, что функция E) не тождественна функции Лагранжа D) п. 4.1.1. Воспользовавшись теоремой Рисса об общем виде непрерывного линейного функционала на пространстве C(A,Rn) (п. 2.1.9), мы можем утверждать лишь, что где v(t) = (y\(t),... ,vn(t)) — вектор-строчка из канонических функций ограниченной вариации. Подставляя это в E) и учитывая обозначе- обозначение F) из п. 4.1.1, получаем dv(t){x(t) - <p(t,x(t),u(t))}+ A + l(to,x(to),ti,x(ti)). F) Сравнивая эту формулу с (А)-F) из п. 4.1.1, мы видим, что функ- функция Лагранжа 9? получается из Я, если функция z/(») абсолютно непрерывна, а ее производная равна нулю вне [to,ti] и совпадает с р(-) в этом отрезке. Ситуация напоминает здесь п. 1.4.1. Подобно тому как лемма Дюбуа-Реймона позволила нам там вывести урав- уравнение Эйлера без дополнительного предположения о дифференциру- дифференцируемое™ функции t —> p(t) = Lx(t), подходящее обобщение этой лем- леммы позволит нам сейчас доказать абсолютную непрерывность функ- функции z/(-). 4.1.3. Обобщенная лемма Дюбуа-Реймона. Пусть на отрезке [а, /3} векторная функция а(-): [а,/3] —> Rn* интегрируема по Лебе- Лебегу, матричная функция Ь(-): [а, C] -^i/?(Rn,Rn) непрерывна, z/(-) : [а, C] —> Rn* — каноническая векторная функция ограниченной ва- вариации; tk — различные точки интервала (а, C), Ck G Rn*, к = = 0,1,...,р. Если для всех h(-) G Cl([a,C],Hn) имеет место равенство Р Р р \a(t)h(t)dt+ \dv(t){h(t)-b(t)h(t)} + ^2ckh(tk) =0, A) то функция z/(-) абсолютно непрерывна; ее производная р(-) непре- непрерывна на [а, C], кроме, быть может, точек tk, в которых она имеет пределы слева и справа, абсолютно непрерывна в любом интервале, не содержащем точек tk, и при этом p(t) = a(t) — p(t)b(t) почти всюду, B)
4.1. Принцип Лагранжа для задачи Лагранжа 275 р(а) = р(/3) = О, C) p(tk + O)-p(tk-O)=ck. D) t Доказательство. Положив h(t) = 7 + \ v(s) ds, мы получаем из A) /з /з _ /з t Г v-^ 1 Г Г ait) dt — du(t)bit) + > Cfc >7 + a(t) 77E) dsdt+ J t^ ] J J CK CK CK CK /3 /3 t p tk + du(t)rj(t) — dv(t)b(t) rj(s) ds + \^ c^ 77E) ds = 0. J J J jU_ Г) J ск а а ^~и а Так как 7 G Rn и ?7(-) е C([a,C], Rn) можно выбирать произвольно и независимо друг от друга, то, во-первых, a(t) dt - dv(t)b(t) + Y^ ck = ° E) ск ck ^=0 (ибо можно положить ?7(-) = 0, 7 — любое), а во-вторых, для любого ?7(-) G C([a,/3],Rn) имеет место равенство tfc [ a(t) [ ф) ds dt + [ du(t)rj(t)- СК CK CK /3 t ^ — dv(t)b(t) rj(s) ds + V^ Cfc 77E) ds = 0. F) CK CK ^ = 0 CK Меняя в первом и третьем члене порядок интегрирования в со- соответствии с формулой Дирихле (E) п. 2.1.9), обозначая буквой s переменную интегрирования во втором члене, полагая С 1 <^ <^ -/- / \ I I, OL ^ S ^ Г, (г7\ X[a,t]{S) = < 0, t < S ^ /3 G) и используя равенство /з Vdt, (8) справедливое для абсолютно непрерывных функций [КФ, с. 359], пре- преобразуем F) к виду
276 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления /3 /3 Ш \ И И /И \ \ г г I г \ a(t) dt I ф) ds + du(s)rj(s) — I dv(t)b(t) 177E) ^5+ /3 p /3/3 + [ J2 ckX[a,tk] (s)r/(s) ^ = [ dA(s)r/(s) + [ dv(s^(s) = 0, (9) где r (r r ^ a(t) dt — dv{t)b{t) + N^ c^X[a)ifc] (c Функция Л(-) абсолютно непрерывна на [а,/3] и Л(а) = 0, следователь- следовательно, это каноническая функция, а так как z/(») — также каноническая функция ограниченной вариации, то из (9) и свойства единственности в теореме Рисса (п. 2.1.9) A(s) + v(s) = 0. Следовательно, z/(-) абсолют- абсолютно непрерывна, а ее производная p(s) = v\s) при s ф tk равна (снова используем (8)) = - L(t)dt+ i Из этой формулы видно, в свою очередь, что р(-) непрерывна всюду, кроме точек tk, где справедливо D), и что имеет место B). Равенство р(/3) = 0 очевидно, а р(а) = 0 эквивалентно E), так что доказано и C).и 4.1.4. Вывод условий стационарности. Итак, мы показали, что если ? доставляет локальный минимум в задаче A)-C) п. 4.1.1, то най- найдутся такие множители Лагранжа Ао ^ 0, Л G Rm* и у* G C(A,Rn)*, что выполнены условия согласования знаков и дополняющей нежест- нежесткости для Л и условия стационарности а) ?*(.)= 0, б)^@=0, B)^tfc=0, A; = 0,1, A) где Я> определяется равенством F) п. 4.1.2, а 3?х(.), $и(-) и &tk получа- получаются ИЗ i/?x(.), i?w(.), i^tfc ПОДСТаНОВКОЙ #(•) = ж(-), u(-) = u(-), tk = tfc, /с = 0,1. Переходим к расшифровке условий A). При дифференцировании функции 9В мы будем иметь в виду, что первый и третий члены фор- формулы F) п. 4.1.2 образуют функционал Больца, производная которого дается формулой C) того же пункта, а второй член является суперпо- суперпозицией оператора дифференциальной связи и линейного отображения rj(') —> dv(t)rj(t), и его производная получается поэтому интегрирова- А нием формулы D) п. 4.1.2 по dv(t).
4.1. Принцип Лагранжа для задачи Лагранжа 277 А) Стационарность по х(-). Дифференцируя 9Е по #(•), полу- получаем в соответствии с Aа), что при всех h(-) G С1(А,Ип) имеет место равенство \ to + J du(t){h(t) - $x(t)h(t)}+TXoh$o) +TXlh(tl). B) A Рассмотрим сначала случай t\ > to. Согласно обобщенной лемме Дюбуа-Реймона из B) следует, что функция */(•) абсолютно непрерыв- непрерывна на А, а ее производная р(-) = */'(•) непрерывна на А всюду, кроме, быть может, точек to и t\, где она имеет пределы слева и справа, и выполняются соотношения B)-D) п. 4.1.3, которые применительно к нашей ситуации означают, что = -P(t)(px(t) + хй?] г=0 при t ^ to, t\, p(a) = р(C) = 0, где а и C — концы А, и что p(to + O)-p(to-O)=TXo, p(tx+O)-p(tl-O)=TXl D) (здесь X\tou] ~ характеристическая функция, равная 1 на [to,t\] и О вне этого отрезка). Из уравнения C) видно, что р(-) удовлетворяет однородному линейному дифференциальному уравнению на полуинтер- полуинтервалах [a,to) и (t\,C]. Поскольку она обращается в нуль в концах а и C этих полуинтервалов, по теореме единственности п. 2.5.3 p(t) = О на А \ [?о, ?i] и p(to - 0) = p(U + 0) = 0. Обозначим теперь через р(-) решение уравнения Gа) п. 4.1.1, сов- совпадающее на интервале (to, ti) с р(-) (в этом интервале уравнения Gа) п. 4.1.1 и C) тождественны). Поскольку Gа) линейно, решение р(-) определено на всем А и принадлежит С^А, Rn*) (п. 2.5.4). Для этого решения p(to) = p(to + 0) и p(t\) = p(t\ — 0), а так как p(to — 0) = 0 и P\t\ +0) =0, то D) превращается в условие (8а) п. 4.1.1. Таким образом, для р(-) условия стационарности G) и (8) (или Gа) и (8а)) из п. 4.1.1 справедливы. При t\ < to мы вместо C) получим уравнение г=0 решение р(-) которого равно нулю на [a,t\) и (?о,/3]. В этом случае надо обозначить через р(-) то решение уравнения Gа) п. 4.1.1, которое
278 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления совпадаете (—1)р(-) на (t\,to), после чего условия G), (8) п. 4.1.1 будут выполнены. ^ ^ Наконец, при t\ = to мы снова можем воспользоваться обобщенной леммой Дюбуа-Реймона, но теперь уже v'(t) = p(t) = 0 всюду на А, кроме, быть может, точки to =t\, где должно еще выполняться условие p(t\ + 0) - p(t\ - 0) = lXo + lXl = 0. Отсюда lXo + lXl = 0. Беря в каче- качестве р(-) то решение уравнения Gа) п. 4.1.1, для которого р(?0) = 1Хо, мы снова убеждаемся в том, что условия G), (8) п. 4.1 Л выполнены. Б) Стационарность по и(-). Дифференцируя 9} по и(-) и учи- учитывая, что и(-) абсолютно непрерывна, а ее производная р(-) = z/(-) отлична от нуля лишь в интервале (to, ti), а в этом интервале совпадает с р(-), имеем 0 = <?u[v{-)\ = j I Y,bfiu(t) - p(t)Vu(t) \ v(t) dt. Так как это равенство имеет место при всех v(-) G C(A,Rn), то, снова сославшись на единственность в теореме Рисса (п. 2.1.9), мы получаем г=0 что совпадает с уравнением (9а), а следовательно, и с условием (9) п.4.1.1. В) Стационарность по ?&. Поскольку - [ p{t){x(t) - ф, x(t),u(t))} dt = 0, to то производные этих двух функций по tk в точке ? = (ж(-), и(-), to, t\) совпадают, а так как имеет место равенство 9Etk = 0, то выполняется и условие A0) п. 4.1.1. 4.1.5. Задача со старшими производными. Уравнение Эйлера- Пуассона. Снова зафиксируем замкнутый отрезок А с R и будем рассматривать пространство ?s = Cs(A,Rn) xRxR, элементами которого являются тройки ? = (x(-),to,t\), где функция #(•): А —> Rn непрерывно дифференцируема до порядка s включитель-
4.1. Принцип Лагранжа для задачи Лагранжа 279 но; to, t\ G intA. Говоря о задаче со старшими производными (в классическом вариационном исчислении), будем иметь в виду экстре- экстремальную задачу 0b(O^extr; 0tfO$O, i=l,...,m, A) где ,х(и),...,х(*-1Ни)) B) в пространстве Ss. При этом в A), B) ff. V —> R, фс W —> R, г = = 0, 1,...,т; V и W — открытые множества в пространствах Rx х (Rn)s+1 и R x (Rn)s x R x (Rn)s соответственно; fa и ф^ по крайней мере непрерывны. Тройка ? = (x(-),to,t\) G Ss является допустимой в задаче A), B), если (t,x(t),... ,x^s\t)) e V, t e А и Допустимую тройку ^ = (x(-),to,ti) мы называем (локальным) ре- решением задачи A), B), если она доставляет функционалу SPq локаль- локальный экстремум в пространстве Ss, т. е. если существует такое г > О, что для всех допустимых ? = (x(-),to,ti)> Для которых ||f-?l|se <e&\tk-Tk\ <e, к = 0,1; ||ж-ж(.)||с*(д,н») < е, выполняется одно из неравенств: ^Ь@ ^ ^о(^) в случае минимума и ^о(С) ^ ^о(?) в случае максимума. Покажем, что задача со старшими производными A), B) сводится к задаче Лагранжа. С этой целью обозначим x=(Xl,...,xs)e(RnY, Тогда задача A), B) приобретает следующий стандартный вид задачи п.4.1.1: и J , x(to),ti, x(ti))^exti, (Iх) o, x(to),tu x(ti)) $ 0, i = l,...,m, B0 j=l,...,5—1, i;s = и C)
280 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления с функцией Лагранжа g(x(-),u(-),to,t\; р(-)ДДо) = \Ldt + l, D) to где т L(t, х, х,и) = Y^ xifi(t> х> и) + г=0 s-1 ~ +Ps(t)(x8-u) E) Аг^г^О^о^о,...,^^!,^!,*!,...,^"^). F) г=0 Перефразируя на этот случай теорему п. 4.1.2, получаем необходи- необходимое условие экстремума. Теорема. Пусть функции /^: V —> R, г = 0, 1,... ,m, ^ ^х част- частные производные по х, ..., х^ непрерывны в открытом множестве [/cRx (Rn)s+1, а функции ф^: W -^ R, г = 0, 1,..., т, непрерывно дифференцируемы в открытом множестве W С R x (Rn)s x R х х (Rn)s, и пусть х{-) G Cs(A,Rn), to, U e int А таковы, что (?,?(?),...,?(s)(?)) еУ, t g A; Если ? = (x(-),to^i) является локальным решением задачи A), B), то найдутся множители Лагранжа: Ао > 0 в задаче на минимум и^О^в задаче на максимум, р(-) = (рх (•),... ,ps(-)) G С1 (A, (Rn)s*), А = (Аь ..., Ап), яв равные нулю одновременно и такие, что: а) выполнены условия стационарности функции Лагранжа: по х(-) фх(.) = 0, #и@ = 0) G) Й-(^) = (-1)^о-.), fe = 0,l; (8) no tk (%k =0) H(tk) = (-l)k+lltk, A; = 0,1; (9)
4.1. Принцип Лагранжа для задачи Лагранжа 281 б) выполнено условие согласования знаков Хг ^0, г= 1,...,ш; A0) в) выполнены условия дополняющей нежесткости А^(?)=0, г=1,...,га. A1) Здесь /(t,ar,i;>...,a:W)=5]Ai/i(t>a;,...>a;W)> A2) г=0 и, как обычно, и т. п., а неравенства A0) означают, что Л^ ^ 0, если в задаче A) ^г(?) < 0, Л^ < 0, если в A) ^(^Ои А^ может иметь любой знак, если в A) 0Ц?) =0. Подробные выкладки, приводящие условия G)—A2) п. 4.1.1 к ана- аналогичным условиям этой теоремы, предоставляются читателям в каче- качестве упражнения. Для частного случая задачи со старшими производными, в котором терминальные члены в (Iх) и Bх) суть константы и концы закрепле- закреплены, утверждение теоремы можно представить в более простой форме. Условия трансверсальности (8) и (9) здесь опускаются, а систему G) можно записать в виде одного уравнения |))О. (и) Наконец, если предположить существование нужных производных, уравнение A3) можно записать в виде уравнения Эйлера-Пуассона /*(*) -jth + ^Ш -.- - (-i)8^/x(.)(*) = о. A5) Общее решение этого уравнения порядка 2s содержит 2s произволь- произвольных постоянных и зависит еще от чисел Ао, ..., Аш, одно из которых можно выбирать произвольно. Всего в нашем распоряжении оказыва- оказывается 2s + т неизвестных. Для их определения мы используем 2s кра- краевых условий (для закрепленных концов) и еще т условий получаем из условий дополняющей нежесткости и неравенств A) и A0) (про- (проверьте, что всего из них можно извлечь ровно т равенств). Аналогично можно проверить, что и в общем случае число уравнений, которые дает теорема, совпадает с числом неизвестных.
282 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления § 4.2. Принцип максимума Понтрягина 4.2.1. Постановка задачи оптимального управления. Экстре- Экстремальная задача, которой посвящен этот параграф, по форме почти совпадает с задачей Лагранжа A)-C) п. 4.1.1. Здесь мы встретимся с тем же функционалом, той же дифференциальной связью и с теми же ограничениями типа неравенств, что и раньше. Отличие новой задачи состоит в том, что в ее формулировке явно выделено ограничение на управление вида u(t) ? Я, где Я — некоторое топологическое про- пространство. На первый взгляд это не прибавляет ничего нового и даже выгля- выглядит менее общим. Действительно, в задаче Лагранжа мы имели дело с условием (t,x(t),u(t)) ? V, которому должны были удовлетворять допустимые процессы. В частном случае, беря V = G х Я, мы расщеп- расщепляем это условие на два: (t,x(t)) ? G и u(t) ? Я. Однако разделение переменных на фазовые и управление, и выде- выделение ограничений на управление оказалось весьма знаменательным. Вместе с ним выделилась и новая ветвь в теории экстремальных задач, быстро завоевавшая популярность среди прикладников своими возможностями применительно к практическим задачам и позволившая по-новому взглянуть и на классическую теорию. Чем же все это было вызвано? В первую очередь необходимостью исследования задач технического содержания. Разделение фазовых пе- переменных и управления и их связь при помощи дифференциального уравнения — обычная модель для процесса, развивающегося по за- законам природы (дифференциальное уравнение!), но испытывающего воздействие человека, управляющего этим процессом в соответствии со своими целями и стремящегося сделать его в каком-то смысле оптимальным. Теперь ясно, что ограничения на управления вида u(t) ? ? Я связаны с ограниченными возможностями воздействовать на про- процесс (скажем, с ограниченностью диапазона поворота рулей управляе- управляемого аппарата). Если принять за Я открытое множество в Rr, то ничего нового мы действительно не получим. Однако в технических и иных при- прикладных задачах множество Я не обязано быть открытым. Зачастую управление может быть даже просто дискретным (включено — выклю- выключено). Естественно возникают ограничения, при которых Я оказывается замкнутым множеством: насколько это существенно, мы видели, решая задачу Ньютона (п. 1.6.2). Уже в простейших задачах оптимально- оптимального управления встречаются ограничения вида \u(t)\ ^ 1 (см. задачу о быстродействии в п. 1.6.3). В этом последнем случае множеством допустимых управлений оказывается замкнутый шар в сложно устро- устроенном пространстве LOO(A), и в типичных случаях оптимальное управ- управление лежит на границе этого шара (из сказанного в п. 1.6.3 видно, что при ограничении \u(t)\ < 1 задача не имела бы решения: минималь-
4.2. Принцип максимума Понтрягина 283 ное время достигается при управлении, где почти всюду \u(t)\ = 1), а эта последняя чрезвычайно негладкая и «многогранная», а точнее, «бесконечногранная». Все это затрудняет применение обычных методов дифференциального исчисления, и условия гладкости по управлению оказываются довольно часто неестественными. В связи с этим мы не будем больше требовать существования производных fiu, (pu и т. п. и даже само множество Я возможных значений управления будем счи- считать произвольным топологическим пространством, не обладающим, вообще говоря, линейной структурой. Отсутствие производных по и — второе отличие новой задачи от старой. Желая оттенить это обсто- обстоятельство, функционалы, входящие в формулировку задачи, мы обо- обозначаем новой буквой, хотя по виду они совпадают с функционалами Больца. Наконец, последнее отличие — это отказ от непрерывности управ- управления. В основном это связано с тем, что в классе непрерывных управлений задача часто не имеет решения (например, в большин- большинстве задач, где Я дискретно или в задаче о быстродействии п. 1.6.3). Следует, впрочем, отметить, что переход к рассмотрению «ломаных экстремалей» (что соответствует кусочно-непрерывным управлениям) делается и в классическом вариационном исчислении (см. п. 1.4.3). Са- Сама же возможность свободного выбора управления внутри множества Я (а ею мы уже воспользовались, «выпуская» игольчатые вариации при выводе условия Вейерштрасса в п. 1.4.4 и при доказательстве принци- принципа максимума в простейшей ситуации (п. 1.5.4)), порождает скрытую выпуклость по управлениям, с чем связана форма основного условия — принципа максимума (см. A0), A1) в п. 4.2.2), напоминающая соответ- соответствующее условие в задачах выпуклого программирования. Здесь эта связь не будет вскрыта в полном объеме. Мы сделаем это в следующем параграфе, правда в частном варианте общей задачи. Итак, рассмотрим экстремальную задачу x(to),tux(t{))^mf, A) to x = cp(t,x(t),u(t)), u(t)eil, B) Ji(x(-),u(-),to, U) = \ fi(t, x(t), u(t)) dt+ to + Фг(Ь0,x(to),ti,x(ti)) $ 0, i = 1,2,..., m. C) Здесь fi\ Gxtt^R, фг\ W -> R, г = 0, l,...,m, ip\ Gxil^ —> Rn, где G и W — открытые множества в пространствах R x Rn и R x Rn x R x Rn соответственно, Я — произвольное топологическое
284 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления пространство. Знак ^ имеет тот же смысл, что в §§3.2 и 4.1. Все функции fa, i/jj, ip предполагается по крайней мере непрерывными. Четверку (x(-),u(-),to,t\) будем называть управляемым процессом в задаче A)-C), если: а) управление и(-): [to,t\] —> Я — кусочно-непрерывная функция. Ее значения в точках разрыва существенной роли не играют; для определенности будем считать, что и(-) непрерывна справа для to ^ t < < t\ и слева в точке t\\ б) фазовая траектория х(-): [to,t\] —> Rn непрерывна и ее график лежит в G r = {(t,x(t)) \to^t^U}cG; в) для всех t ? [to,t\], кроме, быть может, точек разрыва управления и(-), функция х(-) удовлетворяет дифференциальному уравнению (в этом случае мы говорим, что х(-) соответствует управлению и(-); легко видеть, что в точках разрыва управления х(-) имеет производные слева и справа). Управляемый процесс называется допустимым, если удовлетворя- удовлетворяются условия C). Допустимый управляемый процесс (x(-),u(-),to,t\) называется (ло- (локально) оптимальным, если найдется такое г > 0, что для всякого допустимого управляемого процесса (x(-),u(-),to,t\) такого, что \h-tk\<e, k = 0,1 и \x(t)-x(t)\<s для всех t ? [to,ti] П [fo,ti] D) выполняется неравенство Jo(x(-),u(-),to,ti) > Mx(-),u(')>to,ti). E) Заметим, что и здесь произошло изменение по сравнению с задачей Лагранжа: мы не требуем больше близости производных x(t) и x(t). В классическом вариационном исчислении это соответствует переходу от слабого экстремума к сильному (см. п. 1.4.3). Поучительно сравнить задачу Лагранжа и задачу оптимального управления в том случае, когда il = Rr и в п. 4.1.1 V = G x Rr. При этом предположении: Каждый допустимый управляемый процесс (x(-),u(-),to,t\) зада- задачи Лагранжа является таковым и для задачи оптимального управ- управления (точнее, превращается в таковой при ограничении и(-) на Mi]). Это означает, что произошло расширение задачи (ср. п. 1.4.3). Сле- Следовательно, значение задачи оптимального управления не больше зна- значения задачи Лагранжа (infJ^o ^ inf^o)- Впрочем, при достаточно естественных предположениях относительно функций %, фг и (р обе
4.2. Принцип максимума Понтрягина 285 эти величины совпадают (в тривиальном случае, когда х = и, мы дока- доказали это в лемме «о скруглении углов» в п. 1.4.3). Если inf Jo < inf Й?о> то> как легко видеть, решения обеих задач мо- могут существовать или нет независимо друг от друга. Если же значения задач равны, то возможно одно из трех: ^ ^ а) Задача Лагранжа имеет решение: infSB§ = S)o(x('),u('),to,t\). Тогда та же четверка является и решением задачи оптимального управ- управления, поскольку б) Задача Лагранжа не имеет решения, а задача оптимального управления имеет: inf^o достигается на кусочно-гладкой кривой х(-). Такую ситуацию мы наблюдали в примере F) п. 1.4.3 (при х = и переход от класса С1 к классу КС1 как раз и соответствует переходу к задаче оптимального управления). в) Обе задачи не имеют решения: нижняя грань функционала не достигается и при расширении области его определения. Так обстоит дело в примере Больца (п. 1.4.3). В предыдущих рассуждениях молчаливо предполагалось, что речь идет о минимизации по всему классу допустимых управляемых процес- процессов. Однако обычно при рассмотрении экстремальных задач мы при- придерживаемся локальной точки зрения, что, кстати сказать, отражено и в наших^определениях. В п. 4.1.1 допустимый управляемый процесс (x(-),u(-),to,t\) был назван оптимальным (в слабом смысле), если он доставляет минимум функционалу 5В§ в некоторой С1-окрестности по х(-) и С-окрестности по и(-). Теперь же определение оптимальности предполагает, что минимум 3§ имеет место в более широкой окрестно- окрестности, описываемой неравенствами D). Фактически — это С-окрестность по #(•), а ограничения на управления не накладываются вовсе. Как уже было сказано, в классической ситуации это был бы сильный минимум. Поэтому локальное решение задачи Лагранжа может не быть оптимальным процессом для задачи оптимального управления. Если же в оптимальном процессе (#(•), и(-), to, t\) управление и(-) непрерывно, то при наших обычных предположениях относительно функций, вхо- входящих в задачу, этот процесс будет и локальным решением задачи Лагранжа. Ограничения C) не являются самыми общими, которые приходится рассматривать в задачах оптимального управления. Мы, например, совсем оставляем в стороне так называемые фазовые ограничения вида (t,x(t))eD, to^t^tu F) где D — некоторое подмножество в R x Rn. Конечно, если D открыто, то, заменив в определении управляемого процесса G на G П D и умень- уменьшив, если нужно, г в D), мы автоматически учтем ограничения F). Поэтому основной интерес представляет случай, когда D не явля-
286 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления ется открытым множеством и оптимальная фазовая траектория x(t) выходит для некоторых t на границу D (см. рис. 37; минимизируется длина кривой, заштрихованная часть плоскости не принадлежит D). Это приводит к существенно новым эффектам, в частности, к необходимости ввести в урав- уравнение Эйлера-Лагранжа обоб- обобщенную функцию — производ- не абсолютно непрерывной (или заменить это диф- дифференциальное уравнение инте- гральным с интегралом Стилтье- са по этой мере). 4.2.2. Формулировка принципа максимума. Принцип Лагран- Лагранжа в задаче оптимального управления. Рассмотрим снова задачу ?, x(t), u(t)) dt+ to = cp(t,x(t),u(t)), u(t)eil, mf, A) B) ч x(-),u(-),to,t\) = \fi(t,x(t),u(t))dt+ ция to Как и в п. 4.1.1, функцией Лагранжа этой задачи называется функ- D) где AoeR, A = (Ab...,Am)eRra*, L(t, x, x,u) = Y^ *ifi(t, x, u) + p(t)(x - ip(t, x, u)), E) г=0 l(to,Xo,t\,X\) = У Xilpi(to,Xo,t\,X\). F) г=0 Функция р(-): [to,t\] -^ Rn* предполагается непрерывной. Там, где это будет нужно, мы будем считать, что р(-) определена на более ши- широком промежутке, чем [to,ti], продолжая ее за пределы этого отрезка произвольно, но с сохранением непрерывности. Функция р(-) и числа
4.2. Принцип максимума Понтрягина 287 А^, Ло называются множителями Лагранжа задачи A)-C), функ- функция E) — лагранжианом, F) — терминантом. Наконец, функцию т H(t,x,u,p)=Lix-L=p<p(t,x,u)-'22\ifi(t,x,u) G) г=0 мы будем называть функцией Понтрягина. Как и обычно, будут ис- использоваться обозначения Lx(t) = Ы*> x(t), x(t), u(t)), <p(t) = (f{t, x(t), u(t)), и т. д. Теорема (принцип максимума Понтрягина). Пусть G — открытое множество в пространстве R x Rn, W — открытое множество в пространстве R x Rn x R x Rn, Я — произвольное то- топологическое пространство; функции fii G х Я —> R, г = 0, 1,..., т, и (р: G х Я —> Rn и их частные производные по х непрерывны в G х х Я, а функции Фг: W -^ R, г = 1,... ,т, непрерывно дифференциру- дифференцируемы в W. ^ ^ Если (х(-),и(-),to, t\) — оптимальный процесс для задачи A)-C), то найдутся множители Лагранжа Ло^О, р(-), Л = (ЛЬ...,ЛП), не равные одновременно нулю и такие, что: а) выполнены условия стационарности и принцип минимума для функции Лагранжа: _ по х(-) условие стационарности (?х(-) — 0) ~Li(t) + Lx(t) = O, (8) Li(tk) = (-\)kTXk, A; = 0,1; (9) по и(-) принцип минимума в лагранжевой форме L{t) = Lit, x{t),x{t), u{t)) = minL(t, x(t),x(t), v), A0) vEii или в гамилътоновой (понтрягинской) форме в виде принципа мак- максимума Hit) =H(t,x(t),u(t),p(t)) = mdixH(t,x(t),v,p(t)y, A1) veil при этом функция Hit) непрерывна на отрезке [to,t\]; по tk условия стационарности ?tk=0, k = 0,1; A2)
288 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления б) выполнено условие согласования знаков А,^0; A3) в) выполнены условия дополняющей нежесткости %Ji(x(-),u(-)SoS\) =0, г = 1,2, ...,ш A4) (как и в предыдущем параграфе неравенства A3) означают, что Л^ ^ 0, если в условии C) 3{ ^ 0; А^ ^ 0, если в C) 3{ ^ 0 и Л^ может иметь любой знак, если 3{ = 0). Утверждение о существовании множителей Лагранжа, удовлетворя- удовлетворяющих совокупности условий а)-в), кратко называется нами принципом Лагранжа для задачи оптимального управления A)-C) или принци- принципом максимума Понтрягина. Как и раньше, это утверждение нахо- находится в полном соответствии с общим принципом Лагранжа из п. 3.1.5. Поскольку функция Лагранжа 9} является функцией трех аргументов: х(-), и(-) и (to,t\), надлежит рассмотреть три задачи: (а) Щх(-),Щ-)ЛоЛ1\Я)Х*о) ->Ъй, (/3) ЩЦ'),и(-)ЛоЛ1\Я),\Х) ^mf, G) Щ(-),Ц-)ЛоЛх\Я)Х\о) ^Ъй. Задачи (а) и G) здесь те же самые, что и в п. 4.1.1. Поэтому и соответ- соответствующие условия стационарности по х(-) и по tk должны выглядеть здесь так же, как и в задаче Лагранжа и это действительно так. Что же касается задачи (/3), то это элементарная задача оптимального управления из п. 3.1.4, и принцип минимума A0) вполне соответ- соответствует условию A) этого пункта. Таким образом, приведенная выше формулировка теоремы действительно согласуется с общим принципом Лагранжа. Обычно условия стационарности (8), (9) и A2) записываются в дру- другой форме: (8) — как уравнение Эйлера-Лагранжа (называемое также сопряженным уравнением) dp(t)/dt = -p№x(t) + 53 Aj/teW; (8a) г=0 (9) и A2) — как условия трансверсальности 0i )+TXl=0, -p{t0) +L0=0 (9a) -H(U)+Ttl=0, H(to)+Tto=O. A2a) Соответствующие преобразования проделываются так же, как в п. 4.1.1, и нет нужды их повторять. В точках разрыва управления в уравнении (8а) надо брать правую производную р+х(-) (левая тоже существует). Непрерывность р(-) и Н(-) в точках разрыва управления (т. е. в точках излома #(•)) носит название условия Вейерштрасса-Эрдмана.
4.2. Принцип максимума Понтрягина 289 Можно проделать и здесь анализ «на полноту» набора необходимых условий, даваемых сформулированной теоремой. В сущности он не будет отличаться от того, что было сделано для задачи Лагранжа. Вместо того, чтобы определять и(-) как функцию х(-) и р(-) из условия Lu = 0, теперь это нужно сделать, исходя из соотношения A0). 4.2.3. Игольчатые вариации. Как и в простейшей ситуации, разобранной нами в п. 1.5.4, основной прием в доказательстве прин- принципа максимума, которое будет изложено далее, состоит в замене рассматриваемой нами задачи оптимального управления некоторой ко- конечномерной экстремальной задачей или, точнее говоря, целым на- набором таких задач. Для этого мы включим оптимальный процесс (x(-),u(-),to,t\) в некоторое специальное семейство управляемых про- процессов — «пакет» игольчатых вариаций — и рассмотрим ограничение задачи A)-C) п. 4.2.2 на это семейство. Нужное нам семейство процессов зависит от следующих парамет- параметров: начальные данные (to,xo), конечный момент времени t\\ набор а = (а\,... ,адг), где все «jER достаточно малы; для крат- краткости обозначим а = ^с^; ^ набор г = (т\,..., гдг), где to < Ti < т^ < ... < тдг < t\, причем среди Тг содержатся все точки разрыва оптимального управления и(-); набор v = (v\,..., vn), где V{ G Я. В дальнейшем г и v фиксированы, a (t\,to,xo,a) меняются, и по ним мы будем дифференцировать различные функции. Пусть сначала N = 1. Элементарная игольчатая вариация управле- управления u(t), или просто «элементарная иголка», отвечающая паре (t,v), определяется равенствами u(t;a,T,v) = < / ^ ' i \ A) v ' Л v, t е [г, г + а). к ' Соответственно игольчатая вариация x(t;a,r,v) фазовой траектории x(t) определяется как решение задачи Коши x = (p(t, х, u(t; a, r, г;)), х(т)=х(т). B) С точностью до несущественного различия (вместо [г, г + а) был взят полуинтервал [г — А, г)) мы рассматривали подобную вариацию в п. 1.5.4. Было обнаружено, что функция x(t;a,r,v) дифференцируема по а и при t > г ее производная y(t) = xa(t; 0,r,v) является решением уравнения в вариациях $() C) с начальным услорием у(т) = ср(т, х(т), v) - ср(т, х(т),и(т)). D) 10 В. М. Алексеев и др.
290 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Следуя п. 2.5.4, мы будем здесь и в остальной части параграфа обозначать через О(?,т) фундаментальную матрицу решений урав- уравнения C). Кроме того, для сокращения записи введем специальное обозначение для правой части равенства D): Аф(т, v) = (р(т, х(т), v) — (р(т, х(т),и(т)). E) В этих обозначениях y(t) = xa(t; 0, г, г;) = Q(t, т) А(р(т, v). F) В п. 1.5.4 мы смогли обойтись рассмотрением одной «иголки». Те- Теперь нам понадобится целый их «пакет», поскольку задача стала слож- сложнее, и нам нужно иметь в распоряжении больше свободных параметров. В пакете объединяется любое конечное число иголок с параметрами (ri,Vi,ai), г = l,...,N. При этом существенно, что некоторые из этих иголок могут различаться только значениями управления V{ при одних и тех же Т{. Поэтому задавать иголки формулами вида A) теперь нельзя: при одинаковых Т{ разные иголки будут накладываться друг на друга. Чтобы избежать этого, мы сдвинем полуинтервал действия N г-й иголки на величину га = г ^ aj> так что теперь это будет А^ = = [тг + ш, Ti + ia + ai] (очевидно, что если <х/ > 0 и достаточно малы, то Ai не перекрываются). Согласно сделанным в п. 4.2.1 предположениям оптимальное управ- управление и(-) непрерывно слева в точке t\ и справа — в точке to. Продол- Продолжим и(-) вне отрезка [to,ti] с сохранением непрерывности (например, положив u(t) = u(to) при t < to и u(t) = u(t\) при t > t\) и впредь не будем этого оговаривать. Пусть все ai > 0. Определим игольчатую вариацию управления и(-) формулами u(t;a,r,v) = < Г N N \ G) Соответствующее семейство фазовых траекторий x(t\ to,xo,a,r, v) определим как решение задачи Коши х = cp(t, х, u(t\ а, г, г;)), x(to) = xq. (8) Для краткости далее щ = x(to). Лемма о пакете иголок. 1) При достаточно малых sq > 0, 5 > 0 решение задачи Коши (8) такое, что \t0 - to\ < е0, \х0 - хо\ <е0, 0 < aj < е0, (9) определено для to — 5 ^t ^t\ + 5.
4.2. Принцип максимума Понтрягина 291 2) Если to —> to, #о ~^ ^о ^ <^j I 0. ^° x(t; to, хо,^, т, v) —> x(t) равномерно на отрезке [to,t\]. 3) Отображение (t\,to,xo,a) \-^ x(t\;to,xo,a,r,v) может быть продолжено до отображения, определенного и непрерывно диффе- дифференцируемого в некоторой окрестности точки (t\,to,xo,O), и при этом дх/dtx = xtl(U\to,xo,O,T,v) = <p(tux(U),u(ti)) = (p(ti), A0) дх/dto = xto (U; to, xo, 0, г, г;) = хо,п(?о)) = -u(tuto)<p(to), (И) дх/дхо = xXo(t\-,to,xo,O,T,v) = ft(?i,^), A2) dx/dak = xak(ti;?o,xo,O,r,v) = fi(fbto) Afi(rk,vk), A3) где Q,(t,r) — фундаментальная матрица решений системы уравнений в вариациях C) и A<p(r,v) определено формулой E). Доказательство этой леммы будет приведено в п. 4.2.6. Ясно, что она обеспечивает нам дифференцируемость терминальных членов, вхо- входящих в условия задачи п. 4.2.2. Что же касается интегральных членов, то, как и в п. 1.5.4, мы посвятим им отдельную лемму. Лемма об интегральных фу н к циона л ах. Пусть функ- функции fi(t,x,u) удовлетворяют тем же условиям, что и в формули- формулировке теоремы п. 4.2.2. Если u(t,a,r,v) определено при ai > 0 формулами G), a x(t;to,XQ,a,T,v) — решение задачи Коти (8), то функции и Fi(t\, to, xo,ct) = fi(t, x(t; to, xo,ct,T,v), u(t;a,r,v)) dt, i = 0, 1,..., m, to могут быть продолжены до непрерывно дифференцируемых в неко- некоторой окрестности точки (t\,to,xo,O) функций и при этом OF^dU = FUl(tuto,xo,O) = /г(?их(и),Ци)) = Mi), A4) = -fi(to)+m(to)<p(to), A5) dF./дхо = FlXo(tuto,xo,O) = -poifo), A6) dFx/dak = Fiak(tuto,xo,O) = А/г(тк,ук)-рОг(тк) Afi(rk,vk), A7) где poi(T) — решение задачи Коши dpoi(r)/dr = -poi(r)ipx(T, х(т),и(т)) + fix(r, х(т), и(т)), A8) 10*
292 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления для неоднородной линейной системы, сопряженной к системе урав- уравнений в вариациях C), a Afi(r,v) определяется формулой, анало- аналогичной E). Доказательство этой леммы приведено в п. 4.2.7. 4.2.4. Редукция к конечномерной задаче. График оптимальной фазовой траектории x(t) лежит в области G и в силу второго утвержде- утверждения леммы п. 4.2.3 (о пакете иголок) график решения x(t;to,xo,a,r,v) задачи Коши (8) того же пункта также лежит в этой области при t G [to,t\], если выполнены неравенства (9) п. 4.2.3 с достаточно ма- малым ?о- Значит, четверка (x(-;to,xo,a,r,v),u(-;a,r,v),to,t\) является управляемым процессом для задачи A)-C) п. 4.2.2. Положим Фг(*1, t0, хо, а) = i/>i(to, xo,t\, x(t\ ;to,xo,a,r,v)), A) u r Fi(t\,to,xo,a) = fi(t,x(t;to,xo,a,r,v),u(t;a,r,v))dt, to i = 0,l,...,m. B) В силу третьего утверждения леммы о пакете иголок и по теореме о су- суперпозиции, функции (I) непрерывно дифференцируемы в некоторой окрестности точки (t\,to,xo,O). Для функций B) то же самое следует из леммы об интегральных функционалах п. 4.2.3. Теперь мы можем рассмотреть конечномерную экстремальную за- задачу — сужение задачи A)-C) п. 4.2.2 на построенное семейство управляемых процессов: Io(ti,to,xo,a) = F0(ti,t0,x0,a) + ^o(ti,to,xo,a) -> inf, C) Ii(U, t0, x0, a) = Fi(ti, t0, xo,a) + ^(ti, t0, x0, a) ^ 0, D) i = 1,2,...,m, ak^0, k= 1,2, ...,7V. E) Для этой задачи точка (ti,to,xo,O) является локальным решени- решением. Действительно, если выполнены ограничения D), то четверка x(-',to,xo,a,T,v),u(-',a,T,v),to,t\) является допустимым управляемым процессом задачи A)-C) п. 4.2.2. Если го в неравенствах (9) п. 4.2.3 достаточно мало, то в силу второго утверждения леммы о пакете иголок выполняются неравенства D) п. 4.2.1. Следовательно, верно неравенство E) п. 4.2.1, откуда > 4o(x(-),u(-),to,h) = Io(t\,to,xo,O), а это и означает, что (ti,to,xo,O) — локальное решение задачи C)-E).
4.2. Принцип максимума Понтрягина 293 Применяя к задаче C)-E) правило множителей Лагранжа из § 3.2, получаем следующее утверждение. Лемма (правило множителей Лагранжа для вспо- вспомогательной конечномерной задачи). Существуют такие множители Лагранжа Ло > О, А = (Ль ..., Аш) е Rm*, /х = (/хь ...,nN), F) не равные нулю одновременно, что для функции Лагранжа т N i=0 k=l выполняются: 1) условия стационарности т т Atl = Y, ^Fitl + J2 ^Ф«, = 0, (8) г=0 г=0 (9) г=0 г=0 т т АХо = г=0 г=0 Ai$iafc +/xfe =0, A1) г=0 г=0 обозначено Аак = ЛаА; (ti, to, xo, 0; А, Д, Ао) и т. п.; 2) условия согласования знаков Аг^О, №<0; г=1,2,...,т; к = 1,2,..., 7V; A2) 3) условия дополняющей нежесткости А»[^(ГьГо,жо,О) + Ф»(Г1,Го,жо,О)]=О, A3) г= 1,2,...,т. 4.2.5. Доказательство принципа максимума. За исключением одного не совсем тривиального места, остальная часть доказательства будет посвящена расшифровке условий (8)—A3) п. 4.2.4. Собственно принцип максимума (или в лагранжевой форме — принцип миниму- минимума), т.е. соотношения A1) (или A0)) п. 4.2.2, получается при этом из равенств A1) п. 4.2.4, т.е. условий Аак = 0. Каждое такое условие соответствует одной из иголок, входящих в «пакет», и если эта игол- иголка определялась парой (ть^), то мы получаем из него неравенство H(rk,x(Tk),Vk,-) ^ H(rk,x(Tk),u(rk), •)• Таким образом, чтобы полу- получить принцип максимума, мы должны перебрать иголки, отвечающие
294 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления всем возможным парам (r,v), тогда как наш «пакет» содержит любое, но конечное их число. Положение спасают простые топологические соображения, основанные на компактности. Применяя «лемму о цен- центрированной системе», мы можем выбрать «универсальные» множители Лагранжа, пригодные для всего множества иголок. А) Существование «универсальных» множителей Лагранжа. Изучим подробнее условия (8)—A3) п. 4.2.4, внеся в них значения производных функций Fi и Ф^, вычисленные при помощи двух лемм п. 4.2.3, и уделяя особое внимание членам, в которые входят параметры иголок (rk,vk). Производные функций Fi даны прямо в лемме об интегральных функционалах и, обозначив Аг(т, v) = fi(r, X(r),v) - /г(Г, х(т),и(т))- - Р(н(т)[(р(т, x(t),v) - (р(т, х(т),и(т)] = = А/(т,у)-рОг(т)Аф(т,у), A) мы видим, что ^ а ни в одну из остальных производных параметры иголок не входят, так что эти производные имеют одно и то же значение для любого «пакета иголок» п. 4.2.3. Аналогично производные функций o, t\, x(t\; o, а, т, вычисляются по теореме о суперпозиции и^ лемме о пакете иголок, причем от параметров иголок зависят лишь ^fiak. Если обозначить ,у), B) то а значения производных «пакета иголок». Теперь имеем одни и те же для любого г=0 г=0 , Vk) k, Vk)) г=0
4.2. Принцип максимума Понтрягина 295 Поскольку, согласно условиям A2) и A1) п. 4.2.4, /1^0 и Аак = 0, должны выполняться неравенства J2 0. C) г=0 Рассмотрим теперь в пространстве R(m+1)* следующие множества: г=0 m , г;) = {(Л, Ао) | ^ ШДт, г;) + В»(г, г;)) > 0}, г=0 ТХ = {(А, Ао) | г=0 г=0 и, наконец, множество Z, состоящее из тех (А, Ао), для которых Ао > О, a Xi, г = 1,...,т, удовлетворяют условиям согласования знаков и до- дополняющей нежесткости A2) и A3) п. 4.2.4, тождественных услови- условиям A3) и A4) п. 4.2.2. Все эти множества замкнуты, а сфера S еще и компактна, как замкнутое ограниченное подмножество конечномерного пространства j^(m+l)* Условия стационарности (8)—A0) п. 4.2.4 соответствуют включени- включениям (А, Ао) Е Ti, To, X, условия согласования знаков и дополняющей нежесткости — включению (А, Ао) Е Z (все эти условия одинаковы для всех пакетов иголок). Зависящие от иголок условия A1) п. 4.2.4 вы- выполняются, когда (А, Ао) Е К(тк,Ук), k = l,...,N. Наконец, поскольку множители Лагранжа определены с точностью до пропорциональности и не могут одновременно обращаться в нуль, их можно пронормировать так, чтобы было (А, Ао) Е S. Поэтому утверждение леммы предыдущего пункта означает, что SnTonTxDXnZD П К(тк, vk) + 0. D) Рассмотрим систему замкнутых подмножеств К(т, v) = SnToDTinXDZD К(т, v), re[to,t\}, veil, E) компактного множества S. _ Лемма о центрированной системе. Система множеств К(т, v) имеет непустое пересечение.
296 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления _ Доказательство. Согласно D) любое конечное число множеств K(r,v) имеет непустое пересечение. Такая система множеств называ- называется центрированной. По известной теореме [КФ, гл. II, § 6] пересече- пересечение центрированной системы подмножеств компакта непусто. ¦ Таким образом, существуют (А,А0)Е п К(т, v) = SHT0 nTi nXnZn П K(r,v). F) re\to,u], reftoti] veil veil Это и есть искомые «универсальные» множители Лагранжа. Действи- Действительно, Хг не равны нулю одновременно ((А, Ао) Е S), удовлетворяют условиям согласования знаков и дополняющей нежесткости ((А, Ао) Е Е Z), удовлетворяют условиям Л^г = О, I = 0, 1, и АХо = О ((А, Ао) Е Е То П Ti П X) и, наконец, G) г=0 для всех г Е [to,ti], v E Я. Б) Вывод принципа максимума. Подставив A) и B) в неравенство G), преобразуем его к виду г=0 г=0 = /(г, х(т), v) - /(г, х(т),и(т)) - р\ - <р(т, х(т),и(т))] = -Н(т, x(t),v, р(т)) + Н(т, х(т), и(т),р(т)), (8) где m ¦Р( \ ^ ^ Л -F ( \ ICi\ г=0 m m p.^ р(т) = /] АгРог(т) — у^ А^^-^1 O(tj, r) A0) г=0 г=0 1 — решение уравнения Эйлера-Лагранжа (8а) п. 4.2.2, как мы увидим далее, и Н(т,х,и,р) = р(р(т,х,и) — f(r,x,u) A1) — функция Понтрягина (ср. G) в п. 4.2.2). ^ ^ Неравенство (8), справедливое при всех г Е [to,ti] и г; Е Я, равно- равносильно принципу максимума A1) п. 4.2.2 Г(т,ж(т),г;,р(т)). A2)
4.2. Принцип максимума Понтрягина 297 В) Вывод условий стационарности по х(-). Дифферен- Дифференцируя A0) и учитывая, что poi(r) удовлетворяют уравнениям A8) п. 4.2.3, а (см. теорему п. 2.5.4), имеем dp(r)/dr = ^ ^г{-Рог{т)?х(т) + fix(r)}- г=0 m г=0 ХХ г=0 т. е. р(') является решением уравнения Эйлера-Лагранжа (8а) п. 4.2.2. Далее, прямо из A0) т т р.^ т р.^~ rj?* p(t \ ) = N A^Poi (t 1) ~~ / А^ О(t 1, 11) = — / Xi = , A3) г=0 г=0 г=0 поскольку poi(t\) = 0 в силу A8) п. 4.2.3, a u(t,t) = Е. Здесь, как и в F) п. 4.2.2, т г=0 — терминант, а полученное равенство A3) равносильно первому ра- равенству (9а) из п. 4.2.2. Наконец, условие АХо = 0, т. е. A0) п. 4.2.4, дает после подстановки значений производных A2) и A6) п. 4.2.3 т т 0 = Ахо = ^2\iFiX0 + ^2\i$ixo = г=0 г=0 т т г=0 г=0 / J г=0 г=0 г=0 так что верно и второе условие трансверсальности (9а) п. 4.2.2. Г) Вывод условий стационарности по t{. После подста- подстановки значений производных A0), A1), A4), A5) п. 4.2.3 в условия
298 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Кц = Atx =0 (8) и (9) п. 4.2.4 получаем с учетом обозначений (9)-A1) и уже доказанного равенства A3) 0 = Atl = ^№, г=0 г=0 т г=0 г=0 = /(*!) +Tti +tMh) = f(ti)-0i)'p(ti) + h1 = -H(h) +Tti и т г=0 г=0 г=0 г=0 = -f(to) + Этим доказаны обе формулы A2а) п. 4.2.2. Д) Непрерывность функции Н(-). Вместе с управлением u(t) функция H{t) = H(t,x(t),u(t),p(t)) = = -fit, x(t), u(t)) + pit)ip{t, x(t),u(t)) = г=0 непрерывна справа. Кроме того, каждая из функций H(t,x(t),v,p(t)) непрерывна по t и, переходя к пределу в неравенстве H(t,x(t),v,p(T)) < H(t,x(t),u(t),p(t)) = H(t), A5) мы получаем H(r,x(r),v,p(r))^ lim H(t) = H(r-0), t—)-r—0 откуда H(r) = supH(r,x(t),v,p(r)) <Я(т-0). A6)
4.2. Принцип максимума Понтрягина 299 С другой стороны, Я(т-0)= lim H(t,x(t),u(t),p{t)) = t^T—O = H(t,x(t),u(t -0),р(т)) = lim H(r,x(r),v,p(r)) < v^u(r—0) <Я(т,ж(*),и(т),р(т)) = Я(т) в силу того же неравенства A5). Вместе с A6) это означает, что Н(т — — 0) = Н(т), т. е. H(t) непрерывна и слева. ¦ 4.2.6. Доказательство леммы о пакете иголок. Напомним, что игольчатая вариация x(t;to,xo,a,T,v) оптимальной фазовой траекто- траектории х(-) — это решение задачи Коши х = (p(t,x,u(t;a,T,v)), A) x(t0) = ж0> B) где в свою очередь вариация u(t;a,r,v) оптимального управления u(t) определяется при <х/ > 0 формулами {Vi, t е Дг = [тъ + га, п + га + а^), S(t), t^UA,; a=?>i- C) Доказательство леммы о пакете иголок (лемма п. 4.2.3) удобно разбить на две части. В первой из них, выделенной в отдельное утверждение, мы доказываем равномерную сходимость проварьированных фазовых траекторий к х(-). Существенную роль здесь играет не столько ку- кусочная непрерывность управлений, сколько интегральная сходимость соответствующих правых частей дифференциальной связи (см. ниже формулу E)). Чтобы оттенить это, мы распространяем утверждение также и на случай измеримых управлений (определив сначала под- подходящим образом понятие измеримости в случае, когда управления принимают значения в произвольном топологическом пространстве). Вторая часть доказательства леммы о пакете иголок непосредственно связана с кусочной непрерывностью и опирается на классическую тео- теорему о гладкой зависимости решений от начальных условий. Определение. Пусть Я — произвольное топологическое про- пространство и / — отрезок числовой прямой. Отображение и: I —> Я называется измеримым (в смысле Лебега), если существует конечная или счетная последовательность непересекающихся измеримых под- подмножеств Ап, лежащих в / такая, что: а) ограничение и \ Ап продолжается до функции, непрерывной на замыкании Ап\ б) 7 \ UAn имеет лебегову меру нуль. п Ясно, что всякое кусочно-непрерывное отображение измеримо в смысле этого определения (в качестве Ап берем интервалы
300 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления непрерывности). Почти также очевидно, что в случае, когда Я С С Rr функция, измеримая в смысле этого определения, измерима и в обычном смысле [КФ, гл. V, §4]. Действительно, пусть ип(-) — функция, непрерывная на Ап, и сов- совпадающая с и(-) на Ап. Полагая un(t) = 0 вне Ап, мы получаем изме- измеримую функцию на R. Характеристическая функция хап(-) множества Ап также измерима, а поскольку u(t) = ^2xAn(t)un(t) почти всюду п на /, измерима и u(t). Упражнение. Докажите, что если Я С Rr и функция и: I —>> Я измерима в стандартном лебеговом смысле, то она измерима и в смысле приведенного выше определения. Указание: воспользуйтесь С-свойством Лузина [КФ, с. 291]. В формулировке следующей леммы Я — некоторое хаусдорфово топологическое пространство [КФ, гл. II, §5]. Лемма 1. Пусть функции tp и tpx непрерывны в G х Я х: [to, t\] —> —> Rn — решение дифференциального уравнения x = ip(t,x,u(t)) D) и его график Г = {(?, x(t)) | f0^ t < fjj С G. Пусть далее 5о > 0 и иа: (to — So, t\ + 5о) -^ Я — семейство изме- измеримых управлений такое, что для всех t и всех а ей значения ua(t) содержатся в некотором компакте .Жо С Я. Пусть, наконец, u(t) = u%(t) для некоторого а е Я и lim [ \<p(t,x(t),ua(t)) -<p(t,x(t),u(t))\dt = O. E) *o-<*o Тогда решения Xa(t,to,xo) задачи Коши x = ip{t, x, ua(t)), x(t0) = xo при некотором 5 > 0 определены на отрезке [to — 5,t\ — 5] для всех (to,xo,a) из некоторой окрестности точки (to,x(to),a) в R x Rn x х Я и при to —> to, xo -^ x(to), a —> а Xa(t,to,xo) -^ x(t) равномерно по t e [to, ti]. Доказательство. Применим к рассматриваемому случаю тео- теорему 2 п. 2.5.5, положив Fa(t,x)=<p(t,X,Ua(t)). F) А) Если Ап — те множества, о которых говорится в определении измеримости, примененном к иа(-), то при фиксированном х функции t I—> (p(t,x,ua(t)) непрерывны на Ап, а следовательно, t \-^ Fa(t,x) — измеримые функции и выполнено предположение А) п. 2.5.1. При
4.2. Принцип максимума Понтрягина 301 фиксированном t функции Fa вместе с ср дифференцируемы по х, так что выполнено и предположение Б) п. 2.5.1. Б) Для любого компакта Ж С G функции ср и срх непрерывны на компакте Ж х Жо, а следовательно, и ограничены. Обозначив М= max \(p(t,x,u)\, Mx = max \\(px(t,x, u)\\, Ж х .Жо Ж х .Жо мы видим, что выполняется условие В') теоремы 2 п. 2.5.5 с x(t) = М и k(t) = Мх, поскольку по условию ua(t) G .Жо- Условие Г) той же теоремы совпадает с E). Таким образом, к рассматриваемой ситуации применима теорема 2 п. 2.5.5, из которой и вытекает доказываемое утверждение. ¦ Доказательство леммы о пакете и го л ок. А) Проверим выполнение условий предыдущей леммы. Часть из них, относящаяся к ср и х(-), входит в условия теоремы о принципе максимума. Выше мы уже предположили, что управление и(-) продолжено вне отрезка [to, t\], так что при t ^ to и при t ^ t\ это непрерывная функция. Поэтому мы будем считать далее, что и(-) определена на отрезке А = — [^о — So, t\ + <5o], 5о > 0, а ее точки разрыва лежат в интервале (to, ti). Пусть t^ < t^2) < ... < t(s) — эти точки, t(°) = to - ^o» t^s+1^ = ?i + + 5o. Функция qijf\ _ J a\l)> l ^ 6 <^ 6 , A ]~\ u(tW-O), * = *W, непрерывна на отрезке /^ = [t^~l\t^] и образ .Ж^ этого отрезка при непрерывном отображении щ: I —> Я компактен в Я, поскольку /^ — компакт. В соответствии с формулами C) значения управлений u(t;a,T,v) лежат в компакте 0 1{и г=\ Остается проверить условие интегральной сходимости E). На ком- компакте Ж = {(t, x(t),u) \teA,ue Жо} = Г х Жо непрерывная функция ср ограничена: \ср\ ^ М. При столь малых <х/ > 0, что полуинтервалы Aj не пересекаются, из формул C) имеем i+50 [ \ip(t, x(t), u(t; a, r,г;)) - cp(t, x(t), u(t))\ dt = — ^o N N N 3 = 2Ma -^ 0 при aj I 0, так что условие E) выполнено.
302 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Применяя лемму 1, убеждаемся в справедливости первых двух утверждений леммы о пакете иголок п. 4.2.3: для достаточно малого го > 0 решение x(t;to,xo,a,r,v) задачи Коши A), B) при (to,xo^a), удовлетворяющих неравенствам (9) п. 4.2.3, определено на А = [to — — 5,t\ + 5] (первое утверждение), и при to —> to, хо —> хо, otj \ 0 x(t; to, xo,a, г, г;) —> x(t) равномерно по t e \to,t\] (второе утверждение). Б) Перейдем к рассмотрению отображения (t\,to,xo,a) —> —> x(t\\ to,a,г,г;). Обозначим, как обычно, через X(t,to,xo) решение задачи Коши х = (p(t,x,u(t)), x(to) = xq. G) По теореме 1 п. 2.5.5 функция Х(-, •, •) определена и непрерывна в об- области (to — So, t\ + So) x G, где G — некоторая окрестность графика Г решения х(-). Если же мы сузим область определения так, чтобы to и t не переходили через точки № разрыва управления и(-), то диф- дифференциальное уравнение в G) удовлетворяет условиям классической теоремы о дифференцируемой зависимости решения от начальных дан- данных (п. 2.5.7), так что X(t,to,xo) будет непрерывно дифференцируемо по совокупности аргументов. В частности, X непрерывно дифференци- дифференцируемо в некоторых окрестностях точек (tk,tk>%(tk))> поскольку в неко- некоторых окрестностях точек t& управление и(-) по нашим предположени- предположениям непрерывно. _ Далее, обозначим через S(?,a, г, г;) значение при t = t\ решения задачи Коши для уравнения A) с начальным условием x(to) = ?, т. е. S(^, а, г, v) = x(t\, to, ?,a, r, г;). (8) В соответствии с формулой A3) п. 2.5.5 и формулами C), задающи- задающими управление u(t,a,r,v), имеем x(ti^o,xo,a,T,v) = X(tiSi,S(X@o^o,xo),a,T,v)) (9) (от to до to мы решаем уравнение х = (p(t,x,u) с управлением и = = u(t), а затем от to до t\ — с управлением и = u(t;a,r,u) и, наконец, от t\ до t\ — снова с управлением и = u(t). Важно отметить, что, как и формула A3) п. 2.5J5 формула (9) верна при любом расположении точек ti относительно t{. Если мы теперь сможем продолжить отображение (?,сё) \-^ H^S(^,a, г, г;) до отображения класса С1, определенного в некоторой окрестности точки (x(to),O) (т.е. сможем продолжить его на от- отрицательные olj с сохранением непрерывной дифференцируемости), то в соответствии с формулой (9) и отображение (t\,to,xo,ot) ^ \-^ x(t\\ to,xo,a,r, v) будет продолжено на некоторую окрестность точки (ti, to,xo,0), а по теореме п. 2.2.2 оно будет непрерывно диффе- дифференцируемым как суперпозиция трех непрерывно дифференцируемых
4.2. Принцип максимума Понтрягина 303 отображений: (to,#o) ^ ^(to,to,#o), (С><^) ^ S(?,a,r,l7), (?1,770) \-^ ^ (?ь?1,77о). В) Пусть г G (to, ^1) и v G Я фиксированы. Обозначим через Уу(?, to, г/о) решение задачи Коши y = (p(t,y,v), y(to)=yo. A0) В силу локальной теоремы существования (п. 2.5.2) и классиче- классической теоремы о дифференцируемости решения по начальным дан- данным (п. 2.5.7) Yv(t,to,yo) определено и непрерывно дифференцируемо в некоторой окрестности точки (т,т,х(т)). Если т — точка разрыва управления и(-), т. е. и{т — 0) ф и(т), то наряду с и(-) рассмотрим управление l(T), t < Т. Поскольку и(-) непрерывно в некоторой окрестности точки т, решение X(t,to,xo) задачи Коши x = ip(t,x,u(t)), x(to)=xo, (И) также определено и непрерывно дифференцируемо в некоторой окрест- окрестности точки (т, т, х(т)). Если же т — точка непрерывности и(-), то само X(t,to,xo) обладает тем же свойством, и в следующих далее формулах можно считать X = X. ^ ^ Дополним набор т = (ть...,тдг) точками то = to и тдг+i = t\, так что to = то < т\ < ... < тдг < тдг+1 = ti, и рассмотрим суперпозицию отображений S(?, а, т,г;) = Р о Хдг о Zjv о ... о Х& о Zk о Хк_\ о ... о Z\ о Xq, A2) где Р(^,а) = !; ть,О,«) A3) = (Х(ть т/с + to + ак, YVk (тк + to + ад, т/с + to, Поскольку Xfc и Z/c непрерывно дифференцируемы в окрестности точки р/с = E?(т/с),0), причем Х/с(р/с) =р/с+ь Zk(pk) =pk, a P линейно, супер- суперпозиция A2) определена и непрерывно дифференцируема в некоторой окрестности точки р0 = (^(to),O) = (жо,О). Лемма 2. ?суш все од > 0 и достаточно малы, то S(?, а, т, г;) = S(^, а, г,г;) = x(ti, to, ^, а, т, г;). A5) Доказательство. Обозначим для краткости x(t) = = x(t,to,^,a,т,г;). Если все а/с > 0 и достаточно малы, то полуин-
304 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления тервалы Д^, входящие в определение C), попарно не пересекаются и расположены между to и t\ в порядке возрастания номеров. N Пусть si = Тг -\- га = Тг -\- г ^2, aj — левый конец полуинтервала Д^, J ^о = то = to, 5дг+1 = Tjv+i = t\. Докажем по индукции, что x(sk)=X(sk,Tk,?k), A6) где ^о = ?и b = PoXk_loZk_loXk_2c..oZloX0(^a), к>\\ A7) в частности, ?i = PoX0K,a) = X(ti,to,?). Поскольку при to = = го < t < 5i дифференциальные уравнения в G) и A) совпадают и х(то) = ? = Х(го,го,^о)» то в этом полуинтервале x(t) = Х(?, то,?о)> и, переходя к пределу при t —> si и учитывая тождество X(si,to,?o) = = X(s\,т\,Х(т\,го,?о)), получаем A6) при к=\. Предположим, что A6) верно для некоторого к. Чтобы перейти по решению х(-) от sk до sk+\, надо в силу C) проделать следу- следующее. От Sk до Sk + ak решаем уравнение A0) с начальным усло- условием уо = x(sk), в результате чего получаем x(sk + ак) = YVk(sk + + од, Sfc, x(sk)). Далее от s^ + ак, т. е. от конца Д*., до sk+i — начала Afc+i, решаем уравнение G) с начальным условием хо = x(sk + од) и получаем равенство a; +ОД,жE/с +ОД)) = = X(sk+\,sk + од, l^fc (sk + од, sfc, Согласно A3) п. 2.5.5 справедливо тождество X(t, г, X(r, t0, ж0)) = X(t, t0, ж0). Воспользовавшись им и равенством A6), верным по индукционной гипотезе, получаем последовательно = X(sk+i,Tk+i,X(Tk+i,Tk,X(Tk,sk + ak,x(sk + од)))) = X(X(X( + од, ). A8) Теперь заметим, что если все од > 0, то тк < sk < sk + од, а так как^при t ^ тк уравнения G) и A1) совпадают, то X(rk,sk +од,^) = = X(rk,sk + од,?) и X(sfc,rfc,^) = %,rb(fc). Следовательно, ис- используя сначала определения A3) и A4), а затем A7), мы получаем Х(тк+\,тк, Х(тк, sk + од, yVfc (sfc + од, Sfc, X(sfc, r/c, = РоХко Zk(?k,a) = PoXkoZko Хк_х о ... о Х
4.2. Принцип максимума Понтрягина 305 Поэтому A8) совпадает с A6), в котором к заменено на к + 1, и, таким образом, A6), верно при всех к ^ 1. Остается заметить, что при к = = N + 1 A6) превращается в равенство о ... о , а) = S(?, а, г, (последнее согласно A2)) и, так как по определению x(t\) = = S(?,a, r, г;), A5) доказано. ¦ Как уже было сказано, суперпозиция A2) непрерывно диффе- дифференцируема в некоторой окрестности точки (жо,О). Следовательно, S(?,a, г, г;) (которая раньше была определена только при <х/ > 0) до- допускает непрерывно дифференцируемое продолжение на эту окрест- окрестность. Согласно п. Б) отсюда вытекает, что x(t\,to,xo,a,r,v) допуска- допускает (при фиксированных г, г;)^непреры_вно дифференцируемое продол- продолжение на окрестность точки (t\,to,xo,O). Остается доказать лишь формулы (\0)-(\3) п. 4.2.3 для частных производных этой функции в точке (t\,to,xo,O). Г) Прежде всего заметим, что x(t,to,xo,O,r,v) =X(t,to,xo), A9) x(t,to,x(to),O,r,v) =X(t,to,x(to)) =x(t), B0) x(t\, to, xo,a, r, v) = S(xo,a, r, v). B1) Согласно A9) и B1) частную производную по xo мы можем найти, применяя теорему п. 2.5.6 дх дх дЕ(хо,О,т, v) дхо dX(tuto,xo) ), B2) где ?l(t,r) ях ^0 xo=x(to) фундаментальная матрица решений уравнения в вариаци- z = <px(t,x(t),u(t))z (в формуле B) п. 2.5.6 надо положить F(t,x) = (p(t,x,u(t)) и учесть B0)). Этим доказано A2) п. 4.2.3. Теперь воспользуемся формулой (9|, заметив, что, как было ска- сказано в п. Б), в окрестности точек (tk,tk,x(tk)), к = 0, 1, производные функции X(t,to,xo) можно вычислять, применяя классическую тео- теорему о дифференцируемости по начальным данным (формулы A)-D) п. 2.5.7, где снова F(t,x) = (p(t,x,u(t)). Дифференцируя (9) и учитывая
306 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления уже найденную формулу B2), а также, что, согласно B0) и B1), = x(t\,to,x(to),O,r,v) = x(t\), имеем dx/dt, = 0Н(?,6,т,г;)/0? |^(?о)9Х(Го, to,x(to)/dto \t0=t0 = Этим доказаны A0) и A1) п. 4.2.3. Пусть теперь щ = 0, г ф к и а& > 0. Обозначим для краткости x(t,ak)=x(t,to,x(to), @,...,0,аь...,0), г,г;). При таком выборе а, согласно C), в полуинтервале to ^ t < Tk + /с дифференциальные уравнения A) и G) совпадают и x(to,ak) =x(to), а потому в этом полуинтервале x(t,ak) = ж(^) и, переходя к пределу, получаем х(тк + fcafc, afc) = ж(тъ + fcafc). B3) Далее, при тк + /со^/с ^ t < тк + /со^/с + ак мы решаем дифференциальное уравнение A0) с начальным условием B3) и с v = Vk, откуда +ак) = ад, т/с + как,х(тк + как)). B4) В оставшемся промежутке тк + (к + 1)а& ^ ? ^ t\ мы снова возвраща- возвращаемся к уравнению G), теперь уже с начальным условием B4). Этот промежуток мы разобьем на два, фиксировав s так, что в интервале (rk,s) не было точек разрыва и(-). Величину ак > 0 будем считать столь малой, чтобы было тк < тк + (к + 1)а& < s. Имеем x(t\, ак) = X(t\, s, x(s, ak)) = — /\ 1/1 Q /\ I Q /7~7 I ( к? I 1 j /~\> -г nf* ( h~i I [ L^ I 1 j ал/ у ал/ у ] ] ] — + как,х(тк + как))). При дифференцировании этой формулы мы должны учесть следующие равенства: (ti, S,Xq) = il(t\,S) дх0 xo=x(s,O)=x(s)
4.2. Принцип максимума Понтрягина 307 (A) п. 2.5.6; t\ и s фиксированы); to=rk дх хо=х(тк,О)=х(тк) (E) и F) п. 2.5.7; классическая теорема применима, поскольку на от- отрезке [тк, s] управление и(-) непрерывно и тк < тк + (к + \)ак < s); = (р(тк,х(тк),ук), t=Tk = -<р(тк,х(тк),ук), (формулы D)-F) п. 2.5.7, где следует положить F(t,x) = ip(t,x,vk) и учесть, что всегда О(?,?) = Е); и, наконец, ж(г^) = (р(тк,х(тк),и(тк)) из G). Таким образом, дх дак дак (tu<xk) дх дх0 дх дх (t\,S,Xo {s,rk,x(rk)) dY 8Y (тк,тк,х(тк))х(тк)к 5, тк)[(р(тк, х(тк), vk)(k = fi(fi, rfc)[(p(rk, x(rk), vk) - <р(тк, х(тк), и(тк))], чем доказано A3) п. 4.2.3 (равенство ?l(t\, s)?l(s,rk) = ?l(t\,rk) имеет место по основному свойству фундаментальной матрицы A1) п. 2.5.4). 4.2.7. Доказательство леммы об интегральных функци- функционалах. Пусть ? = (?о,?ь-">?т), / = (/о,/ь---,/т), F = = (Fq, F\,..., Fm) (функции Fi определены в формулировке леммы в п. 4.2.3), u(t,a,r,v) и x(t\ to,xo,a, r, v) имеют тот же смысл, что и в пп. 4.2.3 и 4.2.6.
308 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Рассмотрим при а& > 0 задачу Коши для системы (п + га + 1)-го порядка ~ f&\ ~и <- (. \\ ( ip(t,x,u(t,a,T,v)) \ /1Ч X ^ \ ' I == iOit X с U\t OL Т V) ) == I / ) \ \ I A) V ' / у «/ \ ' ' \ ' ' ' // у ж(*о) = жо, ?(to) = 0. Уравнения для ж здесь не содержат ? и совпадают с A), B) п. 4.2.6. Поэтому их решением является x(t;to,xo,a,r,v), а тогда, как легко видеть, Следовательно, возможность продолжения этой функции на неположи- неположительные^ О? и непрерывная дифференцируемость в некоторой окрест- окрестности (ti,to,^o,O) вытекают из леммы о пакете иголок, примененной к системе A), а значения производных находятся по формулам, анало- аналогичным A0)-A3) п. 4.2.3: дх ~(^\ д% 7) г dt\ ' dto дх0 где — фундаментальная матрица решений системы уравнений в вариациях C) {?tij — прямоугольные блоки в матрице О размерами п х п, п х пг, пг х п и пг х пг соответственно). Учитывая, что 1р не зависит от ?, мы получаем из C), что О, является решением задачи Коши для матричного дифференциального уравнения dt \ ^21 ^22 I \ fx it) 0 / V ^21 ^22 / ' ( пп{т,т) пф,т)\ _ ( Еп 0 х \П2\(т,т) П22(т,т) ) ~ \ 0 Ет Решая поочередно четыре матричных уравнения, составляющие D), имеем (?,т), «ц(т,т)=Яп, откуда Оц(?,т) = O(t,r) — фундаментальная матрица системы C) п. 4.2.3. Уравнениям , r)/dt = <px(t)ui2(t, r), O12(r, r) = 0,
4.3. Задачи, линейные по фазовым переменным 309 удовлетворяет Q,\2(t,r) = 0, и по теореме единственности другого ре- решения не может быть. Далее = fx№(t,r), откуда T В частности, является решением задачи Коши A8) п. 4.2.3 (см. A4) в п. 2.5.4; мож- можно убедиться в этом также и непосредственно, дифференцируя по г и учитывая свойства фундаментальной матрицы, описанные в той же теореме п. 2.5.4). Наконец, 22(t, r)/dt = fx(t)Cli2(t, r) = 0, О22(т, г) = Ет, откуда О22(?,т) = Ет. Таким образом, ^ьг) 0 Подставляя в B) и отделяя то, что относится к ^(t\\tQ,XQ,'a,'f,v) = = F(t\, to, xq, а), мы получаем dF/dto = д^/dto = -П21(иЛоШ?о) - «22(*i,*o)/(*o) = = Po(^o)^(^o) - f(to), dF/дхо = д^/дхо = O21(fi, to) = ~Po(to), 8F/dak = + ^22(^1, rk) Д/(гь vk) = -po(rk) A^(rfc, vk) что совпадает с A4)—A7) п. 4.2.3. ¦ § 4.3*. Задачи оптимального управления, линейные по фазовым переменным Этот параграф посвящен одному специальному классу задач опти- оптимального управления. Этот класс достаточно важен и с прикладной точки зрения, но для нас он интересен не только этим. На примере задач с линейной структурой по фазовым переменным можно наиболее отчетливо продемонстрировать одну из самых принципиальных идей всей теории. Речь идет о «скрытой выпуклости», всегда присутству-
310 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления ющей в задачах оптимального управления. Именно она в конечном счете дает возможность записать необходимое условие в виде «прин- «принципа максимума», т. е. в форме, характерной для задач выпуклого программирования. И если в предыдущем параграфе мы старались подчеркнуть связь задач оптимального управления с общей теорией гладких экстремальных задач, то здесь на первый план выдвигается их связь с выпуклым анализом. Отметим еще, что (как это и характерно для задач выпуклого про- программирования) необходимые условия экстремума почти смыкаются здесь с достаточными. Наконец, и это тоже важно с точки зрения выяв- выявления скрытой выпуклости, мы будем в этом параграфе рассматривать измеримые управления, а не только кусочно-непрерывные. 4.3.1. Редукция задачи оптимального управления, линейной по фазовым переменным, к задаче ляпуновского типа. Пусть А = = [?o>?i] ~~ фиксированный отрезок числовой прямой, ас А —> Rn*, г = 0, 1,..., т, и А: А —> ^?(Rn, Rn) — интегрируемые векторные и мат- матричная функции; Я — топологическое пространство, ff. А х Я —> R, г = 0, 1,... , га, и F(-, •): А х Я —> Rn — непрерывные функции; 7(н> 7н> г = 0, 1,... , га — элементы Rn*, q, г = 1,2,..., га, — числа. Экстремальная задача Jo(x(-),u(-)) = J (ao(t)x(t) + /o(t, u(t))) dt+ A i) -^ inf, A) i(t)x(t) + fi(t,u(t)))dt + 70Л) + 7H^(ti) $ D, в которую величины, связанные с фазовой траекторией х, входят линейно, называется задачей оптимального управления, линейной по фазовым переменным. Она, разумеется, является частным слу- случаем общей задачи оптимального управления из § 4.2. Однако здесь мы несколько расширим совокупность допустимых процессов. Обозначим через °Ы множество измеримых (в смысле определения п. 4.2.6) отображений и: А —> Я таких, что функции 11—> fi(t, u(t)) и 11—> —> F(t,u(t)) интегрируемы. Пара (х(-),и(-)) называется допустимым процессом, если х(-): А -^ Rn абсолютно непрерывная вектор-функ- вектор-функция (см. п. 2.1.8), и(-) е °11, x(t) = A(t)x(t) + F(t,u(t)) почти всюду и выполняются неравенства Ji(x(-),u(-)) ^ Q. Допусти- Допустимый процесс (х(-),и(-)) называется оптимальным, если существует такое г > 0, что для любого допустимого процесса (х(-),и(-)), удовле-
4.3. Задачи, линейные по фазовым переменным 311 творяющего условию \\х(-) — #(-)||с(д,нте) < ? выполнено неравенство Мы покажем сейчас, что линейная структура позволяет преобра- преобразовать задачу A) к такому виду, где х(-) и и(-) в некотором смысле разделены (и, в частности, отсутствует дифференциальная связь). Пусть О(-, •) — фундаментальная матрица (п. 2.5.4) решений одно- однородной линейной системы х = A(t)x. B) В соответствии с формулой A3) п. 2.5.4 t x(t) = U(t, to)x(to) + [ U(t, t)F(t, u(r)) dr. C) to Подставляя (З), преобразуем функционалы задачи A): t -.. u(t,to)x(to)+ \n(t,r)F(r,u(r))dr\ \dt+ to i, to)x(to) + [ U(U, r)F(r, u(r)) dr = to J и t и = [ \ai(t)U(tfr)F(rfu(r))drdt-\- [ fi{r,u{r)) dr+ to to to fi + < cti(t)?l(t, to) dt + 70^ - tl tl .tl J Q(ti, r)F(r, u(r)) ^r = J J J ai(t)Q(t, r) dt F(r, и(т)) + to t0 ^ r , и(т)) + ъМ*1, t)F(t, u(t)) , t0) dt + 70^ + ъМи, *o) to tl г
312 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления где Gi(r, и) = Pi(T)F(r, и) - Ь(т, и), E) А = 70г-Рг(*0), F) J ai(t)u(t,T)dt, G) г = О, 1,..., т. Теперь задача A) приобретает вид J0(x(-),u(-)) = - J G0(t,u(t)) dt + Pox(to) -+ inf, () G,(t,u(t)) dt + /3^(^o) $ <4. A Такую задачу мы будем называть задачей ляпуновского типа или просто ляпуновской задачей. 4.3.2. Теорема Ляпунова. В установлении связи между задача- задачами оптимального управления и выпуклого программирования теорема Ляпунова играет ключевую роль. Она будет сформулирована здесь для случая векторной функции р: R —> Rn и меры Лебега т на пря- прямой R. Незначительное усовершенствование доказательств позволяет распространить эту теорему на случай произвольного пространства с заданной в нем сг-алгеброй 6 и произвольной непрерывной (неато- (неатомической) конечной векторной мерой /i: & —> Rn. В приведенной ниже формулировке 6 — это сг-алгебра измеримых по Лебегу подмножеств в R, а ц(А) = \p(t)dt. А В отличие от других мест нашей книги, здесь и в следующем пунк- пункте нам придется использовать некоторые факты из функционального анализа и теории меры, которые, несмотря на их большое принципи- принципиальное значение, обычно не входят в основные университетские курсы. Начнем с определений. Термины «измеримость», «интегрируемость», «почти всюду» и т. п. далее понимаются в смысле Лебега (для изме- измеримости удобно пользоваться определением, приведенным в п. 4.2.6). Две функции называются эквивалентными, если они совпадают почти всюду. Определение 1. Пусть А — произвольный промежуток число- числовой прямой. Пространствами L\(A) и LOO(A) называются нормирован- нормированные пространства, элементами которых являются классы эквивалент- эквивалентных между собой функций х: А —> R, обладающих конечной нормой, которая задается равенствами: в пространстве L\(A): = \\x(t)\dt; A)
4.3. Задачи, линейные по фазовым переменным 313 в пространстве LOO(A): \\х(-)\\ = supvrai \x(t)\ = inf sup \x(t)\. B) д N(N)O Предложение 1. Пространства L\(A) и Loo(A) банаховы, причем L\(A) сепарабелъно. Пространство LOO(A) изометрически изоморфно сопряженному пространству L\(A)*, так что замкну- замкнутые шары в нем * -слабо компактны. Доказательство этих утверждений мы заменим следующими ссыл- ссылками: полнота и сепарабельность пространства L\(A) — [КФ, гл. VII, § 1] (существование счетного базиса у меры Лебега на бесконечном промежутке сразу следует из его существования на конечных отрезках, поскольку каждый такой промежуток представим в виде объединения счетного числа отрезков); компактность в *-слабой топологии замкну- замкнутых шаров в пространстве, сопряженном к сепарабельному [КФ, гл. IV, §3], изометрический изоморфизм между L\(A)* и L^A) (а, значит, и полнота последнего) [4, с. 314]. Определение 2. Пусть X — линейное пространство, А С X. Точка х множества А называется его крайней точкой, если х = ах\ + A — а)х2, 0 < а < 1, х\,Х2 Е А => х\ = х^. Упражнение 1. Докажите, что по крайней мере одна из точек х\, ..., хп является крайней для их выпуклой оболочки conv{xi,... ,xn}- Теорема Крейна-Мильмана. Компактное выпуклое под- подмножество локально выпуклого линейного топологического про- пространства X содержит по крайней мере одну крайнюю точку и совпадает с выпуклой замкнутой оболочкой своих крайних точек. Доказательство этой теоремы см. [4, с. 477]. Перейдем теперь к основной теореме этого пункта. Теорема А.А.Ляпунова. Если р: А —> R/\ p(-) = (р\(х х),... ,Рп(')) — интегрируемая векторная функция, то множество М= является выпуклым компактом в Rn. (Напомним, что 6 — это сг-алгебра множеств, измеримых по Лебегу.) Доказательство. А) Рассмотрим отображение Л: LOO(A) —> Rn, определяемое равенством dt = Оно линейно, и, кроме того, оно непрерывно относительно *-слабой топологии в Lqo (А) (по определению эта топология слабейшая из тех,
314 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления в которых все отображения ф(-) ь-> (ф(-),р(-)), р(-) G L\(A) непрерыв- непрерывны). Множество W = {<ф(-) е Loo(A) | 0 < фA) < 1,? e А} является замкнутым шаром в L^A) (радиуса 1/2 и с центром в точке ф(-), ф(Ь) = 1/2). Следовательно, оно выпукло и, согласно предло- предложению 1, компактно в *-слабой топологии. Поэтому его линейный и непрерывный образ AW также является выпуклым и компактным. Характеристическая функция любого множества A ? 6, очевидно, принадлежит W, а потому J p(t) dt = J ха(Ф@ dt = А(ха(-)) е AW, А А и, следовательно, М с AW'. Остается доказать, что М = AW'. Б) Пусть точка ? G AVK. Ее прообраз W^ = VK П Л-1(^) является пересечением выпуклого и компактного в *-слабой топологии множе- множества W и замкнутого в той же топологии (поскольку Л относитель- относительно нее непрерывно) выпуклого множества (аффинного многообразия) Л-1(^). Следовательно, W% выпукло и компактно и по теореме Крейна- Мильмана имеет крайнюю точку х(-) G W%. Если мы докажем, что х(-) является характеристической функцией некоторого множества А ? 6, то тогда ? = x(t)p(t) dt = p(t) dteM A A и теорема будет доказана. В) Если 0 ^ x(t) ^ 1 и х(-) не является характеристической функци- функцией, то для некоторого г > О множество В? = {t \ г ^ ж(?) ^ 1 — г} имеет положительную меру. Функция а ь-> m(a) = m[(to, а) П Бе] непрерывна и изменяется от 0 = га(?о) до т(В?) = m(t\) (m(B) — мера Лебега множества Б). Задав произвольно iV, выберем а&, fc = 1,... ,7V — 1 так, чтобы m(ak) = k/NB?. Этим определяется разбиение В? = В\ U ... U U Бдг множества В? на 7V попарно непересекающихся подмножеств В\ = (—оо, а\] П Б?,..., Bk = (cejfe-i, од] П В?,..., Бдг = (адг_1, оо) П Б? положительной меры. Положим теперь 0,
4.3. Задачи, линейные по фазовым переменным 315 При N > п однородная линейная система Pi(t)dt = O Вк имеет ненулевое решение (у\,... ,ун). Соответствующую функцию C) обозначим у(-). Если 0 < Л < гтахЦ^Ц, то и потому х(-) ± Ху(-) G W. При этом Л(ж(.) ± А?(-)) = Л(ж(.)) ± АЛ?(.) = ? ± Л J ?(ф(*) dt = ?. Следовательно, х(-) ± А^(-) G W^, и так как Л ^ 0, то #(•) — не крайняя точка. Таким образом, х(-) — характеристическая функция и теорема доказана. ¦ 4.3.3. Принцип Лагранжа для ляпуновских задач. В этом пункте А — фиксированный промежуток числовой прямой (конечный или бесконечный), Я — некоторое топологическое пространство. Лемма о суперпозиционной измеримости. Если функ- функция f: А х Я —> R непрерывна, а и: А —> Я измерима (в смысле определения п. 4.2.6), то и функция 11—> f(t,u(t)) измерима. Доказательство. Пусть Ап С А выбраны так, что т(А\1Мп) = 0 (т — мера Лебега) и ограничения и(-)\Ап могут V п ) быть продолжены до непрерывных функций на Ап. Тогда и функции t \->_f(t,u(t)), t e An, могут быть продолжены до непрерывных на Ап. ш Пусть теперь заданы непрерывные функции ff. А х Я —> R. Обо- Обозначим через °U совокупность измеримых отображений и: А —> —> Я, для которых суперпозиции ? ь-> fi(t,u(t)) не только измери- измеримы, но и интегрируемы на А, так что на °U определены функции А С другой стороны, пусть X — линейное пространство, функции gi. X —> R — выпуклые для г = 0, 1,..., шх и аффинные с конечными значениями для г = т' + 1,... ,m, Acl — выпуклое подмножество. Экстремальную задачу J /o(?, u(t)) dt + ро(ж) -^ inf,
316 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления ^ О, г = 1,... , га', /1Ч =0, i = m'+l,...,m9 A) х еА, и(-) е °К мы будем называть ляпуновской задачей. В качестве частного случая ляпуновская задача включает в себя стандартную задачу выпуклого программирования, изученную нами в п. 1.3.3 (надо положить га/ = = га и fa = 0), и мы увидим далее, что теорема Ляпунова позволяет распространить на рассматриваемую здесь более общую ситуацию рас- рассуждения, при помощи которых была доказана теорема Куна-Таккера. Функция <?{и{-), х, А, Ао) = ? Хг(Щи(-)) + 9i(x)) B) г=0 называется функцией Лагранжа задачи A). Теорема (принцип Лагранжа для ляпуновской за- задачи). Пусть функции j{. А х °Ы —> R непрерывны, gi: X —> R выпуклые для г = 0, 1,..., т! и аффинные конечные для г = т! + + 1,..., т, A d X выпукло. 1. Если пара (и(-),х) является решением задачи A), то найдутся вектор X = (Ai,...,Am) ? Rm* ц число Ао, яв равные одновременно нулю и такие, что: т ^ т ^ a) min J2 Аг/г(^, и) = J2 Аг(^> ^@) почти всюду, C) wGt/i=0 г=0 A^W = EAift(x) D) xGAi=0 г=0 (принцип минимума); б) Аг^О, г = 0, 1,...,тх E) (условие согласования знаков); в) М^ад-))+#(?)} = 0, j=l,...,m F) (условия дополняющей нежесткости). 2. Если (и(-), х) ? °И х А и существуют такие А ? Rm* и Ао > 0, выполняются условия C)-F), то (и(-),х) — решение задачи A). Доказательство. А) Лемма о выпуклости образа. Образ отображения и(-) н-> У1(и(-)) = (^о(^(*)' ••• »«^ш(^(*)) является выпук- выпуклым множеством в Rm+1. Доказательство. Пусть
4.3. Задачи, линейные по фазовым переменным 317 Функция р(-) = (ро(-),... ,Рт{'))'- R -^ Rm+1, определяемая равенства- равенствами 0, ? ^ А интегрируема, поскольку и^к\-) G ^2/. По теореме Ляпунова множество М= U\? = \p(t)dt, АебХ ^ а * выпукло, и так как этому множеству принадлежат точки О (А = 0) и С1 — С2 (^4. = А), то для любого а е [0, 1] существуют такие Аа е & (т. е. измеримые по Лебегу), что АаПА откуда АаПА \а = <1 + A-а)^2, г = 0, 1,...,ш. G) Положим теперь Тогда в силу G) &{(иа(-)) = а? + (I - a)g, так что ,°1(иа(-)) = а?} + A - а)^2. ¦ Б) Существование множителей Лагранжа. Как уже было сказано, наши рассуждения будут параллельны доказательству теоремы Куна-Таккера из п. 1.3.3. По условию пара (и(-),х) — решение задачи A). Не ограничивая общности, можно считать, что &о(и(-)) -\- до(х) = 0 (в противном случае можно вычесть из SFq -\- go эту константу). Докажем, что множество С = {а = (ао,...,ат) \3(п(-),х)е W х А, Щп(-)) + до(х) < ao,&i(u(-))+gi(x) < aif i= 1,...,т',^(п(-))+0г(ж) =аи г = т+ Iх,...,т} (8)
318 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления выпукло. Действительно, пусть ак = (а§,..., а^) ЕС, fc= 1,2, 0< < 1, (и^к\-),х^) — такие элементы из °ll x Д что =ak, г = mf + 1,..., га. По лемме о выпуклости образа существует функция uq(-) G ^ такая, что г = 0, 1,..., т. Кроме того, xq = Ох^ + A — #)жB) G А ввиду выпуклости А и для г = т' + 1,..., т, поскольку эти функции аффинные. Следователь- Следовательно, Далее, д$ — выпуклая функция, и потому + до(хв) = Аналогично доказывается, что ва) + A - в)а) ')) + 9зЫ < ва) + A - в)а), j = 1,..., т'. Но тогда из определения множества С видно, что 0ах + A — #)а2 G С, т. е. С выпукло. Полагая в (8) (п(-),х) = (и(-),х), получаем включение С D {а = (ао,..., аш) | ао > 0, а^ > 0, г = 1,... ,шх, а• = 0, г = т! + 1,... ,т}. (9) В частности, С непусто. Кроме того, 0 ^ С, так как в противном случае, согласно (8), Щп(-)) + до(х) < 0, ?7i(u(-)) + Л(ж) < О, г = 1,..., шх, ^(гх(-)) +0г(ж) =0, г = шх+ 1,...,ш,
4.3. Задачи, линейные по фазовым переменным 319 для некоторой пары (п(-),х) и, следовательно, (и(-),х) не является решением задачи A). Применяя конечномерную теорему отделимости (п. 1.3.3), находим такие Хг, г = 0, 1,...,га, не равные одновременно нулю, что для всех тп ^ a G С выполняется неравенство J2 ^iai ^ О- г=0 Поскольку (е,0,... ,0,aj = 1,0,...,0) G С, где Ц j ^ m' и «j = = 0 для г ф 0, j, то выполняется неравенство гХо + Aj ^ 0. Переходя к пределу при ? j 0, получаем Aj > 0. Точно так же Ао и, таким образом, верно E). При любом е > 0 (г,0, ...,0,0^ =^-(й(-))+#(?),0, е С => Хое + ^ ^ >0^А,-[^-(Й(.))+^(х)]^0. A0) Поскольку (и(-),х) — допустимая пара, Г 0, 1 < j < mf, . . 1 (И) j = m + 1,... ,га. Вместе с A0) и уже доказанными неравенствами Aj > 0, 1 < j < mx, это дает F). Далее, для любых е > 0, (м(-),ж) G ^хД согласно (8), Yl -)) + gi(x)) + гХ0 = г=0 0. Но, согласно F), A1), j ^ шх + 1 и сделанному выше предположе- предположению о ^о + ^о» $(и(-), х, А, Ао) = 0. Поэтому для функции Лагранжа B) выполнен принцип минимума тт^«),ж,А,Ао)=^(-),ж,А,Ао). A2) °11хА Если же Ао > 0, имеет место A2) и выполняются условия E) и F), то для всякой допустимой пары (и(-),х)
320 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления E) т> Ы&о№))+9о(х)) > ?>№(¦)) + <&(*)) = г=0 171 A2) = 5]А^(и(.))+^(ж))=^«),ж,А,А0) > г=0 m > <?(?(.),?, А, Ао) = Y,М<ЧЯ)) +9i@)) F=П) г=0 так что (г?(-),ж) — решение задачи A). В) Редукция к элементарной задаче. Легко видеть, что соотношение A2) эквивалентно одновременному выполнению соотно- соотношений D) и Р т г. = т-^ I J2^ifi(f' u(f))dt = I т 771 А^(и(.)). A3) г=0 Действительно, если выполняются D) и A3), то г=0 г=0 г=0 г=0 для всех u(-) G ?/ и ж G 4, т. е. имеет место A2). Если же, например, т ^ т ^ J2 \9i$) < S ^г9г{%)> Для некоторого ж G i, то г=0 г=0 г=0 г=0 г=0 г=0 так что A2) не может иметь места.
4.3. Задачи, линейные по фазовым переменным 321 Чтобы перейти теперь от D) и A3) к принципу минимума, т. е. к C) и D), нам нужно показать, что в A3) можно «внести min под знак интеграла», т. е. показать, что функция и(-) тогда и только тогда является решением вспомогательной задачи оптимального управ- управления т ]\ifi(t,u(-))dt ^mf, u(.)e % A4) г=0 r m J А —(Л когда имеет место соотношение C). Подобное утверждение уже было доказано нами в п. 3.1.4. Однако там предполагалось, что функция и(-) кусочно-непрерывна, а здесь она только измерима, так что нам придется воспользоваться более тонкими рассуждениями. Г) Элементарная задача с измеримыми управлени- управлениями. Лемма об условиях минимума в элементарной за- задаче оптимального управления. Пусть А — промежуток в И, Я — топологическое пространство, функция /: А х Я —> R непрерывна и °Ы — совокупность измеримых отображений и: А —> Я таких, что функции 11—> f(t,u(t)) интегрируемы на А. Для того чтобы и(-) ? Ш было решением задачи f(t,u(t))dt^inf, u(-)e % A5) А необходимо и достаточно, чтобы равенство f(t,u(t)) = min f(t, и) A6) uEii было верно почти всюду в А. Доказательство. «Достаточно». Согласно A6) f(t,u(t)) ^ ^ f(t,u(t)) почти всюду для любой и(-) ? °11, откуда ^(и(-)) ^ ^(и(-)). «Необходимо». Пусть и(-) — решение задачи A5). Поскольку и(-) измеримо, существуют (п. 4.2.6) измеримые множества Ап с А такие, что т(А\иАп) =0 и и\Ап продолжается до непрерывной на Ап функции. Назовем точку г ? Ап существенной, если т((т — 5, г + + 5) П Ап) > 0 для любого 5 > 0, и покажем, что равенство A6) имеет место во всех таких точках. В самом деле, если бы для некоторой существенной г ? Ап и неко- некоторого v ?Я выполнялось неравенство f(r,v) < f(r,u(r)), то ввиду непрерывности функций и(-)\Ап и t i—> f(t,v) такое же неравенство сохранилось бы и в некоторой (^-окрестности точки г в множестве Ап, т. е. /(?, г;) < /(?, u(t)), Vt ? (г - 5, т + 5) П Ап. 11 В. М. Алексеев и др.
322 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Функция u(t) = очевидно, принадлежит °U и 9{u(.)) - &{u(-)) = \ [f(t, v) - f(t, u(t))] dt < 0, (т-5,т+5)пАп поскольку f(t, v) < f(t, u(t)) и га((т - 5, г + 6) П Ап) > 0. Остается доказать, что множество несущественных точек имеет меру нуль. Если г G Ап несущественна, то по определению найдется такое 5Т, что т((т — 5т,т + 5Т) Г) Ап) =0. Сузив интервал, найдем такие рациональные (аг,/Зг), что ш((аг,/Зг) П Ап) =0. Множество всех интервалов с рациональными концами счетно, поэтому не более чем счетно и множество тех из них, которые имеют вид (аг,/Зг) для некоторой несущественной точки г G Ап. Пусть это интервалы 1\, /2, ... Тогда Ап П U/fc содержит все несущественные точки Ап к иш( Лг V к J к Поскольку множеств Ап не более чем счетное число, то объеди- объединение множеств несущественных точек каждого из них также имеет меру нуль. По доказанному A6) может нарушаться лишь на А \ UAn и в несущественных точках, т. е. оно верно почти всюду. Д) Завершение доказательства. Согласно В) и Г) для вы- выполнения условия A2) необходимо и достаточно, чтобы одновременно имели место C) и D). Заменив в последнем абзаце пункта Б) A2) на C), D), получаем все утверждения доказываемой теоремы. ¦ 4.3.4. Теорема двойственности. Обозначения в этом пункте те же, что и в предыдущем. Напомним, что понятие двойственно- двойственности для задач выпуклого программирования было введено в п. 3.3.2. Оно было связано с методом возмущений, т. е. с включением ин- индивидуальной экстремальной задачи в семейство задач того же ти- типа. Здесь мы поступим точно так же, ограничившись для простоты одними интегральными функционалами. Кроме того, мы предполо- предположим (и это будет существенно использовано в доказательстве), что А — это отрезок числовой прямой и топологическое пространство Я, в котором принимают значения различные управления и(-), сепа- рабельно, т. е. содержит счетное всюду плотное подмножество {г^п}. Например, в качестве Я можно взять любое подмножество в Rr, C(A,Rn), Cl(A,Rn), Li(A), но пространство Loo (А) (см. п. 4.3.2) уже несепарабельно. Упражнение 1. Докажите эти утверждения.
4.3. Задачи, линейные по фазовым переменным 323 Итак, рассмотрим ляпуновскую задачу А (г) Ш> Ф))dt < О, u(t) e Я, А г= 1,2,...,т. Фиксировав fa, включим ее в семейство &о(и(-)) -+ inf, &i(u(-)) + аг < 0. C(а)) Как и в п. 3.3.2, ^-функция семейства %{а) определяется равенством S(a) = Ы{,Щи(-)) \Щи(-))+щ4:0,и(-) е ЩаеПт. A) Аналогия между ляпуновскими задачами и задачами выпуклого про- программирования сохраняется и здесь и, хотя функции ?Т{ не являются выпуклыми, справедлива Лемма 1. Функция а \-^ S(a) выпукла. Доказательство. Согласно лемме из п. 4.3.3 множество im^= {? = (&,...,?m) | & = #;(«(•)).«(•) е Щ выпукло в Rm+1. Переписав A) в виде S(a) = infj^o | & + он < 0, ^ G im,^} и, полагая ^@ — ^г(Со» ••• Лт) — Сь мы обнаруживаем, что 5(а) явля- является значением задачи выпуклого программирования до@ -> inf, ^@ + а» < 0, ^ Эта последняя является частным случаем задачи, рассмотренной в п. 3.3.2 (отсутствуют ограничения типа равенства, в связи с чем У, Л и т. п. следует опустить), так что выпуклость S обеспечивается следствием 1 п. 3.3.2. Теоремы двойственности для ляпуновских задач. Пусть А — промежуток в R, Я — сепарабелъное топологическое пространство, функции fa: А х Я —> R, г = 0, 1,..., т, непрерывны, °U — совокупность измеримых отображений и: А —> Я таких, что функции 11—> fa(t,u(t)) интегрируемы на А. ?суш S-функция семейства ъ(а) непрерывна в точке а = О, то для любого a G int(domS') = sup Aa+ Ф(*,А)^ , B) А>0 V Ф(г, Л) = inf fo(t, и) + V \fi{t,и) ] . C)
324 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Доказательство. А) По лемме функция a i—> S(a) выпук- выпукла, а из непрерывности ее в одной точке вытекает (предложение 3 п. 2.6.2) непрерывность и равенство S(a) = (conv S)(a) для всех a G G int(domS'). По теореме Фенхеля-Моро (п. 2.6.3) convS = 5**, так что для тех же а S(a) = S**(a)= sup {Aa-S*(A)}. D) AeRm* Теперь вычислим S*(X). По определению 5*(A)=sup(Aa-5(a)) = a - inf [/0 (?,?/(?)) A = sup sup < Aa — /o(t, u(t)) dt> = +oo, A - inf J \fo(t, u(t)) г, u(t)) dt. Подставляя найденное выражение в D), мы видим, что равен- равенство B), а с ним и вся теорема, будут доказаны, если мы проверим, что inf г=1 dt = E) где Ф(^, А) определено равенством C). Б) Лемма 2. Пусть А — промежуток в R, Я — сепарабелъное топологическое пространство, функция f: А х Я —> R непрерывна, °Ы — совокупность измеримых отображений и: А —> Я таких, что функция t \-^ f(t,u(t)) интегрируема на А. Тогда функция ?>(*)= inf {/(*,«)} F) измерима на А, интеграл (p(t) dt (конечный или равный — oq) q/- А ществует и \ <p(t)dt= \ inf f(t,u)dt= inf f/(t,^(t))dt. G) J J и w(-)g^J A k ^ 1} — счетное всюду плотное (8) J A A Доказательство. Пусть подмножество в Я. Ввиду непрерывности / функции pn(t) =min f(t,vk
4.3. Задачи, линейные по фазовым переменным 325 непрерывны и при п —> оо <pn(t) I lim inf f(t,vk) = Mf(t,vk) = Mf(t,v) = <p(t). (9) Кроме того, существуют функции ип(-) ? °U такие, что (pn(t) = = f(t,un(t)). Действительно, при п = 1 это верно, и если (pn_\(t) = = f(t,un-\(t)), то ipn(t) = min = min[/(t, un-i(t)), f(t, vn)] = f(t, un(t)), где функция _, (+\ _ j un-i(t), если <pn-i(t) < f(t,vn), n[ } ~ 1 vn, если ipn-i(t) > f(t,vn), принадлежит °Ы (ввиду непрерывности функций неравенство (pn_\(t) > > f(t,vn) выполняется на открытом множестве, и потому ип(-) измери- измерима; интегрируемость функции t \-^ f(t,un(t)) = ipn(t) следует из непре- непрерывности ipn(t)). Будучи в силу (9) поточечным пределом непрерывных (а значит, и измеримых) функций, функция (р(-) измерима [КФ, с. 284]. Предста- Представив ее в виде разности <p(t) = f(t,v)-[ip(t)-f(t,v)} непрерывной и неотрицательной функций, мы убеждаемся, что инте- грал ip(t) dt существует, конечный или равный (—оо) (непрерывная А на отрезке А функция f(t,v) имеет конечный интеграл, а интеграл неотрицательной измеримой функции ip(t) — f(t,v) существует, но мо- может равняться +оо). Поскольку f(t,u(t)) > (p(t) для любой и(-) ? °U, неравенство inf \ f(t,u(t))dt^ \(p(t)dt A0) А А очевидно. Если левая часть равна —оо, то равенство G) верно. Если же она конечна, то ввиду неравенств i(t)dt> \ipn(t)dt= \f(t,un(t))dt> inf \f(t,u(t))dt последовательность интегралов (pn(t) dt ограничена. Применяя теоре- A му Б. Леви [КФ, гл. V, § 5] к неубывающей последовательности — <^п(-),
326 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления мы находим, что функция (р(-) интегрируема и [ ф) dt = lim [ (pn(t) dt > inf [ un(t) dt = J n^oo J n } A A A = inf f f(t, un(t)) dt > inf f f(t, u(t)) dt. n J u(-)e°H j A A Вместе с A0) это дает G).и По лемме 2 верно E), что, как мы видели, доказывает теорему. Упражнение 2. Сформулируйте и докажите теорему двойственности для ляпуновской задачи общего вида (см. A) в п. 4.33). 4.3.5. Принцип максимума для задач оптимального управле- управления, линейных по фазовым переменным. Вернемся к поставленной в п. 4.3.1 задаче dt+ ) -> inf, A) F(t,u(t)), u(t)eil, B) = \ [ai(t)x(t) + fi(t, u(t))] dt+ T-(r(A 1 A Теорема (принцип максимума для задач, линейных по фазовым переменным). Пусть функции а^. А —> Rn*, г = = О, I,... ,т, и А: А —> ^?(Rn,Rn) интегрируемы на отрезке А = = [to,ti] С R; Я — топологическое пространство; fii А х Я —> R, г = 0, 1,..., т, F: А х Я —> Rn — непрерывные функции, °Ы — сово- совокупность измеримых отображений и: А —> Я таких, что функции t ^ /г(^> ^@) и t ^ F(t, u(t)) интегрируемы. 1. ?суш (ж(•),?/(•)) — оптимальный процесс для задачи A)-C), то найдутся такие не равные одновременно нулю число Ао ^ 0, вектор А = (Аь ..., Аш) G Rm* и абсолютно непрерывная функция р: А -^ Ит*, что выполняются: а) уравнение Эйлер а-Лагранжа (сопряженное уравнение) г=0 б) условия трансверсальности Y^irik* Л = 0,1; E)
4.3. Задачи, линейные по фазовым переменным 327 в) принцип максимума >)=G(t,u(t)) F) vett почти всюду, где т G(t, v) = p(t)F(t, v)-J2 Ъ№>v)' G) г=0 r) условие согласования знаков Xi^O, i= l,...,m; (8) д) условия дополняющей нежесткости ^ 2. Если для допустимого процесса (х(-),и(-)) существуют такие Ло > О, Л G Rm* и абсолютно непрерывная р(-): А —> Rm*, что выполняются условия D)-(9), то (х(-),и(-)) — оптимальный процесс для задачи A)-C). Формально, условия D)-(9) здесь те же, что и соответствующие условия в п. 4.2.2 (читатель легко проведет необходимые преобразо- преобразования от одних условий к другим), но напомним, что содержание их несколько иное. Управление и(-) предполагается здесь всего лишь измеримым, а следовательно, необходимые условия D)-(9) из резуль- результатов § 4.2 не вытекают. Кроме того, вторая часть теоремы дает нам достаточные условия оптимальности, чего не было в §4.2. Доказательство. А) Редукция к ляпуновской зада- задаче. В п. 4.3.1 задача A)-C) уже была сведена к экстремальной задаче ляпуновского типа (см. (8) в п. 4.3.1), которая отличается от задач п. 4.3.3 возможностью присутствия в ограничениях неравенств >. Это, однако, не страшно, поскольку терминальные члены в (8) п. 4.3.1 линейны и, поменяв знаки там, где нужно, мы снова получим выпуклые функции. Перенумеруем индексы так, чтобы в C) ограничения типа равенства стояли в конце, а затем, как и в § 3.2, положим S{ = 1 для г = О и тех г, для которых в C) стоят знаки < и =, и ei = — 1 для тех г, для которых в C) стоит знак ^. Далее положим go(x(-)) = fox (to) Теперь задача (8) п. 4.3.1 приобретает стандартный ляпуновский вид Jo(x(-),u(-)) = -ео Go(t, u(t)) dt + до(х(-)) —> inf. А
328 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления ^ О, г = 1,..., га', = 0, г = га' + 1,..., га, где Gi определены формулами E) п. 4.3.1. Б) «Необходимо». Если (х(-),и(-)) — оптимальный процесс, то по теореме п. 4.3.3 существуют А^, неотрицательные при 0 ^ г ^ га', не равные одновременно нулю и такие, что п \ A1) почти всюду, ~~ ~~ A2) г=0 Х{} г=0 И _ _ \iJi(x(-),u(-))=0, l^i^m. A3) Легко видеть, что, полагая А^ = ?i\i, мы удовлетворим условию (8), а из A3) следует (9). Далее, положим г=0 где pi(-) определены формулами G) п. 4.3.1, откуда и из F) п. 4.3.1 MU) = -JH, Pi(*0)=70i-/?i. A5) Непосредственным дифференцированием (или используя формулу A4) п. 2.5.4) проверяем, что р(-) является решением уравнения D) и E) верно при к = 1. Из G), A4) и из E) п. 4.3.1 получаем G(t,v)=: г=0 т т г=0 г=0 после чего A1) превращается в F). Наконец, подставляя в A2) определения д^, получаем x(t0) = min (y^SiXiPij x.
4.4. Применение общей теории к простейшей задаче 329 т ^ т _ Такое равенство возможно, только если J^ Л^/3^ = ^2 s%XiPi — 0» после г=0 г=0 чего (E), /с = 0) следует из A4) и A5). В) «Достаточно». Пусть для допустимого процесса (х(-),и(-)) на- нашлись такие Ло > 0, А^, р(-), что выполняются условия D)-(9). Пусть, далее, Si — те же, что и раньше, А^ = SiXi и p%{-) по-прежнему опре- определены равенствами G) п. 4.3.1, так что имеет место A5). Функции т ^ р(-) = J2 ^гРг(') и Рг(') удовлетворяют уравнению D) и, согласно (E), г=0 _ к = 1), совпадают при t = t\. По теореме единственности p(t) = p(t) и, следовательно, г=0 т т И т т v^T о (l3 v^? / d \\ _ г=0 г=0 г=0 г=0 Из A6) и F) следует A1), из (9) следует A3), а (8) с учетом равенств А^ = eiXi означает, что А^> 0, г = 1,... ,ш. Кроме того, из A7) и из определения <^(-) вытекает, что г=0 г=0 Ki=0 / г=1 г=1 и потому A2) также имеет место^По теореме п. 4.3.3 условия A1)-A3) вместе с неравенствами Aq > 0, Aq > 0 достаточны для оптимальности § 4.4. Применение общей теории к простейшей задаче классического вариационного исчисления Общую теорию мы применяем здесь к простейшей задаче клас- классического вариационного исчисления, которой уделено такое большое место в учебной литературе. Подобным же образом можно получить необходимые и достаточные условия слабого экстремума и необхо-
330 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления димые условия сильного экстремума и в общей задаче Лагранжа. Это, однако, заняло бы слишком много места, не внеся почти ничего принципиально нового. Поэтому мы ограничились частным случаем, в котором можно довести исследование до конца и продемонстрировать взаимосвязь старой и новой теории. 4.4.1. Уравнение Эйлера. Условие Вейерштрасса. Условие Ле- жандра. Простейшей (векторной) задачей классического вариаци- вариационного исчисления мы называем (ср. п. 1.2.6) следующую экстремаль- экстремальную задачу: и \b(t,x(t),x(t))dt^exti, A) to x(to)=xo, x(ti)=xx. B) Здесь функция L: V —> R по крайней мере непрерывна в открытом множестве V С R x Rn x Rn; xq, x\, to и t\ фиксированы. Задача A), B) исследуется в двух вариантах. В первом из них х(-) принадлежит пространству C1([?o,?i],Rn) и локальный экстремум в этом случае называется слабым (ср. п. 1.4.1). Во втором х(-) принад- принадлежит пространству KCl([to,t\],~R,n) функций с кусочно-непрерывной производной, наделенному нормой ||ж(-)|| = sup |ж(?)|, и локальный экстремум в этом случае называется сильным. Упражнение 1. Проверьте, что пространство KCl([to,ti],Tln) нормиро- ванно, но не банахово (т. е. не является полным). В обоих вариантах х(-) называется допустимой, если ее расширен- расширенный график {(?, x(t), x(t)) \to^t^t\}cVn удовлетворяются краевые условия B). Множество допустимых функций х(-) будем обозначать Y. Вводимые здесь и далее обозначения и терминология сохраняются на протяжении всего этого параграфа. Для краткости задачу A), B) мы будем называть простейшей задачей, опуская остальные подроб- подробности. Упражнение 2. Докажите, что inf Ях(-)) = inf Ях(-)). Указание. Воспользуйтесь леммой о скруглении углов (п. 1.4.3). Если х(-) доставляет сильный экстремум в задаче A) и при этом х(-) непрерывна, то, очевидно, х(-) доставляет и слабый экстремум. Поэтому необходимые условия слабого экстремума являются (в случае непрерывности х(-)) необходимыми и для сильного экстремума. Неко- Некоторые из необходимых условий мы уже знаем. В § 1.4 элементарными средствами были выведены: уравнение Эйлера — необходимое условие слабого экстремума и (для п = 1) условие Вейерштрас- Вейерштрасса — необходимое условие сильного минимума. Посмотрим теперь
4.4. Применение общей теории к простейшей задаче 331 на простейшую задачу с общих позиций. С одной стороны, A), B) сводится к такой задаче Лагранжа: и J(x(-),u(-)) = [ L(t, x(t), u(t)) dt -> extr, C) to x = u, x(to) = xo, x(t\)=x\. Если предположить, что не только L, но и ее производные по х, и непрерывны в V, то к C) можно применить теорему Эйлера-Лагранжа §4.1. При этом слабая оптимальность процесса (х(-),и(-)) в задаче C) означает в точности то же самое, что слабая экстремальность х(-) в задаче A), B). Если х(-) доставляет слабый экстремум в задаче A), B), то по теореме Эйлера-Лагранжа существуют такие Ао и функция р(-) е l Если Ао = 0, то все множители Лагранжа оказываются нулями; поэто- поэтому можно положить Ао = 1. Исключая р(-), получаем систему уравне- уравнений Эйлера ^Lx(t) = Lx(t) D) (как всегда, здесь L±(t) = Lx(t,x(t),x(t)) и т. д.). С другой стороны, задачу C) (предполагая для определенности, что это задача на минимум; в задаче на максимум следует заменить L на —L) можно рассматривать как задачу оптимального управления с Я = Rn. Если предположить, что L и Lx непрерывны по совокупно- совокупности переменных, то можно применить к A), B) принцип максимума из §4.2. При этом оптимальность процесса (х(-),и(-)) означает, что x(-)eKCl([t0,U],Rn) доставляет в задаче A), B) сильный минимум. Из принципа максимума следует, что существуют Ао ^ 0 и кусочно- дифференцируемая функция р(-): [to,t\] —> Rn* такие, что t), E) min {X0L(t, x(t),u) - p(t)u} = A0L(t, x(t),x(t)) - p(t)x(t). F) ueRn Равенство Ао = 0 здесь невозможно, так как из E) Ао = 0 =>¦ p{t) = = const, причем p(t) ^ 0 (иначе все множители Лагранжа равны нулю). Но если Ао = 0 и р ф 0, то F) не может выполняться (нетривиальная линейная функция не имеет минимума на Rn). Таким образом, Ао ф О и можно считать, что Ао = 1.
332 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Условие F) можно переписать в субдифференциальной форме (t)Mt))- G) Если L дифференцируема также и по х, то из F) следует равенство pit) = Lx(t), и мы, с одной стороны, снова приходим к уравнению Эйлера D), а с другой — из F) получаем необходимое условие Вейер- штрасса Lit, x(t), и) - Lit, x{t),xit)) - L±{t, x{t), xit)){u - x{t)) > 0, (8) \/ueRn, vte Mi]. Введем в рассмотрение (ср. п. 1.4.4) Ш — функцию Вейерштрас- Вейерштрасса (латинское excessus — излишек) Щ, х, ?, и) = L(t, х, и) - L(t, х, 0 - Li(t, х, ?)(и - 0- (9) Тогда условие Вейерштрасса (8) можно записать в виде %(t,x(t),x(t),u)^0, Vw G Rn, Vte[to,ti]. A0) Если допустить, что не только L и Lx, но и Lxx непрерывна в V, то из (8) вытекает неравенство iiiW^O, te [to,t\]. (И) Условие A1) называется условием Лежандра. Итак, уравнение Эйлера является необходимым условием как слабо- слабого, так и сильного экстремума. Кроме того, из принципа максимума мы вывели еще два необходимых условия сильного минимума — условие Вейерштрасса и условие Лежандра (в следующем пункте мы увидим, что последнее должно выполняться и для слабого минимума). 4.4.2. Условия второго порядка для слабого экстремума. Усло- Условия Лежандра и Якоби. Лемма. Пусть функция L непрерывна в V, а, кроме того, в V су- существуют и непрерывны ее производные LXi, LXi, LXiXj, LXiXj, LXiXj. Если х(-) е Cl([to,t\],Hn) удовлетворяет уравнению Эйлера, то при \\h{-)\\c^ ^0 справедлива следующая асимптотическая формула: и \L {h(tLxx(t)h(t) + to 2hT(t)Lxx(t)h(t) + h(tLxx(t)h(t)} dt+ )l]), (i) Щ-) e Cl([t0,ti],n>n)> Ч*о) = Hti) = 0.
4.4. Применение общей теории к простейшей задаче 333 Доказательство. Как и в п. 2.4.2, окружив график х(-) ком- компактом, целиком содержащимся в V, и воспользовавшись затем рав- равномерной непрерывностью вторых производных функции L на нем для оценки остаточного члена в формуле Тейлора, получаем разложение L(t, x(t) + h(t),x(t) + h(t)) = = L(t)+Lx(t)h(t) + Lx(t)h(t)+ + \ {hT(t)Lxx(t)h(t) + 2hT(t)Lxx(t)h(t) + + hT(t)Lxx(t)h(t)} + e(*, h(.))[\4t)\2 + \Ш% B) где e(t\ h(-)) —> О равномерно на А при ||^(*)||с1 ~^ ®- Интегрируя это соотношение от to до t\, а затем еще, как всегда, интегрируя по частям линейный член с h(t) и учитывая уравнение Эйлера, получаем A).и Если х(-) доставляет слабый минимум в задаче A), B) п. 4.4.1, то, заменяя в A) h(-) на ah(-) и вычисляя при а [ 0 предел \\т[3(х{-) + + ah(-)) — J(x(-))]/a2, мы получаем, что квадратичный функционал + hT(t)Lxx(t)h(t)}dt^O, C) Щ-) e Cl([t0,ti],n>n)> Kto) = Kh) = 0. Это означает, что функция h(-) = 0 доставляет слабый минимум во вто- вторичной экстремальной задаче Q(/i(.))^inf, Л(*0) = Л(*1)=0. D) По лемме о скруглении углов (п. 1.4.3) нижние грани функционала Q в множествах допустимых функций из пространств Cl([to,t\],Hn) и KCl([to,t\],~Rn) совпадают. Поэтому h(-) = 0 доставляет также и сильный минимум в задаче D). (Заметим, что ввиду однородности Q локальные минимумы оказываются и глобальными и различие между слабым и сильным минимумами сводится к изменению запаса допусти- допустимых функций.) По доказанному в п. 4.4.1 для задачи D) должно выполняться условие Лежандра, которое, очевидно, имеет тот же самый вид Ьц(г)>0, VteMi], E) что и для A), B). Таким образом, условие Лежандра оказалось необ- необходимым не только для сильного минимума, как в п. 4.4.1, но и для слабого.
334 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Уравнение Эйлера для вторичной задачи D) jt [Lxx{t)h{t) + Lxx(t)h(t)] = Lxx(t)h(t) + Lxx(t)h(t), F) называется уравнением Якоби исходной задачи A), B) п. 4.4.1. Определение. Точка г называется сопряженной к точке to (от- (относительно функционала Q), если уравнение Якоби F) имеет решение h(-), для которого h(to) = h(r) = 0, но О Ьхх(т)Цт) ф 0. G) Теорема 1 (необходимые условия слабого экстре- экстремума в простейшей задаче). Пусть функция L удовлетворя- удовлетворяет условиям леммы. Если х(-) доставляет слабый минимум в задаче A), B) п. 4.4.1, то 1) х(-) удовлетворяет уравнению Эйлера (D) п. 4.4.1); 2) выполнено условие Лежандра E); 3) выполнено условие Якоби: в интервале (to,t\) нет точек, сопряженных с to; 4) выполняется неравенство C). В случае, когда х(-) доставляет слабый максимум, в C) и E) следует заменить знак ^ на ^. Доказательство. Утверждения 1), 2) и 4) мы уже доказа- доказали A) — в предыдущем пункте). Поэтому нужно доказать лишь 3). Предположим противное, и пусть точка г G (to,t\) — сопряженная к to, a h(-) — соответствующее решение уравнения Якоби: h(to) = h(r) = 0 и имеет место G). Положим \ 0, Тогда = j h(t)T[Lxx(t)h(t) + Lxx(t)h(t)} dt+ 'i(t)T[Lxx(t)t(t) + Lxx(t)h(t)}dt l) Обычно в учебниках по вариационному исчислению сопряженные точки определяют в предположении, что выполняется усиленное условие Лежандра L±±(t) > 0. При этом предположении Ьхх(т)Н(т) = 0 => h(r) = 0, и так как h(r) = 0, то по теореме единственности h(-) = 0. Поэтому условие G) эквива- эквивалентно нетривиальности h(-) и обычно заменяется этим предположением.
4.4. Применение общей теории к простейшей задаче 335 (здесь использовано, что h(t)TLxx(t)h(t) = h(t)TLxx(t)h(t)). Вспоми- Вспоминая, что ft_(-) удовлетворяет уравнению F), проинтегрируем (с учетом равенств h{to) = h(r) = 0) по частям в первом интеграле, после чего интегралы сократятся. Таким образом, Q(h(-)) = 0, а это означает, что h(-) доставляет (наряду с функцией h(-) = 0) сильный минимум в зада- задаче D). Снова применяем принцип максимума из §4.2. В соответствии с ним найдутся Ло ^ 0 и такая кусочно-дифференцируемая функция р(-): Mi] -> R"*, что p(t) = 2X0Lxx(t)h(t) + 2X0Lxx(t)h(t), min {AouT?^(t)u + 2X0h(t)TLxx(t)u - p(t)u} = = XohT(t)Lxx(t)h{t) + 2\0h{t)TLxx(t)h{t) - p(t)h(t). (9) Тем же рассуждением, что и выше, доказывается, что Ло ф 0, и мы можем считать, что Ло = 1/2. Из соотношений (9) следует, что A0) Но для t ^ г функция h(-) = 0, так что из A0) вытекает, что р(т + 0) = = 0. С другой стороны, р(т - 0) = Lxx(r]h(r - 0) = Lxx(r)h(r) ф 0 в силу G). Поэтому р — разрывна, но она в силу принципа максиму- максимума должна быть непрерывной. Противоречие доказывает выполнение условия Якоби.¦ Итак, мы установили, что все необходимые условия экстремума в простейшей задаче, которые обычно рассматриваются в курсах ва- вариационного исчисления: Эйлера, Лежандра, Якоби и Вейерштрасса — являются следствиями принципа максимума. Перейдем теперь к доста- достаточным условиям слабого экстремума. Теорема 2 (достаточные условия слабого экстре- экстремума в простейшей задаче). Пусть функция L удовлетворя- удовлетворяет условиям леммы, функция х(-) е Cl([to,t\],~Rn) и ее расширенный график {t,x(t),x(t)) \ t0 < t < U} С V. Если: 1) функция х(-) удовлетворяет уравнению Эйлера (D) п. 4.4.1); 2) удовлетворяются краевые условия x(to) = хо, x(t\) = х\; 3) выполнено усиленное условие Лежандра Lxx(t,x(t),x(t))>0, vte [t0,U}; (П) 4) выполнено усиленное условие Якоби: в полуинтервале (to,t\] нет точек, сопряженных с to, то х(-) доставляет строгий слабый минимум (при замене в A1) знака > на < — максимум) в простей- простейшей задаче A), B) п. 4.4.1. Доказательство этой теоремы будет дано в п. 4.4.5.
336 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления 4.4.3. Гамильтонов формализм. Теорема об интегральном ин- инварианте. В п. 4.1.1 мы уже упомянули, что уравнения Эйлера- Лагранжа вместе с уравнениями дифференциальной связи можно при- привести к гамилыпоновой (или канонической) системе вида x = Mp(t,x,p), p = -Mx(t,x,p), A) где функция Ж называется гамильтонианом (или функцией Гамиль- Гамильтона) исходной задачи. Здесь мы рассмотрим это преобразование более подробно, оставаясь в рамках простейшей задачи A), B) п. 4.4.1. Переход от уравнения Эйлера этой задачи (D) п. 4.4.1) к канонической системе A) осуществляется при помощи преобразования Лежандра. Им мы сейчас и займемся. Определение 1. Пусть функция /: v —> R принадлежит классу С1 (г?) в открытом множестве v нормированного пространства X и ее производная взаимно однозначно отображает v на d = {р \ р = /'(?), ?, Е G v} С X*; S: d —> v — обратное к V отображение. Функция h: d —> R, определяемая равенством h(p) = (p,S(p))-l(S(p)), B) называется классическим преобразованием Лежандра функции /. Предложение 1. Пусть функция I: v -^ R принадлежит клас- классу C2(v) в открытом выпуклом множестве v нормированного про- пространства X. Если I" положительно определена, т. е. d2l^v) = l"(Ohv}>0, VUv, VryeX, 77^0, C) то преобразование Лежандра h(-) функции /(•) определено и совпа- совпадает в d с преобразованием Юнга-Фенхеля (п. 2.6.3) функции \ +оо, ?<?v, W которая выпукла. _ Доказательство. Выпуклость / доказана в п. 2.6.1 (пример 2), взаимная однозначность отображения ? ь-> /х(^) доказывается аналогич- аналогично пункту Б) доказательства предложения 2 ниже. По определению сопряженной функции (п. 2.6.3) Т*(р) = suP{(p,o -1@} = -шШ) - (р,0}. Если р е d, то pj= l'(?) = /'(^) для некоторого ^ G v. Следовательно, О = A'@ — р) 6 д[1(-) — (р, -}]@> откуда ? — точка минимума функции Поскольку р = /'(?), то ? = S(p) и по определению 1*(р) = Вспоминая неравенство Юнга (п. 2.6.3), получаем
4.4. Применение общей теории к простейшей задаче 337 Следствие \. В условиях предложения 1 W + h(p)>(p,O, Vped, V?ev. E) Чтобы получить из лагранжиана L(t,x,x) простейшей задачи ее га- гамильтониан Ж(г,х,р), нужно произвести преобразование Лежандра по аргументу х. Таким образом, Ь, х,р) = рх — L(t, х, х), F) где х нужно исключить, используя соотношение p = Li(t,x,x), G) так что формулой F) Ж определено корректно, если отображение х \-^ Lx(t,x,x) взаимно однозначно. (В формулах F) и G) х выступает как самостоятельный аргумент; чтобы не путать его с dx/dt, мы будем далее обозначать х = ?, хотя для соответствующих производных L сохраним обозначения Lx, dL/dxi и т. д.). Предложение 2. Пусть функция (?,х,?) \-^ L(t,x,^) принадле- принадлежит классу Cr(V), г ^ 2 в открытом множестве V С R x Rn x Rn. 1) Если: а) вторая производная Ь%х в V не вырождается, т. е. б) отображение Р, определяемое равенством P(t, x, ?) = = (t, х, Lx(t, х, ^)) взаимно однозначно отображает V на D с R х х Rn х Rn*, то D открыто, Р~х е Cr~\D) и функция Ж: D -^ R, определяемая равенствами F) и G), принадлежит классу Cr(D). 2) Если при любых (t,x) сечение VtfX = {?> \ (t,x,?) ? V} вы- выпукло и при любых (?,#,?) ? V матрица Lxx(t,x^) положительно определена, то условия а) и б) выполняются и заключение п. 1) справедливо. Доказательство. А) Обратное к Р отображение, существующее согласно б), очевидно, имеет вид (t,x,p) i—> (t,x, S(t,x,p)), так что p = Li(t,x,Z)&? = S(t,x,p). (8) Поскольку L eCr(V), r > 2 отображение Р ? Cr~\V) С С1^). Его матрица Якоби имеет вид и ее определитель, равный &etLxx, отличен от нуля согласно а). Пусть (?о,?о,ро) = ^(^о>^о>^о) — любая точка из D. По теореме об обратном отображении существует окрестность U Э (?о>#о>?о)> образ которой P(U) С D является окрестностью (?о,#о,ро)- Следовательно,
338 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления D открыто. По той же теореме Р~х (которое определено однознач- однозначно) совпадает на P(U) с отображением класса С1. Поскольку точка (?о,#о,ро) ^ ^ ~ лю^ая' Р~Х ^ Cl(D). Далее, из (8) видно, что, как неявная функция, E(t,x,p) определяется уравнением F(t,x,p, ?) = р — — Lx(t,x,?) = 0, и так как оно образовано функциями класса Сг~1, то S, а вместе с ней и Р~х принадлежит классу Cr~x(D) (см. в п. 2.3.4 замечание после теоремы о неявной функции). Из F), G) и (8) выводим тождество ,р) = p5(t,x,p) -L(t,x,5(t,x,p)). (9) Дифференцируя его, получаем Жг = pEt - Lt- L^t = \p- Lx(t, x, H)]Ht -Lt = = -Lt(t,x,S(t,x,p)), A0) Жх =pEx - LX-LXEX = -Lx(t,x,5(t,x,p)), A1) Жр = H +pSp - LXEP = Z(t,x,p). A2) Из формул A0)—A2) видно, что первые производные функции Ж являются суперпозициями функций класса Сг~1, следовательно, сами принадлежат этому классу. Поэтому Ж'е Cr(D). Б) Если матрица Lxx положительно определена, то по критерию Сильвестра (см. [7], с. 181-182) detLxx > 0, так что верно а). Пусть сечения VtjX выпуклы. Тогда для любой пары точек (?,#,?&) Е V, к = = 1,2, точки (?, ж, a?i + A — a)^) ? V, а е [0, 1]. Обозначив pk = = Lx(t,x,?k)> имеем pi-p2 = Lx(t, x,?i)- Lx(t, x, ^) = l = —Lx(t,x,a^ + (\-a)&)da = о l = J Lxx(t, x, aft + A - a)^2)F - 6) da. о Если ?i t^ ^2, но P(t,x,?\) = (t,x,p\) = (t,x,p2) = P(t,x,^), то pi = 0= (pi -p2,6 -6) =5^ г=1 + A - aN)F, - ЫF; - 6i) da > 0,
4.4. Применение общей теории к простейшей задаче 339 так как по условию подынтегральная функция положительна {L±± положительно определена). Противоречие показывает, что р\ = р^ => => ?i = &> т- е. верно б). ¦ Вспоминая следствие 1, получаем Следствие 2. В условиях второй части предложения 2 для любых (t,x,?) ? V, (t,x,p) ? D выполняется неравенство Перейдем теперь к связи между уравнением Эйлера ^Li(t,x,x)=Lx(t,x,x) A3) и системой Гамильтона A). Называя далее х: А —> Rn решением урав- уравнения A3) (или пару (ж,_р): А —> Rn x Rn* — решением системы A)), мы подразумеваем, не оговаривая этого особо, что (t,x(t),x(t)) ? V при всех t ? А (соответственно (t,x(t),p(t)) ? D). Для краткости решение ж: А —> Rn уравнения Эйлера A3), а также его график {(t,x(t)) \ t ? ? А} мы будем называть экстремалью, а решение (х,р): А —> Rn x х Rn* системы Гамильтона A) и его график {(t,x(t),p(t)) | t ? А} — канонической экстремалью (из контекста всегда ясно, идет ли речь о функциях или об их графиках). Предложение 3. Пусть функция L ? С2(V) удовлетворяет условиям а) и б) предложения 2. Пара (х(-),р(-)) тогда и только тогда является канонической экстремалью, когда х(-) — экстремаль и p(t)=Li(t,x(t),x(t)). A4) Доказательство. А) Пусть х(-) — экстремаль. Если р(-) опре- определено равенством A4), то, согласно (8), x(t) = E(t,x(t),p(t)). Теперь первое из уравнений A) следует из A2), а второе — из A1) и A3). Б) Пусть (#(•),?>(•)) — каноническая экстремаль. Тогда из A2), (8) и первого из уравнений A) следует A4), а тогда второе из уравне- уравнений A) превращается в A3) согласно A1).и Замечание. Предположение L ? С2(V) является здесь более сильным, чем это действительно необходимо: как и в п. 4.4.2, достаточ- достаточно было бы требовать существование и непрерывность первых и вторых производных только по Xi и Xj. В справедливости этого замечания читатель может убедиться сам, внеся необходимые изменения в форму- формулировки теорем о неявной функции и об обратной функции из п. 2.3.4. Гамильтоновы системы A) обладают многими замечательными свойствами (см., например, [1]). Мы ограничимся только одним из них, имеющим отношение к выводу достаточных условий экстремума. Теорема об интегральном инварианте. Пусть функция Ж принадлежит классу С2 в открытом множестве DcRx Rn x
340 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления х Rn*, дифференциальная форма uj определяется в D равенством ио = pdx — Жйг = \. Pi dxi — Ж(Ь, х, р) dt, г=\ A5) Г/с = {(tk(^),Xk(a),pk(a)) | а < а < Ъ}, к = 0, 1 — два кусочно- гладких замкнутых контура в D (так что tk(ct) = tk(b), Xk(ct) = = Xk(b), р/с (a) =Pk(b)). Если Г\ получается из Т% сдвигом по каноническим экстрема- экстремалям, т.е. если для каждого а точки SPq(ol) = (to(a),xo(a),po(a)) и SP\{a) = (t\(a),x\(a),p\(a)) лежат на одной канонической экстре- экстремали, то ф и = ф и. A6) Го Г! Доказательство. А) Согласно классической теореме о диф- ференцируемости решений по начальным условиям (п. 2.5.7) и тео- теореме о суперпозиции (п. 2.2.2) решение задачи Коши для систе- системы A) с начальными условиями (to(a), хо(а),ро(а)) — обозначим это решение (x(t,a),p(t,a)) — будет кусочно-непрерывно дифферен- дифференцируемо по а и непрерывно дифференцируемо по t. Отображение Рис. 38 a: {(t,a) \ а < а < b,t e [to(a),ti(a)]} -^ D (при t\(a) < to(a) на- надо здесь написать [t\(a),to(a)]), определяемое равенством a(t,a) = = (?, x(t, a),p(t, а)), задает в D двумерную поверхность Е (рис.38). Ориентировав Е надлежащим образом, будем иметь <9Е = Fi — Го (две дуги, отвечающие а = а и а = Ь, геометрически совпадают, но име- имеют противоположную ориентацию, так что интегралы по этим дугам
4.4. Применение общей теории к простейшей задаче 341 сокращаются). Согласно формуле Стокса 6*1 (а) |w-|w= \ со = \ dco = dco[at, aa] dtda Г1 Го as S a t0 (а) и равенство A6) будет доказано, если мы проверим, что dco[at,o-a] = 0. Б) Дифференцируя форму A5), получаем dco = \. dpi Л < г=1 iftdt- п ¦Е г=1 (ЖХг dx Л dxi - Adt = Л dt - JTP. dpi Л dt] A7) г=1 (напомним, что при внешнем умножении dt Л dt = 0). Если ? = (?г,?ж,?р) и ту = (r]t,r]x,r]p) — два касательных вектора, то из A7) получим: г=1 U 6 г 1 j Поэтому dco[at,o-a] = - г=1 0 -ЖХъ Pu(t,a) =0, поскольку a(t,a) = (x(t, a),p(t, а)) по аргументу t является решением системы A), а значит, первая и вторая строки определителя совпада- совпадают. ¦ В связи с равенством A6) дифференциальную форму A5) называют интегральным инвариантом Пуанкаре-Картана. Определение 2. Множество А с D называется лежандровым, если г <Ь о; = 0 A8) 7 для любого кусочно-гладкого замкнутого контура j с А. Другими словами, ограничение со \ А — замкнутая форма. (Понятие кусочной гладкости нуждается здесь в уточнении. Мы бу- будем предполагать, что А является образом открытого множества G С С Ик при отображении (р: G —> D класса Cl(G), и 7 есть образ при этом отображении обычного кусочно-гладкого замкнутого конту- контура в G.)
342 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Следующие три примера лежандровых множеств играют далее су- существенную роль. 1) Фиксируем некоторую точку (to,?o>Po) ^ ^ и РассмотРим семей- семейство канонических экстремалей {(x(t,X),p(t,X)) \ a < t < /3} с началь- начальными условиями x(to,\)=xo, p(to,A)=A. A9) Множество Е = {(t,x,p) | x = x(t,\),p = p(t,\),\po-\\ <?, a<t<C} — искомое; г > 0 и интервал (а, C) Э to подбираются так, чтобы Е С D. Действительно, как было сказано выше, замкнутый кусочно-глад- кусочно-гладкий контур 7 С Е — это образ кусочно-гладкого контура Г = {(t(s), A(s)) | а < s < b, t(a) = t(b), X(a) = А(Ь)} С С (а,/?) х (ро-е,ро + е) при отображении (?, А) ь-> (t,x(t, X),p(t, А)). Спроектировав Г на плос- плоскость ? = to, получим контур Го = {(to, A(s)) | a ^ 5 ^ Ь,Х(а) = А(Ь)}, образ которого То = {(to,x(to,AE)),p(to,AE)) | а < 5 < Ъ} = = {(to,xo,\(s)) \a^s^b} B0) в силу A9). Поскольку 7о получается из 7 сдвигом по каноническим экстремалям, то по теореме об интегральном инварианте ct и = ct p dx — Mdt = 0, J J ибо на 7о в силу B0) dx = 0, dt = 0. Поскольку A8) верно для любого 7 С Е, это множество лежандрово. 2) Пусть в задаче A), B) х(-) — числовая функция, и пусть задано семейство экстремалей х(-,Х): (а,C) \-^ R, A G (а\,C\), причем #(-,-) Е Множество Е = {(t,x,p) | ж = x(t, A), p = p(t,X) = = La;(t,x(t,X),x(t,X)), t е (а,/3), А е (а — искомое. Действительно, пусть 7, То, Г и Го определены, как выше. Тогда ъ dx= L(t0, A(s))|| (*o, AE))AXE) ds. B1) 7о 7о а
4.4. Применение общей теории к простейшей задаче 343 Обозначив через Ф(А) первообразную функции Л i—> p(to, X)x\(to, А), продолжаем равенства B1): b uj = 7 s=b = 0, =a так как Л(а) = \(b) (контур замкнут). 3) Предложение 4. Пусть в открытом множестве GcRx х Rn задана функция р: G —> Rn*, p = (рь... ,рп), график которой Е = {(?, ж,р(?, ж)) | (?, ж) G С} С D. Для того чтобы Е было лежан- дровым множеством: а) предполагая, что р непрерывна, необходимо и достаточно, чтобы существовала функция S e CX(G) такая, что б) предполагая, что р е Cl(G), необходимо, а в односвязной обла- области G и достаточно, чтобы в каждой точке (t, x)gG выполнялись соотношения я - я ' B4) dx/c dxi dpi дЖ A <9JT <9pfc 7 1 —— = > —, i,k=\,...,n. k= 1 Доказательство. Подставляя р = p(t,x) в A5), получаем форму uj = p(t, x) dx — , Лежандровость множества Е означает, что ф си = 0 для любого г Г с G. Согласно классической теореме из анализа это равносильно точности uj, т. е. существованию такой S, что uj = dS. Отсюда вытека- вытекает а). Если р е Cl(G), to uj e Cl(G) и duo = d(dS) = 0, что эквивалент- эквивалентно B4). Достаточность этого условия при односвязности G следует из той же классической теоремы, что и а).и Уравнение B3) называется уравнением Гамильтона-Якоби. Если нам известно некоторое его решение в области G, то B2) определяет функцию с лежандровым графиком. 4.4.4. Достаточные условия абсолютного экстремума в про- простейшей задаче. Рассмотрим снова простейшую задачу классического
344 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления вариационного исчисления и J(x(-))= lb(t,x,x)dt^exti, A) to x(to)=xo, x(ti)=xx. B) Будет предполагаться, что лагранжиан L принадлежит классу С2 в открытом множестве V С R x Rn x Rn. Допустимыми для задачи A), B) будем считать функции х(-) ? KCl([to,t\],Hn) с кусочно-непрерывной производной, расширенный график которых {(t,x(t),x(t)) | to < t < t\} С V. Для определенности все рассуждения будут проведены для случая минимума; необходимые изменения в формулировках в случае максимума читатель легко произведет, заменив L на —L. В ппх4.4.1 и 4.4.2 мы уже видели, что выполнение условия Ле- жандра Lxx(t) = Lxx(t,x(t),x(t)) ^ 0 необходимо для того, чтобы до- допустимая функция х(-) доставляла минимум в задаче A), B). С другой стороны, усиленное условие Лежандра LXx(t) > 0 является составной частью достаточных условий минимума. Из него следует, в свою оче- очередь, выпуклость функции х \-^ L(t, х, х) вблизи точек (t,x(t),x(t)), и это наводит на мысль, что выпуклость лагранжиана L по х во всей области определения должна входить в достаточные условия абсолют- абсолютного минимума. Теорема Боголюбова (см. п. 1.4.3) подтверждает это соображение. Поэтому мы предположим, что Lxx(t,x,?)>0, V(t,x,?)?V C) и что для любых (?, х) сечение Vt,x = {?\(t,x,Z)eV} выпукло. D) Из предложения 1 п. 4.4.3 вытекает тогда, что функция выпукла по ^. В соответствии с предложением 2 п. 4.4.3 условия C) и D) обеспе- обеспечивают корректное определение гамильтониана Ж'е С2 {ГУ) соотноше- соотношениями ЖЬ, х,р)=рх — L(t, х, х), /^ч из которых надо исключить х. По следствию 2 того же пункта L(t,x,Z)+Wt,x,p)>pt, \/(t,x,?)?V, 4{t,x,p)eD.
4.4. Применение общей теории к простейшей задаче 345 Наконец, мы снова будем иметь дело с дифференциальной формой Пуанкаре-Картана u=pdx-M(t,x,p)dt. (8) Теорема 1 (достаточные условия минимума). Я//шь L принадлежит классу С2 в открытом множестве V С R x Rn x х Rn и выполняются условия C) и D). Пусть, далее, D определено так же, как в предложении 2 п. 4.4.3, и G — открытое подмноже- подмножество в R х Rn. Если: 1) х(-): [to,t\] —> Rn — допустимая экстремаль задачи A), B) и ее график T = {(t,x(t) 2) существует функция р: G —> Rn* класса CX(G), график кото- которой Е = {(t,x,p(t,x)) | (t,x) e G} С D и является лежандровым множеством; 3) p(t) d= p(t, x(t)) = Li(t, x(t), x(t)); mo L(t, x(t), x(t)) dt > [ L(t, x(t),x(t)) dt (9) to t0 для любой допустимой x(-): [to,t\] -^ Rn. удовлетворяющей гранич- граничным условиям B) и такой, что ее график Замечание. Из предложения 3 п. 4.4.3 вытекает, что произ- производная x(t) = Jffp(t,x(t),p(t)) непрерывна вместе с x(t) и p(t) = = p(t,x(t)). Поэтому х(-) непрерывно дифференцируема, хотя допу- допустимыми мы считаем все кусочно-дифференцируемые кривые. Это об- обстоятельство не ограничивает применимости теоремы. Действитель- Действительно, в п. 4.4.1 было показано, что существование непрерывной (и даже кусочно-дифференцируемой) функции р(-) такой, что p(t) = = Lx(t,x(t),x(t)) является необходимым условием (сильного) миниму- минимума, вытекающим из принципа максимума. При условиях C) и D) это, как мы видим, означает, что х(-) должна быть непрерывной. Доказательство. Обозначим p(t) = p(t,x(t)) и рассмотрим кри- кривые С E. = {(t,x(t),p(t)) Поскольку x(ti) = x(ti), i = 0, 1, и, следовательно, р(и) = p(U,x(ti)) = = p(U,x(ti)) =p(U), концы этих кривых совпадают и можно рассмот- рассмотреть замкнутый контур 7 — 7 с ?> который получается, если сначала
346 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления пройти от (to,x(to),p(to)) до (t\,x(t\),p(t\)) вдоль 7» а затем обратно вдоль 7- Ввиду лежандровости ? 0= | и= \и- \и. A0) 7-7 7 7 Используя неравенство G), получаем и \pdx-Mdt = \{p(t)x(t) - M(t,x(t),p(t))} dt ш= 7 7 ^o < [ L(t, x(t), x(t)) dt = J(x(-)), A1) to причем равенство здесь возможно, только если т. е. (снова используя G)), если p(t)x(t) - J?{t,x(t),p(t)) = max {px(t) - {p\(t,x(t),p)eD} По теореме Ферма x(t)=Mp(t,x(t),p(t)). A2) Поскольку график р лежандров, должны выполняться равен- равенства B4) п. 4.4.3, откуда с учетом A2) dpi(t) d , , чч dt dt' dt \ dxi дрк = -jeXi(t,x{t),p(t)). A3) Согласно A2) и A3) (#(•),p(-)) — каноническая экстремаль. Ho (x(to),p(to)) = (х(^о),Р^(^о))» и так как (^(')'Р(')) тоже является канонической экстремалью (предложение 3 п. 4.4.3), то по теореме единственности x(t) = x(t), p(t) = p(t). Итак, из A1) L= \ L(t,x(t),x(t)) dt = J( 7 to
4.4. Применение общей теории к простейшей задаче 347 а для остальных допустимых х(-), графики которых лежат в G и кото- которые удовлетворяют условиям B) Ввиду A0) получаем «/(#(•)) > J(x(-)).m Следствие. Если в условиях теоремы G совпадает с проекцией D на R х Rn = {(t,x)}, то х(-) доставляет строгий абсолютный минимум в задаче A), B). Часть условий только что доказанной теоремы в курсах вариа- вариационного исчисления обычно представляют в несколько иной форме, связанной с понятием поля экстремалей. Определение. Пусть Л и G — открытые множества в Rn и R х Rn соответственно. Семейство функций {#(-, A): [?o(A),?i(A)] —> —> Rn | A G Л} образует поле экстремалей, покрывающее G, если: 1) х(-,Х) является экстремалью (решением уравнения Эйлера) за- задачи A), B) для любого A G Л; 2) отображение (?, A) i—> (t,x(t, А)) взаимно однозначно и его образ {(t,x) \x = x(t,X),to(X) ^t^U(X), AgA}dG; 3) функция p: G —> Rn*, определяемая равенствами p(t,x)=Li(t,x(t,\),x(t,\)), (t,x) = (t,x(t,A)), принадлежит классу Cl(G) и имеет лежандров график. Функция и: G -^ Rn, определяемая равенствами u(t,x) =x(t,\), (t,x) = (t,x(t,\)), A5) называется функцией наклона поля. Экстремаль х(-): [to,t\] -^ Rn включается в поле х(-, •), если ее график содержится в G и ж(?) = = x(t, А) для некоторого А е Л. Подставляя A4) и A5) в (8) и, вспоминая определение лежандрова множества (п. 4.4.3), мы можем условие 3) переформулировать еще и так: 3х) В области G интеграл (*ьяя) {Lx(t, х, u(t, x)) dx— (to,xo) - [Lx(t, x, u(t, x))u(t, x) - L(t, x, u(t, x))]}dt A6) не зависит от пути интегрирования между точками (?о>#о) и (t\,x\) (согласно теореме классического анализа последнее равносильно тому, что интеграл по замкнутому контуру равен нулю). Интеграл A6) называется инвариантным интегралом Гильберта.
348 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Теорема Iх. Пусть функция L удовлетворяет тем же услови- условиям, что и в теореме 1, и пусть х(-): [to,t\] —> Rn — допустимая экстремаль, график которой содержится в G. Если х(-) может быть включена в поле экстремалей, покрыва- покрывающее G, то х(-) доставляет функционалу A) минимум в классе допустимых функций, удовлетворяющих условиям B) и таких, что их графики содержатся в G. Читатели легко убедятся, что это всего лишь переформулировка теоремы 1. Особенно удобна она при п = 1, так как в этом случае усло- условие 3) приведенного выше определения следует из 1) и 2) (см. второй из примеров лежандровых множеств в п. 4.4.3). Этим замечанием мож- можно пользоваться при решении многих задач. 4.4.5. Сопряженные точки. Достаточные условия сильного и слабого экстремума. В этом пункте мы по-прежнему будем предпо- предполагать, что L ? C2(V)\ x(-) ? Cl([to,t\],Tln) — допустимая экстремаль задачи A), B) п. 4.4.4, вдоль которой выполняется усиленное условие Лежандра Lii(t,x(t),x(t))>0, We Mi]. A) По непрерывности матрица L±x остается положительно опре- определенной в некоторой окрестности V расширенного графика {(t,x(t),x(t)^ | to ^ t ^ t\}. Окрестность V выберем так, чтобы ее сечения VtfX = {?> I (t,x,?) ? V} были выпуклы. Тогда выполняются условия предложения 2 п. 4.4.3 и соответственно мы можем определить область DcRx Rn x Rn* и гамильтониан Ж: D —> R класса С2. Правые части канонической системы х = Жр(г,х,р), р = -Жх(г,х,р) B) непрерывно дифференцируемы в D. Каноническую экстремаль (х(-),р(-)), отвечающую экстремали х(-), а следовательно, и самое х(-) можно продолжить на некоторый интервал, содержащий отрезок [to,ti]. После этого, сузив, если нужно, V, мы можем считать, что V имеет вид V = {(t,x,?) | \x-x(t)\ <г, \?-x(t)\ <г, t0-e <t <tx+e}. Пусть (to,xo,po) = (to,x(to),Lx(to,x(to),x(to))). Построим семей- семейство канонических экстремалей {(#(•, А),р(-,А))|А—_ро| < ^}' определя- определяемых начальными условиями x(to,\) = xo, p(to,A)=A C) (ср. первый пример лежандрова множества в п. 4.4.3). При достаточно малом 5 экстремали этого семейства вместе с (х(-),р(-)) = (х(-,ро),р(х х,р0)) содержатся в D при t ? [to,t\]', функции х(-,-), р{'г), очевидно, непрерывно дифференцируемы (п. 2.5.7).
4.4. Применение общей теории к простейшей задаче 349 Предложение 1. Для того чтобы точка г G (to,t\] была со- сопряженной к to, необходимо и достаточно, чтобы det дх(т, А) дХ = 0. \=ъ D) Доказательство. А) По теореме п. 2.5.7 совокупность произ- производных решений системы B) по начальным данным при Л = ро образует фундаментальную матрицу решений соответствующей системы уравне- уравнений в вариациях ^ ^ ^ ^ \^) Интересующие нас производные дх/dXi, dp/dXi, расположенные в столбец, составляют половину (п из 2п) столбцов этой матрицы и в соответствии с условиями C) dx/dXi др/дХг t=to F) Равенство D) эквивалентно существованию такого ненулевого вектора с е R™, что „ . dx y^ dx Обозначим г=1 Будучи линейной комбинацией столбцов фундаментальной матрицы, это тоже решение системы E), причем в силу F) t;(to) = 0, rj(to) =c^ 7^ 0. Кроме того, ?(т) = 0. Итак, равенство D) эквивалентно существованию нетривиального решения системы E), у которого ?(?о) = ^(т) = 0. Б) Лемма. Пара {?(•)>??(•)} является решением системы E), тогда и только тогда, когда ?(•) решение уравнения Якоби _ [?я;я.^ + L^] = [Lxi^ + Lxx?] G) r)(t)=Lxx?(t) (8) Доказательство. По определению (см. п. 4.4.2) уравнение G) есть уравнение Эйлера для вторичной экстремальной задачи с лагран- лагранжианом .
Аналогично Й Л Й U , 'гтл ^ • (J 350 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Соответствующий гамильтониан $) получается преобразованием Ле- жандра по ? Чтобы получить второе из этих равенств, заметим, что откуда д2Ь • у* д2Ь • к г к ¦ j г Исключая из A0) ?, получаем Теперь воспользуемся формулами A1), A2) и (8) п. 4.4.3: Жх(г,х,р) = — Lx(t, х, S(?, x,p)), p = Lx(t,x,S(t,x,p)). Дифференцируя по х и р, получаем: жхр = -ьхх% = -ьххжрр, Е= др =? g =2--Ж др хх р хх рр' г\ иУ т _|_ г . . 7ч г. _|_ г ж дх хх хх^х хх хх рх' Отсюда РР- хх > ^ *Р- х* хх^ ^ ^ 'Ч?> Т — 1 7" 'Ч?> Т \ Т Т — 1 Г ЩУ\/ Т» ф / J • • / J ™ г~ ^УСу гр гр / J г~ г~ —— / J rp Z> I J . . / J <у> гр щ Uib XX JjJjI UyUy ibib i ibib XX J-"*-1
4.4. Применение общей теории к простейшей задаче 351 Следовательно, A1) можно переписать так: я = \ Согласно предложению 3 п. 4.4.3 пара {?(•) тогда является решением канонической системы тогда и только A3) когда ?(•) является решением G) и выполняется второе из соотно- соотношений A0), совпадающее с (8). Остается заметить, что система A3) тождественна E).и В) Завершение доказательства. В первой части доказа- доказательства было показано, что D) эквивалентно существованию нетри- нетривиального решения {?(•)> ??(•)} системы E), у которого ?(?о) = C(r) = = 0. По лемме ?(•) является решением уравнения Якоби и имеет ме- место (8), откуда rj(r) = Ьжж(т)?(т). Равенство rj(r) = 0 противоречит (по теореме единственности) нетривиальности решения, поэтому rj(r) ф 0. Вспоминая определение из п. 4.4.2, мы видим, что D) эквивалентно сопряженности точки г точке to-" Рис. 39 Доказанное утверждение позволяет дать следующее геометриче- геометрическое истолкование понятия сопряженной точки. Пусть снова (х(х Х)'Р(*)) ~~ каноническая экстремаль, отвечающая рассматриваемой экстремали х(-). При достаточно малом 5 канонические экстрема- экстремали, определяемые условиями C), образуют полоску вдоль графика ВоВ\ (рис. 39). При t = to край этой полоски «вертикален» и про- проектируется в точку Ао = (to,xo). Условие D), эквивалентное, как дх мы видели, равенству —- с = 0, означает, что при t = г в точке ил
352 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Вт = (т,х(т),р(т)) полоска касается некоторого «вертикального» на- направления (т. е. направления, параллельного плоскостям t = const, х = const). Если мы спроектируем полоску в пространство (t,x), то мы получим пучок экстремалей, выходящий из точки Aq (рис.39). Около точки Ат = (т,х(т)) отображение (t, Л) —> (t,x(t,X)) перестает быть взаим- взаимно однозначным («экстремали, бесконечно близкие к х(-) и имеющие с ней общее начало, пересекаются в Ат»). Точка Ат также называется сопряженной с Aq. Упражнение. На сфере S2 = {(ж, у, z) \ х2 + у2 + z2 = R2} дуги большо- большого круга суть экстремали функционала длины. Проведем через точку Aq e S2 некоторый большой круг. Найдите на нем точку, сопряженную с Aq. Предложение 2. Если на экстремали х(-): [to,t\] -^ Rn вы- выполнено усиленное условие Лежандра A) и усиленное условие Якоби (полуинтервал (to, ti] не содержит точек, сопряженных с to), то эту экстремаль можно включить в поле экстремалей, покрывающее некоторую окрестность G ее графика {(t,x(t)) | to < t < t\}. Доказательство. А) Докажем сначала, что для достаточно малого 5 > О ни одна из точек отрезка [to,ti] не будет сопряженной ни к одной точке tf0 E (to — 5,to). В противном случае существуют такие ?q —> to, t^ E [to,ti] и такие решения <^n^(-) уравнения Яко- Якоби G), что ?(n)Dn)) = C(n)(^in)) = 0, ?^(t$n))^(n)(^in)) т^ 0- Ввиду однородности уравнения можно положить \^п\ц')\ = 1. Переходя, если нужно, к подпоследовательности, мы можем считать, что ц' —> ->*i е [to,ti], При выполнении условия A) уравнение Якоби сводится к линейной системе E), коэффициенты которой непрерывны на отрезке A D [to,ti], и задача Коши с начальными условиями ?(*{)= о, имеет для нее решение (?{t),r](t)), определенное на А (п. 2.5.4). По теореме о непрерывной зависимости решения от начальных дан- данных (п. 2.5.5) ?(п)(*)^Ш и равномерно на А. Но тогда и <^n^(t) -^ ?(t) равномерно на А. Далее, ?(to) = lim^(tin ) = lim^nVtin ) = 0. При этом точки to = п и п и / ) (п) ' и t\ = limt\ ' не могут совпадать, поскольку в противном
4.4. Применение общей теории к простейшей задаче 353 случае г] = ?(t[) = 0, ибо An) _ An) Так как ?(?0) = ?(t[) = 0 и La.?(*i)?(*i) 7^ 0, точка t\ e (to, t\] сопряжена to вопреки условию. Б) Выберем tf0 < to так, чтобы на [to,ti] не было точек, сопряженных с ?q. Построим семейство канонических экстремалей (#(-, Л),р(-, Л)), заменив в C) to на tf0. В силу предложения 1 det -—- (т,ро) 7^ 0» ^r ^ ил е [to,ti]. Определим отображение ip: C$ -^ R x Rn цилиндра С^ = [to — — 5,t\ + 5] х В(ро,5) равенством (p(t,X) = (t,x(t, Л)). В точках (т,_ро)> г G [to,ti] его якобиан det ip' = det ( l ° ] = det жЛ ^ 0, и мы можем выбрать 5 так, чтобы это неравенство сохранилось во всех точках С$. Кроме того, по теореме об обратном отображении (п. 2.3.4) у каждой точки (т,_ро) найдется окрестность UT, которую (р взаимно однозначно отображает на WT = (p(UT) и (p~l e Cl(WT). Покажем, что при достаточно малом 5 отображение (р взаимно одно- однозначно на всем С$. Если это не так, то существуют две последователь- последовательности (С А;), (СЛ;0 такие, что \'п ^ Ро, К^ Ро и (t'n,x(t'n, \'n)) = = <p(tn, Уп) = <р(С К) = К* *К> К))- Отсюда t'n = С Переходя к подпоследовательности, мы можем считать, что t'n = = t'n —> т. При достаточно больших п точки (trn,\rn) и (t^,A^) e UT и равенство (p(t'n,\'n) = (p(tf^,Xf^) противоречит определению UT. Теперь покажем, что G = (p(mtC$) является окрестностью графика Г = {(t,x(t)) | t0 < t < ti}. Поскольку Г = ^({(t,po_) l*o < t ^J\}) С G, нужно доказать открытость G. Но если (t,x) = (p(t,X) e G, (t, A) e C$, то det(p'(J_,\) ^ 0, и по той же теореме п. 2.3.4 некоторая окрестность точки (t, А) отображается на окрестность точки (t,x). Поэтому (t,x) — внутренняя точка G и G открыто. Таким образом, семейство экстремалей {х(-,Х)} взаимно однознач- однозначно покрывает G. То, что это семейство образует поле, было показано в первом примере лежандрова множества в п. 4.4.3. ¦ Построенное поле состоит из экстремалей, проходящих через одну и ту же точку (?q,#o) и называется центральным. Теперь мы возвратимся к достаточным условиям минимума. Прежде всего покажем, как из общей теоремы п. 4.4.4 получаются достаточные 12 В. М. Алексеев и др.
354 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления условия слабого минимума. Соответствующая теорема была уже сфор- сформулирована в п. 4.4.2. Доказательство теоремы Якоби (теорема 2 п. 4.4.2). Ес- Если на допустимой экстремали х(-) задачи A), B) п. 4.4.4 выполняются усиленные условия Лежандра и Якоби, то, согласно предложению 2, ее можно включить в поле экстремалей, покрывающее некоторую окрестность G графика #(•). По теореме 1 (или Iх) п. 4.4.4 неравенство выполняется для всех х(-) ? С1 ([to, t\], Rn), удовлетворяющих краевым условиям x(to) = x(to), x(t\) = x(t\) и таких, что график х(-) содержит- содержится в G, а расширенный график — в V. Если \\х(-) —x(-)\\ci достаточно мала, то последние два условия удовлетворяются. Следовательно, х(-) доставляет в задаче A), B) п. 4.4.4 С1-локальный, т.е. слабый, мини- минимум. ¦ Перейдем к достаточным условиям сильного минимума. В этом слу- случае сами функции х(-) и х(-) по-прежнему можно считать столь близ- близкими, что график х(-) содержится в G, но х(-) может быть любым и рас- расширенный график х(-) не обязан помещаться в V. Вне V условие A) не гарантирует выпуклости функции ? ь-> ?(?,#,?), и неравенство Юн- Юнга, использованное в доказательстве теоремы 1 п. 4.4.4 (см. там фор- формулу G)), не обязано выполняться. Поэтому в формулировку теоремы придется ввести дополнительное предположение (условие Вейерштрас- са) о неотрицательности функции iS(t9 х, и, ?) = L{t, х, ?) - Lit, х, и) - LA(t, x, u)(? - и). Теорема Вейерштрасса о достаточных условиях сильного минимума. Пусть функция L принадлежит классу С2 в открытом множестве V С R x Rn x Rn, функция х(-) ? G Cl([to,t\],Hn) 0 и ее расширенный график T={(t,x(t),x(t)) \to^t^U}cV. Если: 1) х(-) удовлетворяет уравнению Эйлера ±Li{ 1) Напомним, что х(-), доставляющее сильный минимум, при выполнении условия A) должно иметь непрерывную производную, хотя сейчас задача рас- рассматривается в КС1([го,г\],Ип) (см. замечание после формулировки теоремы 1 п. 4.4.4).
4.4. Применение общей теории к простейшей задаче 355 2) х(-) удовлетворяет краевым условиям x(t0) =х0, x(t\) =х\\ 3) вдоль х(-) выполнено усиленное условие Лежандра A); 4) вдоль х(-) выполнено усиленное условие Якоби: в полуинтерва- полуинтервале (to,t\] нет точек, сопряженных с to; 5) существует окрестность V D Г, для которой выполняется условие Вейерштрасса для всех (t,x,u,?) таких, что (t,x,u) ? V, (t,x,?) ? V, то х(х х) доставляет сильный минимум в простейшей задаче A), B) п. 4.4.4 (строгий, если в условии Вейерштрасса %> >J} при ? ф и). Доказательство. Определим окрестность V D Г так ^же, как и в начале этого пункта, и построим окрестность G D Г = = {(t,x(t)) | to ^ t ^ t\} и поле экстремалей, покрывающее G; без ограничения общности V = V. Обозначим через u(t,x) наклон поля в точке (t,x) = (t,x(t,\)) e G: u(t, x) = x(t, Л) при x = x(t,X), и пусть p(t, х) = Lx(t, х, u(t, x)). Согласно предложению 2 и примеру из п. 4.4.3 функция р: G —> Rn* имеет лежандров график Е = {(t,x,p(t,x)) | (t,x) eG} С D. Теперь для допустимой х(-), график которой содержится в G, и = \ L(t,x(t),x(t))dt- - [{p(t, x(t))x(t) - Ж(Ь, x(t),p(t, to и = \{L(t, x(t),x(t)) - LA(t, x(t), u(t, x(t))x(t)+ to LA(t, x(t),u(t, x(t))u(t, x(t)) - L(t, x(t),u(t, x(t)))} dt = = \%(t,x(t),u(t,x(t)),x(t))dt. 12*
356 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления Поскольку экстремаль х(-) содержится в поле, x(t) = u(t,x(t)), а потому и J(x(-))-\uj= \iS(t,x(t),u(t,x(t)),x(t))dt = O. A4) 7 ^о Следовательно, и J(x(-)) - J(x(-)) = J &(t,x(t),u(t,x(t)),x(t))dt A5) как и в теореме 1 п. 4.4.4 \ио = \ио 7 7 По построению (см. доказательство предложения 2 п. 4.4.5) точки {t,x{t,\),x{t,\)) = (t,x,u(t,x)) e V = V при (t,x) = (t,x(t,\)) e G и (t,x(t),x(t)) e V, поскольку х(-) — допустимая функция. Следова- Следовательно, применимо условие Вейерштрасса и из A5) «/(#(•)) — 3(х(х х)) > 0. Таким образом, если х(-) е КС1 ([to, ti],Rn) допустима, удо- удовлетворяет краевым условиям и \\х(-) —х(-)\\с столь мала, что график х(-) лежит в G, то J\x(-)) ^ 3(х(-)). Значит, х(-) доставляет сильный минимум в задаче A)-D) п. 4.4.4. Равенство 3(х(-)) = 3(х(-)) возможно при этом только в случае, когда %?(t,x(t),u(t,x(t)),x(t)) = 0 для всех t, кроме, быть может, точек разрыва х(-). Если и ф ? ^> & > 0, то x(t) = u(t,x(t)) и, в частно- частности, х(-) оказывается непрерывной. Далее, согласно соотношениям (8) и A2) п. 4.4.3, p(tt х) = Lx{t, х, u{t, х)) <^> u{t, х) = = ?(?, х,p{t, x)) <^> u{t, х) = Жр{г, х,pit, x)) => x(t) = Полученная формула совпадает с A2) п. 4.4.4 и, рассуждая, как и там, мы устанавливаем, что x(t) = x(t).m Замечание. Соотношение A5) позволяет показать, что квадра- квадратичный функционал с лагранжианом (9) можно привести^ к «полному квадрату». Вычисляя функцию Вейерштрасса (и полагая ?(•) = 0) получаем
4.4. Применение общей теории к простейшей задаче 357 где P(tJ = Lxx(t), a S(-) и П(-) — решения матричной системы = -%xx(t)z - жхр(ь)и с начальными условиями ВД=0, U(t'0) = E. A8) 4.4.6. Теорема Э. Нётер. В п. 1.4.1 мы уже познакомились с неко- некоторыми ситуациями, в которых уравнение Эйлера имеет первый инте- интеграл. Например, если лагранжиан не зависит явно от t, т. е. имеет вид L(x,x), то Н = Lxx — L = const (интеграл энергии). В этом пункте мы познакомимся с общим приемом конструирования первых инте- интегралов для систем дифференциальных уравнений, являющихся урав- уравнениями Эйлера некоторых вариационных задач. Этот прием основан на простой и вместе с тем глубокой теореме, доказанной замечатель- замечательной женщиной-математиком нашего века Эмми Нётер. Универсальный принцип, выражаемый теоремой Нётер, часто формулируют так: «Вся- «Всякая симметрия в мире порождает закон сохранения», или еще: «Ин- «Инвариантность системы относительно некоторой группы преобразований имеет следствием существование в системе первого интеграла». Так, например, инвариантность системы относительно сдвига по времени, проявляющаяся в том, что время t не входит в лагранжиан, дает нам интеграл энергии. Перейдем к точным определениям. Пусть дано семейство отображе- отображений ^:RxRn^Rx Rn, \a\ < е0, Sa(t, x) = (Т(?, х, a),X(t, х, а)). Относительно него мы будем предполагать, что: 1) функции 1и1 принадлежат классу С2; 2) при а —> О Т(?, x,a)=t + aT(t, x) + о(а), ?(?, х, а) = х + aX(t, х) + о(а). ^ > Векторное поле (T(t,x),X(t,x)) будем называть касательным векторным полем семейства {Sa}. Под действием преобразова- преобразований Sa точка Р = (?, х) описывает некоторую кривую в R x Rn и {T(t,x),X(t,x)} — касательный вектор к этой кривой в точке Р (т. е. при а = 0; рис. 40). Лемма. Пусть х(-) е C2([to,ti],Rn). Тогда существуют та- такие 5 > 0, е > 0, х(-г) е C2((t0 -5,ti+6)x (-?,s),Rn), tk(-) e ? C2((—e,e))> k = 0, 1, что при а ? (—г,г) образ графика функции
358 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления х(-) является графиком функции х(-,а): [to(a),t\(a)] —> Rn. При этом x(t, 0) = x(t), xa(t, 0) = X(t, x(t)) - x(t)T(t, x(t)), B) ф)=Т(и,х(и)). C) Доказательство. Образ графика х(-) при отображении Sa за- задается параметрическими формулами t = t(s, a) = %(s, x(s), a), to ^ s ^t\, x = x(s, a) = X(s, x(s),a), \a\ < s0. Обе функции тих как суперпозиции функций класса С2 сами при- принадлежат этому классу. {Т,Х} D) to t0 (а) Рис. 40 Согласно A) и потому g(«,x.0)=0. ox ds"' dt ds Используя компактность отрезка to ^ s ^ t\ и непрерывность дт/ds, находим такие 5\ > 0 и е\ > 0, что при \а\ < е\, и to — 5\ < s < t\ + 5\ дт выполняется неравенство —(s,a) > 1/2. Тогда при фиксированном as a G (—?,?:) функция s [to,ti] на a s r(s,a) монотонно возрастает и отображает x(to),a),%(tux(U),a)}. E) Из этих равенств видно, что ti(a), г = 0, 1, — функции класса С2, причем из A) следует C). В силу той же монотонности отображение А, определенное ра- равенством A(s,a) = (r(s,a),a), взаимно однозначно отображает пря-
4.4. Применение общей теории к простейшей задаче 359 моугольник П = (to — 5\,t\ + 5\) х (—е,?\) на его образ W = А(П). Поскольку якобиан А dr/ds дт/да\_дт 1 0 1 )-^>2' то, рассуждая так же, как в доказательстве предложения 2 п. 4.4.5, устанавливаем, что W открыто и что обратное отображение А~х\ W —> —> П, которое, очевидно, имеет вид (t,a) \-^ (a(t,a),a), непрерывно дифференцируемо и a G C^W). Из D) и A) имеем t(s,0) = %(s,x(s),0) = 5. Поэтому А оставляет на месте точки E,0) и то же делает А~\ откуда a(t,0) = t. Далее, как неявная функция, <т(-, •) находится из уравнения F(a, t, a) = г (а, а) — t = 0. Отсюда, во-первых, согласно D) и A), aa(t,0) = -F~lFa = -(rs(a(t,0),0)-lra(a(t,0),0) = = -[%(t, x(t), 0) + %x{t, x{t),0)x{t)]-lZa{t, x(t), 0) = = -T(t,x(t)), F) а, во-вторых, поскольку F класса С2, то по сделанному в п. 2.3.4 замечанию а е C2(W). Далее, А отображает отрезок {(s,0) | to < s < t\} в себя и этот отрезок содержится в W. Следовательно, W содержит прямоугольник (to — 5, t\ + 5) х (—?, е), если 5 > 0 и е > 0 достаточно малы, и на этом прямоугольнике x(t, a) = X(cr(t, a), x(a(t, а)), а) G) — функция класса С2. При этом е мы выберем так, чтобы при \а\ < е выполнялись неравенства \и(а) — U\ < 5. Тогда, вспоминая определе- определения функций а(-,-) и U(-), мы видим из D) и G), что образ графика х(-) при отображении Sa есть график функции х(-,а): [to(a),t\(a)] -^ Наконец, дифференцируя G) с учетом A), F) и равенства cr(t,O) = = t, находим xa(t, 0) = [Xt(t, x(t),0) + Xx(t, x(t), 0)x(t)]aa(t, 0) + + Xa(t, x(t), 0) = x(t) [-T(t, x(t))] + X(t, x(t)), т. е. верно B). ¦ Определение. Пусть функция L: V —> R по крайней мере непрерывна в открытом множестве V С R x Rn x Rn. Интегральный функционал и J(x(-),to,ti) = j L(t,x(t),x(t))dt (8) to
360 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления называется инвариантным относительно семейства отображений {Sa}, если для любой функции х(-) G C2([to,t\],Rn) такой, что {(t,x(t),x(t)) | t0 < t < ti} С V для всех достаточно малых а. (Здесь х(-,а), to (се), t\(a) построены по х(-), как в лемме, и интер- интервал, в котором имеет место (9), может зависеть от #(•).) Теорема Э. Нётер. Пусть функции L, Lx, L% непрерывны в открытом множестве V С R x Rn x Rn и интегральный функ- функционал (8) инвариантен относительно семейства преобразований класса С2, удовлетворяющих условию A). Тогда функция ip(t, х, х) = Lx(t, х, x)X(t, x) - [Lx(t, x, x)x - L(t, x, x)]T(t, x) A0) постоянна на каждом решении х(-) уравнения Эйлера ^Li(t,x(t),x(t))=Lx(t,x(t),x(t)) A1) таком, что х(-) е C2([t0, ti],Rn), {(t,x(t),x(t)) | t0 < t < tj С V Доказательство. А) Пусть x(-): [to,ti] -^ Rn — то решение уравнения A1), о котором говорится в условии теоремы. Воспользо- Воспользовавшись леммой, построим семейство (#(-,ce),to(ce),ti(ce)), где #(-,-) — функция класса С2 на (to — 5, t\ + 5) х (—е, г). Фиксируем отрезок А = = [/3,7] так, чтобы выполнялись неравенства to — 5 < C < to < t\ < < 7 < t\ + 5, и уменьшим, если нужно, г так, чтобы при |се| < г выполнялись неравенства /3 < to (се) < ti(ce) < j. Покажем, что отображение Ф: (—г, г) -^ С1 (A, Rn) x R2, при ко- котором а I—> {x(-,a),to(a),t\(a)} дифференцируемо по Фреше в точке а = 0. Ясно, что достаточно проверить это для первой компоненты а I—> х(-,а). Фиксировав г G @, г) и применяя теорему о среднем (к дифференцируемым отображениям а —> x(t,a), t — фиксировано), име- имеем при \а\ ^ г sup teA x(t,a) -x(t,0) -axa(t,0) a sup teA xt(t,a) - xt(t,0) - axta(t,0) a sup sup teAce[o,a] < SUp SUp \xta(t,c) - Xta(t,0)\ -^ 0, при a —> 0, поскольку ха и xta равномерно непрерывны на компакте А х [—г,г]. Следовательно, в пространстве С^А,Rn) *, OL) — XI *, Ю ) ~\ OLXq/ I *, Ю ) ~\ О( (У, \ ), I IZj )
4.4. Применение общей теории к простейшей задаче 361 что и означает дифференцируемость по Фреше. Кроме того, из A2) вытекает, что '() {()'()ф)} A3) Б) Положим 3(а) = (J о Ф)(а) = J(x(-,a),to(a),t\(a)). Соглас- Согласно (9) J(a) = J@) и, значит, J\0) = J'(x(-),to,tiW(O)] = 0. Вос- Воспользовавшись формулой (9) из п. 2.4.2 для производной интегрального отображения, получаем из A3) to + Li(t, x(t), x(t))xat(t, 0)}dt + L(tit х(и),х(и))ф) . A4) г=0 По предположению, Lx(t,x(t),x(t)) непрерывно дифференцируема. Интегрируя в A4) по частям (как в п. 1.4.1) и учитывая A1), B), C) и A0), имеем 0=[Li(ti,x(ti),x(U))Xa(U,0) + + ци9х(и)Ли))ФШо = = [Li(ti, х(и),х(и))Х(и, x(U)) + (L(tit х(и),х(и))- - Li(ti, х(и),х(и))х(и))Т(и, х(и))]?Ъ = = ip(tux(tl)ix(tl))-ip(to,x(to),x(to)). Итак, (p(t\,x(t\),x\(ti)) = <p(to,x(to),x(to)). Повторяя те же рассуждения для произвольного отрезка [to,ti] С С [to,ti], получаем равенство (p(t,x(t),x(t)) = (p(to,x(to),x(to)) = const. ¦ Следствие. Если в условиях теоремы Нётер выполняются предположения а) и б) предложения 2 п. 4.4.3, то функция ф(г,х,р) =pX(t,x)-Jff(t,x,p)T(t,x) A5) постоянна на каждом решении (x(t),p(t)) системы Гамильто- Гамильтона A) п. 4.4.3. Доказательство предоставляется читателю. Из формулы A5) видно, что доставляемый теоремой Нётер первый интеграл есть зна- значение дифференциальной формы Пуанкаре-Картана uj = pdx — Mdt на касательном векторном поле семейства {Sa}. В качестве примера покажем, как из теоремы Нётер получа- получаются интегралы энергии и импульса (п. 1.4.1). Если L не зави- зависит от t, то функционал (8) инвариантен относительно преобразо- преобразований (t,x) I—> (t + a,x) (проверьте!). Здесь Т = 1, X = 0, и потому
362 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления ip = L — L%x = —^постоянна. Если же L не зависит от одной из ком- компонент вектора х, скажем от Xk, то функционал (8) инвариантен относительно преобразований (t,x) i—> (t,x -\- аек) (проверьте!). Здесь Т = О, X = ек, и потому <р = ЬАек = ЬАк. Другие примеры применения теоремы Нётер будут приведены в сле- следующем пункте. 4.4.7. Вариационный принцип и законы сохранения в механи- механике. Рассмотрим систему из п материальных точек («частиц») с мас- массами тп\, ..., тпп, Гг = (xi,yi,Zi) — радиус-вектор г-й точки. Для краткости полагаем = (r1,...,rn)GR 3» дг \дг['"'' дгг, д ( д д д Будем предполагать, что взаимодействие частиц между собой и с внешней средой описывается потенциальной энергией U(t,r), так что уравнения движения имеют вид ГПгГг = Fi = -dU/дГг. A) Кинетическая энергия системы определяется равенством Xl). B) г=\ Теорема (вариационный принцип Лагранжа). Урав- Уравнения движения механической системы суть уравнения Эйлера ва- вариационной задачи и L(t, r, r) dt —> extr, r(to)=r°, r(t{)=r\ L = K-U. Доказательство. Из A) и B) имеем d , . , d dK d T T dU тПоГо = — {гПоГо) = — —— = — Lr- = Lr. = ——. ¦ 1 г dtK г г) dt дт-г dt Гг Гг дт{ Значение этой теоремы выходит далеко за рамки той простейшей ситуации, которой мы ограничимся. Физики и механики очень часто описывают свойства системы, задавая непосредственно ее лагранжиан L. При этом К, U и L = К — U могут быть выражены не в декартовых, а в каких-то других координатах, в лагранжиан могут быть введены члены, описывающие магнитные или гироскопические (не потенциаль- потенциальные) силы и т. д. Как только лагранжиан задан, уравнения Эйлера
4.4. Применение общей теории к простейшей задаче 363 вариационной задачи C) определяют закон движения рассматриваемой системы. Вариационный подход удобен, в частности, возможностью получе- получения первых интегралов («законов сохранения») при помощи теоремы Нётер. Мы проиллюстрируем эту возможность на примере так называ- называемых классических интегралов: энергии, импульса и момента. а) Консервативная система: U не зависит от t. Группа пре- преобразований: (?, г) I—> (t-\-a,r). Функция r(-): [?o>?i] —> R3n переходит при этом в функцию ra(-): [to + a,t\ + a] —> R3n, ra(t) = r(t — а). Функционал C) инвариантен: L(ra(t),ra(t))dt = [ L(r(t - a),r(t - a))dt = \ L(r(t),r(t)) dt. Касательное векторное поле: Т = 1, R = 0. Первый интеграл: Т = г=\ г=\ i)+K-U = -K-U. г=\ Следовательно, в консервативной системе полная энергия является первым интегралом («закон сохранения энергии»). б) Свободная частица: U не зависит от радиуса-вектора гк одной из частиц. Группа преобразований: где / G R3 произвольно. Инвариантность функционала C) очевидна. Касательное векторное поле: T = 0,R= (Ru...,Rk,...,Rn) = @,..., /,..., 0). Первый интеграл: дК , f.Ri = —I = mk(rk Так как / произвольно, то pk = mkrk должно быть постоянно. Таким образом, если fc-я частица не взаимодействует с остальной частью системы (не вносит вклада в потенциальную энергию), то ее импульс Pk = mkrk сохраняется. в) Внешние силы отсутствуют. Это означает, что U за- зависит только от разностей г^ — г j и L не меняется, если систему как единое твердое тело передвинуть в пространстве, т. е. сделать
364 Гл. 4. Принцип Лагранжа в задачах вариационного исчисления преобразование (t,r\,... ,rn) \-^ (t,r\ + al,... ,rn + al), где/ — произ- произвольный вектор. Здесь Т = О, R =(/,...,/) и сохраняется ^ ( -^— / ) = / п \ = I J^ ш^г^ / ). Так как / произвольно, то \г=1 / п Р = S^niiri = const. Итак, если силы только внутренние, то имеет место «закон сохра- сохранения полного импульса системы». г) Вращательная сим мет рия: U зависит только от попарных расстояний \гг — rj\ между точками. Лагранжиан не меняется, если подвергнуть систему ортогональному преобразованию €, так как , €ri) =K-U = 1 П г=\ г=\ (ортогональное преобразование не меняет скалярных произведений и длин). Фиксируем вектор и и рассмотрим группу преобразований, соответствующую равномерному вращению системы около начала ко- координат с угловой скоростью и. Касательное векторное поле: Т = О, R = (и х г\,..., ио х гп). Первый интеграл li(fi | U X Гi) = г=\ ~ ' с г=\ г=\ Ввиду произвольности и должен сохраняться вектор момента коли- количества движения М = г=\
Комментарии и путеводитель по литературе Литература по теории экстремальных задач огромна. Не претендуя на пол- полноту, мы ограничились здесь упоминанием лишь некоторых изначальных ра- работ, основных монографий, учебников и обзорных статей. К главе I. § 1.1. История возникновения первых задач на мак- максимум и минимум (помимо цитировавшейся книги Ван дер Вардена) изложена в [86]; о раннем этапе классического вариационного исчис- исчисления можно прочитать в [83] и [87]. Экстремальным свойствам круга и шара посвящена монография [21]. Транспортная задача исследовалась уже в работе Л. В. Канторовича [55] — первой работе по линейному программированию. Простейшие задачи автоматического регулирования были впервые исследованы А. А. Фельцбаумом (см. в [12]) и Бушау [96]. Задача о быстродействии и ряд других подробно рассмотрены в основопола- основополагающей монографии Л. С. Понтрягина, В. Г. Болтянского, Р. В. Гамкрелидзе и Е. Ф. Мищенко [12] и во многих других книгах по оптимальному управлению ([23], [27] и др.). §§ 1.2-1.5. История принципа Лагранжа рассказана в статье [45]. Этой же теме, но в рамках классического вариационного исчисления, посвящены рабо- работы [43], [44]. Укажем еще несколько книг и статей, посвященных затронутым в этих параграфах темам, и рассчитанных на широкого читателя: [71], [74], [76], [77], [115]. Основы классического вариационного исчисления изложены в учебни- ках [2], [3], [8]. К главе П. §2.1. Помимо упоминавшихся уже учебников по функцио- функциональному анализу, укажем на книги [92], [107] специально ориентированные на «обслуживание» теории экстремальных задач. § 2.2. Дифференциальное исчисление в линейных нормированных про- пространствах (помимо [КФ]) изложено в учебниках [5], [56], [69] и монографи- монографиях [28], [54], [59]. § 2.3. Бесконечномерные варианты теоремы о неявной функции изложены в учебниках [5], [56], [69]. Теорема п. 2.3.1 достаточно удобна для построения общей теории, ибо она содержит классическую теорему о неявной функции и теорему Люстерника о касательном пространстве и дает оценку отклонения от ядра отображе- отображения. Конструкции, использованные в доказательстве, фактически содержались в первоначальной работе [68] (см. также [69]). Другие доказательства и моди- модификации см. в [54], [65].
366 Комментарии и путеводитель по литературе § 2.4. О дифференцируемости других важных конкретных функционалов см. в [28], [59]. § 2.6. Основы конечномерного выпуклого анализа были заложены Мин- ковским [113], [114] и Фенхелем [101], [102]. Выпуклый анализ в беско- бесконечномерных пространствах был построен в шестидесятые годы в работах Бронстеда [95], А. Я. Дубовицкого и А. А. Милютина [46], Моро, Рокафеллара и др. Наиболее полный обзор конечномерной теории содержится в монографии Рокафеллара [81], а также (в части, касающейся лишь выпуклых множеств) в монографии Боннезена и Фенхеля [94]. Бесконечномерная теория изложена в [16], [52], [54], [62], [79], [84]. В самое последнее время делаются попытки создать синтетическое, «глад- «гладко-выпуклое» исчисление — см. [70], [99], [118]. К главе III. § 3.2. Трудно сказать, кем впервые было доказано прави- правило множителей Лагранжа для гладких конечномерных задач с равенствами и неравенствами. В некоторых американских работах дается ссылка на работу Валентайна [120] и диссертацию Каруша [109]. Правило множителей для случая бесконечного числа неравенств было доказано Джоном [108]. Очень большую роль в этой тематике сыграла работа Куна и Таккера [111]. Беско- Бесконечномерные варианты правила множителей изложены в [37], [39], [46], [54], [79], [84]. § 3.3. Линейное и выпуклое программирование очень широко представлено учебной и монографической литературой на русском языке: [38], [40], [41], [50], [57], [58], [67], [75], [76], [81], [89], [90]. § 3.4. Одной из первых работ, посвященных необходимым условиям для задач с ограничениями типа неравенств, была [100]. Конечномерная тео- теория прекрасно изложена в учебнике Хестенеса [106], см. также [51], [85]. В недавнее время Е. С. Левитиным, А. А. Милютиным и Н. П. Осмоловским была разработана полная теория условий второго порядка для задач с огра- ограничениями [64], [65]. В последней из названных работ имеется подробная библиография. В нашем изложении использовались некоторые конструкции этой работы. См. также [105], [117]. К главе IV. §§4.1 и 4.4. Классическому вариационному исчислению посвя- посвящено много учебников и монографий. Кроме упомянутых выше см. [20], [63], [91], [93], [97], [103]. Наиболее полно теория необходимых и достаточных условий экстремума в задаче Лагранжа разработана в монографии Блисса [20]. Там же изложена история вопроса. О связях вариационного исчисления и клас- классической механики см. [1]. § 4.2. Первоначальный набросок теории оптимального управления был из- изложен в [26] и в обзорной статье Л. С. Понтрягина [78], затем теория оп- оптимального управления составила содержание монографии Л. С. Понтрягина, В.Г.Болтянского, Р. В. Гамкрелидзе и Е.Ф.Мищенко [12], давшей толчок бурному развитию всего направления исследований, связанных с экстремаль- экстремальными задачами. Доказательство принципа максимума, изложенное в § 4.2, является обработкой первоначального доказательства В. Г. Болтянского, хотя в нем не используются никакие иные средства, кроме классического анализа. Метод центрированных систем использовался в работах А. Я. Дубовицкого и А. А. Милютина. Сейчас имеется много доказательств принципа максимума, см., например, [24], [31], [46]-[49], [54], [104], [112]. Теории оптимального управления посвящены учебники [23], [31], [35], а также монографии [25], [27], [32], [61], [66], [73] и ряд других. В названных
Комментарии и путеводитель по литературе 367 монографиях много места уделено решению разнообразных конкретных при- прикладных задач. § 4.3. Принцип максимума для линейных систем был впервые доказан Р. В. Гамкрелидзе [36]. Завершенная теория линейных систем была разрабо- разработана Н. Н. Красовским [60]. Обзору проблематики, связанной с ляпуновскими задачами, посвящена статья [17], где содержатся обобщения результатов этого параграфа и имеется подробная библиография. Развитие теории ляпуновских задач привело к изучению выпуклых инте- интегральных функционалов в работах [54], [98], [119] и др. В заключение отметим несколько монографий, в которых читатель сможет ознакомиться с некоторыми принципиальными вопросами теории экстремаль- экстремальных задач, не затронутыми в книге. Многомерное вариационное исчисление: [110], [116]. Теоремы существования: [35], [54], [116]. Достаточные условия в задачах оптимального управления: [22], [23], [61]. Расширения экстремальных задач: [53], [88]. Двойственные методы в теории экстремальных задач: [52], [88]. Численные методы: [29], [42], [72], [80], [82]. Скользящие режимы: [34]. Динамическое программирование: [18], [19]. Фазовые и смешанные ограничения: [33], [47], [48]. См. также обзор [30].
Список литературы Учебники и учебные пособия, цитируемые в основном тексте КФ. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функцио- функционального анализа. — М.: Физматлит, 2004. 1. Арнольд В. И. Математические методы классической механики. — М.: Наука, 1974. 2. Ахиезер Н. И. Лекции по вариационному исчислению. — М.: Гостехиз- дат, 1955. 3. Гельфанд И. М., Фомин С. В. Вариационное исчисление. — М.: Физмат- гиз, 1961. 4. Данфорд И., Шварц Дж. Линейные операторы. / Общая теория. — М.: ИЛ, 1962. 5. Картан А. Дифференциальное исчисление. Дифференциальные фор- формы. - М.: ИЛ, 1971. 6. Коддингтон Э. А., Левинсон Н. Теория обыкновенных дифференциаль- дифференциальных уравнений. — М.: ИЛ, 1958. 7. Курош А. Г. Курс высшей алгебры. — М.: Наука, 1971. 8. Лаврентьев М. А., Люстерник Л. А. Курс вариационного исчисления. — М.-Л.: Гостехиздат, 1950. 9. Никольский С. М. Курс математического анализа, тт. 1, 2. — М.: Наука, 1975. 10. Петровский И. Г. Лекции по теории обыкновенных дифференциальных уравнений. — М.-Л.: Гостехиздат, 1952. 11. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. — М.: Наука, 1965. 12. Понтрягин Л. С, Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Физматгиз, 1961.
Список литературы 369 13. Привалов И. И. Введение в теорию функций комплексного переменно- переменного. — М.: Наука, 1977. 14. Фихтенголъц Г. М. Курс дифференциального и интегрального исчисле- исчисления, тт. 1, 2. - М.: Наука, 1969. 15. Хартман Ф. Обыкновенные дифференциальные уравнения. — М.: ИЛ, 1970. Дополнительная литература 16. Акилов Г. П., Кутателадзе С. С. Упорядоченные векторные простран- пространства. — Новосибирск: Наука, 1978. 17. Аркин В. И., Левин В. Л. Выпуклость значений векторных интегралов, теоремы измеримого выбора и вариационные задачи. — УМН 27, вып. 3, 1972, с. 21-77. 18. Беллман Р. Динамическое программирование. — М.: ИЛ, I960. 19. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. — М.: Наука, 1969. 20. Блисс Дж. Лекции по вариационному исчислению. — М.: ИЛ, 1950. 21. Бляшке В. Круг и шар. — М.: Наука, 1967. 22. Болтянский В. Г. Достаточные условия оптимальности и обоснование метода динамического программирования. — Изв. АН СССР, сер. матем. 28, № 3, 1964, с. 481-514. 23. Болтянский В. Г. Математические методы оптимального управления. — М.: Наука, 1969. 24. Болтянский В. Г. Метод шатров в теории экстремальных задач. — Успехи матем. наук 30, вып. 3, 1975, с. 3-55. 25. Болтянский В. Г. Оптимальное управление дискретными системами. — М.: Наука, 1973. 26. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К теории опти- оптимальных процессов. — ДАН СССР ПО, № 1, 1956, с. 7-10. 27. Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. — М.: Мир, 1972. 28. Вайнберг М. М. Вариационный метод и метод монотонных операторов в теории нелинейных уравнений. — М.: Наука, 1972. 29. Васильев Ф. П. Лекции по методам решения экстремальных задач. — М.: Изд. МГУ, 1974. 30. Габасов Р., Кириллова Ф. М. Методы оптимального управления. — Ито- Итоги науки и техники. Современные проблемы математики. Т. 6. — М.: 1976, с. 133-206. 31. Габасов Р., Кириллова Ф. М. Методы оптимизации. — Минск: Изд-во БГУ, 1975. 32. Габасов Р., Кириллова Ф. М. Особые оптимальные управления. — М.: Наука, 1973.
370 Список литературы 33. Гамкрелидзе Р. В. Оптимальные процессы управления при ограниченных фазовых координатах. — Изв. АН СССР, сер. матем. 24, № 3, I960, с. 315-356. 34. Гамкрелидзе Р. В. О скользящих оптимальных режимах. — ДАН СССР 143, № б, 1962, с. 1243-1245. 35. Гамкрелидзе Р. В. Основы оптимального управления. — Тбилиси: Изд. ТГУ, 1977. 36. Гамкрелидзе Р. В. Теория оптимальных по быстродействию процессов в линейных системах. — Изв. АН СССР, сер. матем. 22, № 4, 1958, с. 449-474. 37. Гамкрелидзе Р. В., Харатишвили Г. Л. Необходимые условия первого порядка в экстремальных задачах. / В кн.: Международный конгресс математиков в Ницце. — М.: Наука, 1972. 38. Гасс С. Линейное программирование. — М.: Физматгиз, 1961. 39. Гирсанов И. В. Лекции по математической теории экстремальных за- задач. - М.: Изд-во МГУ, 1970. 40. Гольштейн Е. Г. Теория двойственности в математическом программи- программировании. — М.: Наука, 1971. 41. Данциг Д. Линейное программированяе, его обобщения и применения. — М.: Прогресс, 1966. 42. Демьянов В. Ф., Рубинов А. М. Приближенные методы решения экстре- экстремальных задач. — Л.: Изд-во ЛГУ, 1968. 43. Дорофеева А. В. Вариационное исчисление во второй половине XIX в. — Историко-математические исследования XV, 1963, с. 99-128. 44. Дорофеева А. В. Развитие вариационного исчисления, как исчисле- исчисления вариаций. — Историко-математические исследования XIV, 1961, с. 101-180. 45. Дорофеева А. В., Тихомиров В. М. От правила множителей Лагранжа до принципа максимума Понтрягина. — Историко-математические иссле- исследования XXV, 1979. — (в печати). 46. Дубовицкий А. Я., Милютин А. А. Задачи на экстремум при наличии ограничений. — ЖВМ и МФ 5, № 3, 1965, с. 395-453. 47. Дубовицкий А. Я., Милютин А. А. Необходимые условия слабого экс- экстремума в общей задаче оптимального управления. — М.: Наука, 1971. 48. Дубовицкий А. Я., Милютин А. А. Необходимые условия экстремума в задачах оптимального управления со смешанными ограничениями типа неравенств. - ЖВМ и МФ 8, № 4, 1968, с. 725-770. 49. Дубовицкий А. Я., Милютин А. А. Трансляция уравнений Эйлера. — ЖВМ и МФ 9, № б, 1969, с. 1263-1284. 50. Еремин И. И., Астафьев Н. Н. Введение в теорию линейного и выпукло- выпуклого программирования. — М.: Наука, 1976. 51. Зангвилл У. И. Нелинейное программирование. — М.: Сов. радио, 1973.
Список литературы 371 52. Иоффе Л. Д., Тихомиров В. М. Двойственность выпуклых функций и экстремальные задачи. — УМН 23, вып. 6, 1968, с. 51-116. 53. Иоффе А. Д., Тихомиров В. М. Расширение вариационных задач. — Труды ММО 18, 1968, с. 187-246. 54. Иоффе Л. Д., Тихомиров В. М. Теория экстремальных задач. — М.: Наука, 1974. 55. Канторович Л. В. Математические методы организации и планирования производства. — Л.: Изд-во ЛГУ, 1939. 56. Канторович Л. В., Акилов Г. П. Функциональный анализ. — М.: Наука, 1977. 57. Карлин С. Математические методы в теории игр, программировании и экономике. — М.: ИЛ, 1964. 58. Карманов В. Г. Математическое программирование. — М.: Наука, 1975. 59. Красносельский М. А., Забрейко П. П., Пустыльник Е. И., Соболев- Соболевский П. Е. Интегральные операторы в пространствах суммируемых функ- функций. — М.: Наука, 1966. 60. Красовский Н. Н. Теория управления движением. Линейные системы. — М.: Наука, 1968. 61. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управле- управления. — М.: Наука, 1973. 62. Кутателадзе С. С, Рубинов А. М. Двойственность Минковского и ее приложения. — Новосибирск: Наука, 1976. 63. Лаврентьев М. А., Люстерник Л. А. Основы вариационного исчисле- исчисления. - М.-Л.: ОНТИ, 1935. - ТТ. I, П. 64. Левитин Е. С, Милютин А. А., Осмоловский Н. П. Об условиях ло- локального минимума в задачах с ограничениями. / В кн. Математическая экономика и функциональный анализ. — М.: Наука, 1974, с. 139-202. 65. Левитин Е. С, Милютин А. А., Осмоловский Н. П. Условия высших порядков локального минимума в задачах с ограничениями. — УМН 33, вып. 6, 1978, с. 85-148. 66. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972. 67. Линейные неравенства и смежные вопросы./Под ред. Г. Куна и А. Таккера. — М.: ИЛ, 1959. 68. Люстерник Л. А. Об условных экстремумах функционалов. — Матем. сб. 41, № 3, 1934, с. 390-401. 69. Люстерник Л. А., Соболев В. И. Элементы функционального анализа. — М.: Наука, 1965. 70. Магарил-Ильяев Г. Г. Теорема о неявной функции для липшицевых отображений. — УМН 33, вып. 1, 1978, с. 221-222. 71. Математика на службе инженера./Под ред. Н. X. Розова. — М.: Знание, 1973.
372 Список литературы 72. Моисеев Н. Н. Численные методы в теории оптимальных систем. — М.: Наука, 1971. 73. Моисеев Н. Н. Элементы теории оптимальных систем. — М.: Наука, 1975. 74. Мышкис А. Д. Математика: Специальные курсы для втузов. — М.: Наука, 1971. 75. Никайдо X. Выпуклые структуры и математическая экономика. — М.: Мир, 1972. 76. Hum И. В. Линейное программирование (с обсуждением некоторых нели- нелинейных задач). — М.: Изд-во МГУ, 1978. 77. Оптимальное управление. — М.: Знание, 1978. 78. Понтрягин JI. С. Оптимальные процессы регулирования. — УМН 14, вып. 1, 1959, с. 3-20. 79. Пшеничный Б. Н. Необходимые условия экстремума. — М.: Наука, 1969. 80. Пшеничный Б. П., Данилин Ю. М. Численные методы в экстремальных задачах. — М.: Наука, 1975. 81. Рокафеллар Р. Выпуклый анализ. — М.: Мир, 1973. 82. Романовский И. В. Алгоритмы решения экстремальных задач. — М.: Наука, 1977. 83. Рыбников К. А. Первые этапы вариационного исчисления./В кн.: Исто- рико-математические исследования, вып. 2. — М.-Л.: ГИТТЛ, 1949. 84. Тихомиров В. М. Некоторые вопросы теории приближений. — М.: Изд- во МГУ, 1976. 85. Фиакко А., Мак-Кормик Г. Нелинейное программирование. Методы последовательной безусловной минимизации. — М.: Мир, 1972. 86. Цейтен Г. Г. История математики в древности и в средние века. — М.- Л.: ОНТИ, 1938. 87. Цейтен Г. Г. История математики в 16 и 17 столетиях. — М.-Л.: ОНТИ, 1938. 88. Экланд П., Темам Р. Выпуклый анализ и вариационные проблемы. — М.: Мир, 1979. 89. Эрроу К. Дж., Гурвиц Л., Удзава X. Исследования по линейному и нели- нелинейному программированию. — М.: ИЛ, 1962. 90. Юдин Д. Б., Голъштейн Е. Г. Линейное программирование (теория, ме- методы, приложения). — М.: Наука, 1969. 91. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. — М.: Мир, 1974. 92. Balakrishnan A. V. Applied Functional Analysis. N.Y.: Springer, 1976. 93. Bolza О. Vorlesungen iiber Variationsrechnung. — Leipzig: 1949. 94. Bonnesen Т., Fenchel W. Theorie der konvexen Когрег. — В.: Springer, 1934.
Список литературы 373 95. Br0ndsted A. Conjugate convex functions in topological vector spaces. — Mat. Fys. Medd. Dansk.Vid. Selsk. 34, 2, 1964, p. 1-26. 96. Bushaw D. W. Differential equations with a discontinuous forcing term. — Princeton: Dept. of Math. Princeton Univ., 1952. 97. Caratheodory C. Variationsrechnung und partielle Differentialgleichungen erster Ordnung. — Leipzig-Berlin: Teubner, 1935. 98. Castaing C, Valadier M. Convex analysis and measurable multifunctions. Lecture Notes in Mathematics, № 580. — В.: Springer, 1977. 99. Clarke F. H. Generalized gradients and applications. — Trans. Amer. Math. Soc. 205, 1975, p. 247-262. 100. Cox M. J. On necessary conditions for relative minima. — Amer. J. Math. 66, № 2, 1944, p. 170-198. 101. Fenchel W. Convex Cones, Sets and Functions. — Princeton: Princeton Univ., 1951. 102. Fenchel W. On conjugate convex functions. — Canadian J. Marth. 1, 1949, p. 73-77. 103. Hadamard J. Calcul des variations. — Paris: Hermann, 1910. 104. Halkin H. On necessary conditions for optimal control of nonlinear sys- systems. — J. Analyse Math. 12, 1964, p. 1-82. 105. Hestenes M. R. Calculus of Variations and Optimal Control Theory. — N. Y.: Wiley, 1966. 106. Hestenes M. R. Optimization theory. The finite dimensional case. — N.Y.: Wiley, 1975. 107. Holmes R. B. Geometric functional analysis and its applications. — N.Y.: Springer, 1975. 108. John F. Extremum problems with inequalities as subsidiary conditions./In: Studies and Essays. Courant Anniversary Volume. — N. Y.: Interscience, 1948, p. 187-204. 109. Karush W. E. Minima of functions of several variables with inequalities as side conditions. — Chicago: Univ. of Chicago, 1939. 110. Klotzler R. Mehrdimensionale Variationsrechnung. — В.: VEB Deutscher Verlag, 1971. 111. Kuhn H. W., Tucker A. W. Nonlinear programming./In: Proc. of Second Berkeley Symp. — Berkeley: Univ. of California Press, 1951, p. 481-492. 112. Michel P. Une demonstration elementaire du principe du maximum de Pon- triaguine. — Bull. Math, economiques. 14, 1977. 113. Minkowski H. Geometrie der Zahlen. — Leipzig: Teubner, 1910. 114. Minkowski H. Theorie der konvexen Korper./In: Gesammelte Abhandlun- gen, Bd. II. — Leipzig-Berlin: Teubner, 1911. 115. Moisseyev N. N., Tihomirov V. M. Optimisation./In: Mathematics Applied to Physics. — N. Y.: Springer, 1970. 116. Morrey Ch.B. Multiple integrals in the calculus of variations. — N. Y.: Springer, 1966.
374 Список литературы 117. Neustadt L. W. Optimization. A theory of necessary conditions. — Prince- Princeton: Princeton Univ. Press, 1976. 118. Rockafellar R. T. The theory of subgradients and its applications to prob- problems of optimization. — Lecture Notes Univer. of Montreal., 1978. 119. Rockafellar R. T. Convex — Integral functuonals and duality./In: Contri- Contributions to Nonlinear Functional Analysis. — N.Y.: Acad. Press, 1971, p. 215-236. 120. Valentine F.A. The problem of Lagrange with differential inequalities as added side conditions./In: Contributions to Calculus of Variations. — Chicago: Univ. of Chicago Press, 1933-1937. Приведем список некоторых книг на русском языке, посвященных теории экстремума, вышедших после 1980 г., в которых обсуждается тематика настоящего издания 121. Аграчев А. А., Скачков Ю. С. Геометрическая теория управления. — М.: Физматлит, 2004. 122. Алексеев В. М., Галеев Э. М., Тихомиров В. М. Сборник задач по опти- оптимизации. — М.: Наука, 1984. 123. Арутюнов А. В. Условия экстремума. — М.: Факториал, 1997. 124. Зеликин МИ. Однородные пространства и уравнения Риккати в вариа- вариационном исчислении. — М.: Факториал, 1998. 125. Матвеев А. С, Якубович В. А. Оптимальные системы управлений. — С.-П.: Изд-во С.-Петербургского университета, 2003. 126. Милютин А. А., Дмитрук А. В., Осмоловский И. П. Принцип максиму- максимума в оптимальном управлении. — М.: МГУ, 2004.
Список основных обозначений V — квантор общности: «для всех» 3 — квантор существования: «существует» => — знак импликации: «из ... следует ...» <^> — знак эквивалентности def = — равно по определению = — равно в силу D) D) => — следует в силу D) х Е А — элемент х принадлежит множеству А х (? А — элемент х не принадлежит множеству А 0 — пустое множество A U В — объединение множеств А и В А П В — пересечение множеств А и В А\В — разность множеств А и В А С В — множество А содержится в множестве В Ах В — декартово произведение множеств А и В А-\- В — арифметическая сумма множеств А и В {х | Р(х)} — множество элементов х, обладающих свойством Р(-) {х\,... ,хп,...} — множество, состоящее из элементов х\, ..., хп, ... F: X —>> Y — отображение F множества X в множество Y; функция F с областью определения X, принимающая значения во множестве Y х I—»> F(x) — отображение (функция) F сопоставляет элементу х элемент F(x)\ обозначение для отображения (функции) F в случае, когда желательно указать обозначение его (ее) аргумента .F(-) — обозначение, которым подчеркивается, что F является отображени- отображением (функцией) F(A) — образ множества А при отображении F imF = {у | у = F(x),x E X} — образ отображения F: X —>> Y F~l(A) — прообраз множества А при отображении F F | А — ограничение отображения F на множество А F о G — суперпозиция отображений G и F: (F о G)(x) = F(G(x)) R — множество всех действительных чисел; числовая прямая R = R U {—оо, +оо} — расширенная числовая прямая inf A (sup A) — нижняя (верхняя) грань чисел, входящих в множество А С CR Rn — евклидово n-мерное пространство, наделенное стандартной евкли- евклидовой структурой, элементы Rn следует представлять себе в виде вектор- столбцов, даже если они по типографским соображениям набраны в строчку
376 Список основных обозначений R+ = {ж = (жь ... , жп) G Rn | Хг ^ 0} — неотрицательный ортант в Rn ei, ..., en — векторы стандартного ортонормированного базиса в Rn: ei = = A,0,...,0), .... en = @,...,l) Rn* — евклидово n-мерное пространство, сопряженное к Rn; элементы Rn* следует представлять себе как вектор-строчки п РХ = (р, х) = Y^j РгХг ДЛЯ ЛЮбыХ X G R™ И ?> G R™* г=1 хт — вектор-строчка, транспонированная к вектор-столбцу х — евклидова норма в Rn = (х х) = х х п (х \ у) = ^2 Xiyi — скалярное произведение в Rn г=1 ||ж|| — норма элемента х в нормированном пространстве р(х, у) — расстояние от элемента х до элемента у р(х, А) = inf{р(х, у) | у G А} — расстояние от элемента х до множества А В(х,г) = В(х,г) = р(х, у) < г} — замкнутый шар с центром ж радиуса г р(х, у) < г} — открытый шар с центром ж радиуса г А — замыкание множества А int A — внутренность множества А ТХМ (Т^М) — множество касательных векторов (односторонних каса- касательных векторов) к множеству М в точке х S?af = {х | f(x) ^ а} — лебеговское множество функции / на уровне а X* — пространство, сопряженное с X х* — элемент сопряженного пространства X* (ж*, ж) — значение линейного функционала ж* G X* на элементе х G X (х \ у) — скалярное произведение элементов х и у гильбертова простран- пространства А± = {ж* | (ж*,ж) = 0,ж G А} — аннулятор множества А dimL — размерность пространства L °U G О(Х) — множество °М открыто в пространстве X Ш G О(х,Х) — множество W, содержащее элемент ж, открыто в простран- пространстве X X/L — фактор-пространство пространства X по подпространству L 2?(Х, Y) — пространство непрерывных линейных отображений простран- пространства X в пространство У; отображения из пространства i?(Rn,Rm) могут отождествляться с их матрицами относительно стандартных базисов в Rn и Rm 9En{X,Y) — пространство непрерывных полилинейных отображений про- пространства X х ... х X в пространство Y I — единичный оператор; Е или Еп — матрица единичного оператора из i?(Rn,Rn), т. е. единичная матрица n-го порядка Л* — оператор, сопряженный с оператором Л; (Л*?/*,ж) = (у*, Ах) КегЛ = {ж | Лж = 0} — ядро линейного оператора 1тЛ = {у | у = Лж} — образ линейного оператора хтАх (у Ах) — обозначение для квадратичной (билинейной) формы с мат- п рицей А: у Ах = J2 ^чУгхз- i,j = l А > 0 — матрица А положительно определена А ^ 0 — матрица А неотрицательно определена
Список основных обозначений 377 С(К, Y) — пространство непрерывных отображений из К в Y с нормой длях(-) eC(K,Y) N-)ll = N-)llo = sup||x(t)|| гек С{К) = C(K,Y), если ясно, о каком Y идет речь, или если Y = R C([to,t\}) — пространство непрерывных функций на отрезке [to, ti] Cr(U) — множество отображений, имеющих в U непрерывные производные до порядка г включительно; обычно употребляется в выражениях: «функция / принадлежит классу Cr(U)» или «отображение F Е Cr(U)» Cr(A,Y) — пространство отображений отрезка А С R в пространство Y (обычно Y = Rn или Rn*), имеющих непрерывные производные до порядка г включительно; для ж(-) Е Cr(A,Y) \\х(-)\\ = \\х(-)\\г = тах{||Ж(.)||о, ||Х(.)||о,..., \\х(г\-)\\о} КС (A,Y) — пространство отображений отрезка А С R в пространство Y (обычно Y = Rn или Rn*), имеющих кусочно-непрерывную производную. Снабжено нормой как подпространство пространства С(А, Y) W^(A,Y) — пространство отображений отрезка А с R в пространство Y (обычно Y = Rn или Rn*), каждое из которых удовлетворяет условию Липшица с некоторой константой. Снабжено нормой как подпространство пространства С(А,У) F'(x\h) — производная функции F в точке х по направлению вектора h 5+F(x; •) — первая вариация отображения F в точке х 5F(x; •) — первая вариация по Лагранжу отображения F в точке х 5nF(x; •) — п-я вариация по Лагранжу отображения F в точке х Fy(x) — производная отображения F в точке х по Гато F'\х) — производная отображения F в точке х по Фреше F'\x)[h] или F'(x)h — значение производной отображения F в точке х на векторе h F E Dx{x) — отображение F дифференцируемо по Фреше в точке х F E SDl(x) — отображение F строго дифференцируемо в точке х F"(х) — вторая производная отображения F в точке х по Фреше F"(x)[h\,h2] — значение второй производной (как билинейной функции) на паре векторов h\ и hi h i—»> d2F(x; h) = F"(x)[h, h] — второй дифференциал отображения F в точ- точке х FXl(x\,X2) (FX2(x\,X2)) — частная производная по х\ (по х^) отображения F, т. е. производная отображения х\ ь->> F{x\,X2) (#2 ^ F(x\,X2)) [х\,Х2] = {х | х = ах\ + A — а)х2,0 < а < 1} — отрезок, соединяющий ТОЧКИ Х\, Х2 _dom/ = {х Е X | f(x) < +00} — эффективное множество функции /: X —»> ^R epi/ = {(х,а) Е X х R | f(x) < а,х Е dom/} — надграфик функции /: X^R SA — индикаторная функция множества А sA — опорная функция множества А IIА — функция Минковского множества А \\пА — линейная оболочка множества А aff A — аффинная оболочка множества А cone A — коническая оболочка множества А convA — выпуклая оболочка множества А
378 Список основных обозначений conv A — выпуклое замыкание, т. е. замыкание выпуклой оболочки множе- множества А df(x) — субдифференциал функции / в точке х /*(•) — функция, сопряженная с функцией /(•), преобразование Юнга- Фенхеля функции / /(ж) —»> inf (sup, extr), x G С — обозначение экстремальной задачи х — решение экстремальной задачи absmin (absmax, absextr) — абсолютный минимум (максимум, экстремум) х G absminC) (absmaxC), absextrC)) — х доставляет абсолютный мини- минимум (максимум, экстремум) в задаче з locmin (locmax, locextr) — локальный минимум (максимум, экстремум) х G locminC), (locmaxC), locextr(з)) — х доставляет минимум (максимум, экстремум) в задаче з J, ^, ^, &, 9JP — функционалы в задачах вариационного исчисления и оптимального управления i2 — квадратичный функционал вторичной задачи вариационного исчисле- исчисления. L = L(t,x,x) или L = L(t,x,x,u) — лагранжиан 2! — функция Лагранжа Ж — гамильтониан Н — функция Понтрягина & — функция Вейерштрасса
Предметный указатель Вектор, касательный в точке 156 Возмущение задачи 236 Выпуклое замыкание множества 196 функции 197 — программирование 45, 234 Выпуклый полиэдр 196 Гамильтониан 271, 336 Гамильтонова система 271, 336 Гиперплоскость 113, 195 График расширенный 330 Двойственная задача 238 Двойственное семейство 238 Дифференциал 127, 139, 144 Дифференцируемость, достаточные условия 135 Зависимость решений дифференци- дифференциальных уравнений от параметра 179 Задача Аполлония 16, 29, 38, 83 — Архимеда 16, 27, 38, 83 — Больца 36, 55 , необходимое условие экстре- экстремума 221 с незакрепленным време- временем 220 — двойственная 238 — Дидоны 13, 14, 15 — Евклида 16, 27, 38, 82 — изопериметрическая 66, 72 — изопериметрическая классиче- классическая 11, 31, 38, 92, 95 Задача изопифанная 12, 16 — Кеплера 17, 28, 38, 84 — классического вариационного ис- исчисления простейшая 37, 51, 330 , со старшими производ- производными 69, 72, 278 — Коши 169, 172, 177, 185 — о брахистохроне 22, 32, 38, 97 — об условном экстремуме 41 — о быстродействии 25, 33, 38, 89 минимальной поверхности вра- вращения 97 преломлении света 20, 38, 84 — оптимального управления 37, 73, 284, 286 , линейная по фазовым пере- переменным 310 элементарная 223, 321 —, условие минимума 223, 321 — оптимизации 11 — о рационе 25, 34, 38 — программирования выпуклого 37, 45, 234 линейного 37, 241 — Лагранжа 36, 70, 284 в понтрягинской форме 70, 268 — линейного программирования 241 двойственная 245 конечномерная 242 элементарная 219 — ляпуновская 312, 316 — Майера 36
380 Предметный указатель Задача Ньютона аэродинамиче- аэродинамическая 24, 29, 38, 86 — Тартальи 17, 86 — транспортная 25, 33, 38 — Чаплыгина 32, 92, 95 — Штейнера 18, 28, 38, 85 — экстремальная 11, 17, 27, 34 без ограничений 27 геометрическая 82 гладкая с ограничениями типа равенства 228, 257, 258 и неравенств 35, 226, 259, 263 , конечномерная 40 элементарная 35, 215 элементарная выпуклая 37, 215 гладкая 35, 215 линейного программирова- программирования 219 оптимального управле- управления 223, 321 Закон Снеллиуса 21, 85 — сохранения 357 импульса 364 момента количества движе- движения 364 энергии 363 Иголка элементарная 76, 289 Игольчатая вариация траектории, управления 76, 289, 290 Изопериметрическая задача 66, 72 классическая 11, 31, 38, 92, 94 Инвариантный интеграл Гильберта 347 Интеграл импульса 55 — энергии 55 Интегральный инвариант Пуанка- ре-Картана 341 — функционал, инвариантный отно- относительно семейства отображе- отображений 360 Интегрант 51, 269 Класс допустимых элементов 26 — смежности 108 Классы экстремальных задач 34 Комбинация аффинная, выпуклая, линейная, коническая 190 Конус сопряженный 210 Кривая Ньютона 87 Лагранжиан 51, 269, 287 Лемма Дюбуа-Реймона 53 обобщенная 274 — Лагранжа 52 — об аннуляторе ядра регулярного оператора 119 — об интегральных функциона- функционалах 291, 307 о скруглении углов 59 условиях минимума в эле- элементарной задаче оптимального управления 321 — о выпуклости образа 316 замкнутости конечнопорож- денного конуса в конечномерном пространстве 242 образа 118 минимаксе 252 нетривиальности аннулято- ра 116 пакете иголок 290, 299 правом обратном отображе- отображении 117 приращении функционала 79 свойствах элементарной вариа- вариации 76 сопряженном конусе 248 суперпозиционной измеримо- измеримости 315 — Хоффмана 250 Линейное программирование 26, 37, 219, 241 — дифференциальное уравнение 173 Максимум 11 — абсолютный 27, 61 — локальный 27 — сильный 59, 61 — слабый 51, 334, 335 Матрица Якоби 139 Метод вариаций 54 — возмущений 236
Предметный указатель 381 Минимум 11 — абсолютный 27, 61, 347 — локальный 27 — сильный 59, 61, 66, 332, 354 — слабый 51, 71, 334, 335 Многогранник выпуклый 191 Множество выпуклое 45, 189 на прямой 191 — лежандрово 341 — эффективное 193 Множители Лагранжа 41, 45, 227, 269, 287 Надграфик функции 193 Неравенство Гронуолла 171 — для энтропии 195 — Иенссена 45, 193 — изопериметрическое 13 Неравенство Коши 195 — Юнга 202 Несобственные числа 193 Норма 106 — эквивалентная 107 Оболочка аффинная выпуклая, ко- коническая, линейная 189 Ограничения 26 — изопериметрические 268 — фазовые 70, 285 Оператор дифференциальной свя- связи 161 — краевых условий 165 — Немыцкого 159, 160 Опорная функция множества 247 Основная лемма классического ва- вариационного исчисления 52 Отображение аффинное 129 —, дифференцируемое по Фреше в точке 126 — значений 165 — измеримое 299 — интегральное 161, 163 — обратное 117, 153 — полилинейное 129 — сжимающее 147 — строго дифференцируемое 126 Пакет иголок 290 Поле векторное 357 — экстремалей 347 центральное 353 Полиэдр выпуклый 196 Полупространство замкнутое, от- открытое 113, 195 Правило множителей Лагранжа 40 для гладких задач с равен- равенствами и неравенствами 227 Преобразование Лежандра 202 классическое 204, 336 — Юнга - Фенхеля 202 Пример Больца 61 — Гильберта 57 Принцип Гюйгенса 20 -Лагранжа 44, 81, 223 для гладких задач 227, 228 задачи выпуклого програм- программирования 236 Лагранжа 270 оптимального управления 288 , линейной по фазо- фазовым переменным 326 Принцип Лагранжа для ляпунов- ской задачи 316 — максимума Понтрягина 75, 287 для задачи со свободным концом 76 — сжимающих отображений моди- модифицированный 147 — Ферма вариационный 19 Программирование выпуклое 45, 234 -линейное 25, 37, 219, 241 Произведение пространств 108 Производная в точке 39, 40 по направлению 125 — высших порядков 140 — Гато 125 — Фреше 126 , существование 135, 136 — частная 40, 137 Простейшая задача классического вариационного исчисления 37, 51, 330 , расширения 57 Пространство банахово 107
382 Предметный указатель Пространство, касательное в точ- точке 156 — нормированное 106 — сопряженное 107 Процесс допустимый 310 — оптимальный 73, 284, 310 в слабом смысле 71, 268 локально 284 — управляемый 71, 73, 268, 284 допустимый 71, 73, 268, 284 Прямая вещественная расширен- расширенная 27 Расстояние от точки до множе- множества 247 Решение дифференциального урав- уравнения 167 — экстремальной задачи 27 Связь голономная 70 — дифференциальная 36, 70, 268 Седловая точка 48 Семейство экстремальных задач двойственное 238 Симплекс п-мерный 191 Сопряженная система 173 Сопряженное уравнение 270, 288 Субдифференциал 207 — нормы 208 Теорема Банаха об обратном опера- операторе 117 — Боголюбова 62 Теорема Вейерштрасса в достаточ- достаточных условиях сильного миниму- минимума 354 о существовании минимума 82, 226 — двойственности для задач выпук- выпуклого программирования 240 — линейного программиро- программирования 245 о кратчайшем расстоянии 247 ляпуновских задач 323 — Дубовицкого-Милютина о пере- пересечении конусов 211 Теорема Дубовицкого-Милютина о субдифференциале максиму- максимума 211 — единственности 172 — Каратеодори 191 — Крейна-Мильмана 313 — Куна-Таккера 45 , субдифференциальная фор- форма 235 — Лагранжа о среднем значении 134 — Лебега 122 — Люстерника 157 — Ляпунова А. А. 313 — Минковского 200 — Моро-Рокафеллара 208 — Нётер Э. 360 — об интегральном инварианте 339 обратной функции 42 обратном отображении 153 оценке конечного приращения 134 — о дифференцируемой зависимо- зависимости решений от начальных дан- данных 182, 185 минимаксе 240 непрерывной зависимости ре- решений от параметра 179 неявной функции 146 классическая 151 полном дифференциале 137 смешанных производных 142 среднем 134 существовании решений гло- глобальная 177 локальная 169 — отделимости вторая 116 конечномерная 46, 49 первая 114 — о фактор-пространстве 109 — о формуле Тейлора 144 — Рисса 123 — существования в задаче линейно- линейного программирования 242 — Фенхеля-Моро 205 — Ферма 18, 39, 216 для функций п переменных 40 — Хана-Банаха 112
Предметный указатель 383 Теорема Эйлера-Лагранжа 72 — Якоби о достаточных условиях слабого минимума 335, 354 Терминант 269, 287 Точка, допустимая по ограничению 26 — крайняя 313 — седловая 48 — сопряженная 334 — стационарная 39, 40, 42, 51, 217 — Торичелли 18, 85 Траектория фазовая 284 Управление 70, 119, 284 Управляемый процесс 268, 284 допустимый 284 Уравнения в вариациях 183, 185 — Гамильтона-Якоби 343 — линейные дифференциальные 173 — Эйлера 15, 51, 55, 330 Лагранжа 72 Пуассона 69, 281 — Якоби 334 Условия Вейерштрасса 66, 202, 332 Эрдмана 288 — граничные 36, 70, 268 — дополняющей нежесткости 45, 220, 225 — краевые 70, 268 — Лежандра 332, 333 усиленные 335 — Липшица 121 — Слейтера 45 — согласования знаков 219, 225 — соответствия знаков 219, 225 — трансверсальности 14, 56 — экстремума в задаче линейного программирования 220, 245 достаточные в гладкой задаче 217, 258, 263 простейшей задаче вари- вариационного исчисления 345, 347, 348, 354 — задаче оптимального управления, линейной по фазо- фазовым переменным 327 Условия экстремума достаточные в задаче оптимального управления элементарной 223, 321 , необходимые в гладкой задаче 216, 257, 259 изопериметрической зада- задаче 67 задаче Больца 55, 221 выпуклого программи- программирования 45, 235 Лагранжа 72, 269 оптимального управле- управления 75, 287 , линейной по фазо- фазовым переменным 326 элементарной 223, 321 — простейшей задаче ва- вариационного исчисления 51, 330-332, 334 — Якоби 334 усиленные 335 Условный экстремум 36, 41 Фазовые ограничения 285 — переменные 70 Фактор-пространство 109 Форма квадратичная, тернарная сте- степени п 130 Формализация 27 Формула Дирихле 124 — конечных приращений 134 — Ньютона-Лейбница 120 Фундаментальная матрица решений однородной системы 175, 186 Функционал 27 — Больца 36, 56, 220, 268 — интегральный 36, 161, 291 инвариантный относительно семейства отображений 360 — смешанный 36 — терминальный 36 Функция абсолютно непрерывная 120 — аффинная 197 Функция Вейерштрасса 66, 202, 332 — выпуклая 45, 194 на прямой 194
384 Предметный указатель Функция выпуклая однородная ПО — Гамильтона 271, 336 —, дифференцируемая в точке 39, 40 — допустимая 330 — замкнутая 197 — измеримая 120, 299 — индикаторная 195 — интегрируемая 120 — Лагранжа 40, 45, 71, 74, 224, 225, 227, 234, 268, 286, 316 расширенная 238 — локально интегрируемая 167 — Минковского 111, 195 — наклона поля 347 — несобственная 193 — ограниченной вариации канони- каноническая 122 — опорная 199 — полунепрерывная снизу 197, 226 — Понтрягина 271, 287 — собственная 193 Функция сопряженная 202 к норме 205 б'-функция 237 Экстремаль 51, 339 — каноническая 339 Экстремальная задача, см. Задача экстремальная Экстремум 11, 26 — локальный 27 — сильный 59, 330 — слабый 51, 268, 330 — условный 35 Экстремума условия, см. Условия экстремума Элементарная вариация процесса 76 — игольчатая вариация траектории, управления 76, 289 — экстремальная задача 35, 37, 215, 219