Text
                    Э. М. Галеев
ОПТИМИЗАЦИЯ
ТЕОРИЯ, ПРИМЕРЫ, ЗАДАЧИ
Рекомендовано
Научно-методическим советом
по математике и механике УМО
университетов Российской Федерации
в качестве учебного пособия
Издание третье,
исправленное и дополненное
URSS
МОСКВА


ББК 22.18я73 22.318 22.161.8 65.05 65.23 22.1п Галеев Эльфат Михайлович Оптимизация: Теория, примеры, задачи: Учебное пособие. Изд. 3-е, испр. и доп. — М.: Книжный дом «ЛИБРОКОМ», 2010. — 336 с. Настоящая книга посвящена важнейшим проблемам оптимизации. В ее основе лежат курсы и спецкурсы по теории оптимизации, прочитанные автором на механико-математическом факультете МГУ. Рассматриваются фрагменты следующих разделов теории экстремальных задач: линейного и выпуклого программирования, математического программирования, классического вариационного исчисления и оптимального управления. Приводятся как необходимые, так и достаточные условия экстремума. Для изучения этих разделов в необходимом объеме даются элементы функционального и выпуклого анализа. В каждом параграфе после теоретической части приводятся примеры решения задач, предлагаются задачи для решения на семинарах, в контрольных работах, а также для самостоятельного усвоения материала. Дается обзор общих методов теории экстремума. Для студентов вузов, обучающихся по специальностям «Математика», «Прикладная математика», а также для аспирантов, преподавателей и научных работников. Издательство «Книжный дом "ЛИБРОКОМ"». И 7312, Москва, пр-т Шестидесятилетия Октября, 9. Формат 60x90/16. Печ. л. 21. Зак. № 2952. Отпечатано в ООО «ЛЕНАНД». 117312, Москва, пр-т Шестидесятилетия Октября, 11 А, стр. 11. ISBN 978-5-397-4)1176-1 © Э. М. Галеев, 2002, 2009 © Книжный дом «ЛИБРОКОМ», 2009 7851 ID 107101 illlllllllMI 785397Ό1176111 Все права защищены. Никакая часть настоящей книги не может быть воспроизведена или передана в какой бы то ни было форме и какими бы то ни было средствами, будь то электронные или механические, включая фотокопирование и запись на магнитный носитель, а также размещение в Интернете, если на то нет письменного разрешения владельцев. НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА E-mail: URSS@URSS.ru Каталог изданий в Интернете: http://URSS.ru Тел./факс: 7 (499) 135-42-16 URSS Тел./факс: 7 (499) 135-42-46
Оглавление Предисловие ко второму и третьему изданиям 9 Предисловие 10 Введение 13 Глава 1. Экстремальные задачи 15 § 1. Конечномерные задачи без ограничений 15 1.1. Постановка задачи 15 1.2. Необходимые и достаточные условия экстремума 15 1.2.1. Функции одной переменной 15 1.2.2. Функции нескольких переменных 18 1.2.3. Теорема Вейерштрасса и следствие из нее 20 1.2.4. Критерий Сильвестра 20 1.2.5. Метод Ньютона (метод касательных) 21 1.3. Правило решения 23 1.4. Примеры 24 1.5. Задачи 30 § 2. Конечномерные гладкие задачи с равенствами 31 2.1. Постановка задачи 31 2.2. Необходимые и достаточные условия экстремума 32 2.2.1. Принцип Лагранжа 32 2.2.2. Конечномерная теорема об обратной функции 34 2.2.3. Необходимое условие экстремума II порядка 34 2.2.4. Достаточное условие экстремума II порядка 35 2.3. Правило решения 37 2.4. Примеры 38 2.5. Задача Аполлония 39 2.6. Задачи 42 § 3. Конечномерные гладкие задачи с равенствами и неравенствами 43 3.1. Постановка задачи 43 3.2. Необходимые и достаточные условия экстремума 43 3.2.1. Принцип Лагранжа 43 3.2.2. Необходимое условие экстремума II порядка 44 3.2.3. Достаточное условие экстремума II порядка 45 3.3. Правило решения 46
4 Оглавление 3.4. Примеры 47 3.5. Задачи 49 § 4. Выпуклые задачи 51 4.1. Элементы выпуклого анализа. Субдифференциал 51 4.2. Теоремы отделимости 54 4.3. Задачи без ограничений 55 4.4. Задачи с ограничением 56 4.5. Задача выпуклого программирования 56 4.6. Задачи, упражнения 61 § 5. Элементы функционального анализа 62 5.1. Нормированные и банаховы пространства 62 5.1.1. Определение пространств 62 5.1.2. Произведение пространств 64 5.1.3. Примеры банаховых пространств 64 5.1.4. Сопряженное пространство, оператор 65 5.2. Определения производных 65 5.2.1. Производная по направлению 66 5.2.2. Вариация по Лагранжу 66 5.2.3. Производная Гато 66 5.2.4. Производная Фреше 67 5.2.5. Строгая дифференцируемость 67 5.2.6. Частные производные 68 5.2.7. Производные высших порядков 68 5.2.8. Контрпримеры на дифференцируемость 69 5.3. Некоторые теоремы дифференциального исчисления в нормированных пространствах 71 5.3.1. Теорема о суперпозиции 71 5.3.2. Формула Тейлора 74 5.3.3. Теорема о среднем 74 5.3.4. Теорема о полном дифференциале 77 5.4. Дополнительные сведения из алгебры и функционального анализа 78 5.5. Задачи 84 § 6. Гладкая задача без ограничений 86 6.1. Постановка задачи 86 6.2. Необходимые условия I порядка 86 6.3. Необходимые и достаточные условия II порядка 87 § 7. Гладкая задача с равенствами 89 7.1. Постановка задачи 89 7.2. Необходимые условия I порядка 89 7.3. Необходимые условия II порядка 91
Оглавление 5 7.4. Достаточные условия II порядка 92 § 8. Гладкая задача с равенствами и неравенствами 93 8.1. Постановка задачи 93 8.2. Необходимые условия I порядка 93 8.3. Необходимые условия II порядка 97 8.4. Достаточные условия II порядка 102 § 9. Элементы общей теории поля 108 Ответы к задачам главы 1 110 Глава 2. Линейное программирование 117 § 1. Симплекс- метод 118 1.1. Постановки задач. Геометрическая интерпретация .... 118 1.2. Правило решения задач по симплекс- методу 120 1.3. Примеры 123 1.4. Задачи 127 § 2. Двойственность в линейном программировании . .' 128 2.1. Элементы выпуклого анализа. Преобразование Лежандра 128 2.2. Примеры 129 2.3. Вывод двойственных задач 131 2.3.1. Вывод задачи двойственной к задаче в общей форме . . 131 2.3.2. Вывод задачи двойственной к двойственной задаче для задачи линейного программирования в общей форме 132 2.3.3. Вывод задачи двойственной к задаче в канонической форме 133 2.3.4. Упражнения 133 § 3. Обоснование симплекс- метода 134 3.1. Теоремы существования, двойственности, критерий решения 134 3.2. Свойства множества допустимых точек 137 3.3. Доказательство симплекс- метода 139 § 4. Методы нахождения начальной крайней точки 142 4.1. Переход к решению двойственной задачи 142 4.2. Метод искусственного базиса 144 4.3. Примеры 147 4.4. Задачи 153 § 5. Транспортная задача 154 5.1. Постановка задачи 154 5.2. Особенности задачи 156
6 Оглавление 5.3. Методы нахождения начальной крайней точки 157 5.4. Метод потенциалов 162 5.5. Примеры транспортных задач 163 5.6. Задача двойственная к транспортной задаче 170 5.7. Обоснование метода потенциалов решения транспортной задачи . . 171 5.8. Задача о назначении. Пример 173 5.9. Задачи 175 Ответы к задачам главы 2 176 Глава 3. Вариационное исчисление 178 § 1. Простейшая задача вариационного исчисления 179 1.1. Постановка задачи 179 1.2. Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления 179 1.3. Вывод уравнения Эйлера с помощью леммы Дюбуа-Реймона 181 1.4. Векторный случай 183 1.5. Интегралы уравнения Эйлера 184 1.6. Примеры 184 1.7. Задачи 185 § 2. Задача Больца 190 2.1. Постановка задачи 190 2.2. Необходимое условие экстремума 191 2.3. Многомерный случай 192 2.4. Пример 193 2.5. Задачи Больца 195 § 3. Задача с подвижными концами 196 3.1. Постановка задачи 196 3.2. Необходимые условия экстремума 197 3.3. Пример 197 3.4. Задачи с подвижными концами 199 § 4. Изопериметрическая задача 202 4.1. Постановка задачи 202 4.2. Необходимое условие экстремума 203 4.3. Пример 205 4.4. Задача Дидоны 206 4.5. Изопериметрические задачи 208 § 5. Задача со старшими производными 211 5.1. Постановка задачи 211
Оглавление 5.2. Вывод уравнения Эйлера—Пуассона с помощью леммы Лагранжа 212 5.3. Вывод уравнения Эйлера—Пуассона с помощью леммы Дюбуа-Реймона 213 5.4. Пример 215 5.5. Задачи со старшими производными 217 § 6. Задача Лагранжа 220 6.1. Постановка задачи 220 6.2. Необходимые условия экстремума 221 6.3. Примеры 225 6.4. Вывод уравнения Эйлера—Пуассона из теоремы Эйлера—Лагранжа 228 6.5. Задачи Лагранжа 229 Ответы к задачам главы 3 235 Глава 4. Задачи оптимального управления 247 § 1. Принцип максимума Понтрягина в общем случае 248 1.1. Постановка задачи 248 1.2. Формулировка теоремы 249 1.3. Пример 250 § 2. Формулировка и доказательство принципа максимума Понтрягина для задачи со свободным концом 253 § 3. Избранные задачи оптимального управления 258 3.1. Простейшая задача о быстродействии 258 3.2. Аэродинамическая задача Ньютона 262 3.3. Примеры задач оптимального управления 266 3.4. Задачи оптимального управления 271 Ответы к задачам главы 4 275 Глава 5. Условия второго порядка в вариационном исчислении .... 281 § 1. Простейшая задача вариационного исчисления 281 1.1. Сильный и слабый экстремум 281 1.2. Пример слабого, но не сильного экстремума 282 1.3. Условия Лежандра, Якоби, Вейерштрасса 284 1.4. Необходимые и достаточные условия слабого и сильного экстремума 287 1.4.1. Игольчатые вариации. Условие Вейерштрасса 287 1.4.2. Необходимое условие сильного экстремума — неравенство (7) 290 1.4.3. Необходимые условия сильного экстремума 293 1.4.4. Лемма о скруглении углов 294
8 Оглавление 1.4.5. Необходимые условия слабого экстремума 295 1.4.6. Поле экстремалей 297 1.4.7. Достаточные условия слабого экстремума 303 1.4.8. Достаточные условия сильного экстремума 303 1.4.9. Квадратичный функционал 304 1.5. Правило решения 306 1.6. Примеры 308 1.7. Задачи 312 § 2. Задача Больца 316 2.1. Сильный и слабый экстремум 316 2.2. Условия экстремума II порядка 316 2.2.1. Необходимые условия слабого экстремума 316 2.2.2. Достаточные условия сильного экстремума 319 2.2.3. Квадратичный функционал 322 2.3. Пример 324 Ответы к задачам главы 5 326 Список литературы 330 Список обозначений 331 Предметный указатель 333
Предисловие ко второму и третьему изданиям Во втором и третьем изданиях исправлены все замеченные опечатки предыдущих изданий, расписаны подробнее некоторые доказательства, существенно более подробно изложены примеры, убрано громоздкое доказательство принципа максимума Понтрягина в общем случае, и, самое главное, добавлено большое число новых задач и простых, и более сложных. При большем числе задач легче будет преподавателю выбирать те из них, которые более соответствуют излагаемому в соответствующем ВУЗе курсу. Основная часть задач взята из более ранних задачников, написанных автором вместе с Алексеевым В. М., Кушниренко А. Г., Тихомировым В. Μ. ^ Первой попыткой создания соответствующего задачника был изданный по инициативе Тихомирова в 1980 г. в МГУ «Сборник задач по оптимальному управлению» (Галеев, Кушниренко, Тихомиров). В 1984 г. в издательстве «Наука» вышел «Сборник задач по оптимизации» (Алексеев, Галеев, Тихомиров), в котором были существенно расширены и теоретический, и задачный материал. В эти задачники были включены многие классические задачи, задачи, используемые преподавателями при ведении обязательного курса «Вариационное исчисление и оптимальное управление». Авторами задач являются многие профессора и преподаватели кафедры общих проблем управления. Большая часть задач была создана специально для задачника студентами и аспирантами МГУ под руководством автора, а также самим автором. Этот задачник стал использоваться во многих ВУЗах при ведении занятий по курсам оптимизации и написании учебников и задачников. Задачи по линейному программированию частично взяты из «Сборника задач по линейному программированию» — Заславский Ю.Л. М.: Наука, 1969.
Предисловие Задачи на отыскание наибольших и наименьших величин являются актуальными на протяжении всей истории развития человечества. Особенное значение они приобретают в настоящее время, когда возрастает важность наиболее эффективного использования природных богатств, людских ресурсов, материальных и финансовых средств. Все это приводит к необходимости отыскивать наилучшее, или, как говорят, оптимальное решение того или иного вопроса. Первые задачи на максимум и минимум были поставлены и решены в глубокой древности, когда математика только зарождалась как наука. Теория экстремальных задач начала создаваться в начале XVII века, и затем она активно развивалась вплоть до наших дней, включая в свою орбиту крупнейших математиков, таких как Ферма, Ньютон, Лейбниц, Бернулли, Эйлер, Лагранж, Пуанкаре, фон Нейман, Канторович, Пон- трягин и других. В наше время невозможно мыслить себе полноценное математическое образование без элементов теории экстремума. Монография является переработанным и расширенным переизданием первых пяти глав, написанных Галеевым, книги Галеев Э. М., Тихомиров В. М. «Оптимизация: теория, примеры, задачи». М.: УРСС, 2000. Книга состоит из 5 глав. Они содержат материал курса лекций по методам оптимизации, линейному программированию, оптимальному управлению и вариационному исчислению, а также спецкурса по условиям экстремума второго порядка на механико-математическом факультете Московского государственного университета, а также в некоторых институтах естественнонаучного профиля. Данный курс лекций был разработан целым рядом профессоров и преподавателей механико-математического факультета МГУ, на начальном этапе курс сформировался усилиями В. М. Алексеева, В. М. Тихомирова, С. В. Фомина. При написании книги использовался материал, содержащийся в ранее опубликованных книгах: [АТФ] — Алексеев В. М., Тихомиров В. М., Фомин С. В. «Оптимальное управление». М.: Наука, 1979; [АГТ] — Алексеев В. М., Галеев Э. М., Тихомиров В. М. «Сборник задач по оптимизации». М.: Наука, 1984; [ГТ] — Галеев Э, М., Тихомиров В. М. «Краткий курс теории экстремальных задач». М.: Изд-во МГУ, 1989. Книга является расширенным вариантом пособия Галеева Э. М. «Курс лекций по вариационному исчислению и оптимальному управлению». М.: Изд-во мехмата МГУ, 1996. Она предназначена для курсов, включающих элементы теории экстремума любого уровня и приспособлена к действующим ныне программам. Все чертежи в LATEX'e 2ε выполнены Галеевой Альфирой.
Предисловие Рассматриваются следующие разделы теории экстремальных задач: задачи без ограничений, гладкие задачи с ограничениями типа равенств и неравенств, линейное программирование, вариационное исчисление, оптимальное управление, необходимые и достаточные условия экстремума в вариационном исчислении. При изучении данных разделов требуется знание основ математического анализа и линейной алгебры, изучаемых на первых двух курсах технических и педагогических вузов, университетов. Предполагается, что читатели знакомы с элементарными приемами дифференцирования и интегрирования функций, умеют решать простейшие дифференциальные уравнения, знакомы с элементарными навыками работы с матрицами (умножением, транспонированием, нахождением обратной). Все остальные используемые в курсе математические понятия подробно определяются. В первой главе рассматриваются задачи без ограничений, задачи с ограничениями типа равенств, с ограничениями типа равенств и неравенств для числовых функций η переменных и в нормированных пространствах. Для каждого типа задач приводятся решения соответствующих примеров. Одним из примеров является старинная задача Аполлония о нормалях к эллипсу. Методами теории экстремальных задач решается задача из курса алгебры о приведении квадратичной формы к главным осям. Большое внимание уделяется выпуклым задачам. Даются элементы выпуклого анализа, причем выпуклый анализ в зависимости от уровня математической подготовки читателя может рассматриваться как в конечномерных пространствах, так и в линейных нормированных пространствах, вводится понятие субдифференциала и доказывается теорема Куна—Таккера. В этой же главе даются некоторые элементы функционального анализа и дифференциального исчисления в нормированных пространствах. Вторая глава посвящена линейному программированию. В ней вначале даются постановки задач линейного программирования, правило решения задач в канонической форме по симплекс-методу, приводятся с решениями примеры. Вводится понятие двойственности, затем проводится строгое обоснование симплекс-метода, дается ряд методов нахождения первоначальной крайней точки. Полученные навыки применяются к некоторым наиболее известным типам задач линейного программирования — транспортным задачам и задачам о назначении. Основная цель при этом — ознакомление студентов с имеющимися методами решения задач линейного программирования и проведение обоснования этих методов. Обоснование проводится таким образом, чтобы для решения подобных задач в дальнейшем возможно было бы самостоятельно создать метод решения и провести его обоснование. В пособии приведены доказательства теоремы существования решений и теоремы двойственности, позволяющие более глубоко понять данный курс.
12 Предисловие В третьей главе приводятся следующие элементарные задачи классического вариационного исчисления: простейшая задача, задача Больца, изопериметрическая задача. Все эти задачи являются частным случаем более общей задачи Лагранжа. Как частный случай задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными. В четвертой главе рассматриваются задачи оптимального управления. Приводится формулировка принципа максимума Понтрягина в общем случае, а также доказательство принципа максимума для задачи со свободным концом. Решаются простейшая задача о быстродействии, задача Ньютона и ряд других задач оптимального управления. В пятой главе даны необходимые и достаточные условия экстремума в простейшей задаче классического вариационного исчисления и задаче Больца. Галеев Э. М. Автор благодарит В.М.Тихомирова, у которого учился теории и решению задач на экстремум и который внес огромный вклад в разработку курсов оптимизации.
Введение Теорию задач на отыскание наибольших и наименьших величин называют теорией экстремальных задач. Слово maximum по латыни означает «наибольшее», слово minimum — «наименьшее». Оба этих понятия объединяются словом «экстремум» (от латинского extremum, означающего «крайнее»). Слово «экстремум», как термин, объединяющий понятия «максимум» и «минимум», ввел в употребление Дюбуа-Реймон. Ныне раздел анализа, в котором изучают разнообразные задачи на максимум и минимум, называют теорией экстремальных задач. Запись задачи в виде f(x) —► extr означает, что мы должны решить и задачу на минимум, и задачу на максимум. Задачу на максимум всегда можно свести к задаче на минимум, заменив задачу f(x) -~+ max задачей f(x) -~+ min, где f(x) = -f{x), и наоборот. Поэтому в тех случаях, когда формулировки теорем для задач на минимум и максимум различны, мы иногда будем ограничиваться рассмотрением задачи на минимум. Задачи на максимум и минимум изначально формулируются, как правило, на языке той области, в которой они возникают. А исследуют их средствами математического анализа. Для того, чтобы можно было воспользоваться этими средствами, необходимо перевести формулировку задачи на язык математического анализа. Такой перевод называется формализацией. В общем виде формализованная задача выглядит следующим образом: найти экстремум (максимум или минимум) функции f : X —> R, определенной на некотором пространстве X при ограничении χ Ε D (D С X). Кратко записываем так: f(x) -> extr; x£D. (P) Для функции одной переменной X = R, для функции нескольких переменных X = Rn. В более общих случаях X может быть линейным, нормированным или топологическим пространством. Ограничение χ е D может быть записано в виде включения, а также в виде уравнений или неравенств. (Р) — нумерация (обозначение) задачи (от английского слова problem — задача). Множество допустимых элементов в задаче (Р) обозначаем D = D(P) или Dp. Если множество допустимых элементов совпадает со всем пространством (D = X), то задачу (Р) называем задачей без ограничений. Решением задачи (Р) на минимум является точка ώ такая, что f(x) ^ /(£) для всех точек χ G D(P). В этом случае мы пишем
14 Введение at Ε absminP. Такой минимум называется еще абсолютным, или глобальным. Аналогично определяется абсолютный максимум в задаче (absmaxP). Величина /(£), где at — решение задачи, называется численным значением задачи и обозначается Sm\n или Smax (иногда, чтобы подчеркнуть глобальность экстремума, Sabsmin или Sabsmax). Множество решений задачи (Р) обозначается AigP. Если экстремум не достигается, то мы должны указать последовательность точек хп, на которой значение функции f(xn) стремится к величинам Smin и Smax. При решении задачи следует отыскать не только абсолютные (глобальные) экстремумы задачи, но и локальные экстремумы. Точка at является точкой локального минимума в задаче (Р) (пишем χ Ε locminP), если существует окрестность U точки ± такая, что f(x) ^ f(±) для любой допустимой точки χ из этой окрестности (Ух € D Г) U). Аналогично точка £ является точкой локального максимума в задаче (Р) (пишем £ Ε locmaxP), если существует окрестность U точки έ такая, что f(x) < /(£) Ух £ D C\U. Если речь идет о максимуме или минимуме, то пишем locextrP. В связи с каждой экстремальной задачей возникают вопросы: каковы необходимые условия экстремума, каковы достаточные условия, существует ли решение задачи, как найти решение явно или численно. В теории экстремальных задач наиболее разработаны необходимые условия, которым должно удовлетворять решение задачи. Выписывая эти необходимые условия экстремума, мы находим некоторое множество точек, удовлетворяющее этим условиям. Это множество точек (мы называем их стационарными, или критическими, или экстремальными), возможно, шире, чем множество абсолютных и даже локальных экстремумов. Поэтому далее надо с каждой такой точкой разобраться, доставляет она экстремум (и какой) или нет. Это делается с помощью достаточных условий. Одним из важнейших принципов решения задач с ограничениями является принцип Лагранжа снятия ограничений. Ниже он будет сформулирован и доказан для некоторых конкретных типов задач. Сфера применимости принципа Лагранжа достаточно широка. Иногда нельзя к задаче применить имеющуюся теорему, однако этот принцип, примененный без обоснования, тем не менее может привести к точкам, среди которых можно выделить решение.
Глава 1 Экстремальные задачи § 1. Конечномерные задачи без ограничений В этом параграфе даются необходимые и достаточные условия экстремума функций одной и нескольких переменных. 1.1. Постановка задачи Пусть / : Rn —> R — функция η действительных переменных, обладающая некоторой гладкостью. Под гладкостью мы понимаем определенную дифференцируемость функции. Если функция / дифференцируема к раз в точке х, мы пишем / G Dk(x). Гладкой конечномерной экстремальной задачей без ограничений называется следующая задача: f(x) -> extr. При решении задачи надо найти не только абсолютные (глобальные) экстремумы (минимумы и максимумы) функции, но и локальные экстремумы. Точка χ является точкой локального минимума (максимума) функции /, если существует окрестность U€ = {χ | |ж - х\ < ε} точки χ такая, что f(x) ^ f(x) (f(x) < /(£)) для любой точки χ из этой окрестности. При этом мы пишем χ G locmin/ (x G locmax/), а если речь идет о минимуме или максимуме, то пишем χ G locextr/. 1.2. Необходимые и достаточные условия экстремума 1.2.1. Функции одной переменной Теорема 1 (Ферма). Пусть f : R —► R — функция одного действительного переменного. Если χ G locextr/ — точка локального экстремума функции f и f G D(x) дифференцируема в точке х, то /'(*) = о.
16 Глава 1. Экстремальные задачи Это соотношение мы называем условием стационарности или необходимым условием экстремума I порядка. Точки, удовлетворяющие условию стационарности, называются стационарными. Доказательство. По определению дифференцируемости /(* + Л) = /(*) + f(x)h + r(ft), r(ft) - o(h) = o(\)h при малых ft. Значит, f(x + ft) - /(ж) = (/'(ж) -f o(l))ft. Если бы f'(x) ^ 0, то при ft достаточно близких к нулю, величина /'(ж)-Ьо(1) имела бы знак /'(£), поскольку о(1) —* 0 при ft —► 0. Само же ft может принимать как положительные, так и отрицательные значения. Следовательно, разность f(x -f ft) - /(&) может быть как меньше, так и больше нуля. Это противоречит тому, что /(£ + ft) - /(£) ^ 0 при χ G locmin/ и /(ж -f ft) - /(ж) < 0 при ж G locmax/. ■ Геометрически теорема Ферма утверждает, что в точке экстремума дифференцируемой функции касательная к ее графику горизонтальна. Теорема Ферма дает необходимое условие I порядка для существования локального экстремума. Сформулируем необходимые и достаточные условия экстремума I—II порядка. Теорема 2. Пусть функция / G D2(x) дважды дифференцируема в точке х. Необходимые условия экстремума: если χ G locmin / — точка локального минимума функции /, то /'(*) = 0, /"(4)>0. Достаточные условия экстремума: если /'(*) = 0, /"(ж)>0, то χ € locmin / — точка локального минимума функции /. Доказательство. По формуле Тейлора /(ж + ft) = f(x) + /'(*)ft + ^/"(*)ft2 + r(ft), r(ft) = o(ft2). Необходимость. Пусть ж G locmin/. Тогда, во-первых, по необходимому условию экстремума I порядка для функций одной переменной — теореме Ферма — /'(ж) = 0, во-вторых, /(ж -f ft) - /(£) ^ 0 при достаточно малых ft. Поэтому в силу формулы Тейлора /(ж -h ft) - /(ж) = ^/"(a)ft2 + r(h) > 0 (r(ft) = o(h2)) при малых ft. Разделим обе части последнего неравенства на ft2 и устре- r(ft) мим ft к нулю. Поскольку —г ► 0, то получим, что f"(x) ^ 0.
§ 1. Конечномерные задачи без ограничений 17 Достаточность. Пусть /'(£) = 0, /"(£) > 0. Тогда по формуле Тейлора в силу условия г (К) = o(h2) & \r(h)\ < eh2 =» r(h) ^ -ε/ι2 для любого ε > 0 при достаточно малых h имеем: /(* + Л) - /(*) = ±f"(±)h2+r(h) > (^ - e)h2 > 0 /"(Я) при ε < —-—. Следовательно, £ € locmin/. ■ Для локального максимума неравенства имеют противоположный вид: /"(ж) <0и /"(А) < 0 соответственно. Теоремы 1 и 2 допускают обобщения на конечномерный и бесконечномерный случаи (см. соответственно Глава I, п. 1.2.2 и §6). В одномерном случае можно дать почти исчерпывающий ответ на вопрос о том, является ли данная точка at локальным экстремумом или нет. Теорема 3. Пусть функция / Ε Dn(x) n раз дифференцируема в точке х. Необходимые условия экстремума: если at € locmin (max) / — точка локального минимума (максимума) функции /, то либо /'(*) = ... =/<->(*) = о, либо /'(а) =... = /<2т-,)(£) = о, /(2т)(а) > о (/(2т)(а) < о) (1) при некотором т : 2 ^ 2га < п. Достаточные условия экстремума: если выполняется условие (1), то at G locmin (max) / — точка локального минимума (максимума) функции /. Доказательство. Пусть для определенности £ € locmin/. По формуле Тейлора /(а+Д) = £^МЛ*+г(Л), r(h) = o(hn) (^г-0 при Л-θ). Необходимость при η = 1 следует из теоремы Ферма. Пусть далее η > 1. Тогда либо /'(£) = ... = f^(±) = 0 (в этом случае выполняется утверждение теоремы), либо /'(£) = ... = /(/~!)(ж) = 0, /(/)(ж) Φ 0, * *ξ η. Значит, f(±+h)-№ =£ziMfc*+r(fc)=ώ*>Λ'+Γι(Λ), ri(fc)=0(ti). /(z)(a) Поскольку at e locmin /, то f(± + h) - f(£) = ., h + η(Λ) > 0 при достаточно малых по модулю h. Так как /^(А) ^ 0, то отсюда следует, что Ζ — четно и /(ί)(£) > 0.
18 Глава L Экстремальные задачи Достаточность. Пусть f'(x) = ... = /(2т_1)(^) = 0, f2m(x) φ О. Тогда по формуле Тейлора f(± + h)-m) = L^±lh^ + r2{h)y -«-2-0 при ft-0. Поскольку /(2т)(£) > 0, то /(£ + fr) - /(ж) ^ 0 при достаточно малых Л, т.е. χ G locmin/. ■ 1.2.2. Функции нескольких переменных Сформулируем необходимое условие экстремума I порядка в конечномерной задаче без ограничений, являющееся аналогом теоремы Ферма. Теорема 1. Если χ = (х\,...,хп) Ε locextr/ — точка локального экстремума функции η переменных f(x\,...,xn) и функция f £ D(x) дифференцируема в точке х, то дх\ дхп Доказательство. Рассмотрим функцию одной переменной ψ(χχ) = /(4i,...,*f-i,a?i,4<+i,...,An). Поскольку χ = (Аь... ,An) € locextr/, то Х{ £ locextr у?. Кроме того φ £ D(&i). По необходимому условию экстремума для функций одной переменной — теореме Ферма *>'(*,) = 0 <=► Ш = о. ОХ{ Сформулируем необходимые и достаточные условие экстремума II порядка в конечномерной задаче без ограничений. Предварительно напомним, что второй производной функции нескольких переменных является симметричная матрица вторых производных а также приведем определения знакоопределенностей симметричных матриц. Матрица А называется неотрицательно определенной (А^О), если η (Ah,h)^0 VheRn <ί=> Σ *<;*<*'^° Vfc = (fti,...,hn)€Rn. Матрица А называется положительно определенной (А > 0), если (Ah,h)>0 VfcERn, fc#0.
§ 1. Конечномерные задачи без ограничений 1$ Матрица А называется строго положительно определенной, если существует а > О такое, что {Ah,h)^a\\h\\2 VfcGRn. Аналогично определяются неположительная й отрицательная матрицы. Отметим, что в конечномерном пространстве условие положительной определенности симметричной матрицы А эквивалентно условию строгой положительности матрицы А. (Ah,h)>0 VfcGRn, h^O <=> 3 a>0\ (Ah,h) ^ a\h\2 VfcGRn. В бесконечномерных пространствах это не так (см. Гл. 1, п. 6.3, Пример 2). Теорема 2. Пусть функция / Ε D2(£) дважды дифференцируема в точке ± = (£ι,..., £„). Необходимые условия экстремума: если at Ε locmin (max) / — точка локального минимума (максимума) функции f, то /'(£) = 0, (f"(x)h,h)>0 ((f"(±)h,h)^0) VfcGRn. Достаточные условия экстремума: если /'(£) = О, (f"(&)h9h)>0 ((f"(£)h,h)<0) VfcERn, МО, то £ € locmin (max) / — точка локального минимума (максимума) функции /. Доказательство. По формуле Тейлора f(& + h) = /(*) + </'(*),*> + l(f"(*)hfh)+r(h)9 r(h) = o(\h\2). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость. Поскольку χ Ε locmin/, то, во-первых, по необходимому условию экстремума I порядка в конечномерной задаче без ограничений — аналогу теоремы Ферма /'(ж) = 0, во-вторых, f(£+Xh)-f(x)^0 при достаточно малых А. Поэтому в силу формулы Тейлора /(4 + Xh) - f(±) = у (f"(&)h, h) + г (АЛ) > О (r(Xh) = о(\Х\2)) при малых А и фиксированном Л. Разделим обе части последнего нера- о r(Xh) венства на А и устремим А к нулю. Поскольку —j ► 0, то получим, что (fn(A)h9h)^0 VfcGRn. Достаточность. Так как f(x) = 0, то по формуле Тейлора в силу выполненного условия (f"(x)h,h) ^ a\h\ имеем: f(x + h)-f(x)=l- (f"(x)h, ft) + г(Л) > Ι |Λ|2 + r(ft) > 0
20 Глава 1. Экстремальные задачи при достаточно малых h, так как r(h) = o(\h\2). Следовательно, χ е locmin/. ■ η Замечание. Для квадратичных функционалов Q(x) = Σ ^ijxixj усло- вие положительной (отрицательной) определенности матрицы A = f"(£) = (aij)ZM является достаточным условием абсолютного минимума (максимума) функционала в стационарной точке. 1.2.3. Теорема Вейерштрасса и следствие из нее Пусть / : Rn —* R — функция η переменных. При исследовании вопроса о достижении функцией η переменных экстремума часто используется следующая теорема. Теорема Вейерштрасса. [19, т. 1, с. 235.] Непрерывная функция на непустом ограниченном замкнутом подмножестве конечномерного пространства (компакте) достигает своих абсолютных максимума и минимума. Выделим простое следствие из этой теоремы, которое часто будем использовать. Следствие. Если функция f непрерывна на Rn и lim f(x) = -boo |*|-кх> ( lim f(x) = -oo), то она достигает своего абсолютного минимума |я|-юо (максимума) на любом замкнутом подмножестве из Rn. 1.2.4. Критерий Сильвестра Знакоопределенность матрицы устанавливается с помощью критерия Сильвестра. Напомним, что последовательными главными минорами матрицы А (а\\ ... ахк\ 1. α*ι ··· α**/ Главным минором Λ,,.ύ матрицы А называется определитель матрицы размера k x к, составленной из строк и столбцов с номерами αΜι · · · aUik \ α«**Ί · · · aikik ' Теорема. [10, с. 260.] Пусть А — симметричная матрица. Тогда 1. Матрица А положительно определена (А > 0) тогда и только тогда, когда все ее последовательные главные миноры положительны, т. е. -Αι...* > 0, fc= Ι,.,.,η. ,**, 1 < *ι <···<**< «: Λ i>...ik:=det ί
§ 1. Конечномерные задачи без ограничений 21 Действительно, у матрицы А = ( Л л ) последовательные главные 2. Матрица А отрицательно определена (А < 0) тогда и только тогда, когда все ее последовательные главные миноры чередуют знак, начиная с отрицательного, т. е. (-1)*-А|...* > 0, * = 1,... ,η. 3. Матрица А неотрицательно определена (А ^ 0) тогда и только тогда, когда все ее главные миноры неотрицательны, т. е. -А*,.»«* ^ 0» 1 <i| < ... <ц <п, к = 1,...,п. 4. Матрица А неположительно определена (А < 0) тогда w только тогда, когда все ее главные миноры чередуют знак, начиная с неположительного, т.е. (-l)*.At|...tfc ^ 0, 1 < i\ < ... ^ гк < п, к = 1,... ,п. Замечание 1. Как будет показано ниже, положительность (неотрицательность) матрицы равносильна положительности (неотрицательности) всех собственных значений матрицы. Замечание 2. Отметим, что условие положительности последовательных главных миноров матрицы равносильно условию положительности всех главных миноров (см. [10, с. 260]). Для условия неотрицательности это не так, т.е. из условия неотрицательности последовательных главных миноров не следует неотрицательность всех главных миноров матрицы и, следовательно, не следует неотрицательность матрицы. -О -О миноры равны нулю (А\ = А\2 = 0), но она не является неотрицательной: (Ah,h) = ((0,-h2),(huh2)) = -h22<0 при h2 φ 0. 1.2.5. Метод Ньютона (метод касательных) Для того, чтобы решить задачу без ограничений нужно найти стационарные точки — решения уравнения f'(x) = 0. Для решения таких уравнений численным способом можно воспользоваться замечательным приемом, восходящим к Ньютону. Итак, пусть нам требуется решить уравнение F(*) = 0. (1) Здесь F — дважды непрерывно дифференцируемая функция одной переменной. Будем искать решение уравнения (1) методом последовательных приближений. Если хк — приближенное значение корня, то точное значение корня x = xk + hk, (2) где hk мало, и в силу дифференцируемости функции F 0 = F(x) = F(xk + hk) = F(xk) + F\xk)hk + o{hk). F(xk) Пренебрегая слагаемым o(hk), находим, что hk = --=77—г. Внеся эту поправку в формулу (2), получим новое уточненное приближенное значение корня: #*+! = Я* "bub
22 Глава 1. Экстремальные задачи Таким образом, мы имеем следующее рекуррентное соотношение для нахождения последовательных приближений к нулю уравнения (1): (з) Геометрически метод Ньютона эквивалентен замене дуги кривой y = F(x) касательной, проведенной в некоторой точке кривой (см. рис. 1). Рис. 1 Пусть для определенности нам надо найти корень уравнения (1), находящийся на отрезке [а,Ь] и F(b)F"(b) > 0. Положим жо = Ь. Проведем касательную к кривой у = F(x) в точке (b9F(b)) = (ж0>-Р(яо)). В качестве первого приближения х\ берется абсцисса точки пересечения этой касательной с осью Ох. Через точку (x\,F(x\)) снова проводим касательную, абсцисса точки пересечения которой дает второе приближение хг корня £ и т.д. (рис. 1). Очевидно, что уравнение касательной в точке (xk>F(xk)) есть y = F(xk) + Ff(xk)(x-Xk)· Полагая в этом уравнении у = 0, χ = Хк+\, имеем формулу (3) , F(xk) 0 = F(xk) + F (xk)(xk+\ - хи) <=> Хк+\ =Хк- ^Ьт· Заметим, что если в нашем случае положить хо — а и, следовательно, F(xq)F"(xo) < 0, то, проведя касательную к кривой у = F(x) в точке (a,jF(a)), мы получили бы точку х\9 лежащую вне отрезка [а,Ь], т.е. при этом выбор начального значения в методе Ньютона оказался бы неудачным. Таким образом, в данном случае правильным начальным приближением at является условие F(xo)Ffi(xo) > 0.
§ 1. Конечномерные задачи без ограничений 23 Имеет место следующая Теорема. Пусть F G C2([a,b],R), значения функции F(a) и F(b) принимают разные знаки (F(a)F(b) < θ), функция F монотонна на отрезке [а, 6], Fl(x)F"(x) Φ О Vx e [а,Ь]. Тогда, исходя из начального приближения хо € [а, 6], удовлетворяющего неравенству F(xo)F"(xo) > О, можно вычислить по методу Ньютона единственный корень уравнения F(x) = О с любой степенью точности. Если производная F'(x) мало меняется на отрезке [а,Ь] или вычисление F*(xk) слишком трудоемко, то в формуле (3) можно положить F'(xk) = F'(xo) для всех значений к = О,1,2,...: Хк+1 = Хк~¥ы- Такой метод нахождения корня уравнения называется модифицированным методом Ньютона. Геометрически этот способ означает, что мы заменяем касательные в точках (xk,F(xk)) прямыми параллельными первой касательной, построенной в точке (xo,F(xo)). Подробнее о методе Ньютона можно прочитать в книге «Основы вычислительной математики» Б. П.Демидович и И. А. Марон [11]. 1.3. Правило решения Для решения конечномерной задачи без ограничений следует: 1) Выписать необходимое условие экстремума I порядка — аналог теоремы Ферма: Найти точки £, удовлетворяющие необходимому условию I порядка (эти точки называются стационарными). 2) Проверить выполнение условий экстремума II порядка в каждой стационарной точке. Выписать матрицу вторых производных A=,ix)={d^)iJ=riiikM· а) Проверить выполнение достаточных условий экстремума — исследовать ее знакоопределенность, т. е. посчитать последовательные главные миноры матрицы А: А\.„к = det ((at-j-)i,i=I), fc = 1,... ,η.
24 Глава 1. Экстремальные задачи Если все ее они положительны, т.е. А\ш„ь > О, к = Ι,.,.,η, то точка ж доставляет локальный минимум в задаче, ж £ locmin/. Если все ее последовательные главные миноры чередуют знак, начиная с отрицательного, т.е. (-\)kdztA\t„k > 0, к = 1,... ,п, то точка доставляет локальный максимум, ж Ε locmax/. b) Если не выполняются достаточные условия экстремума, то надо проверить выполнение необходимых условий — исследовать ее слабую знакоопределенность, т. е. посчитать главные миноры матрицы А — определители матриц размера к χ к, составленных из строк и столбцов /<*М. ··· омЛ с номерами %\,...,г*: j4tl...tJb := det I J . V αΜ. · · · αΜι / Если матрица А не является неотрицательно определенной (А^О), т.е. не выполняется условие, когда все ее главные миноры неотрицательны, т.е. -Ai,...tfc ^ 0> 1 ^ *ι ^ ... ^ ύ ^ п, к = 1,... ,п, то точка χ не доставляет локальный минимум, ж £ locmin/. Если матрица А не является неположительно определенной (А £ 0), т. е. не выполняется условие, когда все ее главные миноры чередуют знак, начиная с неположительного, т. е. (—1)*<А,·,...,^ > 0, 1 < i\ ^ ... < ik < η, fe = 1,..., η, то точка ж не доставляет локальный максимум, ж £ locmax /. 1.4. Примеры Пример 1. /(ж) — f(x\,x2) = χ] - х\Хг + ж2 - 2х\ -f хг -* extr. Решение. Необходимое условие локального экстремума I порядка: 5/(ж) 3/(ж) Г 2ж| - ж2 - 2 = 0; ' V ' 0Ж| 0Ж2 I -Х\ + 2ж2 +1 = 0. Решая эту систему уравнений, находим единственную стационарную точку χ — (жьж2) = (1,0). Для проверки условий II порядка выпишем матрицу вторых производных и проверим ее знакоопределенность: ,/*/(») V /2 -Л jii=2>0, A12 = detf_J -2)=3>°· Матрица А по критерию Сильвестра положительно определена. По достаточному условию экстремума функции нескольких переменных точка χ доставляет локальный минимум функции /. Поскольку lim /(жьж2) = lim ( (a?i - — ) + -7- - 2ж| + ж2 ) = +оо, |х|—»Ч-оо |аг|-»оо \ \ 2/4 /
§ 1. Конечномерные задачи без ограничений 25 J w дх{ дх2 14х\ -: то по следствию из теоремы Вейерштрасса абсолютный минимум в задаче должен достигаться. Значит, точка £ будет доставлять не только локальный, но и абсолютный минимум, Smm = /(1,0) = -1. Выше показали, что 5тах = Н-оо. Ответ. (1,0) G absmin, 5min = -1; 5max = -boo. Пример 2. f{x) = f(x\9x2) = x\ + x\ - x] - 2x\x2 -x\-+ extr. Решение. Необходимое условие локального экстремума I порядка: - 2х\ - 2х2 = 0, 2a?i - 2ж2 = 0. Вычитая из первого уравнения системы второе, получим Ах\ - 4х2 = 0 & х] = х2 & х\ = х2. Подставляя х2 = ж ι в первое уравнение системы, находим Ж| и х2: Ах\ - 2а?| - 2х\ = 0 £> ж? = х\ «=> a?i = -1; 0; 1, соответственно х2 = -1;0* 1. Получили три стационарные точки £! = (}Л), &2 = (-1,-1), £ = (0,0). Для проверки условий II порядка выписываем матрицу вторых производных в каждой точке стационарности: (^т\2 /12*?-2 -2 \ \dxidxj) \ -2 12х22-2 J =*> ^lo.i) = -^Ιί-ι.-ΐ) = у-2 10 ) ' ^Ι(ο,ο) = (^-2 -2у' Матрица ( ~ 1П I по критерию Сильвестра положительно определена: А{ = 10 > 0, An = det ί _j ^ J = 100 - 4 = 96 > 0. По достаточному условию локального экстремума функции нескольких переменных точки (1,1) и (-1,-1) доставляют локальный минимум функции /. Поскольку lim f(x\,x2)= lim (х\ + х\ - (х\ +х2)2) = -Ьоо, |з|-»+оо |ж|-»оо то по следствию из теоремы Вейерштрасса абсолютный минимум в задаче должен достигаться. Значит, эти точки будут доставлять не только локальный, но и абсолютный минимум, Sm\n = /(!,!) = -2. /-2 -2\ Матрица ( ~ ~ I по критерию Сильвестра не является ни положительно, ни отрицательно определенной: А\ = -2 < 0, А\2 — det ( "^ I? ) = 0. Она является неположительно определенной матрицей (А ^ 0) и не является неотрицательно определенной матрицей
26 Глава 1. Экстремальные задачи (A J£ 0). Следовательно, не выполняется необходимое условие локального минимума. Поэтому £3 = (0,0) g locmin/. Проверим, доставляет ли точка локальный максимум. Поскольку f(h9 -h) = 2hA > 0 = f(±3) при малых h Φ 0, то £3 £ locmax/. Таким образом, точка (0,0) £ locextr/. Выше показали, что 5тах = +оо. Ответ. (0,0) $ locextr; (-1,-1),(1,1) Gabsmin, 5min = -2; Smax = +oo. Пример 3. Найти экстремумы неявно заданной функции двух переменных а?з = /(жь^г), если F(x\,а?2,а?з) = я? + ^2 + а?з - 2х\ -f 2ж2 - 4хз - 10 = 0. ^ θ/ 0ж3 df дхг Решение. Частные производные -— = -— и -— = -— находим ОХ\ ОХ\ ОХ2 дХ2 из уравнений: _ 0F dF дхг _ дх\ дх$ дх\ Р*г-=— + — -ТГ-=Ь 2х,- 2 + (2х3 -4)|^ = 0, 2ж2 + 2 + (2ж3-4)--^ = 0. аа?2 (*) dF dF дхг дХ2 дх$ дХ2 Необходимое условие экстремума I порядка: Ааз(З) _ 9х3{±) _ м Г 2£, - 2 = 0, Г *ι = 1, 0*ι ~ дх2 " 12*2 + 2 = 0, ^^ 1*2 =-1. Подставляя координаты а;ι и ж2 в заданное уравнение F(x\,X2>xi) = 0, находим хз 1 + 1 + х\ - 2 - 2 - 4ж3 - 10 = 0 <=> ж1 - 4ж3 - 12 = 0 <=> ж3 = -2; 6. Таким образом, получаем две стационарные точки at1 = (*ь*2>^з) = (1,-1,-2) и Я2 = (*1,42,*з) = 0,-1,6) Для проверки условий II порядка надо выписать матрицу вторых производных в каждой стационарной точке. Дифференцируя первое уравнение правой части системы уравнений (*) по х\ и Х2 с учетом дхг дхг _ условия -— = -— = 0, имеем ОХ\ OX2 Δ\^Χ* -ί\ θ2χ*\ -1 &2χ*\ - 1 2 + (2Я5з-4)^5--0=>555-|л|-5, _|^«-5, (2ж3 - 4) л * = 0 =» „ * =——i- =0. v ' дх\дх2 дх\дх2\ъх dxidx2\*2
§ 1. Конечномерные задачи без ограничений 27 Аналогично, дифференцируя второе уравнение правой части системы (*) по х\ и х2, получим а2ж3 _ д2хи __ 1 02ж3] __ 1 2 + (2ж3-4)^-0^^^--, —141--?. 02ж3 а2ж3 Очевидно, что -—-— = -—-—. Таким образом, дх2дх\ дх\дх2 л-(&-)* +А -(»* ,%). л\ -М* «V KoxidzjJij^ У V0 >/4/ I*2 \ ° -1/4/ Матрица j4|$i по критерию Сильвестра является положительно определенной, а матрица Α\& отрицательно определенной. Поэтому по достаточному УСЛОВИЮ ВТОРОГО ПОрЯДКа S|ocmin = -2, Si0cmax = 6. МОЖНО ΠΟ- казать, что это будут не только локальные экстремумы, но и глобальные. Ответ. (1,-1) € locextr; (1,-1) glocextr, Smin = -2; 5max = 6. Приведем несколько примеров различных свойств экстремумов в задаче без ограничений. Пример 4. Абсолютные минимумы и максимумы достигаются в бесконечном числе точек: /:R-+R, f(x)=sinx. Пример 5. Функция ограничена, абсолютный максимум достигается, минимум — нет: /:«-■. M-J^. Пример 6. Функция ограничена, но абсолютные максимум и минимум не достигаются: f :R-+R, /(a?) = arctga?. Пример 7. Функция ограничена, имеет стационарные точки, но абсолютные максимум и минимум не достигаются: f :R-»R, /(ж) = (arctgs)3. Пример 8. Функция ограничена, имеет локальные максимумы и минимумы, но абсолютные максимум и минимум не достигаются: f : R -» R, f(x) = arctga? · sin ж. Пример 9. Ограничение функции, заданной на плоскости, на любую прямую, проходящую через начало координат, имеет в нуле локальный минимум, но вместе с тем начало координат не является точкой локального минимума: f : R2 -+ R, f{xux2) = {х\ - xl)(x\ - За£).
28 Глава 1. Экстремальные задачи Действительно, на любой прямой вида х\ = аж2, ol Ε R, функция /(аж2,ж2) = (olxi - х\) («ж2 — Зж2) = ж2(а ~ ж2)(а - Зж2) = = ж^(а2 - 4аж2 + Зж2) ^ 0 = /(0) при малых ж2. Значит, на любой прямой вида Х\ = аж2 функции / имеет локальный минимум в нуле. Аналогично на прямой ж2 = 0 функция /(жι,Ο) = ж? имеет минимум в нуле. С другой стороны, на параболе х\ — 2х\ функция /(2ж2,ж2) = —х\ < 0 в любой окрестности нуля. То есть точка χ = 0 не является точкой локального минимума функции /. Пример 10. Имеется единственный локальный экстремум, не являющийся абсолютным: f : R2 -> R, !{хихг) = х\-х\ + 2е~*5. Необходимое условие экстремума I порядка в конечномерной задаче без ограничений: f>{x) = Q ^ дЖ = ^М = 0 <=► / а», - 4·1β—?=о. ^ v ' dsi 0ж2 1-2ж2 =0, { х{ =0, 2е-*« = 1 & -ж? = ln(l/2) = -In2 ^ ж, = ±л/1тГ2; ж2 = 0. Получаем в задаче три стационарные точки х{ = (0,0), ж2 = (νΊη 2,0), *3 = (-vln2f0). Для проверки условий II порядка надо выписать матрицу вторых производных в каждой стационарной точке: 2 / 1 - Ар~х~\ 4- 8^ρ"χϊ Π λ . . . \ Π -9 У Л-Г/(8)V =/r2-4e-i + te?e-i θ\ \дхгдх,)и=х V 0 -2 у J =f"2 <Л I Π Λΐη2 θ\ U«=(o,o) \ 0 -2/· Ifi |*з у 0 -2 у (1 -5) Матрица вторых производных ( п ~ ) в точке #ι = (0,0) по критерию Сильвестра является отрицательно определенной: А\ = -2 < 0, А2 = 4 > 0. Поэтому по достаточному условию второго порядка стационарная точка Я1 Ε locmax. Очевидно, что 5аЬстах = +оо (/(жь0) —► +оо при х\ —> -foo). Матрица вторых производных ( п _0 ) по критерию Сильвестра не является ни положительно, ни отрицательно определенной и более того не является ни неположительно определенной матрицей (А $£ 0)
§ 1. Конечномерные задачи без ограничений 29 и ни неотрицательно определенной матрицей (A J£ 0). Следовательно, не выполняется необходимое условие ни локального максимума, ни локального минимума. Поэтому стационарные точки £2, ±3 g locextr/. Поскольку /(0,*) = -t2 + 2 -+ -оо при t -+ -boo, a /(*,0) = *2 + 2е"г -+ -boo при t —> -boo, то 5mi„ = -оо и 5тах = +оо. Значит, у функции / имеется единственный локальный экстремум в точке (0,0), не являющийся абсолютным. Ответ. (0,0) € locmax, (±у/Ш2, 0) £ locextr; Smjn = -oo; 5max = -boo. Пример 11. Можно ли утверждать, что если функция одной переменной имеет в какой либо точке локальный минимум, то в некоторой достаточно малой окрестности этой точки слева от точки функция убывает, а справа возрастает? Нет. Контрпример: f(x) = | χ1 (2 + sin * )' х * °> Ясно, что at = О £ absmin/. С другой стороны, в любой окрестности нуля и справа, и слева производная f(x) = 2ж(2 + sin £) - cos £, ж / О, принимает как положительные, так и отрицательные значения, т.е. функция / и возрастает, и убывает. Пример 12. Имеется бесконечное число локальных максимумов, но нет ни одного локального минимума: f : R2 -► R, f{x\,X2) = sin a?! - х\- Решение. Необходимое условие экстремума I порядка: д fix) df(x) f cossci = 0, ί χ\ = - + for, Α: € Ζ, - =0 <=> 4 Λ Λ <=> < 2 cteι дх2 {cos Ει =0, I a?i = -2a2=0, ^ |Я2 = | Стационарные точки ±k = (~ + kir,0), fc G Z. Для проверки условий II порядка выпишем матрицу вторых производных: (d2f(x)\2 _/-«inx, θ\ A-^a:^;..=i-V О -2J· Проверим знакоопределенность матрицы -4 в точках £2п = (| -Ь +2ηπ,θ), η€Ζ: ^U = ("J -2)' Αι=-Κ0> ^Ι2 = 2>0. Матрица -4.|^2ж по критерию Сильвестра является отрицательно определенной. Поэтому по достаточному условию локального экстремума
30 Глава 1. Экстремальные задачи х2п € locmax/. Поскольку /(а?|,ж2) = sinajj - χ] < 1 = f{x2n), то эти точки будут доставлять не только локальный, но и абсолютный максимум в задаче. Проверим знакоопределенность матрицы А в точках £2п_и = (| + +(2η+1)π,θ), η Ε Ζ: А\*»* = (о -2)' ^ι = 1>°> Л,2 = -2<0. Матрица вторых производных ^|f2«+i по критерию Сильвестра не является ни положительно, ни отрицательно определенной и более того не является ни неотрицательно определенной матрицей (А^О) и ни неположительно определенной матрицей (^4^0). Следовательно, не выполняется необходимое условие ни локального минимума, ни локального максимума. Поэтому точки х2п+] не являются ни точками локального минимума, ни точками локального максимума. Точки локального минимума могли быть только среди стационарных точек, но там их не оказалось. Следовательно, нет ни одного локального минимума. Поскольку /(О,*) = -t2 --► -00 при t -~+ -boo, то Sabsmin = -00. Ответ. (- + (2п + 1)тг,о) g? locextr V η Ε Ζ; (- + 2ητ,θ\ G absmax V η € Ζ, Sat>smax = 1; Sabsmin = -0°· 1.5. Задачи В задачах 1.1-1.22 без ограничений найти стационарные точки, проверить их на экстремальность, а также найти все локальные и глобальные минимумы и максимумы. 1.1. /(ж|,ж2) = 5х] +4х\Хг + х\ - \6х\ - \2х2 —► extr. 1.2. f(x\, ж2) = χ2 - х\ - 4a?i + 6x2 —► extr. 1.3. /(a?i, ж2) = Зж? + ж2 + 4а?1Ж2 - 8χι - 12ж2 —► extr. - / ч 50 20 1.4. ДЖ|,ж2) = а?|Ж2 Η 1 ► extr. a?i хг 1.5. /(Ж|,ж2,ж3) = х\ + 2х\ + х\ - 2х\Х2 -х\ + 2χ3 —► extr. 1.6. /(ж|,ж2,а?з) = х\ +х\ Λ-χ$ — Х\Хг + Х\ — 2а?з -» extr. 1.7. /(жьж2,жз) = ж? + ж2 -Ь2а?з Л-Х\х2 + 2х\Х$ + 3ж2жз — a?i —► extr. 1.8. /(жьж2,жз) = х\ + х\ + 2х\ + х\х2 Л- Зх2хз — х\ -* extr. 1.9. f(x\,x2) = Зх\ -f 2ж2 - х] - х\ -+ extr.
§ 2. Конечномерные гладкие задачи с равенствами 31 1.10. f(x\>xi) — х\ + а?2 - Ъх\Х2 —>extr. 1.11. /(ж|,ж2,жз) = х] + х\ + х\ + \2х\х2 + 2ж3 -+ extr. 1.12. f(x\,X2) = Ъх\Хг - х2Х2 - х\х\ -> extr. 1.13. f(x\,X2) = x\ + х\ - (х\ + хт)4 -* extr. 1.14. f(x\, а?г) = 2ж| -f ж* - ж? - 2x\ -+ extr. 1.15. /(»i,a?2) = Х\Х2Щх2\ + x\) '-♦extr. 1.16. f(x\9X2) = ж?а?2(6 - Ж| - ж2) —► extr. 1.17. /(ж|,ж2) = е2а:,+3*2(8х? - 6x{x2 + 3a£) -> extr. 1.18. /(ж1,ж2) = еж'"а:2(5-2ж1 + a?2)-+extr. 1.19. /(ж|,Ж2,жз) = x\x\xl(7 - x\ - 2ж2 - Зж3) —> extr. ι 1.20. /(жьж2)= (t2+ x2t + x{)2dt-+min. -1 (задача о полиномах Лежандра второй степени) ι 1.21. f{x\,X2,xy)= I (t3 + xit2 + X2t + x\)2dt —► min. -I (задача о полиномах Лежандра третьей степени) 1.22. Найти экстремумы неявно заданной функции двух переменных хз = f{x\>xi)b если F{x\, а?2, хъ) = х2 + х2 + х] - Х\Хз - хгХъ + 2х\ + 2а?2 + 2а?з -2 = 0. § 2. Конечномерные гладкие задачи с равенствами В этом параграфе даются необходимые и достаточные условия экстремума в гладкой конечномерной задаче с ограничениями типа равенств. 2.1. Постановка задачи Пусть /( : Rn —► R, г = 0,1,..., га, — функции η переменных, отображающие пространство Rn в R Считаем, что все функции fc обладают
32 Глава 1. Экстремальные задачи определенной гладкостью. Гладкой конечномерной экстремальной задачей с ограничениями типа равенств называется следующая задача: /о(х)-> extr; /,·(*) = (>, t = l,...,m. (P) Таким образом, в задаче (Р) ищутся экстремумы функции на множестве, задаваемом конечным числом ограничений типа равенств. 2.2. Необходимые и достаточные условия экстремума 2.2.1. Принцип Лагранжа Сформулируем необходимое условие экстремума I порядка в гладкой конечномерной задаче с ограничениями типа равенств — принцип Лагранжа. Теорема. Пусть χ £ locextrP — точка локального экстремума в задаче (Р), а функции fi, г = О,1,... ,га, непрерывно дифференцируемы в окрестности точки χ (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа А = (Aq, λ ι ,..., Am) £ Rm+1, λ Φ О, такой, m что для функции Лагранжа задачи (Р) А(х) = ^2^ifi(x) выполняется i=0 условие стационарности Лж(х) = 0 <=* ^^=0, j = l,...,n <=► У>//(*) = 0. Это соотношение называется условием стационарности. Точки, удовлетворяющие условию стационарности, называются стационарными. Доказательство проведем от противного. Предположим, что условие стационарности не выполняется. Это означает, что векторы t4+\ f9fi{±) dfi{±)\ .· η ι m fi{x)={-te7'->-d^r)' —m.-.™. линейно независимы. Поэтому ранг матрицы / 0/о(*) , df0(x) \ I дх\ дхп I dfm(±) '" dfm(&) \ dxi дх„ / равен тп+1. Тогда по теореме о ранге матрицы (см. [15, с. 71]) существует матрица Μ порядка (т+1) χ (τη+1) с определителем, отличным от нуля. \ dxj ) «=о,...,ш j=l,...,n
§ 2. Конечномерные гладкие задачи с равенствами 33 Допустим для определенности, что этой матрицей является матрица, составленная из первых столбцов матрицы А: Μ \ дх{ QM&) \ дхт+[ Ofm(A) detM^O. Не ограничивая общности, считаем, что /о(£) = 0. Действительно, если /о(£) ^ 0, то следует рассмотреть функцию /о(х) = /о(х) - /о(£) и для нее будет выполняться условие /о(£) = fo(±) - /о(£) = 0, а условия стационарности и точки экстремума для функций /0 и /о одинаковы. Для вектораж = (а?|,... ,a?m+i) положим F(x) = (Fo(aj),... ,Fm(x)) = (Л(«,*га+2,...,4п),.--»/т(«,*га+2,...,4я)). ТоГДа фуНКЦИЯ F ОТОбра- жает некоторую окрестность точки χ = (£i,...,&m+i) € Rm+I в Rm+I и является (в силу условий гладкости теоремы) непрерывно дифференцируемым отображением в этой окрестности и F(x) = у = 0 в силу допустимости точки £. Кроме того, якобиан отображения F в точке χ отличен от нуля, т. е. ы(Ц&) -ы(Ш) _*,*,,.■ \ dXj ) *=0,1 го у dXj ) *=0,1 m ^ j=l,...,m+l j=l,...,ro+l По теореме об обратной функции в конечномерных пространствах (см. следующий пункт) существует обратное отображение F~[ некоторой окрестности точки # = 0 в окрестность точки χ такое, что F~x (# = 0) = χ и \F-l(y) - F-l(j)\ ζ К\у - 0| ^ |jH(y) - £| ^ jr|y| c некоторой кон- стантой К > 0. В частности, для достаточно малого по модулю ε определен вектор χ(ε) := F~!(ε,0,...,0), для которого \χ(ε) - χ\ ^ ϋΓ|ε|. Это означает, что Ρ(χ(ε)) = (ε,0, ...,0), что равносильно равенствам /о(х(г),йто+2,...,йп) = е> /•(*(е)94го+2»...,*п) = 0, ί = 1 m. Таким образом, для вектора χ(ε) = (£ι(ε),... ,жт+1^),£т+2>··· ,^η) выполняются условия /о(зс(е)) = с, Д(*(е)) = 0, г=1,...,т, (1) и при этом |*(е)-*|<ЛГМ. (2) Из соотношений (1)-(2) следует, что вектор at не доставляет в задаче экстремума, ибо вблизи его существуют допустимые векторы χ(ε), на которых функционал /о принимает значения как большие так и меньшие чем /0(ж) (напомним, что /0(£) = 0). Получили противоречие с тем, что £ € locextr P. Таким образом, наше предположение (противного) неверно и тем самым теорема доказана. ш
34 Глава 1. Экстремальные задачи 2.2.2. Конечномерная теорема об обратной функции Теорема (конечномерная теорема об обратной функции). [19, т. 1, с. 455.] Пусть F : U -» Rn — непрерывно дифференцируемое отображение некоторой окрестности U С Rn точки χ в Rn, F(x) — # и якобиан отобра- жения F в точке χ отличен от нуля ( det F'(x) = det ( —j— ) Φ О ). V V dxJ /ij=i / Тогда существует обратное отображение F~l некоторой окрестности V точки # в окрестность точки χ такое, что F~l(y) = х и \F-l(y)-F-\y)\^K\y-y\ VyeV с некоторой константой К > 0. 2.2.3. Необходимое условие экстремума II порядка Сформулируем необходимое условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств. Теорема. Пусть χ Ε locmin Ρ — точка локального минимума в задаче (Р), функции fi, г = 0,1,..., га, дважды непрерывно дифференцируемы в окрестности точки χ (условие гладкости), dimlin ^ {f[(x)>... ,fm(x)} = m (условие регулярности). Тогда существует множитель Лагранжа А = (1, Л|,..., Лт) Ε Rm+I такой, что для функции Лагранжа задачи (Р) т Л(*) = Д(*) +£ */'(*> выполняются условия стационарности: т л'(а) = о <^ /5(4) + £ λί/ί(*) = о и неотрицательной определенности матрицы вторых производных: (A"(x)h,h)>0 VheK:= {</·(£),&) =0, t= 1 т}. Доказательство. Поскольку χ Ε locmin Ρ, το для задачи (Р) гладкой конечномерной задачи с равенствами выполняется принцип Лагранжа. Согласно нему существует ненулевой вектор множителей Лагранжа А = (А0, Αι,..., Am) E Rm+1, λ Φ 0, такой, что для функции Лагранжа А(х) = m m Σλίίί(χ) выполняется условие стационарности ^А,-/,'(£) = 0. В силу «=0 «=0 условия регулярности вектора /[(£),... ,/ш(£) линейно независимы. Поэтому λο φ 0 и, следовательно, можно положить А0 = 1. Тем самым условие стационарности с множителем Лагранжа λο = 1 доказано. ^ Нп означает «линейная оболочка».
§ 2. Конечномерные гладкие задачи с равенствами 35 Докажем условие неотрицательности. Возьмем вектор h € К. Тогда по теореме о касательном пространстве (см. §5.4) вектор h в точке χ является касательным к множеству допустимых элементов в задаче (Р) D = {х G Rn | /ι(χ) = ... = /т(я) = 0}. По определению касательного вектора существуют число ε > 0 и отображение г : [-ε; ε] —> Rn такие, что /ι(й + th + r(t)) = ... = /m(£ + th + r(*)) = 0 для любого * G [-ε; ε] и |r(<)| = o(t) при * -+ 0. Таким образом, £ + th + r(t) — допустимый элемент в задаче (Р) при t G [-ε; ε] и, так как £ Ε locminP, то /0(£) < /o(£+<fc+r(t)). Поэтому по определению функции Л и формуле Тейлора m /о(*) < /о(* + th + r(i)) = А(4 + ifc + r(t)) - ^ А«Л'(4 + th + r(t)) = i=l = A(4) + <Α'(4),ίΛ + r(i)> + ^<A"(4)(ifc + r(i)),ifc + r(i)> + o(*2) = = /(*) +у (Α^Λ,^ + οίί2). Отсюда — (Α"(*)Λ,Λ) + ο(ί2) ^ 0 при малых t. Разделим обе части последнего неравенства на t2 и устремим t к нулю. Получим (A"(±)h,h) ^ 0. ■ Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, А|,..., Am) G Rm+I и соответственно m функция Лагранжа А(х) = -/о(#) + Σ *«/«(я). «=ι 2.2.4* Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств. Теорема. Пусть функции /,·, г = 0,1,... ,га, дважды непрерывно дифференцируемы в окрестности точки at (условие гладкости), dimlin {/[(£), •••>/m(£)} = m (условие регулярности), существует множитель Лагранжа А = (Ι,Λι,... ,АГО) G Rm+I такой, что для функции Лагранжа т задачи (Р) А(х) = /о(я)+Σ λ;.ft (ж) выполняются условия стационарности: m Α'(Λ) = 0 <^ /£(*) + £ Ai/i'iA) = 0 ί=1 и положительной определенности матрицы вторых производных: (A"(£)h,h)>0 Vfc/0: </i(4)fft>=0, i=l,...,m. 7огдд ж € locmin Ρ — точка локального минимума в задаче (Р).
36 Глава 1. Экстремальные задачи Доказательство. Применяя лемму о правом обратном отображении (см. § 5.4) к линейному оператору А := Ff(x) := (/[(£),..., fm(x)) : Rn ™Rm, действующему по формуле Ah = ((/[(ж), ft),..., (/m(x),ft)), построим оператор Μ : Rm —> Rn такой, что ioM = /r, |Мг/|^С|г/| Vy G Rm. Возьмем χ + /ι — допустимый элемент в задаче (f\(x + ti) = ... = /m(x + ft) — 0). Положим ft2 := M(.Aft) и обозначим h\ := h- ft2. Тогда ilfci = A(h - ft2) = Ah - А о M(Ah) = Ah - Ah = 0. Значит, hx G KerA. По формуле Тейлора 0 = F(x + h) = F(x) + F'(£)ft + r^"(£)[ft, /ι] + o(\h\2). Отсюда существует δ > 0 такое, что 1 |4λ| = \F'(x)h\ = -F"(x)[h,h] + o(\h\2) ^C{\h\2 V|ft|<tf с некоторой константой C\ > 0. Поэтому |ft2| = \MAh\ ^ C\Ah\ < CCi|/i|2 ^ CC\6\h\ = e\h\ при ε = CCi(5 и |ft| - |ft2| < l*il = |ft - *г1 < Ifcl + lfcjI^O-e^ftl^lftiKO + c^fcl. Вновь по формуле Тейлора f0(x + ft) = A(4 + ft) = A(f) + <A'(4),ft) + ^(A"(*)ft,ft> + o(|ft|2) = A'-=0/o(^) + ^A,'(x)ft,ft>-ho(|ft|2). Отсюда, обозначая В := ||Л"(ж)||, имеем /о(* + Л) - /о(4) = ^(A"(fti + *2),Λι + Λ2> + o(|ft|2) = = i((A,fft,>ft,) + 2(A"ft,>ft2> + (A,fft2>ft2>) + o(\h\2) > > I (a|ft, |2 - 2B|ft, | · |Λ2| - B\h2\2) + o(\h\2) ^ > \\h\2 (a(l - ε)2 - 2B(1 + ε)ε - Be1) + o(\h\2) > 0 при достаточно малых ε > 0 (при ε = 0 множитель в круглых скобках равен a > 0). Из последнего соотношения следует, что χ G locminP. ■ Мы сформулировали достаточное условие минимума. Достаточное условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1,А|,... ,Am) G Rm+1 и соответственно m функция Лагранжа А(х) — -fo(x) + Σ Kfi(x)-
§ 2. Конечномерные гладкие задачи с равенствами 37 2.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств следует: 1) Составить функцию Лагранжа т А(*) = £*/,(*). 1=0 2) Выписать необходимое условие экстремума I порядка — условие стационарности функции Лагранжа: т А'(4) = 0 ^ Х>//(*) = 0. t=0 3) Найти точки £, удовлетворяющие условию стационарности (эти точки называются стационарными). При этом следует отдельно рассмотреть случаи: а) Ао = 0, Ь) А0 = 1 (или любой положительной константе), с) А0 = -1 (или лк)бой отрицательной константе). В случае а) стационарные точки могут доставлять и минимум, и максимум в задаче. В случае Ь) стационарные точки могут доставлять минимум в задаче. В случае с) стационарные точки могут доставлять максимум в задаче. 4) Найти решение среди стационарных точек или доказать, что его нет. При этом можно пытаться воспользоваться непосредственной проверкой или перейти к исследованию условий экстремума II порядка в каждой стационарной точке. Выписать матрицу вторых производных А"(£) и пространство L = {h e Rn | (fl(&),h) = 0, г = 1,...,т}. Проверить выполнение достаточных условий экстремума — положительную определенность матрицы вторых производных: (A"(±)h9h) >0 VfcEL, МО. Если это условие положительности выполняется, то точка at доставляет в случае Ь) локальный минимум в задаче (& Ε locmin.P); в случае с) локальный максимум в задаче (£ G locmaxP). 5) Если не выполняются достаточные условия экстремума, то надо проверить выполнение необходимого условия экстремума — неотрицательную определенность матрицы вторых производных: <Α"(4)Λ,Λ>>0 VheL. Если это условие неотрицательности не выполняется, то точка χ не доставляет в случае Ь) локальный минимум в задаче (х g locminP); в случае с) локальный максимум в задаче (£ £ locmaxP).
38 Глава 1. Экстремальные задачи 2.4. Примеры Пример 7. 4х\ + Ъхг -» extr; х\ + х\ = 1. Решение. Функция Лагранжа Λ = A0(4a?i + Зж2) + А (ж? + ж* - l). Необходимое условие локального экстремума: д<_0 ^ /Ав|=0, Γ4λ0 + 2λ*ι=0, л - и <ς=? ^ лЖ2 = 0, ^* \ ЗА0 + 2Аж2 = 0. Если Ао = 0, то λ Φ 0. Тогда из предыдущих уравнений вытекает, что х, = χ2 = о, но эта точка не является допустимой. Полагаем А0 = -1. Тогда Х\ = 2/А, х2 = 3/(2А). Подставляя Ж1,ж2 в ограничение х]+х\ = 1, получаем, что 4 9 2 5 /4 3\ / 4 3\ Соответственно имеем две стационарные точки I —, — 1, I —, — τ ) · По теореме Вейерштрасса (в силу компактности единичной окружности) существуют решения задач на максимум и минимум. Рассматривая значения функционала в стационарных точках, получаем: G absmax, 5max = 5. G absmin, Smin = -5. GO (4-1) Пример 2. {Αχ,χ) —► extr; (ж, ж) = 1 (x G Rn, A = (aij)£j-i — симметричная матрица). Решение. Существование решения задач на минимум и на максимум следует по теореме Вейерштрасса, поскольку сфера Sn~l = {χ G Rn | \x\2 = (ж, ж) = 1} компактна. Функция Лагранжа Λ = А0(Аж, χ) + λ ((ж, ж) - l). Необходимое условие локального экстремума: Λ' = 0 ^=^ Х0Ах + Аж = 0. Если Ао = 0, то λ ^ 0. Тогда из условия стационарности £ = 0, но эта точка не является допустимой. Полагаем А0 = -1. Тогда Ах = Аж. Таким образом, стационарные точки — собственные вектора матрицы А. Домножив соотношение А± = Х± на ±, получим, что (А£,£) = Х{±,±) = А. Значит, решение задачи на минимум — собственный вектор матрицы А, соответствующий наименьшему собственному значению, решение задачи на максимум — собственный вектор матрицы А, соответствующий наибольшему собственному значению.
§ 2. Конечномерные гладкие задачи с равенствами 39 2.5. Задача Аполлония Древнегреческим ученым Аполлонием (III—11 век до н.э.) в книге «Конические сечения» решается задача о проведении из некоторой точки к эллипсу самого длинного и самого короткого отрезка (см. рис. 2). При этом он решает даже более общую задачу, определяя все проходящие через эту точку отрезки, перпендикулярные, к эллипсу. Решим задачу Аполлония с помощью метода Лагранжа неопределенных множителей. Формализованно задача записывается следующим образом: /о(яьж2) = {χι - £ι)2 + (х2 - б)2 -* extr; /ι(*ι,*2) = (^)2 + (^)2 -1=0 (а, > а2 > 0) (здесь рассматривается эквивалентная задача об экстремуме квадрата расстояния). Функция Лагранжа Λ = λο((ζ,-ω2 + (χ2-6)2)+λ((^)2+(^)2-ΐ) · Необходимое условие локального экстремума — условие стационарности: Ах. = о <!=> \0(х{ - £{) + А ^ = 0, г = 1,2. Если До = 0, то А Ф 0, так как не все множители Лагранжа нули. Тогда х\ = Х2 = 0, но эта точка не лежит на эллипсе. Полагаем Ао = 1. Тогда х\ = -= > * = 1>2. Подставляя эти значе- α? + λ ния ж^ в уравнение эллипса, получаем '^~($Р +<$?-'■ (1) Относительно А это алгебраическое уравнение четвертой степени. Поэтому число действительных корней уравнения не более четырех, и, значит, число стационарных точек задачи не более четырех. Каждому корню А соответствует своя стационарная точка ж. График функции <р(Х) схематически изображен на рис.3. Если φ(0) = -=■ + -~ > 1, то точка (ίι > ζι) лежит вне эллипса. Этот случай и изображен на рисунках 3 и 4. Эллипс — ограниченное и замкнутое (т. е. компактное) множество. По теореме Вейерштрасса решение задач на минимум и максимум существует. Для полного решения задачи надо решить уравнение (1), получить At-, найти соответствующие точки ж(А;), подставить эти точки в /о и найти наименьшее и наибольшее из полученных значений функционала.
40 Глава 1. Экстремальные задачи Рис.2 Рис.3 Условия стационарности Xj; - &; 4- λ-4 = 0 <θ> ξ{ - Xi = λ-4, г = 1,2, aj a- имеют очевидный геометрический смысл: вектор ξ - χ пропорционален вектору-градиенту функции f\ в точке я, т.е. лежит на нормали к эллипсу. Этот факт был впервые установлен Аполлонием. Выведем из полученных нами соотношений уравнение кривой, «разделяющей» те точки ξ, из которых можно провести две нормали, от точек, из которых можно провести четыре нормали. Очевидно, что это разделение происходит для А, удовлетворяющих соотношению (1), для которых φ'(λ) = - 2tfa? 2Л2 2tf«2 (α2 + λ)3 (α\ + λ)3 = 0, Xe(-al-al). (2) Обозначим а] 4- А = Α(ξ\α\)2^9 тогда из соотношения (2) можно найти, что а\ 4- А = -Afaai)2^. Из последних двух уравнений, вычитая из первого второе, найдем, что А = Л2 Л Подставляя (ξ.α,)2/3 + &α2)2/3' вначале в уравнение (1) а] 4- А, а\ + А, а затем и ^4, получаем уравнение разделяющей кривой: *?«? 2„2 «<*2 ^(£|в1)4/3 Л2&02)4/3 (£.<м)2/3 + (6а2)2/3 = = 1 <=► (ξιαι)2/3 + (ξ2α2)2/3 = Α2 (а2-а])2 ((ξι«ι)2/3 + (6α2)2/3)'
§ 2. Конечномерные гладкие задачи с равенствами 41 Рис.5 Это уравнение астроиды. Вне астроиды каждая точка имеет две нормали к эллипсу, внутри нее — четыре, на самой астроиде — три (за исключением вершин, где имеются две нормали (рис.4)). Докажем, что касательная к астроиде перпендикулярна к эллипсу в точке ее пересечения с эллипсом (рис. 5). Обозначим точку на астроиде через £. Пусть χ — точка на эллипсе такая, что вектор χ -ξ перпендикулярен к эллипсу. Для доказательства утверждения достаточно показать, что вектор χ - ξ перпендикулярен нормали η к астроиде в точке ξ. По доказанному выше ж,- = -=—-, и, значит, „ *_( 6*1 , 6*2 Λ-ί Л6 Л6 \ Нормалью к астроиде (6*ι)2^3 + (6*2)2/ГЗ = (*2 - α1)2^ в точке ξ является вектор пропорциональный градиенту функции #(6>6) = (6*ι)2/3 + (6*2)2'3» т.е. вектор η = (£|~]'3а2/3, £2 3α2'3). Возьмем скалярное произведение векторов ж - ξ и гг. А6СГ1/3*?/3 A6i2"I/3*f <*-€,*) = - λ(6*ι)2/3 A(6a2)2/3 а? + А αί + λ αί + λ ai + λ (подставим значения α? + λ, выраженные через А и (&а*)2/3) Λ^,α,)2/3 Л(6а2)2/3 = АЛ A(i,a,)V3 -Л(£2а2)'/з ^ + А Скалярное произведение векторов равно нулю, следовательно, вектора х - ξ и η перпендикулярны.
42 Глава 1. Экстремальные задачи 2.6. Задачи 2.1. х] + «2 —> extH 3a?i + 4»2 = 1. 2.2. е*1*2 -»extr; г( + ж2 = 1. 2.3. Х[ + ж2 -* extr; 5ж? + 4a?ia?2 -f ж| - 1. 2.4. ж ι -Ы2ж!Ж2 + 2ж2 -► extr; Ах] + х\ = 25. 2.5. ж? + »2 + &з --> extr; хх + ж2 + ж3 = 1 · 2.6. ж ι + 2»2 + За?з --> extr; ж? + ж| + х\ = 1. 2.7. х] + »2 + ж2 -+ extr; Ж1 + ж2 + ж3 = 1, Ж| + ж2 - жз = т- 2.8. 2х2\-(>х\ -6ж2-3ж3 —» extr; Ж1-ж2 + ж3 = 0, 5ж| + Ж2-2ж3 = 1. 2.9. Ж] + Ж2 + ж3 —► extr; х\ + ж2 - я3 = 1, ж? + ж2 + ж2 = 1. 2.10. Ж1Ж2 + ^2жз ~* extr; х\ + х\~ 2, Ж2 + жз = 2. 2.11. Ж|Ж2ж3 -+ extr; ж2 + Ж2 + ж2 = 1, х\ + Ж2 + ж3 = 0. 2.12. ж? + Ж2 + х\ -► extr; ж? + (ж2 - З)2 + (ж3 - 4)2 = 1. 2.13. Х\х\х\ —> extr; Ж] + ж2 + ж3 = 1. 2.14. х\х\х\ —> extr; ж2 + Ж2 + ж2 = 1. 2.15. Найти минимум линейной функции /(ж) = (а,ж), а,ж Ε Rn, на единичном шаре (ж, ж) = 1. 2.16. Найти расстояние от точки ж Ε Rn до гиперплоскости (а, ж) = Ь, aERn, 6ER. 2.17. Найти расстояние от точки ж Ε Rn до прямой ж = а* + Ь, а,Ь Ε Rn. 2.18. Найти максимальную площадь прямоугольника со сторонами, па- ж2 ж? раллельными осям координат, вписанного в эллипс -4 + -=■ = 1. 2.19. Найти максимальный объем прямоугольного параллелепипеда со сторонами, параллельными осям координат, вписанного в эллип- 2 2 2 Ж, х\ Жз СОИД -г + -г + -=· = 1. a, aj a\ 2.20. Решить задачу Аполлония для параболы. 2.21. Решить задачу Аполлония для гиперболы.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 43 § 3. Конечномерные гладкие задачи с равенствами и неравенствами В этом параграфе даются необходимые и достаточные условия экстремума в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. 3.1. Постановка задачи Пусть /,♦ : Rn —> R, г = 0,1,..., га, — функции η переменных, отображающие пространство Rn в R. Считаем, что все функции /,· обладают определенной гладкостью. Гладкой конечномерной экстремальной задачей с ограничениями типа равенств и неравенств называется следующая задача вГ: fo(x) -> min; Д(ж) < О, г = 1,..., га', Л(ж) = 0, » = т'+1 т. В задачах, где имеются ограничения типа неравенств, важно, рассматриваемая задача на минимум или максимум. Для определенности мы будем рассматривать задачи на минимум. 3.2. Необходимые и достаточные условия экстремума 3.2.1. Принцип Лагранжа Сформулируем необходимое условие экстремума I порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств — принцип Лагранжа. Теорема. Пусть at Ε locmin P — точка локального минимума в задаче (Р), а функции /,, г = 0,1,... ,га, непрерывно дифференцируемы в окрестности точки at (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа А = (А0, Α ι,..., Am) £ Rm+!, λ Φ О, такой, что для m функции Лагранжа задачи (Ρ) Α(χ) = Σ ^ifi(x) выполняются условия: 1=0 a) стационарности: л'(х) = о <=* ^^ = о, j = i,...,n *=* Υ>/ί(*) = °· b) дополняющей нежесткости: λ,·/,·(Α) = 0, г = 1,... ,га'; c) неотрицательности: А* ^ 0, г = 0,1,..., га'. Доказательство этой теоремы в более общем случае см. ниже. Точки, удовлетворяющие необходимым условиям локального экстремума, называются критическими. В задаче на максимум Ао < 0.
44 Глава 1. Экстремальные задачи Отметим, что в задаче (Р) с ограничениями типа равенств и неравенств ограничения типа равенств можно было бы не писать, заменив любое из равенств f(x) = 0 <£> 0 ^ f(x) ^ 0 двумя неравенствами f(x) ^ О, -f(x) ^ 0. Упражнение. Докажите, что при такой замене ограничения типа равенства двумя неравенствами, принцип Лагранжа в обеих задачах дает одни и те же критические точки. 3.2.2. Необходимое условие экстремума II порядка Сформулируем необходимое условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. Теорема. Пусть χ G locmin P — точка локального минимума в задаче (Р), функции /,·, г — 0,...,т, дважды непрерывно дифференцируемы в некоторой окрестности точки χ (условие гладкости), векторы /m'+iO*0> · · ·»/т(я) — линейно независимы (условие регулярности). Тогда существует множитель Лагранжа λ = (А0, Аь..., Хт) G Rm+1 такой, что для функции Лагранжа задачи (Р) т Λ(*, λ) = £>/<(*) выполняются условия экстремума I порядка: a) стационарности: Λχ(*,λ) = 0 «=► ^Λ = 0> j = l,...,n <=► ;£>/!(*) = (>; dxi tS b) дополняющей нежесткости: At/i(x) = 0, i = l,...,m'; c) неотрицательности: λ, ^ 0, г = 0,1,... ,га'; и max(Axx(x,X)h,h) ^ 0 Vfc G ИГ, где ϋΓ := {/ι G Rn I <//(*), h) < 0, i = 0,1,...,m', </,'(*), k)=0, i = m' + l,...,m} — /соиус допустимых вариаций, а С — совокупность множителей Лагранжа А, для которых выполнены условия а)-с).
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 45 Доказательство этой теоремы см. в § 8. Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа λο ^ 0 и соответственно в конусе допустимых вариаций (f№),h) ^0. 3.2.3. Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. Теорема. Пусть функции /t·, г = 0,...,т, дважды непрерывно дифференцируемы в некоторой окрестности тонки χ (условие гладкости), векторы /щ'+|(£),..-,/т(£) — линейно независимы (условие регулярности), существует множитель Лагранжа λ = (Λο,..., Am) Ε Rm+I с Λο = 1 такой, что для функции Лагранжа задачи (Р) т ι=0 выполняются условия экстремума I порядка: a) стационарности: Λί(*,λ) = 0 «=* ^^1 = 0, ; = 1,...,п ^ f>/;(*) = 0; ■7 1=0 b) дополняющей нежесткости: А;Л(а) = 0, i= 1,...,го'; c) неотрицательности: А» > 0, г = 0,1,... ,т'; и max(Axx(±,X)h,h)^a\h\2 Vhe К с некоторой положительной константой а, где K:={heRn\(fi(±)9h) ^0, г = 0,1,...,т', <//(*),&) = 0, i = m4l,..,m} — конус допустимых вариаций, а С — совокупность множителей Лагранжа Л, для которых выполнены условия а)-с) с λο = 1. Тогда at G locmin Ρ — точка локального минимума в задаче (Р). Доказательство этой теоремы см. в § 8. Достаточное условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А0 = -1 и соответственно в конусе допустимых вариаций (/ό(^),Λ) ^ 0.
46 Глава 1. Экстремальные задачи 3.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств и неравенств следует: m 1) Составить функцию Лагранжа А(х) = Σ λ,-/,·(&). t=0 2) Выписать необходимое условие экстремума I порядка: a) стационарности: А'(*) = <>«=► ^ = 0, i = l,...,n; b) дополняющей нежесткости: λ;Λ(£) = 0, i=l,...,m'; c) неотрицательности: Aj ^ 0, г = 1,...,т\ 3) Найти точки £, удовлетворяющие условиям а)-с) (эти точки называются критическими). При этом следует отдельно рассмотреть случаи a) А0 = 0; b) Ао = 1 (или любой положительной константе); c) Ао = -1 (или любой отрицательной константе). В случае а) критические точки могут доставлять и минимум, и максимум в задаче. В случае Ь) критические точки могут доставлять минимум в задаче. В случае с) критические точки могут доставлять максимум в задаче. При нахождении критических точек в условиях дополняющей нежесткости Xifi(£) = 0 для каждого г надо рассматривать два случая: Aj = 0 и λ< Φ 0. 4) Исследовать на локальный и абсолютный экстремум найденные критические точки или, если их нет, найти Sm\n и 5тах и указать последовательности допустимых точек, на которых эти абсолютные экстремумы достигаются. При этом можно пытаться воспользоваться непосредственной проверкой или перейти к исследованию условий экстремума II порядка в каждой критической точке. Отметим, что проверка выполнения необходимых или достаточных условий экстремума в задаче с ограничениями типа равенств и неравенств — задача непростая. Поэтому, как правило, мы будем при исследовании экстремума использовать непосредственную проверку, сравнивая значение исследуемой функции в критической точке с ее значениями в близких допустимых точках.
§3. Конечномерные гладкие задачи с равенствами и неравенствами 47 3.4. Примеры Пример 1. х] + х\ + х\ —► min; 2х\ - х2 + Жз ^ 5, Ж| -f ж2 + ж3 = 3. Решение. Функция Лагранжа Λ = Хо(х2\ +xl + х]) + A|(2a?i - х2 + з3 - 5) + A2(a?i + ж2 + Хг - 3). Необходимые условия локального минимума: a) стационарности: АХ| = 0 <=> 2А0Ж1 + 2А, + А2 = О, {Λβ| =0, Г 2A0a?i + 2λι + А2 = 0, АХ1 = 0, <=> ^ 2А0ж2 - А| + А2 = 0, Л*з=0, 12А0ж3+ λι+λ2 = 0; b) дополняющей нежесткости: Ai(2a?i -Ж2 + Ж3-5) = 0; c) неотрицательности: Ао >09 А| > 0. Если А0 = 0, то из уравнений пункта а) выводим, что λ ι = А2 = 0 —· все множители Лагранжа — нули, а этого быть не может. Поэтому Ао φ 0, полагаем А0 = 1/2. Предположим λ ι Φ 0, тогда в силу условия Ь) 2х\ - ж2 + Хз - 5 = 0. Выразим Ж1,ж2,ж3 из условия а) через А|,А2: х\ = -2А|-А2, хг = А|-А2, х3 = -А|-А2, и подставив в уравнения Ж|+ж2+ж3 = 3, 2х\ -ж2+хз = 5, получим, что -2Aj - λ2 + λι — А2 — Αι -λ2 = 3, Γ-2λι-3λ2 = 3, ~4λι - 2λ2 - Αι + λ2 - Αι - λ2 = 5, ^^ \ -6λι - 2λ2 = 5, 9 откуда λ ι = -— < 0 — противоречие с условием неотрицательности b). Значит, в случае Α ι Φ 0 критических точек нет. Пусть Aj = 0. Тогда Х\ = ж2 = ж3 = _А2. Подставляя Х{ = -А2 в равенство х\ + ж2 + ж3 = 3, получаем, что -ЗА2 = 3θΆ2 = -1=^Χι=: х2 = хъ = 1 — единственная критическая точка. Функция f(x) = χ] + ж2 + а?з —► оо при |ж| —► оо, значит по следствию из теоремы Вейерштрасса решение задачи существует, а в силу единственности критической точки решением может быть только она. Итак, £ = (1,1,1) Ε absmin, Smm = 3. Пример 2. Приведение квадратичной формы к главным осям. Пусть А = (aij)"j-.| — симметричная матрица (a,j = α,·,·) и Q(x) = η Σ aijXiXj = (^4ж, ж) — соответствующая ей квадратичная форма.
48 Глава 1. Экстремальные задачи Теорема. В пространстве R" существует ортонормированный базис /ь · · · , fn, в котором квадратичная форма Q имеет представление η Q{x) = Yd\i{x,U)\ В базисе /ι,..., /„ матрица формы Q диагональна. Направления векторов /ι,...,/η называются главными осями формы Q, а переход к базису /ι,..., /„ называется приведением формы к главным осям. Доказательство. Если Q = 0, то λι =... = А„ = 0, f\,..., fn — любая ортонормированная система. Пусть Q £ О, тогда Q принимает положительные или отрицательные значения. Для определенности считаем, что Q принимает отрицательные значения. Рассмотрим первую экстремальную задачу (Αχ,χ) -» min; (χ, χ) ^ 1. (Ρχ) Если Q принимает только неотрицательные значения, то надо рассматривать задачу на максимум. Решение χ = f\ задачи (Р\) по теореме Вейерштрасса существует, так как шар В — {х G Rn | (х,х> ^ 1} является компактом в Rn, а функция (Αχ,χ) непрерывна. Функция Лагранжа задачи (Р\) А = Хо(Ах,х) + А«х,х>-1). Необходимые условия минимума: a) стационарности: Ах = О <<=> XoAf\ -f Xf\ = 0; b) дополняющей нежесткости: А((/1,/1> - 1) = 0; c) неотрицательности: А0 ^ 0, А ^ 0. Если А0 = 0, то λ Φ 0 и из пункта а) выводим, что f\ = 0, но это противоречит условию Ь). Поэтому А0 φ 0, полагаем А0 = 1. Тогда из a) Af\ —. -A/j. Умножая последнее равенство скалярно на /ι, получим, что (Af\,f\) = -λ(/ι,/ι> - Smin < 0. Отсюда λ > 0 и по условию Ь) (/ι,/ι) = 1. Таким образом, /ι — собственный вектор матрицы A, Af\ = \\f\ (Αι = -λ), Ι/ι I = 19 Smm = Χ\, Aj — минимальное собственное значение матрицы А. Обозначим L\ = {χ G Rn | (x,f\) = 0} — подпространство в Rn. Если Q(x) — 0 Vx G L\, το λ2 = ... = An = 0, /2,..., fn ■— любая ортонормированная система из L\. Пусть Q £ 0 на L\. Тогда Q на L\ принимает положительные или отрицательные значения. Для определенности теперь считаем, что Q принимает на L\ положительные значения. Рассмотрим вторую задачу (Αχ,χ) -+ max; (χ,ζ) < 1, (x,f{) = 0. (Ρ2) Решение χ = /2 задачи (Р2) по теореме Вейерштрасса существует, так как сечение шара В плоскостью L\ является по-прежнему компактом. Функция Лагранжа Λ = \q(Ax,x) + λ((χ,χ) - l) + 2μ(χ,ί\).
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 49 Необходимые условия максимума: a) стационарности: Ах = 0 <==> A0j4/2 + А/2 + μ/ι =0; b) дополняющей нежесткости: А((/2,/2) - 1) = 0; c) неотрицательности: Ло <0 (задача на максимум!), λ ^ 0. Если Ао = 0, то из пункта а) выводим, что λ/2 + μ/ι = 0. В силу линейной независимости векторов f\ и /2 следует, что λ = μ = 0 — все множители Лагранжа — нули, а этого быть не может. Поэтому А0 φ 0, полагаем А0 = -1. Тогда из a) Af2 = А/2 + μ/j. Умножая последнее равенство скалярно на f\ и учитывая ортогональность векторов /ι и /2, получим, что (Af2,f\) = Α</2,/ι> + μ(/ι,/ι) = ' Kfi,/i> "^ μ- Отсюда μ - Μ/2>/ι> = </2, Afi> = (Λ,λ,/,) = 0. Умно- жая полученное равенство Af2 — А/2 скалярно на /2, получим, что (Af2,f2) = А(/2,/2> = Smax > 0. Отсюда А > 0 и по условию Ь) {fi>h) = 1· Таким образом, /2 — собственный вектор матрицы А, Af2 = А2/2 (А2 = А), |/2| = 1, векторы f\ и /2 ортогональны. Далее поступаем подобным образом. Вводим подпространство L2 = {же Rn | <я?,/|> =0, (ж,/2) = 0}. Если Q(x) = 0 Vx Ε £2, то А3 = ... = Λη = 0, /з,...,/п — любая ортонормированная система из £2. Пусть Q £ 0 на L2. Тогда Q на £2 принимает положительные или отрицательные значения. Вновь рассматриваем задачу на минимум или максимум: {Αχ,χ) -♦ extr; (ζ, ζ) О, (ж,/,> = <ж,/2> = 0. (Р3) Решая эту задачу, получаем единичный вектор /з такой, что ^4/3 = А3/з, /з ортогонально /ι и /2. Поступая аналогично, в итоге придем к ортонормированному базису /ь · ·., fn из собственных векторов матрицы А с собственными числами Αι,... ,λη. Любой вектор χ Ε Rn разлагается по ортонормированному базису η η /ι,...,/η в следующем виде: ж = Σ (ж,Λ)Λ· ТогДа ^ж = Σ(χ» ΛΜΛ = «=1 = Σλί<*»Λ>Λ и, значит, ί=1 Q(x) = (Αχ,χ) = (2А*(*,Л)Л,^,Л)Л) = Σ>(χ,/,·>2 3.5. Задачи 3.1. Х\х2хъ —► extr; χ] + ж2 + а?| < 1. η η 3.2. ]Γ ж] - extr; £>,Ч 1.
50 Глава 1. Экстремальные задачи η η 3.3. ^s}->extr; Х^ж]^ 1. 3.4. eXl~X2 -x\-xi-> extr; xx -f ж2 ^ 1, a?j ^ 0, ж2 ^ 0. 3.5. ж? + x2 -+ extr; ж? -f χ] < 1, a?i > 0, ж2 > 0. 3.6. ж? -f ж2 + а?з -+ extr; X\ -f ж2 + жз ^ 12, Ж| ^ 0, ж2 ^ 0, ж3 ^ 0. 3.7. ж? + 4ж2 + Жз —► extr; Ж1 + ж2 + ж3 < 12, х\ > 0, ж2 > 0, ж3 ^ 0. 3.8. 2ж* + 2ж2 + 2ж1Ж2 - Х\ - ж2 —► extr; Ж] + ж2 < -, Ж| > 0. 3.9. ж? + ж2 + Жз --> extr; х\ + ж2 + жз < 1, Ж) ^ 0, Ж] + ж2 - жз = -. ЗЛО. 2ж? + 2Ж| + 4ж2 - Зж3 -♦ extr; 8а?| - Зж2 + Зж3 < 40, -2ж) + ж2 - ж3 = -3, ж2 ^ 0. 3.11. 2а?| 4- 2а?ι + 4ж2 - Зж3 -+ extr; ixx - Зж2 + Зж3 = 40, -2ж| + ж2 - ж3 < -3, ж2 ^ 0. 3.12. Зж? - 11ж| - Зж2 - ж3 -+ extr; х{ - 7ж2 + Зж3 + 7 ^ О, " 5ж1 -Н 2ж2 - Жз < 2, Жз ^ 0. 3.13. Зж2 - 11ж1 - Зж2 - жз -+ extr; хх - 7ж2 + Зж3 + 7 ^ О, 5ж1 + 2ж2 - жз < 2, ж3 ^ 0. 3.14. Ж1Ж3 - 2ж2 —► extr; 2ж1 - ж2 - Зж3 ^ 10, ж2 ^ О, Зж1 + 2ж2 + ж3 = 6. 3.15. х\ХгХъ -~* extr; жз ^ 1, Ж| ^ 1, ж2 ^ 1, х\ + х\ + х\ = 8. 3.16. Доказать неравенство для средних степенных /1 JL \ Up / ι JL \ х1я (ήΣ>/) ^(ϊΣι*/) . °<*<*<■ путем решения экстремальной задачи η η ]Г|ж/^тах; £ |ж/= α' (Kp<gfa>0). 3.17. Доказать неравенство между средним арифметическим и средним геометрическим: ж η ν l/n j η ί ЦжЛ ^ ~Σ*ί v*i>°» .7 = 1,...,η. . 00,
§ 4. Выпуклые задачи 51 § 4. Выпуклые задачи Пусть в этом пункте X — линейное нормированное пространство (определение линейного нормированного пространства см. в §5), для простоты понимания можно считать, что X = Rn — конечномерное пространство. 4.1. Элементы выпуклого анализа. Субдифференциал Напомним определение выпуклого множества. Множество А С X называется выпуклым, если для любых двух точек ах и α-ι из А и любого числа t G (0,1) элемент ta\ + (1 - t)a,2 G Α. Пусть С := {с\,..., Cm} С X ■ — некоторое конечное подмножество. m m Элемент ν = ]ζ ί,-c,-, £t-^ 0, i = 1,..., га, ]ζ U = 1, называется выпуклой комбинацией С. Совокупность всех выпуклых комбинаций конечных подмножеств множества С называется выпуклой оболочкой С и обозначается convC (иногда со С). Можно легко показать, что множество convC совпадает с пересечением всех выпуклых множеств, содержащих С (иногда это свойство берут за определение выпуклой оболочки). Выпуклая оболочка конечного числа точек называется выпуклым многогранником. __ Пусть задана функция (функционал) / : X -»R := R U {-oo} U {+оо}. Множество epi/ = {(α,χ) G R χ Χ | α ^ /(ж)} в пространстве R χ Χ называется надграфиком функции /. • Функция / называется выпуклой, если надграфик / — выпуклое множество. • Функция / называется замкнутой, если надграфик / — замкнутое множество. • Функция / называется собственной, если f(x) > -оо V» и / ■£ +оо. Мы будем изучать выпуклые собственные функции. Для краткости будем называть их просто «выпуклые» функции. Из определения выпуклого множества сразу следует, что функция выпукла тогда и только тогда, когда выполнено неравенство Иенсена: /(<»ι + (ΐ-ί)*2)<ί/(*ι) + (ΐ-*)/(*2) vxux2ex, Vie (ο,ι). Ясно, что сумма двух выпуклых функций является функцией выпуклой. Но суперпозиция двух выпуклых функций не всегда является выпуклой функцией. Попробуйте привести пример! Выпуклость многих классических функций одной переменной сразу вытекает из следующей теоремы.
52 Глава 1. Экстремальные задачи Теорема 1. [Р, с. 42.] Пусть функция f : R —> R дважды непрерывно дифференцируема (/ Ε £>2(R)). 7Ъгдя оид выпукла тогда и только тогда, когда ее вторая производная неотрицательна (f"(x) ^ 0 Va: Ε R). Приведем несколько примеров выпуклых функций, выпуклость которых сразу следует из теоремы 1 и определения выпуклой функции. 1. /(х) = еаж, aER. 2. f(x) = \x\P,p^\. Выпуклость функций из примеров 1-2 сразу следует из теоремы 1 и определения выпуклой функции. 3. Аффинная функция f(x) = (α, ж) + 6, а Ε Rn, b E R, в многомерном случае (/ : Rn -> R). Аффинная функция является выпуклой по неравенству Иенсена. Выпуклость функций нескольких переменных можно определять также из следующего многомерного обобщения теоремы 1. Теорема 2. [Р, с. 42.] Пусть функция f : Rn —> R дважды непрерывно дифференцируема (/ Ε £>2(Rn)). Тогда она выпукла тогда и только тогда, когда ее матрица вторых производных (гессиан) всюду неотрицательно определена (f"(x) = ( ^ ) ^ 0 Уж Ε Rn ) . \ \axidxj /1 j=l / 4. Квадратичная функция Q(x) = (Аж,ж), где А — симметричная матрица, является выпуклой тогда и только тогда, когда матрица А неотрицательно определена. Это сразу вытекает из теоремы 2. Выпуклыми функциями многих переменных (функционалами) являются также следующие функции: 5. Функция нормы I max{|aii|,,..,|xn|}, ρ = +оо. 6. Индикаторная функция выпуклого множества А С X "м={0;», :|ί: 7. Функция Минковского выпуклого множества АС X а~1х£А Va>0, μΑ(χ) = <{ +оо, a'sg.A Va>0, min{a | α > 0, a~lx e А}, иначе.
§ 4. Выпуклые задачи 53 Функция Минковского означает наименьшее число, в которое надо уменьшить вектор ж, чтобы он попал в множество А. 8. Опорная функция непустого множества АС X sA(x*) = max (ж*, ж}. V ' х€А Дадим определение важного понятия выпуклого анализа — понятия субдифференциала функции, обобщающего для выпуклых функций понятие производной в гладком анализе. Субдифференциалом выпуклой функции / в точке χ называется следующее множество в сопряженном пространстве X*: df(x) = {χ* е X* | <ж*,ж - *) ^ /(*) - /(*) Va; G X}. Напомним, что сопряженным пространством X* называется пространство линейных непрерывных функционалов на X. В случае X = Rn сопряженное пространство (Rn)* = Rn. Из определения сразу вытекает, что субдифференциал — выпуклое множество в X*. Легко доказать, что оно замкнуто. Субдифференциал дифференцируемой функции совпадает с ее производной. Для функции одной переменной субдифференциал df(x) — это совокупность угловых коэффициентов fe, при которых прямые у = кх + Ь, проходящие через точку (х, f(x)), лежат под графиком функции у = /(ж). Пример. f(x) = |ж| (см. рис.6). \У ^^xX^Z^— Q, , /signs, χ Φ О, ^^¥ζ^ ,ж ew = ([-ui. * = ο. Рис.6 Для субдифференциала суммы функций имеет место теорема аналогичная теореме о производной суммы функций. Теорема Моро—Рокафеллара [5]. Пусть f\ u fi — выпуклые функции на X. Существует точка жо, * которой функция f\ конечна (|/|(жо)| < °°)> а функция fa непрерывна (/ £ С(ж0)). Тогда 0(fi+f2)(x) = dfi(x) + df2{x) Va?.
54 Глава 1. Экстремальные задачи При доказательстве необходимых условий экстремума в гладкой задаче с равенствами и неравенствами нам понадобится следующая теорема о субдифференциале максимума. Теорема Дубовицкого--Милютина [5]. Пусть f\ и /2 — выпуклые функции, непрерывные в точке £, /ι(£) = Λί^)· Тогда 0max{/,,/2}(a) = conv(0/i(4) U β/2(4)). Важным примером выпуклой функции является сублинейная функция. Функция ρ называется сублинейной, если ее надграфик является выпуклым конусом с вершиной в нуле. Из неравенства Иенсена следует, что собственная функция является сублинейной тогда и только тогда, когда a) р(Хх) = Хр(х) VA > 0, Va? € Х\ b) р(х\+хг)^р(х\)+р(хг) Va?,,aj2GX. Сформулируем теорему Моро—Рокафеллара и теорему Дубовицкого—Милютина для сублинейных функций. Теорема Моро—Рокафеллара. Пусть р\,рг — сублинейные функции, функция р\ непрерывна, функция р2 замкнута. Тогда в точке £ = О д(р\ +Р2) = др\ +0р2. Теорема Дубовицкого—Милютина. Пусть р\>рг — непрерывные сублинейные функции. Тогда дтэх{р1,р2}(0) = сот(др](0)и др2(0)). 4.2. Теоремы отделимости При выводе необходимых условий экстремума (принципа Лагранжа) в выпуклых задачах и в задачах с равенствами и неравенствами мы будем использовать свойство отделимости непересекающихся выпуклых множеств. Определение 1. Множества А и В из пространства X называются отделимыми, если существует линейный непрерывный функционал Хе X*, Χ Φ О, для которого inf (Χ,α) > sup(A,6). вел ьев Из определения следует, что множества являются отделимыми, если можно провести гиперплоскость Η = {х е X \ (Х,х) = с}, с Ε R, так что одно из множеств лежит в одном замкнутом полупространстве #+ = {х е X | (Х,х) ^ с}, а другое — в другом замкнутом полупространстве Я_ = {ж€Х|(А,жКс}.
§ 4. Выпуклые задачи 55 Определение 2. Множества А и В называются строго отделимыми, если существует линейный непрерывный функционал A G X*, для которого inf (Α, α) > sup(A,6). Приведем результаты об отделимости в конечномерном случае. Теорема 1 (первая теорема отделимости в конечномерном пространстве). Пусть А и В — непустые выпуклые множества в Rn, А П В = 0. Тогда множества А и В отделимы. Теорема 2 (вторая теорема отделимости в конечномерном пространстве). Пусть А — непустое выпуклое замкнутое множество в Rn, Ь & А. Тогда точку Ь можно строго отделить от множества А. Доказательство теорем 1, 2 см. [ГТ, с. 20]. Упражнение. Если в теореме 2 вместо точки Ь взять множество В, то теорема не будет верна. Привести пример. Сформулируем результаты об отделимости в случае нормированных пространств. Теорема 1' (первая теорема отделимости в нормированном пространстве). Пусть А и В — непустые выпуклые множества в X, \п\А Φ 0, ml Α Π Β = 0. Тогда множества А и В отделимы. Теорема 2' (вторая теорема отделимости в нормированном пространстве). Пусть А — непустое выпуклое замкнутое множество в X, Ь & А. Тогда точку Ь можно строго отделить от множества А. Доказательство теорем 1', 2' см. [АТФ, с. 124]. 4.3. Задачи без ограничений Пусть / : X —► R — выпуклая функция, отображающая нормированное пространство X в расширенную прямую. Выпуклой задачей без ограничений называется следующая экстремальная задача: /(aj)-+min. (Ρ) Теорема (аналог теоремы Ферма). Для того чтобы точка ± доставляла β выпуклой задаче без ограничений (Р) абсолютный минимум (at G absminP), необходимо и достаточно, чтобы выполнялось соотношение 0 G df(£). Доказательство. ± G absminP & f(x) - f(£) ^ 0 = (0,ж - ±) Va? G X <=> 0 G df(±). m Поскольку из выпуклости функции / не следует, вообще говоря, выпуклость функции -/, то существенно, что рассматривается задача на минимум а не на максимум.
56 Глава 1. Экстремальные задачи 4.4. Задачи с ограничением Пусть / : X —► R — выпуклая функция, отображающая нормированное пространство X в расширенную прямую, D С X — выпуклое множество. Выпуклой задачей с ограничением (или просто выпуклой задачей) называется следующая экстремальная задача: f(x) -> min; x G D. (Ρ) Теорема. Пусть х G locminP — доставляет локальный минимум в выпуклой задаче (Р). Тогда χ G absminP — доставляет абсолютный минимум в этой задаче. Доказательство. Пусть χ G locminP. Это означает, что существует окрестность U точки х, такая, что f(x)<f(x) VxeUHD. (*) Возьмем произвольную точку χ G D. Тогда, поскольку χ и χ из D, то χ = (1 - a)x + ax eU HD при достаточно малом а > 0. Следовательно, (·) /(£) < f(x) — /((1 - а)ж + аж) < (по неравенству Иенсена) (1 - ot)f(x) + α/(ж), откуда а/(£) ^ af(x) & f(x) ^ f(x) Vx e D. Значит, £ доставляет абсолютный минимум в задаче (Р). ■ Из теоремы следует, что в выпуклой задаче локальный минимум является и абсолютным (глобальным). Поэтому в дальнейшем в выпуклых задачах, говоря «минимум», имеем в виду абсолютный минимум. 4.5. Задача выпуклого программирования Пусть fi; : X —> R, г = 0,1,..., га, — выпуклые функции, отображающие линейное нормированное пространство X в расширенную прямую, А С X — выпуклое множество. Задачей выпуклого программирования называется следующая экстремальная задача: /o(:r)->min; /,·(») < 0, г = 1,...,га, χ е Α. (Ρ) Точка ж называется допустимой в задаче (Р), если χ е А и выполняются все заданные ограничения типа неравенств. Упражнение. Докажите, что задача выпуклого программирования является выпуклой задачей, т. е., что множество допустимых элементов в этой задаче является выпуклым множеством. При проверке достаточных условий минимума в задаче выпуклого программирования будет использоваться некоторое условие регулярности множества допустимых элементов — условие Слейтера. Множество допустимых элементов в задаче (Р) удовлетворяет условию Слейтера, если существует точка χ G А, для которой /,·(£) < 0, г = 1,..., га.
§ 4. Выпуклые задачи 57 Теорема Куна—Ткккера. 1. Если £ G absminP — решение задачи выпуклого программирования, то найдется ненулевой вектор множителей Лагранжа т+\ А = (Ло,Л|,... ,АТО) G R m такой, что для функции Лагранжа А(х) = Σ А,·/,·(ж) выполняются 1=0 условия: a) принцип минимума для функции Лагранжа ттЛ(ж) = Л(£); b) дополняющей нежесткости: λί/ί(Α) = 0, i=l,...,m; c) неотрицательности: λ, > О, г = О,1,...,т. 2. £Ъш для допустимой точки £ выполнены условия а)-с) и Ао φ О, то А € absminP. 3. £biw для допустимой точки £ выполнены условия а) - с) г/ люо- жество допустимых элементов удовлетворяет условию Слейтера, то ± € absminP. Доказательство. Пусть £€ absminP. He ограничивая общности, считаем, что /о(£) = 0 — иначе введем новую функцию /о(ж) = fo(x) -/о(£). Положим Б = {Ь = (Ьo,Ьι,...,ύ€Rm+, \3x£A:fi(x)^bi9 г = 0,1,... ,т}. Покажем, что Б — непустое выпуклое множество. Действительно, неотрицательный октант R^"1"1 С В, т.е. любой вектор с неотрицательными компонентами принадлежит В, ибо в определении множества В можно положить χ = £. Докажем выпуклость множества В. Пусть точки Ь и Ь1 принадлежат множеству В. Надо доказать, что аЪ+ (1 - ot)b' Ε В Va G (0,1). Поскольку точки Ь,Ь' € В, то по определению множества В существуют ж,ж'б4 такие, что fi(x) ^ fy» /«(#') ^ &;> г = 0,1,... ,m. Положим ха = ах + (\ - а)ж'. Тогда жа Ε А9 поскольку А — выпукло, а ввиду выпуклости функций /,·, г = 0,1,..., т, по неравенству Иенсена /*(**) = Л(оа: + (1 - а)х') ζ afi(x) + (1 - α)/,-(*') < <*6t + (1 - α$, т.е. точка а* + (1 - а)Ь' ЕВ. Обозначим С = {с = (со, 0,..., 0) Ε Rm+1 | со < 0} — открытый луч в пространстве Rm+1. Ясно, что С — непустое выпуклое множество.
58 Глава 1. Экстремальные задачи Покажем, что С Π В = 0. Действительно, если бы существовала точка с е С Г\ В, то ввиду определения множества В отсюда следовало бы, что имеется элемент χ £ А, для которого выполняются неравенства: /о(£) < со < 0, fi(x) ^ 0, г = 1,..., га. Но из этих неравенств следует, что для допустимой точки χ /о(я) < /о(£) = 0, т.е. А ^ absminP. Получили противоречие с условием теоремы £ G absminP. Значит С Π В = 0. По первой теореме отделимости в конечномерном пространстве множества В и С можно отделить, т.е. существует вектор Л = (Λο,Λι, ..., Am) φ 0, для которого т m inf У2 Xibi ^ sup У2 х& = SUP λο^ό ^ 0 . Ь€В м с€С tS *<0 Таким образом, m Y^Xibi^o чье в. (*) 1=0 Из неравенства (*) будут выведены условия неотрицательности, дополняющей нежесткости и принцип минимума. 1. Условие неотрицательности. Поскольку, как мы уже говорили, любой вектор с неотрицательными компонентами принадлежит В, то вектор (0,...,0,1,0,...,0) Ε В, где единица стоит на ί-ом месте (счет начинаем с нуля). Подставив эту точку в неравенство (*), получим, что А,- > 0. Условие дополняющей нежесткости. Нетрудно видеть, что точка (0,..., 0, /,(£),0,...,0) Ε Б. Действительно, в определении множества В возьмем χ = £, тогда χ Ε А и нужные неравенства выполняются. Подставив эту точку в неравенство (*), имеем Xifi(£) ^ 0. Если А,-/,·(£) > 0, то (так как по уже доказанному условию неотрицательности Aj ^ 0) fi(£) > 0 — это противоречит допустимости точки £. Значит, А*/,·(£) = 0. Принцип минимума. Возьмем точку χ Ε А, тогда точка (/ο(ε),/ι(χ), •. · t /т(я)) £ #· Тогда по неравенству (*) m m А(х) = £ Xifi(x) >0 = Σ ХгШ, 1=0 ί=0 так как, не ограничивая общности, положили /0(£) = 0 и по уже доказанному условию дополняющей нежесткости Xifi(£) = 0, г = 1,...,т. Таким образом, принцип минимума для функции Лагранжа доказан. 2. Пусть для допустимой точки ± выполнены условия а)-с) и λο φ 0. Положим А0 = 1. Тогда для любой допустимой точки χ будет выполняться неравенство m ν τη ν /о(*) = /ο(*) + Σ λ·*(*) =f Λ<*) < Λ(χ) = *>(ж) + Σ **/<(*) < Λ(*) «=1 ί=Ι
§4. Выпуклые задачи 59 (в последней сумме все слагаемые А,-/,·(&) неположительны). Неравенство /о(£) ^ /о(ж) Для любой допустимой точки χ означает, что χ G absminP. 3. Пусть для допустимой точки £ выполнены условия а)-с) и множество допустимых элементов удовлетворяет условию Слейтера. Предположим, что при этом Ао = 0. Так как вектор λ Φ 0, то в силу условия неотрицательности существует хотя бы одно Xj > 0, j G {l,...,m}. Следовательно, m с) т A(x) = £>/<(*) ^ Xifiix) < 0 S ^Ш£) = Λ(χ). Но это полученное неравенство противоречит условию а). Значит, наше предположение, что А0 = 0 неверно. Поэтому λ0 Φ 0 и по доказанному п. 2 at G absminP. Теорема Куна—Таккера полностью доказана. ■ Из теоремы Куна—Таккера можно вывести достаточные условия абсолютного минимума в выпуклой задаче с неравенствами без ограничения типа включения. Рассмотрим задачу /о(ж) - min; /,-(*) ζ 0, г = 1,... ,m. (Р') Теорема. Пусть /,· : X —► R, г = 0,... ,т, — выпуклые функции, £ — допустимая точка в задаче (Р') (£ G Ар), для функции Лагранжа т Мх) == Σ Α«/ί (ж) с множителем Лагранжа XQ> 0 в точке at выполняются t=0 условия: a) условие стационарности функции Лагранжа: 0 G #Л(£); b) дополняющей нежесткости: At-/,♦(£) = 0, i = 1,... ,т; c) неотрицательности: А, ^ 0, г = 1,..., га. 7Ьгда £ G absminP'. Доказательство. Поскольку /* : X -* R, г = 0,... ,га, — выпуклые т функции, то функция Лагранжа А(х) = ^2Xifi(x) с неотрицательными множителями Лагранжа является выпуклой функцией. По аналогу теоремы Ферма для выпуклых функций условие 0 G дА(±) является необходимым и достаточным условием абсолютного минимума функции Лагранжа в точке £. Значит, условие стационарности функции Лагранжа в настоящей теореме равносильно принципу минимума для функции Лагранжа в теореме Куна—Таккера. Таким образом, для нашей задачи выполняются соотношения а)-с) теоремы Куна—Таккера с множителем Лагранжа Ао Φ 0. По п.2 теоремы Куна—Таккера следует, что £ G absminP'. ■ Легко видеть, что теорема остается верной и для задач с ограничениями типа равенств и неравенств, если функции, задающие равенства,
60 Глава 1. Экстремальные задачи являются аффинными. (В этом случае, как мы говорили об этом в п. 3.2 равенство f(x) = 0 «=> 0 < f(x) ^ 0 заменяется двумя неравенствами f(x) < 0, -f(x) < 0. Из аффинности функции / следует выпуклость функций / и -/.) Пример. /(ж|,ж2) -x} + X\Xi + х\ + 3|xj + ж2 -2| -+ min. Решение. Функция f(x) является выпуклой функцией как сумма двух выпуклых функций. Действительно, функция д(х) = х\ -f х{х2 + ^ выпукла по Теореме 2 п. 4.1, так как по критерию Сильвестра матрица вторых производных 2 ™-та.-оо положительно определена и не зависит от ж. Очевидно, что функция h(x\,x2) = |а?| + а?2 - 2|, являющаяся модулем линейной функции также является выпуклой функцией. Необходимое и достаточное условие экстремума в выпуклой задаче без ограничений: 0€df(&) = dg(±) + 3dh(&) (1) (использовали теорему Моро—Рокафеллара о субдифференциале суммы функций). Для дифференцируемой функции ее субдифференциал совпадает с производной. Поэтому дд(±) = (2&\ + &г,£\ + 2£2). Найдем dh{±) в точке недифференцируемости функции Λ, т. е. при %[ + %2 - 2 = 0. По определению субдифференциала α = (αι,α2) G 9/ι(χ) ^=> (ж- Α,α) ^ h(x) - h(±) Va? G R2 <ί=* <=> a|X|+a2X2~«i^i -^2^2 ^|3i +«2-2|-|4| + #2-2| VxbE2. (2) Полагая в неравенстве (2) ж2 = 0, получим, что aja?i ^ \х\ - 2| + С\ для любого Ж|, откуда вытекает, что |αι| ζ 1. Полагая Х\ = -ж2, получим, что (а2 - а])ж2 < С2 для любого ж2, откуда вытекает, что αϊ = α2. Таким образом, а = (α,α), |а| < 1. При таких значениях α в точках £\, х2 таких, что х\ + х2 - 2 = 0 неравенство (2) будет выполняться: а(х\ -f ж2 - 2) < |а?| -f ж2 - 2| Vxi,x2. Поэтому Значит { (1,1), *,+х2-2>0, dh(x) = { (а, а), \а\ < 1, х{+х2-2 = 0, (-1,-1), ж,+ж2-2<0. {: (2ж1+ж2 + 3,Ж1 + 2ж2 + 3), х{+х2-2>0, */(*) = { (2χι + ж2 + За, а?! + 2ж2 + За), |«К 1, хх + ж2 - 2 = 0, (2χί +ж2-3,Ж| + 2х2-3), χι -Ьж2~2< 0.
§ 4. Выпуклые задачи 61 Следовательно, соотношение (1) запишется в виде Г 2ζι + х2 + 3 = О, хх + 2ж2 + 3 = О, 2ж| + ж2 + За = О, Ж| + 2х2 + За = О, 2ж| + ж2 - 3 = О, х\ + 2ж2 -3 = 0, при х\ + ж2 -2 > 0, (<) при a?i + ж2 - 2 = 0, (|а| ^ 1) (it) при Ж| + ж2 - 2 < 0. (й<) В случае (г) нет критических точек, так как из уравнений системы следует, что х\ + ж2 = -2 — противоречие с условием х\ + ж2 - 2 > 0. В случае (tit) также нет критических точек, так как из уравнений системы следует, что х\ + х2 = 2 — противоречие с условием Ж| + ж2 - 2 < 0. В случае (it) система из трех уравнений с тремя неизвестными имеет единственное решение ^ = £2 = 1, α = -1. Таким образом, Smjn = 3, при £| = £2 = 1- 4.6. Задачи, упражнения В задачах 4.1-4.4 выяснить, при каких значениях параметра функции являются выпуклыми: 4.1. /(ж) = аж2 + Ьж + с. 4.2. /(ж) = ае2*+Ье* + с. 4.3. /(х,,Ж2) = (|Ж,Г + |а:2Г),/р, ρ > 0. 4.4. /(ж|,ж2) = ацж2 + 2а|2Ж1а:2 + а22ж2. В задачах 4.5-4.6 выяснить, являются ли выпуклыми функции: 4.5 /Ы = /ж1пж + (1~ж)1п(1-«). 0<ж<1, * \ +оо, иначе. 4.6. f(x) = min{a;2 + х\ \ х\ + ж2 = ж}. 4.7. /(a?) = 2|x-l| + N; 9/(4)=? В задачах 4.8-4.15 вычислить субдифференциалы выпуклых функций в точке А = 0: 4.8. /(ж) = max {ж, 0}. 4.9. /(ж) = тах{е*, 1-ж}. 1/2 11*. ί(ζι,...,ζη) = \χ\:=(Σχ1) . i=i
62 Глава 1. Экстремальные задачи η 4.11. /(х,,...,а^ = Х>;|. 4.12. /(Ж|,...,ж„)= max |а?,-|. 4.13. /(&ι,...9£η) = max ж,·. i=i,...,n 4.14. /(а^,...,жп) = тах{0,(а,ж)}, a€Rn. 4.15. / : Χ —► R, f(x) = ||ж|| (X — нормированное пространство). 4.16. Найти функцию Минковского для треугольника с вершинами в точ- ках о.*(4*т)· 4.17. Привести пример выпуклой замкнутой функции / и точки at таких, что |/(4)| < оо, 0/(й) = 0. 4.18. Привести пример выпуклой, но не замкнутой функции. 4.19. Показать на примере, что суперпозиция двух выпуклых функций не всегда выпукла. 4.20. Доказать, что любая выпуклая функция, конечная на всей прямой, непрерывна. 4.21. Доказать, что не существует выпуклой ограниченной функции, определенной на всей прямой и отличной от константы. Решить выпуклые задачи 4.22-4.25: 4.22. /(ж|,ж2) = 3? - x\X2 + xl + 3|ж| -ж2 -2| -+ min. 4.23. f(x\, χι) = x2\ + x\ + 4max {x\, x2} --> min. 4.24. f(x\bxi) = x] + x\ + 2y (a?i - αϊ)2 + (ж2 - α2)2 -► min. 4.25. f{x\,xi) = ж? + ж2 + 2а|ж| + ж2 - 1| -+ min (α>0). § 5. Элементы функционального анализа 5.1. Нормированные и банаховы пространства 5.1.1. Определение пространств Непустое множество X элементов ж,у,ζ,... называется линейным (векторным) пространством, если а) для любых элементов х,у G X однозначно определен элемент из X, называемый их суммой и обозначаемый χ -f у;
§ 5. Элементы функционального анализа 63 Ь) для любого числа λ Ε R и элемента χ однозначно определен элемент, называемый произведением числа А на элемент χ и обознача- емый Аж. Эти< I. II. III. операции должны удовлетворять следующим условиям: 1°. 2°. 3°. 4°. 1°. 2°. 1°. 2°. х + У = У + х — коммутативность. (х + у) + ζ = χ + (у + ζ) — ассоциативность. Существует элемент 0 такой, что χ + 0 = хУх £ X. Элемент 0 называется нулевым элементом. Для любого элемента χ существует элемент, обозначаемый через -ж, такой, что χ -f (-χ) = 0. 1 · χ = χ. α(βχ) = αβ(χ). (α + β)χ = αχ + βχ. α(χ + у) = αχ + ay. Линейное пространство X называется нормированным, если на X определен функционал || · ||: X —► R, называемый нормой и удовлетворяющий условиям: a) ||ж|| ^ 0 VxeX и \\х\\ = 0 <* ж = 0; b) ||а*|| = |а| - |М| VaGR, Vx G X; c) ||я1+ж2||^1М1 + 1Ы Vx,,x2GX. Линейное нормированное пространство иногда будем называть для краткости нормированным пространством. Иногда, чтобы подчеркнуть, что норма задана именно на X, мы пишем ||ж||х. Две нормы на X \\х\\\ и ||ж||2 называются эквивалентными, если существуют положительные константы С\ и С2 такие, что CilMli^lNh^CjINIi. Всякое нормированное пространство становится метрическим, если в нем ввести расстояние d(x\,xi) = ||ж| - ж2||. В метрическом пространстве естественным образом вводятся понятия открытых и замкнутых множеств, сходимость. Последовательность точек {xn}%L{ метрического пространства называется фундаментальной, если она удовлетворяет критерию Коши, т.е. если для любого ε > 0 существует Νε такое, что d(xni,xn2) < ε для всех Λι,η2 >Ne. Метрическое пространство называется полным, если любая фундаментальная последовательность сходится. Полное относительно введенного расстояния метрическое пространство называется банаховым пространством. Отметим, что всякое конечномерное нормированное пространство является банаховым. Бесконечномерное нормированное пространство не обязано быть банаховым.
64 Глава 1. Экстремальные задачи 5.1.2. Произведение пространств Пусть X и Υ — линейные нормированные пространства. Декартово произведение Χ χ Υ можно превратить в линейное нормированное пространство, введя норму Н(*.»)11ххг = max{||jc||xf||y||r}. Легко проверить, что все аксиомы нормы выполняются. Отметим очевидное утверждение: декартово произведение банаховых пространств банахово. 5.1.3. Примеры банаховых пространств 1. Конечномерное пространство Rn, состоящее из векторов χ = (жь... ,хп) с нормой / » \1/2 N14*1= (Σ*') . Эту норму иногда называют евклидовой нормой, а расстояние, вводимое с помощью этой нормы, называют евклидовым расстоянием. 2. Конечномерное пространство Ιρ, Ι ^ ρ ^ оо, состоящее из векторов χ = (х[,..., хп) с нормой и, Л (1*0'*· 1*р<00· [тах{|ж,|,...,|ж„|}, ρ = оо. Отметим, что в конечномерном пространстве все нормы эквивалентны. 3. Бесконечномерное пространство ^» состоящее из последовательностей χ = .{xn}%L{ (иногда пишем, χ = (жь... ,£„,...)), для которых 00 Σ жп < °о, с нормой 1/2 / V 4. Пространство C([*o>*i]) ."= C([£o,*iLR) непрерывных на отрезке [*ο>*ι] функций х(·) с нормой 1И-)11с([*0,<.]) = ψ** 1*01· t€[to,iiJ Обобщением этого пространства является пространство C(2T,Rn) непрерывных вектор-функций ж(·) : К -♦ Rn, заданных на компакте К, с нормой И-)11с(лг) = ψ™ И01·
§ 5. Элементы функционального анализа 65 5. Пространство Cl([to,t\]) := C]([to,t[],R) непрерывно дифференцируемых на отрезке [*ο»*ι] функций х(·) с нормой Н*ОНс«([м,])= тах{Иж(-)11с([м.])»11*(')11с([м,])}· Обобщением этого пространства является пространство Cr(K,Rn) г раз непрерывно дифференцируемых вектор-функций х(-) : К -» Rn, заданных на компакте К с нормой \Ш\ст = max {|W-)llcw, Н*(-)11с<*). · · · · ll*(r)(-)llc(*)}· 5.1.4. Сопряженное пространство, оператор Совокупность X* всех линейных непрерывных функционалов на нормированном пространстве X образует сопряженное к X пространство. Оно является банаховым пространством относительно нормы ||χ*||χ. := max (χ*,χ), ΙΜΙχ<ι где {х*у х) означает действие функционала х* на элемент я. Пусть X и Υ — нормированные пространства. Через L(X, Y) обозначим пространство линейных непрерывных операторов из X в Υ. Пусть А € L(X,Y). Тогда можно определить сопряженный оператор Л*: Y* -> X* такой, что <ЛУ,*) = <у\Лх) Ух еХ. Для линейного непрерывного функционала на произведении пространств имеет место следующая очевидная Лемма. Всякий функционал Λ G (X xY)* однозначно представляется в виде (А,(х,у)) = (х\х) + (у\у), гдех*еХ*,у* ZY*. 5.2. Определения производных Для вещественных функций одного вещественного переменного два определения — существование конечного предела ш&±!кл& (1) л->о ft и возможность асимптотического разложения при ft —» О /(* + ft) = /(£) + /f(*)ft + o(ft) (2) — приводят к одному и тому же понятию дифференцируемости. Но уже Для функций двух и большего числа переменных существует несколько
66 Глава 1. Экстремальные задачи различных подходов к понятию дифференцируемости (гладкости). Определение (1) ведет к понятиям производной по направлению, вариации по Лагранжу и производной Гато. Определение (2) ведет к понятиям производной Фреше и строгой дифференцируемости. Пусть далее в этом пункте Χ,Υ,Ζ — линейные нормированные пространства. Как правило (если это не оговорено иначе), / : Χ —>Υ — отображение пространства X или некоторой окрестности точки at e X в пространство Y2\ 5.2.1. Производная по направлению Будем говорить, что отображение / имеет в точке £ производную по направлению h9 если существует предел справа который обозначается £+/(£, Λ). Плюс в индексе здесь указывает на то, что берется именно предел справа. 5.2.2. Вариация но Лагранжу Если отображение / имеет в точке £ производную по всем направлениям и 6+f(£,h) = -6+f(±,-h) =: 6f(£,h) Vfc E X, то говорят, что отображение / имеет в точке £ вариацию по Лагранжу. При этом отображение h —► 6f(±,h) называют вариацией по Лагранжу. Таким образом, вариация по Лагранжу 6f(£,h)-hm . 5.2.3. Производная Гетто Если оператор вариации по Лагранжу 6f(±, ·) : X -» Υ линеен и непрерывен по h (£/(£,·) e L(X9Y)), то говорят, что / дифференцируемо по Гато в точке £, а оператор δ/(£,·) называется производной Гато отображения f в точке £ и обозначается /о(^)· Отсюда следует, что если отображение / дифференцируемо по Гато в точке £, то для любого фиксированного h имеет место разложение /(4 + Afc) = /(4) + Xf'o{i)[h] + г(Л,А), где ||r(fc, А)||зг = ο(|λ|) при А -» 0. Отметим, что отображение, дифференцируемое по Гато в точке £, не обязано быть непрерывным в этой точке (см. Пример 4, п. 5.2.8). 2* Но вполне содержателен пример, когда X = R*, Υ = RTO. Элемент из L(X, Υ) определяется в этом случае матрицей размера η χ т.
§ 5. Элементы функционального анализа 67 5.2.4. Производная Фреше Отображение / называют дифференцируемым по Фреше в точке χ и пишут / G D(x), если существуют линейный непрерывный оператор f(x) : X —► Υ и отображение г : X -* Υ такие, что f(x + Л) = /(*) + f(x)[h] + r(h). (*) где ||r(fr)||r = 0(||Λ||χ) при \\h\\x -+ 0. Оператор /'(£) называется производной Фреше. Это разложение можно кратко записать так: /(4 + fc) = /(4)+/\*)[k] + o(kb понимая o(h) как элемент пространства У, для которого ||o(fc)|| = o(||ft||) при ||ft|| -» 0. Через f'(x)[h] обозначено значение отображения f(x) на элементе h. Из разложения (*) следует, что функция, дифференцируемая по Фреше, непрерывна в точке дифференцируемости, а также дифференцируема в этой точке по Гато. Уже в двумерном случае эти два понятия различаются: из дифференцируемости функции по Гато не следует ее дифференцируемость по Фреше (см. Пример 4, п. 5.2.8). Аналогично из дифференцируемости по Гато по определению вытекает существование вариации по Лагранжу. И снова (уже в двумерном случае) эти понятия различны. Отметим, что производная Фреше линейного оператора совпадает с самим оператором. Если в каждой точке χ открытого множества U отображение / G D(x), а отображение χ —> f(x) непрерывно, то пишем / G С1 (17). На языке ε-δ определение дифференцируемости по Фреше отображения / в точке χ формулируется так: существует оператор f'(x) G L(X,Y) такой, что для любого ε > 0 найдется δ > 0, при котором для любого \\h\\ < δ выполняется неравенство ||/(« + fc)-/(*)-/f(*)[kJ||y<e||fc||x. Из разложения (*) следует, что производная Фреше определена однозначно, ибо равенство Λ1Λ-Λ2/1 = o(h) для линейных непрерывных операторов Λι и Лг возможно лишь при Λι = Лг. 5.2.5. Строгая дифференцируемость Во многих задачах конечномерного и бесконечномерного анализа дифференцируемости по Фреше в точке недостаточно для получения содержательного результата. Это побуждает к следующему усилению дифференцируемости в точке. Пусть отображение / дифференцируемо по Фреше в точке х. Оно называется строго дифференцируемым в точке χ (при этом пишут / G SD(x)), если для любого ε > 0 найдется такое δ > 0, что для
68 Глава 1. Экстремальные задачи всех χι и х2, удовлетворяющих неравенствам \\х\ - х\\ < б, \\х2 - х\\ < δ, выполнено неравенство ||/(х,) - f(x2) - f\x)[x{ - χ2]\\γ ζ ε\\χ{ - χ2\\χ. Из определения следует, что функция, строго дифференцируемая по Фре- ше в точке, непрерывна в некоторой окрестности этой точки. Ниже будет показано, что если производная Фреше (даже производная Гато) отображения непрерывна в точке, то отображение будет строго дифференцируемо в этой точке. 5.2.6. Частные производные Пусть X, У, Ζ — нормированные пространства. Рассмотрим отображение / : Χ χ Υ —► Ζ, (χ, у) е X х Υ. Если отображение χ —► /(ж, у) дифференцируемо в точке χ по Фреше, то его производная называется частной производной по χ отображения f в точке (£,#) и обозначается fx(x,y) fl/(*,fl) А или — . Аналогично определяется частная производная по у ох 5.2.7. Производные высших порядков Дадим теперь определение второй производной Фреше. Если отображение f : Χ -+Υ дифференцируемо в каждой точке χ G X, то определено отображение χ —► f(x) пространства X в пространство L(XyY). Поскольку L(X, Y) также является нормированным пространством, то можно ставить вопрос о существовании второй производной отображения / f"{±) = (f')'(&)€L{X,L(X,Y))- Для вектора h\ G X оператор f"(x) [h {] G L(X,Y). Возьмем вектор h2eX, тогда определено отображение /''(£)№,,Μ = /'WMIM ег. Таким образом, определено билинейное (линейное по каждому аргументу) отображение /"(£) : X х X -+ Υ. Аналогично определяются производные высших порядков. Теорема (о смешанных производных). [АТФ, с. 156.] Если отображение f G D2(x) дважды дифференцируемо в точке х, то f{b)\h\M = /"(*)[/*2,Μ V/n,/i2Gl. Замечание. Можно считать, что отображения определены не на всем пространстве, а в окрестности рассматриваемых точек.
§ 5. Элементы функционального анализа 69 5.2.8. Контрпримеры на дифференцируемость Приведем несколько контрпримеров, показывающих, что введенные понятия дифференцируемости действительно различны. Пример /. Непрерывная функция не имеет в фиксированной точке производной ни по какому направлению: \ 0, χ = О, /:R-,R,/(x)=< *' ^ ' * = ° На прямой R имеются с точностью до умножения на положительную константу два направления: h\ = 1 и hi = -1. Однако пределы по обоим направлениям не существуют. Действительно, предел *+/(*, ft) = lim /(x + Aft)-/(£) ~ Α-+0 Α. A sin j l = lim ——*- = lim sin - *=o A-*+0 A A-»+0 A A=l не существует. В силу четности функции / не существует также предел по направлению ft = -1. Пример 2. Непрерывная функция имеет в фиксированной точке производную по всем направлениям, но не имеет в этой точке вариации по Лагранжу: /R^R, /(x) = M, 4 = 0. Как и в примере 1, на прямой R имеются с точностью до умножения на положительную константу два направления: ft ι — 1 и hi = -1. Пределы по обоим направлениям существуют: /(А + Aft)-/(4)1 *+/(*. *)|« =λι™( Но предел »-»,· А-+° λ .. |АЛ{| ... |λ| = hm —-— = hm — = 1. 4=0 λ-»+0 λ A-++0 A h=h, 6mh)\ =lim f(£ + Xh)-f(±) = lim — *=o λ-»0 λ A=1 не существует. Следовательно, отображение / не имеет в точке χ = О вариации по Лагранжу. Отметим, что если £ Φ 0, то tf/(£,ft) = /'(£)[ft] = sign £ · ft. Пример 3. Отображение имеет в фиксированной точке вариацию по Лагранжу, непрерывно в этой точке, но не имеет в этой точке производной Гато. Определим отображение в полярных координатах χ = (χ\,χι) = (г cos у?, г sin у?) по формуле: / : R2 -> R, /(ж) = г cos 3φ9 χ = 0.
70 Глава 1. Экстремальные задачи Вычислим вариацию по Лагранжу данного отображения в точке at = 0. Возьмем произвольное направление h = (t cos α, t sin α). Тогда 6f(£,h) = \im λ-*0 /(£ + ΑΛ)-/(£) *=ο ,. λ* cos 3α = hm = t cos 3α. λ-ο Α Покажем, что вариация по Лагранжу 6f(£,h) не является линейным оператором по h. Действительно, возьмем два вектора h\ = (1, 0) = (cos0,sin0) (t= 1, а = 0)иЛ2 = (0,1)= (cos-,sin ~) (t = 1, α = 7г/2). Тогда Λ| + Λ2 = (1,1) = (V2cos-,V^sinjJ. Однако 6f(±,h\ + Λ2) = x/2 cos— = -1 ^<*/(^fti) + tf/(£,u2) = cosO-l-cos— = 1. Пример 4. Отображение f имеет в фиксированной точке производную Гатв, но не имеет в этой точке производной Фреше: /:R2-*R, f(x) -ί1· Ι ο, χ2 = ζ], a?i > 0, в остальных случаях, 4 = (0,0). /(*) Рис.7 °1 Рис. 8 Поскольку */(*,*) = Um f(± + \h)-f(£) = lim λ-0 f(Xh) = 0 для любого h, то производная Гато существует и /^(£) = 0. С другой стороны, функция / разрывна в точке 4 = (0,0), а функция, дифференцируемая по Фреше, должна быть непрерывна в точке дифференцируемое™. Пример 5. Функция имеет в фиксированной точке производную Фреше, но не строго дифференцируема в этой точке: /:R-R, f(x) Ι ο, χ рационально, χ иррационально, ' й = 0.
§ 5. Элементы функционального анализа 71 Выписанная функция одной (!) переменной дифференцируема в точке £ = 0. Значит она дифференцируема по Фреше в этой точке. С другой стороны, функция имеет разрывы в любой окрестности нуля, а строго дифференцируемая функция должна быть непрерывна в некоторой окрестности £. 5.3. Некоторые теоремы дифференциального исчисления в нормированных пространствах Приведем несколько теорем, наиболее часто используемых для решения экстремальных задач. 5.3.1. Теорема о суперпозиции Теорема. Пусть Χ,Υ,Ζ — линейные нормированные пространства, φ :Χ —>Υ, ψ :Υ -+ Ζ, φ(£) = y, /=ψοφ:Χ—>Ζ — суперпозиция отображений φ и ψ> Тогда, если отображение ψ дифференцируемо по Фреше в точке у, а отображение φ в в точке χ имеет вариацию по Лагранжу (дифференцируемо по Гато, дифференцируемо по Фреше), то отображение f обладает в точке χ тем же свойством, что и отображение φ, и при этом соответственно λ) δί(&,Κ) = ψ($)[6φ(&,Ιι)) VfcEX. B) /£(4) = *'0)о*Ш. C) ί'(&) = Ψ'(ν)οφ'(&) («>/'(*)[Λ] = ^(ί)Η*)[Λ]]). D) Если отображения ψ € SD(if) и ψ Ε SD(x) строго дифференцируемы в точках $ и at, соответственно, то отображение f Ε SD(&) также строго дифференцируемо в точке £. Доказательство. А) Вариация по Лагранжу. Вычислим вариацию по Лагранжу отображения 6f(x,h). По определению у а v ' λ-ο Α λ-ο A (По определению производной Фреше отображения ψ в точке у вытекает, что ^(# + Λ) = V(y) + ^'(0)М + o(h). Перепишем это разложение в виде Цу) - iKfl) = 1>'Шу - $\ + °(у - ϋ) дая у = <р(* + Xh)> у = *>(*)·) ,. tf'(fl)M* + Xh) " ?(*)] + ο(φ(Α + Xh) - φ(χ)) = Urn = λ-ο λ (Из определения вариации по Лагранжу отображения φ в точке χ вытекает, что φ(Λ + λ/ι) - φ(χ) = Χδφ(χ, h) + ο(Χ))
72 Глава 1. Экстремальные задачи ^)[lim^ + Ah)-yW 1 λ-^ο Α | 1ίαιθ(λδφ(&,Η) + ο(λ)) А-.0 λ λ—>0 Λ что и доказывает формулу для вариации по Лагранжу суперпозиции отображений. B) Производная по Гато. Если отображение φ дифференцируемо по Гато в точке х, то по определению производной по Гато оператор y?'G(x)[fr] = δψ(χ,Κ) € L{X,Y)> Тогда по уже доказанному п. А) оператор 6f(Ath) = ψ(ΰ)[6φ(&9Η)] = Ψ'(1))[<Ρο(χ)№ € L(X,Z). Это означает, что отображение / дифференцируемо по Гато в точке χ и производная по Гато /σ(*) = ΐΜ) **£(*). C) Производная по Фреше. Так как отображение φ Ε D(x), а отображение φ Ε -О(у), то из определения дифференцируемости по Фреше для любых €иб2 > 0, найдутся такие δ\,δ2 > О, что из неравенств ||ж - £|| < δ\, \\у - у\\ < δ2, следуют неравенства \\φ(χ) - φ{χ) -φ(χ)[χ - *]\\γ < d||* - Α\\χ9 (1) 1Иу) - Μ) " *Шу - Μζ < «2||у - 2/llr. (2) По неравенству треугольника для норм следует, что для элемента у = φ(χ) выполняется неравенство \\У - 011 =f Ых) - φ(*)\\ 2 \\φ'(*)[* " *]|| + *ι II* " *ll < < ||ρ'(*)|| · ||χ - «|| + ε, ||χ - *|| < (||ρ'(*)|| + ex)\\x - χ\\ < δ2 (3) при ||s - χ\\ < δ := miiJ * —,<*ι L и, значит, при \\х - &\\ < δ ΙΙΙν(*)ΙΙ + «ι - J для элементов у = ¥>(я) и ж справедливы неравенства (1)-(3). Тогда \\нх)-№-пт<рШ*-щ\ = (вычтем и добавим ψ'($)[φ(χ) - <р(х)]) = \\i>(<p(z)) - !&(*>(*)) " Ψ'(Β)Μ*) ~ <Р(*)1 + + *'(Ш») - Ф)\ - *'0)И*)[* - *11|| < (по неравенству треугольника для норм) ^ \\ψ(φ)) - ψ(φ(χ)) - М)[Ф) ~ Ψ(*)\\\ + (2) + \\*ШФ) - Φ) - *»·(*)[* - Щ\ < < ε2\\Φ) - Φ)\\ + ΙΜ0ΙΙ · ΙΜ») - *>(*) - Α*)\* - Щ <
§ 3. Элементы функционального анализа 73 (з).(0 < «2(1И*)и+«i)ii* - «и+н'ты\х - &\\ = = (е2|И*)11 + е2е, +eill^(i)||)||x - *|| < с||* - *||. Это и означает, что отображение / Ε D(±) и /'(£) = ψ'(§) ο φ'(£). Действительно, для любого ε > О подберем ει,ε2 > 0 так, чтобы выполнялось неравенство £2||у?'(£)|| +^2^ι + £il№'(0)ll < ε· По этим ει»ε2 найдем tf|,tf2 > 0» так» чтобы имели место соотношения (1)-(3). По δ\ и 02 выбирается ί. D) Строгая дифференцируемость. Так как отображение φ е SD(£), а отображение ψ € SD($), то по определению строгой дифференцируемое™ для любых б|,е2 > 0, найдутся такие tf|,tf2 > 0, что из неравенств ||я« - #11 < *ι > lift' ~ #11 < *2» i = Ь 2, следуют неравенства ||у(ж|)-у(аг2)-^'(А)[я?| -ж2]||у <ei||a?i -a?2|lx, (4) 1Из/|) -*(Ы - *'»)[yi - К]||ж ^ e2||yi - к||у. (5) Из соотношения (4) по неравенству треугольника для норм следует, что для элементов у,- = φ(χ%) Из/1 —3/211 ^ ||ν^4^)[^ι —ж2]|| -b^ill^i —ж2|| ^ (llv^4^)ll-b^i)ll^i —^2||. (6) Полагая в соотношении (4) х\ = a?t, х2 = £, имеем также \\φ(χ{) - φ(Α) - φ\±)[χι - А]\\ < e,||xt- - £||, г = 1,2. Отсюда по неравенству треугольника для норм следует, что для элементов Уг = ψ(χ%) выполняются неравенства ^11^Ч*>11Ч1»· —ΛΐΐΗ-βιΙΙ»» —*11^<11^*<Л>||Н-в1>||я?*—А||^02, '*= 1,2, (7) при ||a?t--i&||<^:=min< ,6\ >. Следовательно, при ||a?j-A'||<i Ulv(*)ll+«i J для у,- = φ(χ{) и ж^ справедливы неравенства (4)-(7). Тогда ||/(*i) - SiPi) - *'(ЙИ*)[*1 - *2]]|| = (вычтем и добавим ^'(0)[^(?ι) _ ψ{χι)\) = ||V>M*i)) - tffate)) - 1>'Ш<р(х\) - φ(χ2)] + + Ψ\ϋ)[φ{χ\) - *)(я?2)] " 0Ш*>'<*)[*1 - *2]]|| ^ (по неравенству треугольника для норм) < |И*>(*0) - iHvfo)) - *'(ί)Μ*ι) - 4>(*г)\\\ + + |H*)M*l) - *>(*2) - *>'(*)[*! - *2]]||<
74 Глава 1. Экстремальные задачи ^ егЫхх) - φ(χ2)\\ + МШ ' ΙΜ*ι) " V(*2> " φ'(*)[*\ - *2]|| < W,(4) ^ e2(llp'(*)ll + е,)||х, - х2|| + |№'»)||е, ||x, - х2|| = = (C2llv'(*)ll + *2*ι + «ιΙΙ*'(ί)ΙΙ)ΙΙ*ι -х2|| < ε||χ, -*2||. Это и означает, что отображение / Ε SD(ifc). Действительно, для любого ε > 0 подберем ει,ε2 > 0 так, чтобы выполнялось неравенство ε2||^'(ί&)||4- ε2ει + ει||^'(#)|| < ε. По этим ει,ε2 найдем tf|,tf2 > 0, так, чтобы имели место соотношения (4)-(7). По 6\ и £2 выбирается δ. Теорема полностью доказана. ■ Замечание. Теорема о суперпозиции не имеет места для производной Гато. Доказательство. Пусть φ : R2 -» R2, φ(χ) = (ч>\(х\,хг),Ч>г{х\,хг)) = (х?,ж2), 4 = 0, у>(£) = £ = 0, ^:R2-R, *(„„Λ) = /ΐ. »=^»>0, -i1· 10, в остальных случаях. Функция φ дифференцируема по Фреше в точке ± и даже строго дифференцируема (проверьте!), функция *ф дифференцируема по Гато в точке у (см. Пример 4, п. 5.2.8). С другой стороны, функция № = 1>οφ(χ) = ψ(χΙχ2) = ί1> *? = *!, *2>0*x2 = |*il,*2>0, I 0, в остальных случаях, являющаяся суперпозицией отображений φ и ψ, не дифференцируема по Гато в точке χ (и даже не имеет в этой точке производных по направлениям h = (1,1) и h — (-1,1)). ■ 5.3.2. Формула Тейлора Теорема. [АТФ, с. 159.] Пусть отображение f Ε Dn(±) n раз дифференцируемо по Фреше β точке £. Тогда имеет место разложение β ряд Тейлора /(* + *) =/(4) + /'^ где \\r(h)\\ = о(||ЛЦя) при h — 0. 5.3.3. Теорема о среднем Хорошо известно, что для числовых функций одного переменного справедлива следующая теорема Лагранжа, называемая иногда также теоремой о среднем значении или формулой конечных приращений: Теорема Лагранжа. Если функция f : [α, b] —> R непрерывна на отрезке [α, Ь] и дифференцируема в интервале (а, Ь), то существует точка с Ε (а, Ь) такая, что f(b)-f(a) = f'(c)(b-a). (*)
§ 5. Элементы функционального анализа 75 Замечание 1. Формула (*) остается справедливой и для числовых функций /(ж), аргумент которых принадлежит произвольному линейному нормированному пространству. Дифференцируемость понимается в смысле Гато. (/: X —> R, X — линейное нормированное пространство, f Ε С[а,Ь]3*, А?М)4) =»(*)). Доказательство. Полагая φ(ί) := f(a + t(b - a)), мы сводим доказательство к случаю функции одной переменной: /(&) - Да) = φ(1) - φ(0) = φ9(θ) = /'(а + 0(6 - a))(b - а) = /'(с)(Ь - а), где 0G (0,1), с = а + 0(Ь-а) € (а,6). ■ Замечание 2. Для векторнозначных функций теорема Лагранжа не верна. Доказательство. Пусть / : R —► R2, f(x) = (sinж,-cosж). Тогда f'(x)[h] = (cos», sin χ) [h] = (Λ cos x9 h sin ж), Л Е R. В то же время для любого с /(2тг) - /(0) = (sin 2тг, - cos 2тг) - (sin 0, - cos 0) = (0,0) Φ Φ f'(c)[2n - 0] = 27r(cosc,sinc), так как cose и sine ни для какого с одновременно в ноль не обращаются. Значит, формула (*) для функции / не имеет места. ■ Отметим, что в анализе, как правило, используется не сама формула (*), а вытекающая из нее оценка 1/(*)-/(«)1< sup |/'(с)|.|Ь-а|. с£(а,Ь) Покажем, что в этом более слабом виде утверждение распространяется уже на случай произвольных нормированных пространств. По традиции оно сохраняет название «теорема о среднем», хотя, конечно, его следовало бы назвать «теоремой об оценке конечного приращения». Теорема о среднем. Пусть Χ,Υ — линейные нормированные пространства, отображение f : Χ —►У дифференцируемо по Гато в каждой точке отрезка [а,Ь]. Тогда ||/(Ь)-/(а)||< sup ||/i,(c)||-||ft-e||. с€(а,Ь) Доказательство. По лемме Банаха (см. п. 5.4) для любого у Ε У, а значит, и для у = f(b) - f(a) найдется элемент у* Ε У* такой, что 11Я1 = 1 и {у\у) = Цг/Ц, т.е. (у*,/(b) - /(a)) = ||/(Ь) - /(а)||. Обозначим φ(ί) = (y*,f(a + t(b-a))). Поскольку у* — линейный непрерывный функционал, а отображение / в каждой точке отрезка 3) Отрезок Μ] = {ζ€ΑΊζ = α + *(δ-α), 0<<< 1}. 4) Интервал (о, 6) = {х € X \ х = a + t(b- о), 0<£< 1}.
76 Глава 1. Экстремальные задачи [а,Ь] имеет производную Гато, то по теореме о суперпозиции, пользуясь тем, что производная Фреше линейного непрерывного функционала совпадает с ним самим, получим ^(t) = (y\f'G(a + t(b-a))[b-a]) V* € [0,1]. Из дифференцируемости функции у?следует ее непрерывность на отрезке [0,1], и, следовательно, к ней можно применить формулу Лагранжа: φ(1) - φ(0) = φ'(θ), θ G (0,1). Поэтому ||/(Ь) " /ИИ = <»%/(*) " /(«)> = ¥>0) " 9(0) = Ψ\8) = = (y\fi(a + 0(b-a))[b-a))lyl~l\\fi(a + e(b-a))[b^a]\\^ ^\\&(* + 9(Ъ-а))\\.\\Ъ-а\\< sup ||Л(с)||-ЦЬ-а||. - се(а,Ь) Следствие 1. Пусть выполнены все условия теоремы о среднем (/ Ε DgWM) и оператор Λ G L(X,Y). Тогда ||/(*)-/(β)-Λ(6-α)||^ sup ||Л(с)-А||-||Ь-а||. с€(а,Ь) Доказательство. Надо применить теорему о среднем к отображению g(x) = f(x) - Л. ■ Следствие 2. Пусть Χ,Υ — линейные нормированные пространства, отображение F : X —> Υ дифференцируемо по Гато в некоторой окрестности точки х, отображение χ —► Sq(x) непрерывно в точке х. Тогда отображение f строго дифференцируемо в точке χ (а следовательно, и дифференцируемо по Фреше в той же точке). Доказательство. В силу непрерывности отображения x-~+fc(x) в точке χ для любого ε > 0 найдется такое δ > 0, что ||/о(в) - /g(^)|| < ε при ||ж-ж|| < 6. В силу выпуклости шара В := 6(χ,δ) — {χ \ \\х - х\\ < 6} из условия х\,Х2 € В следует, что отрезок [жι, хг\ Ε -В. По следствию 1 теоремы о среднем с Л = fO(x) получаем ||/(*ΐ)-/(*2)-/ό(*)[*|-*2]||< < sup \%{х)-Го{Щ\Л\хх-хг\\^е\\хх-хг\1 х£(хих2) что означает строгую дифференцируемость отображения / в точке ж. ■ Следствие 2 показывает, что при проверке дифференцируемости конкретного функционала достаточно доказать существование производной Гато и проверить ее непрерывность. Это гарантирует строгую дифференцируемость и тем более существование производной Фреше.
§5. Элементы функционального анализа 77 Следствие 3. Существование второй производной Фреше в точке гарантирует строгую дифференцируемость отображения в этой точке (/ Ε P2(£)=>/eS2>(£)). Доказательство. Покажем, что все условия для выполнения Следствия 2 имеются. Действительно, из существования второй производной фреше в точке χ следует существование производной Фреше (и, следовательно, существование производной Гато) в некоторой окрестности этой точки, а также непрерывность производной Фреше (и, следовательно, непрерывность производной Гато) в точке χ. Тогда по Следствию 2 вытекает строгая дифференцируемость отображения в этой точке. ■ 5.3.4. Теорема о полном дифференциале Теорема. Пусть Χ,Υ,Ζ — линейные нормированные пространства, отображение F : Χ χ Υ ~* Ζ имеет в каждой точке (ж, у) из некоторой окрестности точки (х, ф) € X х Υ частные производные Fx(x, у) и Fy(x, у) в смысле Гато, являющиеся непрерывными в точке (at, у). Тогда F Ε SD(x, у) строго дифференцируемо в той же точке и при этом *(*> Ш, v)} = fx{x, $Ш + *·,(*, №1 Доказательство. В силу непрерывности отображений Fx(x,y) и Fy(x,y) в точке (ж,#) для любого ε > О можно найти δ > О такое, что для любой точки (х9у) из «прямоугольной» окрестности V := 6(£,δ) χ 0($,б) точки (£,у) существуют частные производные Fx(x,y) и Fy(x,y) в смысле Гато и выполняются неравенства \\Fx(x,y)-Fx(x,u)\\<e, \\F9{zfy)-F,(*9t)\\<e. (*) Легко видеть, что если точки (х\,у\), (#2,2/2) лежат в У, то и точка (Я2,У|) Ε V и, более того, оба отрезка [(х\9у\),{х2,У\)], [(^2,2/ι),(ζ2,2/2)] содержатся в У в силу выпуклости множества V. Поэтому отображения χ -+ F(x,y\) и у —► F(x2>y) дифференцируемы по Гато: первое отображение имеет производную Fx(x9y\) на отрезке [х|,ж2], второе Fy(x2>y) на [у\> Уг]- Применяя следствие 1 теоремы о среднем к этим отображениям, получаем в силу (*) \\F(x]9yi)-F(x2,y2)-Fx(x,$)[x]-x2]-Fy(x,$)[yi-y2]\\ = (вычтем и добавим F(x2,y\)) = \\F(x],y])-F(x2,y])-Fx(x,<9)[x\-X2] + + F(x2,yi)-F(x29ih)-Fw(A91lKvi-V2]\\ < (по неравенству треугольника для норм и Следствию 1 Теоремы о среднем) ^ max \\Fx(x,y]) - Fx(x,$)\\ · ||ж, - х2\\ + χφι,Χι)
78 Глава 1. Экстремальные задачи + max ||*у(*2,у) " *У(*,0)||' \\У\ - Уг\\ < е\\х{ - х2\\ +е\\уг - у2\\ y€(yi,y2) для любых (х\,у\),(х2,У2) € У у что и означает строгую дифференциру- емость отображения F в точке (£,#) и дает явный вид производной Фреше (и полного дифференциала) отображения от двух переменных. ■ 5.4. Дополнительные сведения из алгебры и функционального анализа В этом пункте приводятся дополнительные сведения из алгебры и функционального анализа, которые понадобятся для доказательства теорем об условиях экстремума в гладких экстремальных задачах в нормированных пространствах. Определение. Аннулятором А1 множества А линейного нормированного пространства X называется множество линейных непрерывных функционалов ж*, для которых (ж*, ж) = 0 для любого χ £ А: А±:={х*еХ*\(х*9х) = 0 VxeA}. Отметим, что аннулятор А1 всегда содержит нулевой элемент (ж* = 0) сопряженного пространства X*. Лемма о нетривиальности аннулятора. Пусть L — замкнутое собственное (L Φ Χ) подпространство линейного нормированного пространства X. Тогда аннулятор L1 содержит ненулевой элемент х* G X*. Доказательство. Поскольку L Φ X, то существует точка £ £ L. По второй теореме отделимости (о строгой отделимости точки, не принадлежащей выпуклому замкнутому множеству) существует линейный непрерывный функционал х* € X*, строго разделяющий точку £ и подпространство L (L — подпространство линейного пространства и, следовательно, выпукло) sup (ж*, ж) < (ж*,£). (*) xtL Из этого неравенства следует, что ж* Φ 0. Покажем, что х* € L1, т.е. (ж*, ж) = 0 Уж G L. Действительно, если бы существовало ж0 G £, для которого (ж*,жо) φ 0', то поскольку ажо G L для любого a G R, было бы sup (ж*, ж) ^ sup (ж*, ажо) = -foo. x€L a€R Это не так в силу неравенства (*). Следовательно, (ж*,ж) = 0 Уж G L и, поэтому ж* G D1. ■ Далее нам понадобятся следующие две теоремы из функционального анализа.
§5. Элементы функционального анализа 79 Теорема Банаха об открытости. [КФ, с. 262; ГТ, с. 109.] Пусть Χ, Υ - банаховы пространства, Л — непрерывный линейный оператор из Χ β Υ, являющийся эпиморфизмом (Л : X —> F). Тогда образ каждого открытого множества в X открыт в Υ. Теорема Банаха об обратном операторе. [КФ, с. 213.] Пусть X, F — банаховы пространства, Л — непрерывный линейный оператор из Χ β Υ, являющийся эпиморфизмом и КегЛ '= 0. Тогда существуют обратный оператор Л"1 : Υ —► X, так же линейный и непрерывный. Лемма Банаха. [ГТ, с. 109.] X — линейное нормированное пространство, xq Ε X. Тогда существует линейный непрерывный функционал х* £ X* /идеей, что \\х*\\ = 1, (х*,ж0> = ||ж0||. Лемма Банаха является следствием из известной теоремы Хана—· Банаха о продолжении линейного функционала. Лемма о правом обратном отображении. Пусть Χ,Υ -г- банаховы пространства, Λ — непрерывный линейный оператор из Χ βΥ, являющийся эпиморфизмом. Тогда существуют отображение Μ:Υ —► X (необязательно непрерывное и необязательно линейное) и константа С > 0 такие, что AoM = IY5\ \\My\\^C\\y\\ V2/GF. Доказательство. Обозначим Вх := {х £ X | ||ж|| < 1} — открытый шар в пространстве X радиуса 1. По теореме Банаха об открытости образ открытого множества ΚΒχ открыт. Поскольку при линейном отображении ноль переходит в ноль, то множество ΑΒχ содержит внутренней точкой ноль, и, следовательно, содержит какой-то открытый шар с центром в нуле 6Βγ := {у Ε Υ \ \\у\\ < δ}. Значит, для любого у £ 6BY найдется х(у) такой, что Ах(у) = у, \\х(у)\\ < 1. Для любого у Ε Υ обо- 2\\у\\ ( 6у \ и ду и δ значим My := —— ам ттгт:). Тогда г^-т: = - < δ и из определения * δ ^2||у||/ П2||у||11 2 отображения Μ имеем: бу _ 2112/11 "У' АоМу=а(—*(щ); = — лИщ); = — пит II ll2|l2/|L^ '» Ml 2M \U бу \\\s2\U,\\ ||М2/"=|гУ II=—· \\х(щ\) || < вш Лемма о замкнутости образа. Пусть Χ,Υ,Ζ — банаховы пространства, А : X -+ Υ, В : X —► Ζ — линейные непрерывные операторы, подпространство Im А замкнуто в Y, подпространство ВКегА замкнуто β Ζ, С : Χ -+Υ х Ζ, Сх :— (Αχ,Βχ). Тогда С — линейный непрерывный оператор и подпространство Im С замкнуто в Υ χ Ζ. 5) Через Ιγ обозначается тождественный оператор на пространстве Υ.
80 Глава 1. Экстремальные задачи Доказательство. Очевидно, что оператор С линеен и непрерывен. Докажем замкнутость его образа. Замкнутое подпространство Υ = Im A банахового пространства Υ — банахово и по определению образа отображения А : X —> Υ — эпиморфизм. По лемме о правом обратном отображении существуют оператор Μ : Υ -» X и константа К > 0 такие, что _ АоМ = 1?9 \\Му\\ ζ К\\у\\ V2/GF. Пусть точка (у, z) G ImC принадлежит замыканию образа оператора С. Это означает, что найдется последовательность {хп}п^\ такая, что у = UmAxn G У, ζ — \imBxn. Положим hn := М(Ахп - у), zn := В(хп - /ιη). Тогда по свойству оператора Μ, получим: ИМ = \\М(Ахп - у)\\ < К\\Ахп - 2/Ц - 0, А(хп - hn) = Ахп - А(М(Ахп - у)) = Ахп - (Ахп -у) = у. Поэтому, Bhn -» 0 в силу непрерывности оператора В и ζ = \imzn = limB(xn - /ιη) = Нт£жп, τ. е. ζ принадлежит замыканию множества Σ — {ξ = Вх | Ах = у}. Это множество, как легко видеть, является сдвигом подпространства БКег4, следовательно, замкнуто. Итак, ζ G Σ = Σ. Это означает, что существует χ G X : Ах — у, Вх = ζ, т.е. (у,z) G ImC ■ Лемма об аннуляторе ядра регулярного оператора. Пусть Χ, Υ — банаховы пространства, А: Χ -+Υ — линейный непрерывный эпиморфизм. Тогда (ΚετΑ)1 = ImA*. Доказательство. А) Докажем, что ImA* С (КетА)1. Возьмем х* G \тА* & χ* = А*у*. Тогда (х\х) = (А*у*,х) = {у\Ах) = 0 Ухе КегА Значит, х* G (Кег^)1, т.е. Im,4* С (КетА)1. В) Докажем, что (Кег^4)х С ImA*. Возьмем х* G (ΚετΑ)1, т.е. (х*,х) = 0 Vx G Ker^4. Применим лемму о замкнутости образа для пространств X, У, Ζ = R и отображений А, Бж := (ж*,ж). Условия леммы выполняются: подпространство ImA = У замкнуто в У, подпространство БКег^4 = (ж*, Кег^4> = 0 замкнуто в Ζ = R. По лемме о замкнутости образа подпространство ImC = lm(A,x*) замкнуто bYxZ = YxR. Подпространство lm(A,x*) является собственным, так как точка (0,1) £ Im(A,x*) (если Ах = 0, то (х*,х) = 0/1). По лемме о нетривиальности аннулятора замкнутого собственного подпространства существует ненулевой линейный непрерывный функционал (у\X) G (lm(A,x*))1' G (Y х R)* = У* х R такой, что ((у\\),(Ах,(х*9х)))=0 <=^ (у\Ах) + \(х*,х) = 0 <=* <^> (4У,ж> + Л(ж*,:г) =0Ф=> (4У + Аж*,ж> =0 VxGX <=> 4=> ^У + λχ* = 0.
§5. Элементы функционального анализа 81 Причем А Ф О (ибо иначе (у*,Ах) = 0 Уж 6 ί =ί> у* = о — противоречие). Тогда ж* = А*(-у*/Х) elm А*, т.е. (КегЛ)1 С ImA*. ■ Теорема об обратном отображении. Пусть Χ,Ζ — банаховы пространства, F :Х -+ Z, F(£) = £. £cww F G SZ>(£) и F'(£) является эпиморфизмом, то существуют обратное отображение F~[ : W С Ζ -> X некоторой окрестности W точки £ и константа К > О такие, что F~l(2) = at и F(F~\z)) = ζ, \\F~](z) - F~](z)\\ ^ K\\z - f || Vz G W. Теорема Люстерника. Пусть X, Ζ — банаховы пространства, отображение F : Χ —> Ζ, F € SD(±), оператор F'(£) является эпиморфизмом. Тогда существуют отображение φ : U С X —► X некоторой окрестности U точки χ и число К > О такие, что F(x + φ(χ)) = F(*)9 \\φ(χ)\\ < K\\F(x) - F(£)|| V* G ΕΓ. Доказательство этой теоремы основано на модифицированном методе Ньютона. A) Не ограничивая общности, для краткости записи, считаем, что ^ = 0и F(£) = 0. По лемме о правом обратном операторе для оператора F'(±) : X^Z существуют обратное отображение Μ : Ζ -» X и константа (не ограничивая общности, можем считать ее большей единицы) С > 1 такие, что F'(£)oM = Iz, ||Mz|KC|H Vz G Ζ. Отображение F G SD(±), поэтому для ε = — существует δ > 0 такое, что ||F(x') - F(x") - F'(&)(x· - x")\\ < ~ ||x' - x"|| (1) при ||ж'|| < δ, \\χ"\\ < δ. Из строгой дифференцируемости в точке χ = 0 следует также непрерывность непрерывность F в некоторой окрестности нуля. Выберем δ' столь малым, чтобы ||а?|| + С||-Р(а?)|| < δ/2 при ||ж|| < δ1. Для элемента χ G U := J§(0,£') определим последовательность элемен- тов {ζη} с помощью рекуррентного соотношения tn+\:=tn-M(F(tn)), п^О, & = я. (2) B) Докажем по индукции, что ||£η|| < δ Vn > 0. Действительно, ΙΙέοΙΙ = INI < #/2. При η = 1 из (2) и леммы о правом обратном операторе получаем оценку Ml-x\\ = \\MF(x)\\^C\\F(x)\\, (3) откуда по неравенству треугольника для норм ||£ι || < ||ж|| -fC||F(a?)|| < δ/2. Пусть II&H < δ при t = 0,1,..., к (к ^ 1). Выведем отсюда, что ||&+ι || < δ.
82 Глава 1. Экстремальные задачи Из соотношения (2) следует, что &+| -£i+MF(&) = 0. Применяя к обеим частям этого равенства оператор JF'(£), получим для г = 0,1,..., к *"(*)[&+, -£,·] +Fl(&)[MF&)] = 0 ^ *"(*)[&+, -6] +JP(6) = 0, (4) откуда MM-m = WF№\<c\\Fw\ = (вычтем из F(£i) выражение F(&-\) -fF'(i&)(£t· -&-ι) равное нулю в силу соотношения (4)) = C\\F(d) - F(6-i) - JFW, - 6-.)|| < 0)1 1 <2'1й "б-'" ^ (аналогично) ^||6-ι -&-2II < ... =*ΊΙ6+ι-6·ΙΚ^ΙΙίι-*ΙΙ<^||ρ(χ)||<1.5, < = ι,...,*. (5) Отсюда в силу неравенства треугольника для норм получаем Иб+ill = 116+1 -6 + 6 -6-1 + ...+6 -6 + 611 < <ΙΙ6+.-6ΐΙ + ΙΙ6-6-.ΙΙ + .·· + Ιΐ6-6ΙΙ + ΙΙ6ΙΙ< /ι ι ι\δ * с Таким образом, мы получили, что ||&+||| < б, откуда по индукции следует, что ||£η|| < δ для любого п^Ои неравенство (5) выполняется для всех элементов последовательности ξη. С) Из неравенства (5) следует, что ΙΙίη+m-ίη|| = ll£n-f-m—£n+m-l +£n+m-l — £n+m-2 + · · · +£n+l *~£n|| ^ < Mn+m ~ £n+ro-l II + ||£n+m-l ~ 6м-го-2|| + · · · + ΙΙίη+1 - ίη|| < / 1 1 \\δ 2 δ ^(^г^ + ^^ + ,,, + ^ при n~*°°' τ·е· {ξη}η^ο — фундаментальная последовательность и, значит, она сходится в силу банаховости X. Обозначим φ(χ) = lim £п-ж. Поскольку п-+оо 116-ж|1 = 116-6-1+6-1-6-2 + ... + 6-6+6-*И< < 116 -6-.il + ΙΙ6-ί -6-211 +... +116-611 +116 - «II < (5) /11 \ <Hii-*ll(jpr + yi2+··· + !] <2||ίι-*ΙΙ, то ||ρ(ζ)|| = lim ||ί. - z|| < 2||6 - х|| § 2C\\F(x)\\ = K\\F(x)\\
§ 5. Элементы функционального анализа 83 (положили по определению К = 1С) и \\х + φ(χ)\\ < \\х\\ + \\φ(χ)\\ 4 ||х|| + 2С||^(*)|| < 6. Отображение JP, как объяснялось выше, непрерывно в окрестности £ = 0, и, значит, непрерывно в точке χ + φ(χ) = lim ξη, и поэтому П-* 00 F(x + ?(*)) = lim *■(&) (=} - lim *"(*)(£„+, -&) = <> = ВД. ■ n—»oo n—*oo Пусть X — линейное нормированное пространство, М — некоторое его подмножество. Элемент h G X называется односторонним касательным {полукасательным) вектором к множеству Μ в точке χ G X, если существуют ε > 0 и отображение г : (О, ε] —► X, такие, что a) x + th + r(t)eM Vi€(0,e]; b) ||r(t)|| = ο(ί) при ί - +0. Вектор Л называется касательным к множеству Μ в точке ж, если векторы hn -h являются односторонними касательными векторами к Μ в at. Иными словами, элемент h G X называется касательным вектором к множеству Μ в точке at G Μ, если существуют ε > 0 и отображение г : [-ε, ε] —► X, такие, что a) A + th + r(t)eM ViGf-ε,ε], Ьф 0; b) ||r(i)|| = ο(ί) при ί -> 0. Множество всех касательных векторов к Μ в точке £ обозначается Т&М, множество односторонних касательных векторов обозначается Т£М. Очевидно, что Т&М и Т$М — конусы. Если множество Т&М является подпространством в X, то оно называется касательным пространством к множеству Μ в точке х. Во многих случаях, в том числе и представляющих значительный интерес для теории экстремальных задач, множество касательных векторов может быть найдено при помощи такого следствия из теоремы Люстер- ника. Теорема (о касательном пространстве). Пусть Χ,Ζ — банаховы пространства, F : X -* Z, F G SD(x), оператор F'(£) — эпиморфизм, множество Μ = {χ G X I F(x) = F(x)}. Тогда T*M =KerF'(x). Доказательство. А) Докажем, что Т&М С KerF'(ifc). Пусть h G Т&М, тогда существуют ε > 0 и отображение г : [-ε, ε] -» X, такие, что £ + ifc + r(<) eMVte [-ε,ε], ||r(£)|| = o(t) при *->0. При малых t F(A) = F(x + th + r(t)) = F(x) + tF'(x)[h] + o(i). Отсюда *F'(x)[fc] + o(0 = 0и, значит, F'(u)[fc] = 0, т.е. h G KerF'(x) => ^МСКег^'(ж).
84 Глава 1. Экстремальные задачи В) Докажем, что KerF'(u) С Т&М. Пусть h G KerF'(x). Положим r(t) = φ(χ + th), где φ — отображение, построенное в теореме Люстер- ника. Тогда при малых t , def , F(x + th + r(i)) =F(x + th + <p(x + th)) = F(&) <=> χ + to + r(<) G M, ||r(0||^||v(* + tt)||<jr||F(* + tfc)-F(*)|| = = ΛΓ||ί^(*)[Λ] + ο(ί)||=ίτ||ο(ί)||=ο(ί), т. е. Λ G TAM => KerF'(S) С Т*М. Таким образом, Т$М = KerF'(ifc). ■ 5.5. Задачи Найти производные Фреше следующих отображений. 5.1. / : X —► У, /(ж) = Лж, Х,У — линейные нормированные пространства, Л G £(Х,У). В задачах 5.2-5.3, 5.5-5.10 Η — гильбертово пространство. 5.2. / : Η -> R, /(ж) = (а, ж), абЯ. 5.3. /:tf ^R, /(ж) = (ж,ж>. 5.4. / : Rn —> R, /(ж) = (^4ж,ж), ^4 — симметрическая матрица. 5.5. /:tf-R, /(ж) = (ж,ж>3. 5.6. / : Η \ {0} -* R, /(ж) = ||ж|| = ч/<^>. 5.7. /:tf^R, /(ж)-(ж,ж>3/2. 5.8. /:#\{0}^Я, /(ж)-ж||ж||. 5.9. /:#->#, /(ж) = ж||ж||3. 5.10. /:Я\{0}-Я, /(ж) = ^. 5.11. /:*2-R2, f(zi,x2) = (xiX2,x2i+xb, * = (U). ι 5.12. / : С([0,1]) - R, /(*(·)) - ^ *(*) Л. о ι 5.13. / : С([0,1]) -> R, /(*(·)) = f x(t)a(t)dt, α(·) G C([0,1]).
§ 5. Элементы функционального анализа 85 5.14. / : С([0,1])-> R, /(*(-)) = (fz{t)dt) . о 1 5.15. / : С([0,1]) -> R, /(*(·)) = J x\t) dt. о ι 3 5.16. /:C([0,1])-R, /(*(·)) = (/*2(*)л) · о 5.17. / : С([0,1]) - R, /(*(.)) = (/x2(t)a(t)d?j , α(·) € C([0,1]). о ι 5.18. /:C({0,1])-»R, /(*(·)) = (Jx3(t)a(t)dt) , α(·) € C([0,1]). C([0,1])-R, /(*(·)) = *(0). C([0,1])-»R, /(x(-)) = x2(l). C([0,1])-R, /(x()) = x(0)x(l). C([0,1])-C([0,1]), /(x()) = x2(0)x(l). C([0,ll)-C([0,l]), /(χ(·)) = χ(·)χ(1). C([0,1])-»R, /(x()) = sinx(0). C([0,1])-»R, /(*(·)) = cosx(). C([0,1]) -» R, /(x(·)) = sinx(0)cosx(l). C([0,1]) - R, /(x(·)) = sinx(-)cosx(0). C([0,1]) -* R, /(x(·)) = sinx(l)cosx(·). C([0,1])-R, /(x(-)) = e*(0). C([0,1]) - R, /(x(·)) = χ(1)ι(0) (x(i) > 0 VO < t < 1). C([0,1])-R, /(x()) = (sinx(0)r^'>. C([0,1]) - C([0,1]), /(x(·)) = ?(*,*(«)), V 6 C'(R2)· ι 5.33. / : C([0,1]) - R, /(x(·)) = У <p(x(t)) dt, φ€& (R).
86 Глава 1. Экстремальные задачи 5.34. / : С!([0,1]) -> С([0,1]), /(*(·)) = yjl+x2(t). 5.35. / : С1 ([ίο, ίι]) -> R, /(»(·)) =£(<,«(*),*(*)), Ι € C'(R3). 5.36. / : C'iMi]) - R, /(»(·)) = У L(t,x(t),x(t))dt, L G C!(R3). *° В задачах 5.37-5.39 указать точки, где функции / : Rn —► R не дифференцируемы по Фреше. / п \,/2 5.37. /(*)=(5>i) · 5.38. /(ж) = max |a?J. η 5.39. ί(χ) = Σ\χι\. § 6. Гладкая задача без ограничений В этом параграфе даются необходимые и достаточные условия экстремума функционалов в нормированных пространствах. 6.1. Постановка задачи Пусть / : X —► R — отображение линейного нормированного пространства X во множество действительных чисел (в этом случае обычно говорим функционал на пространстве X), обладающее некоторой гладкостью, т. е. определенными свойствами дифференцируемости. Гладкой задачей без ограничений называется задача об отыскании экстремумов этого функционала: /(ж) -+ extr. 6.2. Необходимые условия I порядка Теорема 1 (аналог теоремы Ферма в нормированных пространствах). Пусть χ £ locextr/ — точка локального экстремума функционала f и функционал f дифференцируем по Фреше (имеет вариацию по Лагранжу) в точке х. Тогда /'(*) = 0 (i/(4,k)=0 Vk€X).
§ 6. Гладкая задача без ограничений 87 Доказательство. Возьмем произвольный, но фиксированный элемент ft G X. Рассмотрим функцию <р(Х) — f(x + Aft). Поскольку at G locextr/, то 0 G locextr ^ — локальный экстремум функции φ. По теореме Ферма для функций одной переменной φ'χ(0) = 0. По определению вариации по Лагранжу это эквивалентно тому, что 6f(x9 ft) = 0. В силу произвольности ft 6f(±, ft) = 0 Vft G X. Если функционал / дифференцируем по Фреше в точке ж, то в этой точке он имеет вариацию по Лагранжу и /'(£)[ft] = 6f(±,h). Поскольку из уже доказанного следует, что эта вариация of (at, ·) = 0, то и /'(£) = 0 в силу определения дифференцируемое™ по Фреше. ■ 6.3. Необходимые и достаточные условия II порядка Теорема 2. Пусть функционал / G D2(&) дважды дифференцируем по Фреше в точке £. Необходимые условия экстремума: если ± G locmin(max)/, то /'(*) = 0, f"(x)[h,h]^0 (/"(*)[M]<0) VftGX. Достаточные условия экстремума: ес/ш /'(&) = 0к Л*)[М] > «IN2 (/"(*)[*,*] < -α||Λ||2) VftGX (*) /i/?w некотором а > 0, то ж G locmin (max) /. Доказательство. По формуле Тейлора /(* + *) = /(*) + /'(*)[*] + 5/"(*)[fcffc] + r(ft)f r(/k) = oflikii2). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость. Поскольку £ G locmin/, то, во-первых, по теореме Ферма /'(£) = 0, во-вторых, /(£ + Aft) - /(£) > 0 при достаточно малых А. Поэтому в силу формулы Тейлора /(4 + Aft) - /(4) - -/"(*)[ft, ft] + r(Aft) ^ 0 (r(Aft) = o(|A|2)) при малых А. Разделим обе части последнего неравенства на А2 и устре- r(Aft) мим А к нулю. Поскольку —J ► 0, то отсюда /"(u)[ft,ft]^0 VftGX. Достаточность. Так как /'(£) = 0, то по формуле Тейлора в силу заданного условия /"(£)[ft,ft] ^ a||ft||2 имеем: /(* + ft) - № = i /"(*)[ft, ft] + r(ft) ^ у ||ft||2 + r(ft) ^ 0
88 Глава 1. Экстремальные задачи при достаточно малых h, так как r(h) = о(||Л||2). Следовательно, £ € locmin/. ■ Условие (*) называется условием строгой положительности {отрицательности) второй производной Фреше функционала /. Отметим, что в конечномерных пространствах условие положительной определенности симметричной матрицы А гарантирует строгую положительность матрицы А (и, значит, является достаточным условием минимума в стационарной точке). В бесконечномерных пространствах это не так. Пример 7. В бесконечномерных пространствах условие положительной определенности отображения не гарантирует строгой положительности отображения. оо 2 Второй дифференциал / в нуле /"(0)[k,k]=2^—>0 Vft^O ί=ΐ η и, следовательно, является положительно определенным. Но вместе с тем второй дифференциал отображения / в нуле не является строго положительным. Действительно, неравенство f"(x)[h,h] ^ (*\\h\\2 Vh не может выполняться ни для какой константы а > О, поскольку на последовательности векторов {хп} = еп, η = 1,2,... (еп — п-й базисный вектор пространства Ь)> η 71=1 00 hi /'Шлп,М = —>«IIM2. 00 / 2 \ η—Ι ^ ' η Пример 2. В бесконечномерных пространствах условие равенства нулю первой производной и положительной определенности второй производной не гарантируют локального экстремума отображения. оо /л#2 min. Точка χ = О является стационарной. Действительно, /•<*)м = Σ (^ - «**■) => /'(°)=о. Второй дифференциал отображения / в нуле 00 Я2 ^—f л·5 п=1
§ 7. Гладкая задача с равенствами 89 и, следовательно, является положительно определенным, но вместе с тем как легко видеть не является строго положительным. В задаче на минимум точка χ = О £ locmin/, поскольку на последовательности векторов {хп} = еп/п9 η = 1,2,... (еп — n-й базисный вектор пространства h), f{xn) = l/n5 - \/п4 < 0 = /(0) при п > 1, а сама последовательность {еп/п} -> χ = 0 в пространстве ^ при η -* +оо. § 7. Гладкая задача с равенствами 7.1. Постановка задачи Пусть Х,У — линейные нормированные пространства. Функционал / : X -> R и отображение F : X —> Υ обладают определенной гладкостью. Гладкой экстремальной задачей с ограничениями типа равенств в нормированных пространствах называется следующая задача: f(x) -» extr; F(x) = 0. (Ρ) Отметим, что отображение типа равенства в бесконечномерных пространствах может содержать в себе как конечное, так и бесконечное число равенств. 7.2. Необходимые условия I порядка Теорема (правило множителей Лагранжа). Пусть χ G locextrP — точка локального экстремума в задаче (Ρ), Χ,Υ — банаховы пространства (условие банаховости), функционал f и отображение F G SD(x) — строго дифференцируемы в точке χ (условие гладкости), lmFl(£) — замкнутое подпространство в Υ (ослабленное условие регулярности). Тогда существуют множители Лагранжа Ао G R и функционал у* G Y* не равные одновременно нулю, (λ0, у*) Φ 0, и такие, что для функции Лагранжа задачи (Р) A(x) = A0/(*) + (y*,F(*)> выполняется условие стационарности: Л'(£) = 0 («. Ao</'(*),ft> + (y*,F,(±)[h]) = 0 Vft G X о Ο <λ„/'(*) + (*-'(а))У ,ft) = 0 Vft G X «► Ao/'(4) + (*"(*)) V = θ). Доказательство. Определим отображение Т{х) := (/(ж) - /(a), F(*)), ^: X - R χ Υ. Очевидно, что отображение Τ G SD(a;) и производная Фреше ?(&) = (/'(A), F'(£)) :X-*RxY.
90 Глава 1. Экстремальные задачи Возможно одно из двух: образ Im.F'(x) совпадает или не совпадает со всем пространством R χ У. A) Вырожденный случай: Im^x) ^RxF. К отображению ^'(х) применим лемму о замкнутости образа. Условия леммы выполняются. Действительно, подпространство lmF'(x) замкнуто по условию. Подпространство /'(KerF'(x)) также замкнуто. (Множество f'(KerF'(±)) является подпространством в R. Но в R имеются всего два подпространства: 0 и R. И оба они замкнутые. Значит, в любом случае подпространство /'(KerF'(i&)) замкнуто в R.) По лемме о замкнутости образа подпространство Im.F'(i&) замкнуто в R χ У. Так как оно не совпадает с R χ У, то Im^x) — собственное замкнутое подпространство в R χ У. По лемме о нетривиальности аннулятора существуют число λο и функционал у* Ε У*, не равные нулю одновременно и такие, что, (А0,2/*)е (1т^(*))\ Значит, ((Ао,у*),1ш^(*)>=0 <=» <(A0,y*),^(4)[fc])=0 VheX ^ *=* ((Ао,У*). ((/'(*).*>.-P'(*)W))= 0 V/i€l« <=* (Ao/'(4),fc> + (y\F'(x)[h]) = 0 VfeGX. А это и есть условие стационарности. B) Невырожденный случай: 1т^"'(ж) = Rx У. По теореме об обратном отображении существуют отображение Τ~λ :W CRxY —> X некоторой окрестности W точки (ά,#) ((α, у) = (0,0)) и константа К > 0 такие, что Т~\а9у) = ж, Г(Г-1(а9у))=(а9у), ||^-|(а,у)-Г-,(а,Й|]<1Г||(а,у)-(а,Л|| <^> ^\\?-\а,у)-4^к\\(<*,у)\\ v(*,y)ew. Положим χ(ε) = ^"'(ε,Ο) для достаточно малого по модулю ε. Тогда Τ(χ{ε)) = (ε, 0) «=» / (χ(ε)) -/(*)= е, F{x(e)) = 0, ||*(e) - f|| = (^-'(cO) - f|| < ЛГ||(е,0)|| = Κ\ε\. Из этих соотношений следует, что вектор £ не доставляет в задаче экстремума, ибо вблизи его существуют допустимые векторы ж (ε), на которых функционал / принимает значения как большие так и меньшие чем /(ж). Получили противоречие с тем, что £ Ε locextrP. Таким образом, невырожденный случай невозможен, и тем самым теорема доказана. ■ Замечание. Если в условиях теоремы выполнено условие регулярности отображения F в точке х9 т. е. lmF'(x) = У, то множитель λ0 Φ 0, г/, следовательно, можем считать его равным единице: А0 = 1.
§ 7. Гладкая задача с равенствами 91 Действительно, если λο = 0, то у* Φ О в силу того, что множители Ла- гранжа одновременно в ноль не обращаются. Поэтому условие стационарности приобретает вид: (у*,F'(£)[h]) = 0 Vfc G X Ф> (y*,Y) = 0 & у* = 0. Получили противоречие. 7.3. Необходимые условия II порядка Теорема. Пусть £ G locmin Ρ — точка локального минимума в задаче (Ρ), Χ,Υ — банаховы пространства (условие банаховости), функционал f и отображение F имеют в точке χ вторые производные Фреше (/, F G D2(±)) (условие гладкости), ImJP'(A) = У (условие регулярности). Тогда существует множитель Лагранжа — функционал у* G Y* такой, что для функции Лагранжа с множителем Лагранжа А0 = 1 задачи (Р) A(x) = f(x) + (y*,F(x)) выполняются условия стационарности: А'(4) = 0 (*/'(*)+ (f(f))V = 0) (1) w неотрицательности: A"(4)[ft,k] > 0 Vfc G KerF'(x). (2) Доказательство. Напомним, что по Следствию 3 п. 5.3.3 существование второй производной Фреше в точке гарантирует строгую диффе- ренцируемость отображения в этой точке. Поэтому условие стационарности (1) с множителем Лагранжа λο = 1 вытекает из правила множителей Лагранжа для гладкой задачи с равенствами и замечания к нему (см. предыдущий пункт). Докажем условие неотрицательности. Возьмем h G KerF'(x). Тогда по теореме о касательном пространстве KerF'(£) = Т&М, где Μ = {χ G X I F(x) = F(±) = 0}. Следовательно, h G T&M и, значит, существуют ε > 0 и отображение г : [-ε; ε] —> X такие, что F(± + th + r(t)) = 0 V< G [-ε; ε] и ||г(<)|| = о(£) при * -» 0. Таким образом, £ + th + г(£) —- допустимый элемент в задаче (Р) при £ G [-ε; ε] и, так как £ G locminP, то /(£) < f(£+th+r(t)). Поэтому по определению функции Λ и по формуле Тейлора /(4)</(4 + ifc + r(0) = /(4 + <ft + r(0) + (»%F(* + ift + r(0)>^ (добавим и вычтем (y*,F(± + £Λ, + r(£))» -(у%^(4 + *Л + г(0)>=А(* + *Л + г(*))-(»*,^(4 + *Л + г(0)> = = A(4) + A'(A)[ik + r(Q]+^ = /(*) + jAw (*)[fcf A] + o(i2).
92 Глава 1. Экстремальные задачи Отсюда -A"(±)[h,h] + o(t2)>0 при малых t. Разделим обе части последнего неравенства на t2 и устремим t к нулю. Получим Л"(Л)[М]>0. ■ 7.4. Достаточные условия II порядка Теорема. Пусть выполняются условия теоремы о необходимых условиях II порядка (банаховость, гладкость, регулярность, стационарность для функции Лагранжа А(х) = f(x) + (y*,F(x)) с множителем λ0 = 1) и для некоторого а > О выполняется условие строгой положительности: A"(£)[h,h] > «Hull2 Vfc G KerF'(u). Тогда χ G locminP — точка локального минимума в задаче (Р). Доказательство. По лемме о правом обратном отображении к отображению F'(x) : Χ ™ Υ существуют отображение М:У-*1и константа С > О такие, что, F'(a)oM = /r, ||Му|| < С\\у\\ VyeY. Возьмем £ + fr — допустимый элемент в задаче (F(£ -f Л) = 0). Положим h2 := M(F'(ifc)[u]) и обозначим hx := h-h2. Тогда F'(ifc)[Jii] = ί"(4)[Λ - fc2] = *"(*)[*] " F'i^M^i*)^]) - i*(4)[ft] ~ F'(^)W = 0. Значит, h\ G KerF'(ifc). По формуле Тейлора 0 = F(4 + Л) = F(x) + i"(4)[fc] + ^F"(4)[*>/ι] + o(\\h\\2) =* ^^(*)W = -|j^(*)[fc,4-«(llfc|l2). Отсюда существует δ > 0 такое, что 1И*)И1 = 5|И*)[л,л]|| + o(l|ft|l2)<с,||й||2 ν||Λ||<ί с некоторой константой С\ > 0. Поэтому ЦЛ2Ц = ||M(JF*(4)[ft])|| < C||i"(i)[ft]|| < СС, ||ft||2 < CC,tf||ft|| = e||ft|| при ε = CC.tf и ||ft|| - ||ft2|| < ||h,|| = ||ft - Μ| < IN + llfcll * 0 - e)||ft|| < INI < (1 + e)||ft||. Вновь по формуле Тейлора /(4 + Л) = A(4 + ft) = A(4) + A'(*)[fc] + jA"(A)[fc, ft] + o(||ft||2) = Λ,==°/(Α) + 5Λ"(ώ)[Λ(Λ] + ο(||Λ||2).
§ 8. Гладкая задача с равенствами и неравенствами 93 Отсюда, обозначая В := ||Л"(А)||, имеем /(* + h) - /(*) = iА"[Л, + Л2, h{ + h2) + o(\\h\\2) = - j(A"[fc,f fc,] + 2A"[huh2] + Л"[Л2,Л2]) + o(\\h\\2) > > \(а\Ы2 - 20|N| · \\h2\\ - B||fc2||2) + o(\\h\\2) > > \\\h\\\a{\ - ε)2 - 2B(l + ε)ε - Βε2) + o{\\h\\2) > 0 при достаточно малых ε > О (при ε = 0 множитель в круглых скобках равен α > 0). Из последнего соотношения следует, что £ Ε locminP. ■ § 8. Гладкая задача с равенствами и неравенствами 8.1. Постановка задачи Пусть X, У — линейные нормированные пространства. Отображение F : X -» У, функционалы £ : X —► R, г = 0,1,... ,га, обладают некоторой гладкостью. Гладкой экстремальной задачей с ограничениями типа равенств и неравенств в нормированных пространствах называется следующая задача: /о(ас) -♦ min; /,·(*) ^ 0, г = 1,..., m, F(jc) = 0. (Ρ) 8.2. Необходимые условия I порядка Теорема (правило множителей Лагранжа). Пусть at Ε locminP — точка локального минимума в задаче (Р), Х,У — банаховы пространства (условие банаховости), отображения F,/,· Ε SD(£), г = 0,1,...,га, — строго дифференцируемы в точке at (условие гладкости), ImJP'(A) — за- мкнутое подпространство в У (ослабленное условие регулярности). 7Ьгда существуют множители Лагранжа — вектор А = (Ао, Α ι,..., Am) Ε Rm+1 и функционал у* Ε У* не равные одновременно нулю, (А, у*) Φ 0, w такие, что для функции Лагранжа задачи (Р) т A(x) = J2Xifi(x) + (y\F(x)) выполняются условия: а) стационарности: Л'(4) = 0
94 Глава 1. Экстремальные задачи / m (* Σ) А*/?(*)[Л] + (гД*"(*)[Л]> =0 Vfc G X о m v t=o ' b) дополняющей нежесткости: А;/;(а) = 0, t = l,...,m; c) неотрицательности: A, ^ 0, t = 0,l,...,m. Доказательство. Можно считать, что fo(±) = 0, иначе рассмотрим функцию /о(ж) = /о(ж) - /<)(£)· Если /;(£) Φ 0 при 1 < t < m, то отбросим эти ограничения, поскольку для локального экстремума ограничения fi(x) < 0 несущественны и полагаем А,- = 0. Таким образом, можно считать, что условия дополняющей нежесткости уже выполнены. A) Вырожденный случай, lmFf(±) Φ Υ. Тогда ImF'(&) есть замкнутое собственное подпространство У. По лемме о нетривиальности анну- лятора замкнутого собственного подпространства существует ненулевой функционал у* G (imF'(f)) С У*. Это означает, что (у*,у) = 0 Vy G ImF'(s) & (y*,F'(£)[h]) = 0 Vfc G X & (*"(*)) V = 0. Остается положить Xi = 0, г = 0,1,..., га, и приходим к утверждению теоремы. B) Невырожденный случай. lmF'(£) = У, т.е. оператор F'(£) отображает пространство X на все У. Положим для 0 < k ^ m УЦ = {fc G X | (f'i(&),h) < 0, i = *,...,m, i*(4)[fc] = θ}. Очевидно, что А0 С А\ С ... С Ат. Лемма 1 (основная). Aq — пустое множество. Доказательство. Предположим противное, т.е. Aq Φ 0. Тогда существует вектор h G KerF'(s), для которого (/,·(£),h) < 0, г = 0,1,... ,m. По теореме ρ касательном пространстве KerF'(A) = Т$М, где Μ = {χ G Χ Ι F(a?) = F(£) = 0}. Значит, существует отображение г : [-ε, ε] —* Χ (ε > 0) такое, что ||г(*)|| = o(t), HiHrfilGM^i'lHiHrf^O WGf-ε,ε]. (1) При малых t > 0 для г = 0,1,..., τη имеем неравенства /i (Λ + ifc + r(i)) =/i(4)+i <//(*), Λ>+ο(ί)<0. (10 Соотношения (1) и (lt), i = 1,...,m, означают, что при малых t > 0 элемент ж + £/ι + г(£) допустимый в задаче (Р). Но при этом неравенство (1о) (/о(х + th + r(t)) < 0 = /о(£) при малых £ > 0) противоречит тому, что χ G locminP. ■
§ 8. Гладкая задача с равенствами и неравенствами 95 C) Лемма 2. Если Ат есть пустое множество, то для задачи (Р) верен принцип Лагранжа. Доказательство. Если Am = {ftG X | (/m(£),ft> < 0, F'(x)[h] = 0} = 0, то (/m(£)>h) = 0 Vft G KerF'(£) (действительно, если бы существовало ft : </;(*),Λ> > 0, F'(&)[h] = 0, то </;(*),-fc> < 0, i"(4)[-ft] = 0 => -h е Ат =ϊ Ат φ 0 — противоречие), т.е. fm(&) G (КегР'(ж))"1. Так как по лемме об аннуляторе ядра регулярного оператора (КегР'(£)) — 1т(Р'(£))*, то /™(£) £ Im(F'(4))* и, значит, существует у* G У*, для которого /4(4) +,(F,(4))V = 0. Получили условие стационарности функции Лагранжа Λ (ж) с А0 = • · · = λγη-χ = 0, Am = 1. ■ Таким образом, из пп. В) и С) вытекает, что либо принцип Лагранжа уже обоснован (Ат = 0), либо Эк, 0 < к < т : Ак = 0, Ак+\ ф0. (2) D) Лемма 3. Если выполнены соотношения (2), то ft = 0 является решением следующей задачи: </*(*),*>-*min; <//(a),ft><0, i = * + l,...,m, 1^(*)[Λ] = 0. (Ρ) Доказательство. Предположим, что утверждение леммы неверно. Тогда найдется такой элемент 7/, что (/ί(4),ι/) < 0, (//(4),τ/) ^ 0, г = fc+ 1,... ,га, Р'(4)[т/] = 0. Пусть £ — элемент, принадлежащий Ак+\, т.е. (//(£),£) <0, г = fc+ l,...,m, F'(£)[£] = 0. Тогда при малом t > 0 элемент η + ί£ принадлежит Ак в противоречии с (2). ■ E) Завершение доказательства. Применим к задаче (Р) теорему Куна—Таккера, учтя при этом, что условие Слейтера для этой задачи выполнено (из-за непустоты Ак+\). По этой теореме найдутся неотрицательные числа Afc = 1, Ajfc+1,... ,Am, такие, что выполняются условия дополняющей нежесткости А,-/,·(£) = 0, г = к + 1,... ,га, и для функции Лагранжа задачи (Р) A(ft) = S^i(/,'(A),fc) в точке ft = 0 выполнен t=ft принцип минимума: m min A(ft) = A(ft) = 0 <ί=> A(ft) = V λ,-(/■(*), ft) > A(ft) = деКегод ^ m = ΣΑ<(Λ'(*)»0) = ° VftGKerF'(£). ~ m Из последнего соотношения вытекает, что A(ft) = J2^i(fl(x),h) = 0 i=k для любого ft. G KerF'(£) (действительно, если бы существовало
96 Глава 1. Экстремальные задачи h e KerF'(u) : A(h) > 0, то -h e KerF'(f), A(-h) < 0 = A(h) - проти- т . воречит принципу минимума), т.е. ]£ Kf[(x) € (KerF'(£)) . Поскольку i=k по лемме об аннуляторе ядра регулярного оператора (KerF'(ifc)) = Im (F'(£)) , то существует у* € У*, для которого m £>/;(*)+(П*))У=о. Это и есть условие стационарности функции Лагранжа Л(ж), если положить А0 = ... = Ajfc_j =0. ■ Замечание. Из доказательства теоремы следует, что если lmFl(&) = У (т.е. если F регулярно в£)и существует элемент h Ε KerF'(£), для которого (fl(£),h) < 0, г = 1,...,т, <£> Ai ^ 0 (назовем это условие аналогом условия Слейгера), то Λο φ 0 и, следовательно, можем полагать Ао = 1. Приведем еще одно доказательство правила множителей Лагранжа в задаче с ограничениями типа равенств и неравенств в нормированных пространствах с использованием элементов выпуклого анализа. Доказательство. Как и в предыдущем случае, не ограничивая общности, считаем, что /*(£) = 0, г — 0,1,...,т. Будем рассматривать основной невырожденный случай: lmF'(£)= У. Рассмотрим задачу без ограничений <p(h) := max (fl(x),h) + 6KerF'(±)(h) -> min, t=0,l m где δΑ(·) — индикаторная функция выпуклого множества А. Напомним, чго6А(х) = {^ х^1 Лемма. Вектор h = 0 доставляет абсолютный минимум функции φ (h = 0 Ε absmin у?). Доказательство. Доказательство леммы проведем от противного. Предположим, что 0 £ absmin φ. Тогда Sabsmin < 0. Следовательно, существует вектор h Ε KerF'(i&), для которого max (f-(±)9h) < 0 & i=0,l, ...,m (fl(±)9h) < 0, i = 0,...,m. Поскольку ImF'(i&) = У, то по теореме о касательном пространстве h Ε Ker JF1'^) = Т&М, где Μ = {ж | F(x) = F(£) = θ}. Тогда по определению касательного вектора существует отображение г : [-ε,ε] —► X такое, что F{& + th + r(t)) = 0 V£ € [-ε,ε], ||r(0H - ο(0· Поэтому /<(* + th + r(t)) = Λ(4) + (//(*),ίΛ + r(t)> + o(||tfc + r(t)||) = <(/,·(*), fc) + o(<) < 0 при малых * > 0, г = 0, l,...,m.
§ 8. Гладкая задача с равенствами и неравенствами 97 Таким образом, вектор ± + th -f r(t) является допустимым элементом в задаче (Р), но при этом /0(х + th -f r(t)) < 0 = /о(£)· Получаем противоречие с тем, что ± G locminP. ■ Вектор h = О доставляет абсолютный минимум выпуклой функции φ, следовательно, по аналогу теоремы Ферма для минимума выпуклой функции 0 G d<p(h). По теореме Моро—Рокафеллара субдифференциал суммы функций равен сумме субдифференциалов, значит, О G θφ(·) = 0 max (//(£), ·) + 00KerF'(£)(·). i=0,l,...,m По теореме Дубовицкого—Милютина субдифференциал максимума функций равен выпуклой оболочке субдифференциалов, следовательно, д max (/;(#)>') = conv{/o(£),...,/^(£)}. По определению субдиф- ференциала функции 0<*KerF'(u)(O) = {h* G X* | (h\h) < 6KerF'(£)(h) - -6KtrF\m*htx}oeK=m = {h* I (Λ*,Λ> < 6KerF'(±)(h) Vft} = = {Λ* | (fc*f fc) < 0 Vfc G KerF'(£)} = = (KerF,(^))-L = Im(F,(^))* (по лемме об аннуляторе ядра регулярного оператора). Таким образом, 0 G conv{/o(x),... ,/™(£)} + Im (F'(ifc)) . Значит, существуют вектор m λ G Rm+1 такой, что Σ^ί = Ь χ{ ^ 0, и функционал у* G У*, для i=0 m которых Σ *//(*) + (ί"(4)) V = 0. ш ί=0 8.3. Необходимые условия II порядка Теорема. Пусть at G locminP — точка локального минимума в задаче (Ρ), Χ,Υ — банаховы пространства (условие банаховости), функционалы fi;, г — 0,1,..., га, и отображение F — дважды дифференцируемы по Фреше в некоторой окрестности точки & (условие гладкости), ImF'(x) = Υ (условие регулярности). Тогда max Axx(£,\,y*)[h,h]^Q VfcGHf, (А,у*)е£ m где А(х,Х,у*) = Σ */<(*) + (»*.^(*)>. K:={h€X\(f-(&)th)^0, i = 0,l m, F'(Si)[h) = 0}
98 Глава 1. Экстремальные задачи — конус допустимых вариаций, а ( I m С := ] (А, Л G Rm+I χ Г\ Σ Х<№) + (*"(*)) V = 0; ^ I 1=0 m ν λ«Λ(*) = 0, i=l,...,m; А,^ 0, г = 0,1,... ,m, ]Г A< = 1 \ф 0. «=o ' Множество С — совокупность наборов (А,у*), для которых выполнены условия а)-с) правила множителей Лагранжа для задач с равенствами m и неравенствами и ]ζ A; = 1. ι=0 Доказательство основано на лемме о минимаксе и теореме Лю- стерника. Непустота множества С следует из теоремы о необходимых условиях экстремума I порядка в гладкой экстремальной задаче с ограничениями типа равенств и неравенств в нормированных пространствах. Лемма 1 (о минимаксе). Пусть Χ,Υ — банаховы пространства, Λ Ε L(X,Y) — линейный непрерывный оператор из X на пространство Y, АХ = У, х* £ X* — функционалы на X, г— 1,..., п, такие, что max {х\,х) ^0 Vx Ε КегЛ; (*) i=l,. ..,п положим S(a,y) := min max (α* Η-(ж*, ж» для векторов а € Rn, у € Y. а?:Лж+у=0 t'=l,...,n а) величина S(a, у) имеет двойственное представление S(a,y) = sC(a,y) := max ( Υ^λ,-Οί + (у*,у) ), (А,у*)е£ \ Г^ / где 5£(а,2/) — опорная функция множества С := {(А,у*) Ε Rn x Ιέλ^+ΛΥ = 0,λ,- ^ 0, г = 1,...,η,έλ,· = l} 1 ί=1 ι=Ι } χ Γ* в точке К 2/); Ь) минимум в определении S(a,y) и максимум в sC(a,y) достигаются. Доказательство. Нетрудно видеть, что следующие три задачи эквивалентны: φ(χ) := max {α, + (χ*, χ)} + 6MJx) -* inf, (Pi) t=l,...,n где Μν := {χ \ Αχ + у = 0} (=► Sinf(Pi) = S(a,у)); .max {α, + &} -»inf; ξ € M(j/), (P2) t=l,...,n
§ 8. Гладкая задача с равенствами и неравенствами 99 где М(у) := {£= (&, ...,&)€ Rn | Эх GX : 6 = <х?,ж>, Лх +2/ = 0}; c-»inf; Oi+6 ^с, i= 1,...,η, £ G Mfy). (P3) Здесь Му, Μ (у) — аффинные многообразия соответственно в X и Rn. Возьмем элемент ж, для которого Лж + у = 0. Тогда Му = χ + КегЛ, и, следовательно, М(у) = {£ | & = (ж£,ж) + (ж?, Л), Л G КегЛ}. Возьмем произвольный вектор ξ G Μ (у). Тогда ξ = (ж*,ж) + (ж*,/ι), где fr G КегЛ. По условию леммы найдется г0 G {1,...,п} такое, что (ж*0,й) ^ 0 и, значит, max {α,- +&} ^ αίο + (ж-0,ж> + (я?<0,Л> ^ α,·0 + (ж?0,ж> > t=l,...,n ^ min {α; + (ж·,ж» =: С V£ G Af(y) ί=Ι,...,η Таким образом, значения задачи (Р2), а вместе с этим и значения задач (Ρι),(Ρ3) ограничены снизу. Задача (Р3) — задача линейного программирования, значит по теореме существования в (Р3) решение существует и, следовательно, в остальных задачах решение также существует. Обозначим решение в задаче (Р|) через £. Поскольку ± G ArgPi, то (так как φ — выпуклая функция) χ G absminy?. Отсюда 0 G д<р(£) и по теореме Моро—Рокафеллара (d(f+g) = Of+ 09) 0€д( max {о,· + (ж·,χ») + д(6Мя(х))\ . (1) \«=1,...,л / \х~х По теореме Дубовицкого—Милютина, если /(£) = </(£), то dmax{f,g}\± = conv(0/|* U dg\*). Для наших функций это означает, что ι Π Π д( max {а,- + (ж*,ж>}) =У]Авж*, At^0, г = 1,...,п, У^А, = 1. \Х—Х |==| t==| Вычислим субдифференциал второго слагаемого: д(6Му{£)) = {ж* | (ж*,ж - £) < бМу(х) - 6МУ(£) Vx£X} = (£ — допустимый элемент в задаче (Pi), следовательно, at G Му и, значит, 6Му(х) = 0) = {ж* | (х\ χ - х> < <5М„(х) Vx € X} = {χ* | (χ*,χ - х> ^ 0 Vx € Му} = (поскольку χ € Му := {х | Лх + у = 0}, то условие χ € Му равносильно условию Л = χ - χ € КегЛ) = {х* | (х*,Л> = 0 Vft € КегЛ}d= (КегЛ)"1 = 1тЛ*.
100 Глава 1. Экстремальные задачи Тогда из соотношения (1) следует, что существуют вектор А = (Αι,..., λη) и функционал y*GF*, для которых выполняются соотношения: η η 5>.а* + ЛУ = 0, λ,^Ο, i=l,...,n, ][> = 1. (2) t=l ι=1 При этом, если А,- > 0, то по теореме Дубовицкого—Милютина, а,{ -f (х*,£) = S(a,y). Далее имеем η η η η s(*> у) = Σ Α«5(α> ^) == Σ **(*»■+(χ^>) = Σ Α*α< + (Σ *<*«.*)- t=l ί=1 1=1 ι=1 η η η = 2 *.·«,· - (АУ, 4> = Σ *·«.' " »*. Λ*> = Σ λ'α·' + <**' *>· i=l i=l i=l η С другой стороны, если (А, у*) G £, то l^Ata?t* -Ь ЛУ = 0 и для любого ι=1 х такого, что Ах + у = 0 будет выполнено η η η def£ Σ Α«α«+(»*»») = ΣΑ,αί" ^*> Лж>= Σ Α«αί" (A*2/*^>d= ί=1 ί=1 ι=1 η η η = ΣΑίαί + (ΣΑί^'χ) = ΣΑ«(α< + ^'^) ^ ί=! ι=1 «=1 η < max (oj + (ж*,ж» У2 Xi = max (α* + (ж*,ж». «=1,...,η τ-* i=l,...,n «=1 Тогда Σ A*'ai + (2/*>2/> < min max (а,- + (я?*,я?>) =f5(a,y) = Σ^<Ч+ (**,»>· *Γ^ ζ:Λ&+ϋ=0ι=1,...,η ^-^ «=1 ι=1 т.е. 5(α,2/)= max (έλ,-α,· + (у*, у)) = £А,а; + (у*, у). ■ Введем обозначения: х] := /t'(£), Λ := F'(x), α, := -/,·'(£)[*&,*&]> * = 0,1,..., га, у := -F"(A)[fc,fc], где h G UT — некоторый фиксированный вектор. В лемме п. 8.3, использованной при доказательстве необходимых условий I порядка в задачах с равенствами и неравенствами, было доказано, что вектор h = 0 доставляет абсолютный минимум функционалу φ, где ψ(Κ) := max (//(£), ft)+<5KerF'(u)(fc). Значит, max (/·(£), Л> ^ 0 i—0,\,...,m t'=0,l,...,m
§ 8. Гладкая задача с равенствами и неравенствами 101 для любого h e KerF'(ifc). Следовательно, условие (1) леммы о мйнимак- се выполняется. По этой лемме существует элемент ξ = £(Л), Αξ + у= 0, для которого max (μι + (Xi ,£>) = max ( V) Atat- + (y*,»>) = i=0,...,ra (А,!Г)€£ \ ^ / = 5 , ™Ρ< ( Σλί/"(*)ΐΛ·*] + (y*,F"(x)[h,h))) = λ (A,y*)€£ \ £J / = ^ max Л„(*,А,У*)[М]. (2) По формуле Тейлора в силу условий F'(£ )[h] = 0иЛ£-Ь2/ = 0 = t V(*)[f ] + у *"'(*)[&> Л] + ο(ί2) = *2(Λ£ + у) + ο(*2) = ο('2)· По теореме Люстерника существует отображение φ : U —► X некоторой окрестность точки £ такое, что F(a?+ ?(*)) = 0, \\<p(z)\\<K\\F(x)\\ V*G С/. Полагая r(£) := φ(± + th +12£), получим, что при малых t F(& + th + ί2ξ + r(t)) = F(& + th +12£ + φ(Α + th +12£)) = 0, \\r(t)\\^K\\F(& + th + t20\\ = o(t2). He ограничивая общности, считаем, что /,·(£) = 0, г = 0,1,... ,m. Рассмотрим задачу: max /.-(a)-+min; F(x) = 0. (Ρ1) i=0,l,...,m Лемма 2. ± e locminP'. Доказательство. Проведем доказательство леммы от противного. Предположим, что точка ± & locminP'. Тогда для любого δ > 0 существует точка χ = χ(δ) такая, что \\х - £\\ < δ и max /,-(ж) < max /,·(Α) = 0 t-0,...,m t=0,...,m ^ /«(я) < 0, i = 0,... ,m, F(a?) = 0. Значит, точка х является допустимой в задаче Ρ и /о(ж) < 0 = /о(&). Следовательно, точка А £ locminP — противоречие с условием теоремы. Поэтому наше предположение, что точка £ g locminP' неверно и, значит, £ Ε locminP'. ■ По лемме 2 при малых t > 0 0= max /<(*)< max /,·(* +*Λ + ί2£ + r(t)) = max </<(«) + i=0,l,...,m 1=0,1,··.,"» ι=0,1,...,m ^
102 Глава 1. Экстремальные задачи + fi(&)[th + ί2ξ + r(t)] + ^fi(i)[th + ΐζ + r(t),th + t2t + r(t)) + o(t2)\ = =. max (tfum)+t2f'i(m\+V/"(*)ifc»fei+°(*2)} < 1=0,1,·..,"> ^ l ) V. max {/ί(4)[ί] + ^Λ,'(4)[Λ,Λ]}+β(<2) = *2 = *2 max {<»*,€> +α,·}+ α(ί2)^ί- max Л,,(4,А,У*)[М] + o(t2). t=0,!,...,m 2 (A,y*)€£ Разделим обе части неравенства на t2/2 и устремим t нулю. Получим max Axx(£,\,y*)[h,h] ^ 0 для любого вектора h€ К. т (А,У)€£ 8.4. Достаточные условия II порядка Теорема. Пусть выполняются условия теоремы о необходимых условиях второго порядка (банаховость, гладкость, регулярность), множество С Φ 0 и для некоторого а > 0 выполняется условие строгой положительности: max Axx(£,Xiy*)[h,h]}ta\\h\\2 (А,У*)€£ для любого h, принадлежащего конусу допустимых вариаций К. Тогда at Ε locminP — точка локального минимума в задаче (Р). Доказательство. Не ограничивая общности, считаем, что /,·(£) = 0, г = 0,1,..., га. Покажем, что существует δ > 0 такое, что условия /•■(4 + ЛК0, t = 0,l,...,ra, F(s + fc) = 0 (I) противоречивы при ||Л|| < tf, Л Φ 0. Из этого сразу будет следовать, что точка χ Ε locminP. Действительно, пусть вектор h удовлетворяет условию (1) и ||А|| < δ\. Тогда по формуле Тейлора Л(* + Л) = Л(4) + </<(*),Л> + f/"(*)[*,Л] + r,(ft), ||r,(h)|| = o(||ft||2), F(* + ft) = F(f) + ί"(Λ)[Λ] + ^"(*)[Λ,Λ] + r(ft), ||r(ft)|| = o(||ft||2). Введем обозначения: χ] := /,'(£), Λ := F'(x), f(x) := max /«(ж), α,- := i-0,l,...,m x/<'(*)[ft»ftl +n(ft)t У := 5-Р"(*)[Л»Л] + **(*)· ТогДа в силУ соотношений (1) разложения перепишутся в виде Д(А + Л) = (а£,Л) + а*^0, г = 0,1,...,га, ΛΛ + 2/ = 0. (2)
§ 8. Гладкая задача с равенствами и неравенствами 103 Откуда <*?, ft)+ < Ν < C{\\h\\\ ||Αλ|| = ΙΙ2/Μ < С,||Л||2. (3) По лемме Хоффмана расстояние от вектора h до конуса допустимых вариаций К оценивается по формуле / го \ (з) d(h,K,X) < С2[ Σ(*ί,Λ>+ + ||Αλ|| ) < С3||Л||2. Поэтому вектор h можно представить в виде суммы векторов h = h\+h2, где h\ e К, а вектор h2 допускает оценку ||А2|| < Сз1|Л||2· Пусть δ2 выбрано так, чтобы из условия \\h\\ < 62 следовало бы неравенство Сз1|Л|| < - (достаточно положить [62 = гтг)· Тогда ΙΙΛ.ΙΙ > \\Н - \Ы\ > ||h|| - Сз||Л||2 > ||Л||(1 - C,||ft||) > ^ и, значит, \Ы\^Съ\\Щ2^АСъ\\к{\\\ (4) По лемме о компактности множества С вытекает, что если (А,у*) Ε £, то 11у*Н < С*· Пусть £3 настолько мало, что из условия \\h\\ < £3 следует неравенство X>,T,(fc) + (yV(ft)> 1=0 < £||Л||2 < £lNI2. (5) Обозначим С$ := max ||Лм(А,А,у*)||. Если (А,у*) € С, то по опре- (А,у*)€£ делению множества С выполняются условия: А, ^ 0, г = 0,1,...,тп, т т т Σ λ, = 1, Σλ,(χ*,χ)'+ (ЛУ,х> = 0 «. Σλ,(χ,·,Χ> + <у*,Л*> = 0 для 1=0 t=0 1=0 m любого х Ε X. Отсюда ]СМж*,ж) = 0 для любого χ Ε КегЛ. Значит, ί=0 max (χϊ,χ) ^ 0 для любого χ Ε КегЛ. Следовательно, применима «=0,1 m лемма о минимаксе. По этой лемме 0) (2) 0 ^ max fi{± + ti)= max {(st*, Л> + at}^ i=0,l,—,"i i=0,l,...,m ^ min Ax+y ι max {(ж,*,χ) + at·} лв?=Ш1 max ( Υ] λ,α,- + (у*, у) ) = =0t=0,l,...,m (λ,ϊΤ)€£\~ / ,™» (Σ ъУш>ь] + 6*> М*)[*.ч) + Σ *"·.·(*> + (А,У')€Г V ^ 2 \ 2 / «
104 Глава 1. Экстремальные задачи + (y*,r(h))) (ί l- max A..(f,A,y*)[ft, +Й2,Л, +Л2] - ^||ft,||2 > J 2 (A,y*)€£ 4 ^i max AII(f)A,2,*)[ftI,ft1]-C5||uI||||ft2ll-^C'5||/l2||2-5l|ftill2^ 2 (A,y*)€£ 2 4 Sf ΙΙΛ.ΙΙ2 - 4C3Cj||ft,H3 - SClCsllft.H4 - Jwi* > 0, если только из неравенства ||Л|| < δ < mm{6i,6i,6i} следует неравенство |||ft,||2 > 4СзС5||М3 + 8C32C5||ft,||4 <Ф ^ 4C3C5||/m|| + 8θ|θ5||Λ,||2, которое всегда будет выполняться при достаточно малых h\, а в силу неравенства ||Л|| < 2||Λι|| и при достаточно малых h. Получили противоречие: 0 ^ max /;(ж -f h) > 0. ■ t=0,l,...,m Лемма (о замкнутости). Пусть X — банахово пространство, L,L' С X — подпространства в X, причем L — замкнутое подпространство, а подпространство L' конечной размерности (dim 2/ < -foo). Тогда сумма L + L' — замкнутое подпространство. Доказательство. Достаточно доказать, что сумма L+lina для любого вектора a £ X будет замкнутым подпространством (тогда аналогично подпространства L -f lin {a\, а^}, ..., L + lin{αϊ,..., ап} также будут замкнутыми). Если вектор a G L, то подпространство L + Una = L замкнуто. Если вектор а £ L, то по II теореме об отделимости точка α и подпространство L (выпуклое замкнутое множество) строго отделимы. Значит, существует функционал ж* G X* такой, что sup (ж*, ж) < (ж*, а). Из этого неравенства вытекает, что х* G LL — аннулятору подпространства L. (Если бы существовало жо € L, для которого (ж*,ж0) Φ 0, то поскольку ажо € «Ь ДЛЯ любого a G R, было бы max (ж*, ж) ^ max (ж*, ажо) = Н-оо. x€L <*€R Это не так. Следовательно, (ж*,ж) = 0 Уж G L и, поэтому ж* G LL) Не ограничивая общности, считаем, что (ж*, а) = 1 (этого мы можем добиться, умножая функционал ж* на какое-то положительное число). Пусть точка ζ принадлежит замыканию множества L-blina {ζ G L + lin a), т.е. точка ζ является предельной точкой множества £ + Una. Следовательно, существуют последовательности ξη G L, Хп G R такие, что £η + Ληα —\ζη -* ζ. Тогда в силу непрерывности функционала ж* (а*,2п> -> (ж*,ζ) =:А. С другой стороны, (χ*,ζη) = (ж*,£п + Хпа) = (я*,£п> + Ап(ж*,а> = Ап (здесь (ζ*,ξη) = 0, так как ж* G L1, а £n G £). Значит, Λη -+ Λ и, следовательно, £п = ζη - ληα —► ζ - λα =:£ G L (в силу замкнутости £). Отсюда zn = £п + ληα —► £ + Ха = ζ G £ + Una. Таким образом, множество L-ЬUna — замкнуто. ■
§ 8. Гладкая задача с равенствами и неравенствами 105 Лемма (о компактности С), Пусть Х,У — банаховы пространства, оператор Λ G L(X,У), ΛΧ = У, функционалы ж* € X*, i = 1,...,п. 7Ъгдд {I п (А,2/*) G Rn х Υ* Σ*ίχϊ + AV =0, λ* ^ 0, г = 1,..., η, 5Ζ λ|· = 1 \ является компактом. Доказательство. Рассмотрим симплекс Σ := |λ G Rn | A; > 0, г = η ^ η 1,..., η, Σ λ,- = 1 > и отображение у>: Rn -> X* такое, φ(Χ) := 51 А,-а£. ί=1 ' ι=1 Очевидно, что симплекс Σ — компакт, а отображение φ непрерывно. Тогда множество φ(Σ) С X* —· компакт (образ компакта при непрерывном отображении является компактом). Возьмем точку (А, у*) G £. Это означает по определению множества £, что φ(Χ) + А*у* = 0. Следовательно, множество φ{Σ) С 1тЛ*. По лемме об аннуляторе ядра регулярного оператора 1тЛ* = (КегЛ)1. Множество (КегЛ)1 замкнуто (аннулятор всегда замкнут), значит, и множество 1тЛ* замкнуто и, следовательно, является банаховым пространством. Отметим, что КегЛ* = {0}. (Действительно, если h* G КегЛ*, то Л*h* = 0. Это означает, что (Л*h*,х) = 0 для любого χ G X, следовательно, (h*,Ax) = 0 для любого χ G X. Поскольку ЛХ = У, то отсюда следует, что h* = 0). По теореме Банаха об обратном операторе для линейного непрерывного оператора Л* : Y* -~+ 1тЛ* С X* существует линейный непрерывный обратный оператор Л*-1 : 1тЛ* -» У*. Образ компакта при непрерывном отображении является компактом, поэтому Л*"]φ(Σ) — компакт. Но тогда и множество {(А, У*) G С} = {(A,A*~V(A)) | А € Σ} также является компактом. ■ Лемма (о двойственности для задачи о кратчайшем расстоянии). Пусть X — линейное нормированное пространство, К С X — непустое выпуклое подмножество. Тогда d(x,K,X)= sup {(x\x)-sK(x*)}, 1ИК1 где d(x,K,X) = inf {||ж-у|| | у G К} —расстояние от элемента χ до множества К. Доказательство. Напомним некоторые сведения из выпуклого анализа. Опорной функцией множества К С X называется функция sK{x*) = sup (χ*у х), конволюцией двух функций / и g называется функ- ция (/ Θ р)(ж) = inf (f(x\) +g(x2)), сопряженной функцией к функ- ции / называется функция f*(x*) — sup((aj*,x) - f(x)), индикаторной
106 Глава 1. Экстремальные задачи функцией множества К называется функция 6К(х) — \ ,' „ ' U +00, X % Л , имеет место формула (f Фд)* = f* +д*. Обозначим N(x) := ||ж||. Тогда d(x9K9X) = inf ||x - ж2|| = inf(||a? - ж2|| + *ίΓ(»2))^ "=Ф inf (\\χι\\ + δΚ(χ2)) = (Ν@6Κ)(χ). Тогда по формуле взятия сопряженной функции от конволюции <t(;K9X)(z·) = (ΝΘδΚ)*(χ*) = Ν* (χ*) + (ИГ) V) = (по определению сопряженной функции) = 8ир«ж*,ж> - ||*||) + sup«**,s> - δΚ(χ)) = ■С +00, Ί'Γ,-ΊΊ5'.;+3«*··'> -*в1'><*'>+«*<*■>· Функция ж —► d(a?,JST,X) является непрерывной, выпуклой (в силу выпуклости К) и, следовательно, замкнута. Тогда по теореме Фенхеля— Моро (/ = Г) d(x9К9X) = d(x9К9Χ)** ά= sup«*\ a?) - δ{ΒΧ*)(χ*) - sK{x*)) = χ* = sup ((x*9x) - sK(x*)). m IMKi Лемма (о сопряженном конусе). Пусть X9Y — банаховы пространства, оператор Λ Ε L(X9 Υ), ΛΧ = Υ9 функционалы χ* Ε Χ*, г = 1,..., η, конус Κ := {χ £ Χ \ {x*i9χ) ^ 0, г = 1,...,η, Лж = 0}. 7Ьгда сопряженный конус к конусу К представим в виде к* = Liеχ*\χϊ + Σχίχ* + а*у* = °> *>°> · = ι.···.». г/*ег*У I I i=r, J Доказательство. По определению сопряженного множества К* = {х*0 е X* | (хо,х) > 0 Уж е К}. Пусть ж$ G К\ Если ж G КегЛ, то либо существует г € {Ι,.,.,η} такое, что (х*9х) > О и тогда max (ж*,ж) > 0; либо (ж*,ж) ^ 0, г = 1,... ,п, значит, ж G JST и тогда ί=Ι,...,η по определению сопряженного множества (ж$,ж) ^ 0. Таким образом, в любом случае max (ж?, ж) ^ 0 Уж Ε КегЛ. Следовательно, точка «=0,1,..., η
§8. Гладкая задача с равенствами и неравенствами 107 х = 0 € absmin( max (χ*,χ) + ЖегЛ(ж)). По аналогу теоремы Ферма «=0,1, ...,л для выпуклых функций 0 е д( max (x*i,x) + δΚετΑ(χ))\χ=0 = conv{aj*>,x*,... ,a£} + ImA*. η Значит, существует пара (А, у*) е Rn_M x Y* такая, что ]£ А*ж* +ЛУ = 0, t=0 η η At > 0, ι = 0,1,... ,η, Σ λ,- = 1. Если А0 = 0, το Σ Ata?*-bA*2/* = 0 и мож- ι=0 i=l η λ,- г/* но прийти к противоречию. Если λ0 φ 0, то Жо+И"Г-ж1*+Л*-~=0. ■ i=i Ао Ао Лемма (Хоффмана). Пусть Χ,Υ — банаховы пространства, оператор A Ε £(Х,У), ΑΧ = У, функционалы χ* € X*, г = 1,... ,гс, /сояус ϋΓ := {ж Ε Χ | (χ*, χ) ^ 0, г = 1,..., η, Αχ = 0}. 7Ъгда существует константа С > 0 такая, что d(h,K,X) < с(]Г(ж*,ж>+ + ||Аа?||). Доказательство. Положим £ = Нп{ж*,... ,ж*} -f ImA*. По лемме об аннуляторе ядра сюрьективного оператора ImA* = (КегА)1 — замкнуто (аннулятор всегда замкнут). Тогда ImA* — замкнут и, следовательно по лемме о замкнутости L — замкнутое подпространство и тем самым банахово пространство. η Обозначим А| (Х,у*)=Σχίχί +Λ V. Тогда оператор Αι GL(Rn х У*,£). ι=Ι Поскольку Αι : Rn χ Υ* ™ L, то по лемме о правом обратном отображении существуют оператор Μ : L -+ Rn χ У* и константа С > 0 такие, что Λ, oM = /L, ||Ms*K C||jc*|| Vs*EL, т.е. если ||ж*|| < 1 и Мж* = (А,у*), то ЦМ**||»1ку.:=2|А,| + ||у*КС. i=l Отсюда следует, что |Aj| < С, \\у*\\ < С. По лемме (о двойственности для задачи о кратчайшем расстоянии) d(x,K,X)= sup {{χ*,χ) - 5ϋΓ(α?*)} = sup {{ж*,ж) - sup{x*,fe) > =
108 Глава 1. Экстремальные задачи (поскольку К* = {х* € X* | (x*,h) > 0 Vft € К}, то -К* =f {х* е X* I {x*,h)^0Vh€K}) = sup \{x*,x) - { °' х* |-|;· ) = sup {<х*,х> | -а* € **} = ||«·||<ι Ι 1+00' χ * я > J ||χ·||<ι (по лемме о сопряженном конусе) = sup \(х\х)\х* = У2\{х*{+АУ,К^0,1 = 1,...,п,у*€¥*} = 1М1<| I I Tlf .J =sup{(Z) А»ж·· + AV> *) Ι 0 < Αι < С, ||у*|| < с} < <c(f>i,:n>+ + ||A*||Y . § 9. Элементы общей теории поля Рассмотрим гладкую экстремальную конечномерную задачу с ограничениями типа равенств f(x) -+ min; F(x) = 0. (Ρ) Здесь / : Rn -+ R, F : Rn -+ Rm. Функции /,F обладают определенной гладкостью. Стандартным возмущением задачи (Р) называется серия задач с параметром Ь € Rm /(я)-* min; F(a?) = b. (А) Теорема (о поле в конечномерных задачах с равенствами). Пусть функции f9Fe C2(Rn) дважды непрерывно дифференцируемы (условие гладкости), ImJP'(A) = Rm (условие регулярности), существует вектор множителей Лагранжа $ Ε Rm, такой, что для функции Лагранжа А(х,у) = f(x) + (y,F(x)) задачи (Ρ) с множителем Лагранжа с λ0 = 1 выполняется необходимое условие экстремума I порядка — условие стационарности: Λ,(*,ί) = 0 и достаточное условие экстремума II порядка — условие положительности: Л«(М)[Л>Л] >0 V/iG KerF'(a), Л ^ 0, ТЬгдя существуют функции χ : U -► Rn г/ у : ί/ —► Rm, ж = ж(Ь), у = 2/(6), определенные в некоторой окрестности нуля U С (9(0, Rm), для которых х(0) = £, у(0) = #; система уравнений Ax(x,y) = Q,F(x) = b
§ 9. Элементы общей теории поля 109 выполняется в этой окрестности тогда и только тогда, когда χ — x(b), у = у(Ь); причем x(b) G locminP& для любого b £U. Доказательство. Введем отображение Φ : Rn x Rm -> Rn x Rm, действующее по формуле Ф(ж,у):= (Ax(x,y),F(x)) = (f'(x) + (y,F' (χ)), F(x)). Тогда Ф(£,#) = (AX,F(£)) = (0,0). Покажем, что отображение Φ удовлетворяет условиям теоремы об обратной функции в точке (£,#) п. 2.2.2. Условие гладкости Φ G С1 в некоторой окрестности точки (ж, у) выполняется в силу заданного условия гладкости на функции /,F. Якобиан отображения detV'(£,y) Φ 0. Действительно: «'(*>*)[(*>»)] = ».(М)М + *,(М)Ы =(Axx[x],F'Wx]) + + «2,,F'(a)),o)= (A..W + &,&(*))>*(*)[*]). Если (х,у) G КегФ'(ж,#), то F'(£)[x] = 0 и А«[*] + (».1?'(*)>=0. (1) Умножая это векторное равенство на ж, получим Ахх[х,х] + (y,F'(£)[x]) = Ахх[х,х] = 0. Отсюда в силу условия положительности χ = 0. Поэтому из равенства (1) (y,F'(£)) = 0. Из условия регулярности ImF'(4) = Rm следует линейная независимость строк матрицы F'(£). Следовательно, из равенства (y,F'(£)) — 0 вытекает, что у = 0. Таким образом, КегФ'(£,г/) = 0. Значит, якобиан άβίΦ'(£,#) ^ 0. По теореме об обратной функции для отображения Φ существует прообраз точек из некоторой окрестности точки (0,0). В том числе существует прообраз точек вида (0, Ь) при b G U G О(0). Значит, существуют непрерывные в точке 6 = 0 функции χ : U -~+ Rn и у : U —► Rm, х = ж(Ь), 2/ = 2/(&)> ж(0) = &> 2/(0) = #, определенные в некоторой окрестности нуля U G 0(0, Rm), для которых 9(х{Ь)9у(Ъ)) = (0,6) * А,(я?(Ь),у(Ь)) = 0, F(*(b)) = Ь В конечномерном случае положительность матрицы эквивалентна ее строгой положительности. Значит, существует константа β > 0 такая, что Axx(£,$)[h,h] ^ /J||fc||2 для любого h G KerF'(x). Отображение F'(x(b)) является непрерывным отображением от Ь. Поэтому Л.«(4,0)[М] > |||Л||2 Vft G Kerf(*(b)). Отображение Л2Х(х(6),у(6)) является непрерывным отображением от Ь. Следовательно, ||л..(*(ь),у(ь))--М<£
по Глава 1. Экстремальные задачи Ранг непрерывной матрицы локально постоянен, значит lmF'(x(b)) = Rm. Таким образом, при h € KerF'(x(b)) JW*(b),y(ft))[fc,hJ = Л..(М)[Л,Л] + + (А..(*(Ь),у(Ь)) - Л..(*,0))[М] £ |||ft||2 - ^||ft||2 = ^\\h\\\ Поэтому в точке х(Ь) выполняются достаточные условия минимума для точки ж(Ь). Следовательно, x(b) G locmin P&. ■ Аналогично доказывается и бесконечномерный вариант этой теоремы. Поле экстремалей, которое строится далее при доказательстве достаточных условий экстремума в вариационном исчислении, будет построено таким же образом. Только в качестве возмущающего параметра в вариационном исчислении берутся краевые условия на правом конце. Ответы к задачам главы 1 1.1. (-4,14) G absmin, 5min = -52; Smax = +ob. 1.2. (2,3) j? locextr, Smin = -oo; 5max = +oo. 1.3. (8,-10) g locextr, 5min = -oo; 5max = +oo. 1.4. (5,2) G locmin , Smin = -oo; Smax = +oo. 1.5. (1,1/2,-1) G absmin, Smin = -3/2; 5max = +oo. 1.6. (—-,—-, l) G absmin, 5min = --; 5max = +00. 1.7. (-, -1, -J g? locextr, 5min = -oo, Smax = +oo. 1.8. (g, з>~2/ * locextr; 5min = ~°°' 5max = +00· 1.9. (1,1) G locmax, (-1,1) g locextr; 5min = -oo, Smax = +00. 1.10. (1,1) G locmin, (0,0) g locextr; ^min — —00, Omax — +00. 1.11. (24,144,-1) G locmin , (0,0,-1) g? locextr; Smin = -oo, 5max = +oo. 1.12. (l,l)Glocmax, (0,0),(0,3),(3,0) g locextr; 5min = -oo, Smax = +oo. 1.13. (0,0) g locextr, Smin = -oo, 5max = +00. 1.14. (1/2,±1),(-1/2,±1) G absmin, 5min = -9/8; (0,0) G locmax, (0,±l),(±l/2,0) {? locextr; Smax = +00. Л5· (WeW) £ 10Ст1П> (WeW) £ l°CmaX' (±1·°)·(°·±1) * locextr; Smin = -00, 5max = +00. 1.16. (2,3) G locmax, (0,ж2) G locmax при x2 € (-00; 0) U (6; +00), (0,^2) £ locmin при 0 < x-i < 6, (0,0),(0,6),(a?i,0) g locextr; ^min = "OO, 5max - +OO. 1
Ответы к задачам главы 1 111 1.17. (0,0) е absmin, 5min = 0; (--, --J g locextr; Smax = +oo. 1.18. (1, -2) g? locextr, Smin = -oo, 5max = -boo. / 7 — 2#2 \ 1.19. (1,1,1) Glocmax; стационарные точки (0,&2,—ι—)> (si,£2,0)£ locextr; стационарные точки (жь0,хз) при некоторых соотношениях доставляют локальный минимум, максимум или не доставляют локального экстремума; Sm\n = -оо, 5тах = +оо. л 1 8 1.20. г - τ € absmin, 5min = —; 5тах = +оо. 3 45 3£ 8 1.21. tl - j G absmin, 5min = —; Smax = +оо. 1.22. (-3 - л/6, -3 - л/6) G absmin, Smin = -4 - 2л/б, (-3 + V6, -3 + V£) G absmax, Smax = -4 + 2л/б. 2.1. (—, —J G absmin, 5min = —, 5max = +oo. 2.2. (-,-) G absmax, 5max = e,/4, 5min = 0. 2.3. (^,-—^Gabsmin, Smin=->/2, (--=,--=) Gabsmax, 5max=v^. 2.4. (2,-3), (-2,3) G absmin, Smln = -50, (-,4), (-y-*) G absmax> unax = 106-. 4 2.5. (-, -, -J G absmin, 5min = -, 5max = +00. absmin, 5min = ->/Ϊ4. /3 3 1\ 11 2.7. (-, -, -J G absmin, 5min = —, 5max = +00. ^o /33 229 ™\ u . * 1071 „ 2.8. ^y, — >98J G absmin, 5min = —, 5max = +00. 2.9. (-, -, -) G absmax, 5max = -; (0,0,-1) G absmin, 5min = -1. 2.10. (-1,1,1) G absmin, Smin = 0, (1,1,1) G absmax, 5max = 2. absmax, £min = "~ . /7) ^max = /7·
112 Глава 1. Экстремальные задачи / 18 24\ / 12 16\ 2.12. \0, у, у J G absmax, Smax = 36, [0, у, у J G absmin, Smin = 16. 2.13. (-, -, -) G locmax, (*,0,1 -*) G locmin при * G (0,1),(*,0,1 -*) G locmax при t G (-oo, 0) U (1, +oo), (0,0,!),(!, 0,0), (*, 1 -*,0) g locextr V*, 5max = +oo, Smin = -oo. 2'14' (^'^^'(^^^Tf)^158™11' ___ 1 / ! . 1 ! W ! . 1 Μ κ absmin- 12ч/5; ^>±V3,^>,,V ^ ^"Vf/6 **' 1 ^absmax= —7=5 стационарные точки (ж!,0,ж3) G locmin при X\Xy > 0 (x\ + xl = 1); (ж|,0,ж3) G locmax при X\Xy < 0 (x2 + x\ = = 1); (±1,0,0), (0,0,±1) g locextr; (жьж2,0) ( locextr при ж?+а?2 = 1. a 2.15. -— G absmin, 5min = -|a|. |a| 6-(a,s) п \(a,x)-b\ H2 a{a9x-b) ' ι ^1/2 2.16. at = X + a TTJ » ^min = 2.17. A = \a\2 2.18. Стороны прямоугольника: αι>/2,α2>/2, площадь 2а,\аг. Λ Λ 2α ι 2α2 2α3 8 2.19. Стороны параллелепипеда: —ρ,—ρ,—ρ, объем —ра^аз· ν3 V3 V3 3v3 2.20. Из точки с координатами (£ι,&) к параболе у = ах2 (а > 0) можно провести три нормали, если точка расположена выше кривой £2 = 3 · 2 3a 3£,3 + 2~1a"~l; две нормали из точек на этой кривой кроме точки (0,2""|а-'1); одну нормаль из точек ниже этой кривой и точки (0,2~*а~1). /хЛ2 /х2\2 2.21. Приведем ответ для гиперболы ( — ) - I — ) = 1. Из точки с ко- ординатами (£ι,&) можно провести три нормали к ближайшей ве- тви гиперболы и одну к дальней, если (ξ\а\)3 - (£2^2)3 > (αι + al)' 5 две нормали к ближайшей ветви гиперболы и одну к дальней из точек (ξχ,ξτ)* Для которых последнее неравенство обращается (о,*^); в равенство, исключая точки ( 0,± I; из всех остальных V а« / точек плоскости можно провести по одной нормали к каждой ветви гиперболы.
Ответы к задачам главы 1 113 / 1_ J_ J_\ /J 1_ J_\ /J_ J 1_\ /j ι i\ /_j_ J !\ f_J L Ал W vT >/2'9\ Vb'Vb' у/з)'\ vT Vb'Vb^ absmax Smax = —=; (*,0,0),(0,*,0), (0,0,0 £ locextr V|i| < 1. 3v3 3.2. (0,..., 0) G absmin, 5min = 0, (±тГ1/4,...,±тГ,/4) G absmax, Smax = γ/rc, критические точки (0,... ,0,±га~1/Г4,... ,±m~!/4) g locextr (и их всевозможные перестановки координат), m = 1,... ,п - 1. 3.3. (0,...,0)G absmin, 5min = 0, (±η~1/2,...,±τΓ1/2) G absmax, Smax=l, критические точки (0,... ,0,±га~1/Г2,... ,±га~1/Г2) £ locextr (и их всевозможные перестановки координат), га = 2,..., п. 3.4. (0,1) G absmin, 5min = е-1 - 1; (1,0) € absmax, Smax = е - 1; '(0,0) g locextr. 3.5. (0,0) G absmin, Smin = 0; (л/3/2,1/2) G absmax, 5max = 5/4; критическая точка (0,1) £ locextr. 3.6. (0,0,0) G absmin, Smin = 0; (12,0,0),(0,12,0),(0,0,12) G absmax, Smax= 144; (4,4,4),(0,6,6),(6,0,6),(6,6,0) £ locextr. 3.7. (0,0,0) G absmin, Smin = 0; (0,12,0) G absmax, 5max = 576, (f,f,f))(f,f,0),(0,f,f))(6)0,6))(12,0,0))(0,0,.2)^ locmax. 3.8. (7,7) G absmin, Sabsmin — ~7> критические точки в задаче на V6 6/ 6 максимум (θ,-), (-,-) glocextr; (θ,-J Glocmax, 5abSmax = +00. 3·9· U'6'-6)GabSmin>5min=== Π; Ι0'*"*)· U'8u)^°CeXtr; / 3 1\ [0, -, - J G locmax, 5max = +00. 3.10. (-2,0,7) G absmin, Smm = -17; 5max = +00. 3.11. (-5/2,0,20) G absmin, Smin = -52,5; Smax = +00. 3.12. (16,257,592) g? locextr; 5min = -00; 5max = +00. 3.13. (0,1,0) G absmin; Smin - 0, 5max = +00. (2 174 24 \ y,—,-yJ € locmin, 5min = -00; (1,0,3) G locmax, 5max = +00; (-1,6,-3) g locextr.
114 Глава 1. Экстремальные задачи 3.15. (ν/6,1,1),(1,v/б",1),(1,1,\/б)€ absmin, Smin = v/б; (γι· Vi' уу€ absmax> 5max=ivf: (ν? vf · 0 - G/il·· 7D · О· Л> VD *,ocextr· 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 4.8. 4.9. 4.10. 4.11. 4.12. 4.13. 4.14. 4.15. 4.16. 4.17. 4.18. 4.19. 4.22. 4.23. 0 0. О О, 6^0. Р>1. α-ιι ^ О, о22 > 0, ома22 - о?2 ^ 0. Да. Да. (-3, χ < О, [-3,-1], х = 0, -1, 0<х<1, [-1,3], х = 1, 3, К ж. 0/(0) = [0,1]. 0/(0) = [-1,1]. W) = {j/ = (j/,,...,2/n)€Rn ||уЮ} */(0) = {у = (У ,!*.)€ R"| max |%U l}. 0/(0) = {y = (y,,...,»,) € R" Ι Σ \Vj\ < l}· */(0) = {» = (»i,...,jfc)€R" I Ей=1, W>0, j = l 0/(0) = [0, a]. 0/(0) = Я* = {x* G Χ* | ||χ*|Ιχ· < 0· тах{ж|+\/Зж2,Х| - ν/3χ2,-2χι}. /(х) = (-^/ГГ^- N<]. 4 = ±l. м ' \+oo, |*| > 1, Г0, |x|<l, f{x) = \ 1, |x| = 1, I+oo, |x|>l. /(*) = е-',$(ж) = х2,/о,;=е-*\ (1, -1) € absmin, Smin = 3. (-1,-1) € absmin, 5min = -2.
Ответы к задачам главы 1 4.24. of + а\ < 1 => (01,02) € absmin, 5min = of + a\; a] + a\ ( , α' , ) e absmin, Smin = 2γ/β? + o^ - 1. ^yof + o^ \Ja\ + a\' 1 , 4.25. 0 < a < - =» (a, a) € absmin, 5min = -2a + 2a - < a =► (-, -J € absmin, 5min = -. 5.1. /'(*)[ft]=Aft. 5.2. f(A)[h) = (a,h). 5.3. /'(£)[ft] = 2(£,ft). 5.4. /'(*)[&] = 2(4£, ft). 5.5. /'(*)[&] = 6(£,*>2(£, ft). 5.7. f(A)[h] = 3\\&\\(A,h). 5.8. /'(4)[fc] = ||4||fc+^j^. 5.9. /'(*)[&] = p||3ft + 3*р||(*,Л>. 5.11. /'(£)[(/»,, ft2)] = (2ft, + ft2,2ft, + 4ft2). 1 5.12. f(&())[h(-)] = fh(t)dt. 0 I 5.13. /'(*(·))[*(·)]= f a(t)h(t)dt. 0 I 2 I 5.14. /'(*(.))[*(·)] = з( f&(t)dt\ · fh(t)dt. о о 1 5.15. /'(*(·))[*(·)] - 3 / 42(i)fc(0 <**· 0 I 2 I 5.16. /'(*(·))[*(·)] = б ( / *2(0 *) ' / *(*)*(*)<**·
116 Глава 1. Экстремальные задачи I 2 ' 5.17. /'(*())[Ч)] = б( f&2(t)a(t)dtj ■ I£(t)a(t)h(t)dt. 0 о 1 1 5.18. /'(*(·))[&()] = 6 / Α3(ί)α(<) dt ■ ί &2(t)a(t)h(t) dt. 5.19. /'(*(·))[Λ()] = Μ0). 5.20. /'(*(·))[*(·)] = 2A(l)ft(l). 5.21. /'(*(·))[ft()l = Α(1)Λ(0) + *(0)ft(l). 5.22. /'(Α())[Λ(·)] = 2*(0)a(l)ft(0) + £2(0)ft(l). 5.23. /'(±(·))[Λ(·)] = *(1)Μ·) + *(·)Λ(1)· 5.24. /'(*(·))[*(·)] = cos*(0) · ft(0). 5.25. /'(*(·))[Μ·)ί = -8ΐη*(·) · МО· 5.26. /'(*(·))[/»(·)] = cosf(O) cos£(l) · ft(0) - sinA(0)sinA(l) · ft(l). 5.27. /'(*(·))[*(·)] = cos£() cos£(0) · h() - sin A() sin 4(0) · ft(0). 5.28. /'(£(·))[Λ(·)] = cos4(1)cos*() · ft(l) -sinA(l)sin*(·) · ft(). 5.29. /'(*(·))[*(·)! = ef(0)ft(0). 5.30. /'<*(.))[*(·)] = *(1)*<°> (МО)Ш4(1) + *(0)щ)■ 5.31. /'(*(·))[*()] = (sin4(0)r^^cos^(1)co^y) _ sin £(l)ft(l)lnsin£(0)J. 5.32. /'(4(·))[*(·)1 = *>«(*,*(<))*(*)· ι 5.33. /'(*(·))[*(·)] = У'<p'№))4t)dt. о 5.34. m.))W·)] = 4S%=. у!+*(*) 5.35. /'(*(·))[*(·)] = Lx(t,mMt)№) + £*(«,4(ί),4(ί))Λ(ί). 5.36. /'(*(·))[*(')] = / (ϋ,(*,Λ(*)»*(*))Λ(*) + £*(<,4(ί),*(ί))Λ(*))Λ. *0 5.37. ж = 0. 5.38. {ж = (»ι,...,хп) | |ж*| = |ж;| для некоторых i^j}. 5.39. {х = (жь...,жп) \х{ -χ2·'...·χη = 0}.
Глава 2 Линейное программирование В линейном программировании изучаются задачи об экстремуме линейной функции нескольких переменных при ограничениях типа равенств и неравенств, задаваемых также линейными функциями. Рождение линейного программирования принято отсчитывать от работы Л. В. Канторовича 1939 года об оптимизации раскроя листов фанеры для самолетов и распределения ограниченных ресурсов в более общих проблемах, где впервые было показано, что многие задачи экономики формализуются как задачи об экстремуме линейной функции при линейных ограничениях. Канторович для рассмотренного им класса задач ввел двойственные переменные, дал им содержательную экономическую интерпретацию и описал алгоритм решения двойственной задачи близкий по духу к симплекс-методу. Через несколько лет (около 1947 года) интерес к подобным задачам возник у американских математиков. Этот интерес был вызван проблемами, связанными с экономикой и военно-промышленным комплексом. Из числа экономистов, пропагандировавших среди математиков данный класс задач, следует прежде всего назвать Т. Купманса. Он же ввел термин «линейное программирование» (linear programming). Впоследствии Канторовичу и Купмансу была присуждена Нобелевская премия по экономике за 1975 год. Слово «программирование» заимствовано из зарубежной литературы и в данном случае означает не что иное, как «планирование». Симплекс-метод был разработан Д.Данцигом. Общая теория была построена коллективом математиков, среди которых следует отметить так же Куна, Таккера, Гурвица и Дж. фон Неймана. В этой главе рассматриваются постановки задач линейного программирования, правило решения задач в канонической форме по симплекс- методу, приводятся с решениями примеры. Вводится понятие двойственности, проводится обоснование симплекс-метода, дается ряд методов нахождения первоначальной крайней точки. Рассматриваются наиболее известные типы задач линейного программирования — транспортные задачи и задачи о назначении.
118 Глава 2. Линейное программирование §1. Симплекс-метод 1.1. Постановки задач. Геометрическая интерпретация Задачей линейного программирования в канонической форме называется задача нахождения максимума линейной функции от η переменных Х = (Х\9...,Хп) f(x) = сххх + с2х2 + ... + СпХп, удовлетворяющей системе га линейных неравенств а\хх + а\х2 + ... + а"хп = Ь{, а\х\ + а\х2 + ... + а2хп = Ьъ oii»i + <*тЯ2 + ... + а» жп = Ьт, и ограничениями неотрицательности ж^· ^ 0, j = 1,...,п. Поскольку уравнения системы можно умножать на -1, то считаем, что в задаче линейного программирования в канонической форме 6,-^ 0, г = 1,..., га. В дальнейшем мы, как правило, будем использовать векторно- матричную запись: (с, х) -+ max; Ах = Ь, χ ^ 0. (Р*) Здесь ж = (х\>...9хп) G Rn — неизвестная переменная, заданные вектора с = (с|,...,с„) G Rn и 6 = (Ь|,...,ЬШ) € Rm, η — скалярное произведение векторов с и ж, 4 = {aj}i=:i,...,m = aj ... a? заданная матрица со столбцами «ϊ aL j = l,...,n, размеров га χ η. Функция / называется целевой функцией, вектор с — вектором стоимости, вектор Ь — вектором ограничений, матрица А — матрицей условий. Обозначим Sp — численное значение задачи (Р), AjrgP — множество решений задачи (Р), т.е. множество допустимых точек χ Ε Rn, для которых (с9х) = 5р.
§ 1. Симплекс-метод 119 Задачей линейного программирования в общей форме назовем задачу (с, х) —> min; Ах < Ь. (Р) Иногда задачи линейного программирования рассматриваются приведенными к нормальной форме (с, х) -* max; Ах < Ь, ж ^ 0. (Р„) Каноническая форма более удобна при описании алгоритмов решения, задачи в общей и нормальной формах часто используются при рассмотрении проблем существования решений и двойственности. Двойственные задачи для задач в нормальной форме приобретают наиболее симметричный вид. Сведение различных форм задач друг к другу Задачи в различных формах легко сводятся друг к другу путем введения дополнительных координат и изменением матрицы А. Все полученные формы одной задачи одновременно: а) имеют пустое или непустое множество допустимых точек; Ь) имеют или не имеют конечное решение. Например, если дана задача в нормальной форме, то ее можно свести к задаче в канонической форме путем введения дополнительных координат χ = (ж„_и · · · ·, хп+т): (с, х) —► max; Ах + 1х = Ь, χ ^ 0, χ ^ 0. Здесь J — единичная матрица размеров га χ га. В качестве упражнений попробуйте самостоятельно свести другие формы задач линейного программирования друг к другу. Упражнения 1. Свести задачу в канонической форме к задаче в нормальной форме, 2. Свести задачу в канонической форме к задаче в общей форме, 3. Свести задачу в общей форме к задаче в нормальной форме. 4. Свести задачу в общей форме к задаче в канонической форме. 5. Свести задачу в нормальной форме к задаче в общей форме. Геометрическая интерпретация. Рассмотрим более подробно задачу линейного программирования в канонической форме. Через D(Pk) будем обозначать множество допустимых точек в задаче (Р*) (D(Pk) := {χ Ε Rn I Ax = 6, χ > 0}). Множество D(Pk) является выпуклым многогранником в пространстве Rn. Линии уровня функционала (с, ж) являются гиперплоскостями. Нетрудно видеть, что экстремум линейной функции (если он существует) достигается в крайней (угловой) точке выпуклого многогранника. Напомним, что точка d выпуклого множества D называется крайней (угловой), если не существует точек d\9d2 Ε D, d\ Φ d^b и числа t Ε (0,1) таких, что d = td\ -f (1 - £)^2· У многогранников крайние точки — вершины. Имеет место следующая
120 Глава 2. Линейное программирование Теорема Минковского. Выпуклый компакт в Rn является выпуклой оболочкой своих крайних точек {\ Число крайних точек множества D, задаваемого в виде конечного числа линейных равенств и неравенств, является конечным. Таким образом, для решения задачи линейного программирования (если оно существует), достаточно перебрать значения функции (с, ж) во всех крайних точках множества D. Но нахождение всех этих крайних точек и перебор значений функции (с, х) — операция довольно трудоемкая. Описываемый ниже симплекс-метод решения задачи линейного программирования позволяет, начиная с некоторой исходной крайней точки, переходить к другой по направлению наибольшего возрастания функции (с, х). Свое название симплекс-метод получил из-за вида множества допустимых элементов, которое в простейших задачах имеет вид симплексов (отрезка, треугольника и т. д.) Задача (Р*) называется невырожденной, если любая крайняя точка множества D(Pk) содержит ровно т положительных координат. Пусть χ — крайняя точка в невырожденной задаче с положительными координатами (для определенности первыми) х\>...9хт. Тогда вектор χ можно представить в виде χ = (ж&,хп), где хъ = (х\,...9хт) — базисный вектор, Х{ > 0, г = 1,...,т, хп = (0,... ,0) Ε Rn_m — небазисный вектор. Аналогично матрицу А можно представить в виде А = (Ab9An). Будет доказано в п. 3.2, что матрица Аь невырожденная, то есть ее определитель отличен от нуля. 1.2. Правило решения задач по симплекс-методу Для решения невырожденной задачи линейного программирования следует: 1. Привести задачу к задаче в канонической форме (Р*). 2. Отыскать крайнюю точку χ = (xi,...,xm,0,...,0), xt- >0, i = l,...,m, множества допустимых элементов D(Pk). Методы нахождения начальной крайней точки будут описаны ниже в § 4. 3. Построить симплексную таблицу для начальной крайней точки ж. Пояснения к построению таблицы: В таблице га + 4 строки и η + 4 столбца. В первом столбце, начиная с третьего по га 4- 2-е место, находятся базисные векторы α',.,.,α"1, соответствующие положительным координатам начальной крайней точки χ = (х\, ..., жт, 0,..., 0). *) Бесконечномерный аналог этой теоремы: выпуклый компакт в нормированном (и даже локально-выпуклом линейном топологическом) пространстве является выпуклой оболочкой своих крайних точек был доказан Крейном и Мильманом. Его называют теоремой Крейна—Мильмана.
§ 1. Симплекс-метод 121 Во втором столбце на аналогичных местах стоят значения Cj вектора с с теми же номерами, что и столбцы а3. Последний столбец заполняется при исследовании симплексной таблицы. В первой строке, начиная с четвертого столбца, стоят элементы Вторая строка, начиная с третьего столбца, — векторы 6,α!,...,αη. Под ними — разложения этих векторов по базису а!,...,ат. Ясно, т что Ь = Σα%χΐ & Ах = b. То есть разложением вектора Ь являем ι ется вектор хь ненулевых координат крайней точки ж. Предположим, что вектора a3, j = Ι,.,.,η, имеют следующее разложение по базису а1,...,ат: а3 = Y^cixij <& а3 = Аьх3 <& А = АъХ, где χ = {ху}ы\,„.9т — матрица разложений векторов α!,...,αη по базису i=i,...,n а19...,ат, состоящая из столбцов х1,..,9хп. Тогда X = ΑζιΑ9 то есть неизвестные векторы-столбцы х3 отыскиваются с помощью обратной матрицы: х3 = А^ха3. Очевидно, что при г = 1,... ,га разложения век- / ° \ торов а* тривиальны: а* = а*, то есть в этом случае х3 = 1 \0/ (е3 — вектор-столбец канонического базиса). В предпоследней строке ζ в столбце под вектором Ь (хь) запишем ζ0 = {съ,хь)- Тогда ζ0 — значение функционала в начальной крайней точке ж. Под векторами a3, j = 1,... ,η, запишем Zj = (сь,ж7), то есть 2 = (z\,...,Zn) = с&Х. Очевидно, что Zj = 9 при j = 1,... ,m. C| Cm базис И*») C| ^o Cm «I (сь,ж6> C| Cm Cm+1 ^lm+1 ■Et'om-f1 •^rnrn+l (m+l\ !2L 5iio "Wo ^mjo (Сб,^+,> <<*,**> im+l *Jo Cn X\n ьг0п \(cb,xn)
122 Глава 2. Линейное программирование В последней строке Δ, начиная с четвертого столбца, записывается разность между элементами предпоследней строки и элементами первой строки: Δ = ζ - с <£> Δ,- = Ζ{\- с,·, г = 1,..., п. 4. Исследовать симплексную таблицу. a) Если Δ ^ 0, то крайняя точка χ — решение задачи (ж Ε AigPk). b) Если для некоторого j Δ;· < 0 и ar7 ^ О, то значение задачи S^ = -boo. c) Пусть в строке Δ имеются отрицательные числа, а соответствующие столбцы х3 содержат положительные числа. Предположим, что min Δ;· = Δ,·0 < 0. Ясно, что га + 1 < jo < п. Столбец, соответствующий индексу jo называется разрешающим столбцом. Если min Aj достигается на нескольких значениях j, то в качестве j разрешающего столбца выбираем столбец с любым таким индексом. Обозначим U := \ —— хцп > 0 } > 0. Эти значения U ставим соответственно I J но в последнем столбце симплексной таблицы. Пусть £;0 = min U > 0. i Строка вектора α*° называется разрешающей. Если min£t· достигается г на нескольких значениях г, то в качестве разрешающей строки выбираем любую такую строку. Элемент Xi0j0 называется разрешающим элементом симплексной таблицы. Далее необходимо из числа базисных векторов исключить вектор а%0, вместо него взять вектор а·70. Значение функционала на новой крайней точке xf с новыми базисными векторами a1,... 9at0~[9aj09 a'0*1, ...,am, возрастет на величину -^0Δ^0. 5. Построить новую симплексную таблицу для нового базиса а1,..., а%0~ \ а\ аго+\..., ат, т. е. фактически разложить векторы b9al9...9an9 по новому базису. Укажем без обоснования (оно будет приведено в п. 3.3) способ построения новой симплексной таблицы по предыдущей. Элементы таблицы x'{j9 лежащие под векторами δ,α1,... ,αη, и не лежащие в разрешающей строке старой симплексной таблицы, вычисляются по правилу прямоугольника: ι _ xJqx%3q ι __ _ xiojxiJQ . , . *t — xi > **ij — *ij » * r *0> xi*to x4fa из числа Xij вычесть произведение Xij на ж^0, деленное на а^0. Ясно, что в разрешающем столбце новой симплексной таблицы xi(Jj0 = 1, остальные элементы равны нулю (х'^0 = 0, г Φ ц9 г = 1,...,т). Элементы разрешающей строки новой таблицы вычисляются путем деления
§ 1. Симплекс-метод 123 элементов разрешающей строки старой таблицы на величину xi0j0: Далее необходимо вновь исследовать симплексную таблицу, т. е. вернуться к п. 4 и так далее, пока не придем к решению задачи. Отметим, что симплекс-метод позволяет решать точно так же и вырожденные задачи линейного программирования. Число положительных координат крайней точки в таких задачах может быть меньше га, но число базисных векторов всегда равняется рангу матрицы А, величина £t0 может оказаться равной нулю. Теоретически в вырожденных задачах возможно зацикливание, когда через несколько этапов приходим к уже рассмотренной ранее крайней точке и это возвращение может происходить бесконечное число раз. При этом значение целевой функции не меняется и, значит, ί,·0 = 0. Перейти от вырожденной задачи к невырожденной можно путем сколь угодно малого изменения начальных данных задачи. 1.3. Примеры Производственная задача Одним из важнейших экономических прототипов математической модели данной задачи является производственная задача. Пусть на предприятии имеются производственные ресурсы (сырье) га типов в объемах &!,...,Ьто. Предприятие производит продукцию η видов. На производство единицы продукции j -го вида (j= 1,..., η) требуется использовать ресурс каждого г-го типа в объеме а\. Прибыль от реализации единицы продукции j -го вида равна Cj. Следовательно, при изготовлении Xj единиц продукции каждого вида прибыль предприятия составит величину η Σ CjXj. Надо найти план производства (х\,...,хп) такой, чтобы прибыль предприятия была максимальной. Равенства а\х\ + а}х2 Η Ь о^хп = fy будут означать, что весь ресурс каждого г-го типа израсходован полностью. Если ресурсы могут быть израсходованы неполностью, то план производства должен удовлетворять неравенствам а\х\ +а}х2-\ Ьа"жп < bi, г = 1,..., т. Можно так же рассматривать смешанную производственную задачу, в которой часть ресурсов должна быть израсходована полностью, а часть может быть израсходована частично. Задача на минимакс Приведем задачу, не являющуюся задачей линейного программирования, но путем замены переменных сводящуюся к задаче линейного программирования.
124 Глава 2. Линейное программирование Пусть /(ж) = тах{^(ж),...,^(ж)} — функция η переменных ж = (х\,-.-,хп) — является максимумом линейных функций. Здесь 18 = (с5, ж) - d8 — линейные функции, ж, с5 G Rn, d, € R, θ = l,...,k, -A — матрица т χ η, b G Rm. Рассмотрим следующую задачу /(ж) -> min; 4ж = δ, ж ^ 0. (Р) В отличие от задачи линейного программирования функция /(ж) не является линейной. Покажем, что задача (Р) эквивалентна задаче линейного программирования ж„+1-+гтп; *в(ж)<жп-и, s = 1,... ,fc, Αχ = δ, ж ^ 0. (Р') Действительно, если £ G AigP, то (&,£η+ι ·= /(&)) € AigP'. (Если допустить, что вектор (#,/(£)) g ArgP', то существует вектор ж € -D(P) такой, что /(ж) < /(£) =Ф> A {? ArgP — противоречие.) С другой стороны, если (£,£„+1) Ε ArgP', то £ € AjrgP. (Если допустить, что £ {? ArgP, то существует вектор ж G 2?(Р) такой, что /(ж) < /(А). Значит, вектор (ж,/(ж) € Х>(Р') и ж„+! < Ап+1 =4- (£,£η+ι) g ArgP' — противоречие.) Пример 1. Решить невырожденную задачу линейного программирования в канонической форме 2ж| +Ж2 -Ьж3 -Ж4 —> шах; ж; ^ 0, г = 1,2,3,4, Ж1 ~ Ж2 +Жз = 1, 2ж1+ж2 +ж4 = 3, с заданной начальной крайней точкой ж = (0,0,1,3). Решение. Базисные векторы а3 = (1,0) и а4 = (0,1). Составим первую симплексную таблицу: базис в3 а4 ζ Δ с 1 -1 хъ 1 3 -2 2 а1 1 2 -1 -3 1 а2 -1 1 -2 -3 1 а3 1 0 1 0 -1 а4 0 1 -1 0 t 3 Из таблицы видно, что в качестве разрешающего столбца можно взять столбцы а1 и а2. Возьмем для определенности столбец а2. Тогда t = 3, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а2
§ 1. Симплекс-метод 125 и для нового базиса строим вторую симплексную таблицу: базис а3 о2 ζ Δ с 1 1 «6 4 3 7 2 а1 3 2 5 3 1 а2 0 1 1 0 1 а3 1 0 1 0 -1 а4 1 1 2 3 ί Вектор Δ ^ 0, поэтому точка χ = (0,3,4,0) является решением задачи и 5тах = 7. Если бы в качестве разрешающего столбца в первой симплексной таблице взяли столбец а\ то пришли бы к той же точке (0,3,4,0), но за большее число шагов. Пример 2. Решить задачу линейного программирования х\ + Х2 4- Хъ 4- χ4 4- я5 + Ж6 —► max; ж« ^ 0, г = 1,..., 6, Ж) + ж2 4- 2ж3 4- 3^4 4- 6»б = 9, ^2 4- жз+ ж4 4- ж6 = 3, ж3 4- ха - ^5 + 2ж6 = 1, ж4 + Жб = 1) с заданной начальной крайней точкой χ = (1,2,0,0,1,1). Решение. Базисные векторы а1 = (1,0,0,0), а2 = (1,1,0,0), а5 = (0,0,-1,0) и о6 = (6,1,2,1). Матрица (11 0 6\ 0 1 0 11 0 0-12) 0 0 0 1/ не является единичной, поэтому найдем для нее обратную матрицу. Для этого записываем рядом две матрицы: нашу матрицу Аь и единичную. Далее сводим матрицу Аь к единичной путем элементарных преобразований строк. Полученная в результате преобразований матрица на месте единичной матрицы и является обратной к нашей матрице Аь» Напомним, что элементарными преобразованиями матрицы являются: a) перестановка двух строк; b) умножение строки на число отличное от нуля и c) прибавление к одной строке другой строки, умноженной на любое число.
126 Глава 2. Линейное программирование /11 0 6 1 0 0 0> 0 1 0 10 10 0 0 0-120010 \0 0 0 10 0 0 1, 10 0 0 1-1 0 -5> 0 10 10 1 О О 0 0 1-20 0-1 О ,0 0 0 10 0 0 1, /10 0 5 1-1 О 0N 0 10 10 1 0 0 0 0 1-20 0-10 \0 0 0 10 0 0 1, 10 0 0 1-1 О -5N 0 10 0 0 1 0-1 0 0 10 0 0-1 2 ,00010 0 01, На первом этапе мы умножили третью строку на -1, из первой строки вычли вторую. На втором этапе из первой строки вычли четвертую, умноженную на 5. На третьем этапе из второй строки вычли четвертую, а к третьей строке прибавили удвоенную четвертую. Таким образом, получили, что Далее находим разложения векторов аъ,аА по базису α1,α2,α5,α6: χ = Ab a = χ = Аь а = 1 -1 0 -5 0 10-1 0 0-12 ,0001 1 -1 0 -5 0 10-1 0 0-12 ,0001 Разложением вектора Ь является вектор (1,2,1,1) ненулевых координат крайней точки. Составим первую симплексную таблицу: базис а1 а2 а$ а6 ζ Δ с 1 1 1 1 хь 1 2 1 1 5 1 а1 1 0 0 0 1 0 1 а2 0 1 0 0 1 0 1 а3 1 1 -1 0 1 0 1 а4 -3 0 1 1 -1 -2 1 а5 0 0 1 0 1 0 1 а6 0 0 0 1 1 0 t 1 1
§ 1. Симплекс-метод 127 Разрешающий столбец а4. В качестве разрешающей строки можно взять строки а5 и а6. Возьмем для определенности строку а6. Тогда t — 1, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а4 и для нового базиса строим вторую симплексную таблицу: базис а< а2 а5 а4 ζ Δ с 1 1 1 1 ж» 4 2 0 1 7 1 а' 1 0 0 0 1 0 1 а2 0 1 0 0 1 0 о3 -1 0 1 0 1 а4 0 0 0 1 1 0 1 о5 0 0 1 0 1 0 1 а6 3 0 -1 1 3 2 t Вектор Δ ^ 0, поэтому точка £ = (4,2,0,1,0,0) является решением задачи и 5тах = 7. Полученная крайняя точка содержит только три положительные координаты. Значит, решенная нами задача является вырожденной. 1.4. Задачи Задачи линейного программирования в канонической форме с заданной первоначальной крайней точкой. 1.1. х\ +ж2 +жз-*пшх; xt^0, г = -х\ + x2 + яз = 2, Зх\ - х2 4- хг = 0, х0 = (0,1,1). 1,2,3, 1.2. 2а?| + х2 + Зжз 4- #4 -* max; Ж| +2ж2-Ь5ж3- ж4 = 4, #1 ~~ #2 ""* ХЪ + 2#4 = 1, 1.3. 6ж| 4- а?2 + 4ж3 - 5ж4 -+ max; Ъх\ Л-хг- хг 4- ^4 = 4, 5ж| -Ьа?2 + жз ~ #4 = 4, 1.4. a?i -Ь Ж2 + Яз-Ь ж4-»тах; а?1 -Ь3ж2 + жз + 2ж4 = 5, 2х\ — а?з + ж4 = 1, ж,- ^0, г = 1,2,3,4, х0 = (0,0,1,1). Xi^O, г = 1,2,3,4, х0 = (1,0,0,1). ж,^0, г =1,2,3,4, ж0 = (0,1,0,1). xt^0, г=1,. 1.5. X] + х2+ Хг+ ж44· xs—>тах; 2a?i + Зж2 + 5ж3 4· 7ж4 4- 9ж5 = 19, ж, - ж2 4· ж4 + 2ж5 = 2, ж0 = (0,0,1,2,0). ,5,
128 Глава 2. Линейное программирование 1.6. х\ -Ьж2-Ьж3 + ^4-*тах; ж,-^0, г =1,2,3,4, а?1 + ж2 + ж3 + 3ж4 = 3, Ж | + Ж2 — Xl + Ж4 = 1, Ж|-ж2-Ьж3-Ь ж4 = 1, ж0 = (0,0,0,1). 1.7. Ж| -Ь2ж2 + 2ж3 + ж4 + 6х$ —► max; ж*^0, i=l,...,5, Ж1+Зж2 + Зж3 + ж4 + 9ж5 = 18, Ж| + 5ж2 + 2ж4 + 8ж5 = 13, ж3 + ж5 = 3, ж0 = (0,1,2,0,1). 1.8. Ж|-ж2-Ьж3-Ь ж4 - ж5 - Жб~>тах; ж,^0, г=1,...,6, 2a?i + ж2 + а?з + Зж4 + Зж5 + 2хе = 7, Ж| - Жз + Ж5 ~ #6 = _2, ж2 + ж3 + я4 + ж5 + 2ж6 = 5, ж0 = (0,0,2,0,1,1). 1.9. а?| 4- ж2 + ж3Ч-Зж4- ж5-2жб + жу-^тах; Ж1+2ж2 + 3ж6 + Х7 = 8, Ж| -f Зж2 + 2ж3 + 2а?б + За?7 = 15, ж2 + Зж3 + 2ж4 + 2жз - Зж6 + Зжу = 11, ж3 + Зж4 + ж5 - 2ж6 + ж7 = 5, ж,-^0, г= 1,...,7, ж0 = (1,0,0,1,0,1,4). §2. Двойственность в линейном программировании 2.1. Элементы выпуклого анализа. Преобразование Лежандра Пусть / : Rn —> R —· некоторая функция. Преобразованием Лежандра функции / (или сопряженной функцией к /) называется функция f(y) := sup {(x,y)-f(x)}. X Из определения /* видно, что /* — верхняя грань семейства аффинных функций (ж, у) - /(ж). Ее надграфик является выпуклым множеством (как пересечение выпуклых множеств — полупространств). Следовательно, /* — выпуклая функция. Из определения сопряженной функции следует неравенство Юнга: (*,уК/(*) + /*(») Уж,уеКп. Функция /**(ж) := sup {(ж,у) - f*(y)}, являющаяся сопряженной У к /*, называется второй сопряженной к /. В теории двойственности для задач линейного программирования важной является следующая теорема выпуклого анализа.
§ 2. Двойственность в линейном программировании 129 Теорема Фенхеля—Моро. [АГТ, с. 37] Собственная функция совпадает со своей второй сопряженной (f(x) = /**(ж)) тогда и только тогда, когда она выпукла и замкнута (т. е. когда ее надграфик epi / — выпуклое и замкнутое множество). 2.2. Примеры Пример 1. Найти первую и вторую сопряженные (в смысле Лежандра) функции к функции /(ж) = ах2 + Ъх + с в зависимости от значений параметров а, Ь, с. Решение. По определению сопряженной функции f(y) = sup {(ж, у) - f(x)} = sup {xy - ах2 -bx-с} = X X = sup {-ах2 + (у - Ь)х - с}. χ / у-Ъ\2 Если а > 0, то парабола -αχ + (у - Ь)х - с = -α Ι ж — I + (у-ь)2 (у-ь)2 у-ь — с достигает своего максимума — с при χ = ——. 4α 4α 2α Поэтому Найдем вторую сопряженную к /. По определению /**(*) := sup {(х,у) - Г (у)} = supja^ - ^^- + с} = Г (2/-Ь-2аж)2 2 ь \ = sup4 - — — + ах + Ьх + с >. у I 4а J (г/ - Ь - 2аж)2 ~ Парабола и(у) := Ь ax +Ъх + с достигает своего макси- 4а мума при у = Ь + 2аж. Следовательно, ί (ν - Ь - 2ах)2 -у Ί ? / (ж) - sup< - — — + ах +Ъх + с > = axL + Ъх + с. у I 4a J Если а = 0, то функция (у - Ь)ж - с —> +оо, если у Φ Ь, при ж —► +оо или ж —► -оо. Поэтому r(j/) = sup{(j/-6)x-c} = |+^ У = Ь, УФЬ.
130 Глава 2. Линейное программирование Найдем вторую сопряженную к /. Нетрудно видеть, что Г(х) := sup {(χ, у) - Г (у)} = sup {ху - { "^ J = £ } = 6х + с. Если α < 0, то парабола -аж2 + (у - Ь)х - с с осями, направленными вверх, стремится к +оо при ж —> -boo. Значит, f*(y) = +00. Найдем вторую сопряженную к /. Нетрудно видеть, что /**(ж) := sup {(ж,2/) - f*(y)} = sup{xy - (+00)} = -00. У У Пример 2. Найти первую и вторую сопряженные (в смысле Лежандра) функции к функции /(ж) = ех. Решение. По определению сопряженной функции f*(y) = sup {(ж, у) - /(ж)} = sup {xy -ex}= sup #(ж), X XX где д(х) := ху - ех. Найдем максимум функции д(х). Имеем д'(х) = у-ех = 0&х = \пу при у > 0. Поскольку д"(х) = -ех < 0, то по достаточному условию экстремума гладкой функции при у > 0 в этой точке будет достигаться максимум этой функции. Подставляя ж = In у в #(ж), находим, что sup д(х) = у In у - у. χ Если у = 0, то очевидно, что sup д(х) = supi-e*} = 0. Если у < 0, X X то д(х) —► -Ьоо при ж —> -оо. Таким образом, {2/1П2/-2/, у>0, О, у = О, +оо, у < 0. Найдем вторую сопряженную к /. По определению irylny-y, у > 0, ϊ жу - < 0, у = оЛ = I +оо, у < О J = max {sup{xy - ylny + y},0}. Нетрудно видеть, что функция u(y) := жу-уЫу + у достигает своего максимума при у > О в точке обращения в нуль своей производной. Действительно, и (у) = χ - In у - 1 + 1 = ж - In у = 0 <£> у = е*> tt"(y) = — < О ПРИ 2/ > 0. 2/
§ 2. Двойственность в линейном программировании 131 Подставляя это значение у в выражение для /**(ж), получаем f**(x) = max{sup{s2/-yln2/ + 2/},0} = max{e*,0} = ех. у>0 Равенство /**(ж) = /(ж) = ех следует также непосредственно из теоремы Фенхеля—Моро, поскольку функция ех является выпуклой и замкнутой. 2.3. Вывод двойственных задач 2.3.1. Вывод задачи двойственной к задаче в общей форме Рассмотрим задачу линейного программирования в общей форме (с, х) -» min; Ах < Ь. (Р) Обозначим через 5(6) := inf {(с,ж) | Ах < b\ — S-функцию зада- X чи (Р), рассматривая аргумент Ь как параметр в задаче (Р). Определение. Двойственной задачей к задаче линейного программирования в общей форме называется задача нахождения второй сопряженной (в смысле Лежандра) функции S**(b) для S -функции задачи (Р). Для нахождения второй сопряженной необходимо найти вначале первую сопряженную функцию к функции S(b): S*(y) = sup{(y,b) - S(b)} =sup{(y,b) -inf {(c,x) \ Ax<b}} = b b x = sup{(y,6)-(c,aj> | Ax^b} = < χ Μ ^ +oo, иначе sup{(A*2/-c,a?>}, y<0, _Jo, A*2/ = c, jK 0, ■! +oo, иначе 1·+°°> иначе· -Г" I +00, Найдем сопряженную в смысле Лежандра функцию к функции S*(y), т. е. вторую сопряженную к функции S(b): 5**(Ь) = sup{(y,6) - S*(y)} = sup{(y,6> | А*у = с, у ^ О}. Таким образом, двойственной задачей к задаче линейного программирования в общей форме является следующая задача: (Ь, у) -> max; А*у = с, у < 0. (Р**) Для задачи линейного программирования в нормальной форме: . (с, х) —► max; .Аж ^ Ь, ж ^ О, (Р„)
132 Глава 2. Линейное программирование выпишем без доказательства двойственную задачу (попробуйте сделать это самостоятельно): (ft,y)-^min; А*у>с, у > 0. (Рп**) Как мы видим, двойственная задача в этом случае обладает определенной симметрией по отношению к исходной. Элементы бис меняются местами, максимум меняется на минимум, матрица А меняется на транспонированную, и матричное неравенство меняет знак. 2.3.2. Вывод задачи двойственной к двойственной задаче для задачи линейного программирования в общей форме Покажем, что понятие «двойственности» введено правильно, т.е. двойственная задача к двойственной является исходной задачей. (ft, у) -> max; А*у = с, у < 0. (Р**) Для того, чтобы вывести двойственную задачу к задаче (Р**) надо вначале свести ее к задаче линейного программирования в общей форме, для которой уже известна двойственная задача. Вначале сведем задачу на минимум, заменяя функционал (6,2/) на функционал (-ft,у). Затем заменим равенство А*у = с на два неравенства с < А*у < с <& А*у < с, -А*у < -с. Получим эквивалентную задачу линейного программирования в общей форме: (-6,2/) -+ min; ί -A* J у < ί -с 1 . Двойственная к ней будет следующая задача: I ((с, -с,0), (ж1,ж2,ж3)) -+ max; Перепишем эту задачу в виде (с, ж1 - ж2) -+ max; A(xl - х2) + ж3 = -6, х1 < 0, ж2 < 0, ж3 ^ 0. Равенство А(х1 -ж2)-Ьж3 = —ft эквивалентно неравенству А(х1 -ж2) ^ -ft, поскольку ж3 < 0. Обозначим ж = ж2 - ж1, тогда ограничений на знак ж уже не будет. Задача перепишется в виде -(с, ж) —► max; —Ax ^ -ft.
§ 2. Двойственность в линейном программировании 133 Заменяя max на min и умножая матричное неравенство на -1, придем к задаче (с, х) -» min; Ах ^ Ь, (Р) являющейся двойственной к задаче (Р**), которая совпадает с исходной задачей (Р). Таким образом, мы убедились, что термин «двойственная задача» используется правильно. 2.3.3. Вывод задачи двойственной к задаче в канонической форме Задачу линейного программирования в канонической форме (с, х) —> max; Ах — Ь, χ ^ О, (Р*) сведем к задаче на минимум: (-с,ж)—►min; .Ах = Ь, ж ^ О, (Р') при этом 5д = -5р'. Обозначим через 5(6) := inf{(-c,x) | Ах = Ь, ж ^ 0} — S-функцию X задачи (Р'), рассматривая аргумент Ь как параметр в задаче (Р'). Найдем первую сопряженную функцию к функции S(b): S*(b*) = sup{(b\b) - S(b)} =sup{(b* ,b) -inf{(-c,x) \Ах = Ь,х^0}} = ь ь х = sup{(b\b) + {c,x)\Ax = b, х^О} = sup{(6*9Ax) + (c9x)\z^0} = Ь.х χ =*ир{(А*Ь* + с,х)\х^0} = \°> А*Ь* + х 1Х '' J l^+oo, иначе. с^О, Найдем сопряженную в смысле Лежандра функцию к функции S*(b*), т. е. вторую сопряженную к функции S(b): S**(b) = sup{(6*,6> - S*(b*)\ = sup{{b*,b) | A'b* +c < θ} =ί> ft* 6* a> 5p« = -S"(b) = inf {(-b*,b) | A*b* + с < θ}. Полагая у = -Ь*, получаем £р» — inf {(у, Ь) | -А*у + с ^ О}, и, следова- тельно, имеем следующую двойственную задачу (2/,b>-+min; А*2/ > с. (Ρζ*) 2.3.4. Упражнения 1. Вывести двойственную для задачи линейного программирования в нормальной форме с помощью преобразования Лежандра. 2. Вывести двойственную для задачи линейного программирования в нормальной форме путем сведения ее к общей задаче линейного программирования.
134 Глава 2. Линейное программирование 3. Вывести двойственную для задачи линейного программирования в канонической форме путем сведения ее к общей задаче линейного программирования. 4. Вывести двойственную для задачи линейного программирования (с, ж) —► inf; Ах = Ь, χ ^ О, путем сведения ее к канонической задаче, для которой двойственная известна. 5. Вывести двойственную для задачи линейного программирования в нормальной форме путем сведения ее к канонической задаче. 6. Вывеси двойственную для задачи линейного программирования (с, х) —> inf; Ах ^ Ь, ж^Ос помощью преобразования Лежандра. 7. Вывести двойственную для задачи линейного программирования (с, х) —► sup; Ах ^ Ь, ж^Ос помощью преобразования Лежандра. § 3. Обоснование симплекс-метода 3.1. Теоремы существования, двойственности, критерий решения Приведем три теоремы, играющие важную роль при обосновании симплекс-метода. Рассмотрим задачу линейного программирования в общей форме (с, х) -+ min; Ах < Ь, (Р) где с,х € Rn, δ Ε Rm, матрица размеров m χ η A = (aji)i=\i...im = αϊ ... aj «ι со столбцами а3 = | ... | , j = 1,. Обозначим Sp — численное значение задачи (Ρ), Απ» Ρ — множество решений задачи (Ρ), т.е. множество допустимых точек χ Ε Rn, для которых (с, ж) — 5р. Теорема существования. Если численное значение задачи (Р) конечно (\Sp\ < -Ьоо), то ее решение существует (ArgP Φ 0). Доказательство. Отметим сразу, что поскольку численное значение задачи конечно, то множество допустимых элементов непусто {D(P) Φ 0). Рассмотрим множество К := {(a,^)GRxRm|3a?:(c,x> ^ α, 4ж<г}. Ясно, что ϋΓ — выпуклый конус.
§ 3. Обоснование симплекс-метода 135 Напомним два определения из выпуклого анализа. Пусть С := {ci,... 9Ст} С Rn — некоторое конечное подмноже- m ство. Элемент к = Y^Uci, U; ^ 0, г = 1,...,т, называется конической 1=1 комбинацией С. Выпуклая коническая оболочка конечного числа точек называется конечнопорожденным конусом. Лемма 1. Конус К — конечнопорожденный. Доказательство леммы 1. Покажем, что К — cone {±ξ\,..., ±ξη, ηο, f?i,...,f?mh ГДе £j = (cj,a\9...,aJm), j = l,...,n; η0 = (1,0,...,0), ηχ = (0,1,..., 0),..., ?/m = (0,0,..., 1) — канонический базис в пространстве Rm+I. Вложение сопе{±£|,... ,±£n,?7o>··· >*&»»} С К следует из того, что все образующие конуса лежат в ИГ. Действительно, полагая χ = ±ej (еь...,еп — канонический базис в Rn) в определении конуса К, мы получим, что ±£j € ЛГ, i = 1,... ,η; для векторов ^ надо взять ж = 0. Обратно, если вектор (α,ζ) = (α,2ι,... ,zm) G ϋΓ, то существует ж = (ж|,... ,жп) G Rn, для которого (с,ж) ^ а, Ах ^ ζ. Значит, для некоторого набора чисел βο ^ 0, ..., /?т ^ 0 выполняются соотношения <с,ж>+А) = а, 4ж + /? = ;г (/? = (#,...,Д»)) *=> η η *=* ΣW + А> = α, Σαΐ^ + Α=^» i = l,...,m. >=ι i=i Но это как раз и означает, что η m j=l ί=0 Поскольку η η το (α,ζ) € cone{±£ι,...,±ξ„,%,...,ifo,}. ■ Лемма 2 (о замкнутости конечнопорожденного конуса). Конечно/to- рожденный конус замкнут. Доказательство. Доказательство проведем индукцией по числу га порождающих точек. Если га = 1, то конус К = {х G Rn | χ = tk\, £ ^ 0} — полупрямая, очевидно, замкнутая. Пусть теорема верна для конусов, порожденных га -1 точкой, га ^ 2, и пусть заданы га точек к\,..., кт. Если конус ϋΓ = cone {k\,..., fcm} содержит векторы -fe|,..., -кт, то ЛГ — конечномерное подпространство, т. е. замкнутое множество. В противном
136 Глава 2. Линейное программирование случае существует вектор (пусть это будет -fem), который не принадлежит К (~кт g К). Обозначим К1 := cone {к\,..., кт-\}. По предположению индукции конус К1 замкнут и К = {к \ к = к1 + tkm, к1 € К', t ^ 0}. Пусть {кп := к,п -f tnkm}n€n _— последовательность векторов из JST, сходящаяся к к Ε Rn (fen —► fc). Из последовательности {£п} выберем сходящуюся подпоследовательность {tni} —► £ ^ 0. Имеются две возможности: либо ί конечное число, либо t = +оо. В первом случае получим, что числа к'щ = fcn' -tnikm —>к-ikm € ϋΓ' (в силу замкнутости конуса ИГ'), т.е. к Ε ϋΓ и, следовательно, ϋΓ замкнуто. Во втором случае, к'щ кщ ; деля кп* на Ьщ, имеем: — + кт = — —> 0 при i -t oo ({fen*} — сходя- щаяся последовательность, {tni} —> -boo). Откуда — сходится к -кт, с что невозможно так как -кт£К\ т Поскольку Sp = inf{a | Зх: (с,ж) = а, Аж<Ь}=:а, то существуют последовательности {ж*} и {α*}, α*—>ά при fe—>-|-оо, для которых (c,a?ft) = a!jfc, Axu^b (это означает, что последовательность точек (ctk,b)eK — замкнутому по лемме 2 множеству. Поэтому предельная точка (a,b) Ε ϋΓ. Тогда по определению множества К существует точка ± такая, что (с,±) ^ а = 5р, j4£ < Ь. Это означает, что £ € AjrgP. Теорема существования доказана. ■ Вернемся к задаче линейного программирования в общей форме. В п. 2.3 мы обозначили через S(b) := inf {(с, ж) | Ах < Ь} — S-функцию X задачи (Р), рассматривая аргумент Ь как параметр в задаче (Р). Лемма 3. S — выпуклая замкнутая функция. Доказательство леммы легко выводится из соотношения epiS = К, где К — выпуклый замкнутый конус, рассмотренный при доказательстве теоремы существования. ■ Лемма 4. Пусть f : Rn —► R — выпуклая замкнутая функция и существует точка Zq такая, что /(*о) = -oo. Тогда f(z) = -oo Vz Ε dom/. Напомним, что двойственной задачей к задаче линейного программирования в общей форме является следующая задача: (Ь, у) — max; А*у = с, у ζ 0. (Ρ**) Теорема двойственности. Для пары двойственных задач линейного программирования (Р) и (Р**) имеет место следующая альтернатива: или значение одной из задач конечно (и тогда конечно значение другой и оба значения совпадают), или множество допустимых элементов в одной из задач пусто (и тогда другая задача либо несовместна, либо имеет бесконечное значение).
§3. Обоснование симплекс-метода 137 Доказательство. 1) Пусть \S(b)\ < оо, тогда поскольку по лемме 3 5 — выпуклая замкнутая функция, то по лемме 4 S(z) > -оо У ζ G Rm. По теореме Фенхеля—Моро п. 2.1 S**(b) = S(b). Это означает, что конечно значение двойственной задачи и оба значения совпадают. 2) Пусть Dp = 0 (<& S(b) = -boo), тогда либо а) существует точка z0 такая, что 5(20) = -оо, тогда S* = -foo, следовательно, 5** = -оо, т.е. DP** = 0 (это означает, что множество допустимых элементов в двойственной задаче пусто), либо b) S(z) > -оо Vz G Rro, тогда по теореме фенхеля—Моро S**(b) = S(b) = -boo (это означает, что двойственная задача имеет бесконечное значение). ■ Критерий решения. Пусть ж,# — допустимые элементы β задачах (Р) и (Р**) соответственно (ж G D(P), # G D(P**)). Тогда точки χ,у являются решениями в задачах (Р) и (Р**) соответственно (ж G ArgP, у е ArgP**) тогда и только тогда, когда (с,х> = (0,Ь>. Доказательство. Необходимость. Пусть # G ArgP**, тогда у G D(P**) и (#, Ь) = 5р-. Аналогично, χ G ArgP, тогда ж G 1>(Р) и (с, ж) = SP. Значение задачи (Р) при этом конечно (\Sp\ < -boo). Значит по теореме двойственности значение двойственной задачи также конечно и оба значения совпадают (Sp = £р**). Следовательно, (с, ж) = (#,6). Достаточность. Пусть ж G #(^)> # G D(P**) и (с, ж) = (#,6). Возьмем произвольные допустимые элементы χ G #(Р), у G D(P**). Это означает, что Ах ^ Ь, ^4*у = с, у < 0. В силу этих условий на ж и у имеем (с, ж) = (А*у,х) = <у,-Аж> > (у,Ь). Из этого соотношения вытекает, что (с,ж) > (#,Ь) = (с,ж) Уж G -D(P). Это означает, что х€ ArgP. Аналогично доказывается, что #G ArgP**. ■ 3.2. Свойства множества допустимых точек Рассмотрим задачу линейного программирования в канонической форме (с, ж) —► max; Ах = Ь, ж ^ 0. (Р*;) Предложение 1. Пусть ж = (жь... ,ж*,0,... ,0) G Rn, ж, > 0, г = 1»..., fe, — допустимая точка β задаче (Р*) (ж G #(Pft)). Тогда ж является крайней точкой множества допустимых элементов D(Pk) тогда и только тогда, когда столбцы а1,..., а* матрицы А линейно независимы. Доказательство. Необходимость. Пусть ж — крайняя точка. Докажем, что тогда столбцы α1,...,α* линейно независимы. Доказательство будем вести от противного. Допустим противное, что столбцы
138 Глава 2. Линейное программирование α1,...,α* линейно зависимы. Тогда существует ненулевой набор мно- жителей Αι,..., А* такой, что Σ-W = 0. Значит АХ = 0 для вектора А = (Λι,..., λ&,0,...,0) G Rn. Поэтому точка x(t) := ж + tX G D^ при малых t как больше, так и меньше нуля. Это означает, что точка ж не является крайней. Получили противоречие. Значит, наше допущение, что столбцы а1,... ,а* линейно зависимы — неверно. То есть столбцы а1,..., ак линейно независимы. Достаточность. Пусть столбцы, соответствующие положительным координатам точки χ линейно независимы. Для определенности будем считать, что это столбцы α1,...,α*. Докажем, что тогда χ — крайняя точка. Доказательство вновь будем вести от противного. Допустим противное, что χ не является крайней точкой. Тогда существуют точки у G D(Pk) иге D(Pk), У Φ ζ, отличные от ж и число t G (0,1) такие, что х = ty + (1 - t)z. Из этого равенства и условий χ = (жь... ,ж*,0,..., 0), Xi > 0, г = l,...,fc, у,ζ ^ 0 вытекает, что у = (уь... ,у*,0,... ,0), к ζ = (2Ь... ,ζ*,0,... ,0). А из условий ^4у = Ь ф> Σ2/«α* = &> -42 = 6** fc * Σ Ζ{α% = Ь следует, что X)(2/t - 2«)α* = 0. Это означает, что столбцы α1,...,α* линейно зависимы. Получили противоречие. Значит, наше допущение, что χ не является крайней точкой — неверно. То есть χ является крайней точкой. Поскольку количество линейно независимых столбцов не может превышать количества строк матрицы А, то крайняя точка содержит не более т положительных элементов. ι Предложение 2. Пусть (Р*) — невырожденная задана линейного программирования в канонической форме, χ = (х\,..., ж*, 0,...,0) G Rn, Xi > 0, г = 1,..., к, — допустимая точка в задаче (Pk) (x G Ζ)(Ρ*)). Тогда а) к ^ т\ Ь) точка χ является крайней точкой множества допустимых элементов D(Pk) тогда и только тогда, когда к = т. Доказательство, а) Доказательство будем вести от противного. Допустим противное, что существует допустимая точка, у которой менее m положительных координат. Для определенности пусть это первые & координат (к < га). Рассмотрим множество D = {у G R* | Ау = Ь, у ^ 0}, где А := {о1,...,о*} — матрица, состоящая И£ первых к столбцов исходной матрицы А. Точка χ = (жι,...,ж*) G D, то есть множество D непусто. Пусть у -г крайняя точка множества D (докажите самостоятельно ее существование). У нее число положительных координат I (I ^к <тп) будет меньше га и соответствующие / столбцов матрицы А по предложению 1 линейно независимы. Тогда вновь по предложению 1
§3. Обоснование симплекс-метода 139 точка ± = (#, 0,..., 0) Ε Rn будет крайней точкой множества допустимых элементов в задаче (Р), причем число положительных координат / у нее меньше га. Это противоречит невырожденности задачи. Значит, наше допущение, что существует допустимая точка, у которой имеется менее га положительных координат, неверно. То есть к ^ га. Ъ) Необходимость непосредственно следует из определения невырожденной задачи (в невырожденной задаче любая крайняя точка имеет ровно га положительных координат). Достаточность. Пусть χ = (х\,..., жт, 0,..., 0) £ D^, Х{> 0, г — 1,...,т — допустимая точка в задаче (Р*). Докажем, что тогда χ — крайняя точка множества допустимых элементов. Доказательство будем вести от противного. Предположим противное, что точка χ не является крайней. Тогда по предложению 1 столбцы а1,..., ат матрицы А линейно зависимы. Это означает, что существует ненулевой набор множителей m Αι, ,Ата такой, что Σ)Λ;αι = 0. Значит, АХ = 0 для вектора А = (Ль...,Лт,0,...,0) e Rn. Поэтому A(x + t\) = Ax + tAX = Ax = b Vi, а вектор х -f1A ^ 0 при малых t как больше, так и меньше нуля, т. е. χ -Ь tX G Oft. Поскольку Х{ -Ь t\ = Х{ > 0 при t = 0, то увеличивая |t|, придем к случаю, когда еще одна координата вектора χ + tX обратится а ноль, а все остальные по-прежнему больше или равняются нулю. Таким образом, при некотором t допустимая точка χ + tX будет иметь менее га положительных координат. Это противоречит пункту а) данного предложения. Получили противоречие. Значит, наше предположение, что точка χ не является крайней — неверно. То есть χ является крайней точкой. ■ 3.3. Доказательство симплекс-метода Рассмотрим невырожденную задачу линейного программирования в канонической форме (с, х) -» max; Ах = Ь, χ ^ 0. (Р*) Напомним, что двойственной к ней является следующая задача: <6,y)-+min; А*у^с. (Р?) При изложении правила решения задачи в канонической форме мы пользовались фактами, которые были даны там без обоснования. Сейчас мы их докажем, оформив утверждение в виде теоремы. Теорема. Пусть χ = (жь... ,жт,0,... ,0) Ε Rn, Xi > 0, г = 1,... ,га — крайняя точка множества допустимых элементов D(Pk). Тогда: a) если Δ > 0, то вектор χ — решение задачи (Р*)> а вектор у := сьА^] — решение двойственной задачи (Ρ£*)\ b) если для некоторого j Aj < 0 и χ*< 0, то значение задачи SPk — +оо;
140 Глава 2. Линейное программирование с) если не выполнены условия пп> а) и Ь), то точка xf является новой крайней точкой множества допустимых элементов D(Pk)9 значение функционала при этом возрастет на величину —ti0AjQ9 а разложение векторов х'9 а1,..., ап производится согласно симплекс-методу. Доказательство. Напомним, что по предложению 1 dzt Аъ Φ 0, т.е. матрица Аь обратима. a) Пусть Δ > 0. Преобразуем это условие с учетом определения векторов ζ := сьХ, у := сьА^1 &> уАь = с& и матрицы X (АьХ = А): A^0&z-c^Q&z^c& сьХ ^с& уАьХ ^с&уА^с& А*у ^ с. Значит, у является допустимым вектором в задаче {Pi*) двойственной к задаче (Р*). Кроме того в силу условия АьХь = Ь (с9х) = (сь,хь) = (уАь,хь) = (А*ьу,хь) = (у,Аьхь) = (у9Ъ). По критерию решения п. 3.1 χ — решение в задаче (Р*), а у — решение в двойственной задаче (Р**). b) Положим x(t) := χ - t(x*,Q) -f tej (ei,...,en — канонический базис в Rn). Тогда x(t) = (хь — tx39ϋ) Λ- tej ^ 0 V£ ^ 0 в силу условия χι < 0 и Ax(t) = Αχ - ЬАьх* + ί-Aey = Ь - ία·7 -f ta? = Ь. Значит, ж(£) — допустимый элемент для любого t ^ 0, при этом {c9x(t)) = {c9x-t(x? 9ϋ) Λ-tej) = (с9х) - t(cb9x?) + t{c9ej) = (с,ж) -tzj + tcj = = (с,ж) - £(Zj - Cj) = (с,ж) - tAj —► -boo при £ —► -boo. c) Предположим, что не выполнены условия пп. а) и Ь) теоремы. Тогда для некоторого jo такого, что га -Ь 1 < jQ < η, выполнено условие Ду0 < 0 и величина «•о - ™п {— I *iJo > θ) = — > 0· Возьмем xf := χ - U0(x?09Q) + UQej0. Докажем, что вектор χ1 является новой крайней точкой в задаче (Р*). Покажем вначале, что он является допустимым вектором. Как и в пункте Ь) выводим, что Ах1 = Ь. Имеем х[ = Xi - tioxijo = χι —xijo ^ 0 при г = 1,..., га; XioJo Χ' x\ = 0 при г = га + 1,..., п9 г Φ jQi x'io = tio = —— > 0. Таким образом, xf ^ 0, и значит, вектор ж' является допустимым в невырожденной задаче (Р*). По построению у вектора х' по сравнению с вектором χ добавилась одна положительная jo-я координата, а какие-
§ 3. Обоснование симплекс-метода 141 то обратились в ноль. Поскольку по предложению 2а) у допустимой точки число положительных координат не менее т, то в ноль может обратиться только одна координата (это ж[0-я координата обратилась в ноль). Значит, у вектора х1 имеется ровно т положительных координат на местах 1,..., to -1, to+1,..., m, jo. Следовательно, по предложению 2Ь) х' — крайняя точка. (Отметим, что в невырожденной задаче число положительных компонент у крайней точки может уменьшаться.) Выписанные формулы означают, что в новой симплексной таблице столбец х' вычисляется согласно указанному методу построения симплексной таблицы. Покажем, что и остальные столбцы х'* в новой симплексной таблице строятся по этому же способу. Для этого вычислим координаты х\$ разложения столбцов а3 у j = 1,... ,η, матрицы А по базису а1,... ,α^,α^,α*4"1,..., ат. В старом базисе мы имели следующие разложения: m m aJ = £Vaty = γ^αχχ^ + atoxioji j = l,...,n. (1) m В частности при j = j0 ajo = Σ a%xik + а%*хчк- *Фк Поскольку Xi0j0 Φ О, то выразим α*° из последнего уравнения ^-* Я·· · 3!· · i=l и подставим в соотношение (1). Получим разложения по базису а1,..., а<0-|>а*,а'0+|>...>ат: "* ■ s ТЛ JO \ t=l >· «=1 Wo ^«ojo/ / \ = Σα< l*ч - ^^) + eio—· j = |=l \ XioJo / ж*'о7о l,...,n. Таким образом, XJQ jXJJQ xij=xij —-, г^г0, г=1,...,т, =>xijo=0, t#t0, *oJ ~~ ~ > у — ι,..., τι. XtQJQ
142 Глава 2. Линейное программирование § 4. Методы нахождения начальной крайней точки 4.1. Переход к решению двойственной задачи Рассмотрим метод решения задач линейного программирования путем перехода к двойственной задаче и решения полученной двойственной задачи. При этом строка Δ последней симплекс-таблицы даст нам решение исходной задачи. Пусть нам дана следующая задача линейного программирования: <6,y)-min; А* у > с, у > 0. (Р) Двойственной для нее является задача в нормальной форме (с, ж) -► max; Ах < Ь, χ > 0. (Ρ**) Сведем эту задачу к эквивалентной задаче в канонической форме путем добавления неотрицательных (искусственных) переменных χ = (Хп+\ у · · · > Хп+т) и единичной матрицы I: (с,ж) —► max; Ах + 1х = Ь, ж > 0, ж ^ 0 <=> (с,ж) —► max; Ах = Ь, ж ^ 0 (с=(с,0), 2 = (*,*), 1=АГ). (?) Задачу (Р) с вектором 6^0 можно решить симплекс-методом, взяв в качестве исходной крайней точк# точку (0,...,0,6|,...,6m) G Rn+m. Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной матрицы I, соответствующие положительным координатам этой точки, линейно независимы. _ __ Пусть вектор χ — (χ,χ) является решением задачи (Р) (ж € ArgP). Тогда соответственно χ является решением задачи (Р**) (ж € ArgP**). А по теореме п. 3.3 вектор у := сьА^] является решением задачи, двойственной к задаче в канонической форме Р: (b,y>-+min; Ту^с (*("/)»> (о) ^ А*у > с> У>0)· То есть у является решением исходной задачи (Р). При этом Sj — SP, а из разложения АьХ = А & X = А^]А & X = А^{А, X = А^]1 = А^{ получим, что вектор у = сьАь1 = сьХ = z = z-c = A. Таким образом, часть строки Δ последней симплекс-таблицы, лежащей под разложениями векторов искусственных переменных, дает нам решение исходной задачи (Р).
§4. Методы нахождения начальной крайней точки 143 Пример. Решить задачу линейного программирования путем перехода к двойственной задаче. Пусть необходимо решить следующую задачу: 42/1 + 2у2 -> min; у{ ^ 0, «=1,2, 92/1 + 2/2 > 15, 32/1 + 42/2 ^ 27, у, + 5у2 ^20. ( ) Решение. Двойственной для данной задачи линейного программирования будет следующая задача в нормальной форме (выведите это самостоятельно): 15я?| + 27ж2 + 20ж3-* max; Xi>0, i= 1,2,3, 9х\ -Ь3ж2 + жз <4, Ж| + 4ж2 + 5ж3 < 2. * ' Сведем эту задачу к задаче в канонической форме путем добавления неотрицательных (искусственных) переменных а?4, и xs и заменяя неравенства равенствами: 15a?i + 27ж2 + 20ж3 -+ max; ж,·^ 0, г = 1,..., 5, 9хх+Ъхг + ж3+х4 =4, (Р) Ж1+4ж2-ь5жз -Ьа?5 = 2. В выписанной задаче линейного программирования в канонической форме в качестве первоначальной крайней точки возьмем точку χ = (0,0,0,4,2). Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной матрицы, соответствующие положительным координатам этой точки, линейно независимы. Тогда базисными векторами будут векторы а4 = (1,0), а5 = (0,1). Составим первую симплексную таблицу для задачи в канонической форме (Р): базис а4 а5 ζ Δ с 0 0 «6 4 2 0 15 о1 9 1 0 -15 27 а2 3 4 0 -27 20 а3 1 5 0 -20 0 а4 1 0 0 0 0 о5 0 1 0 0 t 4 3 I 2 В первой симплексной таблице разрешающий столбец а , разрешающая строка а5, разрешающий элемент симплексной таблицы 4. Заменяем в базисе вектор искусственных переменных а5 на вектор а2 и для нового
144 Глава 2. Линейное программирование базиса строим вторую симплексную таблицу: базис а4 а2 Ζ Δ с 0 27 хь 5 2 1 2 27 2 15 а1 33 4 1 4 27 4 33 4 27 а2 0 1 27 0 20 а3 II 4 5 4 135 4 55 4 0 а4 1 0 0 0 0 а5 3 4 1 4 27 4 27 4 t 10 33 2 Во второй симплексной таблице разрешающий столбец а1, разрешающая строка а4, разрешающий элемент симплексной таблицы 33/4. Заменяем в базисе вектор искусственных переменных а4 на вектор а{ и для нового базиса строим третью симплексную таблицу: базис а1 а2 1 z Δ с 15 27 хь 10 33 14 33 16 15 а1 1 0 15 0 27 а2 0 1 27 0 20 а3 I 3 4 3 31 11 0 а4 4 33 1 33 1 1 0 а5 1 II 3 11 6 6 * Вектор Δ ^ 0, поэтому точка ж = (τΪ'τϊ'^Ό) является Реше' нием двойственной задачи с добавленными искусственными переменными (Р), а вектор at = (тг>гг»о) является решением задачи (Р**) и Sp = SP** = 16. В последней симплекс-таблице под разложениями векторов искусственных переменных стоят числа 1, 6, являющиеся значениями решения исходной задачи (Р), т. е. вектор § = (1,6) является решением задачи (Р) и SP = 16. 4.2. Метод искусственного базиса Метод добавления искусственных переменных используется для отыскания начальной крайней точки в задаче линейного программирования в канонической форме (с, х) —► max; Ах = Ь, χ ^ 0. (а)
§ 4. Методы нахождения начальной крайней точки 145 Не ограничивая общности, можем считать, что все координаты вектора Ь неотрицательны. Если это не так, например, bj < О, то умножим обе части j-го уравнения на -1. Поэтому далее считаем, что 6^0. Рассмотрим вспомогательную задачу, добавляя искусственные переменные χ = (хп+\,· ·. ,Хп+т) и единичную матрицу /, m - У^ xn+i -~* max; Ах + 1х = Ь, χ ^ 0, х^О. (Р) Поскольку значение задачи 5р < 0 и множество допустимых элементов Р(Р) Ф® (х := (0,..., 0, Ь\,..., Ьт) е D(P))9 to значение задачи конечно (\Sp\ < -boo). По теореме существования п. 3.1 решение в задаче (Р) существует. Причем, если в исходной задаче (Р*) множество допустимых элементов непусто (D(Pk) Φ 0), то значение задачи Sj = 0, а решением задачи (Р) будет крайняя точка, у которой все искусственные переменные равны нулю. Задачу (Р) можно решить симплекс-методом, взяв в качестве исходной крайней точки точку х. Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной матрицы J, соответствующие базисным_координатам точки ж, линейно независимы. При решении задачи (Р) симплекс-методом могут возникнуть три исхода: 1) Не все искусственные переменные равны нулю. Это означает, что исходная задача (Р*) не имеет допустимых элементов. Действительно, если не все искусственные переменные равны нулю, то S-p < 0. Предположим, что исходная задача (Р*) имеет допустимые элементы, например, х°. Но тогда Sp<0=<(0,-l),(x°,0)> — противоречие. Значит, наше предположение, что исходная задача (Рк) имеет допустимые элементы, неверно. 2) Все искусственные переменные равны нулю и среди базисных векторов нет векторов, соответствующих^ искусственным переменным. Это означает, что решением в задаче (Р) будет χ = (£, 0) — крайняя точка множества D(P). Точка £ будет крайней точкой множества D(Pk) по Предложению 1, поскольку столбцы матрицы А> соответствующие базисным координатам, линейно независимы. Далее, взяв в качестве первоначальной крайней точки точку £, можем приступать ко второму этапу — решению задачи (Р*) по симплекс-методу с найденной крайней точкой. Таким образом, мы имеем двуэтапный метод решения задачи (Рк)·
146 Глава 2. Линейное программирование 3) Все искусственные переменные равны нулю и среди базисных векторов есть вектора, соответствующие искусственным переменным. В этом случае надо исключить из числа базисных вектора, соответствующие искусственным переменным. Пусть, например, в последней таблице имеется строка с искусственной переменной xn+i0* Будем считать эту строку разрешающей. В качестве разрешающего столбца возьмем столбец a·70, jo < η, такой, что Xn+iQja Φ 0· Столбец b новой симплексной таблицы при этом не из- менится (по правилу прямоугольника х{ = ж,- -—— = ж,·, так как xn+i0jo xn+i0 = 0), только вместо переменной жп+|-0 будет стоять переменная Xj0. Значение функционала (с, ж) также не изменится. Этот процесс закончится удалением всех базисных векторов, соответствующих искусственным переменным, с заменой их на неискусственные, или окажется, что Xn+ioj = 0, j = 1,... ,η. Так как ж,·, — г -я координата разложения вектора а3 по базисному вектору а*, то тогда все векторы а3, j = 1,..., η, включая вектор Ь, можно разложить по базисным без вектора ап_Ио. Значит, io-я строка исходной системы уравнений является линейно зависимой от остальных строк и на втором этапе можем просто вычеркнуть из симплексной таблицы г0-ю строку, содержащую эту искусственную переменную, и начать второй этап с меньшим числом базисных векторов. Таким образом, двуэтапный симплекс-метод позволяет для любой задачи линейного программирования в канонической форме: 1) обнаружить, что исходная задача не имеет допустимых элементов, или 2) найти первоначальную крайнюю точку в задаче (Р) и решить задачу по симплекс-методу, или 3) исключить линейно зависимые равенства и решить задачу по симплекс-методу с найденной крайней точкой, имеющей менее т положительных элементов. Замечание. Вместо такого двуэтапного решения задачи (Р*) можно решать следующую задачу (ее принято называть М-задачей) (с, (ж, ж)) —> max; .Аж + 1ж = Ь, ж ^ 0, ж ^ 0, где c=(c,-M,...,-M)GRn+m, Μ — положительное число. Нетрудно показать, что при любом достаточно большом Μ первые η координат полученного решения определяют решение в (Р*.), а искусственные переменные равны нулю.
§4. Методы нахождения начальной крайней точки 147 4.3. Примеры Пример 1. Решить методом искусственного базиса задачу: х\ + 2х2 + Зж3 - а?4 -♦ max; ж,- ^ 0, г = 1,2,3,4, a?i + 2х2 + яз + ж4 = Ю, 2Ж| + ж2 + 5ж3 =20, х\ + 2а?2 + Зж3 = 15. Рассмотрим вспомогательную задачу, добавляя искусственные переменные ж5,ж6: -х5 - хв -* max; х% ^ 0, г = 1,..., 6, a?i + 2ж2 + ж3 + а?4 = Ю, 2я?| + хг + 5ж3 + я5 = 20, a?i +2ж2 + 3ж3 +ж6 = 15. Исходная крайняя точка χ = (0,0,0,10,20,15). Базисные векторы а4 = (1,0,0), а5 = (0,1,0), а6 = (0,0,1). Составим первую симплексную таблицу для вспомогательной задачи: базис L д4 а5 а6 ζ Δ с 0 -1 -1 хь 10 20 15 -35 0 а1 1 2 1 -3 -3 0 а2 2 1 2 -3 -3 0 а3 1 5 3 -8 -8 0 а4 1 0 0 0 0 -1 а5 0 1 0 -1 0 -1 а6 0 0 1 -1 0 t 10 4 5 Из таблицы видно, что разрешающим столбцом является столбец α3, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а3 и для нового базиса строим вторую симплексную таблицу: базис а4 1 а3 а6 Ζ Δ с 0 0 -1 хь 6 4 . 3 -3 0 а1 3 5 2 5 1 5 1 5 1 5 0 а2 9 5 1 5 7 5 7 5 7 5 0 а3 0 1 0 0 0 0 а4 1 0 0 0 0 -1 а5 1 5 1 5 3 5 3 5 8 5 -1 а6 0 0 1 -1 0 t ю 3 20 15 7
148 Глава 2. Линейное программирование Из таблицы видно, что разрешающим столбцом является столбец а2, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а2 и для нового базиса строим третью симплексную таблицу: базис а4 а3 а2 ζ Δ с 0 0 0 Хь 15 7 25 7 15 7 0 0 а1 6 7 3 7 1 7 0 0 0 а2 0 0 1 0 0 0 а3 0 1 0 0 0 0 а4 1 0 0 0 0 -1 а5 4 7 2 7 3 7 0 1 -1 а6 9 7 1 7 5 7 0 1 —Т\ Вектор Δ ^ О, поэтому точка / 15 25 15 \ * = (°'У-'Т'М) является решением вспомогательной задачи и £тах = 0. Перейдем к решению основной задачи. Составим первую симплексную таблицу для начальной крайней точки / 15 25 15\ Я=(°'Т'7'Т)· Разложения векторов ж,а1 по базису α4,α3,α2 берем из последней симплексной таблицы: базис а4 а3 а2 Ζ Δ с -1 3 2 хь 15 7 25 7 15 7 90 7 1 а1 6 7 3 7 1 7 1 7 6 7 2 а2 0 0 1 2 0 3 а3 0 1 0 3 0 -1 а4 1 0 0 -1 0 t | 5 2 25 1 з Разрешающим столбцом является столбец а , разрешающая строка α . Заменяем в базисе вектор а4 на вектор а1 и для нового базиса строим вторую симплексную таблицу:
§4. Методы нахождения начальной крайней точки 149 базис о1 а3 а2 ζ Δ с 1 3 2 хь 5 2 5 2 5 2 15 1 о1 1 0 0 1 0 2 а2 0 0 1 2 0 3 а3 0 1 0 3 0 -1 а4 7 6 1 2 1 6 0 1 t Вектор Δ > О, поэтому точка £ = (х»х»х»0) является решением исходной задачи и £тах = 15. Пример 2. Решить методом искусственного базиса задачу: Х\ - 2ж2 + #з —► niax; ж,- ^ О, ί = 1,2,3, ^1 + хг + хъ = 5, 2х\ + ж2 = 3, -2ж| + 2ж2 = 4. Решение. Рассмотрим вспомогательную задачу, добавляя искусственные переменные Х4,х$: -ж4 - а?5-"* max; ж, > 0, г = 1,...,5, Χι + ж2 + ж3 =5, 2хх + ж2 + ж4 =3, -2x\+2x-i -Ьа?5 = 4. Исходная крайняя точка χ = (0,0,5,3,4). Базисные векторы а3 = (1,0,0), а4 = (0,1,0), а5 = (0,0,1). Составим первую симплексную таблицу для вспомогательной задачи: базис а3 а4 а5 ζ Δ с 0 -1 -1 Хь 5 3 4 -7 0 а1 1 2 -2 0 0 0 а2 1 1 2 -3 -3 0 а3 1 0 0 0 0 -1 а4 0 1 0 -1 0 -1 а5 0 0 1 -1 0 t 5 3 2 Разрешающий столбец а2, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а2 и для нового базиса строим вторую симплексную
ISO Глава 2. Линейное программирование таблицу: базис а3 а4 а2 ζ Δ с 0 -1 0 хь 3 1 2 -1 0 oi 2 3 -1 -3 -3 0 а2 0 0 1 0 0 0 а3 1 0 0 0. 0 -1 а4 0 1 0 -1 0 -1 а5 1 2 1 2 1 2 1 2 3 2 ' 3 2 1 3 Во второй симплексной таблице разрешающий столбец а , разрешающая строка а4. Заменяем в базисе вектор искусственных переменных а на вектор а1 и для нового базиса строим третью симплексную таблицу: базис а3 а' а2 Ζ Δ с 0 0 0 щ 7 3 1 3 7 3 0 0 а1 0 1 0 0 0 0 а2 0 0 1 0 0 0 а3 1 0 0 0 0 -1 а4 2 3 1 3 1 3 0 1 -1 а5 1 6 1 6 1 3 0 1 t Вектор Δ ^ 0, поэтому точка является решением вспомогательной задачи с добавленными искусственными переменными, и 5тах = 0. Перейдем к решению основной задачи. Составим первую симплексную таблицу для начальной крайней точки -fllh х- ^з'з'З/' Разложения вектора χ по базису а?,а],а2 берем из последней симплексной таблицы:
§ 4. Методы нахождения начальной крайней точки 151 базис а3 о1 а2 ζ Δ с 1 1 -2 1 хь 7 3 1 3 7 3 -2 1 а1 0 1 0 1 0 -2 а2 0 0 1 -2 0 1 а3 1 0 0 1 0 t Вектор Δ ^ О, поэтому точка * = (з'з'з) является решением исходной задачи и 5тах = -2. Заметим, что на самом деле исходная задача тривиально решается, так как мы имеем систему из трех линейных уравнений с тремя неизвестными. И эта система имеет единственное решение - (ί I 1\ Пример 3. Решить, вводя искусственные переменные задачу: 2х\ +Ж2 + Зжз +5ж4 -* max; χι ^ О, г = 1,2,3,4, 2ж|+Зж2-Ь ж3 + 2ж4^30, 4ж!-ь2ж2+ ж3 + 2ж4<40, «ι + 2ж2 + Зж3 + ха < 25. Добавив неотрицательные переменные Ж5,а?б,Ж7, получим задачу в канонической форме: 2х\+хг + За?з + 5а?4 -+ max; ж* > 0, г = 1,..., 7, 2Ж|-Ь3ж2-Ь Жз + 2ж4-Ьж5 =30, 4a?i + 2χι + ж3 + 2ж4 + ж6 = 40, Х\ +2х2 + 3хз + ж4 +Ж7 = 25. Исходная крайняя точка χ = (0,0,0,0,30,40,25). Базисные векторы а5 = (1,0,0), а6 = (0,1,0), а7 = (0,0,1).
15 2 Глава 2. Линейное программирование Составим первую симплексную таблицу: базис а5 а6 а1 ζ Δ с 0 0 0 а» 30 40 25 0 ? л,1 2 4 1 0 -2 1 а2 3 2 2 0 -1 3 а3 1 1 3 0 -3 5 а4 2 2 1 0 -5 0 а5 1 0 0 0 0 0 а6 0 1 0 0 0 0 а7 0 0 1 0 0 t 15 20 25 В первой симплексной таблице разрешающим столбцом является столбец а4, Разрешающая строка a5, t = 15. Заменяем в базисе вектор а5 на вектор а4 и для нового базиса строим вторую симплексную таблицу: базис а4 а6 а7 ζ Δ с 5 0 0 ХЬ 15 10 10 75 2 а1 1 2 0 5 3 1 а2 3 2 -1 1 2 15 2 13 2 3 а3 1 2 0 5 2 5 2 1 2 5 а4 1 0 0 5 0 0 а5 1 2 -1 1 2 5 2 5 2 0 а6 0 1 0 0 0 0 а7 0 0 1 0 0 t 30 4 Во второй симплексной таблице разрешающий столбец а3, разрешающая строка a7, t = 4. Заменяем в базисе вектор а7 на вектор а3 и для нового базиса строим третью симплексную таблицу для базиса аА,ае,аъ: базис а4 <*6 а3 ζ Δ с 5 О 3 хь 13 10 4 77 2 а1 1 2 0 5 3 1 о2 7 5 -1 1 5 38 5 33 5 3 а3 0 0 1 3 0 5 а4 1 0 0 5 0 0 а5 3 5 -1 1 5 12 5 12 5 0 О6 0 1 0 0 0 0 а7 1 5 0 2 5 1 5 . 1 5 —Т\
§ 4. Методы нахождения начальной крайней точки 153 Вектор Δ ^ 0, поэтому крайняя точка £ = (0,0,4,13,0,10,0) является решением расширенной задачи, а решением исходной задачи является точка £ = (0,0,4,13), Smax = 77. 4.4. Задачи Задачи линейного программирования в канонической форме с незаданной первоначальной крайней точкой. Решить методом искусственного базиса. 4.1. #1 -Ь 4ж2-Ь жз-* max; ж*^0, i =1,2,3, х\- хг + хз = 3, 2х\ - 5»2 - жз = 0. 4.2. х\ - Юж2+ Жз~*п1ах; я*^0, г =1,2,3, Ж! - 5,5ж2-7ж3 = -13, a?i - 14,5ж2 + 7жз = 15. 4.3. Х\ Л- 2х2 + Зжз - 4а?4 -»max; ж,· > 0, г = 1,2,3,4, Χι -Ь #2 "~ жз + а?4 = 2, Ж| + 14ж2 + 10а?3 - Юж4 = 24. 4.4. х\-5хг- жз + ж4-^шах; ж,^0, г = 1,2,3,4, »1 + Зж2 + За?з + ха = 3, 2а?! + а?з - а?4 = 4. 4.5. a?i + ж2 + жз+ ж4-+тах; ж,^0, =1,2,3,4, 4a?i + 2а?2 + 5ж3 - ж4 = 5, 5х\ + 3^2 + 6а?з - 2а?4 = 5, 3»! + 2χι + 4а?з - а?4 = 4. 4.6. Ж1-И0ж2- Жз + 5ж4-+тах; ж.-^О, г =1,2,3,4, Х\ + 2а?2 — Жз — а?4 = 1, -a?i + 2ж2 + Зж3 + я4 = 2, a?i + 5а?2 + #з — #4 = 5. 9 ^9 4.7. Ж) -Ь2ж2-Ь3жз -Ь 4а?4-Ь 5ж5-* max; ж,-^0, г=1,...,5 #2 4- хъ - 2x4 + 7x5 = 2, 6ж| + жз - 2а?4 + 7^5 = 2, Si + ^2 -2x4 + 7a?5 = 2. 4.8. х\+хг- хг+ ха - 2х5 -+ max; х,^0, г=1,...,5, Зж1 + ж2 + ^з + ха - 2xs = 10, 6х\ + Ж2 + 2жз + Зж4 - 4^5 = 20, ΙΟχι + Ж2 + За?з + 6ха - 1хь = 30.
154 Глава 2. Линейное программирование 4.9. х\ - 4ж2-Ь жз+ ха+ а?5+ ж6-+тах; ж» >0, г=1,...,6, 14Ж| - 14ж2 + 12жз + 5ж4 + 6^5 + За?б = 8, Х\ - Хг + 2а?3 + #5 =0, 16χι - 1бж2 + 8ж3 + 7ж4 + 4я?5 + 5ж6 = 12. § 5. Транспортная задача Важный частный случай задач линейного программирования — транспортные задачи. Это математические модели разнообразных прикладных задач по оптимизации перевозок. Распространенность в приложениях задач транспортного типа оправдывает неослабевающее внимание к ним. Транспортные задачи решаются методом потенциалов, который является усовершенствованием симплекс-метода, примененного к данному более узкому типу задач. В этом параграфе мы приведем постановку транспортной задачи, методы отыскания исходной крайней точки, решение задачи методом потенциалов, двойственную к транспортной задаче, обоснование метода потенциалов, задачу о назначении, примеры. 5.1. Постановка задачи Транспортной задачей по критерию стоимости называется следующая задача о минимизации стоимости перевозок. Пусть в пунктах отправления А\9-..,Ат сосредоточено соответственно ai,...,am единиц некоторого однородного груза. Этот груз следует перевезти в η пунктов назначения В\,...,ВП9 причем в каждый из них надлежит завезти соответственно Ь\,..., Ьп единиц груза. Стоимость перевозки единицы груза из пункта А{ в пункт Bj равна с,·;. Обозначая через xtJ количество единиц груза, предназначенного к отправке из пункта А{ в пункт Bj, получим задачу нахождения плана перевозок, при котором общая стоимость окажется минимальной: m n (с, х) : = Σ Σ CijXij -+ min; Xij>09 г = 1,...,т, j = l,...,n, (P) η Σχ4 = α*, г = 1,...,т, (а) т Х^ = Ьу, i = i»···»*· (b) В матричном виде ограничения задачи (а)-(Ь) имеют вид:
§ 3. Транспортная задача 155 /11.. 0 0.. о о .. 1 0 .. 0 1 .. Ι ό ό .. 10 0.. Oil.. ό ό ό .. 0 10.. 0 0 1.. i ό ό .. . 0 . 1 . ό . 0 . 0 . i ο ο ο ο 1 1 1 Ο Ο 1 ο ο План перевозок и стоимость перевозок представляются в виде векторов х = (хц, t= l,...,m, j = Ι,.,.,η), с= (щ, г= l,...,m, j = 1, ...,n) соответственно, или матриц X = {xij}i=\,...,m, С = {cij}i=\,...tm. j=l,...,n j=l,...,n Уравнения (а) означают, что из пункта отправления А{ весь груз вывезен в пункты назначения (потребления). Уравнения (Ь) означают, что количество груза, завезенного в пункт Bj со всех пунктов отправления, соответствует требуемому. Естественно считать, что общий запас груза на всех пунктах отправления равен суммарной потребности всех пунктов назначения, т. е. : 1) . i . 0 . 0 • i/ / Х\\ \ Х\2 Х2\ Х22 #2п Хт\ = / α, \ α2 0>т Ьх Ъг \ Ьп ) В этом случае говорят, что имеется замкнутая модель транспортной задачи. Рассмотрим незамкнутые модели транспортной задачи и покажем, как они могут быть сведены к замкнутой модели. Если суммарные запасы отправителей больше суммарной потребно- m n сти пунктов назначения, т.е. Σ^ > ]ζ bj, то равенства (а) заменяются неравенствами η sixij ^ α«> г = 1,...,га, а условие (b) остается без изменений. В этом случае вводится фиктивный т η пункт назначения Вп+\ с требуемой величиной завоза bn+i = Σ at - Σ bj i=l J=l и нулевыми стоимостями перевозок в этот пункт. Добавляя новые неотрицательные переменные ж^п+1, г = 1,..., т, приходим к замкнутой модели транспортной задачи с ограничениями в виде равенств (a)-(b).
156 Глава 2. Линейное программирование Если суммарные запасы отправителей меньше суммарных запросов m n пунктов назначения, т.е. ^αί < Σ^> το равенства (Ь) заменяются неравенствами m а условие (а) остается без изменений. В этом случае вводится фиктивный пункт отправления Ат+\ с требуемой величиной вывоза ат+\ = η m Σ fy - Σ α« и нулевыми стоимостями перевозок из этого пункта. Доба- i=i i=i вляя новые неотрицательные переменные xm+\j, j = 1,... ,η, приходим к замкнутой модели транспортной задачи с ограничениями в виде равенств (а)-(Ь). 5.2. Особенности задачи Транспортная задача является задачей линейного программирования и может быть решена симплекс-методом, который значительно упрощается в виду простого строения системы ограничений (а)-(Ь). Этот упрощенный метод мы и опишем ниже. Предварительно докажем некоторые утверждения, имеющие место для транспортных задач. Лемма 1. Для любой транспортной задачи существует допустимый план перевозок (Dp Φ 0). αφ* Доказательство. Положим Xij = —г, тогда уравнения (а) будут выполняться: η η , η Аналогично показывается выполнение уравнений (Ь). Значит а?у — допустимый план перевозок. ■ Отметим, что поскольку значение задачи ограничено снизу нулем и допустимый план перевозок имеется по лемме 1, то в задаче (Р) по теореме существования решения п. 3.1 (\Sp\ < -Ьоо => ArgP Φ 0) оптимальный план существует. Лемма 2. Ранг системы ограничений (а)-(Ь) равен га + η - 1. Доказательство. Если сложить первые га строк матрицы ограничений А и вычесть из них последние η строк, то получим нулевую строку. Следовательно, ранг матрицы А меньше га + п.
§ 5. Транспортная задача 157 С другой стороны, располагая га - 1 строку матрицы А (начиная со второй), под га последними строками, получим треугольную матрицу из т+п-1 строк, ранг которой равен количеству уравнений (га + η - 1). Таким образом, ранг матрицы А равен га -f га - 1. ■ По предложению 1 п. 3.2 (столбцы матрицы ограничений, соответствующие положительным координатам крайней точки, линейно независимы) и лемме 2 (количество линейно-независимых столбцов не превышает га + га - 1) крайняя точка в задаче может иметь не более m + га - 1 положительных координат. .Лемма 3. Любые га + га - 1 строк матрицы А линейно независимы. Доказательство. Любая строка матрицы А (для определенности возьмем строку из системы уравнений (а)) равна сумме всех строк системы уравнений (Ь) минус сумма всех строк уравнений (а) без этой строки, то есть является линейной комбинацией оставшихся га + га - 1 строк. А так как ранг матрицы А равен га -f га - 1, то оставшиеся строки линейно независимы. ■ Отметим, что не любые га -Ь га - 1 столбцов матрицы А являются линейно независимыми (приведите пример!). 5.3. Методы нахождения начальной крайней точки Рассмотрим замкнутую модель транспортной задачи. Как мы уже знаем, незамкнутая модель может быть легко сведена к замкнутой введением фиктивного поставщика или фиктивного потребителя. 1. Метод «северо-западного угла». Назначим максимально возможную перевозку из пункта отправления А\ в пункт назначения В\. То есть заполняем верхний левый элемент матрицы X первоначальной крайней точки. При этом либо пункт отправления А\, либо пункт назначения В\, либо оба эти пункта окажутся полностью обслуженными. Если пункт отправления А\ оказался полностью обслуженным, то в дальнейшем при нахождении первоначального плана перевозок выводим из рассмотрения первую строку матрицы X и рассматриваем только оставшуюся часть матрицы. Если пункт назначения В\ оказался полностью обслуженным, то аналогично выводим первый столбец из дальнейшего рассмотрения. Если же и пункт отправления, и пункт назначения оказались полностью обслуженными (так может случиться только в вырожденной задаче), то вывести из рассмотрения следует или первый столбец, или первую строку матрицы X. Условимся для определенности выводить из рассмотрения первый столбец матрицы. В этом случае в число базисных элементов на следующем этапе введем элемент с нулевым значением перевозки, стоящий в северо-западном углу оставшейся части матрицы X, т. е. в базис войдет второй элемент в строке, считая вычеркиваемый элемент первым.
158 Глава 2. Линейное программирование Эту процедуру продолжаем до тех пор, пока все пункты отправления и пункты назначения не будут обслужены. Последней перевозкой будет перевозка из пункта отправления Ат в пункт назначения Вп. На каждом шаге обслуживается один из пунктов отправления или назначения, а на последнем шаге обслуживаются и последний пункт отправления и последний пункт назначения. Поэтому число базисных элементов будет ровно га + η - 1. Найденный план будет допустимым планом перевозок, содержащим не более m + n- 1 положительных координат и являющийся (как будет показано ниже) крайней точкой множества допустимых элементов. Отметим, что данный метод нахождения первоначальной крайней точки не учитывает стоимости перевозок. Поэтому начальный план может оказаться далеко не оптимальным. Приведем другие методы нахождения начальной крайней точки, учитывающие стоимости перевозок. 2. Минимум по матрице. Выберем в платежной матрице С минимальный элемент. Пусть mine,·;· = с,-0у0. Назначим максимально воз- можную перевозку из пункта отправления Ai0 в пункт назначения Bj0. Если минимальная стоимость перевозки достигается на нескольких элементах, то выбираем любой из них. Тем самым пункт отправления А^ или пункт назначения Bj0 (или оба пункта одновременно) будет обслужен. А в платежной матрице соответствующая строка или столбец выводятся из дальнейшего рассмотрения. Если и пункт отправления, и пункт назначения одновременно обслужились, то для определенности как и в п. 1 будем выводить из рассмотрения столбец матрицы X. В оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор, пока первоначальный план перевозок не будет получен. Найденный план будет допустимым планом перевозок, содержащим не более га + η - 1 положительных координат с числом базисных элементов m+n—1 и являющийся крайней точкой множества допустимых элементов. 3. Минимум по строке. Выберем в первой строке платежной матрицы С минимальный по величине элемент. Предположим minc\j = c\j0- з Назначим максимально возможную перевозку из пункта отправления Α ι в пункт назначения Bj0. Если минимум достигается на нескольких элементах, то выбираем любой из них. Тем самым пункт отправления А\ или пункт назначения Bj0 (или оба пункта одновременно) будет обслужен. А в платежной матрице первая строка или соответствующий столбец выводятся из дальнейшего рассмотрения. В первой строке оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор пока первоначальный план перевозок не будет получен (первой строкой может
§ 5. Транспортная задача 159 оказаться вновь первая строка исходной матрицы без какого-то элемента или вторая строка исходной матрицы без какого-то элемента). В итоге получаем крайнюю точку множества допустимых элементов задачи. 4. Минимум по столбцу. Выберем в первом столбце платежной матрицы С минимальный по величине элемент. Предположим min С(\ = с,-0|. г Назначим максимально возможную перевозку из пункта отправления А{0 в пункт назначения В\. Если минимум достигается на нескольких элементах, то выбираем любой из них. Тем самым пункт отправления ji,-0 или пункт назначения В\ будет обслужен. А в платежной матрице соответствующая строка или первый столбец выводятся из дальнейшего рассмотрения. В первом столбце оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор пока первоначальный план перевозок не будет получен (первым столбцом может оказаться вновь первый столбец исходной матрицы без какого-то элемента или второй столбец исходной матрицы без какого-то элемента). В итоге получаем первоначальную крайнюю точку множества допустимых элементов задачи. Лемма 4. Описанные выше методы нахождения первоначального плана перевозок, приводят к первоначальной крайней точке множества допустимых элементов. Доказательство. По предложению 1 достаточно доказать, что соответствующие базисным элементам столбцы матрицы А линейно независимы. Отметим, что описанные методы нахождения первоначального плана перевозок содержат общий элемент действия: на каждом этапе мы выводим из рассмотрения либо столбец, либо строку матрицы X. Доказательство можно провести индукцией по числу га-Ь η = к. Пусть га + η = 2 — минимально возможное число. Матрица А состоит из единственного элемента и утверждение очевидно. Предположим, что для га -f η = к получаемые этим методом столбцы линейно независимы. Докажем соответствующее утверждение для ra-fn = fc+1. Не ограничивая общности, считаем, что на первом этапе выводится из рассмотрения первая строка или первый столбец (в противном случае мы можем строки или столбцы переобозначить и поменять местами). Если мы выводим из рассмотрения первую строку матрицы, то это означает, что первый пункт отправления А\ обслужен полностью, х\\ — базисный элемент, а все элементы X\j = О, j = 2,...,η. Первое ограничение уравнений (а) выполнено, в матрице ограничений А можно убрать первую строку и первые η столбцов. Получилась меньшая матрица размера (га - 1 + η) χ (га - 1)п, а для нее по предположению индукции соответствующие столбцы являются линейно независимыми. Добавление
160 Глава 2. Линейное программирование столбца с единицей на первом месте (и еще на одном из последних η мест) к га -Ь η - 2 столбцам, расширенным и начинающимся с нуля образует систему га + η - 1 линейно независимых столбцов. Если мы выводим из рассмотрения первый столбец матрицы, то это означает, что первый пункт назначения обслужен полностью, χ и — базисный элемент, а все элементы хц = 0, г = 2,... ,га. Первое ограничение уравнений (Ь) выполнено, в матрице ограничений А можно убрать га + 1 -ю строку и соответствующие га столбцов. Получилась подобная меньшая матрица размера (га-Ьп- 1) χ (η - 1)га, а для нее по предположению индукции соответствующие столбцы являются линейно независимыми. Добавление столбца с единицей на га -f 1-м месте (и еще на одном из первых га мест) к га + η - 2 линейно независимым столбцам, расширенным и имеющим на га-Ь 1-м месте нули образует систему из га-Ьп-1 линейно независимых столбцов. Индукция закончена.и Примеры нахождения начальной крайней точки Пример 1. Метод «Северо-западного угла». Зададим транспортную задачу в виде платежной матрицы. а, = 10 о2 = 80 а3 = 20 6, =40 2 4 6 62 = 15 1 3 2 6з = 42 5 4 7 Ь4=13 11 2 8 Построим по методу «Северо-западного угла» первоначальный план перевозок. Назначим максимально возможную перевозку равную 10 из пункта отправления А\ в пункт назначения В\. То есть заполняем верхний левый элемент матрицы X первоначального плана перевозок. При этом из пункта отправления А\ весь груз окажется вывезенным. В пункт назначения В\ остается привести 30 единиц груза. В дальнейшем при нахождении первоначального плана перевозок выводим из рассмотрения первую строку матрицы 3 χ 4 и рассматриваем только оставшуюся матрицу 2x4. Назначим максимально возможную перевозку равную 30 из пункта отправления Αι в пункт назначения В\. То есть заполняем верхний левый элемент оставшейся матрицы X. При этом пункт назначения В\ окажется полностью обслуженным. В пункте отправления Αι останется 50 единиц груза. Выводим из рассмотрения первый столбец матрицы 2 χ 4 и рассматриваем только оставшуюся матрицу 2x3. Назначим максимально возможную перевозку равную 15 из пункта отправления Αι в пункт назначения Bi. To есть заполняем верхний левый элемент оставшейся матрицы 2x3. При этом пункт назначения Βι окажется полностью обслуженным. В пункте отправления Αι останется
§ 5. Транспортная задача 161 35 единиц груза. Выводим из рассмотрения первый столбец матрицы 2 х 3 и рассматриваем только оставшуюся матрицу 2x2. Назначим максимально возможную перевозку равную 35 из пункта отправления А2 в пункт назначения В$. То есть заполняем верхний левый элемент матрицы 2x2. При из пункта отправления А2 весь груз оказался вывезенным. В пункт назначения Б3 остается привезти 7 единиц груза, которые привозятся из пункта отправления Аъ. После этого в пункте отправления Аъ остается 13 единиц груза, который перевозится в пункт назначения Б4. 0| = 10 а2 = 80 о3 = 20 6, =40 10 30 0 &2 = 15 0 15 0 &з = 42 0 35 7 Ь4=13 0 0 13 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Число ненулевых элементов в первоначальном плане перевозок т + п — \ =4 + 3-1 = 6. Значение функционала (с,хх) = 2 · 10 + 4 - 30 + 3 · 15 + 4 ♦ 35 + 7 · 7 + 8 · 13 = 478. Пример 2. Метод «Минимума по матрице»» Рассмотрим транспортную задачу из примера 1. Выберем в платежной матрице С минимальный элемент. Им является стоимость С\2 = 1. Назначим максимально возможную перевозку равную 10 из пункта отправления А\ в пункт назначения В2. При этом из пункта отправления А\ весь груз окажется вывезенным. В платежной матрице первая строка выводится из дальнейшего рассмотрения. В оставшейся части платежной матрицы 2x4 вновь ищется минимальный элемент. Минимальная стоимость перевозки достигается на двух элементах с^2 — с2^ — 2. Выбираем любой из них. Для определенности Сз2- Назначим максимально возможную перевозку равную 5 из пункта отправления As в пункт назначения В2. При этом пункт назначения В2 окажется полностью обслуженным. В платежной матрице 2x4 второй столбец выводится из дальнейшего рассмотрения. Οι = 10 θ2 = 80 α3 = 20 6, =40 0 40 0 62 = 15 10 0 5 Ьз = 42 0 27 15 64= 13 0 13 0 В оставшейся части платежной матрицы 2x3 вновь ищется минимальный элемент. Им является стоимость с2^ = 2. Назначим максимально возможную перевозку равную 13 из пункта отправления А2 в пункт
162 Глава 2. Линейное программирование назначения Б4. При этом пункт назначения Б4 окажется полностью обслуженным. В платежной матрице последний столбец выводится из дальнейшего рассмотрения. В оставшейся части платежной матрицы 2x2 вновь ищется минимальный элемент. Минимальная стоимость перевозки достигается на двух элементах с2\ = c-χ = 4. Выбираем любой из них. Для определенности c2i. Назначим максимально возможную перевозку равную 40 из пункта отправления Аг в пункт назначения В\. При этом пункт назначения В\ окажется полностью обслуженным. В платежной матрице первый столбец выводится из дальнейшего рассмотрения. Остается привезти 42 единицы груза в пункт назначения 2?з· Оставшиеся 27 единиц груза в пункте отправления 1г и 15 единиц груза в пункте отправления А$ остается привезти в пункт назначения 2?з · Значение функционала (с, х2) = 1 · 10 + 2 · 5 + 2 · 13 + 4 · 40 + 4 · 27 + 7 · 15 = 419. Метод «Минимума по матрице», учитывающий стоимости перевозок в данном примере оказался более эффективным по сравнению с методом «Северо-западного угла». 5.4. Метод потенциалов Сформулируем правило решения транспортной задачи методом потенциалов (обоснование этого метода будет дано в п. 5.7). Для решения транспортной задачи следует: 1. Привести задачу к замкнутой модели (см. п. 5.1). 2. Найти первоначальный план перевозок х, являющийся крайней точкой множества допустимых элементов. Он содержит га -f η - 1 положительных компонент, назовем их базисными. При нахождении мы можем использовать любой из описанных выше методов нахождения первоначального плана перевозок. 3. Исследование плана перевозок х. Для найденного плана χ построить матрицу С = {cij}i=z\,...,m > <kj ·'= Щ+Vj, определяя т+п потенциалов i=i,...,n щ, Vj из системы т + η - 1 уравнений: щ + Vj = Cij для базисных индексов i,j. Эти уравнения линейно независимы (это следует из линейной независимости столбцов, соответствующих базисным элементам), поэтому для однозначного определения потенциалов U{,Vj положим заранее один из потенциалов заданной величине, например, положим щ = 0. т η Замечание. Элементы c\j матрицы С и величина ]Са«^« + IZtyVj не зависят от первоначального выбора щ.
§ 5. Транспортная задача 163 Действительно. Предположим, что вместо первоначального потенциала щ мы бы взяли потенциал щ = и\ +t. Тогда v\ = v\ -1 и все щ = щ+t, Vj — Vj - t при базисных г, j, поскольку щ + Vj = су при базисных г,j. Следовательно, сумма щ + г;7· = г^ +£ + vj -£ = и,- + ν;· = cjj не зависит от выбора первоначального потенциала и\. 4. Провести исследование матрицы Δ.— C -С. Если Δ ^ 0, то исследуемый план з является решением задачи (Р), а потенциалы α,-,τ;, являются решением двойственной задачи. Если среди элементов матрицы Δ есть отрицательные, то выберем элемент с наименьшим значением. Пусть, например, Δ,·0^ = min Ay < 0. 5. Построить новый план перевозок, являющийся крайней точкой множества допустимых элементов. Положим xfiojo = t, x\j = X(j ± t для базисных индексов г, j, где t — некоторая положительная величина (не изменяя остальные небазисные компоненты зу равные нулю) так, чтобы Зу по-прежнему были неотрицательны, но одна из базисных компонент обратилась бы в ноль. Вектор матрицы А, соответствующий этой компоненте, выводим из числа базисных, а вектор матрицы А, соответствующий переменной з,-о7-0, вводим в число базисных векторов. Далее вновь начинаем исследование полученной крайней точки х', т.е. возвращаемся к п.3. В невырожденной задаче в ноль может обратиться только одна из компонент вектора з. В вырожденной задаче в ноль может обратиться несколько компонент. В этом случае из числа базисных векторов исключается любой вектор с нулевым значением, как правило исключается вектор с наибольшей стоимостью перевозок. 5.5. Примеры транспортных задач Пример 1. 2зп + 2х{2 + 4ж!з + 8ж14 + 4з2! + 5з22 + 7ж2з + 6я24 + + 6ж31 + Зж32 + 4ж33 + 9ж34 -> min; , ν , , ЛА Зц +321 +331 +341 ^ 22, Зц+з12 +3,3+ 314 =14, ·'+·„ + ·„ + *!,< 2 з21 + з22 + з23 + з24 = 18, Ζ» +1» + Τ 1Τ % {j 331 + з32 + ззз + 334 = 16, Χ« Χ Χ» + *33 Χ Χ« % J· 3ΐ4 + 324 + 334 + 344 ^ 11, хц>0, i= 1,2,3, j = 1,2,3,4. Решение. Поскольку суммарные запасы груза на всех пунктах отправления меньше суммарных запросов пунктов назначения, т. е. 3 4 Σ<ΐ{ = 48 < Σ^ = 52, то надо привести задачу к замкнутой модели. t=l j=l
164 Глава 2. Линейное программирование Введем фиктивный пункт отправления А^ с требуемой величиной выво- 4 3 за α4 = Σ ty - Σ α« = 4 и нулевыми стоимостями перевозок из этого пункта. Зададим транспортную задачу в виде платежной матрицы: а, = 14 а2 = 18 а2 = 16 04 = 4 Ь, =22 2 4 6 0 Ь2 = 2 2 5 3 0 Ь3= Π 4 7 4 0 64=П 8 6 9 0 Построим по методу «Северо-западного угла» первоначальное распределение: о, = 14 о2 = 18 а2 = 16 а4 = 4 Ьх = 22 14 8 62 = 2 2 63 = 17 8 9 64 = 11 7 4 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 225. Число ненулевых элементов в первоначальном плане перевозок га-Ьп-1 = 4+4-1 = 7. Это позволяет сразу перейти к исследованию на оптимальность найденного плана. Построим матрицу С2*: Ui = 0 u2 = 2 «з = -1 tt4 = -10 t>, = 2 2 4 1 -8 t>2 = 3 3 5 2 -7 »з = 5 5 7 4 -5 t>4 = 10 10 12 9 0 В матрице Δ = С - С = 0 0 5 8 -1 0 1 7 -1 0 0 5 -2 -6 0 0 минимальный элемент Δ24 = min A{j = -6 < 0. Добавляя в первоначальный план распределе- ния на место нулевого небазисного элемента xia величину t, получим 2) В матрице С базисные элементы будем выделять полужирным шрифтом.
§ 5. Транспортная задача второй план возможных перевозок: 165 14 8 2 8-ί 9 + t t 7-t 4 14 8 2 1 16 7 4 Величина t = 7. Значение функционала = 183. Построим матрицу С: «|=0 «2 = 2 «з = -1 «4 = -4 V\ =2 2 4 1 -2 vi = 3 3 5 2 -1 г>з = 5 5 7 4 1 «4 = 4 4 б 3 0 В матрице Δ = С - С минимальные элементы '0 -1 -1 4> 0 0 0 0 5 10 6 Л 1 -1 0, Δ12 = Δ|з = Δ43 = min Δ^ = -1 < 0. Во множество базисных элементов включим элемент х^ъ с наименьшей стоимостью перевозок. Добавляя в первоначальный план распределения на место нулевого небазисного элемента х^ъ величину t, получим третий план возможных перевозок: 14 8 2 \-t 16 t 7 + t A-t 14 8 2 16 1 8 3 Величина t = 1. Значение функционала = 182. Построим матрицу С: щ =0 U2 = 2 щ = 0 щ = -4 v\ =2 2 4 2 -2 v2 = 3 3 5 3 -1 Vj = 4 4 6 4 0 »4 = 4 4 б 4 0
166 Глава 2. Линейное программирование В матрице Δ = С - С минимальный элемент 'О -1 0 4> О 0 10 4 0 0 5 ,2 10 0, Δ)2 = min A{j = -1 < 0. Добавляя в первоначальный план распределения на место нулевого небазисного элемента хц величину t, получим четвертый план возможных перевозок: 14-< 8 + < t 2-t 16 1 8 3 12 10 2 16 1 8 3 Величина t = 2. Значение функционала = 180. Построим матрицу С: «|=0 «2 = 2 «3 = 0 «4 = _4 V\ =2 2 4 2 -2 t>2 = 2 2 4 2 -2 v3 = 4 4 6 4 0 »4 = 4 4 б 4 0 Поскольку Δ = С - С 0 0 4 2 0 1 1 2 0 1 0 0 4 0 5 0 ^ 0, то найденный четвертый план перевозок является оптимальным и суммарная стоимость 180. Пример 2. х\ ι + 2^12 + За13 + 4ж)4 + 4ж2! + Ъх2г + 2ж2з + 2ж32 + 2ж3з + #34 #η+#ΐ2 + #ΐ3 + #ΐ4 = 3, *n+*2i+*3i=2f #21 + #22 + #23 + #24 = 4, min; #31 + #32 + #33 + #34 = 5, асу ^0, г = 1,2,3, #12 + #22 +#32 = 3, #13+ #23+#33 =4, #14+ #24 +#34 = 3, j = 1,2,3,4. Решение. Поскольку суммарные запасы отправителей равны суммар- 3 4 ным запросам потребителей, т.е. Σα* = J2^jГ = 12, то данная задача t=l j=l является замкнутой моделью транспортной задачи.
§ 5. Транспортная задача 167 Зададим задачу виде платежной матрицы: β| = 3 а2 =4 о3 = 5 6, =2 1 4 0 ь2 = з 2 3 2 Ьз = 4 3 2 2 ь4 = з 4 0 1 Построим по методу «Северо-западного угла» первоначальное распределение: 0|=3 о2 = 4 а3 = 5 Ь,=2 2 ь2 = з 1 2 63 = 4 2 2 ь4 = з з Для краткости в Матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 21. Число ненулевых элементов в первоначальном плане перевозок га-Ьп-1 = 3-ь4-1 = 6. Это позволяет сразу перейти к^сследованию на оптимальность найденного плана. Построим матрицу С: щ=0 и2 — 1 щ = 1 V\ = 1 1 2 2 v2 = 2 2 3 3 v3 = 1 1 2 2 v4 = 0 0 1 1 _ / 0 0 2 4\ В матрице Δ = С - С = I 2 0 0 -1) минимальный элемент \-2 -1 О О/ Δ3| = min Δ,· = -2 < 0. Добавляя в первоначальный план распределения на место нулевого небазисного элемента х^\ величину t, получим второй план возможных перевозок: 0 2 3 4 0 3 2-t t 1+ί 2-t 2 + t 2-t 3 Величина t = 2. Из трех обнулившихся базисных элементов в базисе оставили два элемента с наименьшими стоимостями перевозок. Значение
168 Глава 2. Линейное программирование функционала равно 17. Построим матрицу С: «ι=0 «2 = — 1 «з = -1 v\ = 1 1 0 0 vi = 2 2 1 1 Vi = 3 3 2 2 *>4 = 2 2 1 1 минимальный элемент _ /0 0 0 2> В матрице Δ = С - С = I 4 2 0 -1 \0 1 0 0/ Δ24 = пип Ajj; = -1 < 0. Добавляя в первоначальный план распреде- ления на место нулевого небазисного элемента x-ц величину t, получим третий план возможных перевозок: 0 2 3 4-t 0 + f t 3-t 0 2 3 1 3 3 Величина t = 3. Значение функционала = 14. Построим матрицу С: и, =0 «2 = -1 «з = -1 V\ — 1 1 0 0 vi = 2 2 1 1 Vi = 3 3 2 2 tr4=l 1 0 0 В матрице Δ = С - С = все элементы неотрицательны. Значит найденный третий план перевозок является оптимальным и суммарная стоимость всех перевозок равняется 14. Пример 3. 5жц +4^12 + 13a?i3 + 9хц + 2ж2| + ?#22 + 6#2з + 8ж24 + + 9ж31 + 7ж32 + 11#зз + 7ж34 + #41 + 6#42 + #43 + #44 -> min; #п+#12+ #13+ #14 = 19, #ц -f#2i + #31 + ж41 = 9, #21 + #22 + #23 + #24 = 7, #12+#22+#32 +#42= 1?, #31 + #32 + #33 + Ж34 =П» #13 + #23 + #33 + #43 = 15, #41 + #42 + #43 + #44 = 15, #14 + #24 + #34 + #44 = Н> Xij ^0, i,j = 1,2,3,4.
§ 5. Транспортная задача 169 Решение. Представим задачу замкнутого типа в стандартной форме: о, = 19 о2 = 7 02 = П о4 = 15 6, =9 5 2 9 1 Ь2 = 17 4 7 7 6 Ь3= 15 13 6 11 1 Ь4 = 11 9 8 7 1 Построим по методу «Северо-западного угла» первоначальный план: о, = 19 о2 = 7 о2 = П 04 = 15 6, =9 9 Ь2 = 17 10 7 Ь3 = 15 0 11 4 ь4 = п 11 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 270. Число элементов в базисе га-Ьп-1 = 4-Ь4-1 = 7. Один базисный элемент оказался нулевым. Это означает, что задача является вырожденной. Перейдем к исследованию на оптимальность найденного плана. Построим матрицу С: «, =0 «2 = 3 а3 = 8 «4 = —2 V\ = 5 5 8 13 3 V2 = 4 4 7 12 2 V3 = 3 3 6 11 1 "4 = 3 3 6 11 1 | В матрице Δ = С - С = 0 -6 -4 -2 0 0 -5 4 10 0 0 0 6 2 -4 0 минимальный элемент Δ21 = min Aij = -6 < 0. Добавляя в первоначальный план распределения на место нулевого небазисного элемента хг\ величину t, получим Второй план возможных перевозок: 9-t t 10 + t 7-ί 0 11 4 11 2 7 17 0 11 4 11
170 Глава 2. Линейное программирование Величина t = 7.,Значение функционала = 228. Построим матрицу С: щ = 0 щ = -3 Щ ~ 2 «4 = -8 V\ = 5 5 2 7 -3 «2 = 4 4 1 6 -4 v3 = 9 9 б 11 1 «4 = 9 9 6 11 1 Ό 0 4 0 0 6 0 2 2 10-4 ,4 10 0 0 Δ34 = minAy = -4 < 0. Третий план перевозок: В матрице Δ = С - С = минимальный элемент 2 7 17 0 11-ί 4 + ί t 11 — * 2 7 17 0 15 11 0 Величина t — 11. В этом случае обнуляются сразу два базисных элемента. Оставим из них в базисе элемент Ж44 с наименьшей стоимостью перевозок. Значение функционала равно 184. Построим матрицу С: щ =0 «2 = -3 и3 = -2 «4 = -8 V\ = 5 5 2 3 -3 «2 = 4 4 1 2 -4 »з = 9 9 б 7 1 v4 = 9 9 | 6 7 1 Матрица Δ = С - С = 0 0 6 4 0 6 5 10 4 0 4 0 0 2 0 0 ^ 0. Значит третий план перевозок является оптимальным и стоимость всех перевозок равна 184. 5.6. Задача двойственная к транспортной задаче Рассмотрим транспортную задачу: 1=1 j=l min;
§ 5. Транспортная задача 171 Xij > 0, г = l,...,m, j = 1,... ,η, η /1з»з = α»> г = 1,...,т, т J^Stf = bj, j = 1,...,п, (*) (а) (b) «=i (m η ν Σ,α,ί = 53bj=Μ). Двойственной к ней будет (см. п. 2.5) i=i y=i ' задача m n (α, и) + (6, t;) := ^ atwt· + ]Γ δ;·ν, -+ max; i=i j=\ \p ) Щ+Vj^Cij, г = 1,...,т, j = l,...,n, в которой двойственными переменными являются потенциалы В матричном виде ограничения задачи (Р**) имеют вид: / 1 0 ... О 1 0 ... О \ ' 1 0 ... О 0 1 ... О λ О 1 о о о о \ о о . 0 0 0 О 1 О О 0 1 0 0 0 1 1 О 1 0 1 1 О О и2 υ2 \ Vn / ( С]] \ С22 1 / С2п Ст2 \ Стп / Матрица ограничений является транспонированной по отношению к матрице ограничений исходной транспортной задачи (Р). 5.7. Обоснование метода потенциалов решения транспортной задачи Теорема. Крайняя точка χ является решением в невырожденной транспортной задаче (Р) тогда и только тогда, когда вектор Δ ^ 0.
172 Глава 2. Линейное программирование Доказательство. Достаточность. Пусть Δ ^ 0. Это означает, что для точки χ найдены потенциалы Ui,Vj такие, что Δ;,· := Cij - Cij = С{3f - (щ -f Vj) ^ 0, г = 1,..., га, j = 1,...,η, причем г*,· -f Vj = c,j для базисных ij (множество базисных индексов обозначим В). Следовательно, щ +Vj < Cij, г = l,...,m, j = 1,... ,η. Таким образом, условие Δ ^ 0 равносильно тому, что вектор (и, ν) является допустимым в двойственной задаче (Р**). С другой стороны, поскольку Xij = 0 при (i,j) £ В, то m n m n (с χ) = ς Σ °у*«= Σ */*ο' = Σ^(«*ί+vi)xa = Σ Σ(^+νϊ)χ4- «=1 i=l tj€B t,;6B i=l j=l Разбивая последнюю сумму на две и учитывая условия (а) и (Ь), продолжим последнее равенство то η топ топ пто (с,*> = ΣΣ*»'*«+ΣΣ^· = Σ*··Σ*«+Σ**Σ*« = ι=Ι j=l ι=1 i=l t=l j=l j=l 1=1 m η = Σ^α*+Σν^= <α'*)+ <δ>^· ι=1 ;=1 Отсюда по критерию решения п. 3.1 χ — решение в прямой задаче (Р), а (и, ν) — решение в двойственной задаче (Р**). Необходимость. Пусть ж — оптимальный план. Докажем, что тогда Δ ^ 0. Проведем доказательство от противного. Допустим, что это условие не выполняется, т.е. существует Δ,·ο7·0 < 0. Поскольку Δ^ = 0 для (г,;) Ε В, то (t'ot Jo) £ -В. Возьмем достаточно малое t > 0 так, чтобы ж +1 ^ 0, где вектор t = {£tj} выбирается по методу потенциалов, {±£ или 0, i9j e Б, *> i = io> J = io> 0, иначе. Условия (a)-(b) допустимости вектора χ +1 в задаче (Р) равносильны условиям: то η Σ*'; = 0> i = i,-...n; Σ^' = 0> i = 1>...,™. (*) «=1 ;=1 Поскольку cij = Aij -f Qj- = Δ,-j + (и,- + Vj), то m η (c,x + i) - (c,x) = <c,i> = Χ)Σ(Δ„· + Κ + ν;·))% = 171 П ТОП ПТО =Σ Σ) Ау*у+Σu»' Σ '«+Σ ^ Σ '*>=*<·*'<·*·
§5. Транспортная задача 173 Последние два слагаемых в этой сумме равняются нулю в силу соотношения (*). Слагаемые Ау£у = 0 при (г,;) Φ (г'о, ,?(>)> так как в этом произведении один из сомножителей равен нулю: Ду = 0 при (i,j) Ε В, Uj = 0 при (г, j) g? В, (i9j) Φ (г0,jo). Таким образом, (с, χ + г> - (с, х) = Aiojotiojo < О, значит, χ не является оптимальным планом. Получили противоречие. Следовательно, наше допущение, что существует Δ^·0 < 0 неверно и, если χ — оптимальный план, то обязательно Δ ^ 0. ■ 5.8. Задача о назначении. Пример Пусть некоторая фирма нанимает га служащих на η вакантных мест. Известно, что при назначении г-го служащего на j'-e место фирма получит су прибыли. На какие должности кого надо назначить, чтобы общая прибыль фирмы после назначений была наибольшей? Таким образом, задача о назначении является частным случаем транспортной задачи о максимуме функционала, когда at = 6^ = 1, г= 1,...,га, j = Ι,.,.,η: m n (с,ж) :=]>^]Г^суЖу -+тах; ху ^ 0, г=1,...,га, j = Ι,.,.,η, т η 5^я?у = 1, j = Ι,.,.,η; ]Гжу = 1, i = l,...,m. «=1 ;=l Задачи о назначении также решаются методом потенциалов, предварительно перейдя от задачи на максимум к задаче на минимум m n -(с,х) = J^ ]Г -сужу -> min. •=i i=i Поэтому, если в платежной матрице задачи о назначении стоимости были су, то при решении методом потенциалов берутся стоимости -су. Пример, 5х\\ + 4хп + 1х\г + 6ж21 + 7ж22 + Зж2з + 8ж31 + Пззг + 2ж3з -+ max; жн + хп + а?1з = 1, а?ц + а?21 + ж3| - 1, Х2\ + #22 + #23 = 1, #12 + #22 + #32 = 1» #31 + #32 + #33 = lj Х|3 + Ж23 + #33 = If #у ^0, i,j = 1,2,3. Решение. Задачу о назначении можно задать в виде платежной матрицы, не указывая величины α,·,67·, поскольку они равны 1:
174 Глава 2. Линейное программирование 5 6 8 4 7 11 7 3 2 Перейдем от задачи на максимум к задаче на минимум, при этом в платежной матрице стоимости поменяют свой знак: -5 -6 -8 -4 -7 -11 -7 -3 -2 Построим по методу «Северо-западного угла» первоначальное распределение. Два нулевых элемента будем считать базисными, чтобы число элементов в базисе было m + n-l = 3 + 3 — 1 = 5. Выберем их так, чтобы они имели минимальные стоимости: 1 0 1 0 1 Значение функционала равно -14. Построим матрицу С: ' щ = 0 U2 — 1 щ = -3 v\ = -5 -5 -4 -8 υ2 = -8 -8 -7 -11 t>3 = 1 1 2 -2 В матрице Δ = С - С = I -2 0 -5] минимальный элемент V 0 0 0/ Δ π = min Aij; = -8 < 0. Добавляя в начальный план распределения на место нулевого небазисного элемента χ\$ величину t, получим второй план: 0 1 1 0 1 1-ί 0 + ί 1 0 ί 1-ί Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала
§5. Транспортная задача 175 равно -22. Построим матрицу С: г*1 = 0 «2 = 1 щ = -3 V\ = -5 -5 -4 -8 υ2 = -8 -8 -7 -11 ν3 = -7 -7 -6 -10 В матрице Δ ...(. минимальный элемент 0 4 (Г -2 0 3 0 0 8/ Δ21 = min Δίί = -2 < 0. Добавляя во второй план распределения на место нулевого небазисного элемента х2\ величину t, получим третий план распределения должностей: 0 t l-t l-t 0 + t ι о 1 0 1 1 Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала равно -24. Построим матрицу С: И| =0 «2 = -1 щ = -3 v\ = —5 -5 -6 -8 v2 = -8 -8 -9 -11 v3 = -7 -7 -8 -10 В матрице Δ = С _ /0 4 0\ -С= 0 2 5 \0 0 8/ все элементы неотрицательны. Значит найденное распределение является оптимальным и значение исходной задачи равняется 24. 5.9. Задачи 5.1. 2х\\+ЗХ\2 + 4Хи + Х\4.+ ЗХ2\+4Х22 + 2Хм + 5Х24 + Х*\+7Х32 + 5ХП + + 7ж34 + 5^41 + 2ж42 + 8ж4з + 2^44 -+ min; #11 + #i2 + #i3 + #14 = 7, #21 + #22 + #23 + #24 = 8, #31 + #32 + #33 + #34 = 5, #41 + #42 + #43 + #44 = 6, Xij >0, г J = 1,2,3,4. #11 +#21 +#31 +#41 = И, #12 4- #22 + #32 + #42 = 2, #13 + #23 + #33 + #43 = 6, #14 + #24 + #34 + #44 = 7,
176 Глава 2. Линейное программирование 5.2. хи + 3χΐ2 + 10χΐ3 + 6х!4 + 7χ2ι + 2x22 + 5хгз + 8х24 +.5χ3ι + 2х32 4- 2х3з + 9х34 + 2χ4ι + «42 + 3x43 + 4x44 -* min; «и +х\г + «1з + «м = 6, хп + «2ΐ + Х31 + «4i = 14, Х21 + «22 + «23 + Х24 = 18, «12+ «22 + «32 + «42 = И> «31 + «32 + «33 + «34 = 14, «|3 + «23 + «33 + «43 = 8, «41 + «42 + «43 + «44 = Ю, «14 + «24 + «34 + «44 = 15, Xij ^0, ij = 1,2,3,4. 5.3. 4χιι + 3xj2 + 3xi3 + 6χ2ι + 4x22 + 5«23 + 5x3i + 4x32 + 6x33 + 6x4! + 9x42 + IOX43 --► min; «11+«12+«13< 8, _ - τΛ1 4-τΛΛ 4_τλ„ < 17 «Μ +«21 +«31 + «41 — ·>, «21 + «22 + «23 ^ 1 'f τ , _ , τ 4- τ,*, - 1 5 τ„4.τ,α3·„< 7 «12+ «22+ «32+«42- !*>> !31 ί !32 ί ?3 ϊ Д *13 + *23 + Χ33 + «43 = 10, «41 + «42 + «43 ^ 4, «tj>0, «,= 1,2,3,4, J = 1.2,3. 5.4. 2«ц + 6«ΐ2 + 2«ΐ3 + «и + 2χ!5 + 9χ2ι + 4χ22 + Зх2з + 4χ24 + 3χ25 + 5χ3ι + 2хз2 + 8χ33 + 2χ34 + 5x3s -* min; «Π +«21 +«31 = 15, «II +«12 + «13 + «14 +«15 = 13, «12+ «22+ «32= 7, «21 + «22 + «23 + «24 + «25 = П, «13 + «23 + «33 = 14, «31 +«32 +«33 +«34 + «35 = 27, «14+ «24+ «34= 9, «15+ «25+ «35= 6, Zij&O, i= 1,2,3, j = 1,2,3,4,5. Ответы к задачам главы 2 1.1. (1,3,0) GAig; 5max = 4. 1.2. (0,3,0,2),(2,l,0,0)€AigP;Smax = 5. 1.3. (0,4,0,0) 6 Aig; 5max = 4. 1.4. (2,0,3,0) GAig; 5max = 5. 1.5. (5,3,0,0) GAig; 5max = 8. 1.6. (1,1,1,0) GAig; 5max = 3. 1.7. (5,0,3,4,0) GArg; 5max = 15. 1.8. (1,2,3,0,0,0) GAig; 5max = 2. 1.9. (5,0,4,1,0,1,0) GArg; 5max = 10. 4.1. (5,2,0) G Extr, (5,2,0) G Arg; 5max = 13. 4.2. (l,0,2)GExtr; Smax = +oo, ((1,-10,1), (l + 10ί,ί,2 + ^)) = 9 3 + τ-ί -* +00 ПОИ t —► +00. 14
Ответы к задачам главы 2 177 4.3. (θ, — ,0, -) € Extr, (4,0,2,0) € Arg; Smax = 10. 4.4. (-,0,-,θ) €Extr, (-,0,0,-) €Arg; 5max = 3. 4.5. (0,1,1,2)6 Extr, (1,2,0,3) 6 Arg; 4.6. D = 0 => 5max =. -oo. 4.7. (θ, 0,0,0, y) G Extr; 5max = +00, ((1,2,3,4,5), (ο,Ο,Ο,*, - + -*)) = —t > +00 ПрИ * _> +00. 4.8. ©,0,10,0,0),(10,0,0,0,10)€Aig; 5max = -10. 4.9. (0,0,0,1,0,1) G Extr, (0,0,0,1,0,1) € Aig; 5max = 2. 5.1. a?n = 4, ж14 = 3, x2\ = 2, X23 = 6, Ж31 = 5, Ж42 = 2, £44 = 4; и™ = 46. 5.2. ЖЦ =6, ж22 = 11, ^24 = 7, a?3i = 6, а?зз = 8, Ж41 = 2, а?44 = 8; Smin=166. 5.3. a?i3 = 8, х22 = 15, ж2з = 2, а?3| = 5; 5min = 119. 5.4. χη = 10, ж13 = 3, а?2з = И, ж31 = 5, Ж32 = 7, ж34 = 9, Ж35 = 6;
Глава 3 Вариационное исчисление Началу появления вариационного исчисления дала толчок работа И. Бернулли 1696 года «Новая задача, к решению которой приглашаются математики», в которой поставлена задача о брахистохроне. В вертикальной плоскости даны две точки А и В. Определить путь АМВ, спускаясь по которому под действием собственной тяжести тело М, начав двигаться из точки А, дойдет до точки В за кратчайшее время. Вводя в плоскости систему координат так, чтобы ось t была горизонтальна, а ось ж вертикальна, и пользуясь законом Галилея о скорости тела, падающего вниз под действием силы тяжести, можно выписать формализованную постановку задачи: } у/1+i2(t) jx x(to) = Xq, X(t[) — Я?|. Здесь и далее точка над функцией (x(t)) означает производную этой функции по t. Поставленная задача была решена самим И. Бернулли, а также Я. Бернулли, Лейбницем, Лопиталем и Ньютоном. Решение Лейбница было основано на аппроксимации кривых ломаными. Развитая затем в работах Эйлера, эта идея заложила основы прямых методов в вариационном исчислении. Выписанная выше задача об экстремуме интегрального функционала при заданных условиях на концах, является простейшей задачей вариационного исчисления, к рассмотрению которых мы сейчас и перейдем. В третьей главе приводятся также и другие элементарные задачи вариационного исчисления: задача Больца, изопериметрическая задача. Все они являются частными случаями более общей задачи Лагранжа. Как частные случаи задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными.
§ 1. Простейшая задача вариационного исчисления 179 § 1. Простейшая задача вариационного исчисления 1.1. Постановка задачи Простейшей задачей вариационного исчисления называется следующая экстремальная задача в пространстве C^fo^ihR): *. *(*(·)) = J L(t,x(t),x(t)) dt -> extr; x(t0) = x0, x(t{) = xx. (P) to Здесь L = L(t,x,x) — функция трех переменных, называемая ин- тегрантом. Отрезок [ЬоЛ\] предполагается фиксированным и конечным, to < t\. Экстремум в задаче рассматривается среди непрерывно дифференцируемых функций χ £ Cl([to9t\]yR)y удовлетворяющих условиям на концах, или краевым условиям: x(to) = х0, x(t{) = х{. Такие функции называются допустимыми. Определение. Говорим, что допустимая функция £ доставляет слабый локальный минимум в задаче (Р), и пишем χ Ε wlocmin^P, если существует δ > О такое, что J(x(-)) ^ «J(#(·)) для любой допустимой функции χ (χ е D(P)), для которой ||х(.) - 4(-)llc'([w,])2) < *· Наряду со слабым экстремумом в классическом вариационном исчислении также изучается сильный экстремум. При этом расширяется класс функций, среди которых рассматривается задача. Сильный минимум ищется в более широком пространстве, чем С]([Ьо,Ь[])9 а именно, в пространстве кусочно-дифференцируемых функций PC{([to9t\)). Строгое определение сильного экстремума будет дано в главе 5 п. 1. Однако, как правило, функции, доставляющие абсолютный (глобальный) экстремум в С1 или РС{, доставляют абсолютный экстремум и среди более широкого класса функций — всех абсолютно непрерывных функций, на которых функционал J определен. 1.2. Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления Теорема. Пусть функция £ доставляет слабый локальный экстремум в задаче (Р) (х Ε wlocextrP), функции LbLx,L± — непрерывны как функции трех переменных, L± Ε С]([Ьо^\]). Тогда функция χ удовлетворяет ^ Weak — слабый. 2> Напомним, что IMIci([<0,i|]) :=иих{|1»11са«о.«,])»11*11с(М,])}» ™e IMIc(fo,f,]) := max{|y(i)l|i€[io.ii]}.
180 Глава 3. Вариационное исчисление уравнению Эйлера ~t±(t) + Lx(t) = 0 Vi€[io,ii]. at d ι d ι Здесь £*(£):= —£(£,χ,ά)Ι , аналогично Lx(t):= — L(t,x,x)\ dx Ι*=±(ί) dx I Выписанное дифференциальное уравнение второго порядка было впервые (в 1744 году) выведено Эйлером. Он, аппроксимируя кривые ломаными, вывел уравнение, которому были должны удовлетворять экстремали. Впоследствии Лагранж назвал его уравнением Эйлера. Сам Лагранж выводил это уравнение (в 1759 году), варьируя кривую, подозреваемую на экстремум. Выделил из приращения функционала главную линейную часть, которые называл вариациями, и воспользовался тем, что в точке экстремума вариация должна обращаться в нуль. Метод вариации, предложенный Лагранжем, стал общепринятым. Этим методом мы и выведем далее уравнение Эйлера. Функции, удовлетворяющие уравнению Эйлера задачи (Р), называются экстремалями. Множество экстремалей обозначаем Е(Р). Допустимые функции (класса С1 с заданными граничными условиями), удовлетворяющие уравнению Эйлера, называются допустимыми экстремалями. Множество допустимых экстремалей обозначаем DE(P). Доказательство. Возьмем произвольную, но фиксированную функцию h £ Съ([Ьо,Ь[])3К Поскольку χ Ε wlocextrP, то функция одного переменного «ι φ(Χ) := j(*(·) + ΑΛ(.)) = /Ι(ί,χ(ί) + ΑΛ(*)>^(*) + ΑΛ(ί)) dt to имеет экстремум при А = 0. Положим F(if A) = L(ttx(t) + ΑΛ(ί), *(ί) + ΑΛ(ί)). Из условий гладкости, наложенных на £,х,Л, следует, что функция φ дифференцируема в нуле. (Действительно, функции F и F\ непрерывны в некотором прямоугольнике [to,t\] χ [-λο,λο], и, значит по известной теореме из анализа можно дифференцировать под знаком интеграла.) Но тогда по теореме Ферма φ'(0) = 0. Дифференцируя функцию φ и полагая А = 0, получаем φ'(0) = f(Lx(t)h(t) + Lx(t)h(t)) dt = 0 Vhe Cd([iof ίι]). (1) 3) Cjdio.ii]) := {fc(·) € Cl([toM) | h(t0) = A(t,) = θ}.
§ 1. Простейшая задача вариационного исчисления 181 Проинтегрируем по частям первое слагаемое в соотношении (1) для h Ε Co([*o>*i]) (здесь мы пользуемся условием теоремы, что L± Ε C[([to9t\])): ίι U t\ U it±hdt= fL±dh = Li(t)h(t)^- fhdLi = - Hjt^hdt. to ' ίο ίο ίο Свободные члены при интегрировании по частям равняются нулю, так как h(to) = h(t\) = 0. Тогда соотношение (1) перепишется в виде и J(-jtLx(t) + Lx(t))h(t)dt = Q VheCU[to,ti]). (2) to Основная лемма вариационного исчисления (лемма Лагранжа). Пусть функция а непрерывна на отрезке [to9t\] (a € C([to9t\]) и *1 a{t)h(t)dt = 0 Vfc€CS([i0fi|]). ίο Тогда a(t) = 0. Доказательство леммы. Предположим а(т) /0 в некоторой точке τ € (to,t\). Для определенности, пусть а(т) > 0. Тогда в силу непрерывности функция a(t) > 0 и в некоторой окрестности точки г, например, отрезке [τ0,τι] С [<ο*Ί]: Пусть h Ε Co([^o»^ij) — положительная в этой окрестности функция и равная нулю вне ее, типа «шапочки», например, ЛМ-/С-7Ь)2('-Т1)2» *€[7b,Ti]f (,""\0, ^[το,τ,]. ί. Тогда h E Cq ([to, t\ ]) — допустимая в лемме функция, но / a(t)h(t) dt > 0, ίο что противоречит условию леммы. Лемма Лагранжа доказана. ■ По лемме Лагранжа из соотношения (2) вытекает уравнение Эйлера. ■ 1.3. Вывод уравнения Эйлера с помощью леммы Дюбуа-Реймона В этом пункте мы выведем уравнение Эйлера для меньших условий гладкостей, наложенных на интегрант L. При выводе уравнения Эйлера вместо леммы Лагранжа будем использовать лемму Дюбуа-Реймона.
182 Глава 3. Вариационное исчисление Теорема. Пусть функция χ доставляет слабый локальный экстремум в задаче (Р) (х Ε wlocextrP), функции L,LX,LX — непрерывны в некоторой окрестности расширенного графика Г^ {L,LXiL± € С(0(Гхх))). Тогда Lx — непрерывно дифференцируемая функция (Lx Ε C!([£o>*i])) ы функция χ удовлетворяет уравнению Эйлера -4г*0+ £«(*)= 0 Vi€[io,ii]. at Доказательство. Возьмем произвольную, но фиксированную функцию h Ε Co([£o,*i])· Поскольку χ Ε wlocextrP, то функция одного переменного <p(X):=j(x() + Xh(·)) = ίL(tyx(t) + Xh(t),x(t) + Xh(t)) dt to имеет экстремум при λ = 0. Положим F(t9 A) = L (t, x(t) + Afc(i), x(t) + Xh(t)). Из условий гладкости, наложенных на L,x,h, следует, что функция φ дифференцируема в нуле. (Действительно, функции F и F\ непрерывны в некотором прямоугольнике [to,t\] χ [-А0,А0], и, значит по известной теореме из анализа можно дифференцировать под знаком интеграла.) Но тогда по теореме Ферма <р'(0) = 0. Дифференцируя функцию φ и полагая А = 0, получаем h φ'(0) = f(Lx(t)h(t) + Lx(t)h(t)) dt = 0 Vfc Ε C0!([io,iil). (Ι) ίο Здесь мы не можем, как в предыдущем случае, брать второй интеграл по частям, поскольку не задана дифференцируемость функции L±(t). Уравнение (1) означает, что вариация по Лагранжу функционала J равна нулю: 6j(x(),h())=0 Vfc€q}([i0>ii]). Лемма Дюбуа-Реймона. Пусть функции α0,αι Ε C([*o>*i]) и t\ f(a{{t)h(t) + a0(t)h(t)) <tt = 0 Vfc Ε C,}([io,ii])· ίο Тогда функция а\ Ε C^o^i]) и выполняется дифференциальное уравнение — —-αι(ί) + α0(£) = 0 V£ Ε [£ο>*ι] (аналог уравнения Эйлера). at Vr&i:={(t,*(t),Ht))\te[t0,ti)}.
§ 1. Простейшая задача вариационного исчисления 183 Из леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. Доказательство леммы. Возьмем функцию ρ е Cl([to,t\]) такую, что p(t) = α0(0, / p(t) dt= fa} (t) dL Ό k Она существует, так как p(t) = α0(£) — дифференциальное уравнение 1-го порядка, решение которого определено с точностью до константы, а выбором константы можно удовлетворить второе условие. Тогда для любой функции h е Со ([£о, * ι]) πο условию леммы должно выполняться равенство f(al(t)h(t) + aQ(t)h(t))dt= ί ax(t)h(t)dt + [h(t)dp(t) = to to to «I t, t, = /ai(t)A(t)A+A(0P(<)f' - fp(t)h(t)dt= f\a,(t)-p(t))h(t)dt = 0. (2) ίο ίο *o t Возьмем функцию h(t) = / (α\(τ) -p(r))dr. Тогда h = a\ - ρ и ίο h e C0l([io,^i]). Действительно, равенство h(to) = 0 следует из определения функции Л, равенство h(t\) = 0 вытекает в силу выбора функции р: Л(^) = I (a>\(t) - p(t)) dt = 0. Значит для функции Л должно вы- io t\ полняться равенство (2), то есть / (а\ - р)2 dt = 0. Отсюда следует, что ίο a\(t) = p(t). Таким образом αϊ G Cl([*o,*i]) и -—a\(t) + ao(t) = 0. Лемма ar Дюбуа-Реймона, а вместе с ней и теорема доказаны. ■ 1.4. Векторный случай Мы сформулировали теорему для одномерной задачи вариационного исчисления. Аналогично ставится векторная задача и формулируются необходимые условия экстремума. Пусть x(t) = (x\(t)9...9xn(t)) — n-мерная вектор-функция, инте- грант L = L(t9x\9...9xn9x\9...9xn) — функция 2гс + 1 переменного.
184 Глава 3. Вариационное исчисление Рассмотрим задачу в пространстве C]([to,t\],R) x ... xC]([to,t\],R) Ч l· £(^x,,...,a^,£,,...,£n)ctt-->extr; to Xi(tj) = Xij, i=l,...,n, j =0,1. Необходимые условия экстремума в простейшей векторной задаче состоят из системы уравнений Эйлера --А(0+ £*(*) = о, t = i,...,п. at Доказательство теоремы в векторном случае тривиально редуцируется к одномерному случаю. 1.5. Интегралы уравнения Эйлера Если интегрант L = L(t9x,x) не зависит явно от одной из переменных, то уравнение Эйлера сводится к более простым уравнениям. 1. Если интегрант L = L(t,x) не зависит явно от ж, то имеет место интеграл импульса ^ Lx(t) = const. 2. Если интегрант L = L(x,x) не зависит явно от ί, то имеет место интеграл энергии (оба названия интегралов взяты из классической механики) &(t)Lx(t) - L(t) = const. Для доказательства интеграла энергии достаточно продифференцировать последнее равенство по t и воспользоваться уравнением Эйлера: .|b-W-W = d~-i(-|: Замечание. Отметим, что при выводе интеграла энергии мы использовали дополнительное предположение о существовании второй производной έ. Интеграл энергии имеет также лишнюю экстремаль ±(t) = const. £LX + x—Lx - Lx£ - L±± = 0 <=> -x[-—L± + Lx) = 0. at \ at / 1.6. Примеры 1 Пример 7. J(x(·)) = x2dt-^> min; x(0) = 0, x(l) = 1. о Уравнение Эйлера: χ = 0. Общее решение: χ = C\t + Сг. Из начальных условий находим единственную допустимую экстремаль: £ = t.
§ 1. Простейшая задача вариационного исчисления 185 Докажем, что она доставляет абсолютный минимум в задаче, т.е. & = t € absmin. Для этого надо показать, что J(x(-)) ^ «/(#(·)) мя любой допустимой функции ж, или, что то же самое, J(£ + h) ^ J(£) для любой функции h Ε Со([0,1]). Действительно, I 111 J{x + h)-J(£) = f(£ + h)2dt- Ia?dt = 2 f$hdt+ ih2dt^ 0 0 0 0 1 1 1 ^2 [£hdt = 2 I£dh = 2£h\l -2 f '$hdt = 0. 0 0 0 Таким образом, разность всегда неотрицательна, то есть имеем абсолютный минимум. 3*/2 Пример 2. J(x(-)) = / (χ2 - χ2) dt -+ min; x(0) = я(-у) = 0. о Уравнение Эйлера: χ -f χ = 0. Общее решение: ж = Ci sini -f C2Cos£. Из начальных условий находим единственную допустимую экстремаль: £ = 0. Покажем, что она не доставляет локального минимума, т.е. at g wlocmin. 1 2t Рассмотрим последовательность функций xn(t) = —sin·—. Очевид- п 3 но, что хп — допустимые функции и хп —► £ в метрике пространства С1 ([0,1]), но при этом 3*/2 ^.)).i/(i«pf-^|)-^(i-.)<..w». о Получили, что значение функционала на жп меньше, чем на £, значит £ не доставляет слабого локального минимума. Из этого примера видно, что уравнение Эйлера — необходимое, но не достаточное условие экстремума. 1.7. Задачи 1 1.1. fx2dt-> extr; x(0) = 1, х(1) = 0. о Го 1.2. fx2dt-^ extr; x(0) = 0, х(Т0) = ξ.
186 Глава 3. Вариационное исчисление ι 1.3. f(x2-x)dt-+txtr; ж(0) = ж(1) = 0. о То 1.4. Пх2 -x)dt^> extr; x(0) = О, х(Т0) = ξ. о 1.5. / (ж2 - х) dt -> extr; ж(О) = ж(Г0) = О. о I 1.6. / (ж2 + tx) dt -» extr; x(0) = ж(1) = О о 1 1.7. Дж2 - t2x) dt — extr; ж(О) = ж(1) = О. о е 1.8. tx2dt->zxtT; x(l) = О, ж(е) = 1. ι е 1.9. f(tx2 + 2ж) <ft -+ extr; ж(1) = ж(е) = О. ι 1 1.10. i(l+t)x2dt -> extr; x(0) = 0, ж(1) = 1. о € 1.11. f(tx2 + 2ж) ей — extr; ж(1) = 1, х(е) = 0. ι е 1.12. J (x-tx2)dt-* extr; x(l) = 1, ж(е) = 2. ι 2 1.13. / *2ж2 <tt -» extr; x(l) = 3, ж(2) = 1.
§ 1. Простейшая задача вариационного исчисления 187 з 1.14. J (t2 - \)х2 dt — extr; x(2) = 0, х(3) = 1. 2 е 1.15. / (2х - *2ж2) dt -+ extr; ж(1) = е, ж(е) = 0. ι 1 1.16. fx2x2dt — extr; s(0) = 1, x(l) = >/ϊ. о 1 1.17. / х2х2 dt — extr; ж(0) = 2, ж(1) = л/3, о 4/3 1.18. У* J«- extr; x(0) = 1, ж(-) = ~. о I 1.19. / ехх2 dt -> extr; x(0) = 0, х(\) = 1п4. о 1 1.20. I (х2 + хх + \2tx) dt-+ът\ х(0) = ж(1) = 0. о е 1.21. / (to2 + жж) ей -+ extr; ж(1) = 0, х(е) = 1. ι Ί 1.22. /Уж2 + 12ж2) dt — extr; ж(0) = 0, ж(1) = 1. о 1 1.23. /(ж2 + ж2) dt-* extr; ж(-1) = ж(1) = 1. -ι I 1.24. j{x2 + 4x2)dt-*tm\ ж(-1) = -1, ж(1) = 1.
188 Diaea 3. Вариационное исчисление ι 1.25. f(x2 + x2 + 2x)dt-^zxtr, ж(0) = ж(1) = 0. о 1 1.26. J (χ2 + x2 + tx) dt -+ extr; ж(0) = ж(1) = 0. о Го 1.27. ί(χ2 + χ2) dt - extr; x(0) = 0, х(Т0) = ξ. о 1 1.28. (4xsmt-x2-x2)dt-+zxtr; ж(0) = ж(1)=0. о I 1.29. Их2 + ж2 + 6ж sh 20 dt -► extr; я?(0) = я?(1) = 0. о То 1.30. / (х2 + ж2 - 4a?sin<) dt -> extr; ж(0) = 0, ж(Т0) = £. о Го 1.31. 1{х2 + ж2 + 6ж sh 2t) dt -> extr; я?(0) = 0, х(Т0) = £. о I 1.32. Пх2 + х2 + Ах sht) dt — extr; x(0) = -1, х(\) = 0. о Г0 1.33. / (ж2 + х2 + 4ж sht) dt -> extr; ж(0) = 0, ж(Г0) = £. о 1 1.34. А(ж2 + х2 + 4ж cht) dt -+ extr; ж(0) = x(l) = 0. '* о Го 1.35. / (х2 + х2 + 4х ch t) dt -> extr; ж(0) = 0, ж(Т0) = £.
§ 1. Простейшая задача вариационного исчисления »/2 1.36. f(x2 - x2)dt -+ extr; ж(0) = 1, х{^Л = 0. о Φ 1.37. /(ж2 - ж2) dt — extr; x(0) = 0, ж (|) = 1. о Φ 1.38. / (ж2 - ж2 + 4жсоз*) dt -* extr; ж(0) = ж (-г) = 0. о */2 1.39. / (ж2 - ж2 - 4ж sin t) dt -> extr; ж(0) = ж (^) = 0. о I 1.40.. / Vl+X dt ^ extr; хцц = ж(1) = 1. о 1/2 , 1Л1.}£±Е* -^extr; х(0) = 1, ,(1) = £ О 1.42. / ^^ dt -> extr; x(i) = ^, ж(1) = 1. 1/2 Го 1.43. Υ жл/1+ж2сй —extr; ж(-Т0) = ж(Г0) = £ -То (задача о минимальной поверхности вращения). '■ > τ /vl -Ь ж 7=— dt -♦ extr; ж(£0) = ж0, ж(£|) = Ж1 (ж0 > О, х\ > у/х к (задача о брахистохроне). Ά 1.45. / у/Т^у/Г^ dt -+ extr; ж(0) = 0, ж(Г0) = ξ (h > 0) о (задача о стрельбе).
190 Глава 3. Вариационное исчисление */2 1.46. / {х] + х\ + 2а?1Ж2) d* -> extr; X\(Q) = ж2(0) = 0, Ж| ί-Λ = 1, о *(ί)—ΐ· I 1.47. / (ж? -h я?1 — 2a?ia?2) Л -> extr; х{(0) = ж2(0) = 0, ж,(1) = sh 1, о ас2(1) = -Л1. I 1.48. (х]+х1 + 2х{Х2)<И-+ехгг; х{(0) = х2(0) = 0, a?i(l) = a?2(l) = shl. о 1 1.49. I {x\X2+x\Xi)dt -+ txlr\ a?i(0) = a?2(0) = 1, a?i(l) = e, x2(l) = -. о */2 1.50. / (x\±2 - x\X2)dt —► extr; a?i(0) = ж2(0) = 0, a?j ί — J = 1, о *2(|) = -i. 1.51. / (a?|S2+6tei + 12*2a?2)<«-»extr; Ж|(0)=ж2(0)=0, a?i(l)=a?2(l)=l. о I 1.52. / (ж? + 2s2 + x\ + 2a?ia?2 + 2ж2ж3) <й -> extr; a?i(0) = ж3(0) = 1, о § 2. Задача Больца 2.1. Постановка задачи Задачей Больца называется следующая экстремальная Задача без ограничений в пространстве С1 (fob* i]): *. В(х()) = JL(t,x(t)9x(t)) dt + Ι(*(ί0),*(ίι)) -> extr. (P)
§ 2. Задача Больца 191 Здесь L = L(t,x,x) — функция трех, a I = l(x(to),x(t[)) — функция двух переменных. Задача Больца — элементарная задача вариационного исчисления. Функционал В называется функционалом Больца, функция I — терминантом. Любые функции класса C^fio,^]) являются допустимыми в задаче. Определение. Говорим, что допустимая функция £ доставляет слабый локальный минимум в задаче (Р), и пишем £ € wlocminP, если существует δ > О такое, что В(х(-)) ^ В(±(-)) для любой допустимой функции ж, ДЛЯ КОТОРОЙ ||Я?(.) - Α(·)ΙΙ<7'([ίο,ίι]) < *. 2.2. Необходимое условие экстремума Теорема. Пусть функция £ доставляет слабый локальный экстремум в задаче (Р) (£ Ε wlocextrP), функции L,LX,LX — непрерывны в некоторой окрестности расширенного графика Гхх (L,LX,LX Ε С(θ(Γχ$))), функция I — непрерывно дифференцируема в окрестности точки (£(£ο),#(*ι)) (l G С1 (С?(£(£о), £(*ι)))) · Тогда Lx — непрерывно дифференцируемая функция (Li e Cl([to,t\])) и выполнены a) уравнение Эйлера —£*(«) +£«(0 = 0 Vi€[io,i|]; b) условия трансверсальности ■Ь±(*о) = lx(t0), Lx(t[) = -ί*(*,). Доказательство. Возьмем произвольную, но фиксированную функцию h G С1 ([ίο, ίι]). Поскольку £ Ε locextrP, то функция одного переменного <p(X):=B(£(-) + Xh(-)) = и = /ϋ(ί,4(ί) + ΑΛ(ί),*(ί) + ΑΛ(ί)) Λ +1(4(ίο) + Ak(*o), 4(ίι) + ΑΛ(ί|)) ίο имеет экстремум при А = 0. Но тогда по теореме Ферма φ'(0) — 0. Дифференцируя функцию φ и полагая А = 0, получаем и φ'(0) = f{Lx{t)h(t) + Lx(t)h(t)) dt + f*(io)ft(io) + 4(ί!)Λ(ίι) = 0 *0 Vfc€C'([i0,ii]).
192 Глава 3. Вариационное исчисление Равенство (1) выполняется для любой функции h Ε C]([to,t\]), а значит и для функций h e Ca([£o,£i]). Следовательно, из (1) вытекает, что (L±(t)h(t) + Lx(t)h(t)) dt = o vhe ς!([ί0>ίι]). ίο Отсюда по лемме Дюбуа-Реймона функция L± Ε ^([tfo^i]) и выполняется дифференциальное уравнение —£*(«)+£«(«) = 0 Vi€[i0,ii] — уравнение Эйлера. Для завершения доказательства теоремы осталось вывести условия трансверсальности. Проинтегрируем по частям первый интеграл в соотношении (1) (оно стало возможным в силу доказанного включения L±(t)ecl([tQM))· jtx{t)h{t)dt = ft±{t)dh{t) = Lx(t)h(t)^ - f h{t)jlx{t)dt to to to Подставляя полученное выражение в соотношение (1) и учитывая уже доказанное уравнение Эйлера, получим ч φ'(0) = /(-^£*(0 + Lx(t))h(t) dt ° +(ϊ*(ί|) +t*(tl))h(tl) + (-£*(ί0) + ix{to))h(to) = = (2*(ii) + WM*i) + № VfcGC'dio,*!]). (2) Подставляя в (2) последовательно h(t) — t-t\ и h(t) = t-tQ, придем к условиям трансверсальности Lx(to) = lx(to) и L±{t\) = -[<,.(*,)· Тем самым теорема полностью доказана. ■ 2.3. Многомерный случай Мы сформулировали теорему для одномерной задачи Больца классического вариационного исчисления. Совершенно аналогично ставится векторная задача Больца и формулируются необходимые условия экстремума. Пусть x(t) = (x\(t)>... ,xn(t)) — n-мерная вектор-функция, инте- грант L = L(t9 х\,..., хП9 ±\,..., хп) — функция 2п+1 переменного, тер- минант/ = l(x\(to),... ,Xn(to),x\(t\),. - - ,xn(t\)) — функция 2п перемен-
§ 2. Задача Больца 193 ных. Рассмотрим задачу в пространстве C]([to,ti]9R) х ... х С[([Ьо,Ь\],И) I L(t9x\,...,xnixu...9xn) dt + к + l{x\(to)9... ,xn(to),X\(t\), - - - ,Xn(t\)) -*extr. Укажем на необходимые изменения при формулировке условий экстремума для векторного случая. Необходимые условия экстремума в векторной задаче Больца состоят из системы η уравнений Эйлера --£*,(*) + £*, (0 = о> « = ι,...,η, и системы 2п условий трансверсальности £*,·('ο) = txi(to)> ί*,·(Ί) = -£■*(*■)· i = 1,.. .',η. Доказательство теоремы в векторном случае тривиально редуцируется к одномерному случаю. Действительно, фиксируем у вектор-функции ж(·) = ((ал(·),...,жп(·)) все компоненты кроме ж<(·). Тогда функционал Больца будет зависеть только от одной функции ж,-(·): Б(ж,(·)) = В((£\ (·), ...9£j-.i(*)t^i(a)»^t+i(a)»*--»^nO)- А для одномерного случая необходимые условия экстремума — уравнение Эйлера и условия трансверсальности по a?f (·) — уже доказаны. Каждое уравнение Эйлера — дифференциальное уравнение второго порядка — содержит при интегрировании две константы. Всего — 2п констант интегрирования. Для их нахождения у нас есть 2п уравнений — условий трансверсальности. В таком случае, когда количество неизвестных совпадает с количеством уравнений для их нахождения, мы говорим о полноте набора условий для нахождения экстремали. Как правило, во всех наших задачах мы имеем полный набор условий для определения неизвестных. 2.4. Пример 1 В(х(·)) = /V - х) dt + ж2(1) - extr. о Решение. Необходимые условия экстремума: а) уравнение Эйлера d d l ---Ιέ + 1χ = 0 <ί=Φ ---2a·-1=0 <=* -2ж-1 = 0 <£=> # = --;
194 Глава 3. Вариационное исчисление Ь) условия трансверсальности f £*(0) = J,(o), /24(0) = 0, /*(0) = 0, \ϋ*0) = -ί,(ι) \2»(1) = -2»(1), ^ \4(1) = -*(1). Решение уравнения Эйлера: t e 2 4 Из условий трансверсальности находим константы С\ и Сг\ С,=0, ^ ^ 3 /*(о)-о, _/с,Г0,1 \х(1) = -*(1), ^ \"2 = Т_< З-*2 Таким образом, имеется единственная допустимая экстремаль at = —-—. 4 Покажем, что она доставляет абсолютный минимум в задаче. Действительно, если функция h Ε С!([0,1]), то ι в(*0+Ч))-л(*0)=/(Ф^ о 1 111 - f(&2-&)dt-&2(l)= fl&hdt+ fh2dt- Jhdt + 2&{\)h{\) + h2{\)> 0 0 0 0 I (отбросим неотрицательные слагаемые / h2dtnh2(\), внесем функцию h о под знак дифференциала, проинтегрируем по частям и объединим два интеграла, вынося за скобки К) 1 1 1 ^ I 2£dh- АлЛ+24(1)Л(1) = 2*(*)Л(')|1+ М-24-1)ЛЛ+24(1)Л(1) = 0 0 0 (функция £ удовлетворяет уравнению Эйлера -2ж - 1 = 0 и условиям трансверсальности х(0) = 0, х(\) = -ж(1)) = 2*(1)Л(1) - 2*(0)ft(0) + 24(l)fc(l) = 2(*(1) + *(l))h(l) = 0. 3-t2 Следовательно, at = —-— Ε absmin. 4 л/ач /V'2 3 **W ! /*3 3ίΜ' ! 2-9 + 3 1
§ 2. Задача Больца 195 Очевидно, что 5max = -boo. Действительно, возьмем последовательность функций xn(t) = η, тогда В(хп(-)) = -п + п2 -~+ +оо при η —> оо. 3 — £2 1 Ответ, —ξ— Ε absmin, 5min = --, 5max = +oo. 2.5. Задачи Больца 1 2.1. [(χ2 + 2ж) dt + ж2(0) -> extr. о 1 2.2. fx2dt + 4x2(0)-5x2(\)-+zxtr. о 2.3. f(x2-x)dt-?-^--+extr. о 1 2.4. /(ж2 + ж2) dt - 2ж(1) sh 1 -+ extr. о 2.5. / (ж2 + ж2 - 4ж sin <) dt + 2s2 (0) + 2ж(тг) - ж2(π) -> extr. о π/2 2.6. А (ж2 - ж2) dt + ж2(0) - ж2 (|) +4я?(т) "^ extr· о 2.7. /(ж2 - ж2 - 2ж) dt - 2ж2(0) - ж2 (|) — extr. о I 2.8. / (х\х2 + а?1Ж2) dt -f Ж1(0)ж2(1) + Ж1(1)ж2(0) -+ extr. о е-1 2.9. f(t+\)x2dt + 2x(0)(x(e- 1) + l) -♦extr. .
196 Глава 3. Вариационное исчисление 2 2.10. / t2x2 dt - 2х(\) + х2(2) — extr. ι е 2.11. ί 2(tx2 + xx) dt + Зж2(1) - х2(е) - 4х(е) — extr. ι 3 2.12. f4x2x2dt + x4(0)-8x(3)-*txtr. о 1 2.13. / е*х2 <tt + 4е*(0) + 32е"ж(1) - extr. о 2.14. ίеш(х2 + 2х2)dt + 2х(\)(х(0) + l) -> extr. § 3. Задача с подвижными концами 3.1. Постановка задачи Задачей с подвижными концами называется следующая экстремальная задача в пространстве С](А) χ R2: J(t) = / /(*■*>*)dt + *о(*o,x(to),t\,x(t\)) - extr; (P) ii(<o,»(*o),*i,»(*i)) = 0, г= l,...,m, (1) где ξ — (x(-),to,t\)9 Δ — заданный конечный отрезок, £0>*i G Δ, ί0 < *ι· Частным случаем является задача, в которой один из концов или даже оба закреплены. Элемент ξ = (x(-),to>t\) называется допустимым, если χ G С1 (Δ), to,t\ G Δ, *ο < t\, и выполняются условия (1) на концах. Определение. Говорим, что допустимый элемент ξ = (£(·),£оД|) Д°" ставляет слабый локальный минимум в задаче (Р), и пишем £ G wlocminP, если существует δ > 0 такое, что J(£) ^ J(£) для любого допустимого элемента ξ = (ε(·),*ο»*ι), Для которого ||ж(-) — ^(-)llc'(A) < ** Ι'ο-ίοΙ < ^> |ii-fil<*.
§ 3. Задача с подвижными концами 197 3.2. Необходимые условия экстремума Теорема. Пусть элемент ξ = (χ(·), io,i\) доставляет слабый локальный экстремум в задаче (Ρ) (ξ Ε wlocextrΡ), функции L, LX,L± — непрерывны в некоторой окрестности расширенного графика Гхх := {(£,ж(£),£(£)) | ί G Δ} (L,LXyLx Ε 4?(0(ГХХ))), функции /,· — непрерывно дифференцируемы в окрестности тонки (£о,£(£оМь£(£|)) (** € Cl(io9£(to)>£\,&($\)))> г = 0,1,...,га. Тогда существует ненулевой вектор множителей Лагранжа А = (А0,..., Ат) € Rm+1, λ φ О, такой, что для функции Лагранжа / Λ(*(·),«ο,ίι) = / Αο/(ί,«,*)Λ + 53ΑΑ(ί0,»(ίό),*ι,»(*ι)) выполнены условия: a) стационарности по χ — уравнение Эйлера для интегранта £ = А0/(*,х,ж) ™г*0+ £«(*) = 0 ViG Δ <^> -^λ0/*(0 + ΑοΛ(ί) = 0; at αί т b) трансверсальности по χ для терминанта I = Σ-Μ*(*ο>#(£ο)» *ι»#(*ι)) £*(ίθ) = fis(io) *=* λ0/*(ίο) = t(<b)» ■Μ^ι) = ""^(<ι) 4<=^ λο/«(^ι) = "-'*(«,); c) стационарности по подвижным концам (выписывается только для подвижных концов отрезка интегрирования): Л<о=0^ -Ао/(*о) + it0 + L(t0)Hto) = 0, Л|,=0<^ Αο/(ίι) + Ux + /«(*,)*№) = 0. Необходимые условия экстремума в задаче с подвижными концами непосредственно будут вытекать из необходимых условий экстремума в задаче Лагранжа п. 6.2. 3.3. Пример г J(x(-),T) = f(x2 -z + l)dt-> extr; x(0) = 0. о
198 Глава 3. Вариационное исчисление Решение. Функция Лагранжа: τ Λ = Λ(χ(·),Γ) = ί Χ0(χ2 - χ + 1) dt + А,ж(0). о Необходимые условия экстремума: a) уравнение Эйлера для интегранта L = Л0(ж2 - χ + 1) d d -—L± + Le = 0 <=> -—2λ0χ - λ0 = 0 <=> -2А0ж - А0 = 0; ос ос b) трансверсальность по χ для терминанта I = Λιχ(0) f£*(o) = /,w, Г 2λοά(0) = λ|, 2λ0χ(Γ) = 0; с) стационарность по Τ (выписываем только для подвижного конца отрезка интегрирования) Ат = о «=> А0(ж2(Г) - х(Т) + 1) = 0. Если λο = 0, то из Ь) следует, что λ ι = 0 — все множители Лагранжа оказались нулями. Этого не может быть. Значит, λο Φ 0. Положим λο = 1. Тогда условия о)-с) преобразуются к виду -2х - 1 = 0, х(Т) = 0, х(Т) = 1. ί t2 Из первого уравнения следует, что χ = -- -Ь С\, χ = —-j + C\t -f С2. Поскольку ж(0) = 0, то С2 = 0. Неизвестные СЬГ определяются из условий Τ { χ(τ) = о, х(Т) = 1 -у+С,=0, т2 -—+ С,Т=1. 4 Отсюда находим, что Τ = 2, Cj = 1. Таким образом, в задаче имеется единственный допустимый экстре- / t2 \ мальный элемент £ = (£(·),!?) = (--j -И,2]. Покажем, что £ не доставляет локального экстремума, т. е. что в любой его окрестности существует другой допустимый элемент, на котором значение функционала J^ в точке ξ как больше, так и меньше значения функционала J в точке £. Действительно, возьмем допустимый элемент / t2 \ { = (*(.), Т) =(—+*, Tj. Тогда
§ 3. Задача с подвижными концами 199 '<«=/((-ИЧ-т+') + 1)*=/(т-'+2)*= о о Τ 2 =2 f (\- 1У dt> j&=2 f (\- 1У м о о при Τ > f и J (ξ) < J(() при Т < t, поскольку под знаком интеграла стоит неотрицательная функция. Найдем абсолютный минимум в задаче. Возьмем последовательность η элементов ξη = (χη(·),Γη) = (t,n); тогда J(£n) = /(2 - t)dt -» -оо при о η --► +оо, т.е. Smjn = -оо. Если вместо исходной задачи с подвижным правым концом Τ рассмотреть задачу с фиксированным концом Τ = Г0, то нетрудно вывести, что функция, доставляющая абсолютный минимум в новой задаче, существует (ее легко найти, решая задачу с фиксированным Г0) и абсолютный минимум в задаче будет конечным для каждого фиксированного То- При этом значение абсолютного минимума будет стремиться к -оо при Т0 —► -foo. Найдем абсолютный максимум в задаче. Возьмем последовательность ι элементов £п = (жп(-),!Гп) = (л*,1); тогда J(xn(-),T)==/(ra2-n£-|-l)<ft-»+oo о при η —► -boo, т.е. 5тах = +оо. Ответ. Допустимая экстремальная пара (£(·)»Г) = (~T+'»2j £ wlocextr, Smin = -оо, 5max = +oo. 3.4. Задачи с подвижными концами 1 3.1. /V<ft-+extr; х(\) = 1. о 3.2. f x2dt-2x2(l)-^zxtv; ж(0)=0. о 1 3.3. / (а2 + х) dt -+ extr; x(l) = 0.
200 Глава 3. Вариационное исчисление 2 3.4. (x2-x)dt->extr; х(0) = 0. о е 3.5. (tx2 + 2x)dt->zxtr, х(1) = 0. ι τ 3.6. [ x2dt-^ extr; x(0) = 0, Τ + ж(Г) + 1 = 0. о τ 3.7. f x2dt-> extr; x(0) = 0, (Τ - 1)ж2(Г) + 2 = 0. о г 3.8. I x*dt-> extr; ж(0) = О, Τ + ж(Г) = 1. о г 3.9. /(ж2 + ж) ей -> extr; ж(0) = 1. о τ 3.10. ({x2 + x)dt->txlr\ x(T) = T. о г 3.11. /(ас2 + х) dt -> extr; ж(0) = 0, ж(Т) = £. о г 3.12. Нх2 + x)dt-> extr; ж(0) = 0, х(Т) = Г. о τ 3.13. Нх2 + х + 2) ей-► extr; ж(0) = 0. о тг/4 3.14. А (ж2 - ж2) <й -♦ extr; x(0) = 1.
§ 3. Задача с подвижными концами Го 3.15. /(ж2 - ж2) ей-► extr; ж(0) = 0. о ж/4 3.16. / (ж2 - х2 + Ах cos t) dt -* extr; x(0) = 0. о Φ 3.17. / (χ2 - x2 + 4xsint)dt -* extr; я(т) = 0. I 3.18. / (ж2 + ж2 + 4ж sh t) dt -> extr; x(0) = 0. о I 3.19. f(x2 + x2 + 4xcht)dt->extr; ж(1) = 0. о ι 3.20. /(ж2 + ж2) dt - ж2(1) -► extr; ж(0) = 1. о To 3.21. f(x2 + x2)dt->txtr, ж(Т0) = £. о г 3.22. /(ж2 + ж2) dt -♦ extr; ж(0) = 0, ж(Г) + Τ + 1 = 0. о г 3.23. f(x2 + x2)dt->tyXr\ ж(Г) + Г-1 = 0. о г 3.24. / y/l+x2dt - extr; ж(0) = 0, Г2ж(Г) = 1. о /\/l 4· ж2 v J <ft^extr; ж(0) = 1.
202 Глава 3. Вариационное исчисление 3.26. / - dt — extr; х(\) = 1. о т / /-/1 ι χ2 dt -+ extr; x(0) = 1, x(T) = Γ - 1. 3.28. / xA±E_ dt _> extr; x(0) = 1, 2T + ж(Г) = 2. о 3.29. I xy/T+&dt -> extr; x(T0)=£. о 3.30. f (X[*X2 -X\Xi\dt-> extr; a?i(l) = ж2(1) = 1. о 3.31. [ (X{*X2 -x\x2)dt-*zxtr; ж,(0) = ж2(0) = 1. § 4. Изопериметрическая задача 4.1. Постановка задачи Изоперыметрической задачей в вариационном исчислении называется следующая экстремальная задача в пространстве Cl([to,t\]): и Jo(*0) = ] /о(«. *(«).*(*)) Л - extr; (P) ίο М*(')) = ffi(tMt)M*)) dt = оц9 i = 1, ·. · ,m, (1) ίο x(*o) = s0, ж(^)=жь (2) где <*|,..., ат — заданные числа (o?t· Ε R). Отрезок [ίο,^ι] является фиксированным и конечным, £0 < *ь Ограничения вида (1) называются изопериметрическими. Экстремум в задаче
§ 4. Изопериметрическая задача 203 рассматривается среди функций χ Ε Cl([to,t\]), удовлетворяющих изо- периметрическим условиям (1) и условиям (2) на концах; такие функции называются допустимыми. Определение. Говорим, что допустимая функция χ доставляет слабый локальный минимум в задаче (Р), и пишем ± Ε wlocminP, если существует δ > 0 такое, что J0(a?(·)) ^ Jo(£(-)) для любой допустимой функции ж, для которой \\х(·) - £(·)ΙΙ<7'(ί<ο,<ι]) < <*. 4.2. Необходимое условие экстремума Теорема. Пусть функция at доставляет слабый локальный экстремум в задаче (Р) (£ Ε wlocextrΡ), функции fi, fix, fa, i = 0,1,..., m, — непрерывны в некоторой окрестности расширенного графика Гх$ (fi, fix, fix € Тогда существует вектор множителей Лагранжа А = (A0,...,Am) Ε т Rm+1, λ Φ 0, такой, что для лагранжиана L = Σ λί/ί($, ж, ж) выполняется условие гладкости Lx £ Cl([to,t\]) и выполнено уравнение Эйлера -^-Lx(t) + Lx(t) = 0 V*e[Mi]. at Доказательство. Выпишем вариацию по Лагранжу функционала Ί J(x) = j f(t9x,x) dt, найденную нами при выводе необходимых условий к в простейшей задаче вариационного исчисления (п. 1.3) и л/(а(.),М·)) = f{fx(t)h(t) + fx(t)h(t))dt9 hecUlhM). to Рассмотрим следующее линейное отображение А функционального пространства Cd([£o,ii]) в конечномерное пространство Rm+I(.A:Co([£(h*i])-* Rm+I), действующее по формуле Ah=^Jo(±,h)JJ{(±,h),...96Jm(x,h)). Возможны два случая: 1) ImA Φ Rm+1, т. е. А — отображение на часть пространства Rm+I (вырожденный случай); 2) ImA = Rm+I, т. е. А — отображение на все пространство Rm+1 (невырожденный случай). 1) Вырожденный случай. Пусть \тАф Rm+I. Образ линейного пространства при линейном отображении является подпространством. Зна-
204 Глава 3. Вариационное исчисление чит, в этом случае Im А есть подпространство в Rm+1 размерности < га. Погрузим его в какое-нибудь подпространство размерности га (гиперплоскость). Следовательно, найдутся числа А0,...,Ат, не все равные нулю и такие, что m m ^λ^=0 Vz€lmA <=> Y^\ioJi(£,h) = 0 Vk € Ci([i0>ii]). Откуда из явного вида для 6Ji(£,h) имеем Дт τη ν Σ λ</»(')λ(0 + Σ)λί/.*(')Λ(0 )^ = 0 Vft € Ctf ([Mil). Тогда из леммы Дюбуа-Реймона следует, что для лагранжиана L = m л J2^ifi(t,x>x) выполняется условие гладкости L± Ε C{([to,t\]) и выпол- i=0 нено уравнение Эйлера --^(0+Ы0 = 0 Vi€[i0,i|]. 2) Невырожденный случай. Пусть Im^4 = Rm+1. Покажем, что невырожденный случай невозможен. Тем самым теорема будет полностью доказана. Возьмем е0 = (1,0,... ,0), ..., ет = (0,... ,0,1) — канонический базис в Rm+I. Поскольку образ отображения A lm A = Rm+1, то существуют функции Щ е Cq ([*o, *i ]) такие, что Ahj = е,, j = 0,1,..., га, то есть &/,·(£, Лу) = ^ ί 6ij — \ г{ -Ζ, / ~~ символ Кронекера J. Рассмотрим функцию F : Rm+I —► Rm+I, действующую по формуле • т т ч jpw = (jo(*+x;/iifci),...,j«(*+x;/iifci)). Нетрудно проверить, что в силу заданных условий гладкости функций /,♦ построенная функция F непрерывно дифференцируема в некоторой окрестности точки β = 0 и F(/3) = (Jo^),...,Jm(^))=(ao,ai,...,«m) = ^ («о := Jo(*))· Поскольку якобиан отображения F не равен нулю как определитель единичной матрицы (F'(0) = (^ii^fy))?1. 0 = I — единичная матрица), то по теореме об обратной функции существует обратное отображение F~{ некоторой окрестности точки ά в окрестность точки β = F~](a) = 0
§ 4. Изопериметрическая задача 205 такое, что \F-](a)-F~l(u)\<K\a-u\ ^ \F'l(a)\<K\a-a\ с некоторой константой К > 0. Возьмем а = α(ε) = (<*о + ε,«ι,... ,o?m) при достаточно малом ε и обозначим β(ε) = ^_1(α(ε)). Тогда F(P(e)) = α(ε), т.е. ^ i=o ' при этом ijr'Hl^JTIe-al «=► |/3(ε)|<ϋΓ|ε|. Получилось, что в любой окрестности экстремальной функции ± в пространстве С1^,^]) существует допустимая функция (а именно m *0 + ΣΑ'(ε)*ί("))> на которой значение функционала может быть и больше (при ε > 0), и меньше (при ε < 0) чем на А. Пришли к противоречию, что at не доставляет локального экстремума. Таким образом, случай 2) невозможен. ■ 4.3. Пример 1 1 J(x(.)) = J±2dt-+ extr; ί xdt = 0, χ(0) = 0, χ(\) = 1. ο ο Решение. Лагранжиан L = А0ж2 + Ajx. Необходимое условие экстремума — уравнение Эйлера для лагранжиана L d d -—Li + LX = 0 ^=^ -— 2X0x + Ai = 0 <=* -2X0x -b A, == 0. at at Если Α0 = 0,τολι = 0 — все множители Лагранжа — нули. Этого не может быть. Положим λ0 = 1/2. Тогда χ = λ ι. Общее решение этого дифференциального уравнения: χ = C\t2 + Cit + С3. Неизвестные константы Си Сг, Сз находим из условий на концах и изопериметрических условий: х(0) = 0 => С3 = 0, х(1) = 1 =► С\ + С2 = 1, 1 1 fxdt = 0=> f(Cit2 + C2t)dt = 0 => γ + γ = 0.
206 Глава 3. Вариационное исчисление Отсюда С\ = 3, Сг = -2. Таким образом, в задаче имеется единственная допустимая экстремаль at = 3t2 -2t. Покажем с помощью непосредственной проверки, что найденная допустимая экстремаль χ доставляет абсолютный минимум в задаче. Возьмем функцию h Ε ^([0,1]) такую, чтобы χ + Λ, была допустимой функцией. Для этого надо взять функцию h, такую, что h(0) = h(l) = 0 ι и fhdt = 0. о Тогда I 111 J(4(·) + h(·)) - J(±(·)) = f(k + h)2dt- f±2dt = 2 f khdt + I h2 dt ^ 0 0 0 0 1 (отбросим неотрицательное слагаемое Jh2dt и далее интегрируем по о частям с учетом условий на h) II II ^2 J xhdt>2 J £dh = 2£h\ -2 i'ahdt =-12 J hdt = Q. 0 0 0 0 Таким образом, разность всегда неотрицательна. Значит, имеем абсолютный минимум. I I Smin = J&2dt = J(6t-2)2 v9 36*3 24t2 11 v2<tf= — —+4i =12-12 + 4-4. 3 2 lo о о Очевидно, что 5max = -boo. Действительно, возьмем последовательность допустимых функций xn(t) = £(t) + nsin2nt, тогда J(xn(-)) —► -boo при η —> oo. Ответ. 3t2 - 2t e absmin, Smin = 4, Smax = +oo. 4.4. Задача Дидоны Одними из первых задач на отыскание наибольших и наименьших величин являлись изопериметрические задачи о нахождении замкнутой кривой, имеющей заданную длину и охватывающ>гк> наибольшую площадь, и о нахождении пространственной замкнутой поверхности, имеющей заданную площадь и охватывающей наибольший объем. Еще до Аристотеля (IV век до н.э.) было известно, что среди изопериметри- ческих (имеющих равную длину) кривых наиболее вместимой является окружность, а среди изопифанных (имеющих равную площадь) поверхностей — сфера.
§4. Изопериметрическая задача 207 Изопериметрическая задача содержится также в легенде о царице Дидоне. Описываемые события легенда относит к 825 году до н. э. Финикийская царица Дидона и с ней небольшая часть жителей города Тира, спасаясь от преследований, покинули родной город и в поисках счастья отправились на кораблях на запад вдоль берегов Средиземного моря. Выбрав на африканском побережье удобное место (нынешний Тунисский залив), Дидона и ее спутники решили основать здесь город. Эта идея не понравилась местным жителям, но все же финикийской царице удалось уговорить их предводителя Ярба, и он простодушно и неосторожно согласился уступить Дидоне клочок земли, «который можно окружить бычьей шкурой». Хитрая финикиянка, разрезав шкуру на тонкие ремни, связала их в один длинный ремень и, окружив им значительную территорию, заложила на ней город Карфаген. В память об этой истории карфагенская цитадель получила название Бирса (шкура). Из истории город Карфаген помнится нам еще войнами с Римом за обладание господством на Средиземном море (Пунические войны, III—II век до н.э.), которые завершились взятием римлянами Карфагена и его разрушением. Мы видим, что Дидона «решала» классическую изопериметрическую задачу о наибольшей вместимости. Естественно считать, что Дидона хотела сохранить выход к морю. Тогда мы получаем первую задачу Дидоны. Среди всех кривых длины I с концами на фиксированной прямой (прямолинейный берег), найти ту, которая ограничивает фигуру наибольшей площади. Формализованная задача имеет вид: г г J xdt-> max; ί у/\ + х1 dt = I, x(-T) = x(T) = 0 -τ -r (здесь Τ — подвижный конец). Эта задача относится к типу задач Ла- гранжа (см. §6). Давайте решим вторую задачу Дидоны, в которой оба конца кривой закреплены на прямой. Формализованная вторая задача Дидоны имеет вид: Го Го J xdt-+ max; / \/l + х2 dt = Ζ, χ(-Τ0) = χ(Τ0) = 0 -Го -Го (здесь Го — фиксировано). Это — задача, укладывающаяся в схему изо- периметрических задач п. 4.1. Приведем ее решение с помощью вариационного исчисления. Лагранжиан L = Xqx + Xy/\ Л-х1. Необходимое условие — уравнение Эйлера
208 Глава 3. Вариационное исчисление Если Ао — 0, то λ Φ 0 (не все множители Лагранжа — нули) и, значит, из уравнения Эйлера d Xx Хх = 0 =Ф , = const => χ = const. * y/ΐΛ-χ2 \/l + x2 Тогда из условий на концах и изопериметрического условия следует, что £ == 0, I = 2Т0. Если А0 φ 0, то положим А0 = 1. Тогда из уравнения Эйлера вытекает, что d Хх Хх _ — , = 1 <==* . =t + Cu dt V1 + χ2 V1 + χ2 Возведя последнее уравнение в квадрат, выразим х: ^ = (^С|)2 *=» AV = (f + C,)a(l W) ^ x2= J^%)2 *=» <^±= J * + С' ^dx= f + C»>d* =TdJx2-{t + C{)2. ±y/x2-(t+c{)2 ±^αμΓΓ^Ρ v v " Проинтегрировав по t полученное уравнение, имеем: χ + Сг = Τ\/λ2 - (t + C\)2 & (t+C\)2 + (x+Ci)2 = λ2. Это уравнение окружности. Из условий на концах ж(-Г0) = ж№) следует, что С\ = 0, т.е. *2 + (ж + С2)2 = А2. Неизвестные константы С2,А определяются единственным образом (Ас точностью до знака) из условия х(Т$) = 0 и изопериметрического условия. При 2То < I ^ 1гТо имеется единственная (с точностью до знака) экстремаль, являющаяся дугой длины I окружности, проходящей через точки (±Т0»0)> с центром на оси ж. Поскольку у нас задача на максимум, то мы выбираем экстремаль, лежащую в верхней полуплоскости. При I < 2Г0 в задаче нет допустимых функций, при I > ιτΤο нет допустимых экстремалей. Можно показать, что в этом случае рещением будет полуокружность радиуса Т0, «поднятая» на высоту (I - πΤο)/2 вместе с двумя вертикальными отрезками этой длины. 4.5. Изопериметрические задачи I 1 4.1. /V<tt-»extr; fxdt = 1, х(0) = х(\) = 0. о о 1 1 4.2. I x2dt-> extr; ί χ dt = 0, χ(0) = 1, χ(\) = 0.
§ 4. Изопериметрическая задача 209 ι 4.3. fx2dt-> extr; f xdt = 3, x(0) = 1, x(l) = 6. о о I I 4.4. J x2dt-+ extr; J txdt = l, x(0) = x(l) = 0. о о 1 1 4.5. J x2dt-+ extr; /ted* = 0, x(0) = 0, ж(1) = 1. о о 1 1 4.6. J x2dt^ extr; ftxdt = 0, ж(0) = -4, ж(1) = 4. о о 1 1 I 4.7. Аж2<Й -+ extr; I txdt = f xdt = 0, x(0) = 0, я?(1) = 1. 0 0 0 .1 11 4.8. [x2dt-+zm; ftxdt = 0, fxdt = 1, ж(0) = ж(1) = 0. О 0 0 1 I 1 4.9. [x2dt->zxtT; ftxdt = -29 fxdt = -|, ж(0) = 2, ж(1) = -14. О 0 0 4.10. / ж2<Й —► extr; / xcostdt = — ж(0) = 1, χ(π) = -1. о о 4.11. x2dt-^> extr; x$intdt = О, ж(0) = 0, ж(тг) = 1. о о 4.12. I xsintdt-^ extr; x2dt= —, ж(0) = Ο, χ(π) = π. о о 4.13. I x2dt —> extr; / ajcostfdtf = —, / a?sinJ<ft = π -f 2, ж(0) = 2, 0 0 0 ж(тг) = 0.
210 Глава 3. Вариационное исчисление ι ι 4.14. fx2dt->extr; /же"'it = е, ж(0) = 2е + 1, ж(1) = 2. о о I I 4.15. J x2dt-> extr; А же' it = 0, х(0) = 0, ж(1) = 1. о о 1 1 4.16. [ x2dt-+ extr; A же' it = 1, ж(0) = ж(1) = 0. о о 1 1 2 4.17. Пх2 + ж2) <tt -> extr; /же' it = ^-~-, »(0) = 0, ж(1) = е. о о ι ι - //* 1 — Зе 1 (ж2 + ж2) it -> extr; / же~' <ft = , ж(0) = 0, ж(1) = -. о о 2 2 4.19. / t2x2it -> extr; ftxit = -, ж(1) = 1, ж(2) = 2. ι ) 2 2 4.20. / *V it -+ extr; f xit = 2, ж(1) = 4, ж(2) = 1. ι ι 1 I 4.21. J χ2it -> extr; /я?2Л = 1, ж(0) = ж(1) = 0. о о 4.22. / (ж2 - ж2) it -► extr; / ж cos t it = 1, ж(0) = ж(тг) = 0. о о π/2 χ/2 4.23. / (ж2 - ж2) it -» extr; / ж sin * <tt = 1, ж(0) = ж(£) = 0. о о Го Го 4.24. / xy/\+x2it -♦ extr; / y/l+x2dt = Ζ, ж(-Г0) = ж(Г0) = 0. -Го -Го
§ 5. Задача со старшими производными 211 I 1 4.25. / х\х2 dt -+ extr; I x{dt = x2dt = 0, x{(0) = x2(0) = 0, *i(l) = l, *2(1) = 2.° 4.26. / x\x2 dt -* extr; / x\ dt = 1, I x2dt = 0, a?i(0) = a?,(l) = a?2(0) = 0, ar2(l) = 1. 1 1 1 4.27. / ±\x2 dt -+ extr; / tx\ <# = 0, / ta2 <ft = 0, *i(0) = *i(l) = X2(0)=0, ap2(l) = 1. 2 I 4.28. (xi+x2)dt -> extr; / сМг*** = 0,a?i(0) = x2(0) = 0, a?i(l) = 1, *2(1) = -3. 4.29. / t(x\ - ж2) Л —► extr; / άιά2 dt = --, a?i(0) = a?2(0) = a?2(l) = 0f *,(1) = 2. § 5. Задача со старшими производными 5.1. Постановка задачи Задачей со старшими производными в вариационном исчислении называется следующая экстремальная задача в пространстве Cn{[t^t\])\ J(*{-)) = /L(*>*(').*(*)> *(')> ■ · · ·χΜ(*)) dt -+ extr» (p) x{k)(tj)=xkj, fc = 0,l,...,n-l, j=0,l. (I) Здесь интегрант L = £(£, ж, ж,..., a^) — функция п+2 переменных. Отрезок [t09t\] является фиксированным и конечным, tQ < t{. Экстремум в задаче рассматривается среди функций χ Ε Cn([to,ti])9 удовлетворяющих условиям на концах (1); такие функции называются допустимыми. Определение. Говорим, что допустимая функция χ доставляет слабый локальный минимум в задаче (Р), и пишем χ Ε wlocminP, если существует
212 Глава 3. Вариационное исчисление δ > 0 такое, что J(x(·)) ^ J(&()) для любой допустимой функции ж, для которой ||ж(·) - £(-)11с"([*о,*.])5) < δ· 5.2. Вывод уравнения Эйлера—Пуассона с помощью леммы Лагранжа Теорема. Пусть функция χ доставляет слабый локальный экстремум в задаче (Р) (£ Ε wlocextrP), функции L,LX,L±,... >Lx{n) — непрерывны в некоторой окрестности расширенного графика Гхх^) 6\ (L, LXi..., Lx(*) £ С(0(Гхх_х(п))))9 Lx(k) € C*([*o,*i]), * = 1,... ,η. Тогда выполнено уравнение Эйлера—Пуассона έ(-1)'^Γ^(<) = 0 Vi€[io,ii]. jfe=0 При η — 1 уравнение Эйлера—Пуассона совпадает с уравнением Эйлера. При η = 2 уравнение Эйлера—Пуассона выглядит следующим образом: |j£,(0-j£*(0 +£.(«) = о. Доказательство. Будем выводить уравнение Эйлера-Пуассона методом вариаций. Вычислим вариацию по Лагранжу функционала J. Возьмем произвольную, но фиксированную функцию h Ε Οζ([ίο9ί\])7\ Поскольку χ Ε wlocextrP, то функция одного переменного φ(Χ) := J(± + Xh)= f L(t9 * + Afc, * + Afc,... f ±(n) + Afc(n)) ctt ίο имеет экстремум при А = 0. Но тогда по теореме Ферма φ'(0) = 0. Дифференцируя функцию φ и полагая А = 0, получаем <p'(0) = 6J(x9h)= f(Y^Lxi4t)h{k\t))dt = 0 Vft€Cj([io,ii]). (1) Проинтегрируем по частям А: раз каждое слагаемое в соотношении (1): J Lxik)h{k)dt = j L^dh^ = £^(ί)*(*'Ι,(ί)||Ι - Ыи'Ы^ = 5) Ну11с-(|м»]) ·'= max{lMlc([io,iji)» liylic([<o,ii])"--lly(n)iic([io,i.])}· 6) A*...*« := {(«·*W.±W. ·-·.*(n)W) € Rn+21 * € [fa,«ι]}. ^Cj([itt,<i])={*€C"([itt,<i]) | Λ<*)(ίο) = *<*>(<,) = 0, * = 0,1,·...»-!}.
§ 5. Задача со старшими производными 213 (свободные члены интегрирования по частям равны нулю, поскольку h e C0n([*o,*i]) и, значит, ft«(i0) = к{к)(и) = 0, к = 0,1,... ,п - 1) -/(~^>-в«--/(н>·^)»*· ίο *о Тогда соотношение (1) перепишется в виде 6J(jt,h) = /(έί-1)1^)/»* = 0 Vft € C?(fe,t|]). *. ^*=° Отсюда по основной лемме вариационного исчисления (лемме Лагранжа8*) п. 1.2 следует выполнение уравнения Эйлера—Пуассона. ■ 5.3. Вывод уравнения Эйлера—Пуассона с помощью леммы Дюбуа-Реймона В этом пункте мы выведем уравнение Эйлера—Пуассона для меньших условий гладкостей, наложенных на интегрант L. Вместо леммы Лагранжа будем использовать обобщенную лемму Дюбуа-Реймона. Теорема. Пусть функция χ доставляет слабый локальный экстремум в задаче (Р) (£ G wlocextrP), функции L,LXiLXi...,Lxto — непрерывны в некоторой окрестности расширенного графика ГххЛ{%), (i,£„...,£,(.) 6 C(0(r^tjW))). Тогда функции Ьх(п), -— L&) + £,<.-», at —— [ --τ:-£*<·> + -£ж(»-1) 1 + Ar<i»-2),... непрерывно дифференцируемы на от- at \ at / резке [to,t\) и выполнено уравнение -|(-(-г(-гА-"+х-^°) +**-) -) +t-°- Если Lx(t) G C*([io,*i]), fe = 1,...,п, то полученное уравнение совпадает с уравнением Эйлера—Пуассона. Доказательство. Возьмем произвольную, но фиксированную функцию h € C£([<o,<i]). Поскольку £ е wlocextrP, то функция одного *) В формулировке леммы Лагранжа вместо пространства CO([io,*il) можно было взять пространство СУ([$о,*|])> а при доказательстве соответственно взять функцию /,(«) = {<*" го)п+,(<-г,)в+', t е[го,т,], *£h>,il·
214 Глава 3. Вариационное исчисление переменного φ(Χ) := J(£ + АЛ) = ί L{t, at + АЛ, £ + АЛ,..., £(η) + ΑΛ(η)) dt имеет экстремум при λ = 0. Но тогда по теореме Ферма у?'(0) = 0. Дифференцируя функцию φ и полагая А = 0, получаем Л7(*,Л) = [(f^L^h^dt^O VheCSdtoJt)). (1) Здесь мы не можем, как в предыдущем случае, брать интегралы по частям, поскольку не задана дифференцируемость функций £ж«. Обобщенная лемма Дюбуа-Реймона. Пусть ак() G C([*o,*i]) ы ίο k*=° ^ , ± d did \ Тогда функции αη, -~-αη+αη_ι, --- Ι -—αη+αη_ι Ι +αη_2,... непрерывно дифференцируемы на отрезке [to, t\] и выполнено уравнение (аналог уравнения Эйлера—Пуассона) -Ι(···("^("1αη+αη-)+αη-2) )+αο=°· Из обобщенной леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. ■ Доказательство леммы. Рассмотрим следующую систему из η линейных дифференциальных уравнений: ( -ро + а0 = 0, β) Эта система легко решается с помощью последовательного интегрирования уравнений, начиная с первого. При этом непрерывно дифференцируемая функция ρη_ι определена с точностью до многочлена степени η - 1. Подберем этот многочлен таким образом, чтобы шщ функции ρη-ι выполнялись условия J{U - т)к(рп-{(т) - an(r))dr = 0, к = 0,1,... , η - 1. (3)
§ 5. Задача со старшими производными 215 Рассмотрим функцию й, определяемую по формуле t h{t) := (~1)ί/(*-т)""ЧМт) -Λ-ι(τ))ίτ. Из определения функции h вытекает, что к = 0,1,...,η - 1. Кроме того в силу условий (3) htk\t\) = О, к = 0,1, ... ,п - 1. Значит, h Ε Cq ([*о>Μ)· Тогда для h по условию леммы 0=/ (Σ a»~h(k))dt=/ (Σ *rw+а»й(п))d<= to ~~ to ~~ (подставим из системы (2) ак = ри +Рк-\ и соотношение ап = рп-\ + ϊ№) гП-\ П-\ = /(Σ?*^+Σ>&(*+1)+&n))2)dt=jjt (i>&(k))<*<+ Из полученного равенства 0 = f(h^)2dt следует, что ft*n* = 0. Отсюда ίο ап = jpn-i· Поскольку из системы (2) вытекает, что все функции рк непрерывно дифференцируемы, то ап = pn_i Ε C!([£o,*i]). Выразим рп_2 из последнего уравнения системы: ρη_2 = -ρη-ι4-αη_ι = -άη + αη_ι (отсюда вновь следует, что -άη + αη_ι € С1^,^])) и подставим в предпоследнее. Проводя эту процедуру для рп-з,.. · ,JPo, придем в итоге к непрерывной дифференцируемости остальных, указанных в лемме функций и справедливости дифференциального уравнения. ■ 5.4. Пример 1 J(x(<)) = fx2dt-+ extr; х(0) = ж(0) = х(\) = 0, ж(1) = 1. о Решение. Интегрант: L = ж2.
216 Глава 3. Вариационное исчисление Необходимое условие — уравнение Эйлера—Пуассона Общее решение уравнения Эйлера—Пуассона: χ = C\t3 Л-Сг^Л-С^ + С^. Неизвестные константы C\yCibCy,C^ находим из условий на концах х(0) = о =» С4 = 0; х(0) = 0 => С3 = 0; Г*(1) = 0, ГС,+С2 = 0, ГС, = 1, \*(1)=1, \3Ci + 2C2=l, IC2 = -1. Таким образом, единственная допустимая экстремаль χ = £3 - t2. Покажем с помощью непосредственной проверки, что функция at доставляет абсолютный минимум в задаче. Возьмем функцию h Ε С2([0,1]) такую, чтобы функция χ + h была допустимой. Для этого надо взять функцию Л, для которой h(0) = h(l) = /ι(0) = /&(1) = 0. Тогда 1 I I I I J(*+fc)-J(4) = i(&+h)2dt- / xdt = 2 [hhft+ jh2dt > 2 jkhdt 0 0 0 0 0 Дважды интегрируя по частям с учетом условий на Л, получим I 1 J(£ + h)-J(£)^2 f&dh = 2&h\l -2 fat{3)hdt = о о I I = -2 f *ly)dh = -2&ly)h\l +2 [at{4)hdt = 0. о о Таким образом, разность всегда неотрицательна, то есть имеем абсолютный минимум ι ι ι Smin= I £2dt= f(6t-2)2dt= /(36*2-24Й-4)сй= 12ί3-12ί2+4ί |' =4. 0 0 О Очевидно, что 5тах = -foo. Действительно, возьмем последовательность допустимых функций xn(t) = £(t)+nt2(t-1)2, тогда J(xn()) —> +00 при η -* оо. Ответ, *3 - t2 e absmin, Sabsmin = 4, 5absmax = +oo.
§5. Задача со старшими производными 217 5.5. Задачи со старшими производными ι 5.1. /a2<tt — extr; x(0) = х(0) = х{\) = О, х(\) = 1. о 1 5.2. /x2dt — extr; x(0) = ж(1) = х(\) = 0, ж(0) = 1. о 1 5.3. /Vctt — extr; ж(0) = ж(1) = 0, х(0) = -1, ж(1) = 1. о ι 5.4. ί(χ2 - 48ж) ей — extr; ж(0) = x(l) = ж(0) = ж(1) = 0. о 1 · 5.5. ί(χ2 - 48ж) ctt -+ extr; x(Q) = 1, х(0) = -4, я?(1) = А(1) = 0. о I 5.6. /(48» - х2) dt -+ extr; x(0) = *(0) = 0, х(\) = 1, *(1) = 4. о I 5.7. /(24ta - χ2) dt — extr; x(0) = *(0) = х{\) = 0, *(1) = —. о 1 5.8. ί(χ2 - 2Atx) dt -> extr; x(0) = *(0) = 0, x(\) = -, *(1) = 1. о к 5.9. Ι {χ2 - χ2) dt -> extr; x(0) = x{ir) = 0, *(0) = 1, χ(τ) = -1. о к 5.10. / (χ2-χ2) dt -+ extr; ж(0) = 0, ж(0) = 1, χ(ιτ) = sh7r, ж(тг) = eh*. о 5.11. (x2-x2)dt-+zxtr; x(0) = ж(0) = 0, ж(тг) = ch*+l, *(ir) = shir.
218 Глава 3. Вариационное исчисление 5.12. / (χ2-χ2) dt -> extr; x(0) = х(0) = 0, х(ж) = shir, χ(π) = ch7r+l. о τ/2 5.13. /(ж2 - x2)dt -> extr; ж(О) = ж(О) = ж(|) = О, ж(|) = 1. о τ 5.14. / (ж2 + Ах2) dt -► extr; ж(О) = s(O) = ж(тг) = О, x(ir) = shir, о π 5.15. (x2 + 4x2)dt-*zxtr\ а?(0) = -1, ж(0)=0, a?(7r) = ch7r, x(n)=shir. о π 5.16. / (χ2 + 4ж2) <ft -► extr; ж(О) = ж(О) = χ(π) - О, ж(тг) - shir, о π/2 5.17. /(ж2 - x2)dt — extr; x(0) = *(0) = 1, ж(|) = |, i(^) = 0. о τ/2 5.18. /(ж2 - χ2) dt-+ extr; x(0) = *(0) = i(^) = 0, jc(^) = 1. о 5.19. J (χ2 - ж2) <ft -> extr; x(0) = *(0) = x(ir) = Ο, χ(π) = 1. о I 5.20. f(x2 + x2) dt -+ extr; x(0) = 1, *(0) = 0, ac(l) = ch 1, *(1) = sh 1. о I 5.21. f(x2 + x2) dt -> extr; x(0) = 0, *(0) = 1, x(\) = аЦ 1, *(1) = ch 1. о I 5.22. J е~гх2dt — extr; ac(0) = 0, x(0) = 1, ac(l) = e, *(l) = 2e.
§ 5. Задача со старшими производными 219 ι 5.23. J e~lx2 dt -+ extr; x(0) = х(0) = 1, х(1) = х(\) = е. о е 5.24. MS2 Л -> extr; х(1) = 0, *(1) = 1, х(е) = е, ж(е) = 2. ι е 5.25. ft2x2dt — extr; ж(1) = 0, х(е) = ж(1) = 1, а(е) = -. ι е 5.26. /Va2ctt-extr; ж(1)= 1, ж(е) = -, 4(1) = -1, ж(е) = -4т. У ее2 ι ι 5.27. f(t + l)x2 dt — extr; ж(О) = ж(О) = О, ж(1) = 1, х(\) = 2. о 1 5.28. f(t+\)2x2dt — extr; ж(О) = О, ж(1) = 1п2, ж(О) = 1, х(\) = ~. о е 5.29. Α(ί + 1)*х2 ей -» extr; x(l) = О, х(1) = 1, х(е) = е, х(е) = 2. ι ι 5.30. f(t+l)3x2dt -» extr; х(0) = 1, х(1) = I х(0) = -1, х(1) = -^. о 1 5.31. /(ж(3))2 dt -» extr; х(0) = х(0) = х(0) = 0, х(1) = 1, х(1) = 3, о х(1) = 6. 1 5.32. /(х(3))2 dt -► extr; x(0) = х(0) = х(0) = 0, х(1) = 1, х(1) = 4, х(1) = 12. ι 5.33. Мх<3))2 dt -» extr; x(0) = х(0) = х(0) = х(1) = х(1) = 0, х(1) = 2.
220 Глава 3. Вариационное исчисление ι 5.34. f(x{i))2dt — extr; х(0) = х(0) = х(0) = х(1) = х(1) = 0, х(1) = 1. о I 5.35. /((х(3))2 + х2) dt — extr; х(0) = х(0) = 0, х(0) = 1, х(1) = ch 1, x(l) = x(l) = shl. π/2 5.36. / ((х(3))2 - χ2) dt -+ extr; x(0) = x(0) = χ (|) = 0, о x(|)=x(0) = x(f) = l. 5.37. / ((ж(3))2 - χ2), dt -♦ extr; x(0) = x(0) = x(0) = χ(π) = 0, о х(тг) = тг, χ(π) = 2. 7Γ 5.38. [ ((χ{3))2-χ2) dt-> extr; ж(0) = ж(0) = ж(0) = 0, aj(7r) = E(7r) = sh7r, о £(π) = chir-b 1. §6. Задача Лагранжа Все задачи, изученные нами в предыдущих пунктах, являются частными случаями или могут быть сведены к задаче (мы сформулируем ее чуть позже), поставленной Лагранжем в сочинении «Аналитическая механика» в 1788 году. Для ее решения Лагранж использовал метод неопределенных множителей, который впоследствии стали называть методом множителей Лагранжа. Впрочем этот метод не был им аккуратно обоснован, и понадобилось более ста лет для того, чтобы придать рассуждениям Лагранжа вид строго доказанной теоремы. 6.1. Постановка задачи Задачей Лагранжа называется следующая экстремальная задача Я0(£) - min; Bi($ < °> г = 1,..., m', Bi(€) = 0, < = m' + l,...,mf (Ρ) xa(t)-<p(t,x(t))=0 V*GA, (1)
§ 6. Задача Лагранжа 221 где ξ = (»(·),ίο,ίι), s(·) 6 (7!(Δ, RB), t0,ti ^Δ,ί0< «ι, Δ - заданный конечный отрезок, «ι Bi(0= /Λ(*,»(*).*(*))Λ + '*(*ο,β(*ο),*ι,β(*ι)), i = 0,l,...,m. Условие (1), называемое дифференциальной связью, может быть наложено не на все координаты вектор-функции х(-) = (а?|(·),... ,жп(·)), а только на некоторые, для определенности на первые к координат: &i(t) -(pi(t,x(t)) = 0, г = l,...,fc. Обозначим далее χ = (жа,ж^), где я<х = (#1,..., Хк), хр = (ж*+ь..., ж„). Если дифференциальная связь отсутствует, то fc = 0 и χ = яр. Поскольку вместо ха в функции fi{t,x,x) можно подставить из (1) равное ему выражение <p(t,x), то в дальнейшем считаем, что Λ = /·('* *>fy)· Частным случаем задачи (Р) является задача, в которой один из концов £о или t\ — подвижный, а другой закреплен или оба конца отрезка интегрирования [*ο,*ι] фиксированы. Элемент £, для которого выполнены все указанные условия и ограничения задачи, называется допустимым. Определение. Говорим, что допустимый элемент ξ = (£(-)»?o»fι) доставляет слабый локальный минимум в задаче Лагранжа (Р), и пишем ξ € wlocminP, если существует δ > О такое, что Bq(£) ^ -^ο(ί) Для любого допустимого элемента £ = (&(-)> *о>£|)> для которого IK-IW)xr><* <=» (Ν·)-*(·)ΙΗδ)<*. Ιίο-foK*, Ι«ι-ίιΙ<*). 6.2. Необходимые условия экстремума Теорема Эйлера—Лагранжа. Пусть элемент ξ = (£(·), £ο>ίι) доставляет слабый локальный минимум в задаче Лагранжа (Ρ) (ξ Ε wlocminP), функции fi, fix, fιέ непрерывны в некоторой окрестности расширенного графика Гйё := {(ί,*(ί),4(ί)) I * € Δ} (/« i = 0,1,...,m, функции φ,φχ непрерывны в некоторой окрестности графика Г& := {(*,£(<)) | < 6 Δ} (р,р* € С(0(Г4))), функции U непрерывно дифференцируемы в некоторой окрестности точки (to,£(io),t\,£(t\)) (k € C{ (θ(ίο,£(ίο)9i\,&(i\)))), i = 0,1,...,m (условие гладкости). Тогда найдутся множители Лагранжа (А,р) Ε Rm+I x Cl(A,Rk)9 А Ф 0, такие, что для функции Лагранжа и Λ(4(·),Μι)=/ (/(«,х,*^)+р(«)(*в-^*)))Л + и'о»*('о),«ь*(«|)), ίο
222 Глава 3. Вариационное исчисление где т т f(t,x,xp) = Σ λι7«('»3.*0). Ι = 5D АЛ(«о,я?(*о),*ь«(*|)) i=0 i=0 — терминами, выполнены условия: a) стационарности по х() — уравнение Эйлера для лагранжиана L(t,x,x) = f(t,x,xp) +p(xa - у(*,»)) ^ Л ί-ρ(*)-ρ(*)^.(*)+Λ.(*)=ο, Л \ -г/^(0-р(*)М)+/^(«)=о; b) трансверсальности по χ bi(i0)= Ц*0) "^ W /1ч f £*(£ι) = -ί*(«ι) c) стационарности по подвижным концам (выписывается только для подвижных концов отрезка интегрирования) Λί0 = 0 <=» -/(ί0) + ίίο -l· t(io)4(fo) = О, Αι, = ο ^=> /(ίο + ft, + ?*«,>*(* ι) = ο; d) дополняющей нежесткости ΑΑ·(9 = 0, i=l,...,m'; e) неотрицательности Xi ^0, i = 0, 1,...,т'. Доказательство теоремы Эйлера—Лагранжа основано на правиле множителей Лагранжа для гладких задач с ограничениями типа равенств и неравенств в нормированных пространствах (глава 1, п. 8.2). Поскольку равенство Bt = 0 можно заменить двумя неравенствами В{ < 0, -В( < 0, то в дальнейшем для простоты записи считаем, что у нас имеются только ограничения типа неравенств и га' = га. Покажем, что все условия теоремы о правиле множителей Лагранжа в полученной задаче Βο(ί)-ηιίη; BifcKO, i=l,...,m, F(t) = 0. (Ρ) выполняются. Здесь X = C!(A,Rn) x R2, Υ = C(A,R*). Это банаховы пространства — условие банаховости выполняется.
§6. Задача Лагранжа 223 Из непрерывной дифференцируемое™ функций в теореме Эйлера— Лагранжа следует, что функционалы В{ :I-+R, г = 0,1,... ,га, и отображение F : X -► У, F(£) = F(*(-),*o,*i) = **(0 - ¥>(*>*(*)), строго дифференцируемы в точке ξ — условие гладкости выполняется. Ослабленное условие регулярности — условие замкнутости образа оператора F'(£) выполняется, так как ImF'(f) = Υ = C(A,R*) —- замкнутое пространство. Действительно, ί"(ί)[Λ(·),τ0,τ,] = h(t) - ipXa(t)h(t), а система линейных дифференциальных уравнений с непрерывными коэффициентами h(t)-(pXa(t)h(t) = y(t) (1) имеет решение для любого у(-) € С(Д,К*), определенное на всем отрезке Δ, с любым граничным условием в форме Коши Λ(ί0) = 7· Таким образом, lmF*(£) = С(Д,К*) — замкнутое пространство. Все условия теоремы главы 1 п. 8.2 выполняются. Согласно этой теореме существуют вектор A = (A0,Ai,...,Am)E Rm+I и функционал у* GF* не равные одновременно нулю и такие, что для функции Лагранжа m НО = Σ>*(ί) + <у*,.р«)> = Α(χ(.),ίο,<ι) = t=0 h выполняются условия: а') стационарностиЛ^=0<=>АХ=0 (^ЛЖв=0, Λ^=θ), Λίο=0, Л*, =0; b') дополняющей нежесткости: Л,-£,'(£) = 0, t = 1,... ,т; с') неотрицательности: At ^ 0, г = 0,1,... ,т. Покажем, что из уравнения Л^ = 0 следует существование функции ρ е C](A,Rk) такой, что <»*>»(·)> = fnt)y(t)dt Vy€C(A,R*) h и для которой выполняются условия а)-Ь) теоремы Эйлера—Лагранжа. Тогда Λ = Λ и теорема будет доказана. Уравнения Эйлера и условия трансверсальности по Χβ будут вытекать из условия стационарности функции Лагранжа Апож^. Они выводятся как и для задачи Больца.
224 Глава 3. Вариационное исчисление Распишем условие стационарности Л по ха: ЛЖл=0<=* AXa[h] = Q VheCl(A,Rk) ίο Отсюда в силу соотношения (1) ft <»%»(■)> = -//«.*«-k(«7-^(*,)Μίι) VyGC(A), V7GR*. (2) Определим функцию ρ из условий: -ДО) - *(*)&.(*) + /*(*) = о, p(fi) = 4β(ω· (з) По теореме существования и единственности решения задачи Коши для линейной неоднородной системы [АТФ, с. 191] функция ρ Ε C](A,Rk) определяется нашими условиями однозначно. Тогда уравнение Эйлера по ха и условие стационарности по ха в точке i\ будет выполняться. В силу соотношений (3) и (1) имеем: ft ft J l{ph)dt = p(ti)h(tl)-p(io)h{i0) = J(ph + ph)dt = to to i, i, = I (fxah - p<pXah + py + pipXah) dt = J (fx„h + py) dt. h к Находя из последнего соотношения J fXahdt и подставляя полученное ίο выражение в (2), получим (3) (У*М)) = fpydt-piiMi^+pihWo) -ϊΧαΜΊ W;„(i,)ft(ii) ίο ίι = jpydt+l(p{io) -LM) Vy € С(Д,Н*), V7 € R*
§ 6. Задача Лагранжа 225 Поскольку функция у(-) и вектор η определяются независимо, то значение функционала (у*,у(-)) не зависит от 7» и, значит, коэффициент при 7 должен обращаться в ноль. Откуда следует, что <»*.»(■)> = /р(0»(0*> ptfo) = W Таким образом, Λ = Λ. Теорема полностью доказана. ■ 6.3. Примеры 1 1 Пример 1. J(x(-)) = x2dt -+ extr; / ж<й = О, x(l) = 1. о о Решение. Выписанная задача не является изопериметрической задачей, поскольку не задано граничное условие функции ж(·) в нуле. Задачу надо решать как задачу Лагранжа. Функция Лагранжа: ι Л= /(А0ж2 + А,ж)^ + А2(ж(1)-1). о Необходимые условия: a) уравнение Эйлера для лагранжиана L = А0ж2 + Х\х d -—Ιέ + Lx = 0 <ί=> -2А0ж + λ| = 0; at b) трансверсальность no χ для терминанта I = \г(х{\) - 1) Ы0) = l,№, Li(l) = -/*(1) <=» 2А0ж(0) = 0, 2А0ж(1) = -А2; Если А0 = 0, то из а) А| == 0, а из Ь) А2 = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда χ = Х\. Общее решение: χ = C\t2 -f С2£ + С3. Неизвестные константы СьС^Сз находим из условия трансверсальности х(0) = 0, условия на конце в единице и изопериметрического условия: х(0) = 0 =» С2 = 0, ГС,+С3 = 1,
226 Глава 3. Вариационное исчисление Отсюда С\ = 3/2, Сз = -1/2. Таким образом, в задаче имеется единственная допустимая экстремаль £ = (3t2 - 1)/2. Покажем с помощью непосредственной проверки, что функция £ доставляет абсолютный минимум в задаче. Возьмем функцию h Ε С1 ([0,1]) такую, чтобы χ + h была допустимой функцией. Для этого надо взять ι функцию Л, для которой h(\) = 0 и Jhdt = 0. Тогда о 1 1111 J(a+fc)-J(£)= f(£+h)2dt- f&2dt = 2 f$hdt+ f h2dt^2 f&h ft. Интегрируя по частям с учетом условий на h и условия трансверсальности ж(0) = 0, получим 1 I I J(x + h) - J(*) ^2 J £dh = 2£h\{ - 2 /*ЛЛ = -6 /fctf = 0. 0 0 0 Таким образом, разность всегда неотрицательна, то есть имеем абсолютный минимум. II 1 3 Smm = f xdt = J(3t)2dt = jtfdt - у [ = 3. 0 0 О Очевидно, что 5max = Н-оо. Действительно, возьмем последовательность допустимых функций xn(t) = £(t) -f nsin2irt, тогда ι J(xn(·)) = Ι (#(0 + ra27rcos27r£) dt -> +oo при η —► +oo. о Ответ. (3t2 - l)/2 e absmin, 5min = 3, 5max = -boo. ι Пример 2. x2dt-* extr; x(0) = x(0) = 0, x(l) = 1. о Решение. Выписанная задача не является задачей со старшими производными, поскольку не задано значение производной функции х(·) в единице. Задачу надо свести к задаче Лагранжа, вводя вместо функции χ вектор-функцию (жьж2), и обозначения: х\ = ж, х2 = ж. Тогда исходная задача сведется к задаче Лагранжа: ι I x\dt->tx\.x\ Si=a?2, ж,(0)=0, ж2(0)=0, хх(\) = 1.
§ 6. Задача Лагранжа 227 Функция Лагранжа: ι Λ = ί(λ0χ2 +ρ(0(*ι - x2)) dt + ΑιΖι(Ο) + А2ж2(0) + A3(a?i(l) - l). о Необходимые условия: a) система уравнений Эйлера для лагранжиана L = XQxl + р(х\ - Хг) d d at at b) трансверсальность no χ для терминанта I = AiEi(O) + A2a?2(0) + λ3(*ι(1)-ΐ) £*,(0) = i«l(o), Jbil(l) = -i«,(i) *=* P(°) = Ait J>0) = -*3, £*2(°) = ti(o), i*2(l) = -l«2(i) <^ 2A0x2(0) = A2, 2A0*2(1) = 0; c) неотрицательность λ0 ^ 0. Если λο = 0, то из а) следует, что р = 0, а из Ь) λι = λ2 = λ3 = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда из а) χψ = 0 & х(А) = 0. Общее решение: χ = С χ t3 + C2t2 + Сз* + CA. Неизвестные константы С|,С2,С3,С4 находим из условия трансверсальности ж2(1) = 0<£>ж(1) = 0 и условий на концах: ж(0) = 0 => С4 = 0, ж(0) = 0 => С3 = 0, Г*(1)=1, ^^ ГС,+< \*(1) = 0 ^ \6Ci + С2 = 1, 2С2 = 0 ^^ Ч «4 Таким образом, в задаче имеется единственная допустимая экстремаль± = -t3/2 + 3t2/2. Покажем с помощью непосредственной проверки, что функция χ доставляет абсолютный минимум в задаче. Возьмем функцию h Ε С2([0,1]) такую, чтобы ± + h была допустимой функцией. Для этого надо взять функцию h, для которой h(Q) = h(\) = h(0) = 0. Тогда для функционала ι J(x(-)) = / χ2 dt имеем о I 1111 J{jb+k)-J(*) = f(&+h)2dt- J &2dt = 2 f £hdt+ fh2dt ^ 2 f Ahdt.
228 Глава 3. Вариационное исчисление Интегрируя дважды по частям с учетом условий на функцию h и условия трансверсальности х(\) = 0, получим ι ι ι J(x+h)-J(±)^2 f&dh=2±h\[-2 ί±{3)каЬ=-2х(3)^\2 ίx{4)hdt^0. 0 0 О Таким образом разность всегда неотрицательна, то есть имеем абсолютный минимум. ι ι ι 5min= Jx2dt= f(-3t + 3)2dt = 9[(t2-2t + l)dt = 3t3-9t2 + 9t\l=3. 0 0 О Найдем абсолютный максимум в задаче. Возьмем последовательность допустимых функций xn(t) = &(t) -f nt2(t - 1); тогда ι J(xn()) = / (£(*) + n(6*--2))2<ft--*+oo при п->+οο, т.е. Smax = +oo. о t3 3t2 Ответ. -— + — e absmin, Smin = 3, 5max = -boo. 6.4. Вывод уравнения Эйлера—Пуассона из теоремы Эйлера—Лагранжа Вернемся к задаче со старшими производными: «ι J(x()) = У* JD(*. а?(*). *(*). *(*). - - -. ж(я>(*)) Λ -> extr; (P) x(k)(ti) = *kj. * = 0,1,...,п-1, j =0,1. (О Теорема. Пусть χ Ε wlocextrP, функции L9LX9 £*,..., £ж<·) — яе- прерывны в некоторой окрестности расширенного графика «Г*$...$w. 7Ьгйа функции Lx(n), -—Lx(n) + Lx{n-\), "-^ΐί - 37^s(n) + £*<»-0 J + ifc<«-2),. . · непрерывно дифференцируемы на отрезке [to,t\] и выполнено уравнение -!(··· (" 1(- г^+^0 +*■") ···)+t*=°·
§ 6. Задача Лагранжа 229 Доказательство. Приведем задачу со старшими производными к задаче Лагранжа, сделав замену переменных ж* = х^к"{\ к= 1,... ,п, *1 £r(i,a?i,a?2,... ,a?n,arn)di -~> extr; хк =я?*+ь fc = 1,...,п- 1, «О Xk(tj) = xk-\j, fc=l,...,n, J =0,1. / (Ρ') Здесь переменной является вектор-функция (х\9...9хп). Поскольку функция at доставляет локальный экстремум в задаче со старшими производными (Р), то вектор-функция (х\9...9хп) доставляет локальный экстремум в задаче Лагранжа (Р'). Выпишем согласно теореме Эйлера— Лагранжа необходимые условия стационарности для лагранжиана п-1 £ = ХцЩ9х\9х29... ,a?n5*n) + 2jpjfe(*jfc -ж*+|). к=\ Терминальную часть функции Лагранжа, а также остальные необходимые условия экстремума, не играющие существенной роли в задаче с закрепленными концами и фиксированным отрезком интегрирования, не выписываем. Система уравнений Эйлера: . [ -Р\ + λ0ίβ| = °> й ~ ~ I ^ Если A0 = 0, то из системы уравнений Эйлера следует, что рп-\ = · · · = Р\ = 0. Все множители Лагранжа — нули. Пусть Ао ^ 0. Положим Ао = 1. Выразим ρη_ι из последнего уравнения и подставим в предпоследнее; проводя эту процедуру для ρη_2,... ,ρι, придем в итоге к уравнению Эйлера—Пуассона. ■ 6.5. Задачи Лагранжа 1 1 6.1. x2dt-+em; ixdt = l. о о ! 1 6.2. / х2 dt -> extr; / ж ctt = 1, x(0) = 0. о о 1 I 6.3. x2dt-+ extr; txdt = l9 x(0) = 0.
230 Глава 3. Вариационное исчисление ι ι 6.4. x2dt-> extr; txdt = 0, х(0) = 1. о о I I I 6.5. x2dt-+ extr; txdt = Q, xdt = Q, x(0) = 1. 0 0 0 I I I 6.6. x2dt->extr\ txdt = Q, / xdt = 0, x(\) = 1. 0 0 0 г г 6.7. f x2dt-+ extr; j xdt = U x(0) = 3. о о г г 6.8. /ж2 ей-» extr; xdt = -, ж(Г) = 1. о о 6.9. x2dt~+ extr; x$intdt=l, x(0) = 0. о о π π τ 6.10. I x2dt-+zxlr\ x$intdt=\, xcostdt = 0, x(0) = 0. 0 0 0 π π * 6.11. Ix2dt->zxtr; xsintdt--2y xco$tdt = -,x(0) = Q. 0 0 0 I 1 6.12. I x2dt-+ extr; / xel dt = 1, ж(0) = 0. о о 6.13. x2dt-^ extr; x2dt = \. о о I 1 I 6.14. x2dt-+ extr; x2dt=\, xdt = Q. 0 0 0 I 1 6.15. J x2dt-> extr; f x2dt = \, x(0) = 0. о о I ! 6.16. xdt -> extr; / л/1+*2Я = ^, ж(1) = 0.
§ 6. Задача Лагранжа о 6.17. / xdt -► extr; / \Λ + χ2dt = ^, ж(-1) = 0. -ι -ι ι 2 6.18. f(X]*X2+ xix2)dt-+extr; ж,(0) = x2(0) = 1. о 1 6.19. I x2dt^ extr; ж(0) = ж(1) = 0, x(0) = 1. о I 6.20. J x2dt-+ extr; ж(0) = x(0) = 0, ж(1) = 1. о I 6.21. /(£2-48aO<tt->extr; ж(0) = ж(1) = 0. о I 6.22. /(£2-48z)<ft-+extr; ж(0) = ж(1) = x(0) = 0. о 1 6.23. ι (χ2 + 48ж) dt -> extr; ж(0) = 0, x(l) == 1. о /1 e ia?2<tt -+extr; x(\) = e + -, ж(е) = —, x(\) = 1. ι e 6.25. Λ*2Λ — extr; x(l) = 0, ж(1) = 1, x(e) = 2. ι e 6.26. ft2x2dt -+ extr; ж(1) = -1, ж(е) = ж(1) = е. ι е 6.27. ft2x2dt — extr; ж(1) = 0, х(\) = 1, ж(е) = -. ι е /е 3 1 Ьгх2 dt -► extr; ж(1) = -, ж(е) = -, х(е) = —, ж(1) = 1 ι е 6.29. ft*x2dt — extr; ж(1) = 1, х(\) = -1, ж(е) = —j.
232 6.30. I 0 π о */■■ ■I 6.32 6.33. 7Г / 0 0 .35./ о .36./ 0 π/: .3,/ 6.38. о 1Г/2 / ί.39. / о π IM.J о ui / о ί.42. / Глава З. Вариационное исчисление ж2 + 4ж2) <tt -> extr; ж(0) = ж(0) = 0, ж(тг) = shir. ж2 + 4ж2) Л -+ extr; ж(0) = ж(0) = 0, ж(тг) = shir. 2 - ж2) ctf -> extr; ж (-J = 1. ж2 - ж2) <й -♦ extr; ж(0) = 1. ж2 - ж2) dt -* extr; ж(0) = 1. ж2 - ж2) dt -+ extr; χ(π) = 1. ж2 - ж2) dt —► extr; χ{τ) = 1. ж2 - ж2) dt -+ extr; ж(0) = 0, ж {^Л = 1. ж2 - ж2) dt -+ extr; ж(0) = 0, ж (-) = 1. ж2 - ж2) dt -+ extr; ж(0) = О, ж(тг) = 1. ж2 - ж2) dt -» extr; ж(0) = О, χ(π) = 1. ж2 - ж2) dt -► extr; ж(0) = ж(тг) = 0, ж(0) = 1. ж2 - ж2) dt -> extr; ж(0) = ж(тг) = О, ж(тг) = 1.
§ 6. Задача Лагранжа 233 к 6.43. 1(х2 - х2) dt -> extr; x(0) = 1, х(0) = ж(тг) = 0. о 6.44. / (х2 - х2) dt -+ extr; ж(0) = ж(тг) = 0, х{ж) = 1. о Φ 6.45. /(ж2 - х2) dt -> extr; ж (~) = 1, х(0) = £ (|) = О о 1 6.46. /(ж2 + ж2) dt -* extr; x(0) = 0, ж(1) = sh 1, *(1) = ch 1. о 1 6.47. Пх2 + х2) dt -+ extr; я?(0) = - sh 1, х(0) = ch 1, я?(1) = 0. о 1 6.48. Пх2 + ж2) dt -f extr; х(0) = *(0) = 0, x(l) = sh 1. о 1 6.49. Пх2 + х2) dt — extr; ж(0) = sh 1, ж(1) = ж(1) = 0. о τ/2 6.50. f(x2 - ж2) А -► extr; х(0) = 0, ж (|) = 1 + ^, х (|) = 1. о 6.51. /(ж2 - х2) dt — extr; x(0) = *(0) = 0, ж(|) = 1. о 1 1 6.52. I xdt-+ extr; x2dt = l, x(0) = x(l) = 0. о о 1 I 6.53. xdt-+ extr; x2dt=l9 x(0) = ж(0) = x(l) = 0. о о 1 I 6.54. [ xdt-> extr; f x2dt = 1, ж(0) = x(0) = ж(1) = ж(1) = 0. о о 1 1 6.55. x2dt-+ extr; / χ dt = 1, ж(0) = 0.
234 Глава 3. Вариационное исчисление ι 6.56. f x2dt -> extr; f xdt = 1, x(\) = x(0) = 0. о о 6.57. f x2dt-+ extr; ίχdt = 1, x(0) = x(0) = x(l) = 0. о о I 1 6.58. x2dt-> extr; xdt=\, x(0) = x(\) = ж(0) = 0. о о 6.59. f x2dt -> extr; /жЛ = 1, x(0) = я?(1) = *(0) = *(1) = 0. о о 6.60. fx2dt-> extr; fx2dt = \, x(0) = *(0) = 0. о о i III 6.61. А ж2 <Й-> extr; ix2dt=l, [ xdt= f txdt = 0. 0 0 0 0 I 1 1 6.62. fx2dt -> extr; ^ ж2Л = 1, А «Л = 0, ac(0) = x(l), *(0) = A(l). 0 0 0 г 6.63. Τ — extr; f x2dt = 4, ac(0) = 0, *(0) = 1, x(T) = -1. о г 6.64. Г -♦ extr; f x2dt=\, x(0) = ж(0) = 0, ж(Г) = 1. о г 6.65. Τ -» extr; / ж2 dt = 1, ас(0) = i(0) = jc(T) = 0, x(T) = 1. о г 6.66. Τ -+ extr; f x2dt = 4, x(0) = *(0) = 0, x(T) = 1, x(T) = 2. о I 6.67. *(1) -> extr; l x2dt = 4, ж(0) = ж(0) = ж(1) = 0. о ι 6.68. х(1) -► extr; ί x2dt = 12, ж(0) = *(0) = *(1) = 0.
Ответы к задачам главы 3 I 6.69. ί (x{3))2dt - extr; x(0) = х(0) = х(0) = О, х(\) = 1. о 1 6.70. / (ж(3))2 dt -+ extr; x(0) = х(0) = а(0), ж(1) = 1. о 1 6.71. ί (ж(3))2 dt - extr; х(0) = х(0) = х(0) = О, х(\) = 1. о 1 6.72. ί (ж(3))2 dt -> extr; x(0) = А(0) = *(0) = *(1) = 0, х(1) = 1. о Ответы к задачам главы 3 1.1. 1 -1 e absmin, Smin = 1, Smax = +00. ft 1.2. — 6 absmin, Smax = +00. t2 t 1 1.3. —7 + 76 absmin, Smin = -7-; Smax = +00. 4 4 48 1.4. -- + (— + -pj< € absmin, Smax = +00. j//ti j\ лпЗ 1.5. —^ Ε absmin, 5mi„ = --£; Smax = +00. 4 48 *3-* 1 1.6. —^- e absmin, Smin = - —, 5max = +00. t-t4 1.7. —— e absmin, 5max = +00. 1.8. \nt € absmin, Smin = 1; 5max = +00. 1.9. t - 1 - (e - 1) in* € absmin, 5min = 1, Smax = +00. ln(* + 1) 1.10. e absmin, Smin = 1, Smax = +00. 1.11. t - elnt £ absmin, 5max = +00. 1+e 3-t 1.12. —— In* Η—— G absmax, Smjn = -00. 4 7 1.13. - - 1 G absmin, Smin = -; 5max = +00.
236 Глава 3. Вариационное исчисление 1.14. ψ- G absmin, 5max = H-oo. In | e 1.15. - - ln£ G absmax, 5mjn = -oo. 1.16. y/t + 1 G absmin, 5max = -boo. 1.17. \/4-£ G absmin, Smin = -; 5max = +oo. 4 (t - 2)2 1.18. —-— G striocmin, 5min = -oo, Smax = H-oo, (t - l)2 g iocextr. 4 1.19. 21n(* + 1) G absmin, Smax = +00. 1.20. t3 -1 G absmin, 5max = H-oo. 1.21. \nt G absmin, 5max = H-oo. 1.22. £3 G absmin, Smjn = 3, Smax = +oo. cht 1.23. -— G absmin, 5max = H-oo. chl л ^A sh2* u . o 1.24. —- G absmin, Smax = H-oo. sh2 sh2 e' + e1""' 1.25. — 1 G absmin, 5max = H-oo. 1 -be shi * 1.26. ^j-j- - - € absmin, Smax = -boo. £ sh£ , 1.27. —— G absmin, Smin =rcthT0, 5max = -boo. sni0 1.28. sin* —— G absmax, Smjn = -oo. sh 1 sh2sh* 1.29. sh2t —— G absmin, Smax = H-oo. shl . ™ . , (£-sin2b)sh* t . 1.30. sin* + — — G absmm, Smax = H-oo. shTo 1.31. sh2* + . m G absmin, 5max = -boo. snio 1.32. (t - \)cht G absmin, 5max = H-oo. * ™ , w (i-2bchr0)shi u . β 1.33. * cht + ~ ——' G absmin, 5max = +oo. shT0 1.34. (* - l)sh* G absmin, Smin = —-—, 5max = -boo. 135· (Άτ + * - To) sh* G absmin, 5max = H-oo. ν sh To /
Ответы к задачам главы 3 237 1.36. cost e absmin, Smln = 0; 5max = +оо. 1.37. sin* Ε absmin, Smin = 0, Smax = H-oo. / π\ π 1.38. It - -1 sin* e absmin, 5min = --, 5max = H-oo. 1.39. tcost e absmin, 5max = -boo. 1.40. \/l +1 -12 G absmin, 5max = -boo. 1.41. Vl -t2 € absmin, 5max = -boo. 1.42. V2t - t2 e absmin, Smax = -boo. t 1.43. Допустимые экстремали — цепные линии вида С ch — , где кон- о т* станта С отыскивается из условия на конце С ch— = £. Причем о при — > а имеются две допустимые экстремали, при — = а Tq Го имеется одна допустимая экстремаль, при — < а допустимых экс- Го тремалей нет, где а определяется из системы уравнений а = shr, г = cthr, 5max = -boo. Подробное исследование задачи содержится в книге [ИТ, с. 427]. 1.44. Экстремаль записывается в параметрической форме следующим а2 а2 образом: χ = —(1 - cost), t = —(τ - sinr) Η- с. Константы а и с однозначно отыскиваются из начальных условий. Допустимая экстремаль доставляет absmin, 5max = -boo. Исследование задачи содержится в книге [АТФ, с. 113]. 1.45. Экстремали, удовлетворяющие начальному условию х(0) = 0, име- 1 4- С2 ют вид x(t,C) = Ct + —-—t2. Константа С отыскивается из гра- Ah ничного условия ж(Го) = £· Уравнение огибающей этого семейства t2 имеет вид χ = — - h (в баллистике эта кривая носит наимено- Ah вание кривой безопасности). Причем при ξ > — - h имеются две Ah Т2 допустимые экстремали, при ξ = —- - h имеется одна допустимая Ah Т2 экстремаль, при ξ < — — h допустимых экстремалей нет. В случае Ah двух экстремалей верхняя (в осях t,-x), носящая название навесной, не дает локального экстремума, нижняя (настильная) дает сильный минимум. Smax = +оо. 1.46. (sin£, - sin t) G absmin, 5max = -boo.
238 Глава 3. Вариационное исчисление 1.47. (sht, -sht) G absmin, Smax = -f oo. 1.48. Допустимая экстремаль ±(t) = (sh$,sh£); Sm\n = -oo (xn(t) = x(t)+ (sin πηί, - sin τηί)); Smax = +oo (xn(t) = £(t) + (sin nnt9 sin nut)). 1.49. Допустимая экстремаль x(t) = (e',e~*); Smin = -oo (xn(t) = x(t) + (sin πη£, - sin nnt)); 5max = -boo (xn(t) = £(£) + (sin irnt, sin ππ£)). 1.50. Допустимая экстремаль &(£) = (sint,-sin£); Smin = -oo (xn(t) = &(t) + (sin2n£,-sin2n£)); 5max = -boo (xn(t) = x(t) + (sin2n£,sin2n£))· 1.51. Допустимая экстремаль £(£) = (t*,t3); Smin = -oo (a?n(i) = £(t) + (sintfrctf, - sin irnt)); 5max = -boo (xn(t) — £(£) + (sin πηί, sin πη£)). 1.52. Допустимая экстремаль x(t) = (£-|-cos£, -cost,cost-t); Smin = -oo (xn(t) = 4(i) + (0,-nsin2i,0)); Smax = -boo (ac„(i) = 4(i) + (0,nsin2*,0)). *2 4 2.1. - - < - 1 G absmin, Smin = —; Smax = +00. 2.2. χ = 0 g? locextr, Smin = -oo (жп(<) = η), 5max = +oo. t2 + 3 2.3. — t locextr, Smin = -oo (xn(t) = n), 5max = -boo. 2.4. ch£ G absmin, Smax = -boo. 2.5. el + sin£ G absmin, Smax = +oo. 2.6. sinf + cos* g? locextr, 5min = -oo (жп(<) = η), Smax = -boo. 2.7. cos* - 1 $ locextr, Smin = -oo (xn(t) = n), Smax = -boo. 2.8. (0,0) glocextr, Smi„ = -oo (a?n(<) = (n,-n))f Smax=+oo (a?n(<) = (n,n)). 2.9. ln(* + 1) - 1 G absmin, 5max = -boo. 2.10. - 4- - G absmin, 5max = +oo. 2.11. In t + 1 G absmin, 5max = -boo. 6 /4£3 2.12. Допустимые экстремали: vT+7, у—, 5max = +oo. 2.13. 21n(* + 1) G absmin, 5max = -boo. e< 2.14. --τ—- G absmin, 5max = -boo. e3 + 1 3.1. χ = 1 G absmin, 5т{п = 0, 5max = +oo (a?n(<) = n(* - 1) + l). 3.2. 0 t locextr, 5min = -oo (xn(t) = nt), 5max = -boo. t2-\ 3.3. —-— G absmin, 5max = +oo.
Ответы к задачам главы 3 239 е 2 3.4. -— +1 G absmin, 5min = --, 5max = -boo. 4 3 3.5. t - elnt - 1 G absmin, 5max = -boo. 3.6. (£ = -2*, f = 1) G absmin, Smi„ == 4, Smax = -boo. 3.7. Ut = ±4*, f = - j G absmin, Smin = 8, Smax = -boo. 3.8. (A = 0, ί = 1) <? iocextr, 5min = -oo, 5max = +oo. / t2 \ 3.9. (* = --<+1, ί = 2J fi? Iocextr, Smi„ = -oo (xn(t) = 1 -ί, Γη = η), unax = +00. (£2 ч / t2 — n2 \ a = j-8,r = 8jgiocextr,Smin = -oo (»„(«) = —j-+n,rB = nJ, «unax = +00. 3.11. £>0=>(й=-,Г= 2ν/ί) £ Iocextr, 5min = -oo / f-t, 0<ί<1, ν ( **(*)={ -1» KKn-1, rn = n),5max = -boo. V l(£+l)(i-n+l)-l, n-KKn, / ft2 \ 3.12. (u = -- - (1 + Vs)t9 f = 8 + 4V3) g iocextr, 5min = -oo (χη(ή = —J— + ** Tn = n) ' 5max = +00· 3.13. (u = -—\/2t, Γ = 2\/2j g iocextr, Smin =-oo (as»(«) = -ί, T„ = n), 5max = +00. 3.14. sin£ -b cosi G absmin, 5max = +oo. 3.15. r0<-=>A = OG absmin, T0 = τ => С sin* G absmin VC G IR; 5min = 0; To > τ => Smm = -oo; 5max = -boo. 3.16. it - ■- - l) sin* G absmin, Smax = +oo. 3.17. ί — - t - 1J cos* G absmin, 5max = +oo. „«« , , , sh*(shl+chl) t . Λ 3.18. ί chtf —— G absmin, Smax = -boo. chl 3.19. t sht - th 1 ch£ G absmin, Smax = +oo. 3.20. el G absmin, 5max = +oo. 3.21. Ц— G absmin, Smin = £2ШГ0; 5max = +oo. chT0
240 Глава 3. Вариационное исчисление 3.22. £ = -2 chT sht, где ί1 — единственное решение уравнения sh 2Ύ = Т+1. 3.23. ж = 2 shi ch£, где ί — единственное решение уравнения sh2T + Г=1. 3.24. * = ^, ? = 21/6, Smax = +oo. 3.25. д/1 + 2* - & € absmin, Smax = +оо. 3.26. y/2-t2 G absmin, Smax = +оо. 3.27. А = л/1 + 2* — *2, Г = 2, 5тах = +оо. 3.28. ί й = \Л + 2f - t2, Г = 1 - W- J G absmin, Smax = -boo. t 3.29. Допустимые экстремали — цепные линии вида С ch —, где кон- С/ станта С отыскивается из условия на конце С ch — = £. Причем ΙίΙ ^ ΙίΙ при — > а имеются две допустимые экстремали, при — = а То То имеется одна допустимая экстремаль, при — < а допустимых экс- То тремалей нет, где α определяется из системы уравнений а = shr, r = cthr, 5max = +oo. 3.30. Допустимая экстремаль /cost cos A VcosT cosl/ 3.31. Допустимая экстремаль (cos t + tg 1 sin t, cos t + tg 1 sin t). 4.1. -6t2 + 6te absmin, 5ml„ = 12; 5max = +oo (xn(t) = -(2n + 1) sin(2n + l)irt). 4.2. 3*2 - At + 1 G absmin, 5min = 4, 5max = -boo. 4.3. 3*2 + It -Ы G absmin, 5max = -boo. 15 4.4. у (-ί3 + ί) G absmin, 5mi„ = 45; 5max = -boo. 5*3 - 3t 4.5. —-— G absmin, Smi„ = 6, Smax = +oo. 4.6. 5t3 + 3t-4 e absmin, 5max = H-oo. 4.7. 10i3 - 12*2 + 3* G absmin, 5max = -boo. 4.8. 60*3 - 96*2 + 36* G absmin, Smin = 192, 5max = +oo. 4.9. -10*3 - \2t2 + 6t + 2 G absmin, 5max = -boo. 4.10. cos* G absmin, 5mi„ = -, 5max = +oo.
Ответы к задачам главы 3 241 л^ t-2%mt ' . „ 4.11. G absmin, 5max = -К». ж 4.12. ί -f- sini G absmax, t - sin t G absmin. 4.13. 2sin£ + cost -f 1 G absmin, 5max = +oo. 4.14. 2ex~l -t + le absmin, 5min = 2e2 + 2e - 3, 5max = +oo. Але 2(1 - e*) (e-l)t u . β 4.15. -r^--;—~ + f- G absmin, 5max = +oo. e2 - 4e + 3 e - 3 ,«* 2(ie-i-e' + l) u . „ 4Л6· ~7; 77 7T~ G absmin, 5max = +00. (3 - e)(e - 1) 4.17. tel G absmin, 5max = -boo. 4.18. £e~' G absmin, 5max = -boo. 7 4.19. * G absmin, 5mln = -, 5max = +oo. 4 4.20. -j G absmin, 5max = -boo. 4.21. Допустимые экстремали: ±\/2sin fcirt, fc G IN, ±V5siniri G absmin, 4 4.22. —*sin* + Csin* VCG IR, 5max = -boo. π 8 4.23. — £cos£, 5max = -boo. π 4.24. Допустимые экстремали — цепные линии вида ±с( ch — -ch — J, /τι где константа С > О отыскивается из условия 2Csh— = ί. О Причем при Ζ > 2Т0 имеются две допустимые экстремали, при I = 22о имеется одна допустимая экстремаль £ = О, при Ζ < 22ο допустимых экстремалей нет, 5тах = +оо. 4.25. Единственная допустимая экстремаль (3t2 - 2t,6t2 - 4t) g iocextr, Smin = -00, 5max = +00. 4.26. (-6t2 + 6t,3t2 - It) g? Iocextr, 5min = -oo, 5max = +00. / 5*3 3t\ 4.27. ^0, — - у J g? Iocextr, 5min = -00, 5max = +00. 4.28. (3*2-2*, 3<2-6ί), (-3*2+4*, -3*2) g? Iocextr, Smi„ = -00, 5max = +00. 4.29. (-*3 + 3M3 - 0» (*3 + '»~*3 + 0 £ iocextr, Smin = -00, 5max = +00. 5.1. -2*3 + 3*2 G absmin, 5mln = 132; 5max = +00. 5.2. t(t - l)2 G absmin, 5max = +00. 5.3. t2 - t G absmin, 5min = 4; Smax = +00.
242 Глава 3. Вариационное исчисление 5.4. t4 - 2t3 +t2 G absmin, 5mi„ = --; Smax = +оо. 5.5. t4 - 4t3 + 6t2 - 4t + 1 G absmin, Smax = -boo. 5.6. t4 G absmax, Sm\n = -oo. ff4 i2(^3 - 2i -h 1) u 5.7. — G absmax, Sm]n = -oo. t5 -f 3t3 — 2t2 5.8. — G absmin, 5max = -boo. 5.9. sint G absmin, Smax = -foo. 5.10. sht G absmin, Smax = H-oo. 5.11. cht - cost G absmin, Smax — -boo. 5.12. sht - sint G absmin, Sm\n = 2 shir; Smax = +oo. / π\ sint-sht , π cht-cost 5.13. ^1 + sh -J - + ch - G absmin, Smax = -boo. 5.14. ch t sin t - sh £ cos t G absmin, Smax = -boo. 5.15. - cht cos t G absmin, 5max = -boo. 5.16. -shtsin* G absmin, 5max = +oo. 5.17. t + cost G absmin, 5max — -boo. ^ <o 2(sint-cost-t+l) ^ . 5.18. — G absmin, 5max = H-oo. 4- π 1 — cost 5.19. G absmin, 5max = +oo. 5.20. cht G absmin, 5max = -boo. 5.21. sht G absmin, 5max = +oo. 5.22. te* G absmin, 5max = +oo. 5.23. el G absmin, 5max = H-oo. 5.24. tint G absmin, 5max = H-oo. 5.25. IntG absmin, 5max = +oo. 5.26. - G absmin, Smsx = +oo. 5.27. t2 G absmin, Smm = 6; 5max = H-oo. 5.28. ln(t + 1) G absmin, 5max = -boo. 5.29. tint G absmin, Smin = e; Smax = -boo. 5.30. -—- G absmin, 5max = H-oo. 5.31. t3 G absmin, 5min = 36; 5max = +oo. 5.32. t4 G absmin, 5max = +oo. 5.33. t3(t - l)2 G absmin, 5min = 36; 5max = +oo.
Ответы к задачам главы 3 243 5.34. б*5 - 15*4 + 10*3 G absmin, 5min = 720; 5max = +oo. t , , Λ sh 2 Л 5.35. sh* e absmin, Smin = —; 5max = -boo. 5.36. 1-cos*, 5max = +00. 5.37. *-sin*, 5max = +oo. 5.38. sh* - sin*, Smax = -boo. 6.1. 1 G absmin, 5min = 0; 5max = +oo (xn(t) = - sin(2rc+l)7r*J . 3*2 6.2. —— + 3* G absmin, £mjn = 3; Smax = -boo .. 5'3 15* . · „ 15 о 6.3. —— 1 — 6 absmin, Smin = —; 5max = -boo. 4 4 2 ,, 5*3- 15*+ 8 u . β 15 β 6.4. G absmin, 5min = —; Smax = -boo. 20*3 , 6.5. —— + 14Г - 8* + 1 G absmin, 5min = 8; Smax = +oo. 20*3 2 1 6.6. — 6* +-G absmin, Smm = 8; Smax = +oo. 6.7. (u = 3, Γ = -) Ε absmin, 5min = 0; (± = 3*2 - 6* + 3, t = 1) g? locextr, Smax = +00. 6.8. (й = 1, f = -) G absmin, 5min = 0; (£ = *2, f = I) & locextr; ^max = +00. 2 6.9. — (* + sin*) G absmin; Smax = +oo. Зтг 6.10. ———j (l - cos* - -(* + sin*)J G absmin; 5max = +oo. 6.11. cos* - 1 G absmin; Smax = +oo. 2(el - e* - 1) 6.12. —z— -^ G absmin; 5max = +oo. e2 - 4e + 1 6.13. Допустимые экстремали χ = ±-\/2cosfc7r*, feG!N;x = ±lG absmin, ^min = 0; Smax = +oo. 6.14. Допустимые экстремали χ = ±-\/2cosfc7r*, к G IN; £ = ±V2cosirt G absmin, Smin = π2; 5max = +oo.
244 Глава 3. Вариационное исчисление 6.15. Допустимые экстремали χ = ±>/2sin ί к -f rWtf, ΚΖ; г τϊ π2 Λ ж = ±V2sin — G absmin, 5min = —; 5max = +oo. 2 4 6.16. -Vl - t2 G absmin, Smin = —; у/Τ^Ψ G absmax, Smax = —. 4 4 6.17. -λ/1 -ί2 G absmin, Smjn = -—; Vl - £2 G absmax, 5max = T. 4 4 6.18. χ = (*,,f2) = ( c^ , J^ ) € absmin; Smax = +oo. t2 6.19. --+te absmin, Smin = 1; 5max = +oo. *2 6.20. у G absmin, 5min = 1; 5max = +00. 24 6.21. tA - 2*3 +1 G absmin, 5min = -—; Smax = -boo. 5£3 3t2 9 6.22. *4 - — + — G absmin, 5mln = --; 5max = -boo. 6.23. -t4 + 2*3 G absmin; Smax = +oo. 6.24. — - et(\nt - 1) G absmin; 5max = -boo. 6.25. £ln£ G absmin; 5max = H-oo. 6.26. (t + e) lnf - t G absmin; Smax = H-oo. 6.27. ln£ G absmin; Smax = +oo. e 6.28. — + Ы G absmin; 5max = -boo. zc 6.29. - G absmin, 5max = H-oo. , ΛΛ thir(chfsinf -sh£cos£) 6.30. shtfsintf G absmin; 5max = -boo. 6.31. chtfsintf -sh£(th π sin t + cos £) G absmin; 5max = -boo. sin* + sh* (1 -sh f )(cos* + cht) w 6.32. Допустимая экстремаль 1 . π £locextr; 2 2ch γ «^min = ~00; £max = -bOO. , ^-, «г cosfH-ch* Ц-сптг, t4 . A w t 6.33. Допустимая экстремаль ——(sht + sin£) £ locextr; 2 2 shir ^min = ""*°0; Smax = -bOO. sinf + cthf cos* сп* + сп(тг-*) 6.34. Допустимая экстремаль — — ^locextr; 2 2shtf ^min = -οο; Smax — +οο.
Ответы к задачам главы 3 245 ^ ^т l+ch7r. . cos* + ch* t 6.35. Допустимая экстремаль ———(sh* + sin*) у. locextr; 2sh7T 2 5min = -00; 5max = +00. , , (l + ch7r)(cos* + ch*) sh* + sin* wi 6.36. Допустимая экстремаль — £ locextr; 2sn7r 2 5min = -oo; Smax = -boo. ^ля sin* sh* 6.37. —- + ——T G absmin; 5max = -boo. 2 2sh γ ,ЛП „ ch* cos* . f 6.38. Допустимая экстремаль τ — £ locextr; 5max = +oo. 2sh γ 2 . . sh* sin* 6.39. Допустимая экстремаль £(*) = — г— £ locextr; Sm\n = -oo 2сптг 2 / /.ч */Λν ( * * j. sh7r(sh*-sin*)\\ lxn(t) = 4(ί) + n^chi - cos* ch* + l—-J 1; 5max = +oo. ch * cos * 6.40. Допустимая экстремаль ±(t) = —■ ;r~ £ locextr; Smin = -oo 2сп7Г 2 / /v /v / , ν sh7r(sh(7r-*) + sin*)\\ ( a?n(i) = *(*) + n(ch(ir - *) + cos* V chir + i ) ); 5max = +00. 6.41. sin* G absmin, Smin = 0; 5max = +oo. 6.42. -sin* G absmin, Smin = 0; 5max = +oo. 6.43. Допустимая экстремаль £(*) = cos* g locextr; Smin = -oo / /4 /v / sh7r(sh*-sin*)\\ Л ί xn(t) = £(*) + n^ch* - cost chir+i—) ); 5max = +00· 6.44. at = -cos* g locextr; 5min = -oo lxn(t) = &(t)+n(ch(ic-t)+cost- shy(sh^-*) + sin*)^\ Г — : I J ; ^max = +00. chtf + l // 6.45. sin* G absmin, 5min = 0; 5max = +oo. sh2 6.46. sh* G absmin; Smin = —; Smsx = +oo. sh2 6.47. sh(* - 1) G absmin; Smin = —; Sm&x = +oo. 6.48. ch* - 1 G absmin; 5max = +oo. 6.49. 1 - ch(* - 1) G absmin; 5max = +oo. 6.50. * + sin* G absmin; 5max = +oo. 6.51. 1 - cos* G absmin; Smax = +oo. 6.52. at = —^=(*4-2*3+*) G absmax, -4 G absmin, 5max = -Sm\n = Τ"7=·
246 Глава 3. Вариационное исчисление 6.53. χ = — (2*4 - 5t3 + 3t2) G absmax, -x G absmin, Smax = ~5т{п - —-p. 6 8v5 6.54. χ = —t2(t - I)2 G absmax, -x G absmin, Smax = -Smin = 6.55. 2* G absmin, 5min = 0; 5max = +oo. 6.56. — (t4 - 6t2 + 5) G absmin, 5min = —; Smax = +00. ID I 6.57. — t2(t - 2)2 G absmin, 5min = 45; Smax = +00. 40 4 100 ^ 2 6.58. —Г - — Г + 20Г G absmin, 5max = +00. 6.59. 30*2(* - l)2 G absmin, Smin = 720; 5max = +00. 6.60. χ = C((chu> -f coso;)(sha;£ - sina;£) - (sha; -f sina;)(cha;£ - cosart)) G absmin, (a; — минимальный положительный корень уравнения ch a; cos ω = 1, константа С находится из изопериметрического условия); 5mi„ = ω4; Smax = +оо. 6.61. χ = C((chu> - cosa>)(shatf - sin art) - (sha; - sina;)(chart - cosatf)) G absmin, (о; — минимальный положительный корень уравнения cha;cosa; = 1, константа С находится из изопериметрического условия); Smin = a;4; Smax = +оо. 6.62. Допустимые экстремали А* = \/2sin(27rfe£+7) ^7 G IR, £| G absmin, Smin = (2тг)4; Smax = +00. 6.63. (χ = t(\ - *), f = l) € absmin, Smin = 1; Smax = +00. / t2 . \ 6.64. (x = -r, f = ij G absmin, Smin = 1; 5max = +00. / t3 t2 Л \ 6.65. ^r = — - j, Г == 4j G absmin, Smin = 4; 5max = +00. 6.66. (x = t29t=\)e absmin, Smin = 1; Smax = +00. 6.67. -t3 +12 G absmin, 5min = -1; t3 - t2 G absmax, 5max = 1. 6.68. 2*3 - 3*2 G absmin, 5min = -1; -2*3 + 3t2 G absmax, 5max = 1. *4 *3 6.69. -- + у G absmin, 5min = 3; Smax = +00. t2 + 2* + 2 6.70. G absmin, 5min = 0; 5max = +00. *5 - 5i4 + \0t3 6.71. - G absmin, 5min = 20; 5max = +00. 6 Μ* _ 25*4 + 20*3 6.72. G absmin, Smin = 320; 5max = +00.
Глава 4 Задачи оптимального управления В этой главе рассматриваются задачи оптимального управления. Приводятся формулировка и доказательство принципа максимума Пон- трягина в общем случае, доказательство принципа максимума в частном случае для задачи со свободным концом. Решаются простейшая задача о быстродействии, аэродинамическая задача Ньютона и ряд других задач оптимального управления. В пятидесятых годах потребности прикладных дисциплин (техники, экономики и др.) стимулировали постановку и рассмотрение нового класса экстремальных задач, получивших название задач оптимального управления. Необходимое условие экстремума для задач этого класса — «Принцип максимума», — сформулированное Л. С. Понтрягиным в 1956 году, было доказано и развито впоследствии им, его учениками и сотрудниками. Важно отметить, что это условие имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа: в качестве обязательного условия в решении задачи оптимального управления входит решение вспомогательной задачи на максимум (отсюда и название — «принцип максимума»). За разработку теории оптимального управления Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе и Ε. Φ. Мищенко в 1962 году была присуждена Ленинская премия. Понтрягин рассматривал задачу на максимум, мы же для единообразия с прошлым материалом будем рассматривать задачу на минимум, называя соответствующее условие условием оптимальности, и формулировать необходимые условия в лагранжевой форме. В отличие от задачи Лагранжа в задаче оптимального управления вводится управление и появляется дополнительное ограничение типа включения на управление: u€U. Множество U определяет возможности человека влиять на происходящий процесс.
248 Глава 4. Задачи оптимального управления § 1. Принцип максимума Понтрягина в общем случае 1.1. Постановка задачи Задачей оптимального управления (в понтрягинской форме) будем называть следующую задачу: В0(О -> min; В<(£) < О, г = 1,..., т', Д-(€) = 0, < = т' + 1,...,т, (Р) *(i)-v('.*(0.«(0)=0 V*GT, (1) гл(^) G Z7 V*GA, (2) где £ = (*(·),«О.Μι), х € Ρ^Δ,ΙΓ), к € РС^,КГ)!>, *0,*ι € Δ, t0 < t\, Δ — заданный конечный отрезок, U С Rr — произвольное множество, Τ С Δ — множество точек непрерывности управления и, и Bi(t) = JΛ(ί,*(0.»(ί))Λ + Ιί(ίο,»(ίο),ίι,*(ίΟ), г = 0,1,...,т. Вектор-функция ж = (a?i,..., жп) называется фазовой переменной, вектор-функция г* = (tti,...,ttr) называется управлением. Ограничение (1), являющееся дифференциальным уравнением, называется дифференциальным ограничением или дифференциальной связью. Оно должно выполняться во всех точках непрерывности управления и. В отличие от задачи Лагранжа имеется ограничение (2) типа включения, которое должно выполняться во всех точках t Ε Δ, а фазовая переменная χ = (х\,..., хп) может иметь меньшую гладкость. Частным случаем задачи оптимального управления (Р) является задача, в которой один из концов или даже оба закреплены. Элемент £, для которого выполнены все указанные условия и ограничения задачи, называется допустимым, или еще говорят допустимым управляемым процессом. Допустимый управляемый процесс ξ = (&(·), й(·) Jo J \) называется (локально) оптимальным (или еще говорят оптимальным в сильном смысле процессом), если существует δ > О такое, что Β0(ξ) ^ А)(£) Для любого допустимого управляемого процесса ξ = (χ(·),η(·),ίο,ί\), для которого Ы-)-х(-)\\с(А) < б, |io -f0| < *. 1*1 "ill < *. ^ Здесь PC(A,Rn) — пространство кусочно-непрерывных на отрезке Δ вектор- функций, соответственно РС'(Д, Rn) — пространство непрерывных вектор-функций, имеющих кусочно-непрерывную производную. Напомним, что кусочно-непрерывной функцией называется функция, имеющая не более конечного числа разрывов первого рода (в точках разрывов существуют конечные пределы слева и справа).
§ 1. Принцип максимума Понтрягина в общем случае 249 1.2. Формулировка теоремы Теорема. Пусть ξ = (£(·),6(·),£0>£ι) — оптимальный (в сильном смысле) процесс в задаче оптимального управления (Р); функции fc, г = О,1,..., га, φ и их частные производные по χ непрерывны в некоторой окрестности множества {(t,£(t)) \ t G Δ}, декартово умноженного на 17, а функции /,·, г = 0,1,..., га, непрерывно дифференцируемы в окрестности точки (io,£(io),i\,£(i\)) (условие гладкости). Тогда найдутся множители Лагранжа (А,р) G Rm+1 x PC!(A,Rn), А Ф О, такие, что для функции Лагранжа Λ(*(·),4)Λ,*ι) = = /(/(^ж,«)+р(*)(*-ν(*.*.«)))Λ + ΐ(*0,«(*ο),*ι,«(*ι)), где m m i=0 t=0 — терминант, выполнены условия: a) стационарность по χ — уравнение Эйлера для лагранжиана L(t,x,x,u) = —£*(<) + £.(<) =0 V< G Г <^> -р(<) + Д(<) - p(t)<px(t) = 0; b) трансверсальность по χ Lz(k) = L(t0) ^=^ p(to) = L(tQ), Lx(t\) = -(в(«,) <=^ ρ(£ι) = -ί»(«ι); c) оптимальность по и tidnL(t,&(t)9e(t)9u) =L(t,£(t),&(t),u(t)) <ί=> *=* min{f(t,at(t)9u) -p(t)<p(t,&(t),u)} = f\t)-p{t)m Vi G Г; d) стационарность по подвижным концам (выписывается только для подвижных концов отрезка интегрирования) Л<0 = 0 ^=ϊ -/(ίο) + k + 4(<о)£(*о) = 0, Л*, = 0 ^=^ /(?,) + ft, + f«(f|)*(fi) - 0;
250 Глава 4. Задачи оптимального управления e) дополняющая нежесткость ХгВ{(1) = 0у г = 1,...,т'; f) неотрицательность λ* ^0, г = 0,1,...,т'. Покажем, что утверждение теоремы находится в полном соответствии с принципом Лагранжа, о котором в книге неоднократно шла речь. Действительно, функция Лагранжа Λ = Λ(χ(·),^(·),£0,*ι) является функцией трех аргументов: фазовой переменной ж(·), управления г*(·), концов отрезка интегрирования t0it\. Согласно общему принципу Лагранжа, надо рассмотреть задачи о минимуме функции Лагранжа, в которых фиксированы все аргументы, кроме одного, и выписать необходимые условия минимума функции Лагранжа: A(x(03()JoJi)^min; (i) Λ(Α(·),«(·)Λ·£ι) -♦ min; (ii) Α(4θ,β(·),*ο,<ι)-*πιίη. (Hi) Задача (i) является задачей Больца, необходимые условия экстремума в которой — уравнение Эйлера и условия трансверсальности. Задача (ii) является элементарной задачей оптимального управления. Минимум интеграла достигается, если подынтегральная функция достигает своего минимума по выбору возможных управлений — это и есть условие оптимальности по управлению. Задача (iii) является задачей нахождения минимума функции двух переменных, необходимые условия экстремума в которой — теорема Ферма — равенство нулю в точке минимума частных производных по £о и £|. 1.3. Пример 4 В(ж(·)) = ί(χ2 + x)dt-> extr; \x\ ^ 1, х(0) = 0. о Решение. Приведем задачу к виду задач оптимального управления, введя управление и: 4 / (и2 + ж) ей -» extr; x = и, и € [-1,1], х(0) = 0. о Функция Лагранжа: 4 Λ = / (А0(г*2 + х) + р(х - г*)) dt + Х{х(0). о
§ 1. Принцип максимума Понтрягина в общем случае 251 Необходимые условия: а) уравнение Эйлера для лагранжиана L = Ло(г*2 + х) -Ьр(ж - и) -—£* + £* = 0 <ί=> -ρ + λ0 = 0; at b) трансверсальность по χ для терминанта I = Х\х(0) i*(0) = **(о), £*(4) = -1,(4) <^> р(0) = А,, р(4) = 0; c) оптимальность по w min {Aou2 - ри} = Х0й2 - рй\ «€[-1,1] d) неотрицательность Ло > 0 в задаче на минимум, Ло < 0 в задаче на максимум. Если λ0 = 0, то из а) р = 0 и из Ь) ρ = λι = 0 — все множители Лагранжа оказались нулями. В задаче на минимум положим А0 = 1. Тогда из а) р = 1 и из Ь) ρ = t - 4. Из условия с) следует, что Ρ 12' Интегрируя, получаем IP signp, |- 2 4 = ! >1, Г-1, 0<*<2, £ = < t I --2, 2<*<4. 0 ^ * < 2, T-2i + C2f 2<*<4. 4 Из начального условия х(0) = 0 выводим, что С\ = 0, а из условия непрерывности в точке t = 2 имеем -2= 1 - 4 + С2 ^ Сг = 1· Таким образом, Г -<, 0 ^ < ж= < £2 |--2*+1, 2*Ξ* 0 ^ * < 2, ^4. Докажем с помощью непосредственной проверки, что функция χ доставляет абсолютный минимум в задаче. Возьмем функцию h Ε PC1 ([0,4]) такую, чтобы £+h была допустимой в задаче. Для этого надо взять функ-
252 Глава 4. Задачи оптимального управления цию h, для которой \£ + к\ ^ 1, h(Q) = 0. Имеем 4 4 В(£ + h) -В(х) = /((£ + Л)2 + £ + Л)<й- f(£2 + x)dt = о о 4 4 4 4 4 = 2 J £hdt+ Ihdt+ I h2dt^2 j £dh+ I hdt. 0 0 0 0 0 Интегрируя по частям в первом интеграле с учетом условий /ι(0) = 0, £(4) = 0, получим 4 4 -2£+l)hdt. о о Подставляя в последний интеграл найденную функцию χ и разбивая отрезок интегрирования на два, имеем 2 4 2 В(£ + Л)-В(£)^ /(--2£ + 1)Ы* + /(-2£+1)/кй = fhdt^Q, 0 2 0 ибо Л(£) > 0 при * € [0,2], так как Л(0) = 0, и fc ^ 0 при * Ε [0,2] (т.е. функция Л возрастает на отрезке [0,2] и, следовательно, неотрицательна). Итак, at Ε absmin. 4 2 4 2 Smin = B(£) = J{&2 + ±)dt= f(l-t)dt+f((l-2y + ^-2t+l)dt = 4 Ч В(й + Л) - Б(£) > 2ал|4+ f(-2£+l)hdt = П-2* + 1)к< 4 2 =(<4)i:+/(t-4i+5)*=2-2+(?-2,!+5,)i;=-4 2 В задаче на максимум положим А0 = -1. Тогда из а) р= -1 и из Ь) Ρ = 4 - £. Из условия с) min {-г*2 - ри} = -й2 - рй «€[-1,1] следует, что й = £ = signp = sign(4-*) = 1, 0^t<4. Интегрируя, получаем £ = t + С. Из начального условия ж(0) = 0 вытекает, что С = 0. Таким образом, £ = £.
§ 2. Принцип максимума в частном случае 253 Докажем с помощью непосредственной проверки, что функция £ доставляет абсолютный максимум в задаче. Возьмем функцию hΕРС] ([0,4]) такую, чтобы χ + h была допустимой в задаче. Для этого надо взять функцию Л, для которой |* + Л|<1 («И1+Л| < 1^-2< Л^О), Л(0) = 0. Как и при проверке экстремали на минимум имеем 4 4 4 4 4 \dt. 0 0 0 0 0 4 4 4 4 4 В(х + h) - В(х) = 2 f &hdt+ fh2dt+ ί hdt= f{2 + h)hdt+ fhi Оба интеграла неположительны, поскольку в первом интеграле Л ^ 0, а 2 + к ^ 0, а во втором интеграле Л < 0, так как /ι(0) = 0 и Л^0 (т.е. функция h убывает). Следовательно, В(х + Л) - В(4) < 0, т. е. χ = t Ε absmax; 4,4 2 и™ = В(*(·)) = f(£2 + £)dt= f(\ + t)dt= (i + y)[ = 4 + 8=12. о о То, что χ — t 6 absmax можно было бы получить и без непосредственной проверки из условия самой задачи. Разобьем исходный 4 функционал на два интеграла. Максимум / х2 dt при \х\ ^ 1 достигается о 4 на \х\ = 1, а максимум /жeft при |#| ^ 1, ж(0) = 0, достигается при о наибольшем возрастании функции ж, т. е. при χ = 1 (ф> ж = t). г. < е |--2ί+1, 2 < ί < 4, Ответ. ^ £2 _ β € absmin, Smjn = -4-; t G absmax, ^max — 12. § 2. Формулировка и доказательство принципа максимума Понтрягина для задачи со свободным концом Приведем формулировку и доказательство принципа максимума Понтрягина для следующего частного случая задачи оптимального управления — задачи со свободным концом и закрепленным временем (концы
254 Глава 4. Задачи оптимального управления отрезка интегрирования to,t\ фиксированы): B(z(.),u(·)) = //(ί,»(ί)>β(ί))Λ + Ζ(»(ίι)) -min; U (Ρ) x(t) - <p(t,x(t),u(t)) = 0 Vi g Γ, i*(<)€l7 Vi€[MiL »(*o) = »o, где фазовая переменная з€РС,([$о»^»Кп)>управлениег*€РС([$о,^»11г)> Ϊ7 С Rr — произвольное множество, Г С [£ο>*ι] — множество точек непрерывности управления и(-). Теорема. Пусть (#(·)> й(·)) — оптимальный управляемый процесс в задаче оптимального управления {Р) ((£,#) € strlocminP), функции fyip непрерывны в некоторой окрестности множества Гх = {(t,£(t)) \ t Ε [£ο>*ι]}, декартово умноженного на U', частные производные (по Фреше) fx, φχ определены на этом множестве и непрерывны в точках множества Гхц = {(t9x(t),u(t)) | t e [to,t\]}, а функция I дифференцируема (по Фреше) в точке x(t{) (I e D(£(t{))). Тогда выполняется условие оптимальности по и: /(*,*(«).«)-р(*)^(*^(0,«)^/(0-р(*)#(0 ν*€Γ, vueu, (ι) где ρ — единственное решение дифференциального уравнения -P(t) + fz(t)-p№x(t) = 0 V<€T (2) с краевым условием p(tl) = -l'(at(tl)). (3) Отметим, что принцип оптимальности (1) с условиями (2)-(3) может быть выведен из необходимых условий оптимальности в общей задаче оптимального управления, множитель Лагранжа λ0 при функционале В оказывается равным единице, а условие трансверсальности по x(to) не существенно. Доказательство. Единственность решения уравнения (2) с краевым условием (3) следует из теоремы существования и единственности решения задачи Коши для линейных систем [АТФ,с. 191]. А) Игольчатые вариации. Зафиксируем точку г€Т, управление υ£ϋ и такое малое число а ^ 0, что отрезок [τ - α,τ] С Т. Управление \ν, *Ε[τ-α,τ), назовем элементарной игольчатой вариацией управления и (рис.9).
§ 2. Принцип максимума в частном случае 255 ки I I f"T4J Г° !м! ι ι I t< о t—a г Рис. 9 Пусть ха(-) — решение уравнения x(t) = <р(Ь,х(Ь),иа$)) с начальным условием x(t0) = ж0. По локальной теореме существования решения дифференциального уравнения [АТФ,с. 186-189] функция ха определена при малых а в некоторой окрестности точки t0i но из леммы 1, формулируемой ниже, следует, что на самом деле вектор-функция ха определяется единственным образом на всем отрезке [£o>*ib Поскольку при t € [£0,т - а) управление ua(t) = u(t), то на полуинтервале [to,τ - α) функции ха и ж, являющиеся решениями одного и того же дифференциального уравнения, совпадают (см. рис. 10). Функция х^ называется элементарной игольчатой вариацией функции ж, а пара (жа,иа) — элементарной игольчатой вариацией процесса (ж,й). Тройку (τ, ν,α), определяющую эту вариацию, будем называть элементарной иголкой. В) Лемма 1 (о свойствах элементарной игольчатой вариации). Пусть в элементарной иголке (τ,ν,α) точка τ £ Τ и управление ν Ε U фиксированы. Тогда существует число ε > 0 такое, что для любого a Ε [0, ε] отрезок [г - α,τ] С Τ, а функция ха — игольчатая вариация функции ж — определена на всем отрезке [to,t\]; при этом при а —> +0 1) функция ха(·) —► ж(-) β метрике пространства C([to,t\)9Rn)'9 2) функция — ► у(·) в метрике пространства С([т, Jj],Rn), где функция у кусочно дифференцируема на отрезке [r,t\] и удовлетворяет дифференциальному уравнению »(О = 0«(*)У(*) ν*€[τ,ί|]ΠΤ (4) с начальным условием У(т) = ¥>(τ,£(τ),ν) - 0(т). (5) Доказательство леммы 1. Существование функции жа следует из теоремы существования решения обыкновенного дифференциального уравнения, а сходимости функций следуют соответственно из теорем о непрерывной и непрерывно дифференцируемой зависимости решения
ί€[τ-α,τ] 256 Глава 4. Задачи оптимального управления от начальных данных. Полное доказательство этих утверждений мы здесь не приводим, отсылая к книге АТФ, с. 89-91. Докажем, что функция у кусочно дифференцируема на отрезке [r9t\]9 удовлетворяет начальному условию (5) и дифференциальному уравнению (4). Восстанавливая значение функций ха и at в точке t Ε [r,t\] через их производные и учитывая то, что эти функции удовлетворяют дифференциальному уравнению χ = (p(t,x,u)9 имеем ф« „m *_MzM= lim hjMzMdsz= α-+ο a a->+oj a ίο t τ = hm / — ds= hm — / (<p(s9Xa(s),v)-<2>(8))ds+ а-ч-оу a ft-»+oaj x " *o τ-or + lim [«·-*·№»-*·)ъ= Hm (φ,Χα(*),ν)-№) r t Hm / a-M-Oj r = <ρ(τ,£(τ),ν)-φ(τ) + J <px(s)y(s)ds. (6) r При переходе к пределу в первом интеграле мы воспользовались теоремой о среднем для определенных интегралов 2\ а во втором интеграле мы вначале воспользовались дифференцируемостью по Фреше отображения 9:C([t0^Rn)^C([t0itil^n) в точке £(·)3\ а потом перешли к пределу под знаком интеграла4*. При этом Um IHxtt-*)||c(W) = Hm N*«-*)llc. jNtzik = 0.|W|c = o. a-+0 a α-Ч-О ||жа-£||с α Подставляя в уравнение (6) значение t = τ, получаем ^начальное условие (5) для функции у в точке т, а продифференцировав это уравнение а 2* Подынтегральная функция непрерывна. ^ Дифференцируемость следует из заданных условий гладкости функции <р. 4' Подынтегральная функция сходится в метрике пространства С([т, fj],Rn) к функции у.
§ 2. Принцип максимума в частном случае 257 по £, получим, что функция у удовлетворяет дифференциальному уравнению (4). ■ С) Лемма 2 (о приращении функционала). Пусть в элементарной иголке (τ,ν,α) точка τ G Τ и управление ν Ε U фиксированы, В(а) := В(ха(),иа()). Тогда функция В дифференцируема справа в нуле и В'(+0) = /(т,*(т),*) - /(τ) -ρ(τ)(φ(τ,*(τ)9ν) - ф(г)) Доказательство леммы 2. Используя теорему о среднем для определенных интегралов, правило перехода к пределу под знаком интеграла, дифференцируемость по Фреше и лемму 1, получим В'(+0)= ит *(α)-*<0)= lim *(':*■)-*(*'*) = α->+ο α α-*+ο α h = lim -( [(f(t,xa(t),ua(t))-f(t))dt)+ lim '(Μ*ι))-*(*(*0) = ίο τ—α τ ^.. 1,(Д(«|))[»,(*|)-^|)) + фа(<|)-Д(<1)) . = и™ </«,*„(<),«)-/<о)| , ,+1™ /С/.1--ч+*с--*))«о^+ ar-4-0v ' lie[7-~a;r] a-++0J a τ U +ί4*('ι)№'ι)=/(τ>^ Выражая Д из уравнения (2), учитывая уравнение (4), и начальное условие (5) для 2/(т), имеем f fxVdt = J(j> + рфх)у dt = f(jpy + py) dt = J -(py) dt = τ τ τ τ = P(t\)y(t\) -Р(т)у(т) =p(t\)y(t{) -ρ(τ)(φ(τ,χ(τ),ν) - φ{τ)). Подставляя найденное значение J fxydt в выражение для £'(+0), полу- г чим искомое представление.
258 Глава 4. Задачи оптимального управления D) Завершение доказательства. Из леммы 1 следует, что если a Ε [0,ε], то (ха, иа) — допустимый управляемый процесс и ха() равномерно стремится к £(·). Поскольку (£,й) — оптимальный процесс, то при малых а >0 £(жа,г*а) ^ В{хЛ) <=> В(а) > В(0). Отсюда по лемме 2 В'(+0) ^ О, и из выражения для В'(-Ю) вытекает, что /(τ,χ(τ),ν)-ρ(τ)^(τ,^(τ),ί;) >/(т)-р(т)0(т) Vr Ε Г, Vv E С/, т. е. выполняется соотношение (1). Теорема полностью доказана. ■ § 3. Избранные задачи оптимального управления 3.1. Простейшая задача о быстродействии Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, вошедшую во многие монографии по оптимальному управлению. Лифт управляется под воздействием внешней силы, которая может изменяться в заданных пределах, регулируемых человеком. Предположим, что возможности действующей силы, а следовательно, и ускорения, ограничены какой-то величиной, например, ускорение может изменяться от -1 до +1. Требуется за кратчайшее время Τ остановить (х(Т) = 0) лифт, для определенности в начале координат (х(Т) = 0). Нетрудно видеть, что задача может быть формализована следующим образом: T->min; |я|<1, *(()) = £,, А(0) = £2> я?(Г) = *(Т) = 0. Аналогично формализуется задача о машине, движущейся прямолинейно без трения по горизонтальной дороге. Машина может двигаться в любую сторону с ускорением, не превышающем единицу. Требуется остановить машину в определенном месте за кратчайшее время. Решение. Приведем задачу к виду задач оптимального управления, вводя вместо функции χ вектор-функцию {х\,хг)> управление и и обозначения: Х\ = Ж, Х2 = X, U = X, Τ —► min; x\ — х2, хг — и, и Ε [-1,1], *ι(0)=*ι, *2(0) = 6, *!(!·) = а2(Т) = 0. Функция Лагранжа: τ Λ = j(p\(t)(xi - х2) +Pi(t){x2 - и)) dt + о + АоГ + А, (я?,(0) - ft) + λ2(χ2(0) - 6) + A3a?i(T) + λ4*2(Τ). Необходимые условия:
§ 3. Избранные задачи оптимального управления 259 a) система уравнений Эйлера для лагранжиана L = P\{t){x\ - хг) + p2(t)(x2 - и) d b) трансверсальность по ж для терминанта J = XqT + A|(a?i(0) - ξ\) + А2(я2(0) г 6) + λ3*ι(Τ) + А4я2(Т) ^*.(0) = 2*,(ο)> Ыт) = -Ιχ,(τ) <=> Ρι(0) = Αι, ρι(5Γ) = -λ3, Ы°) = W £*,(Γ) = ~**2(г) <=> й(0) = Α2, Й(Г) = -Α4; c) оптимальность по и (не зависящие от и слагаемые не выписываем) min {-p2(t)u} = -p2(t)u(t) => u(i) = «€[-1,1] _ Г signp2(0» й(0 Ф °> \ любое из [-1,1], ρ2(£) = 0; d) стационарность по Г: Лг = 0 <<=^ А0 + A3»i(T) + А4ж2(Т) = 0; e) неотрицательность: λ0 ^ 0. Учитывая то, что из начального условия следует ж ι (Г) = 0, а из Ь) А4 = -р2(Т), получаем, что d) равносильно условию А0 = р2(Т)й(Т). Поэтому если А0 = 0, то р2(Т) = 0 либо й(Т) = 0, но тогда из с) Вновь р2(Т) = 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из a) p2(t) = C(t-T), а тогда из с) следует, что u(t) = 1 или u(t) = -1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением 6 = φ(ξι) ■= < —-- Действительно, пусть u(t) = 1 <о> &2(t) = 1 2=£~ ж2(£) = ί-Γ '=> Ж|(£) = (t - Τ)2/2 => ίι = £2/2 ^ 0 => £2 = -у/2& (при извлечении квадратного корня берем знак минус, поскольку £2 = х2(0) = -Г < 0, при этом минимальное время движения Τ = -£2 > 0). В случае u(t) = -1 аналогично получаем, что ξ2 = \/-2£ι, £ι ^ 0. Ниже покажем, что найденное время движения действительно доставляет минимум в задаче. Таким образом, в нашей задаче в этих случаях минимум достигается при Ао = 0.
260 Глава 4. Задачи оптимального управления Рис. 11 Рис. 12 Если же & Φ <ρ(ξ\), то λο Φ 0, и мы полагаем λο = 1. Тогда из d) вытекает, что |р2(Г)| = 1 и функция р2 меняет свой знак в интервале (0, Г) (случай, когда функция р2 не меняет свой знак в интервале (0,Г) и й(Ь) = ±1, уже был рассмотрен при λο = 0). То есть имеются две возможности (см. рис. 11): pf(i) = C(i-T) + l, ft(t) = C(i-T)-l. Этим возможностям в силу Ь) соответствуют такие управления: ^ Г-1, (К*<т, Г 1, \ 1, τ<ί<2\ α \-1, 0<* <т, τ < * < Г. Рассмотрим траектории, соответствующие оптимальным управлениям и+ и гГ на плоскости (жьжг), называемой фазовой плоскостью (см. рис. 12). Для тех значений t, для которых u(t) = 1, имеем *2 я?? ж2 = 1 => ж, = х2 = * + С' => Ж| = -■ + Ct + С" = у + С. Таким образом, фазовая траектория, соответствующая этим значениям tf является куском параболы Х\ = х\/2 + С, Направление движения по такой параболе определяется из условия возрастания х2, так как в этом случае х2 = 1. Аналогично получаем, что для тех значений £, для которых u(t) = -1, фазовая траектория — кусок параболы &| = -х\/2 + С, а направление движения определяется из условия убывания х2, так как Х2 = -1. Укажем теперь то место на фазовой плоскости (х\,Х2), где должно совершаться переключение управления. В искомую точку (0,0) (х\(Т) = х2(Т) = 0) мы должны попасть не более чем с одним переключением,
§ 3. Избранные задачи оптимального управления 261 двигаясь по фазовой траектории по разрешенному направлению. Совокупность начальных условий, соответствующих управлениям и+ и и~, описывается неравенствами ξ2 > ψ(ξ\) (для и+) и L· < ψ(£\) (для и~)- Переключения совершаются на кривой ξ2 = φ(ξ\)- При этом, как нетрудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0,0). Поскольку всегда \х2\ = 1 на оптимальной траектории, то х2 — \t\+C и, значит, время движения Τ — Varx2 (вариация функции х2). Однако проще находить оптимальное время Г, строя функцию ж() класса PC2([tQ,t\]), удовлетворяющую необходимым условиям экстремума и начальным условиям. В примере 2 пункта 3.3 будет приведено решение одной из конкретных задач быстродействия. Покажем, что построенная таким образом оптимальная траектория, начинающаяся в точке (ξ\,ξ2), доставляет решение задаче. Пусть этой траектории соответствует управление и (для определенности й~), функция χ и время Т. Предположим, что имеется некоторый другой допустимый управляемый процесс (х,и,Т), Τ ^ Т. Доопределим функцию х() нулем на отрезке [Т, Г]. Воспользуемся следующей формулой восстановления функции по ее n-й производной x(t) =(^i)i/(<-srlx(n)(s)ds+ea:W(())S· По этой формуле при η = 2 в силу условий на левом конце функции χ и ж в точке τ можно представить в виде τ х(т) = / (т - s)x(s) ds + ξ2τ + ξ\. о Поскольку £(s) = 1 ^ x(s) для любого s £ [0,τ], то τ £(т) - х(т) = Пт - s)(l - x(s))ds ^ 0, о причем равенство здесь возможно только, если во всех точках непрерывности х(з) = 1, а тогда x(t) = £(t) для любого t Ε [Ο,τ]. Воспользуемся другой формулой восстановления функции по ее п-й производной f *<«> = 5γγϊ)ϊ /с - *г'*<п)(*><**+Σ *№)<*>Цг^ ·
262 Глава 4. Задачи оптимального управления По этой формуле при п = 2в силу условий на правом конце функции χ и ± в точке t = τ можно представить в виде г х(т) = (s- r)x(s) ds. τ Поскольку £(s) = -1 < £(s) для любого 5 G [τ, Τ], то f ж(т) - ж(т) = /(« - т)(-1 - *(*))<fo < 0, г причем равенство и здесь возможно только, если x(s) = -1, а тогда x(t) = £(*) для любого t G [т, Т]. Таким образом, имеем, что х(т) = £(т) и, следовательно, ж(£) = £(t) V*G [0, f]. Отсюда Г = Г. 3.2. Аэродинамическая задача Ньютона Задача Ньютона — это задача о сопротивлении движению тела вращения в «редкой» среде. Необходимо выбрать форму тела вращения так, чтобы сопротивление движению было минимально. История задачи В 1687 году вышли «Математические начала натуральной философии» Ньютона. В седьмом разделе, озаглавленном «О движении жидкостей и сопротивлении брошенных тел», Ньютон рассматривает задачу о сопротивлении шара и цилиндра в «редкой» среде. Затем в «Поучении», при исследовании сопротивления усеченного конуса, Ньютон делает следующее утверждение. Пусть DNEG — некоторая кривая (рис. 13). Из произвольной точки, JV кривой опустим перпендикуляр на ось АВ Рис. 13 и из заданной точки G проведем прямую, параллельную касательной к кривой в точке N. Эта прямая пересечет ось АВ в точ- MN GP3 ке Р. Тогда если имеет место пропорция GP 4BPBG2 , то тело
§ 3. Избранные задачи оптимального управления 263 получающееся вращением кривой DNEG около оси АВ, будет испытывать наименьшее сопротивление в вышеупомянутой редкой среде среди других тел такой же длины и ширины. Ньютон не дал объяснения тому, как он пришел к этому результату. Опубликованные в наше время материалы Ньютона показывают, что он владел элементами многих конструкций, которые потом были использованы при создании вариационного исчисления. Но, как будет видно в дальнейшем, задача Ньютона относится даже собственно не к вариационному исчислению, а к оптимальному управлению, теория которого начала разрабатываться только в середине этого века. Формализация задачи Сопротивление движущегося тела зависит от законов сопротивления среды. Ньютой представлял себе среду состоящей из неподвижных частиц фиксированной массы га, являющихся абсолютно упругими шарами. Мы также будем придерживаться этого предположения. Пусть тело вращения вокруг оси χ движется в направлении, обратном оси χ в описанной выше среде со скоростью ν (рис.14). Элемент dr на оси г при вращении вокруг Ох описывает кольцо da. Этому кольцу соответствует пояс dL на теле вращения. За время dt этот пояс «вытеснит» объем dV = 2тгг drvdt, где 2тгг dr — площадь da. При этом слой столкнется Ρ Ρ с N = — dV = — Inrdrvdt частицами, где ρ —- плотность среды. Предположим, что участок ds наклонен к оси г под углом φ. Тогда одна частица, ударившись о слой получит приращение импульса, равное πι(ϋι - ϋ\) = -2ravcosy? · η, |νι| = |г72| — ν, η — единичный вектор нормали к <£Σ. По третьему закону Ньютона, тело получит приращение импульса 2mvcos(pn. За время dt таких приращений будет JV, а так как в силу симметрии компоненты пг вектора -п, т.е. ортогональные оси вращения, сократятся, то суммарное приращение импульса будет направлено вдоль оси χ и модуль его будет равен iDltrvdrdt л 2 2,, Nlmv cos φ cos φ = 2гаν cos φ = 4ρπν r cos ipdrdt. га Рис. 14
264 Глава 4. Задачи оптимального управления В силу второго закона Ньютона это приращение равно dFdt, следовательно dF = Αρπν2τ cos2 φ dr, где к = 4ρν2π. Просуммировав dF по всем поясам dL (т.е. по всем элементам dr), получим \ Ч rdr 2 1 1 щ I cos φ — =— = г /dx\2 r l+tg2v> /dx42 Таким образом, заменив г на £ и Д на Го» получаем экстремальную задачу: Го У 1+ж2 о min; х(0) = 0, ж(Г0) = £. Очевидно, что нижняя грань интеграла равна 0. Действительно, гг > 0 при t € [0,То], и выбрав ломаную x(t) так, чтобы |ж(£)| \ Л-х был очень большим, получим сколь угодно малый интеграл. Получается противоречие, т.е. чем более зазубрен профиль на теле, тем меньше сопротивление. Дело в том, что в формализации неявно использовалась монотонность профиля, так как только в этом случае частица сталкивается с телом один раз. Таким образом к условию задачи нужно добавить требование χ ^ 0. Форма тела вращения задается функцией x(t) такой, что х(0) = 0, x(Tq) = ξ (ξ —· заданное число). Для того, чтобы столкновение частицы среды учитывать только один раз, налагаем условие и ^ 0. Формализованно задача оптимального управления выписывается следующим образом: То min; χ = и, и^О, х(0) = 0, х(То) = £. J l+u2 о Функция Лагранжа Го A^J(j^+p(x-u))dt^X,x(0) + X2(x(To)-(). о Необходимые условия: a) уравнение Эйлера: -р = 0 (& ρ = const); b) трансверсальность по χ: ρ(0) = λ|, ρ(ϊο) = -Χ2Ι ч . f λο* Ί -Μ c) оптимальность по и: min < - г - ри > = -—-τ - рй\ ' u>o 11+ и2 r i 1 + й2 г d) неотрицательность: A0 ^ 0.
§ 3. Избранные задачи оптимального управления 265 Если λο = 0, то ρ Φ 0 (если ρ = 0, то из Ь) следует, что Αι = А2 = 0 — все множители Лагранжа — нули). Минимум в соотношении с) конечен только, если ρ < 0, при этом и == 0, т.е. £ — 0. Из условия ж(0) = 0 вытекает, что £ = 0, тогда ξ = 0. Пусть А0 ^ 0. Положим Ао = 1. Тогда для достижения минимума в с) необходимо, чтобы ρ < 0 (если ρ ^ 0, то функция £(£,г*) :— - ри 1 -Ь и1 монотонно убывает с возрастанием и и не достигает минимума). Если u(t) > 0, то Lu = 0. И из с) управление u(t) должно находиться из уравнения * /, \ 2irf Λ 2u£ . . £"(<,и) = -р-(ГТ^ = 0^р = "(ГТ^· (1) При малых значениях t > 0 производная £и(£,г*) > 0 для любого г* ^ 0. Значит, min Ζ/(ί, η) = Χ(ί,0). Таким образом, u^0 0 < t < τ, Момент излома управления τ характеризуется уравнениями 2й(т)т τ р= — (второе уравнение в (2) L(r -0,0) = £(т,й(т)) — условие совпадения минимумов в точке т). Подставив ρ из первого уравнения соотношения (2) во второе, находим, что й2(т) = 1. Отсюда й(т) = 1 (ибо й ^ 0), и тогда снова из первого уравнения (2) получаем равенство τ = -2р. После излома оптимальное решение удовлетворяет соотношению (1), из которого следует, что р(1 + «2)2 1 + й2(т) -рй(т) (2) ίΜ = ΪΤ^ ри t = - Но 2и dx -f(i+2.W). аи at аи аи 2 V и / Интегрируя это соотношение с учетом равенства х(т) = 0, й(т) = 1, получаем параметрические уравнения искомой оптимальной кривой: & = -?6п- + г*2 + -V) + -р, < = -ξ(- + 2г* + гА ρ < 0. 2 V гл 4/8 2 \г* /
266 Глава 4. Задачи оптимального управления Константа ρ определяется из начального условия x(Tq) = ξ. Эту кривую называют кривой Ньютона, Покажем, что έ доставляет абсолютный минимум в задаче. В силу оптимальности по и для любой допустимой функции χ е PC1 ([0,Го]), х(0) = О, х(П) = £, -px{t) > Γι рЩ. 1+*2(0 * w"i+42(t) Интегрируя это соотношение и учитывая, что Го Го I x(t)dt= ί £(ί)άί = ξ, 0 Го /: tdt l+x2 0 Го tdt получаем о о Значит, ± Ε absmin. Сопоставим полученное решение с решением, полученным Ньютоном. Обозначим MN = t, ВМ = ж, BG = т, угол BGP == φ. Тогда из построения Ньютона имеем ВР — = tgp = ж(0 => ВР = т*, GP2 = BG2 + БР2 = (х2 + 1)т2. Таким образом, из пропорции Ньютона MN GP3 t τ\χ2 +1)3/2 xt _т GP ~ 4BPBG2 ^ (ж2 + 1)«/2т ~ 4тжт2 *^ (ж2 + I)2 " 4" Но это — не что иное, как соотношение (1), в которое подставлено значение р0 = -т/2. Отметим еще, что «затупленность» кривой и условие на скачок в точке G = τ (угол там равен 135°) были по существу предусмотрены Ньютоном в его «Поучении» об усеченном конусе. 3.3. Примеры задач оптимального управления 2 Пример 1. I xdt-^> extr; |S| < 2, х(0) = х(0) = х{2) = 0. о Решение. Эту задачу можно свести к задаче оптимального управления, вводя вместо функции χ вектор-функцию (х\,хг) и управление и и обозначения: х\ — х, Х2~х,и = х. Тогда наша задача сведется к задаче оптимального управления:
/' § 3. Избранные задачи оптимального управления 267 2 a?i<ft-+extr; Х\—хъ х2 = и, г*Е[-2,2], Х\(0) = х2(0) = х2(2)-0. о Функция Лагранжа: 2 Л = J (XoX\+p\(t)(±\-x2)+P2(t)(x2-u)) dt + X{x{(Q) + о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = Л0Ж| -f-pt (t)(x \ - х2) + p2(t)(x2-u) Pt(t) = X0t + C, *2 b) трансверсальность по х для терминанта Ζ = ΑιΧ|(0)+λ2Χ2(0)+λ3Χ2(2) L*M = **,(ο), -Μ2) = "W) <=► Ρι(0) = λ,, ρι(2) = 0, Lt№ = /ΐ2(ο), £*2(2) = -1Χι{2) <^ ρ2(0) = λ2, Λ(2) = -λ3; c) оптимальность по и d) неотрицательность Ло ^ 0 в задаче на минимум, Ло < 0 в задаче на максимум. Если А0 = 0, то из а) следует, что р\ = С и из Ь) р\ = 0. Поэтому из а) р2 = С' Φ 0, иначе все множители Лагранжа оказались бы нулями. Значит из с) й = 2 или й = -2, т. е. ж = 2 или ж = -2, откуда ж — £2 + A\t -f А2 или χ — -t2 + B\t + B2. В обоих случаях не существует функции такого вида, удовлетворяющей условиям на концах х(0) = х(0) = х(2) = 0. Полагаем А0 = 1 в задаче на минимум. Тогда из a) p\(t) = t -f С и - 2Ϋ и из b) pi(t) = t - 2, далее из а) следует, что p2(t) = h С". Получили, что p2(t) — парабола с ветвями, направленными вниз и вершиной на оси t = 2, следовательно, рг(0 или не меняет свой знак на отрезке [0,2], или меняет его с минуса на плюс в некоторой точке г G (0,2). И, значит, из с) оптимальное управление й на всем отрезке
268 Глава 4. Задачи оптимального управления тождественно равняется двум или минус двум или меняет свое значение с минус двух на плюс два в некоторой точке т. Но как мы уже выяснили в первых двух случаях функций, удовлетворяющих начальным условиям нет. Осталось рассмотреть случай * - * - \ · 2, τ < ί < 2. Интегрируя это равенство, находим, что a J-2i + C,, 0<*<т, \ 2t + C2, τ<ί<2. Из условий на концах х(0) = х(2) = О * _ / -2*. О ^ < < т, \2ί-4, т<*<2. Поскольку функция должна быть непрерывной в точке τ, то -2т = 2т-4, откуда г = 1. Интегрируя еще раз, получаем ~Ь2-4< С,, <К*<1, + С2, 1^^2. Из начального условия х(0) - О Ф> Ci = 0 и условия непрерывности в точке τ = 1 : -1 = 1 - 4+С2 «=> С2 = 2 находим допустимую экстремаль А= J-*2. <Κί^1, \*2-4* + 2, 1<*<2. Докажем с помощью непосредственной проверки, что функция £ доставляет абсолютный минимум в задаче. Возьмем функцию h € РС2([0,2]) такую, чтобы & + Л, была допустимой в задаче. Для этого надо взять функцию Л, для которой |£ + Л| < 2, ft(0) = Л(0) = Л(2) = 0. 2 Имеем для функционала J(x(-)) = Jxdt о 2 2 2 2 2 J(&+h)-J(£)= f{£+h)dt-f&dt = ihdt = - /p2hdt = - /hdp2. 0 0 0 0 0 Интегрируя по частям дважды с учетом условий ft(0) = h(0) = h(2) = 0, р2(2) = 0, получим 2 2 2 2 J(£ + h)-J(£)= I hp2dt-hp2\ = / hdp2 = hp2\ - / hp2dt = - / Лр2<й.
§ 3. Избранные задачи оптимального управления 269 Разбивая отрезок интегрирования на два и учитывая, что i/i^O, 0<ί<1, а Г \ h ^ О, 1 ^ t < 2, \ Рг < 0, 0 < * < 1, Р2 ^ 0, 1 < t < 2, имеем J(x I ^ + /ι) - J(u) = - jhp2dt- J hp2 dt ^ 0. Таким образом, ж € absmin. При этом 2 1 2 Smin = J(£(·)) = f xdt= f -t2dt + f(t2-4t + 2)dt = 0 0 1 i3|i /*3 2 \|2 1 8 1 = "T +(τ-2* +2ί) = -т + т-8 + 4--+2-2=-2. 3 lo V 3 /Ι ι 33 3 Ясно, что при решении задачи на максимум -ж € absmax, 5max = 2, так как функционал J (ж) является нечетной функцией относительно ж, а множество допустимых функций симметрично относительно нуля. Ответ. 4=i"' · °^'^1'€absmin, 5min = -2; -ж G absmax, \ί2-4ί + 2, KK2, Пример2. r->min; -l<i<3, ж(0) = 1, ж(Т) = -1, ж(0) = ж(Г)=0. Решение. Приведем задачу к виду задач оптимального управления, вводя вместо функции χ вектор-функцию (ж),ж2), управление и и обозначения: Х\ = Ж, Ж2 = Ж, U = Ж, Т—►min; Х{=х2, ж2 = w, ti €[-1,3], ж,(0) = 1, ж,(Г) = -1, ж2(0) = х2(Т) = 0. Функция Лагранжа: г Λ = /Ы*)(*1 - хг) +РгШ±г - и)) dt + о + А0Т + А,(ж,(0)- 1) + А2ж2(0) + А3(ж1(Т) + I) + А4ж2(Т). Необходимые условия: а) система уравнений Эйлера для лагранжиана L — p\(t)(±\ - х2) + p2(t)(x2 - и)
270 Глава 4. Задачи оптимального управления d -1 ~~~7Г*^£2 +^2 = 0, b) трансверсальность по ж для терминанта I = Л0Т-Ь λ ι (ж ι (0) - 1) + А2ж2(0) + А3(ж,(Т) + 1) + А4ж2(Г) Ы0) = 1*,(о)> £*,(Г) = -1,|(Г) <=* Ρι(0) = А,, р,(Т) = -Аз, Ы°) = i«a(o), £*,(Г) = -1,2(у> <=* й(0) = А2, Й(Г) = -А4; c) оптимальность по и Г-1, й(0<0, min {-ft(i)«} = -й(0*(0 =* *(«)'= S 3, ft(i) > 0, и€Н'3] [любое из [-1,3], ft(i) = 0; d) стационарность по Г: ЛГ(Т) = 0 ^=^ А0 + A3aci(T) + А4ж2(Г) = 0; e) неотрицательность: λο ^ 0. Учитывая то, что из начального условия следует Х\{Т) = 0, а из Ь) Л4 = -р2(Т), получаем, что d) равносильно условию А0 = р2(Т)й(Т). Поэтому если А0 = 0, то Р2(Т) = 0 либо й(Т) = 0, но отсюда из с) вновь Р2(Т) = 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из а) Р20) = C(t - Τ), С Φ 0, а тогда из с) следует, что u(t) ξ -1 или u(t) = 3, т.е. £ = -1 или £ = 3, откуда ж = -£2/2 + А|£ + Аг или ж = 3i2/2 + B\t + Б2. В обоих случаях не существует функции такого вида, удовлетворяющей условиям на концах ж(0) = 1, ж(Г) = -1, ж(0) = х(Т) = 0. Таким образом, в случае А0 = 0 нет допустимых экстремалей. Полагаем А0 = 1. В силу условий п. а) р2 — линейная функция, не тождественно равная нулю. Значит р2 может менять свой знак на отрезке [0,Т] не более одного раза. Причем, если функция р2 не меняет свой знак на [0,Т], то u(t) = -1 или й(Ь) = 3. В обоих случаях мы уже проверили, что нет допустимых экстремалей. Поэтому р2 меняет знак на [0, Т] ровно один раз в некоторой точке г Ε (0,2). Получаем две возможности: и = £ = < 4 t ^ m или й = & = < , , m Первый случай невозможен, так как тогда параболы с заданными условиями на концах не пересекаются. Интегрируя второе равенство, находим, что t<T. \3* + С2, т<<
§ 3. Избранные задачи оптимального управления 271 Из условий на концах ж(0) = х(Т) = О имеем л ί -ί, 0 < ί ^ τ, Ж \3(ί-Τ), τ<ί<2\ Поскольку ж Ε РС2([0,Т]), то функция х должна быть непрерывной в точке т, поэтому -т = 3(т - Г), откуда τ = ЗГ/4. Интегрируя еще раз, получаем {t2 ЗГ 3(ί - ΤΫ ЗГ Из начальных условий ж(0) = 1, х(Т) = -1 следует, что С = 1, D = -1, ЗГ 9Г2 ЗГ2 а из условия непрерывности в точке г = —: — + 1 = 1 4 32 32 4 находим, что Г = —=.. Таким образом, имеется единственная допустимая экстремаль ±= < —2+1. 0<ί<ν/3, 3(<-4)2 4 Аналогично тому, как это было сделано в простейшей задаче быстродействия, можно показать, что at Ε absmin, т. е. найденное значение 4 Τ = -ψ. доставляет абсолютный минимум в задаче. v3 -у + 1, O^t^y/З, 4 Ответ. { Зл _ 4 \2 € absmin, Smin = -?=. 3.4. Задачи оптимального управления 7х/4 3.1. / ж sin* dt -> extr; |£| < 1, ж(0) = 0. о ж 3.2. / ж sin* dt -* extr; \х\ < 1, χ(-π) = ж(тг) = 0. -τ
272 Глава 4. Задачи оптимального управления 4 3.3. / (ж2 + ж) dt -► extr; |ж| < 1, ж(4) = 0. о Го 3.4. f(x2 + x)dt-* extr; |ж| ^ 1, ж(0) = 0. о Го 3.5. / (ж2 -x)dt-^ extr; |ж| ^ 1, х(0) = 0. о Го 3.6. I (ж2 + х) dt -* extr; |ж| ^ 1, ж(Г0) = 0. о Го 3.7. / (ж2 + х) dt -* extr; |ж| ^ 1, ж(0) = ж(Г0) = 0. о Го 3.8. /(ж2 - ж) dt -► extr; |ж| ^ 1, ж(0) = ж(Г0) = 0. о г 3.9. /(ж2 + ж) dt -> extr; |ж| < 1, ж(0) = 0, ж(Г) = 2. о τ 3.10. /(ж2 - ж2) dt -♦ extr; |ж| < 1, ж(0) = 0. о 3*/2 3.11. Мж2 - ж2) dt — extr; |ж| < 1, ж(0) = ж(у) = 0. о Го 3.12. /(ж2 - ж2) ей — extr; |ж| ^ 1, ж(0) = 0. о Го 3.13. Мж2 - ж2) dt -► extr; |ж| ^ 1, ж(0) = ж(Г0) = 0.
§ 3. Избранные задачи оптимального управления 273 ι 3.14. xdt-~* extr; |2| < 2, х(0) = ж(0) = 0. о 1 3.15. xdt-* extr; \х\ ζ 2, х(\) = х(1) = 0. о 1 3.16. xdt-+ extr; |2| ^ 2, х(0) = ж(1) = 0. о 2 3.17. fxdt-> extr; |£| < 2, х(0) + х(2) = 0, £(2) = 0. о 2 3.18. [ xdt-> extr; |£| < 2, ж(0) + х{2) = 0, *(0) = 0. о I 3.19. xdt^ extr; |£| < 2, х(0) + ж(1) = 0, ж(0) + *(1) = 0. о 2 3.20. I xdt-> extr; |£| < 2, ж(0) = £(0) = я?(2) = 0. о 2 3.21. xdt-+ extr; |£| < 2, £(0) = £(2) = ж(2) = 0. о 4 3.22. I xdt-^ extr; |£| ^ 2, ж(0) = ж(4) = 0. о 4 3.23. xdt-* extr; |£| ^ 2, ж(0) = ж(4) = £(4) = 0. о 4 3.24. J xdt-+ extr; |£| < 2, ж(0) = я?(4) = £(0) = £(4) = 0.
274 Глава 4. Задачи оптимального управления 4 3.25. J xdt-> extr; |£| < 2, х(0) + ж(4) = 0, £(0) = £(4) = 0. о 3.26. Τ — min; |£| < 2, ж(-1) = 1, ж(Г) = -1, £(-1) = £(Т) = 0. 3.27. Τ -♦ min; |£| < 2, ж(-1) = -1, х(Т) = 1, £(-1) = £(Т) = 0. 3.28. Г -> min; |£| < 2, £(0) = £(Г) = 0, х(0) = 1, ж(Г) = 3. 3.29. Τ -♦ min; -3 < £ ^ 1, ж(0) = 3, ж(Г) = -5, £(0) = £(Г) = 0. 3.30. Τ -♦ min; 0 < χ < 1, ж(0) = ft, £(0) = ft, ж(Т) = £(Т) = 0. 3.31. Τ -+ min; |£| < 1, х(0) = ft, £(0) = ft, *(Т) = 0. 3.32. Г -> min; |£| < 1, х(0) = ft, £(0) = ft, х(Т) = 0. 2 3.33. I \x\dt -♦ min; £ ^ -2, ж(0) = 0, х(2) = -1, £(2) = -2. о 2 3.34. А |£| dt -> min; £ ^ -2, ж(0) = £(0) = 0, х{2) = -3. о 2 3.35. / |£| dt -» min; £ ^ -2, ж(0) = £(2) = 0, х(2) = 3. о 2 3.36. / |£| А -♦ min; £ < 2, ж(0) = 0, х(2) = 1, £(2) = 2. о 2 3.37. ί |£| <ft -♦ min; £ < 2, ж(0) = 1, £(0) = -2, ж(2) = 0. о I 3.38. fx2dt-> min; £ ^ 24, ж(0) = И, ж(1) = £(1) = 0. о 2 3.39. x2dt-> min; £ ^ 6, х(0) = £(0) = 0, х(2) = 17. о ι 3.40. fx2dt-> min; |£| < 1, ж(0) = £(0) = 0, ж(1) = ~.
Ответы к задачам главы 4 275 3.41. х(2) -> extr; \х\ < 2, f x2dt = 2, х(0) = 0. о Го 3.42. ж(Т0) — extr; / χ2 dt = 1, |жК 1, »(0) = 0. Q 3.43. / ί ^~ + \x\ J dt -> extr; χ(1)=ξ. о Го 3.44. f(xy - ух) dt -► sup; *2 + tf2 ^ 1, ж(0) = x(T0), 2/(0) =. у(Г0). о Го 3.45. f(xy -yx)dt-+ sup; (χ - £)2 + 2/2 ^ 1> *(0) = *№>), 2/(0) = У(2о). ο Γ° 3.46. f(xy-yx)dt-*sup; (|)Ч (|)2< 1, а?(0) = а?(Г0), 2/(0) = 2/(Γ0). о Го 3.47. у (xjjf -yx)dt-+ sup; |*| < 1, |у| < 1, ж(0) = х(Т0), 2/(0) = 2/(Г0). о Го 3.48. /(atf - ух) dt - sup; |i| + \у\ ζ 1, χ(0) = х(Т0);у(0) = y(TQ). о 1 3.49. x2dt-+ sup; |ж| ^ 1, x(0) = 0. Ответы к задачам главы 4 3.1. at = < -t, <К ί < -, ~ ~ τ~ £ absmin, -£ 6 absmax.
276 Глава 4. Задачи оптимального управления 3.2. £ = < * + <, -ir^<^-j, -f, ™ ^ ίζ г, Ε absmin, 5min = -4; -£ € absmax, ^max — ^· ί-π, -<<<1Γ, 3.3. € absmin, 4 -1 € absmax. ί *2 J - - 3, 0 «J t < 2, It - 4, 2 < t < 4, *2 Γ0ί 3.4. Γ0<2=>£ = -- -£-; Го > 2 => 4 2 {-ί, 0 «S f < Γ0 - 2, (ί - Го)2 V 40; 4-1-Γο, Γ0-2<ί<Γ0ι £ € absmin; t € absmax. Γ03 3.5. Го ^ 2 =► -- + -J- € absmin, Smi„ = -=i; Г0 > 2: 4 2 12 4 = ίί, 0^<^Γο-2, | -(<-Γο) _1+Γο> Γο_2<ί<Γο, € absmin; -ί € absmax, Γ2 «max = Γ) + —. t2 Го2 3.6. Γ0<2=ί>£=---7-;Γο>2=ί>£ = 4 4 £ € absmin; -ί + Го € absmax. 3.7. Го «S 4 => * = "*" Г°'; Го > 4 =» U-Γο, Го, <К*<2, 2 < * «S Г0, -ί, О < t ^ ^ - 2, *=| ίίζί}_ + 1_?£, ^_2<ί<? + 2, *€absmin; 4 2 2 2 ί-Γβ, ^ + 2<<<Γ0, «, о < t ^ ^, £ = < _ € absmax. Γο-ί, γ<ί<Γ0,
Ответы к задачам главы 4 277 3.8. Го < 4 =► £ = *(Т° *' e absmin, Smi„ = -?§■; Г0 > 4 =► 4 48 t, О < ί < у - 2, Л = < -£1Д_1+» ?-2ΐί<?+2,« absmin; Το-ί, ^ + 2<*<Г0, 4= < Го Γο G absmax, 5max = Γ0 + -^. ^ - lb, — < t < Го, ί- 3.9. Допустимая экстремаль в задаче на минимум: х = < 4' ^ ^ ' U-1, 2<КГ, Г = 3; 5min = -оо, 5max = -boo. ί, 0<* <τ, 3.10. χ = ± < cos£ G absmin, где т — корень уравнения —:—, τίζί^ΤΓ, sin τ с _ τ\ с τ — —ctgr, omin — r~; jjmax — 7Γ. 14 0<ϊ<τ, cos (t - 3ί) 3π 3.11. A = ±4 Jsin(T-f)' T^<^Y~T' € absmin, где г - 3ir 3π 3ir I 2 -i, 2-'<i<T. / 3π\ Λ 2rJ Λ 3π корень уравнения г = -ctg (jr - — J, 5min = —yl Smax = γ. *7Γ 7Γ 3.12. Г0<-=>й = Ое absmin, 5min = 0; Г0 = у => 4 = С sin* G absmin V|C|<1, Smta = 0; Го > - => χ -±{VTTr Ο ^ ί ^ τ, 2cos(*-T0), r^t^To, G absmin, где г (7Г \ Τ r0~-;r0J, 5min = - —; 5max = 2o. Решение задачи см. [АГТ, N° 11.44]. 3.13. Το<π^>£ΈΞθ£ absmin, 5min = 0; Γ0 = π => χ = С sin* G absmin V|C|<l,5min = 0;
278 Глава 4. Задачи оптимального управления it, (К*^т, \/l + T2cos(t-yV τ<*<Γ0-τ, G absmin, где г — корень уравнения rtgl--— τ) = 1, лежащий на отрезке Г0 π Го! „ 2т3 β т ί η\ ΐ · . 2πητ ^ λ у-2;ТГ min = ~T;5тах = Го ^n(0 = y signsin-^-drJ. 0 3.14. -£2 G absmin, 5mln = --; t2 € absmax, 5max = -. 3.15. -(* - l)2 G absmin, Smin = --;(<- l)2 G absmax, 5max = -. 2 2 3.16. t2 - It G absmin, 5min = --; —i2 + 2i € absmax, 5max = -. 4 4 3.17. £ = (t-2)2 -2e absmin, 5min = —; -4 6 absmax, 5max = -. 4 4 3.18. at = t2 - 2 G absmin, 5min = --; -4 G absmax, 5max = -. л 1 л 1 3.19. t-te absmin, 5min = --; -r + te absmax, 5max = -. 3.20. χ = if' ίΛν ,ж Я' ?<'<?: У!' 6 absmin; 4\/2> + 12 - 8>/2, 2-v5<i<2, -A 6 absmax. ~Ь2-(8- 4 G absmax. 3-21. έ = { ?(7i'2)af J JI J J| € absmin; -x 6 absmax. 32 32 3.22. t2 - At G absmin, Smin = —-; -t2 + 4* € absmax, 5max = —. 3.23. x = /*2 + (8-^«. °<J<2^' 6absmin, 5min = _Ηί^; ff2 + (8-8< l-(<-4)2, -A 6 absmax, Smax = 2v^<i<4, 32(2-л/2) ί2, 0<ί<1, 3 3.24. χ = ^ (ί - 2)2 - 2, 1 < ί < 3, € absmin, 5mi„ = -4; -χ € absmax, -(t - 4)2, 3 ^ t < 4, "max = 4. 3.25. £ = ■( (t - 2Ϋ - 2, 1 < t < 3, € absmin, -x € absmax. Г -f2, 0 £ ί £ 1, <(ί-2)2-2, Ι^ίΟ, t -(f - 4)2, 3 < ( < 4,
Ответы к задачам главы 4 279 "* (*={ΐ+«-., ?<ί*2:ί-2)εΛ-»ΐη· 3.29. U = < __+3, „«^, ^ (*-8/V3)2 , 2 8 V3 —ϊ 5' 71^71' У € absmin. 3.30. Допустимые экстремали существуют при ξ\ > £|/2, 6 < 0, 3.31. 6 > 0 => (а = —- + &ί + ξι> $ = б) € absmin; 6 < 0 =► (а = - +& + ξ,, Τ = -б) € absmin. 3.32. 6 > 0 =► (& = - - + ξ2ί + f ι, ί = 6 + уЙ + 26 ) 6 absmin; 6 <0=> (* = -+6* + £ь ί = -6 + \ji\ - 2f ι ) €absmin; 6 =0=>^ = 0е absmin. ГО, 0<*<I, 3.33. A = < _,{ _ jo ι < ^ < 2 e absmin, Smin = 2. "* *-{:£+1, ΐί!^**-'"·5--2· Γ 2*. 0 < t ^ 1, 3.35. £ = | 3 _ (i _ 2)2) j ^ t < 2> € absmin, Smin = 2. 3.36. £ = | (f _ 1)2> ! ^ f ^ 2) € absmin, Smin = 2. 3.37. £ = { J" 1)2> ° J ί ί J' € absmin' 5min = 2· Г ι 1 I 8i3-Ш+11, (K*< -, 3.38. £ = < 2 G absmin. 12(i - l)2, 5 < ί < 1,
280 Глава 4. Задачи оптимального управления 3.39. * = Н + 6'2' 0^<4 absmin. \3*2 + 3*-1, 1<*<2, 3.40. £ = < t2 1 -j. <К<<-, 2 €absmin, 5min = -. ί ι t I 1 J Τ"' -4-24- i*'*1· 3.41. -< G absmin, 5min = -2; ί G absmax, 5max = 2. 3.42. To < 1 => допустимых экстремалей нет; Го ^ 1 => * = --да G absmax, S^* = >/ϊο; -* € absmin, 5min = -у/Tq. 3.43. K| < 1 => 4 = ί € absmin; |£| > 1 =» с, 0<t<j5i· ж = ^ G absmin, где константа С отыс- .Cd,('-jci)· jci*'*1· кивается из граничного условия на правом конце: Cch ί 1 - — J =£; 5max = +00 («„(ί) = n(t - I) + ξ). 3.44. Оптимальная траектория — окружность радиуса —. Решение этой 2тг задачи и задач №№ 3.45-3.48 см. [АТФ, стр. НО]. 3.45. Оптимальная траектория — эллипс (х2 + у2)1/2 - £у = const. 3.46. Оптимальная траектория — эллипс Г-J + i-J =Л2. 3.47. Оптимальная траектория — квадрат |ж| + \у\ = const. 3.48. Оптимальная траектория — квадрат |ж| = const, |y| = const. t . Г . (2п + 1)тгт , 3.49. Допустимые экстремали: &n(t) = ± / sign cos dr, о η G Ζ; «о € absmax.
Глава 5 Условия второго порядка в вариационном исчислении В этой главе даны необходимые и достаточные условия экстремума в простейшей задаче вариационного исчисления. Это классические условия — условия Лежандра, Якоби, Вейерштрасса и другие. Причем эти условия будут выведены как следствия принципа максимума. Условие Вейерштрасса будет также выведено без принципа максимума с помощью игольчатых вариаций. При выводе достаточных условий в простейшей задаче вариационного исчисления будет строиться поле экстремалей, выводиться основная формула Вейерштрасса. Формулируется и доказывается отдельно теорема о необходимых и достаточных условиях экстремума в простейшей задаче вариационного исчисления с квадратичным функционалом. Аналогичные необходимые и достаточные условия экстремума могут быть получены и в других задачах (Больца, изопериметрической задаче, задаче со старшими производными). § 1. Простейшая задача вариационного исчисления Рассмотрим простейшую задачу вариационного исчисления (для определенности задачу на минимум) J(x(.)) = f L(t,x(t),x(t)) dt - inf; x(t0) = x0, x(t{) = xx. (P) t0 1.1. Сильный и слабый экстремум Задачу (Ρ) мы рассматривали на слабый экстремум. Иногда чтобы подчеркнуть, что задача рассматривается на слабый экстремум, мы будем писать P(W). Множество допустимых элементов в задаче на слабый экстремум D(P(W)) составляют непрерывно дифференцируемые функции класса Cl([to,t\]) с заданными условиями на концах.
282 Глава 5. Условия второго порядка в вариационном исчислении Напомним, что функция £ € D(P(W)) доставляет слабый локальный минимум в задаче (Р) (£ € wlocminP), если она доставляет локальный минимум в пространстве C]([t0J\]), т.е. если существует δ > О такое, что J(x) ^ J(x) для любой функции χ Ε D(P(W))9 для которой 11*0-*01Ьам.])<'· Наряду со слабым экстремумом простейшую задачу вариационного исчисления будем рассматривать на сильный экстремум P(S) (буква S — начальная буква слова strong — сильный). Множество допустимых элементов в задаче на сильный экстремум D(P(S)) составляют кусочно- дифференцируемые функции класса PC[([to,t\]) с заданными условиями на концах. Функция £ е D(P(S)) доставляет сильный локальный минимум в задаче (Р) (£ Ε strlocminP), если она доставляет локальный минимум в пространстве C([t09ti]), т.е. если существует δ > О такое, что J(x) ^ J(£) для любой функции χ Ε D(P(S)), для которой Ν·)-*(·)ΙΗ[Μ!])<*. Так как множество функций, среди которых доставляется сильный экстремум, шире, чем для слабого экстремума, то если функция χ Ε Cl([to9ti]) доставляет сильный, то она доставляет и слабый экстремум. Поэтому для функций £ Ε C{([t0,t\]) необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного экстремума является достаточным условием слабого. 1.2. Пример слабого, но не сильного экстремума Приведем пример задачи, в которой допустимая экстремаль доставляет слабый локальный минимум, но не доставляет сильного локального минимума ι /*3<tt-Miif; χ(0) = 0, х(1) = 1. о Необходимое условие слабого, а значит и сильного экстремума — уравнение Эйлера: -—Lx + Lx = 0 <=» -т-Зл2 = 0 <=> Ъх2 = С <=ϊ χ = const. at at Общее решение уравнения Эйлера: χ = C\t + Ci. Из удяовий на концах находим, что С\ = 1, С2 = 0. Таким образом, имеется единственная допустимая экстремаль £ = t. Покажем, что она доставляет слабый локальный минимум в задаче (£ Ε wlocmin). Действительно, если h Ε Cq([0, 1]), to ι для функционала J(x) = /ж3dt имеем о
§ 1. Простейшая задача вариационного исчисления 1 1 1 283 J(x + h)- J(x) = ί(\ + h)3 dt- f l3dt= f h2(3 + h) dt (*) Отсюда видно, что если \\h\\x <3,то 3 + h(t)>Q и, значит, J(x + h)^ J(£), т.е. £ G wlocmin. Покажем, что at не доставляет сильного локального минимума (х g strlocmin). Рассмотрим последовательность функций hn (n> 1) такую, что |-л/£, te [θ,-], МО = { Тогда М0 = fhn(T)dr = = < ί-Viu, <€ [θ,-], 1 /1 1\ --=, 4 6(-_), Vn Vn 2/ 2ί 2 г1 ι Легко понять, что ftn Ε PCq([0, 1]) и ||Λη||<7([ο,ι]) -+ 0 при η —► оо. Положим жп = А -f hn. Получим последовательность допустимых (в задаче на сильный экстремум) функций хП9 жп(·) —► £(·) в метрике пространства С([0,1]), для которых в силу (*) I l/n I J(a?„) - J(4) = fhl(3 + hn)dt = fn(3 - >/η)Ά + j ^(з + -^L) dt = 1/2 , /- 6 4 = 3-Vn + - + η rt\/n -00, при η -* оо, т.е. функция £ не доставляет сильного локального минимума (£ g strlocmin), более того Sstrabsmin = -оо. Ниже в п. 1.4.3 в лемме о скруглении углов покажем, что функция класса С1, доставляющая абсолютный слабый экстремум, доставляет И СИЛЬНЫЙ, Т.е. SstrabsminP = SwabsminP- В нашей задаче можно было построить последовательность допустимых функций хп класса С1 такую, что J(xn) —> -оо, т.е. сгладить функции жп.
284 Глава 5. Условия второго порядка в вариационном исчислении 1.3. Условия Лежацдра, Якоби, Вейерштрасса Рассмотрим простейшую задачу вариационного исчисления, для определенности задачу на минимум и j(x{.)) = f L(t9x(t)9x(t)) dt -* inf; »(ίο) = xq, x(h) = x\. (P) to Пусть £ e Cl([to,t\]) — некоторая фиксированная допустимая (±(ίο) = «Of *('ι) = «ι) экстремаль (т.е. функция ± удовлетворяет уравнению Эйлера). Далее предполагаем, что интегрант L по меньшей мере дважды непрерывно дифференцируем в некоторой окрестности расширенного графика Г& (L € С2(0(Гхх))). Возьмем функцию h Ε Co([to»'i])· Пусть А € wlocminP, тогда функция одного переменного φ(Χ) = J(4(.) + Aft(·)) = / L{U*(ί) + ΑΛ(ί),*(ί) + Xh(t)) dt к имеет минимум при λ = 0. Из условий, наложенных на гладкость функции L следует, что функция φ(λ) дважды дифференцируема в нуле. Поэтому по необходимому условию минимума первого порядка (по теореме Ферма) у/(0) = 0, т.е. φ'(θ) = J (Li(t)h(t) + Lx(t)h(t)) dt = 0 Vhe Ci([io,i|]). (1) to В главе 3 п. 1.3 было показано, что из соотношения (1) следует уравнение Эйлера — необходимое условие слабого минимума в простейшей задаче. По необходимому условию второго порядка минимума для функции одной переменной (р"(0) > 0, т.е. /(0) = f {Lxx{t)h2{t) + 2Lxx(t)h(t)h(t) + Lxx(t)h2(t)) dt > 0 to Vfc€CJ([io,i,]). Из соотношения (2) выводятся условия второго порядка минимума для простейшей задачи вариационного исчисления. Важную роль играет коэффициент L±±(t) при h2. ^ Говорим, что на экстремали £ выполнено условие Лежандра, если Lxx(t) ^ 0 Vf £ [totti] и усиленное условие Лежандра, если Lxx(t) > 0
§ 1. Простейшая задача вариационного исчисления В векторном случае χ = (жь... ,хп) £ C]([to,t\],Rn), Lxx — 285 ' L±{±x <<ΜχηΧ\ Lx± = JXnX\ JX\XX Lxx — Lxx — LxtXn < L±nXl ... L±nXn LxiXi · · · ^X\Xn Jx*i — матрицы размера η χ η. Отметим, что матрица L±x(t) является транспонированной к матрице Lxx(t) и (Lxxh,h) = (h,L*xxh) = (h,Lxxh). Условие Lxx(t) ^ 0 означает неотрицательную определенность матрицы, условие Lxx(t) > 0 — положительную определенность матрицы. Соотношение (2) можно переписать в виде и /((ϊ^/ι,/ι>+2(£ιά/ι,/ι> + (Χ^/ι,/ι>)^^0 V/iEC(5([*o,*,],Rn). к Пусть далее LXX,LXX,LXX € Cl([t0,ti),Rn ) и выполнено усиленное условие Лежандра. Уравнение Эйлера по h - -rL^t) -f Lh(t) = О для интефанта at L = L(t, h, h) := Lxx(t)h2(t) + 2Lxx(t)h(t)h(t) + Lxx(t)h2(t), т. е. уравнение -jt(Lxx(t)h(t) + Lxx(t)h(t)) + Lxx(t)h(t) + Lxx(t)h{t) = 0 называется уравнением Якоби для исходной задачи на экстремали ж. Точка τ называется сопряженной к точке t0, если для решения уравнения Якоби Λ(·) с начальными данными /ι(£ο) = 0, /&(£0) = 1, функция ft в точке τ обращается в ноль (h(r) = 0). Говорят, что на χ выполнено условие Якоби, если в интервале (to,t\) нет точек, сопряженных с tQ, и усиленное условие Якоби, если в полуинтервале (to,t\] нет точек, сопряженных с tQ. Уравнение Якоби — линейное дифференциальное уравнение второго порядка, которое (из-за усиленного условия Лежандра) можно разрешить относительно второй производной. Для вектор-функций χ = (&ι,... ,жп) ищется фундаментальная система решений уравнения Якоби — матрица H(t)=(h\t)...hn(t)) = h\(t) ... hi(ty X(t) Kit),
286 Глава 5. Условия второго порядка в вариационном исчислении с начальными условиями Η (to) = 0 (нулевая матрица), Η (to) = I (еди- ничная матрица) или detH(to) Φ 0. Вектор-столбцы h% = Ι ... решения системы уравнений Якоби. Нетрудно понять, что точка τ является сопряженной тогда и только тогда, когда матрица #(·) является вырожденной, т.е. det#(r) = 0 Пусть / : Rn —► R — дифференцируемая функция η переменных. Функцию £(х9х') := f(x') - f(x) - f\x)(x - χ) назовем функцией Вейерштрасса функции /. Геометрический смысл функций € таков: 6(х,х') — разность в точке х' между значением / и значением аффинной функции, касательной к графику / в точке х. Отсюда ясно, что если / выпукла, то 6(х9х') ^ 0. Можно показать, что верно и обратное. / >№)-Пх)-Пх)&-х) f(x)(x'-x) Рис. 16 Пусть L — интегрант простейшей задачи вариационного исчисления. Функция 6(t,x,x,u) := L(t,x,u) - L(t,x,x) - L±(t,x9x)(u -x) называется функцией Вейерштрасса интегранта L. Таким образом, £(£,ж,х,и) — функция Вейерштрасса функции χ -* L(t,x,x), где t9 χ играют роль параметров. Говорят, что на экстремали χ выполнено условие Вейерштрасса, если €(tyx9x9u) = L(tyxfu) - L(tyxyx) -L±(t)(u- i) ^ O^u e Rn V* G [Mil· Геометрический смысл условия Вейерштрасса на экстремали х: для любого фиксированного t G [*ο>*ι] график функции L=L(x)=L(t,x(t),x) (как функции от х) лежит выше касательной к кривой L в точке x(t).
§ 1. Простейшая задача вариационного исчисления 287 Если функция L(x) выпуклая по χ для любых t, ж, то условие Вейер- штрасса выполняется на любой экстремали £. 1.4. Необходимые и достаточные условия слабого и сильного экстремума Рассмотрим простейшую задачу вариационного исчисления для вектор-функций χ = (ж|,... ,хп) (для определенности задачу на минимум) J(x(·)) - JL(t,x(t)9x(t)) dt -> inf; x(t0) = *0f x(t{) = xx. (P) to 1.4.1. Игольчатые вариации. Условие Вейерштрасса Понятие сильного экстремума ввел в вариационное исчисление Вей- ерштрасс. Для доказательства необходимого условия сильного минимума Вейерштрасс употребил специальные вариации экстремальной функции at вида xx(t) = 4(<) + hx(t)9 где А ^ О, £А + (*-т)£, ί€[τ-λ,τ], ξχ - (t - τ)ξν\, te[r9r + y/x], (ξ e Rn). ίί [τ-λ,τ + ^/Χ], hx(t) u, Aa 0 Да τ-λ τ r+v/λ, Рис. 17 Производная вариации Лд'(*) имеет вид, изображенный на рис. 17 (для удобства изображения взято η = 1, ξ > 0). При малом А она несколько напоминает иголку, в связи с чем подобные вариации называют «игольчатыми». Такие вариации приспособлены к исследованию задач
288 Глава 5. Условия второго порядка в вариационном исчислении на сильный экстремум. Игольчатые вариации несколько иного вида использовались при доказательстве принципа максимума Понтрягина. Очевидно, что χχ() -» £(·) в метрике пространства C([to9t\]9Rn) при А — О. С помощью игольчатых вариаций докажем условие Вейерштрас- са — необходимое условие сильного минимума в простейшей задаче вариационного исчисления на классе кусочно-гладких функций. Теорема. Пусть функция £ € C1([^o>^i]>Rn) доставляет сильный локальный минимум в задаче (Р) (at € strlocminP), и интегрант L непрерывно дифференцируем в некоторой окрестности расширенного графика Г±% = {(«.*(«),*(«)) \t e Mi]} {l e с1(0(Гм))). Тогда на £ выполняется условие Вейерштрасса Ε{τΜτ)Λ{τ)Ατ)+0 :=£(т,4(г),*(т) + 0 -£(г,4(т),*(т)) - -€£*(т,4(т).*(т))>0 V£GRn, Vt € [*o,*ib Нетрудно видеть, что выписанное условие Вейерштрасса является тем же самым, что и в п. 1.3: E(t9&{t)9&{t)9u) =L(t,*(i),«) -L(t9*(t)9e(t)) -£*(ί)(«-*(«)) >0 Vtt€Rn, Vi€[Mi], где t = r9 и = £(т)+£. Доказательство. Возьмем точку τ G (*ο»*ι) (случаи τ = to9t\ Доказываются предельными переходами τ -» £о> τ -» $| в неравенстве). Рассмотрим выписанную выше игольчатую вариацию x\(t) = 4(f) + Лд (О функции х. При достаточно малых λ ^ О отрезок [г - А, г + у/Х) С Т, функция х\ допустима в задаче на сильный экстремум (х\ € D(P(S)))\ хх е PCl([to,t\])9 x\(ti) = ±(ti) + hx(ti) = xi9 i = 0,1. Очевидно, что функция χχ(-) —► £(·) в метрике пространства C([toiti]) при λ —► 0. Поскольку ± Ε strlocminP, то функция одного переменного φ(Χ) = J(xx) = J(± + hx) имеет минимум при А = 0, т.е. <р(Х) ^ <р(0). Отсюда следует, что если производная справа в нуле у?'(+0) существует, то у?'(Н-0) ^ 0. Вычислим у?'(+0). Поскольку функции £(t) и χχ(ί) совпадают при t Ε [to,τ - А] и t G [τ + >/λ,£|] то, разбивая отрезок интегрирования [to,t\] на четыре отрезка, имеем ' λ-+ο λ λ-»+ο λ = lim ± f(L(t9xX9xx)-L(t9A,e))dt= lim{ f (L(t9zX9*+t)-L(t))dt + А—»+0 Л у А—»+0 Л У ίο r-A
§ 1. Простейшая задача вариационного исчисления 289 т+у/Х + Ит - / (L(t9xxfxx)-L(t9&9&))dt=:J\+J2. A—*-f О Л J τ По теореме о среднем для определенных интегралов J, - L(r9 ж(т), £(т) + ξ) - £(т) при А -> 0. Из условий гладкости, наложенных на интегрант L9 вытекает диф- ференцируемость по Фреше отображения L : С[([т,т + л/Х],Кп) —► С([т,т-{-\/X],R"), действующего по формуле L(x()) = L(t9x(t)9x(t)). По определению дифференцируемости по Фреше L(xx)-L(x) = L(& + hx)-L(A) = L'(±)[hx]+r(hx) = £«Ла + £*Ла + г(*а), где ||г(Ла)(-)Нс([г.г+^Х1) = °(HftA(-)llc4[r,r+VXl)) = <К^*)» так как llhA(-)l!c'([rfr+VX]) = maX{ll/lAllc([r,r+v^])'ll^llc([r,r+v^])} = = max{|i|A,|i|^A} = |i|^A. Поэтому r+>/A J2 = lim - / (Χλα + Дг^а 4- г(ЛА)) dt = λ--+ο λ J \ / r Γ+νΊ τ+λ/λ = lim I / 1ж(£Х-и-т)£л/Х)М + lim j / £±(-{\^А)Л+ λ-»+ο А У λ-++ο λ J τ τ τ+VX + lim - / г(ЛА) Л =: Ах + А2 + А3. А-++0 A J τ Используя теорему о среднем для определенных интегралов, найдем величины А\9А29А$: Ах = lim / Lx£dt - lim -= [ Lx · (t - т){й = О, A-+0 J S Α-+0>/λ J τ τ t+V\ A2 = - lim -= / ίχξάί = -Ιχ(τ)ξ9
г О =* А3 = 0. 290 Глава 5. Условия второго порядка в вариационном исчислении т+у/Х т+у/Х |Лз|^л"™оХ / |г(*А)|Л<л5оХ / ИЛа)(-)НС([г,г+Л])<Й = о(УЛ) ~ Vx В итоге, J2 = -1±(τ)ξ и ν'(+0) = L(t, 4(т), *(t) + €) - £(т) - £i(r)i ^ 0. Нетрудно видеть, что выписанное условие Вейерштрасса является тем же самым, что и в формулировке теоремы, где * = т, г* = £(т)-|-£. Условие Вейерштрасса доказано. ■ В задаче на максимум условие Вейерштрасса меняет свой знак. Ниже условие Вейерштрасса будет выведено из принципа максимума Понтрягина. 1.4.2. Необходимое условие сильного экстремума — неравенство (7) Выведем еще одно неравенство, являющееся необходимым условием сильного минимума. При этом доказательство неравенства будет существенно проще доказательства условия Вейерштрасса, а условием гладкости является просто непрерывность интегранта L. Для функции L, дифференцируемой по ж в точке £(t), неравенство будет совпадать с условием Вейерштрасса. Рассмотрим следующие вариации допустимой экстремали £. Пусть точка τ Ε [Jo» *ι] и произвольные числа ξ,η > 0 фиксированы. Положим x\(t) = *(t) + hx(t), где λ ^ 0, ■*λ + (ί-τ){. ί€[τ-λ,τ], Μ0=ΦΑ~('-τ)77' 46[τ·τ4τ]· 0, ί j? [т-А,т + — ].
§ 1. Простейшая задача вариационного исчисления 291 Аа Аа т-А τ 1_ Рис. 18 При η = £л/Л вариации совпадают с вариациями Вейерштрасса. Теорема. Пусть функция at 6 PCl([to9t\]) доставляет сильный локальный минимум в задаче (Р) (at Ε strlocminP), интегрант L непрерывен в некоторой окрестности множества расширенного графика Г±$ (L Ε С(0(Г^)))9 Т С [to,t\] — множество точек непрерывности функции £. Тогда на at выполняется условие ηΙ(τ9±(τ)9±(τ) + ξ)+ξΏ(τ9&(τ)9*(τ) -*)-(€ + ч)£(т,4(т),*(т)) > О V€,*>0, VreT. (7) Доказательство. Возьмем точку τ € (to9t\) Г\Т (случаи τ = *оЛ\ доказываются предельными переходами τ —► t09 τ —> t\ в неравенстве (7)). Рассмотрим выписанную выше игольчатую вариацию x\(t) = at(t) + Лд(0 функции £. При достаточно малых А > О отрезок τ - λ, τ Η СГ, функция х\ допустима в задаче на сильный экстремум (х\ Ε D(P(S)))\ χχ € PCl([t09t\])9 x\(ti) = £(U) + M*<) = я*, г = 0,1. Очевидно, что функция х\() —> £(·) в метрике пространства C([£0,*i]) при А —► 0. Поскольку £ G strlocminP, то функция одного переменного φ(Χ) = J(x\) = J(& + h\) имеет минимум при А = 0, т.е. φ(λ) ^ у?(0). Отсюда следует, что если производная справа в нуле у?'(-Ю) существует, то φ'(+0) ^ 0. Вычислим у?'(-Ю). Поскольку функции ±(t) и x\(t) совпадают при t Ε [t09r - А] и f E \т-\ 9tA то, разбивая отрезок
292 Глава 5. Условия второго порядка в вариационном исчислении интегрирования [*ο»*ι] на четыре отрезка, имеем А-*+0 λ λ-+0 λ ч = лНто - J (L(t9xx,xx) - ЦЬЛЛ)) dt = (интегралы на промежутках интегрирования [*0,т - λ], \τ-\ ,tA обращаются в ноль) '+* = 1ιιηηγ [(L(t,xxj+i)-t(t))dt+lim { f (L(t,xx,k-V)-t(t))dt λ—*+0 A J A-+-fO A J II (по теореме о среднем для определенных интегралов) = £(т, 4(т),4(т) + ξ) - £(т) + - (l(t,*(т), *(г) - ту) - £(т)) > 0 «=* (умножим обе части неравенства на η) 4=> ηΙ(τ,&(τ)9Ητ) + £) + №(т,&(т)Жт) - ч) - (* + *)£(т) ^ О V£,r/>0, Vr€T. ■ Геометрический смысл условия (7) на экстремали £: для любого фиксированного t € Τ точка (£(ί), £(i,ife(0» #(0)) лежит ниже любой хорды с концами по разные стороны от х графика функции L=L(x)=L(t,±(t)fx) (как функции от х). Действительно, \ξ + 7/ ξ + r/ / ς + r/ ξ+τ/ (первое соотношение — это просто тождество, проверяемое сложением дробей, второе соотношение получается, если разделить-обе части условия (7) на ί + τ/). Для выпуклой функции L(x) условие (7) будет выполняться на любой функции xeP&dto^i]). Если L — дифференцируемая в точке k функция, то из условия (7) вытекает условие Вейерштрасса.
§ 1. Простейшая задача вариационного исчисления 293 1.4.3. Необходимые условия сильного экстремума Теорема 1. Пусть функция χ G С]([Ьо,Ь\],Кп) доставляет сильный локальный минимум в задаче (Р) (х G strlocminP), интегрант L непрерывно дифференцируем в некоторой окрестности расширенного графика Г^ (L G С1 (0(Гм))). Тогда на х выполняется уравнение Эйлера и удовлетворяется условие Вейерштрасса €(Ь,х,х,и) = L(t,x,u)-L(t,x,fy-Li(t)(u-k) > О VuGR", Vi€[io,«i]. Если при этом существует Lx±(t) Vt € [to,t\], то выполняется также условие Лежандра: La(t) ^ О V£ G [£ο>*ι]· Доказательство. Формализуем задачу (Р) как задачу оптимального управления «ι / L(t,x,u)dt —► inf; χ = и, x(to) = xq, x(t\) — x\. (Ρ') to Условие χ G strlocminP равносильно тому, что пара (я,й), где u(t) = x(t), является оптимальным процессом в задаче оптимального управления (Р'). Поэтому согласно принципу максимума Понтрягина найдутся множители Лагранжа λ0,λ|,λ2 и р(·) G PCl([to,t\]), λ Φ О, и такие, что для функции Лагранжа задачи (Р') и А= / (XoL(t9x9u) + p(t)(x - и)) dt + X\(x(to) - xq) + A2(z(ci) - x\) to выполняются условия: d a) уравнение Эйлера: --тгр(0 + λο£χ(£) = 0 V£ G [*ο»*ι]; ас b) трансверсальности по х: p(to) = Аь p(t\) = -Аг; c) оптимальности по и: min{A0£(M(*),u) -Р('М = A0JD(i,*(i),*(0) -?(*)*(*)· u€R* v ^ v d) неотрицательности: λο ^ 0. Если A0 = 0, то из с) (поскольку минимум конечен и равен —p(t)x(t)) вытекает, что p(t) = 0, тогда из Ь) — что все множители Лагранжа нули. Значит, λο Φ 0. Полагаем в задаче на минимум Ао = 1. Тогда из с) по необходимому условию I порядка минимума функции f(u) = L(t,x(t),u) - p(t)u следует, что f'(u) = 0 <ί=> L±(t) = p(t), a no необходимому условию II порядка L±±(t) ^ 0 V£ G [io»*ib Подставляя
294 Глава 5. Условия второго порядка в вариационном исчислении ρ = L± в условие стационарности по ж, получаем уравнение Эйлера. Условие оптимальности по и при Ао = 1 и ρ = L± Ь(ЬЛ{Ь),и) -£*(*)» >Ь(«,*(*),4(0) -L±(t)k(t) VttGR", Vi 6 [ίο,ίι] есть не что иное, как условие Вейерштрасса. ■ 1.4.4. Лемма о скруглении углов Лемма. Пусть функция & е PCl([t0,t\],Rn)9 ынтегрант L € C(R2n+l). Тогда существует последовательность гладких функций {zJ^iec'aMibR"), М*о) = *(*о), **(*ι) = Λ(ίι), такая, что Xk(·) —> £(·) в метрике пространства C([to,t\]), и lim J(xfe) = J(£). k-юо Доказательство. Для простоты записи проведем доказательство для η = 1. Возьмем функцию МО f (ι - I'D2 1*1 < ι, 1*1 > ι. АО 1/2 -1 -1/2 Рис. 19 Она непрерывна, а ее производная при t = О имеет скачок величины -1, |Λ(ί)| < 1/4, \h(t)\ < 1/2. Пусты; € (tot'i), г= l,...,m, —точки разрыва производной έ и Δ» = £(т,- + 0) - £(т* - 0) — ее скачки в этих точках. Функция Λ*(·,Τί) = (1/Аг)Л.(/с(- - т*)), график которой получается из графика функции h преобразованиями подобия и сдвиГга, также непрерывна, и ее производная непрерывна, кроме точки т*, где она по-прежнему имеет скачок -1, кроме того \hk(t9n)\ < l/(4fe), |/&*(£,т;)| ^ 1/2. m Тогда функция Xk(t) = £(0 + Σ Δ<Λ*(ί,Τί) непрерывна вместе со сво- 1=1 ей производной на отрезке [ioi'i]» причем xk(t) = £(£) вне отрезков
§ 1. Простейшая задача вариационного исчисления 295 [т{ - l/fc,rt· + l/k]. В частности, для достаточно больших к эти отрезки не перекрываются, хк(Ьо) = £(*о), xk(t\) = £(*ι)> |χ*(ί)-4(ί)|= ^ΔίΜ*^) ι=1 «sr^'-s ► 0 при fc —► -boo, |М0-*(0|= Σδ.·λ*(*.τΟ ι=1 ^ - ιωχ|Δί| = -г (Δ := max|Af-f). 2 г 2 г На компакте {(«,М)|«о<*<«1, |ж-^)К—, |*-*(«)1<§}. непрерывная функция L ограничена: \L(t9x9x)\ < Μ. Поэтому \j(zk)-J(*)\ = f L(t,xk9xk)dt- I L(t9x9x)dt n+\fk Σ [ (L(t9xk9xk)-L(t9x9£)) dt Ti-\/k AMm < —-— при к > к0 и, следовательно, J(xk) -» J(&) при fe -* +оо. ■ Следствие. Абсолютный экстремум в задаче (Р) на сильный и слабый ЭКСтремум Совпадают*. <$strabsminP — 'S'wabsminP· Для локальных экстремумов это может быть не так (см. п. 1.2). 1.4.5. Необходимые условия слабого экстремума Теорема 2. Пусть функция £ Ε C2([t09t\]9Rn) доставляет слабый локальный минимум в задаче (Р) (х Ε wlocminP), интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного графика Р^ (L Ε С {0(Г±ь))). Тогда на £ выполняется уравнение Эйлера, условие Лежандра и9 если на экстремали χ выполнено усиленное условие Лежандра (L±±(t) > О V£ Ε [to, t\\), то выполняется и условие Якоби9 /и. е. на интервале (to,t\) нет сопряженных точек. В задаче на максимум условие Лежандра меняет свой знак. Доказательство. Для простоты записи проведем доказательство для 71=1. 1) Вывод уравнения Эйлера и условия Лежандра. Поскольку функция χ Ε wlocminP, то для любой функции h Ε Co([to>ti]) функция φ(\) = J(x() + Xh(-)) имеет локальный минимум в нуле. Тогда по необходимому условию минимума функции одного переменного φ'(0) = О
296 Глава 5. Условия второго порядка в вариационном исчислении и φ"(0) ^ 0. В главе 3 п. 1.3 было показано, что первое условие равносильно выполнению уравнения Эйлера на функции at. Второе условие эквивалентно неотрицательности функционала К(Ю) = f (Lxx(t)h2(t) + 2Lxx(t)h(t)h(t) + Lxx(t)h2(t)) dt^O to vfceqj ([ίο,*,]). Из неотрицательности и вида функционала К следует, что функция h(t) = 0 доставляет абсолютный минимум (слабый) в задаче «ι K(h(·)) = /(Lxxh2 + 2Lxxhh + Lxxh2) dt -> inf; h(t0) = h(t,) = 0. (P") to По следствию из леммы о скруглении углов функция h = 0 доставляет в задаче (Р") и сильный минимум. Тогда в силу теоремы 1 о необходимых условиях сильного минимума в задаче (Р") на h выполняется условие Лежандра для интегранта L(t9h(t)9 h(t)) := Lxx{t)h\t) + 2Lxx(t)h(t)h(t) + Lxx{t)h\t)y т. e. LmJJ) ^0<^ L±±(t) > 0 Vt € [ίο,ί ι]. Таким образом, условие Лежандра в задаче (Р) выполнено. 2) Вывод условия Якоби. Предположим противное, что условие Якоби не выполнено, т.е. существует точка г Ε (*ο,*ι) и нетривиальное (h ф. 0) решение h Ε C'iftbM) уравнения Якоби, для которого h(to) = h(r) = 0. Отметим, что из нетривиальности решения h однородного линейного дифференциального уравнения второго порядка с условием h(r) = 0 вытекает, что h(r) Φ 0. Положим hit) = < ,/ '* °^,^' Так как функция h удовлетворяет уравнению Якоби, то после интегрирования по частям получим τ К(Щ = ί (Lxxh2 + 2Lxxhh + Lxxh2) dt = ίο τ — I \L±xh + Lxxhh + Lx±hh + Lxxh ) dt = ίο r r = / (Lxxh + Lxxh)hdt+ / (Zxxh + Lxxh)hdt =
§ 1. Простейшая задача вариационного исчисления 297 г = (Lxxh + Lxxh)h\ + / [-^{Lxxh + Lixh) + Lxxh + Lxxh)hdt = 0. to Таким образом, K(h) = 0, а это означает, что h G absminP" (наряду с функцией h = 0). Проводя рассуждения, аналогичные проведенным в теореме 1, получим, что найдется функция р G PCl([to,t\]) такая, что для лагранжиана квадратичной задачи L(t,h,h) = Lxxh2 + 2Lxxhh + Lxxh2 на экстремали h выполняется уравнение Ρ(ί) = ϊΗ(ίΜ*)Λ(ή) <=* p(t) = 2(Lxx(t)tt(t) + Lxx(t)h(t)). Поскольку h(t) = 0 при t > τ, то ρ(τ + 0) = 0 и в силу непрерывности функции р 0 = р(т - 0) = 2Lxx(r)h(r - 0) = 2Lxx(r)h(r) = 0, откуда h(r) = 0 (ибо Lxx(r) Φ 0 из-за усиленного условия Лежандра). Мы пришли к противоречию с условием Κ(τ) Φ 0. Таким образом, предположение противного неверно и условие Якоби выполнено. ■ 1.4.6. Поле экстремалей Рассмотрим простейшую задачу вариационного исчисления t\ J(x(')) = f L(t,x(t),x(t)) at -► inf; x(t0) = xq, x(t{) = xx. (P) to Полем экстремалей в задаче (Ρ) называется множество (иногда говорят «семейство») экстремалей {χ(·,λ)}, я(·,·) € Cl([tQjt\] x A9Rn), с параметром A G Λ G G(Rn) (<£> Λ — некоторое открытое множество в пространстве Rn). (Напомним, что экстремаль — это функция, удовлетворяющая уравнению Эйлера.) Если для поля экстремалей существует точка (£*,ж*) такая, что x(tt,\) = ж* для всех λ G Λ, то это поле называется центральным полем экстремалей, а точка (£*,ж*) называется центром поля экстремалей. Пусть £ — допустимая экстремаль в задаче (Р) (т. е. экстремаль с заданными в задаче граничными условиями). Говорим, что экстремаль χ включена в поле экстремалей {χ(·,λ)}, если £(·) = я(-,А) при некотором A G Λ. Говорим, что экстремаль х, включенная в поле экстремалей, окружена полем экстремалей, если существует окрестность G графика Гх такая, что для любой точки (г, ξ) из этой окрестности имеется единственная экстремаль семейства, проходящая через эту точку; причем функция А : G —► Rn, λ = А(т,£), должна быть класса C](G). Единственность экстремали, проходящей через точку (т,£), означает, что по точке (г,ξ) G G значение λ = А(т,£) отыскивается единственным образом.
•I /< 298 Глава 5. Условия второго порядка в вариационном исчислении Функция u:G-+Rn, «М) = 4с(*,А(т,0)1 =:*(τ,λ(τ,0) at \t=r называется функцией наклона поля. Отметим, что на экстремали at функция наклона поля u(t9£(t)) = &(t) совпадает с производной функции £(t). Пример (гармонический осциллятор). (ж2 - х2) dt -» min; x(t0) = x(t{) = О (0 < t0 < tl < π). ίο Уравнение Эйлера х -f χ = 0. Экстремали этого функционала имеют вид x(t) = C\ sin£ + C2C0SL Допустимая экстремаль £ (t) = 0. Совокупность экстремалей ж(£,Л) = Xsint есть центральное поле экстремалей с центром в точке (0,0), включающее, в частности, экстремаль £ при λ = 0, покрывающее полосу 0 < t < тт. Найдем экстремаль поля, проходящую через точку (т,£) (0 < τ < π): ж(т,Л) =£^Asinr = £^A = -— =» ж(*,Л(т,£)) = -—sin *. Функция sin τ sin τ d ι d £ ι наклона поля г*(т,£) = — x(t9 Л(т,£)) = — -—sin η = fctgr. dt \ыт dtsmr U=r Построение центрального поля экстремалей Теорема. Пусть έ G C2([t0,t\],Rn) — допустимая экстремаль в задаче (Р) (£ G DE{P))> интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного графика Гхх (L G С3(0(Гхх)))9 на £ выполнены усиленные условия Лежандра и Якоби. Тогда £ можно окружить центральным полем экстремалей, покрывающим полосу [t^t\\ χ Rn. Доказательство. Распишем уравнение Эйлера d --r:Li(tix,x) + Lx(t,x,x)=0 ^=^ Lxxx + Lxxx + Lit - Lx = 0. (1) at Так как выполнено усиленное условие Лежандра, то есть неравенство Lxx(t) > 0 V* G [ίο,^ι], то в силу непрерывности функции^ (напомним, что L G С3) найдется такое U G 0(ГХХ), что Lxx(t,x,x) > 0 У(*,ж,ж) G U. Значит, в области U уравнение Эйлера (1) равносильно системе, разрешенной относительно производных Г X == II * = L*(LX-L*-L*xx) <=> \у = ф(г9х9у)9 где Φ(ί, ж, у) := £jj(*, ж, у)(£*(*,ж, у) - £**(*, ж, у) - Lxx(t, ж,2/)у). В силу заданной гладкости интегранта L функция Φ непрерывно дифференцируема в окрестности U. Тогда по теореме существования
§ 1. Простейшая задача вариационного исчисления 299 и непрерывно дифференцируемой зависимости решения от начальных данных (Гл.4, п. 1.3) найдутся такие ε > 0 и δ > О, что a) решение £ продолжимо на отрезок [to - e>t\ -f ε]; b) для любого A G Λ := {A G Rn | |А| < 6} на отрезке [t0 - ε, tx +ε] определено решение ж(-,А) уравнения Эйлера с начальными данными x(tt9X) = x(U)f έ(έ,,Λ) = &(£*) + А, где U — некоторая точка интервала (U-eM). При этом функция x(t, А) непрерывно дифференцируема как функция двух переменных (ж(·,·) G С1^ - ε»*ι + ε] х A,Rn)). Значит, множество экстремалей {ж(-,А)}, λ Ε Λ, является полем экстремалей (даже центральным). В силу единственности решения дифференциального уравнения ж(·, А) = £ при А = 0, т. е. экстремаль £ включена в поле экстремалей {ж(-,А)}. Покажем, что экстремаль £(£), при t Ε [*ο>*ι] окружена этим центральным полем экстремалей. Положим H(t,U) := ^*М)|л=о = *λ(*,λ)|λ=0 dXi(t,X)\ (я,,«,..):=^|А=0,« = . .). тогда *<*··*·>=έ (£*<*· A>L) L=£*<*·· A>L=£(*<'·>+λ)=L Поскольку x(t,X) — экстремаль для любого λ, |λ| < δ, то, дифференцируя уравнение Эйлера (1) по А и меняя порядок дифференцирования в первом слагаемом, получим " S (Α-^*(*·Α>Ιλ^+Ζ*·^χ(*·Α>Ιλ-ι) + =0 ^4^λ)|λ=0^4^(^)|λ=0=ο Значит, матрица #(·,£♦) удовлетворяет уравнению Якоби с начальными условиями H(U9U) = 0, H(U,U) = I. Пусть #(Мо) — матричное решение уравнения Якоби с условиями #(£о,£о) = 0, H(to,t0) = I.
300 Глава 5. Условия второго порядка в вариационном исчислении Поскольку выполнено усиленное условие Якоби, то не существует нетривиального решения h уравнения Якоби, удовлетворяющего условиям h(tQ) = h(r) = 0, to < τ ^ t\. Таким образом, усиленное условие Якоби равносильно невырожденности матрицы #(Мо) при любом t G (to,t\). Но тогда снова в силу теоремы существования и непрерывной зависимости решения от начальных данных при достаточной близости U к t0 матрица #(М*) будет невырожденной для любого t Ε [£ο>*ι]. Рассмотрим функцию Φ : Rn+1 -► Rn+I, действующую по формуле Ф(т,А) = (т,ж(т,А)), для τ е (to-e,t\ +ε), A G Л. Функция Φ переводит точки (τ, λ) в точки (т,£), где ξ = ж(т,А). При этом Φ(ί,0) = (ί>«(ί,0)) = («,*(«)) и якобиан ^ Ή(ί,ο) = det (*М) хд(?,0)) =u«*>(t,0)^<l«H(t,t.)t0 при t G [*ο>£ι]· По теореме об обратной функции (для каждой фиксированной точки t G [fof*i]) существуют функция Ф"*1 и число δ > 0 (зависящие от t) такие, что Ψ~[(τ,ξ) = (τ, λ) для любой точки (т,£), для которой \t-r\ < δ, \±(t)-i\ <δ9ΐΛ Φ(τ,λ)=Γ(τ>*(τ>λ)) = (τ,£). Обратная функция сопоставляет точке (т,£) точку (т, А) единственным образом. Поэтому существует единственное А = А(т,£) (зависящее от t) такое, что ж(т,А(т,£)) = £. Значит, экстремаль х(-,А) действительно проходит через точку (т,£) и она из поля экстремалей определяется единственным образом. В силу компактности графика Г± = {(t9£(t)) G Rn+I | t G [*ο,*ι]} (из любого открытого покрытия компакта можно выбрать конечное подпокрытие) можно найти одно £0» такое, что для любой точки (т,£), для которой τ G [£ο>*ι], Щт) ~~ £1 < *о> существует (и, как нетрудно понять, единственное) λ = А(т,£) (не зависящее от t) при котором ж(т,А(т,£)) = ξ. При этом гладкость функции А такая же, как гладкость поля {ж(-,А)}, т.е. С]. Построение центрального поля, окружающего экстремаль, закончено. ■ Замечание. Пусть at = 0 является допустимой экстремалью в задаче (Р). В условиях предыдущей теоремы для окружения ее центральным полем экстремалей достаточно взять семейство функций ж(-,А) = !)Для отображения /:Rn->Ra, /(χ ,χ») = (/i(xi,...,xn),...,/n(si,...,xn)), (2L· ... *£Λ 0χι "" dxn J I. %,..%] 0X, "" 0Xn/
§ 1. Простейшая задача вариационного исчисления 301 Я(-,£*)А, где U < to настолько близко к t0, что матрица Я (£,£*) невырождена при to ^ t ^ t\. Это поле покрывает всю полосу to ^ * ^ *ι· Кроме того ж(т, А) = ξ & H(r,tt)X = ξ & А = \(τ,ξ) = Η"ι(τ9^)ξ € С1. Функция наклона поля »(т,0 = 4*(*,А(т,0)| =Я(т,МА(т,€) = Я(т,*ф)Я-!(т,«#)€. 5-функция и ее дифференциал Пусть ж(-,А) — дважды непрерывно дифференцируемое центральное поле экстремалей с центром (£*, ж*), окружающее допустимую экстремаль £(·), и интегрант L — трижды непрерывно дифференцируем в некоторой окрестности расширенного графика Г^ (L е Сг(0(Г±±))). Функция τ S(r,i)= J L(t,x(t,X(r,0)^(t,4r,0))dt называется S-функцией центрального поля χ(·,λ). Найдем дифференциал S-функции. Он понадобится нам для вывода основной формулы Вейер- штрасса при доказательстве достаточных условий сильного экстремума. Для нахождения частных производных S-функции нам понадобятся некоторые соотношения. Имеем по определению поля и функции наклона поля *(τ,λ(τ,0)=ί. Дифференцируя обе части этого тождества по т, получим *(т,А(т,{)) + *а(т,А(т,0)Аг(т,{) = 0 => => -Χχλτ = *(т, Α(τ,ί)) ^ «(*",{) (г) (u(t,Q — функция наклона поля). Дифференцируя обе части тождества по £, получим хх(т,Х(т,0)ЫЫ) = 1 (О (I — единичная матрица). Поскольку (£*,ж*) — центр поля, то ж(£*,А) = х*, и, значит, выполняется следующее соотношение *а(«*,А(т,{))=0. (*) Найдем dS/дт, дифференцируя по г интеграл с переменным верхним пределом, и используя непрерывность ±\, вытекающую из того, что χ(·,λ) ЕС2. Имеем
302 Глава 5. Условия второго порядка в вариационном исчислении τ + j (χ.(ί,*(ί,λ(τ,ί)),*(<,λ(τ,ί)))*Α(<,Α(τ,0)Ατ(τ,{) + ί. + ϋ*(ί,χ(ί,Α(τ,0),*(ί,λ(τ,{)))*Α(ί,λ(τ,0)Ατ(τ,θ)Λ = £(τ,ί,») + Τ Τ Τ + / {LXX\K + LiXXXT) dt = £(τ,£, и) + / Х^жаАг dt+ 1έ dxxXT = = £(т,£,«)+£*а!ААг|4 + /(-—£* + £*) «аАг Л = ^ϋίτ,ί,βίτ,ί^-ϋ^τ,ί,βίτ,Οϊβίτ,ί). При выводе мы воспользовались тем, что функции ж(-,А) — экстремали, т. е. удовлетворяют уравнению Эйлера. Формула для dS/θξ выводится аналогично. Дифференцируя по £, получим τ τ τ — = / (Ха-ждА^ + ϋίάλλ^) ctf = / И^ждА* dt+ Li dxxX( = г и Таким образом, имеет место следующая формула для дифференциала функции S: = (ϋ(τ,{,«(τ,0) -Ιέ(τ,ξΜτ,$)Φ,€))*τ+Ι,έ(τ,ζΜτ,ζ))*ζ. Основная формула Вейерштрасса В частности, для функции χ ζ PC*([to,ti],Rn) формула для дифференциала функции 5 примет вид: dS(t,x(t)) = (£(«,*(<),ti(i,»(t))) -I,(«,*(*),«(«,«(«)))«(<,*(*))) di + + £,(ί,χ(ί),β(ί, *(*))) d«(0 = = ϋ(ί,a(t),«(<,χ(ί))) + Li(t,x(t),u{t,»(*))) (*(*) " «(*.*(*))) dt- (0
§ L Простейшая задача вариационного исчисления 303 В таком виде мы ей и будем пользоваться в дальнейшем. Отметим также, что, поскольку u(t,x(t)) = x(t), то dS(t,x(t)) = L(t)dt (2) Поэтому для допустимой экстремали х() и для допустимой функции ж(·) имеем равенство J(£) = f L(t)dt= f dS(t,x(t)) = S(tux{) - S(t0,x0) = f dS(t,x(t)). to to t0 Следовательно, по формуле (1) Ί Ί J(x)-J(x)= f L(t,x(t),x(t))dt- f dS(t,x(t)) = to to = j (l(*,x(*),x(0) -L(t,x(t)Mt,x(t))) -MMM*,x(0))x ίο χ (x(t) - u(t,x(t)))) Λ = / £(*, я(*),«(*. »(0).*(')) Л- ίο Эту формулу называют основной формулой Вейерштрасса. 1.4.7. Достаточные условия слабого экстремума Теорема 3. Пусть функция χ Ε C2([tQ,t\],Rn) — допустимая экстремаль β задаче (Р), интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного графика ГЛ± (L Ε С3(0(«Г^))), на χ выполнены усиленные условия Лежандра и Якоби. Тогда χ доставляет слабый локальный минимум (х G wlocminP) [АТФ, с. 377]. 1.4.8. Достаточные условия сильного экстремума Теорема 4. Пусть функция χ Ε C2([tQ,t\],Rn) — допустимая экстремаль в задаче (Р), интегрант L Ε C3(V x Rn), где V С Rn+! — некоторая окрестность графика Г&, на χ выполнены усиленные условия Лежандра и Якоби, интегрант L является выпуклым по χ на V. Тогда χ доставляет сильный локальный минимум (х € strlocminP). Доказательство. Условия теоремы позволяют (см. п. 1.4.5) окружить χ центральным полем экстремалей χ(·,Λ), покрывающим некоторую окрестность U С V графика Г&. Пусть χ Ε PC]([to9t\]) — произвольная допустимая функция, график Гх которой расположен в этой
304 Глава 5. Условия второго порядка в вариационном исчислении окрестности. Тогда по основной формуле Вейерштрасса п. 1.4.6 и J(x) - J(±) = f S(t,x(t),u(t9x(t)),x(t))dL to Из выпуклости интегранта следует (см. п. 1.3), что если точка (t,x) G U, то €(t,x,u,x) ^ 0 для любых (и, х) GR"xRn. Таким образом, Ί /S(t,z(t)9u(t9x(t)),&(t))dt ^ 0 «о и, значит, J(x) ^ J(£), т.е. функция & доставляет сильный минимум. ■ 1.4.9. Квадратичный функционал Рассмотрим задачу простейшую задачу вариационного исчисления с квадратичным функционалом для вектор-функций χ(·) = (χ\(·)9.„,χη(·)) J{x(')) = [((Лх9х) + 2(Сх,х) + (Bx,x))dt -> inf; x(to) = ж0, x{t\) = a?i, на слабый и сильный экстремум. Здесь A(t),B(t), C(t) — матрицы порядка η χ η, А, В — симметричные матрицы2*. Теорема 5. Пусть в задаче (Р1) матрицы А и С непрерывно дифференцируемы, а В непрерывна', выполнено усиленное условие Лежандра. Тогда, если выполнено усиленное условие Якоби, то допустимая экстремаль существует, единственна и доставляет абсолютный минимум. Если же не выполнено условие Якоби, то значение задачи равно -оо (5absmin = -оо). Заметим, что по лемме о скруглении углов абсолютный минимум и сильный, и слабый совпадают. 2) Квадратичную относительно 2п-мерного вектора h = (χ, у) (χ € Rn,y € Rn) форму на пространстве R2n можно представить через симметрическую матрицу Μ размера 2п χ 2п в виде Q(h) = (Mh,h). Тогда матрицу Μ можно записать в виде Μ = \ С В ) » где матРицы А к В являются симметрическими, а матрица С не обязана быть симметрической. Значит, квадратичная форма запишется в виде Q(h) = 9((*.»).(*.»)) =((ί ξ) (;).(«.F)) = (A«,*> + (^,*) + (C*>»> + (BiffF>- (Ax,x) + 2(Cxty) + (By,y).
§ 1. Простейшая задача вариационного исчисления 305 Доказательство. Отметим вначале, что для квадратичных функционалов имеет место равенство J(x + ft) = J(£) + J'(x)[h] + ^J"(A)[h9 ft]. Если ж — допустимая экстремаль в задаче, то J'(x)[h] = 0 Vft Ε Co([to>ti]) (это соотношение, как было доказано ранее, эквивалентно уравнению Эйлера). Поскольку для квадратичных функционалов -j"(£)[ft,ft] = J(ft), то на экстремали £ выполняется соотношение J(x + ft) = J(x) + J(h) Vft€C(J([io,ii]). (*) Предположим, выполнено усиленное условие Якоби. Докажем существование допустимой экстремали и ее единственность. Обозначим Я(Мо)> H(t,t\) — матричные решения уравнения Эйлера (совпадающего для квадратичной задачи с уравнением Якоби), удовлетворяющие краевым условиям H(t0it0) = 0, H(t0,to) = I, H(t\9t\) = 0, H(t\9t\) = /. Из усиленного условия Якоби вытекает, что матрицы Я(Мо) и Я (Μι) невырождены для t Ε (£ο>£ι] и [$ο>*ι) соответственно. Положим Я0(<) = tfiMOtf-'ftbii), Я|(0 = H(t9to)H'l(t[9t0). Тогда Я0(*о) = /, Яо(«|) = 0, Ή(ίο) = 0, Ή(*ι) = /, и, значит, Λ(ί) = Яо(0^о'+Я1(^)ж1 — допустимая экстремаль в задаче (Р'). Эта экстремаль единственна, поскольку если бы существовала другая допустимая экстремаль ж, то функция h — ±-x была бы нетривиальным решением уравнения Якоби с граничными условиями h(to) = h(t\) = 0, а это противоречит усиленному условию Якоби. Экстремаль £ можно (см. теорему о построении центрального поля экстремалей) окружить центральным полем экстремалей, покрывающем полосу to ^t ^t\ с функцией наклона поля и(т,£). Возьмем произвольную допустимую функцию χ Ε PC]([to,t\]). Тогда по основной формуле Вейерштрасса J(x)-J(x) = J S(t,x(t)9u(t,x(t)),x(t)) dt = to «ι = / \L(t9x,x) - L(t,x,u(t,x)) - (Ιΐχ(ί,χ,η(ί,χ)),χ - u(t,x))jdt = to
306 Глава 5. Условия второго порядка в вариационном исчислении (для квадратичной функции L(x)-L(u)-Lf(u)(x-u) = ((l/2)L"(u)(x-u)9 = / 1-Ь±±($,х9и)(х-1$9х-и\& = (А(Щх-и),х-и)<И^0, *о to ибо A(t) — положительно определенная матрица по усиленному условию Лежандра. Значит, функция £ € absminP'. Предположим, что не выполнено условие Якоби. Тогда функция h = 0 £ absmin P" не доставляет абсолютный минимум в задаче Ί J(H')) = /«4М> + 2{Ch9h) + (Bh,h))dt -> min; Λ(ίο) = Λ(*ι) = 0 (если ft = 0 € absmin Ρ", то по теореме о необходимых условиях слабого минимума выполнено условие Якоби). Значит, SabsminP" < 0. Поэтому существует функция h Ε Со([£о»*|]) такая, что J(h) < 0. Но тогда в силу соотношения (*) J(x + ΑΛ) = J(£) + J(AJi) = J(£) + X2J(h) -* -oo при A -» +00, Т.е. 5absminP' = -00. ■ 1.5. Правило решения Для решения простейшей задачи классического вариационного исчисления с использованием необходимых и достаточных условий экстремума следует: 1. Найти допустимые экстремали, т.е. допустимые функции, удовлетворяющие необходимым условиям экстремума I порядка. Для этого надо a) Выписать необходимое условие экстремума I порядка — уравнение Эйлера: b) Найти решения этого уравнения (они называются «экстремалями»). c) Найти решения уравнения Эйлера, удовлетворяющие заданным условиям на концах (они называются «допустимыми экстремалями»). 2. Проверка необходимых и достаточных условий экстремума II порядка. а) Проверить выполнение условия Лежандра:
§ 1. Простейшая задача вариационного исчисления 307 Если L±±(t) > 0 V£ Ε [to,t\] (выполнено условие Лежандра), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) минимума. Если Lix(t) < 0 W Ε [to,t\] (выполнено условие Лежандра), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) максимума. Если же величина Lxx(t) знакопеременна на отрезке [to,t\] (не выполнено условие Лежандра), то значит, не выполнено необходимое условие слабого (а, следовательно, и сильного) экстремума. В этом случае найденная допустимая экстремаль не доставляет слабого, и тем более, сильного экстремума. ^ Если Lx±(t) > 0 V* Ε [to,t\] или Lxx(t) < 0 V* Ε [*ο,*ι] (выполнено усиленное условие Лежандра), то значит, выполнено необходимое условие слабого и сильного минимума, соответственно максимума. В этом случае переходим к исследованию условия Якоби. Ь) Проверить выполнение условия Якоби: bi) Выписать интегрант квадратичного функционала L(t,h, h) :- Lxx(t)h2(t) + 2Lxx(t)h(t)h(t) + Lxx{t)h\t). Ъг) Выписать уравнение Якоби на экстремали А, т.е. уравнение Эйлера для интегранта L(t9 h, h): и решить его с начальными данными h(t0) = 0, h(to) = 13^. Ьз) Найти сопряженные точки т, т.е. нули найденного решения h(t) уравнения Якоби при t > to. b4) Проверить выполнение условия Якоби: Если в интервале (to,t\) нет точек, сопряженных с to (выполнено условие Якоби), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) экстремума. Если же в интервале (t09t\) есть сопряженные точки (не выполнено условие Якоби), то значит, не выполнено необходимое условие слабого 3' Для вектор-функций х(·) = (х\ (·)>···, хп(')) ищется фундаментальная система реше- (h\(t) ... ft»(i)\ ний уравнения Якоби — матрица H(t) = yhl(t) ...hn(t)) = j J \ftiw ... «w/ с начальными условиями H(to) = 0 (нулевая матрица), H(t0) — I (единичная матрица) или dttH(to) Φ 0. Вектор-столбцы h*(·) = j ... J — решения системы уравнений V*t(·)/ Якоби. Сопряженными точками будут точки г — нули уравнения det Η (τ) = 0.
308 Глава 5. Условия второго порядка в вариационном исчислении (а, следовательно, и сильного) экстремума. В этом случае найденная допустимая экстремаль не доставляет слабого, и тем более, сильного экстремума. Если в полуинтервале (to,t{] нет точек, сопряженных с t0 (выполнено усиленное условие Якоби), то значит, выполнено достаточное условие слабого экстремума. Следовательно (напомним, что уже выполнено усиленное условие Лежандра), найденная экстремаль доставляет слабый локальный минимум (если L±±(t) > 0 Vi Ε [*ο>£ι]) или максимум (если £**(<) < 0 V<€[*o,ii]). Проверка на сильный экстремум. c) Если интегрант L является выпуклым по χ при всех фиксированных t и ж, рассматриваемых в качестве параметра, то £ доставляет сильный минимум в задаче. Аналогично, если интегрант L является вогнутым по х, то £ доставляет сильный максимум в задаче. d) Если интегрант L не является ни выпуклым, ни вогнутым, то следует проверить выполнение необходимого условия сильного экстремума — условия Вейерштрасса: f(<f4>4itt)=JD(<>*f«)-JD(if*>*)-£4(0(tt-*)>0 VttER, Vt€ftb*i] в задаче на минимум (£ ^ 0 в задаче на максимум). Если не выполнено условие Вейерштрасса, то в этом случае найденная допустимая экстремаль не доставляет сильного экстремума. 1.6. Примеры Пример 1. Исследуем с помощью условий второго порядка задачу, рассмотренную нами в п. 1.2: ι J(s(.))= /V<ft-Mnf; x(0) = 0, *(1) = 1. о Мы выяснили ранее, что имеется единственная допустимая экстремаль έ = t, доставляющая слабый локальный минимум в задаче и не доставляющая сильного. При этом нами была построена последовательность допустимых (в задаче на сильный экстремум) функций хп Ε PCl([to9t\])9 χη(·) —> £(·) в C([to>ti])> для которой J(xn(-)) -* -оо при η —» оо. Поскольку L±±(t) = 6£(t) = 6 > О V£ E [0,1], то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h
§ 1. Простейшая задача вариационного исчисления 309 для интегранта L = Lxxh2 -f 2Lxxhh -f Lxxh2 = 6h2: d . - —12Л = 0 <=* /ι = 0. Общее решение уравнения Якоби: h = Ci* -f С2· Начальным условиям Л(0) = 0, /&(0) = 1, удовлетворяет функция h(t) = £. Эта функция не имеет нулей в полуинтервале (0,1]. Значит, сопряженных точек нет, и стало быть выполнено усиленное условие Якоби. По теореме 3 выполнено достаточное условие слабого локального минимума, значит at £ wlocmin. Поскольку функция L = хг не выпукла по ж, то достаточное условие сильного минимума не выполняется. Проверим необходимое условие сильного минимума — условие Вейерштрасса: f (<,*,*,«) = L(<, 4,«)-£(<,4, *)-L4(0(«-Л) = = и3 - χ - Ъ±2{и - χ) = иъ - 1 - 3(tt - 1) ^ 0 (?) VuER, V*G [0,1]. Оно не выполняется. Так как не выполняется необходимое условие, то функция χ не доставляет сильного локального минимума. Ответ. Единственная допустимая экстремаль χ = t £ wlocmin, и χ £ strlocmin, Smin = -00. Пример 2. Исследуем с помощью условий второго порядка задачу, рассмотренную нами в главе 3 п. 1.6 (пример 2): 3*/2 J(x(.)) = ί (χ2 - χ2) dt -> inf; x(0) = χ (у) = 0. о Уравнение Эйлера: χ -f ж = 0. Мы выяснили ранее, что имеется единственная допустимая экстремаль £ = 0, не доставляющая даже слабого локального минимума в задаче. При этом нами была построена последовательность допусти- 1 It мых функций xn(t) = —sin—, жп(·) —► £(·) в С!([0,1]), для которых J(xn(-))<0 = J(&(-)). Поскольку £**(£) = 2 > 0 V* € [0,3π/2], то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h -ftLh(t) + Lh(t) = Q для интегранта L = L±±h2 + 2Lxxhh + Ι^Λ2 = 2/ι2 - 2/ι2: Λ, + Λ = 0 <=> h = C{smt + C2cost.
310 Глава 5. Условия второго порядка в вариационном исчислении Начальным условиям h(0)=0, h(0) = 1, удовлетворяет функция h(t) = sint. Эта функция в интервале (θ,3π/2) обращается в ноль в точке τ = π. Таким образом, в интервале (0,Зтг/2) имеется сопряженная точка, и стало быть не выполнено необходимое условие Якоби слабого локального минимума, значит допустимая экстремаль &(·) не доставляет в задаче слабый минимум, и тем более не доставляет сильный минимум. Если воспользоваться теоремой 5 о необходимых и достаточных условиях экстремума в простейшей задаче вариационного исчисления с квадратичным функционалом, то из того, что не выполнено условие Якоби, будет следовать, что абсолютный минимум в задача равен -оо. Уравнение Эйлера совпало с уравнением Якоби. Это не случайно. Так бывает, если интегрант исходной задачи является квадратичной функцией от ж,ж. Ответ. Единственная допустимая экстремаль £ = 0 £ wlocmin, и тем более χ g strlocmin, Smjn = -оо. Пример 3 (простейшая векторная задача вариационного исчисления, в которой допустимая экстремаль единственна и доставляет сильный экстремум). ι J(x(·)) = J(xl(-),x2(·)) = / {х] + х\ + 2х\х2) dt -> inf; о ж,(0) = 0, х2(0) = 0, Ж|(1) = sin 1, x2(l) = -sinl. Условие экстремума I порядка — система уравнений Эйлера: (х{=, \х2 = Х\ = ХЪ . (4) „ => Х\ = Х\. хг = хи Последнему дифференциальному уравнению 4-ого порядка соответствует характеристическое уравнение к4 = 1. Его корни k\i2 = ±1, &з,4 = =Ь*· Поэтому общее решение дифференциального уравнения X\ = C\sht + C2cht+C2smt+C4Cost. Тогда х2 = X\ = C\ sht+Qcht-Cisint-Ctcost. Начальные условия: = С\ sh* + C3sin£, С\ sh£ - C3sin£, a?i(l) = C,shl-bC3sinl =sinl, _ z2(l) = C|Shl-C3sinl = --sinl, ] ' 3 Единственная допустимая экстремаль х\ = sin*, έ2 = -sin£. Условия экстремума II порядка. Условие Лежандра. Li± = ( £*»*■ ~*'*2 J = ( ^ ξ J . Эта матрица положительно определена, следовательно, выполняется усиленное условие Лежандра. \Ж2(о)^с2^с4 = о,^С2"-С4-°^Ь2 = ( {
§ 1. Простейшая задача вариационного исчисления 311 Условие Якоби. r*. = f!4'·' li,xi) = (°Q υ) = (?"*' 1х,*2)=ъ*, \li±2X] 1/±гх2 / \υ υ/ χΐίχιχί 1*χ2Χ2/ Τ _ (L*\x\ Lx\xi\ _ f ° 2Λ Квадратичный интегрант L(t,h9h) = (L±±h,h) + 2(Lx±h9h) + (Lxxh,h) = -<(г 5)(fc)-(fe)H(i ί)(ί)·(«>- = 2fc? + 2^ + 4M2 = 2£(*,M). Отметим, что для квадратичного функционала всегда L = 2L. Система уравнений Якоби (система уравнений Эйлера для квадратичного интегранта L): { Л2 = Ль Ищем фундаментальную систему решений уравнения Якофи — матрицу #(i) = (hl(t)h2(t)) = Qj|j Jjjjj) такую, что Я(0) = 0 (нулевая ма- трица), #(0) = / (единичная матрица). Для вектора hUt)- (кЩ - (c*sht + c2cht + C^nt + CAcost\ Для вектора Л (t)- y^J - {CiSht + c2cM_CiSint_cACOst) > ii/л / С\ cht + Qsht + Cjcost - QsinA h It) = ι _ , ± _ , . _ A - . M ) , должны выполняться гра- w VCichi + C2sh<-C3COS< + C4sin</ F ничные условия (л!(о) = с2 + с4 = о, ft2(0) = C2 - C4 = 0, 1 ftj(0) = C, + C3 = l, 2 I ft2(0) = C, - C3 = 0, (sM+sint \ / sht-sint \ sh<isint ) · Аналогично находим: Λ2(ί) = ί Α^ J . Сопряженные точки являются корнями уравнения 'shr + sinr shr-sinr detF(r) = 0 <^=ί> det [ ,_ 2 . U2. | = 0 <=» 1 shr-sinr shr + smr '
312 Глава 5. Условия второго порядка в вариационном исчислении <=> (shT-hsinT)2-(shT--sinT)2 = 0 <=> «Ф=> shrsinr = 0 <^> τ = &π, к G N. На полуинтервале (0,1] нет сопряженных точек, следовательно, выполняется усиленное условие Якоби. По теореме 3 п. 1.4.6 вектор £ = (#ι>£2) = (sint,-sint) € wlocmin. Условие Вейерштрасса — необходимое условие сильного минимума — выполняется: E(t,£,Я,и) := l(U&,tt) - £(*,£,£) - (Lx(t9й9£)9и-ё) = -^+^+-A-*i-*5--A-<(i).(;:i;))- = и? + г*2 + 2&|£2 - 4? - Л2 - 2£|#2 - 2*ι(«ι - f ι) - 2f 2(«2 - £2) = = («ι-*ι)24>2-£2)2^ο v(^,,tt2)€R2, vie[0,1]. Выпуклость интегранта no χ. Функция L(t,x,x) — x\ + x\ + 2х\Хг выпукла по x9 так как L±± — положительно определенная матрица для любых (t9x) e R3. По теореме 4 п. 1.4.7 вектор £ = (£|,£2) € striocmin. (Отметим, что из условия выпуклости интегранта L по χ следует выполнение условия Вейерштрасса.) Если воспользоваться теоремой 5 п. 1.4.8 для квадратичных функционалов, то можно было бы, проверив усиленные условия Лежандра и Вейерштрасса, сразу сказать, что £ = (£|,£2) Gabsmin (и слабый, и сильный). ι ι Sabsmin = J(&) = / (2 cos2 * - 2 sin2 t)dt = 2 I cos It dt = sin 2t\ = sin 2. о о Ответ. Единственная допустимая экстремаль (sint,-sint) € absmin, Smin = sin2. 1.7. Задачи Найти экстремали и исследовать их на слабый и сильный экстремум. */4 1.1. /(4ж2 - х2) dt - extr; ж(0) = 1, ж(~) = 0. о ж'г 1.2. / (ж2 - 4ж2) dt - extr; ж(0) = 0, а: (J) = 1.
§ 1. Простейшая задача вариационного исчисления 313 3π/4 1.3. J (ж2 - 4х2) dt -> extr; x(0) = О, *("£-) = -1. о 1.4. / (2х + х2 - х2) dt -> extr; ж(0) = χ (^) = 0. о 3π/2 1.5. Мж2 - ж2 - 2ж) <tt — extr; ж(0) = ж(у) = 0. о π/2 1.6. Mi;2 - χ2 - tx) dt -> extr; ж(0) = ж(^) = 0. о π/2 1.7. (χ2 -ж2 + 4ж sht)dt-* zxtv; x(0) = хПг) = 0. о Го 1.8. / (χ2 - χ2 + 4a?sh*) <й -► extr; ж(0) = 0, ж(Т0) = ξ. о 1.9. (6xsin2t + x2 - ж2) <ft-► extr; #(0) = ж(^)=0. о Го 1.10. / (ж2 - ж2 - 6жsin2i) dt -► extr; x(0) = 0, ж(Т0) = ξ. о */2 1.11. (4xsint + x2 -x2)dt-+ extr; ж(0) = ж(^) = 0. о 3π/2 1.12. / (ж2 - ж2 - 4xsint) dt -* extr; ж(0) = «(-?) = 0. о π/2 1.13. /(ж2 -ж2 + 4ж cost) dt-^> extr; ж(0) = ж(^) = 0.
314 Глава 5. Условия второго порядка в вариационном исчислении */2 1.14. / (ж2 - ж2 + 4xcost)dt -► extr; х(0) = 0, ж(^) = ^. о 3*/2 1.15. / (ж2 - х2 + 4a?cos*) <ft -♦ extr; ж(0) = 0, я(-~) = ~*Т"· о Го 1.16. / (ж2 - ж2 + 4ж cos 0 <й -+ extr; ж(0) = 0, ж(Г0) = ξ. о То 1.17. / (ж2 - ж2 - 4ж sini) dt -* extr; ж(0) = 0, ж(Г0) = ξ. о 1 1.18. /(ж2 + Зж2)е2'сй -+ extr; ж(О) = 1, ж(1) = е. о 1 1.19. /(ж2 - x2)e2t dt - extr; ж(0) = О, ж(1) = е. о Го 1.20. /(ж2 - ж2)е2' <tt - extr; ж(0) = 0, ж(Г0) = ξ. о 1 1.21. / $inxdt-+zxtr; ж(0) = 0, ж(1) = ^. о I 1.22. / cos ж dt -> extr; ж(0) = 0, ж(1) = тт. о Го 1.23. / sin ж dt -> extr; ж(0) = 0, ж(Г0) = £. о Го 1.24. / cos ж dt -* extr; ж(0) = 0, ж(Г0) = £. о Го 1.25. / же* dt -* extr; ж(0) = 0, ж(Г0) = ξ.
§ 1. Простейшая задача вариационного исчисления 315 1.26. j х2е* dt -> extr; x(0) = 0, х(\) = 2. о 1.27. Пж3 + 4ж2)<tt — extr; x(0) = 0, α?(1) = —Ιο Го 1.28. x3dt-> extr; x(0) = О, х(Т0) = £. о Го 1.29. 1{хъ - х2) dt — extr; x(0) = О, х(Т0) = £. о Го 1.30. /V + ж2) dt - extr; x(0) = 0, ж(Г0) = £. о 3/2 1.31. А(ж3 + 2») dt -> extr; х(0) = О, χ(-) = 1. о Го 1.32. / (ж5 + 5х) dt -+ extr; x(0) = 0, я?(Г0) = £. о 1 1.33. А(1 - ж2)2 <й -> extr; я?(0) = 0, ж(1) = ξ. о Го 1.34. Их2 - хх3) dt -+ extr; х(0) = 0, х(Т0) = О о (исследовать допустимую экстремаль x(t) = 0). ι 1.35. ί(χ2 - 4хх3 + 2te4) <tt -> extr; я?(0) = я?(1) = О о (исследовать допустимую экстремаль x{t) = 0).
316 Глава 5. Условия второго порядка в вариационном исчислении § 2. Задача Больца Рассмотрим задачу Больца (для определенности задачу на минимум) для вектор-функций ж(·) = (χ ι (·),..., жп(·)) В(х(·)) = /jD(i, jc(i),»(<))*+ ϊ(*(Ό),*(ίι)) -* min. (Ρ) to 2.1. Сильный и слабый экстремум Напомним, что функция έ Ε C{([to9t\]9Rn) доставляет слабый локальный минимум в задаче (Ρ) (at G wlocminP), если она доставляет локальный минимум в пространстве Cl([to9t\]9Rn)9 т.е. если существует δ > О такое, что В(х) ^ Β(έ) для любой функции χ G С1 ([$<>»* ι ])> Для которой ||ж(-) - A(-)llc<<[MiL*·) < '· Наряду со слабым экстремумом в задаче Больца как и в простейшей задаче классического вариационного исчисления рассматривается понятие сильного экстремума. Функция £ Ε PCl([to9t\]9Rn) доставляет сильный локальный минимум (£ Ε strlocminP), если она доставляет локальный минимум в пространстве C([to9t[]9Rn)9 те· если существует δ > О такое, что В(х) ^ В(±) для любой функции χ G PC]([tQ9t)]9Rn)9 для которой \\х(·) -*(-)||с([«о.*|].*·) < *· Так как множество функций, среди которых доставляется сильный экстремум, шире, чем для слабого экстремума, то если функция χ Ε C]([to,t\],Rn) доставляет сильный, то она доставляет и слабый экстремум. Поэтому для функций £ Ε Cl([to9t\]9Rn) необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного экстремума является достаточным условием слабого. В этом разделе будут сформулированы и доказаны необходимые и достаточные условия слабого и сильного экстремума в задаче Больца, а также рассмотрена задача Больца с квадратичным функционалом. Доказательства условий II порядка в задаче Больца во многом аналогичны доказательствам условий II порядка в простейшей задаче классического вариационного исчисления. Поэтому они будут проведены более кратко. 2.2. Условия экстремума II порядка 2.2.1. Необходимые условия слабого экстремума Теорема. Пусть функция at Ε C2([t09t\]9Rn) доставляет слабый локальный минимум в задаче (Р) (£ Ε wlocminP), интегрант L трижды не- прерывно дифференцируем в некоторой окрестности расширенного графика
§ 2. Задача Больца 317 Г&± (£ Ε С3(0(Гхх))), терминами I дважды непрерывно дифференцируем в точке (x(to),x{t\)). Тогда на ж выполняются a) уравнение Эйлера: -^£*(*)+ £*(*) = о v*e[Mi] и условия трансверсальности: Дг(*о) = ίε(ί0), L±(t\) = -ϊχ^)', b) условие Лежандра: Lxx(t) ^ О V£ Ε [*ο>*ι]; c) если на χ выполнено усиленное условие Лежандра, то выполняется и условие Якоби; d) если выполняются усиленное условие Лежандра и усиленное условие Якоби, то для любого вектора (ho9h\) Ε R2n решение уравнения Якоби /ι(·) с краевыми условиями h(to) = /ι0, h(t\) = h\, существует, единственно и (P + Q)(/i)^0, где P(h):=(Lxxh + Lxxh,h)\ , Ι ίο Q(h) := Q(h0,h{) := /"(ж0,^,)[(/ι0,/ι,), (/ι0,Λι)], ж0 := x(to), x\ := x(t\). Доказательство. Необходимость а) была установлена нами ранее в главе 3 п. 2.2. Далее очевидно, что если ж доставляет слабый локальный минимум в задаче (Р), то функция ж доставляет слабый локальный минимум в простейшей задаче вариационного исчисления: L(t,ж,ж) dt —► min; ж(£о) = &о, x(t\) = &\, ίο и, значит, в соответствии с теоремой 2 из п. 1.4.5 выполнены условия Ь)-с). Докажем утверждение d). Покажем вначале, что решение уравнения Якоби с краевыми условиями h(to) = /ι0, h(t\) = h\, существует и единственно. Докажем существование. Из усиленного условия Лежандра (Lxx(t) > 0 Vf Ε [£ο>*ι]) вытекает, что матрица Lx± положительно определена и, значит, невырождена и обратима. Поэтому уравнение Якоби —т. (l>±±h> + Lxxh) + Lxxh + Д^/ι = 0 <ί=> £44(ί)Λ + A(t)h + С(*)Л = 0 представляет собой систему из η дифференциальных уравнений второго порядка с непрерывными коэффициентами, которую в силу обратимости матрицы L±x можно разрешить относительно старших производных. • ι l·
318 Глава 5. Условия второго порядка в вариационном исчислении По известной из теории дифференциальных уравнений теореме существования и единственности (см., например, АТФ стр. 191) существуют фундаментальные матрицы решений уравнения Якоби H(t, to) и H(t, t\) с краевыми условиями H(tQ,t0) = 0, H(to,tQ) = /, и H(t\9t\) = 0, H(ti,t\) = I. Из усиленного условия Якоби (на полуинтервале (to,t\] нет сопряженных точек) вытекает, что матрицы H(t,to) и H(t,t\) невырождены для t £ (to9t[] и [*ο»*ι) соответственно. Положим Ho(t) = H(t9t\)H~l(to9t\) и Я|(4) - Я(Мо)#~!(Мо). Тогда Я0(«о) = I, #ο(*ι) = 0, Я,(*0) - 0, H\(t\) = J, и, значит, функция h(t;ho,h\) = Ho(t)ho + H\(t)hi является решением уравнения Якоби с краевыми условиями h(t0;ho,h\) = Л0, ft(*i5*o»*i) — *ι· Докажем единственность. Действительно, предположим, что существует другое решение уравнения Якоби h() с теми же краевыми условиями. Тогда функция /ι(·) = Ц'9к0,к[) - h() является нетривиальным решением уравнения Якоби с граничными условиями h(t0) = h(t\) = 0 и, следовательно, Ь\ — точка сопряженная с to, а это противоречит усиленному условию Якоби. Поскольку £ £ wlocminB, то по необходимому условию II порядка локального минимума функционала В B"(&)[h,h] = / ((Lxxh,h) + 2(Lxxh,h) + (Lxxh,h)) dt + ίο + ί"(*ο·*ι)[(Λο,Λι),(Λο,Λι)] = JT(fc) + Q(h) ^ 0 V/i 6 C'dMi]) (fto - 4*o), *i := *(*i)). (*) Пусть далее Л() — решение уравнения Якоби с краевыми условиями h(t0) = Л0, A(ti) = А|. Тогда JT(ft) = I (l±±h + L±xh,dh)+ (Lxxh + Lxxh,h)dt = ίο ίο «ι = [((LaKh) + (Lxxh,h) + (£,*Μ> + <£«Μ>) Λ = ■/<■ = / (-^(^*A+£4»b)+£«iA+£.eft,ft)i<+(£iift+^«ft,fc>| '=P(ft) (в последнем интеграле подынтегральное выражение равно 0, так как функция h удовлетворяет уравнению Якоби). Подставляя в неравенство (*) вместо K(h) равное ему P(h), получим, что (Р + Q)(h) ^0. ■
§ 2. Задача Больца 319 Замечание. Если в определение оператора Ρ подставить вместо h построенное при доказательстве теоремы решение уравнения Якоби h(;h0,h\)9 то получим, что P(h) = (^^0(^0(0^0 + ^(0^0+^(0(^0(0/10 + ^(0/11), Я0(0/Ю + Я|(0/Ц>Г - (LMiHoit^ho+'H^ht) + Д*(*|)/ц,/ц> - - (Ια(ίο)(Η0(ίο)ίΐο + #ι(*ο)Μ + £**(*ο)/ι0,/ΐο> = Ρ(Λο,Μ· Значит, Р также как и Q является квадратичной формой. 2.2.2. Достаточные условия сильного экстремума Теорема. Пусть функция χ £ C2([£0,*i],Rn) — допустимая экстремаль в задаче (Р), интегрант L Ε C3(V χ Rn), где V С Rn+1 — некоторая окрестность графика, терминант I дважды непрерывно дифференцируем в точке (£(£ο)>£(*ι))> на & выполнены усиленные условия Лежандра и Якоби, интегрант L является выпуклым по χ на V, квадратичная форма P + Q (см. п. 2.2.1) положительно определена. Тогда ± доставляет сильный локальный минимум в задаче (Р) (at £ strlocminP). Доказательство. Обозначим £0 := я(*о)> #ι ·= £(*ι)· По теореме существования и непрерывной зависимости решения от начальных данных для любого ε > 0 существует δ = δ(ε) > 0 такое, что для любой точки (а?о,Ж|) G Β((±ο,±\)9δ) существует единственное решение уравнения Эйлера χ(·;χο,χ\) с начальными условиями x(to;xo,x\) — жо, x(t\\x0fX]) = х\ и \\х{-\Хо>х\) - Н')\\сч[г0А]) < ε· ПРИ этом не ограничивая общности, будем считать, что δ ζ ε. Возьмем произвольную функцию χ £ PCl([t0it\]) (x0 := x(to), х\ := x(t\)), для которой ||ж(·) - &(')\\сф0м\) < δ. Тогда точка (х0,Х[) Ε Β((£0,£\),δ) и для нее, как было сказано выше, существует решение уравнения Эйлера х(-',Хо,х\) с начальными условиями x{to',xo,X\) = ж0, x(t\;xo,x\) = x\ и \\x(-\xo,xi)-&{-)\\c*(it0,tl]) <ε Окружим экстремаль х(-;х0,Х[) центральным полем экстремалей (см. п. 1.4.5). Это можно сделать, так как из условия выполнения усиленных условий Лежандра и Якоби на экстремали £ усиленные условия Лежандра и Якоби в силу условий гладкости будут выполнены и в некоторой окрестности расширенного графика Г±±. Тогда В(х(·)) = J(x()) + l(x(to)M*i)) = J(x(·)) " W;*o,*i)) + + J{x(-;xo,X\)) + 1{хо,х\) = J(x{-))- 7(ж(-;жо,Ж1)) + Ф(ж0,Ж1), где Ф(хо,х\) := J(x(-;xo,x\)) + 1(χο,Χί) =
320 Глава 5. Условия второго порядка в вариационном исчислении = / Х(^ж(^Жо,Ж|),ж(^Жо,Ж|))^ + /(жо,Ж1) = Б(ж(;ж0,Ж1)) *о — функция двух переменных х0 и х\. Из построения следует, что ||ж(·) - х(-;хо,х\)\\с(1Ш) = 11*0 - *(0 + *(0 ~ х(-'>*о>*\)\\с < < МО - 4(-)11с + 11*0 - *(-;*о,*|)11с < *+ е < 2ε. В п. 1.4.7 было показано, что по основной формуле Вейерштрасса для экстремали х{-;хо,х\) и функции х() близких в метрике пространства C([*o>*i] в силу выпуклости интегрант L является выпуклым по χ Ί J(x{-))- J(a?(; х0,Ж|))= fsdt^O. to Покажем, что функция Ф(жо,Ж|) имеет локальный минимум в точке (*о,А|).т.е., что Φ(»ο,»ι)^Φ(4ο,*ι) = Β(4(.)). Тем самым теорема будет доказана. Найдем первую производную функции Ф(х0,х\). При доказательстве необходимых условий экстремума I порядка в задаче Больца (Гл. 3 п. 2.2) было найдено, что и B'(z(-))[h{-)\ = f(L*h + Lxh)dt + lXih(ti)+lxMto) = «I = f (~JtL± + Lx)hdt + ^*(*ι)Μ*ι) - £*(*o)M*o) + k,M*i) + 1«·Μ*ο) ίο VftEC^Mi]). На экстремали ж(·, а?о, Ж|) выражение под знаком интеграла тождественно равно нулю, следовательно, В'(*Мо,*|))[М4] = ^ Из полученной формулы для B'(x(-,Xo,x\))[h(·)] следует, что на экстремали х{-,хо,х\)) производная В (x(-9xo,x\))[h(·)] как функционал от h() зависит только от h(to)9h(t\) — значений функции h() в точках to,t\. На допустимой экстремали £ выражения в скобках обращаются
§ 2. Задача Больца 321 в ноль в силу условий трансверсальности, поэтому *'(*(·))[*(·)] = 0 >fheCl([t09ti\) <=► Φ'(*ο,*ι) = В'(я?(-;*о,4|)) - В'(&(·)) = 0. Выпишем вторую производную функционала Больца: и B"(&(-))[h(-)M)] = f (Ф*±ЬЛ) + 2(Lx±h,h) + (£«М>) <tt + ίο + <ί«,.,Λ(*ι)> *(*■)> + 2(lX[Xoh(to),h(ti)) + (ix0x0h(t0),h(t0)) Vh€Cl([t09t\]). При доказательстве необходимых условий слабого экстремума II порядка в задаче Больца в предыдущей теореме было доказано, что существует единственное решение уравнения Якоби /ι(·) = h(-;ho,h\) с краевыми условиями h(to) = Λ0> Λ(*ι) = Λι и дано его представление. Тогда = / ((£**л.л>+(£**л,л>+(£**л,л> + (£*Ал>)*+ и + (Lxxxhuhi) + 2(lXiXoho,h\) + (1ХоХоН0,Н0) = I (Lxxh + L£Xh9dh) + к + /(£*4Λ+£**λ,λ>λ+<?(Λο,Λι) = (£*4Λ+^4*λ·λ>| ' + У '*ο *0 + /( -j (Lxxh + Lxx1^ +Lxxh+Lxxh>^^ к (функция h(;ho9h\) удовлетворяет уравнению Якоби, поэтому выражение под знаком интеграла тождественно равно нулю). Вследствие положительной определенности Ρ + Q по достаточному условию минимума функции нескольких переменных (xq,x\) £ ΙοατιίηΦ. Значит, если точка (ж0,Ж|) лежит в малой окрестности точки (xq,x\), то Ф(х0,х{) > Ф(х0,х{) = В(х()). Таким образом, если ||ж(·) — &{-)\\с(1к,ь]>*п) < ^> то в(х) ^ ^W и> значит> функция χ Ε strlocminP. ■
322 Глава 5. Условия второго порядка в вариационном исчислении 2.2.3. Квадратичный функционал Рассмотрим задачу Больца с квадратичным функционалом для вектор-функций ζ(·) = (ж,(·),... ,ж„(·)) В{х(·)) = f ({Ах, х) + 2(Сх, х) + (Вх, х)) dt + *° L(t,x,x) + (ea?i,a?i) + 2(7Д?|,ж0) + (βΧρ,Χρ) + (a,a?i) + (Mo) -+ min, (Ρ') Ζ(»ο,«ι) на слабый и сильный экстремум. Здесь xQ = ж(£0), ж ι = ж(^), -4(£), B(t), C(t), α,β,Ί — матрицы порядка η χ η, Α,Β, α,β — симметричные матрицы, векторы a,b G Rn. Для квадратичного функционала матрицы Ρ и Q, введенные в п. 2.2.1, примут вид: Q(&o,fti):=J'4*o,^^ ^>(Λο,Λι):=<Α**Λ + -£*.Λ,Λ>|*1 =2<j4ft + Cfc,ft>| ' =2<^(«i)(J9T0(«i)Ao + Ι ίο l*o + ff|(ii)k|)+C(ii)fc|,fc,)-2^ где /ι(£) := Ho(t)ho+tf j(ί)Λι, #0, tfι — решения уравненияЯкоби с краевыми условиями, tf0(*o) = /, Я0(<|) = 0, Я1^о) = 0, ffi(<i) = /, £0:=£(*о), 4ι:=4(ίι). Теорема. Пусть в задаче (Р') матрицы А и С непрерывно дифференцируемы, а В непрерывна', выполнено усиленное условие Лежандра, Тогда, если выполнено усиленное условие Якоби, матрица Ρ + Q неотрицательно определена и существует допустимая экстремаль, то она доставляет абсолютный минимум. Если же не выполнено условие Якоби или выполнено усиленное условие Якоби, а матрица Ρ + Q не является неотрицательно определенной, то значение задачи равно — оо (5absmin = -оо). Доказательство. Пусть выполнено усиленное условие Якоби. Возьмем произвольную функцию χ Ε C[([to,t\]). Обозначим xq := x(to), Х\ := x{t\). Как уже отмечалось при исследовании простейшей задачи вариационного исчисления с квадратичным функционалом (п. 1.4.8) уравнение Якоби для квадратичного функционала совпадает с уравнением Эйлера и при выполнении усиленного условия Якоби для любых хо,х\ Ε Rn существует и единственно решение уравнения Эйлера (Якоби) x(-;xq,xi), для которого x(to;xo,x\) = xq, x(t\;xo,X\) = х\. Это решение можно записать в виде x(-;xq,X\) = Но(-)хо + Н\(-)х\. Действительно, для него x(to;xo,X\) = Ho(to)x0 + H\(t0)x\ = х0, x(t\;xo,X\) = Ho(ti)xo + H\(t\)x\ =Ж|.
§2. Задача Больца 323 Представим функционал В в следующем виде: В(х()) = J(x(·)) + l(xo,x\) = J(x()) - J(x(-;xo,xt)) + + J(x(\ x0, «ι» + J(*o, ял) = J(a(·)) - J(z(·; ж0, «ι)) + Ф(ж0, х\), где Φ(χο,χι) :=Б(ж(;ж0,а?1)) = 7(&(·;&ο,&ι)) + Ζ(*ο.&ι) — функция двух переменных а?оиа?1.Вп. 1.4.8 было показано, что по основной формуле Вейерштрасса для экстремали x(-;xq,x\) и J(x(-))-J(x(-;xo,xi))= fsdt&Q. to Пусть £ — допустимая экстремаль. Покажем, что функция двух переменных Ф(хо,х\) имеет глобальный минимум в точке (£q,x\) (£q := £(Jo), ±ι := £(t\))> В п.2.2.2 было показано, что Φ'(*ο,*ι)[(Αο,Λι)] =0 ν^ο,Λ, G Rn. Вторая производная функции Φ(ε0,£ι), выписанная в п. 2.2.2, в точке (χ0,£ι) на функции Н(-;хо,х\) := Я0(-)/1о + ffi(-)*i будет иметь вид: Φ"(*ο,*ι)[(Λο,Λι),(Λο,Λι)] = (L±±h + L±xh9h)\il +Q(ho,hx) = = (P + Q)(fto,fci)>0. Следовательно, по Теореме 2 Гл.1 п. 4.1 функция Ф(хо,х\) является выпуклой и ее минимум в точке (£ο>^ι) является глобальным. Итак, доказано, что в точке (#о> х\) функция имеет глобальный минимум. Тогда Φ(3ο,3ι) ^ Φ(*ο,*ι) =fB(a?(;i&o,iCi)) = B(4(·)) Vxo,X\ G Rn и, значит, В(х()) ^ Я(4(·)) Va? G С1 ([ίο,ίι]) => 4 G strlocminP. Предположим теперь, что не выполнено условие Якоби или выполнено усиленное условие Якоби, а матрица Ρ + Q не является неотрицательно определенной. Тогда функция h = 0 £ absminP" не доставляет абсолютный минимум в задаче B(h()) = i((Ah9h)+2{Ch9h) + (Bh,h)) dt + ίο + <aftIf ΛΟ + 2(7kif fto) + (/Jfto.fto) - min; (P") (если h = 0 G absminP", то по теореме о необходимых условиях слабого минимума выполнено условие Якоби и, если выполнено усиленное условие Якоби, то матрица Ρ + Q является неотрицательно определенной). Значит, SabsminP" < 0· Поэтому существует функция h G Cl([to,t\]) такая,
324 Глава 5. Условия второго порядка в вариационном исчислении что В(h) < 0. Но тогда B(\h) = λ2Β(Λ) + A((o,ft,> + <Ь,йо)) -♦ -оо при А -» +оо, т.е. 5abSminP' = -оо. ■ Замечание. Если в задаче (Р1) терминальная часть функционала Больца не содержит линейных по ho,h\ слагаемых и выполнено усиленное условие Якоби, то множество допустимых экстремалей непусто. Оно содержит функцию ife = 0. Действительно, функция at = О удовлетворяет уравнению Эйлера, которое для квадратичного функционала является однородным. В условия трансверсальности / L±(to) = Ц,), Г 2^(ί0)*(ίο) + 2C*x(t0) = 27*(«ι) + 2/?х(*0), \L*(*i) = -huh W(ii)4(i|) +2C*x(t,) = -2α*(«ι) -27**(*o), вместо произвольной экстремали х(-) подставим экстремаль вида ί 2A(to) (H0(tQ)x0 + Hx {tt)x\) + 2C*x0 = 2fx{ + 2βχ0, \2А(«|)(Яо(«|)зро + Я|(«|)»|) +2C*»| = -2аж, -27*ж0. Относительно ж0 и &j получили однородную систему линейных уравнений, которая, как известно из линейной алгебры, всегда имеет решение, среди которых имеется решение хо = Х\ = 0. Следовательно, функция £ = О будет являться допустимой экстремалью, возможно не единственной. 2.3. Пример 1 В(х(-)) = /V - х2) Л + х2(0) - ж2(1) + 4ж(1) — extr. о Условия экстремума I порядка: a) уравнение Эйлера: d ~-~L± + Lx = 0 <^> ж + ж = 0 4=> a? = C|Sini + C2cosi ас (х = Ci cos£ - C2sin£); b) условия трансверсальности: fi*(0) = /,(o), Г i(0) = *(<)), Ui(0 = -i*(.). l*(i) = χ(0-2 ^ C|Cosl-C|Sinl = Cisinl + C2cosl-2 ' 2 sin Г
§ 2. Задача Больца 325 „ sin£-|-cos£ Единственная допустимая экстремаль χ = — . sin 1 Условия экстремума II порядка. Условие Лежандра. Lxx = 2 > 0 —· выполняется усиленное условие Лежандра в задаче на минимум. Условие Якоби. Поскольку Lxx = Lxx = О, Lxx = 2, то квадратичный интегрант -£ = Lxxh + 2Lxxhh + ДгаЛ = 2Λ. — 2Λ . Уравнение Якоби (уравнение Эйлера для интегранта £) dt' —j:Lji + Lh = 0 <=> Λ + /ι = 0 <=> h = CiS\nt + C2cost; Ищем решения уравнения Якоби 2?о(0> ^i(0 c краевыми условиями Я0(0) = 1, Я0(1) = О, Я,(0) = О, Я,(1) = 1. Находим, что я.(*) = !^, н«) = Ц (яо(0 = -^^, н«) = Щ). sin I sin 1 V sin 1 sin 1 / Нули функции НAt) = -— — точки τ = for, fc G Ν, являются sin 1 сопряженными точками. На полуинтервале (0,1] нет сопряженных точек, следовательно, выполняется усиленное условие Якоби. Квадратичная форма Ρ + Q (задана на R2): Ρ = t±±(l)(H0(l)ho + Hi(l)h{)hi - Lxx(0)(H0(0)h0 + JT|(0)ft|)fto = 2 2 = —γ-τΜι + (2ctg 1)Λ| + (2ctg l)fc2 - τ-τΜι => sinl sinl = (-X IS')· «=<"<*<»>,*<.»= (> .5)- ^P + 0=f2ct^1 + 2 "2/sinM tv V-2/sinl 2ctgl-2y· Поскольку det^i = 2ctgl + 2 > 0, dztA[2 = det(P + Q) = 4ctg2l - 4 - 4 . , = -8 < 0, то по критерию Сильвестра (см. Гл. 1, п. 1.2.3) квадра- sin21 тичная форма матрица Ρ + Q не является неотрицательно определенной. Не выполняется необходимое условие слабого локального минимума — неотрицательность квадратичной формы Ρ + Q. Следовательно, χ & wlocmin и тем более χ g strlocmin. По теореме об условиях экстремума для квадратичного функционала, если выполнено усиленное условие Якоби, матрица Ρ + Q не является неотрицательно определенной, то значение задачи равно -оо (Sabsmin^-00)· =*Р
326 Глава 5. Условия второго порядка в вариационном исчислении Покажем, что 5absmax = +00. Возьмем последовательность функций xn(t) = simrnt. Тогда хп(0) = жп0) = 0 и, следовательно, ι ι В(хп()) = / (х2п - xl) dt = Ι (π2π2 cos2 πηί - sin2 irnt) dt = о о —*- 0 Ж П — 1 -boo при η —► -boo. Ответы к задачам главы 5 1.1. cos 2tf G absmax, Smin = -оо. 1.2. sin 2* G absmin, Smax = +00. 1.3. Допустимая экстремаль sin 2* £ wlocextr (π/2 — сопряженная точка => не выполнено необходимое условие Якоби), £min = -00, Smax = +00. 1.4. cos£ + sin* - 1 G absmax, Smin = -00. 1.5. Допустимая экстремаль cos*-sin*- 1 £ wlocextr (π — сопряженная точка => не выполнено необходимое условие Якоби), Smin = -00, Smax = +00. ч _ π sin t - It . 1.6. G absmin, Smax = +00. 4 1.7. shtf - sh — sint G absmin, £max = +00. ,0 Λ /w, (£-shT0)sin* uji u . 1.8. 0 < To < π => допустимая экстремаль —— bsh£ G absmin; sin T0 π — сопряженная точка =» при То > π не выполнено необходимое условие Якоби =» допустимые экстремали £ wlocextr, 5min = -00; То = π =» при ξ = βηπ допустимая экстремаль С sin* + sht G absmin VC G IR; при ξ Φ βηπ допустимых экстремалей нет и 5min = -00; 5max = +00. 1.9. sin It G absmax; Smm = -00. 1.10. 0 < To < π =» допустимая экстремаль (-—-— 2cosT0) sin* + V sin To / sin It G absmin; π — сопряженная точка =» при То > π не выполнено необходимое условие Якоби => допустимые экстремали
Ответы к задачам главы 5 327 £ wlocextr, £mjn = -оо; То = тг => при ξ = О допустимая экстремаль Csin£+sin2£ G absmin VC G IR; при ξ Φ О допустимых экстремалей нет и 5min = -оо; 5max = +оо. 1.11. tcost G absmax, 5mjn = -оо. 1.12. tcost g wlocextr, Smjn = -oo, Smax = +oo. 1.13. (t - —J sin* G absmin, Smax = -boo. 1.14. tsint G absmin, 5max = +oo. 1.15. Допустимая экстремаль tsint £ wlocextr (тг — сопряженная точка => не выполнено необходимое условие Якоби), £min = -оо, Smax = +00· 1.16. 0<Т0<тг=» допустимая экстремаль ( To ) sin*-HsintfG absmin; VsinTo / π — сопряженная точка => при То > π не выполнено необходимое условие Якоби => допустимые экстремали £ wlocextr, 5min = -oo; То = π => при £ = О допустимая экстремаль (t -f С) sint G absmin VCe IR, Smin = -*; при ξφΟ Smin = -oo; 5max = +oo. /£-T0cosT0\ 1.17. 0 < T0 < π =» допустимая экстремаль ( — ) sint +tcost G V sin T0 / absmin; тг — сопряженная точка =» при То > тг не выполнено необходимое условие Якоби => допустимые экстремали £ wlocextr, £min = -оо; То = π => при ξ = -тг допустимая экстремаль tcost + Csint G absmin VC G IR, 5mjn = тг; при ξ φ -π Sm\n = -оо; Smax = +00. 1.18. e* G absmin, Smax = +oo. 1.19. £e2~* G absmax, 5min = -oo. (teTo~f 1.20. —— G absmin, Smax = +oo. To тг* 1.21. Smin = -1, — G absmax, Smax = 1. 1.22. тг* G absmin, 5min = -1, 5max = 1. 1.23. -π + 2&тг < — < 2Ьг, fc G Ζ, => £ = ^- G wlocmin, g strlocmin To T0 (не выполнено необходимое условие Вейерштрасса); 2&тг < — < То тг -f 2&тг, к G Ζ, => £ G wlocmax, £ strlocmax; — = &тг, fc G Ζ, => To требуется дополнительное исследование; 5min = -То, 5max = Т0.
328 Глава 5. Условия второго порядка в вариационном исчислении π Ρ 3π Pt 1.24. -г + 2for < — < h 2for, fcez,=>s = — G wlocmin, g strlocmin 2 T0 2 To (не выполнено необходимое условие Вейерштрасса); 7Г Ρ ΊΓ -— -Ь 2&π < — < — + 2kn, к G Ζ, => ± Ε wlocmax, £ strlocmax; £ π —·- = — Η- &π, fe Ε Ζ, =» требуется дополнительное исследование; -Го 2 £min = —Го, ^тах = *0· 1.25. ^ > -2 => & = —Ε wlocmin, g strlocmin; — < -2 =>£Е wlocmax, Го Г0 Го £ strlocmax; — =-2 =»££ wlocextr, Smin = -oo, 5max = -boo. Го 1.26. It Ε wlocmin, Smax = -boo. 1.27. -t Ε wlocmin, £ strlocmin, Smin = -oo, Sm2X = -boo. 1.28. ξ > 0 =» £ = — Ε wlocmin,£ strlocmin; £ < 0 => A'E wlocmax, g Го strlocmax; ξ = 0 => at g wlocextr, Smm = -oo, Smax = +oo. Τ Pi Τ 1.29. £>^r=>£= — £ wlocmin, £ strlocmin; ξ < -^ => A Ε wlocmax, g 3 Го 3 rp strlocmax; £= — =>&£ wlocextr, Smin = -oo, Smax = -boo. /Jl £± rp 1.30. P> =>£= — Ε wlocmin, £ strlocmin; £ < =» £ G wlocmax, s 3 Го 3 £ strlocmax; ξ = -— =» A g wlocextr, Smin = -oo, 5max = +oo. /2 \3/2 1.31. \-t) gwlocextr, 5min = -oo, Smax = -boo. 1.32. i > -Tq/A =►*=-((« + C)5/4 - C5/4) G wlocmin, g strlocmin; £ < 4 5/4 --T0' => -A G wlocmax, g strlocmax, где константа С отыскивается из граничного условия на правом конце: - Г (t -K*C) - С5'4 J = |{|; { = ^Т05/4 =► <Ь = ^5'4 £ strlocextr; f = -^Г05/4 =► Л = -^5/4 j? strlocextr; \ξ\ < -Г05'4 =^ допустимых экстремалей нет, 5min = -oo,
Ответы к задачам главы 5 329 1.33. \ξ| > -т= ^ * = £'€ wlocmin, g strlocmin; \ξ\ < —= => ± G wlocmax, v3 v3 {?strlocmax, 5min = < ~'2 ,\2 ^Ζ*' s™* = +00· ' 1(ί2-1)2, lfl>l, 1.34. Допустимая экстремаль x(t) не является решением задачи, так как по теореме Боголюбова 5min = -оо, Smax = +оо. 1.35. На допустимой экстремали ±(t) Ξ 0 выполнены достаточные условия слабого минимума: поле x{t, λ) = А окружает экстремаль и условие Лежандра также выполнено: Lx± = 2 > 0. Необходимое условие Вейерштрасса также выполнено, поскольку функция х2 + 2tx4 выпукла. Сильного минимума однако нет. Достаточно взять ломаную {Ы и для любого fc > 0 подобрать Τι > 0 так, что J(x(·; k,h)) < 0.
Список литературы [1] [АГТ] Алексеев В. Af., Галеев Э. Л/., Тихомиров В. М. Сборник задач по оптимизации. М.: Наука, 1984. [2] [АТФ] Алексеев В. Af., Тихомиров В. Л/., Фомин С. В. Оптимальное управление. М.: Наука, 1979. [3] Габасов Л, Кириллова Ф. М. Методы оптимизации. Минск: Изд-во БГУ, 1981. [4] [ГТ] Галеев Э. Л/., Тихомиров В.М. Краткий курс теории экстремальных задач. М.: Изд-во МГУ, 1989. [5] Галеев Э.М., Тихомиров В.М. Оптимизация: теория, примеры, задачи. М.: URSS, 2000. [6] Галеев Э. Af., Кушниренко А, Г., Тихомиров В, Л/. Сборник задач по оптимальному управлению. М.: Изд-во МГУ, 1980. [7] Галеев Э. Af. Классическое вариационное исчисление, оптимальное управление. М.: Изд-во МГГА, 1995. [8] Галеев Э. М. Линейное программирование. М.: Изд-во МГГА, 1995. [9] Галеев Э. М. Экстремальные задачи. М.: Изд-во МГГА, 1996. [10] Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988. [11] Демидович Б. П., Марон И. А. Основы вычислительной математики. М.: Наука, 1966. [12] Заславский Ю.Л. Сборник задач по линейному программированию. М.: Наука, 1969. [13] Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. [14] Карманов В. Г Математическое программирование. М.: Наука, 1980. [15] КурошА.Г. Курс высшей алгебры. М.: Наука, 1975. [16] Магарил-Ильяев Г. L, Тихомиров В. М. Выпуклый анализ и его приложения. М.: URSS, 2000. [17] [Р] Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. [18] Саульев В. К. Прикладная и вычислительная математика. М.: Изд-во МАИ, 1971. Вып.З. [19] Фихтенгольц Г М. Курс дифференциального и интегрального исчисления. М.: Наука, 1969. Т. 1,2.
Список обозначений absmin (absmax) — абсолютный, т.е. глобальный минимум (максимум) в задаче locmin (locmax, locextr) — локальный минимум (максимум, экстремум) £min (Smax), иногда, чтобы подчеркнуть глобальность экстремума ^absmin (^absmax)» — численное значение абсолютного минимума (максимума) задачи (Р) — нумерация (обозначение) задачи Arg Ρ — множество решений задачи (Р) Sp — численное значение задачи (Р) D(P), иногда Dp, —. множество допустимых элементов в задаче (Р) D(x) — множество функций дифференцируемых в точке χ Dk(£) — множество функций к раз дифференцируемых в точке & (к > 1) (а, 6) — скалярное произведение векторов α и 6 Ип {а\,..., ат} — линейная оболочка векторов αϊ,..., ат I — единичная матрица {ж | 4(а?)} — множество элементов ж, обладающих свойством А(х) X* — пространство сопряженное с X (х*, ж) — значение линейного функционала х* на элементе χ L(X, Υ) — пространство линейных непрерывных отображений из прос- транства X в пространство Υ Lx — аннулятор множества L Λ* — оператор, сопряженный с оператором Λ, (А*у*9х) = (у*, Лаг) аг(·) — обозначение, которым подчеркивается, что аг(·) является элементом функционального пространства C([t0iti]9R) — пространство непрерывных на отрезке [ίο>*ι] функций аг(): R -+ Rn с нормой ||α?(·)||ο = maxt£[kA] \x(t)\ С(К9 Rn) — пространство непрерывных вектор-функций х(): К —► Rn, заданных на компакте К с нормой ||ε(·)||0 = maxi6jr |ж(*)| Cr(K, Rn) — пространство г раз непрерывно дифференцируемых вектор- функций х(): К —► Rn, заданных на компакте К с нормой И*(-)11г = шах {||а?(.)11о, И*011о ll*(r>0llo> R:=RU{-oo}U {+oo} — расширенная числовая прямая cone С, иногда со С, — линейная оболочка множества С conv С — выпуклая оболочка множества С
332 Список обозначений dom / — эффективное множество функции / epi / — надграфик функции / 6А(х) — индикаторная функция выпуклого множества А sA(y) — опорная функция множества А df(x) — субдифференциал выпуклой функции / в точке χ 6+f(x,h) — производная по направлению h отображения / в точке χ δ/(χ, ·) — вариация по Лагранжу отображения / в точке χ /с (ж) — производная Гато отображения / в точке χ f'(£)[h] — действие производной (Фреше) /'(£) на элемент h SD(£) — множество отображений строго дифференцируемых в точке χ ψ ο φ — суперпозиция отображений ψ и ψ, (Ψ°φ){χ) = ψ{φ(χ)) 6(χ,δ) — открытый шар радиуса δ с центром в точке χ Т&М — множество всех касательных векторов к множеству Μ в точке χ Т£М — множество односторонних касательных векторов к множеству Μ в точке χ яь (Аь) — базисный вектор (матрица) в линейном программировании хп (Ап) — небазисный вектор (матрица) /* — сопряженная (в смысле Лежандра) функция к функции / /** — вторая сопряженная функция к функции / Р** — двойственная задача к задаче Ρ Е(Р) — множество экстремалей в задаче (Р) DE(P) — множество допустимых экстремалей в задаче (Р) wlocmin (wlocmax, wlocextr) — слабый локальный минимум (максимум, экстремум) strlocmin (strlocmax, strlocextr) — сильный локальный минимум (максимум, экстремум) PC(A,Rn) — пространство кусочно-непрерывных на отрезке Δ вектор-функций PCl(A,Rn) — пространство кусочно-дифференцируемых на отрезке Δ вектор- функций Со (Mil) = {*(·) € С ([*<>,*.]) I h(t0) = h^) = 0} А := {(М(0) I * € [*ο,*ι]} — график функции χ Ai := {(t,x(t)9x(t)) 11 e [*ο,*ι]} — расширенный график функции х О(А) — (открытая) окрестность множества А
Предметный указатель Аннулятор множества 78 Вариация по Лагранжу 66, 87, 180, 203 вектор базисный 120, 143 — касательный 83 — небазисный 120 — ограничений 118 — стоимости 118 выпуклая комбинация 51 — оболочка 51 выпуклый многогранник 51 Дифференцируемость по Гато 75 Фреше 67, 87 — строгая 66, 67, 76 Задача Аполлония 39 — Больца 178, 190, 192 — выпуклая без ограничений 55 с ограничением 56 — выпуклого программирования 56 — гладкая бесконечномерная без ограничений 86 с равенствами 89 и неравенствами 93 конечномерная без ограничений 15 с равенствами 31 и неравенствами 43 — Дидоны 206, 207 — изопериметрическая 178, 202, 206, 281 — Лагранжа 178, 220 — линейного программирования в канонической форме 118, 119, 127, 133 в нормальной форме 119, 131 в общей форме 119 двойственная 131 невырожденная 120, 124, 138 —- на минимакс 123 — Ньютона аэродинамическая 247, 262 — о брахистохроне 178, 189 — о быстродействии 247, 258, 261 — о минимальной поверхности вращения 189 — о назначении 117, 173 — о стрельбе 189 — оптимального управления 247, 248 — производственная 123 — простейшая вариационного исчисления 179 КВИ 281, 282 — с подвижными концами 178, 196, 199 — со старшими производными 178, 211, 217 — транспортная 117, 154 двойственная 170 , замкнутая модель 155, 166 Иголка элементарная 255 игольчатая вариация управления элементарная 254 функции 290 элементарная 255 интеграл импульса 184 — энергии 184 интегрант 179, 181 искусственные переменные 142, 144, 145 Конус допустимых вариаций 44, 98 — конечнопорожденный 135 критерий Коши 63 — решения 134, 137 — Сильвестра 20 Лагранжиан 203, 204 лемма Банаха 75, 79
334 Предметный указатель лемма Дюбуа-Реймона 181-183 обобщенная 214 — Лагранжа 181 — о замкнутости 104 конечнопорожденного конуса 135 образа 79, 80 — о компактности 105 — о нетривиальности аннулятора 78, 80 — о правом обратном 79, 80 — о прирашении функционала 257 — о свойствах элементарной игольчатой вариации 255 — о скруглении углов 294 — о мин и максе 98 — об аннуляторе ядра регулярного оператора 80, 97 — основная КВИ 181 Матрица базисная 145, 163 — небазисная 166 — определенная неотрицательно 18 отрицательно 27, 28 положительно 18, 19 метод искусственного базиса 144 — «Минимума по матрице» 158 — «Минимума по столбцу» 159 — «Минимума по строке» 158 — Ньютона 21-23 — потенциалов 154, 162, 173 — «Северо-западного угла» 157, 164 минимум (максимум) 13, 56 — (максимум) абсолютный 331 — (максимум) глобальный 179 — (максимум) слабый 191 минор главный 20 последовательный 20, 21, 23 Многогранник выпуклый 119 многогранник выпуклый 135 множества отделимые 54 — строго отделимые 55 множество выпуклое 51 — решений задачи 14, 118 множители Лагранжа 32, 34, 36, 44, 89 Надграфик функции 51 неравенство Иенсена 51 — Юнга 128 нормы эквивалентные 63 Оболочка выпуклая 97 ограничение дифференциальное 248 — изопериметрическое 202 — на концах 203 Поле экстремалей 281, 297, 298 центральное 297 поля центр 301 — экстремалей центр 297 последовательность фундаментальная 63 правило прямоугольника 122, 146 преобразование Лежандра 128 принцип Лагранжа 14, 32, 43, 54 — максимума Понтрягина 247, 248, 253, 288 производная высшего порядка 68 — 1ато 66 — по направлению 66 — Фреше 66, 67 — частная 26, 68 пространство банахово 62, 63 — касательное 83 — линейное 62 — метрическое 63 — нормированное 51, 62, 63 — полное 63 — сопряженное 53, 65 процесс допустимый 248 — оптимальный 248 Симплекс-метод 118 симплекс-метод 117, 120, 123, 140 субдифференциал 51, 53 Теорема Банаха об обратном операторе 79 открытости 79 — Вейерштрасса 20, 38 — двойственности 136 — Дубовицкого—Милютина 54 — Крейна—Мильмана 120 — Куна—Таккера 57, 59 — Лагранжа 74, 75 — Люстерника 81, 83
Предметный указатель 335 теорема Минковского 120 — Моро—Рокафеллара 53 — о касательном пространстве 83 — о поле в конечномерных задачах с равенствами 108 — о полном дифференциале 77 — о смешанных производных 68 — о среднем 74-76 — о суперпозиции 71 — об обратной функции 33, 34 — об обратном отображении 90 — отделимости вторая 55 первая 55 — существования 134, 136 — Фенхеля—Моро 129, 131 — Ферма 15, 16 — Эйлера—Лагранжа 221-223 терминант 191, 192 точка крайняя (угловая) 119 — критическая 43, 46 — локального минимума 14, 15 (максимума) 15 — сопряженная 285 — стационарная 16, 23, 32 Управление 248 уравнение Эйлера 180 — Эйлера—Пуассона 212, 216 — Якоби 285 условие Вейерштрасса 281, 284, 286 — дополняющей нежесткости 43, 58 — Лежандра 284 усиленное 284, 285 — на концах (краевые) 179 — неотрицательности 21, 37, 58 — оптимальности 247 — Слейтера 56 — стационарности 16, 32 по подвижным концам 197 — строгой положительности 19, 88 — трансверсальности 192 — Якоби 285, 296 усиленное 285, 295 Фазовая переменная 248 — плоскость 260 — траектория 260 формализация 13 формула Вейерштрасса основная 281, 301, 303 — Тейлора 16, 74 функционал Больца 191, 193 функция аффинная 52, 128, 286 — Вейерштрасса 286 интегранта 286 — выпуклая 51 — замкнутая 51 — индикаторная 52 — квадратичная 52 — кусочно-непрерывная 248 — Лагранжа 37-39 — Минковского 52 — начклона поля 298 — опорная 53 — собственная 51 — сопряженная 128 вторая 128 — сублинейная 54 — целевая 118, 123 Численное значение задачи 14, 134 Экстремаль 180 — включена в поле 297 — допустимая 180 экстремум 13, 15 5-функция 131, 133, 301 —, дифференциал 301
1=1 3$ЗДДО$№] Уважаемые читатели! Уважаемые авторы! Наше издательство специализируется на выпуске научной и учебной литературы, в том числе монографий, журналов, трудов ученых Российской академии наук, научно-исследовательских институтов и учебных заведений. Мы предлагаем авторам свои услуги на выгодных экономических условиях. При этом мы берем на себя всю работу по подготовке издания — от набора, редактирования и верстки до тиражирования и распространения. URSS Среди вышедших и готовящихся к изданию книг мы предлагаем Вам следующие: Понтрягин Л. С. Принцип максимума в оптимальном управлении. Зеликин М. И. Оптимальное управление и вариационное исчисление. Софиева Ю. #., Цирлин А. М. Введение в задачи и методы условной оптимизации. Ковалев М. Л/. Дискретная оптимизация (целочисленное программирование). Ковалев М. М. Матроиды в дискретной оптимизиции. Балакришнан А. Введение в теорию оптимизации в гильбертовом пространстве. Бондаренко В. А., Максименко А. N. Геометрические конструкции и сложность в комбинаторной оптимизации. Эльсгольц Л. Э. Вариационное исчисление. Дикин И. И. Метод внутренних точек в линейном и нелинейном программировании. Сухарев А. Г. Минимаксные алгоритмы в задачах численного анализа. Морозов В. В. и др. Исследование операций в задачах и упражнениях. Саати Т. Л. Принятие решений при зависимостях и обратных связях. Шноль Э. Э. Семь лекций по вычислительной математике. Тарасевич Ю. Ю. Математическое и компьютерное моделирование. Тарасевич Ю. Ю. Перколяция: теория, приложения, алгоритмы. Тарасевич Ю. Ю. Информационные технологии в математике. Мышкис А. Д. Элементы теории математических моделей. Блехман И. //., Мышкис А. Д., Лановко Я. Г. Прикладная математика. Плохотников К Э. Математическое моделирование и вычислительный эксперимент. Хинчин А. Я. Работы по математической теории массового обслуживания. Гнеденко Б. В., Коваленко И. Н. Введение в теорию массового обслуживания. Федулов А. А. и др. Введение в теорию статистически ненадежных решений. Цыгичко В. Н. Прогнозирование социально-экономических процессов. Колесников А. П. Численный анализ: Аналитические и топологические методы. Колесников А. П. Топологические методы в теории приближений и численном анализе. Самарский А. А. и др. Задачи и упражнения по численным методам. Самарский А. А., Вабищевич П. N. Вычислительная теплопередача. Самарский Α. Α., Попов Ю. П. Разностные методы решения задач газовой динамики. Самарский Α. Α., Гулин А. В. Устойчивость разностных схем. Гулин А. В., Ионкин Н. И., Морозова В. А. Устойчивость нелокальных разностных схем. Данфорд Я., Шварц Дж. Т. Линейные операторы. Общая теория. Дубровин Б. Α., Новиков С. Я., Фоменко А. Т. Современная геометрия. Т. 1-3. По всем вопросам Вы можете обратиться к нам: тел./факс (499) 135-42-16, 135-42-46 или электронной почтой URSS@URSS.ru Полный каталог изданий представлен в интернет-магазине: http://URSS.ru Научная и учебная литература URSS.ru URSS.ru URSS
Hi ' ,! * Теория • Экстремальные задачи • Линейное программирование • Вариационное исчисление Задачи оптимального управления Условия второго порядка в вариационном исчислении * Примеры * Задачи * 500 заДач с ответами URSS
Представляем другие книги нашего издательства: № Τ РЯДЫ ВВЕДЕНИЕ В ТЕОРИЮ МАССОВОГО ОБСЛУЖИВАНИЯ БРАЙА ГРИН КОСМОСА ТЕКСТУРА РЕАЛЬНОСТИ ЭКОНОМИЧЕСКИХ О ЦЕССОВ ТЕОРИЯ -- £ СИСТЕМНЫЙ АЛИЗ КУРС в 10 Ной. Г. Г. Ходам Д. Е. Литяауа Г. Лояие НЕРАВЕНСТВА ЭКОНОМЕТРИЧККОГО МО, Л НИЯ m СПРАВОЧНИК ВЫСШЕЙ у МАТЕМАТИКЕ Л 3 Эльсгольц О AM ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ И ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ 7851 ID 107101 785397»01 1761 НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА Тел./факс: 7 (499) 135-42-16 Тел./факс: 7 (499) 135-42^6 E-mail: URSS@URSS.ru Каталог изданий в Интернете: urss http://URSSeru Любые отзывы о настоящем издании а также обнаруженные опечатки присылайте по адресу URSS@URSS.ru. Ваши замечания и предложения будут учтены и отражены на web-странице этой книги в нашем интернет-магазине http://URSS.ru